在Linux系統(tǒng)中,進程間通信(Inter-Process Communication,IPC)是不同進程之間進行數(shù)據(jù)交換和同步的一種機制
為什么需要進程間通信
進程間通信(IPC)是由于在計算機系統(tǒng)中,多個進程可能同時運行,而這些進程可能需要共享信息、協(xié)同工作或者進行數(shù)據(jù)交換,以下是一些常見的原因,解釋了為什么需要進程間通信:
(1)資源共享: 進程間通信允許多個進程共享系統(tǒng)資源,如文件、設備、內(nèi)存等。這種共享資源的方式使得系統(tǒng)可以更高效地利用資源,避免了每個進程都維護一份獨立的資源拷貝;
(2)并發(fā)執(zhí)行: 在多任務操作系統(tǒng)中,多個進程可能同時運行。通過進程間通信,這些進程可以同步執(zhí)行,共享信息,以便更好地協(xié)調(diào)工作。
(3)模塊化設計: 大型軟件系統(tǒng)通常被分解成多個模塊或組件。這些模塊可能運行在獨立的進程中,通過IPC進行通信,使得系統(tǒng)的設計更具模塊化和可維護性。
(4)數(shù)據(jù)傳遞: 進程間通信提供了一種機制,允許進程之間傳遞數(shù)據(jù),從而使得它們能夠相互交流和共享信息。這對于實現(xiàn)分布式計算、網(wǎng)絡通信等場景是至關重要的。
一、進程間通信的目的
數(shù)據(jù)傳輸:一個進程需要將它的數(shù)據(jù)發(fā)送給另一個進程,發(fā)送的數(shù)據(jù)量在一個字節(jié)到幾M字節(jié)之間
共享數(shù)據(jù):多個進程要操作共享數(shù)據(jù),一個進程對共享數(shù)據(jù)
信息傳遞:一個進程需要向另一個進程發(fā)送消息,通知它發(fā)生了某種事件。
資源共享:多個進程之間共享同樣的數(shù)據(jù)。為了做到這一點,需要內(nèi)核提供鎖和同步機制。
進程控制:有些進程希望完全控制另一個進程的執(zhí)行,此時控制進程希望能夠攔截另一個進程的所有陷入和異常,病能夠及時知道它的狀態(tài)改變
二、進程間通信的概念
每個進程各自有不同的用戶地址空間,任何一個進程的變量在另一個進程中都是看不到的,所以進程之間要交換數(shù)據(jù)必須通過內(nèi)核,在內(nèi)核中開辟出一塊緩沖區(qū)。一個進程把自己的數(shù)據(jù)從用戶空間拷貝到內(nèi)核緩沖區(qū),另一個進程再從內(nèi)核緩沖區(qū)把數(shù)據(jù)讀走。內(nèi)核提供的這種機制稱為進程間通信(IPC,Inter Process Communication)
三、進程間通信方式
Linux進程間基本的通信方式主要有:管道(pipe)(包括匿名管道和命名管道)、信號(signal)、消息隊列(queue)、共享內(nèi)存、信號量和套接字。
下面逐漸介紹這幾種方式:
1.管道:管道的實質(zhì)是一個內(nèi)核緩沖區(qū),管道的作用正如其名,需要通信的兩個進程在管道的兩端,進程利用管道傳遞信息。管道對于管道兩端的進程而言,就是一個文件,但是這個文件比較特殊,它不屬于文件系統(tǒng)并且只存在于內(nèi)存中。
管道依據(jù)是否有名字分為匿名管道和命名管道(有名管道),這兩種管道有一定的區(qū)別。
匿名管道有幾個重要的限制:
管道是半雙工的,數(shù)據(jù)只能在一個方向上流動,A進程傳給B進程,不能反向傳遞
管道只能用于父子進程或兄弟進程之間的通信,即具有親緣關系的進程。
命名管道允許沒有親緣關系的進程進行通信。命名管道不同于匿名管道之處在于它提供了一個路徑名與之關聯(lián),這樣一個進程即使與創(chuàng)建有名管道的進程不存在親緣關系,只要可以訪問該路徑,就能通過有名管道互相通信。
2.信號:信號是軟件層次上對中斷機制的一種模擬,是一種異步通信方式,進程不必通過任何操作來等待信號的到達。信號可以在用戶空間進程和內(nèi)核之間直接交互,內(nèi)核可以利用信號來通知用戶空間的進程發(fā)生了哪些系統(tǒng)事件。
信號來源:
信號事件的發(fā)生有兩個來源:硬件來源,比如我們按下了鍵盤或者其它硬件故障;軟件來源,最常用發(fā)送信號的系統(tǒng)函數(shù)是kill, raise, alarm和setitimer以及sigqueue函數(shù),軟件來源還包括一些非法運算等操作。
進程對信號的響應:
進程可以通過三種方式來響應信號:(1)忽略信號,即對信號不做任何處理,但是有兩個信號是不能忽略的:SIGKLL和SIGSTOP;(2)捕捉信號,定義信號處理函數(shù),當信號發(fā)生時,執(zhí)行相應的處理函數(shù);(3)執(zhí)行缺省操作,Linux對每種信號都規(guī)定了默認操作。
3.消息隊列:消息隊列是消息的鏈表,具有特定的格式,存放在內(nèi)存中并由消息隊列標識符標識,并且允許一個或多個進程向它寫入與讀取消息
4.共享內(nèi)存:使得多個進程可以可以直接讀寫同一塊內(nèi)存空間,是針對其他通信機制運行效率較低而設計的。
為了在多個進程間交換信息,內(nèi)核專門留出了一塊內(nèi)存區(qū),可以由需要訪問的進程將其映射到自己的私有地址空間。進程就可以直接讀寫這一塊內(nèi)存而不需要進行數(shù)據(jù)的拷貝,從而大大提高效率。
需要注意的是:共享內(nèi)存并未提供同步機制,在一個進程結束對共享內(nèi)存的寫操作之前,并無自動機制可以阻止另一個進程開始對它進行讀取。所以,我們通常需要用其他的機制來同步對共享內(nèi)存的訪問。
5.信號量:信號量實質(zhì)上就是一個標識可用資源數(shù)量的計數(shù)器,它的值總是非負整數(shù)。而只有0和1兩種取值的信號量叫做二進制信號量(或二值信號量),可用用來標識某個資源是否可用。
6.套接字:套接字是更為基礎的進程間通信機制,與其他方式不同的是,套接字可用于不同機器之間的進程間通信。
有兩種類型的套接字:基于文件的和面向網(wǎng)絡的。
(1).Unix套接字是基于文件的,并且擁有一個“家族名字”--AF_UNIX,它代表地址家族(address family):UNIX。
(2).第二類型的套接字是基于網(wǎng)絡的,它也有自己的家族名字--AF_INET,代表地址家族(address family):INTERNET
不管采用哪種地址家族,都有兩種不同的套接字連接:面向連接的和無連接的。
(1)面向連接的套接字(SOCK_STREAM):進行通信前必須建立一個連接,面向連接的通信提供序列化的、可靠地和不重復的數(shù)據(jù)交付,而沒有記錄邊界。
這意味著每條信息可以被拆分成多個片段,并且每個片段都能確保到達目的地,然后在目的地將信息拼接起來。
實現(xiàn)這種連接類型的主要協(xié)議是傳輸控制協(xié)議(TCP)。
(2)無連接的套接字(SOCK_DGRAM):在通信開始之前并不需要建立連接,在數(shù)據(jù)傳輸過程中并無法保證它的順序性、可靠性或重復性。