linux系統(tǒng)編程之基礎必備(六):可重入函數(shù)、sig_atomic_t類型和volatile限定
一、 POSIX 中對可重入和線程安全這兩個概念的定義:
Reentrant Function:A function whose effect, when called by two or more threads,is guaranteed to be as if
the threads each executed the function one after another in an undefined order, even if the actual execution is interleaved.
Thread-Safe Function:A function that may be safely invoked concurrently by multiple threads.
Async-Signal-Safe Function: A function that may be invoked, without restriction from signal-catching functions. No function is async-signal -safe unless explicitly described as such.
以上三者的關系為:可重入函數(shù) 必然 是 線程安全函數(shù) 和 異步信號安全函數(shù); 線程安全函數(shù)不一定是可重入函數(shù)。
可重入與線程安全的區(qū)別體現(xiàn)在能否在signal處理函數(shù)中被調用的問題上,可重入函數(shù)在signal處理函數(shù)中可以被安全調用,因此同時也是Async-Signal-Safe Function;而線程安全函數(shù)不保證可以在signal處理函數(shù)中被安全調用,如果通過設置信號阻塞集合等方法保證一個非可重入函數(shù)不被信號中斷,那么它也是Async-Signal-Safe Function。
舉個例子,strtok是既不可重入的,也不是線程安全的;加鎖的strtok不是可重入的,但線程安全;而strtok_r既是可重入的,也是線程安全的。也就是說函數(shù)如果使用靜態(tài)變量,通過加鎖后可以轉成線程安全函數(shù),但仍然有可能不是可重入的。我們所熟知的alloc也是線程安全但不是可重入的。
再舉個例子,假設函數(shù)func()在執(zhí)行過程中需要訪問某個共享資源,因此為了實現(xiàn)線程安全,在使用該資源前加鎖,在不需要資源解鎖。 假設該函數(shù)在某次執(zhí)行過程中,在已經(jīng)獲得資源鎖之后,有異步信號發(fā)生,程序的執(zhí)行流轉交給對應的信號處理函數(shù);再假設在該信號處理函數(shù)中也需要調用函數(shù) func(),那么func()在這次執(zhí)行中仍會在訪問共享資源前試圖獲得資源鎖,然而我們知道前一個func()實例已然獲得該鎖,因此信號處理函數(shù)阻塞;另一方面,信號處理函數(shù)結束前被信號中斷的線程是無法恢復執(zhí)行的,當然也沒有釋放資源的機會,這樣就出現(xiàn)了線程和信號處理函數(shù)之間的死鎖局面。
因此,func()盡管通過加鎖的方式能保證線程安全,但是由于函數(shù)體對共享資源的訪問,因此是非可重入。
對于這種情況,采用的方法一般是在特定的區(qū)域屏蔽一定的信號。
二、可重入函數(shù)
我們知道,當捕捉到信號時,不論進程的主控制流程當前執(zhí)行到哪兒,都會先跳到信號處理函數(shù)中執(zhí)行,從信號處理函數(shù)返回后再繼續(xù)執(zhí)行主控制流程。信號處理函數(shù)是一個單獨的控制流程,因為它和主控制流程是異步的,二者不存在調用和被調用的關系,并且使用不同的堆??臻g。引入了信號處理函數(shù)使得一個進程具有多個控制流程,如果這些控制流程訪問相同的全局資源(全局變量、硬件資源等),就有可能出現(xiàn)沖突,如下面的例子所示。
main函數(shù)調用insert函數(shù)向一個鏈表head中插入節(jié)點node1,插入操作分為兩步,剛做完第一步的時候,因為硬件中斷使進程切換到內核,再次回用戶態(tài)之前檢查到有信號待處理,于是切換到sighandler函數(shù),sighandler也調用insert函數(shù)向同一個鏈表head中插入節(jié)點node2,插入操作的兩步都做完之后從sighandler返回內核態(tài),再次回到用戶態(tài)就從main函數(shù)調用的insert函數(shù)中繼續(xù)往下執(zhí)行,先前做第一步之后被打斷,現(xiàn)在繼續(xù)做完第二步。結果是,main函數(shù)和sighandler先后向鏈表中插入兩個節(jié)點,而最后只有一個節(jié)點真正插入鏈表中了。
像上例這樣,insert函數(shù)被不同的控制流程調用,有可能在第一次調用還沒返回時就再次進入該函數(shù),這稱為重入,insert函數(shù)訪問一個全局鏈表,有可能因為重入而造成錯亂,像這樣的函數(shù)稱為不可重入函數(shù),反之,如果一個函數(shù)只訪問自己的局部變量或參數(shù),則稱為可重入(Reentrant)函數(shù)。
不可重入函數(shù)的原因在于:
1> 已知它們使用靜態(tài)數(shù)據(jù)結構
2> 它們調用malloc和free.
因為malloc通常會為所分配的存儲區(qū)維護一個鏈接表,而插入執(zhí)行信號處理函數(shù)的時候,進程可能正在修改此鏈接表。
3> 它們是標準IO函數(shù).
因為標準IO庫的很多實現(xiàn)都使用了全局數(shù)據(jù)結構
3、sig_atomic_t類型與volatile限定符
在上面的圖示例子中,main和sighandler都調用insert函數(shù)則有可能出現(xiàn)鏈表的錯亂,其根本原因在于,對全局鏈表的插入操作要分兩步完成,不是一個原子操作,假如這兩步操作必定會一起做完,中間不可能被打斷,就不會出現(xiàn)錯亂了。
關于原子操作最原始的說法是一條匯編指令能夠完成(對于多線程程序來說原子操作可以指加鎖后的幾個步驟集合),即使是一條C語句也不一定是一個原子操作,比如 a = 5; 如果a是32位的int變量,在32位機上賦值是原子操作,在16位機上就不是。如果在程序中需要使用一個變量,要保證對它的讀寫都是原子操作,應該采用什么類型呢?
為了解決這些平臺相關的問題,C標準定義了一個類型sig_atomic_t,在不同平臺的C語言庫中取不同的類型,例如在32位機上定義sig_atomic_t為int類型。
在使用sig_atomic_t類型的變量時,還需要注意另一個問題??慈缦碌睦樱?/p>
#include
sig_atomic_t a=0;
int main(void)
{
/* register a sighandler */
while(!a); /* wait until a changes in sighandler */
/* do something after signal arrives *
/ return 0;
}
為了簡潔,這里只寫了一個代碼框架來說明問題。在main函數(shù)中首先要注冊某個信號的處理函數(shù)sighandler,然后在一個while死循環(huán)中等待信號發(fā)生,如果有信號遞達則執(zhí)行sighandler,在sighandler中將a改為1,這樣再次回到main函數(shù)時就可以退出while循環(huán),執(zhí)行后續(xù)處理。如果在編譯時加了優(yōu)化選項,則如果第一次比較a是否為0,如果相等則成了死循環(huán),因為不會再次從內存讀取變量a的值。[!--empirenews.page--]
是編譯器優(yōu)化得有錯誤嗎?不是的。設想一下,如果程序只有單一的執(zhí)行流程,只要當前執(zhí)行流程沒有改變a的值,a的值就沒有理由會變,不需要反復從內存讀取,因此上面的兩條指令和while(!a);循環(huán)是等價的,并且優(yōu)化之后省去了每次循環(huán)讀內存的操作,效率非常高。
所以不能說編譯器做錯了,只能說編譯器無法識別程序中存在多個執(zhí)行流程。之所以程序中存在多個執(zhí)行流程,是因為調用了特定平臺上的特定庫函數(shù),比如sigaction、pthread_create,這些不是C語言本身的規(guī)范,不歸編譯器管,程序員應該自己處理這些問題。
C語言提供了volatile限定符,如果將上述變量定義為volatile sig_atomic_t a=0;那么即使指定了優(yōu)化選項,編譯器也不會優(yōu)化掉對變量a內存單元的讀寫。
對于程序中存在多個執(zhí)行流程訪問同一全局變量的情況,volatile限定符是必要的,此外,雖然程序只有單一的執(zhí)行流程,但是變量屬于以下情況之一的,也需要volatile限定:
變量的內存單元中的數(shù)據(jù)不需要寫操作就可以自己發(fā)生變化,每次讀上來的值都可能不一樣;
即使多次向變量的內存單元中寫數(shù)據(jù),只寫不讀,也并不是在做無用功,而是有特殊意義的;
什么樣的內存單元會具有這樣的特性呢?肯定不是普通的內存,而是映射到內存地址空間的硬件寄存器,例如串口的
接收寄存器屬于上述第一種情況,而發(fā)送寄存器屬于上述第二種情況。
sig_atomic_t類型的變量應該總是加上volatile限定符,因為要使用sig_atomic_t類型的理由也正是
要加volatile限定符的理由。
對于多線程的程序,訪問沖突的問題是很普遍的,解決的辦法是引入鎖,獲得鎖的線程可以完成“讀-修改-寫”的操作,然后釋放鎖給其它線程,沒有獲得鎖的線程只能等待而不能訪問共享數(shù)據(jù),這樣“讀-修改-寫”三步操作組成一個原子操作,要么都執(zhí)行,要么都不執(zhí)行,不會執(zhí)行到中間被打斷,也不會在其它處理器上并行做這個操作。