一個(gè)多線程的簡單例子讓你看清線程調(diào)度的隨機(jī)性
線程調(diào)度的幾個(gè)基本知識(shí)點(diǎn)
多線程并發(fā)執(zhí)行時(shí)有很多同學(xué)捋不清楚調(diào)度的隨機(jī)性會(huì)導(dǎo)致哪些問題,要知道如果訪問臨界資源不加鎖會(huì)導(dǎo)致一些突發(fā)情況發(fā)生甚至死鎖。
關(guān)于線程調(diào)度,需要深刻了解以下幾個(gè)基礎(chǔ)知識(shí)點(diǎn):
-
調(diào)度的最小單位是輕量級(jí)進(jìn)程【比如我們編寫的hello world最簡單的C程序,執(zhí)行時(shí)就是一個(gè)輕量級(jí)進(jìn)程】或者線程; -
每個(gè)線程都會(huì)分配一個(gè)時(shí)間片,時(shí)間片到了就會(huì)執(zhí)行下一個(gè)線程; -
線程的調(diào)度有一定的隨機(jī)性,無法確定什么時(shí)候會(huì)調(diào)度; -
在同一個(gè)進(jìn)程內(nèi),創(chuàng)建的所有線程除了線程內(nèi)部創(chuàng)建的局部資源,進(jìn)程創(chuàng)建的其他資源所有線程共享;比如:主線程和子線程都可以訪問全局變量,打開的文件描述符等。
實(shí)例
再多的理論不如一個(gè)形象的例子來的直接。
預(yù)期代碼時(shí)序
假定我們要實(shí)現(xiàn)一個(gè)多線程的實(shí)例,預(yù)期程序執(zhí)行時(shí)序如下:
期待的功能時(shí)序:
-
主進(jìn)程創(chuàng)建子線程,子線程函數(shù)function(); -
主線程count自加,并分別賦值給value1,value2; -
時(shí)間片到了后切換到子線程,子線程判斷value1、value2值是否相同,如果不同就打印信息value1,value2,count的值,但是因?yàn)橹骶€程將count先后賦值給了value1,value2,所以value1,value2的值應(yīng)該永遠(yuǎn)相同,所以不應(yīng)該打印任何內(nèi)容; -
重復(fù)2、3步驟。
代碼1
好了,現(xiàn)在我們按照這個(gè)時(shí)序編寫代碼如下:
??1?#include?
??2?#include?
??3?#include?
??4?#include?
??5?#include?
??6?
??7?unsigned?int?value1,value2,?count=0;
??8?void?*function(void?*arg);
??9?int?main(int?argc,??char?*argv[])
?10?{
?11?????pthread_t??a_thread;
?12?
?13?????if?(pthread_create(&a_thread,?NULL,?function,?NULL)?0)
?14?????{
?15?????????perror("fail?to?pthread_create");
?16?????????exit(-1);
?17?????}
?18?????while?(?1?)
?19?????{
?20?????????count++;
?21?????????value1?=?count;
?22?????????value2?=?count;
?23?????}
?24?????return?0;
?25?}
?26?
?27?void??*function(void?*arg)
?28?{
?29?????while?(?1?)
?30?????{
?31?????????if?(value1?!=?value2)
?32?????????{?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????
?33?????????????printf("count=%d?,?value1=%d,?value2=%d\n",??count,?value1,?value2);
?34?????????????usleep(100000);
?35?????????}?????
?36?????}
?37?????return??NULL;
?38?}??
乍一看,該程序應(yīng)該可以滿足我們的需要,并且程序運(yùn)行的時(shí)候不應(yīng)該打印任何內(nèi)容,但是實(shí)際運(yùn)行結(jié)果出乎我們意料。
編譯運(yùn)行:
gcc?test.c?-o?run?-lpthread
./run
代碼1執(zhí)行結(jié)果
執(zhí)行結(jié)果:可以看到子程序會(huì)隨機(jī)打印一些信息,為什么還有這個(gè)執(zhí)行結(jié)果呢?其實(shí)原因很簡單,就是我們文章開頭所說的,線程調(diào)度具有?隨機(jī)性,我們無法規(guī)定讓內(nèi)核何時(shí)調(diào)度某個(gè)線程。有打印信息,那么這說明此時(shí)value1和value2的值是不同的,那也說明了調(diào)度子線程的時(shí)候,是在主線程向value1和value2之間的位置調(diào)度的。
代碼1執(zhí)行的實(shí)際時(shí)序
實(shí)際上代碼的執(zhí)行時(shí)序如下所示:
如上圖,在某一時(shí)刻,當(dāng)程序走到value2 = count;這個(gè)位置的時(shí)候,內(nèi)核對(duì)線程進(jìn)行了調(diào)度,于是子進(jìn)程在判斷value1和value2的值的時(shí)候,發(fā)現(xiàn)這兩個(gè)變量值不相同,就有了打印信息。
該程序在下面這兩行代碼之間調(diào)度的幾率還是很大的。
value1?=?count;?
value2?=?count;
解決方法
如何來解決并發(fā)導(dǎo)致的程序沒有按預(yù)期執(zhí)行的問題呢?對(duì)于線程來說,常用的方法有posix信號(hào)量、互斥鎖,條件變量等,下面我們以互斥鎖為例,講解如何避免代碼1的問題的出現(xiàn)。
互斥鎖的定義和初始化:
pthread_mutex_t??mutex;
pthread_mutex_init(&mutex,?NULL)
申請(qǐng)釋放鎖:
pthread_mutex_lock(&mutex);
pthread_mutex_unlock(&mutex);
原理:進(jìn)入臨界區(qū)之前先申請(qǐng)鎖,如果能獲得鎖就繼續(xù)往下執(zhí)行, 如果申請(qǐng)不到,就休眠,直到其他線程釋放該鎖為止。
代碼2
??1?#include?
??2?#include?
??3?#include?
??4?#include?
??5?#include?
??6?#define?_LOCK_
??7?unsigned?int?value1,value2,?count=0;
??8?pthread_mutex_t??mutex;
??9?void?*function(void?*arg);
?10?
?11?int?main(int?argc,??char?*argv[])
?12?{
?13?????pthread_t??a_thread;
?14??????????
?15?????if?(pthread_mutex_init(&mutex,?NULL)?0)??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????
?16?????{
?17?????????perror("fail?to?mutex_init");
?18?????????exit(-1);
?19?????}
?20?
?21?????if?(pthread_create(&a_thread,?NULL,?function,?NULL)?0)
?22?????{
?23?????????perror("fail?to?pthread_create");
?24?????????exit(-1);
?25?????}
?26?????while?(?1?)
?27?????{
?28?????????count++;
?29?#ifdef??_LOCK_
?30?????????pthread_mutex_lock(&mutex);
?31?#endif
?32?????????value1?=?count;
?33?????????value2?=?count;
?34?#ifdef??_LOCK_
?35?????????pthread_mutex_unlock(&mutex);
?36?#endif
?37?????}
?38?????return?0;
?39??}
40?
?41?void??*function(void?*arg)
?42?{
?43??????while?(?1?)
?44??????{
?45?#ifdef?_LOCK_
?46?????????pthread_mutex_lock(&mutex);
?47?#endif???????????
?48?
?49?????????if?(value1?!=?value2)??
?50?????????{
?51?????????????printf("count=%d?,?value1=%d,?value2=%d\n",??count,?value1,?value2);
?52?????????????usleep(100000);
?53?????????}?????
?54?#ifdef?_LOCK_
?55?????????pthread_mutex_unlock(&mutex);
?56?#endif
?57??????}
?58??????return??NULL;
?59??}?????
如上述代碼所示:主線程和子線程要訪問臨界資源value1,value2時(shí),都必須先申請(qǐng)鎖,獲得鎖之后才可以訪問臨界資源,訪問完畢再釋放互斥鎖。該代碼執(zhí)行之后就不會(huì)打印任何信息。我們來看下,如果程序在下述代碼之間產(chǎn)生調(diào)度時(shí),程序的時(shí)序圖。
value1?=?count;?
value2?=?count;
時(shí)序圖如下:如上圖所示:
-
時(shí)刻n,主線程獲得mutex,從而進(jìn)入臨界區(qū); -
時(shí)刻n+1,時(shí)間片到了,切換到子線程; -
n+2時(shí)刻子線程申請(qǐng)不到鎖mutex,所以放棄cpu,進(jìn)入休眠; -
n+3時(shí)刻,主線程釋放mutex,離開臨界區(qū),并喚醒阻塞在mutex的子線程,子線程申請(qǐng)到mutex,進(jìn)入臨界區(qū); -
n+4時(shí)刻,子線程離開臨界區(qū),釋放mutex。
可以看到,加鎖之后,即使主線程在value2 =count; 之前產(chǎn)生了調(diào)度,子線程由于獲取不到mutex,會(huì)進(jìn)入休眠,只有主線程出了臨界區(qū),子線程才能獲得mutex,訪問value1和value2,就永遠(yuǎn)不會(huì)打印信息,就實(shí)現(xiàn)了我們預(yù)期的代碼時(shí)序。
總結(jié)
實(shí)際項(xiàng)目中,可能程序的并發(fā)的情況可能會(huì)更加復(fù)雜,比如多個(gè)cpu上運(yùn)行的任務(wù)之間,cpu運(yùn)行的任務(wù)和中斷之間,中斷和中斷之間,都有可能并發(fā)。
有些調(diào)度的概率雖然很小,但是不代表不發(fā)生,而且由于資源同步互斥導(dǎo)致的問題,很難復(fù)現(xiàn),縱觀Linux內(nèi)核代碼,所有的臨界資源都會(huì)對(duì)應(yīng)鎖。
多閱讀Linux內(nèi)核源碼,學(xué)向大神學(xué)習(xí),與大神神交。
正所謂代碼讀百遍,其義自見!熟讀代碼千萬行,不會(huì)編寫也會(huì)抄!
關(guān)于內(nèi)核和應(yīng)用程序的同步互斥的知識(shí)點(diǎn),可以查看一口君的其他文章。
原創(chuàng)不易,歡迎轉(zhuǎn)發(fā)、留言、點(diǎn)贊、分享給你的朋友,感謝您的支持!
長按識(shí)別二維碼關(guān)注獲取更多內(nèi)容
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!