Linux系統(tǒng)進(jìn)程的知識(shí)總結(jié),進(jìn)程與線程之間的糾葛
我們先打個(gè)比方,多線程是十字路口多線程是平面交通系統(tǒng),造價(jià)低,但是紅綠燈多,老堵車,而多進(jìn)程是則是立交橋,雖然造價(jià)高,上下坡多耗油,但是不堵車。這是一個(gè)抽象的概念。相信大家看完會(huì)有這種感覺。
進(jìn)程和線程是兩個(gè)相對(duì)的概念,通常來(lái)說(shuō),一個(gè)進(jìn)程可以定義程序的一個(gè)實(shí)例(Instance)。在Win32中,進(jìn)程并不執(zhí)行什么,它只是占據(jù)應(yīng)用程序所使用的地址空間。為了讓進(jìn)程完成一定的工作,進(jìn)程必須至少占有一個(gè)線程,正是這個(gè)線程負(fù)責(zé)包含進(jìn)程地址空間中的代碼。實(shí)際上,一個(gè)進(jìn)程可以包含幾個(gè)線程,它們可以同時(shí)執(zhí)行進(jìn)程地址空間中的代碼。為了做到這一點(diǎn),每個(gè)線程有自己的一組CPU寄存器和堆棧。每個(gè)進(jìn)程中至少有 一個(gè)線程在執(zhí)行其地址空間中的代碼。如果沒(méi)有線程執(zhí)行進(jìn)程地址空間中的代碼,進(jìn)程也就沒(méi)有繼續(xù)存在的理由,系統(tǒng)將自動(dòng)清除進(jìn)程及其地址空間。
多線程的實(shí)現(xiàn)原理
創(chuàng)建一個(gè)進(jìn)程時(shí),它的第一個(gè)線程稱為主線程(Primary thread),由系統(tǒng)自動(dòng)生成。然后可以由這個(gè)主線程生成額外的線程,而這些線程,又可以生成更多的線程。在運(yùn)行一個(gè)多線程的程序時(shí),從表面上看,這些線程似乎在同時(shí)運(yùn)行。而實(shí)際情況并非如此,為了運(yùn)行所有的這些線程,操作系統(tǒng)為每個(gè)獨(dú)立線程安排一些CPU時(shí)間。單CPU操作系統(tǒng)以時(shí)間片輪轉(zhuǎn)方式向線程提供時(shí)間片(Quantum),每個(gè)線程在使用完時(shí)間片后交出控制,系統(tǒng)再將CPU時(shí)間片分配給下一個(gè)線程。由于每個(gè)時(shí)間片足夠的短,這樣就給人一種假象,好像這些線程在同時(shí)運(yùn)行。創(chuàng)建額外線程的唯一目的就是盡可能地利用CPU時(shí)間。
多線程的問(wèn)題
使用多線程編程可以給程序員帶來(lái)很大的靈活性,同時(shí)也使原來(lái)需要復(fù)雜技巧才能解決的問(wèn)題變得容易起來(lái)。但是,不應(yīng)該人為地將編寫的程序分成一些碎片,讓這些碎片按各自的線程執(zhí)行,這不是開發(fā)應(yīng)用程序的正確方法。線程很有用,但當(dāng)使用線程時(shí),可能會(huì)在解決老問(wèn)題的同時(shí)產(chǎn)生新問(wèn)題。例如要開發(fā)一個(gè)字處理程序,并想讓打印功能作為單獨(dú)的線程自己執(zhí)行。這聽起來(lái)是很好的主意,因?yàn)樵诖蛴r(shí),用戶可立即返回,開始編輯文檔。但這樣一來(lái),在該文檔被打印時(shí)文檔中的數(shù)據(jù)就有可能被修改,打印的結(jié)果就不再是所期望的內(nèi)容。也許最好不要把打印功能放在單獨(dú)的線程中,不過(guò)如果一定要用多線程的話,也可以考慮用下面的方法解決:第一種方法是鎖定正在打印的文檔,讓用戶編輯其他的文檔,這樣在結(jié)束打印之前,該文檔不會(huì)作任何修改;另一個(gè)方法可能更有效一些,即可以把該文檔拷貝到一個(gè)臨時(shí)文件中,打印這個(gè)臨時(shí)文件的內(nèi)容,同時(shí)允許用戶對(duì)原來(lái)的文檔進(jìn)行修改。當(dāng)包含文檔的臨時(shí)文件打印完成時(shí),再刪去這個(gè)臨時(shí)文件。通過(guò)上面的分析可以看出,多線程在幫助解決問(wèn)題的同時(shí)也可能帶來(lái)新問(wèn)題。因此有必要弄清楚,什么時(shí)候需要?jiǎng)?chuàng)建多線程,什么時(shí)候不需要多線程??偟膩?lái)說(shuō),多線程往往用于在前臺(tái)操作的同時(shí)還需要進(jìn)行后臺(tái)的計(jì)算或邏輯判斷的情況。
線程的分類
在MFC中,線程被分為兩類,即工作線程和用戶界面線程。如果一個(gè)線程只完成后臺(tái)計(jì)算,不需要和用戶交互,那么可以使用工作線程;如果需要?jiǎng)?chuàng)建一個(gè)處理用戶界面的線程,則應(yīng)使用用戶界面線程。這兩者的主要區(qū)別在于,MFC框架會(huì)給用戶界面線程增加一個(gè)消息循環(huán),這樣用戶界面線程就可以處理自己消息隊(duì)列中的消息。這樣看來(lái),如果需要在后臺(tái)作一些簡(jiǎn)單的計(jì)算(如對(duì)電子表格的重算),則首先應(yīng)考慮使用工作線程,而當(dāng) 后臺(tái)線程需要處理比較復(fù)雜的任務(wù),確切地說(shuō),當(dāng)后臺(tái)線程的執(zhí)行過(guò)程會(huì)隨著實(shí)際情況的不同而改變時(shí),就應(yīng)該使用用戶界面線程,以便能對(duì)不同的消息作出響應(yīng)。
線程的優(yōu)先級(jí)
當(dāng)系統(tǒng)需要同時(shí)執(zhí)行多個(gè)進(jìn)程或多個(gè)線程時(shí),有時(shí)會(huì)需要指定線程的優(yōu)先級(jí)。線程的優(yōu)先級(jí)一般是指這個(gè)線程的基優(yōu)先級(jí),即線程相對(duì)于本進(jìn)程的相對(duì)優(yōu)先級(jí)和包含此線程的進(jìn)程的優(yōu)先級(jí)的結(jié)合。操作系統(tǒng)以優(yōu)先級(jí)為基礎(chǔ)安排所有的活動(dòng)線程,系統(tǒng)的每一個(gè)線程都被分配了一個(gè)優(yōu)先級(jí),優(yōu)先級(jí)的范圍從0到31。運(yùn)行時(shí),系統(tǒng)簡(jiǎn)單地給第一個(gè)優(yōu)先級(jí)為31的線程分配CPU時(shí)間,在該線程的時(shí)間片結(jié)束后,系統(tǒng)給下一個(gè)優(yōu)先級(jí)為31的線程分配CPU時(shí)間。當(dāng)沒(méi)有優(yōu)先級(jí)為31的線程時(shí),系統(tǒng)將開始給優(yōu)先級(jí)為30的線程分配CPU時(shí)間,以此類推。除了程序員在程序中改變線程的優(yōu)先級(jí)外,有時(shí)程序在執(zhí)行過(guò)程中系統(tǒng)也會(huì)自動(dòng)地動(dòng)態(tài)改變線程的優(yōu)先級(jí),這是為了保證系統(tǒng)對(duì)終端用戶的高度響應(yīng)性。比如用戶按了鍵盤上的某個(gè)鍵時(shí),系統(tǒng)就會(huì)臨時(shí)將處理WM_KEYDOWN消息的線程的優(yōu)先級(jí)提高2到3。CPU按一個(gè)完整的時(shí)間片執(zhí)行線程,當(dāng)時(shí)間片執(zhí)行完畢后,系統(tǒng)將該線程的優(yōu)先級(jí)減1。
線程的同步
在使用多線程編程時(shí),還有一個(gè)非常重要的問(wèn)題就是線程同步。所謂線程同步是指線程之間在相互通信時(shí)避免破壞各自數(shù)據(jù)的能力。同步問(wèn)題是由前面說(shuō)到的Win32系統(tǒng)的CPU時(shí)間片分配方式引起的。雖然在某一時(shí)刻,只有一個(gè)線程占用CPU(單CPU時(shí))時(shí)間,但是沒(méi)有辦法知道在什么時(shí)候,在什么地方線程被打斷,這樣如何保證線程之間不破壞彼此的數(shù)據(jù)就顯得格外重要。在MFC中,可以使用4個(gè)同步對(duì)象來(lái)保證多線程同時(shí)運(yùn)行。它們分別是臨界區(qū)對(duì)象(CCriticalSection)、互斥量對(duì)象(CMutex)、信號(hào)量對(duì)象(CS emaphore)和事件對(duì)象(CEvent)。在這些對(duì)象中,臨界區(qū)對(duì)象使用起來(lái)最簡(jiǎn)單,它的缺點(diǎn)是只能同步同一個(gè)進(jìn)程中的線程。另外,還有一種基本的方法,本文稱為線性化方法,即在編程過(guò)程中對(duì)一定數(shù)據(jù)的寫操作都在一個(gè)線程中完成。這樣,由于同一線程中的代碼總是按順序執(zhí)行的,就不可能出現(xiàn)同時(shí)改寫數(shù)據(jù)的情況。
總結(jié):
在線程中(相對(duì)與進(jìn)程而言),線程是一個(gè)更加接近執(zhí)行體的概念,它可以與同進(jìn)程的其他線程共享數(shù)據(jù),但擁有自己的??臻g,擁有獨(dú)立的執(zhí)行序列。這兩者都可以提高程序的并發(fā)度,提高程序運(yùn)行的效率和響應(yīng)的時(shí)間。線程和進(jìn)程在使用上各有優(yōu)缺點(diǎn):線程執(zhí)行開銷小,但不利于資源管理和保護(hù);而進(jìn)程正好相反。根本的區(qū)別就一點(diǎn):用多進(jìn)程每個(gè)進(jìn)程有自己的地址空間,線程則共享地址空間,在速度方面:線程產(chǎn)生的速度快,線程間的通訊快,切換快等,因?yàn)樗麄冊(cè)谕坏刂房臻g內(nèi)。在資源利用率方面:線程的資源率比較好也是因?yàn)樗麄冊(cè)谕坏刂房臻g內(nèi)。 在同步方面:線程使用公共變量/內(nèi)存時(shí)需要使用同步機(jī)制,因?yàn)樗麄冊(cè)谕坏刂房臻g內(nèi)進(jìn)程中:子進(jìn)程是父進(jìn)程的復(fù)制品,子進(jìn)程獲得父進(jìn)程數(shù)據(jù)空間、堆和棧的復(fù)制品。