當前位置：首頁 > 嵌入式 > 嵌入式軟件

嵌入式Linux實時技術改進與實現

時間：2009-04-21 04:33:49

關鍵字：嵌入式LINUX CK SPI 線程

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]嵌入式Linux實時技術改進與實現

1、簡介

隨著微處理器技術的發(fā)展,嵌入式系統(tǒng)已經成為計算機應用領域的一個重要的組成部分。Linux雖然為分時操作系統(tǒng)，但由于其功能強大、源代碼開放以及可移植性強等優(yōu)勢，已成為日益流行的嵌入式實時操作系統(tǒng)的解決方案，然而，在實時方面它還不能很好地滿足實時系統(tǒng)方面的需要，其本身僅僅提供了一些實時處理的支持。為使Linux滿足實時應用的要求,常用的方法是通過對Linux的內核進行裁減和修改,使其能夠滿足實時性的要求。目前,我們根據實際需要對于Linux采用以下方法進行改進。

2、實現低延遲

使用兩種方法來實現低延遲：一種就是鎖分解，即把大循環(huán)中保持的鎖分解為每一輪循環(huán)中都獲得鎖和釋放鎖，典型的代碼結構示例如下：

鎖分解前：

spin_lock(&x_lock)；

for (…) {some operations；

…}

spin_unlock(&x_lock)；

鎖分解后：

for (…) { spin_lock(&x_lock)；

some operations；

…

spin_unlock(&x_lock)；}

另一種是增加搶占點，即自愿被搶占。增加搶占點之后：

/* Do the write .. */

for (;;) {

size_t size = count;

if (size > chunk)

size = chunk;

ret = -EFAULT;

if (copy_from_user(tty->write_buf, buf, size))

break;

lock_kernel();

ret = write(tty, file, tty->write_buf, size);

unlock_kernel();

if (ret <= 0)

break;

written += ret;

buf += ret;

count -= ret;

if (!count)

break;

ret = -ERESTARTSYS;

if (signal_pending(current))

break;

cond_resched();

}

語句cond_resched()將判斷是否有進程需要搶占當前進程，如果是將立即發(fā)生調度，這就是增加的搶占點，它支持四種搶占模式：[!--empirenews.page--]

（1）．No Forced Preemption (Server)，這種模式等同于沒有使能搶占選項的標準內核，主要適用于科學計算等服務器環(huán)境。

（2）．Voluntary Kernel Preemption (Desktop)，這種模式使能了自愿搶占，但仍然失效搶占內核選項，它通過增加搶占點縮減了搶占延遲，因此適用于一些需要較好的響應性的環(huán)境，如桌面環(huán)境，當然這種好的響應性是以犧牲一些吞吐率為代價的。

（3）．Preemptible Kernel (Low-Latency Desktop)，這種模式既包含了自愿搶占，又使能了可搶占內核選項，因此有很好的響應延遲，實際上在一定程度上已經達到了軟實時性。它主要適用于桌面和一些嵌入式系統(tǒng)，但是吞吐率比模式2更低。

（4）．Complete Preemption (Real-Time)，這種模式使能了所有實時功能，因此完全能夠滿足軟實時需求，它適用于延遲要求為100微秒或稍低的實時系統(tǒng)。

實現實時是以犧牲系統(tǒng)的吞吐率為代價的，因此實時性越好，系統(tǒng)吞吐率就越低。

3、中斷線程化

中斷線程化是實現Linux實時性的一個重要步驟，在Linux標準內核中，中斷是最高優(yōu)先級的執(zhí)行單元，不管內核當時處理什么，只要有中斷事件，系統(tǒng)將立即響應該事件并執(zhí)行相應的中斷處理代碼，除非當時中斷關閉。因此，如果系統(tǒng)有嚴重的網絡或I/O負載，中斷將非常頻繁，后發(fā)生的實時任務將很難有機會運行，也就是說，毫無實時性可言。中斷線程化之后，中斷將作為內核線程運行而且賦予不同的實時優(yōu)先級，實時任務可以有比中斷線程更高的優(yōu)先級，這樣，實時任務就可以作為最高優(yōu)先級的執(zhí)行單元來運行，即使在嚴重負載下仍有實時性保證。

中斷線程化的另一個重要原因是spinlock被mutex取代。中斷處理代碼中大量地使用了spinlock，當spinlock被mutex取代之后，中斷處理代碼就有可能因為得不到鎖而需要被掛到等待隊列上，但是只有可調度的進程才可以這么做，如果中斷處理代碼仍然使用原來的spinlock，則spinlock取代mutex的努力將大打折扣，因此為了滿足這一要求，中斷必須被線程化，包括IRQ和softirq。

中斷線程化的實現方法是：對于IRQ，在內核初始化階段init（該函數在內核源碼樹的文件init/main.c中定義）調用init_hardirqs（該函數在內核源碼樹的文件kernel/irq/manage.c中定義）來為每一個IRQ創(chuàng)建一個內核線程，IRQ號為0的中斷賦予實時優(yōu)先級49，IRQ號為1的賦予實時優(yōu)先級48，依次類推直到25，因此任何IRQ線程的最低實時優(yōu)先級為25。原來的do_IRQ被分解成兩部分，架構相關的放在類似于arch/*/kernel/irq.c的文件中，名稱仍然為do_IRQ，而架構獨立的部分被放在IRQ子系統(tǒng)的位置kernel/irq/handle.c中，名稱為_do_IRQ。當發(fā)生中斷時，CPU將執(zhí)行do_IRQ來處理相應的中斷，do_IRQ將做了必要的架構相關的處理后調用_do_IRQ。函數_do_IRQ將判斷該中斷是否已經被線程化（如果中斷描述符的狀態(tài)字段不包含SA_NODELAY標志說明中斷被線程化了），如果是將喚醒相應的處理線程，否則將直接調用handle_IRQ_event（在IRQ子系統(tǒng)位置的kernel/irq/handle.c文件中）來處理。對于已經線程化的情況，中斷處理線程被喚醒并開始運行后，將調用do_hardirq(在源碼樹的IRQ子系統(tǒng)位置的文件kernel/irq/manage.c中定義)來處理相應的中斷，該函數將判斷是否有中斷需要被處理（中斷描述符的狀態(tài)標志IRQ_INPROGRESS），如果有就調用handle_IRQ_event來處理。handle_IRQ_event將直接調用相應的中斷處理句柄來完成中斷處理。

如果某個中斷需要被實時處理，它可以用SA_NODELAY標志來聲明自己非線程化，例如：系統(tǒng)的時鐘中斷就是，因為它被用來維護系統(tǒng)時間以及定時器等，所以不應當被線程化。

static struct irqaction irq0=

{ timer_interrupt, SA_INTERRUPT | SA_NODELAY, CPU_MASK_NONE, "timer", NULL, NULL};

這是在靜態(tài)聲明時指定不要線程化，也可以在調用request_irq時指定，如：

request_irq (HIGHWIRE_SMI_IRQ,highwire_smi_interrupt,SA_NODELAY, "System Management Switch", NULL))

對于softirq，標準Linux內核已經使用內核線程的方式來處理，為了使其易于被搶占，改進實時性，具體的修改包括：把ksoftirqd的優(yōu)先級設置為nice值為-10，即它的優(yōu)先級高于普通的用戶態(tài)進程和內核態(tài)線程，但它不是實時線程，因此這樣一來softirq對實時性的影響將顯著減小。在處理軟中斷期間，搶占是使能的，這使得實時性更進一步地增強。在處理軟中斷的函數_do_softirq中，每次處理完一個待處理的軟中斷后，都將調用cond_resched_all()，這顯著地增加了調度點數，提高了整個系統(tǒng)的實時性。[!--empirenews.page--]

4、spinlock轉換成mutex

spinlock是一個高效的共享資源同步機制，在SMP（對稱多處理器Symmetric Multiple Proocessors）的情況下，它用于保護共享資源，如全局的數據結構或一個只能獨占的硬件資源。但是spinlock保持期間將使搶占失效，用spinlock保護的區(qū)域稱為臨界區(qū)（Critical Section），在內核中大量地使用了spinlock，有大量的臨界區(qū)存在，因此它們將嚴重地影響著系統(tǒng)的實時性。為此使用mutex來替換spinlock，它的意圖是讓spinlock可搶占，但是可搶占后將產生很多后續(xù)影響。

Spinlock失效搶占的目的是避免死鎖。Spinlock如果可搶占了，一個spinlock的競爭者將可能搶占該spinlock的保持者來運行，但是由于得不到spinlock將自旋在那里，如果競爭者的優(yōu)先級高于保持者的優(yōu)先級，將形成一種死鎖的局面，因為保持者無法得到運行而永遠不能釋放spinlock，而競爭者由于不能得到一個不可能釋放的spinlock而永遠自旋在那里。

由于中斷處理函數也可以使用spinlock，如果它使用的spinlock已經被一個進程保持，中斷處理函數將無法繼續(xù)進行，從而形成死鎖，這樣的spinlock在使用時應當中斷失效來避免這種死鎖的情況發(fā)生。標準linux內核就是這么做的，中斷線程化之后，中斷失效就沒有必要，因為遇到這種狀況后，中斷線程將掛在等待隊列上并放棄CPU讓別的線程或進程來運行。

等待隊列就是解決這種死鎖僵局的方法，讓每個spinlock都有一個等待隊列，該等待隊列是按進程或線程的優(yōu)先級排隊的。如果一個進程或線程競爭的spinlock已經被另一個線程保持，它將把自己掛在該spinlock的優(yōu)先級化的等待隊列上，然后發(fā)生調度把CPU讓給別的進程或線程。

5、優(yōu)先級繼承和死鎖檢測

spinlock被mutex化后會產生優(yōu)先級逆轉（Priority Inversion）現象。所謂優(yōu)先級逆轉，就是優(yōu)先級高的進程由于優(yōu)先級低的進程保持了競爭資源被迫等待，而讓中間優(yōu)先級的進程運行，優(yōu)先級逆轉將導致高優(yōu)先級進程的搶占延遲增大，中間優(yōu)先級的進程的執(zhí)行時間的不確定性導致了高優(yōu)先級進程搶占延遲的不確定性，因此為了保證實時性，必須消除優(yōu)先級逆轉現象。

優(yōu)先級繼承協議（Priority Inheritance Protocol）和優(yōu)先級頂棚協議（Priority Ceiling Protocol）就是專門針對優(yōu)先級逆轉問題提出的解決辦法。

所謂優(yōu)先級繼承，就是spinlock的保持者將繼承高優(yōu)先級的競爭者進程的優(yōu)先級，從而能先于中間優(yōu)先級進程運行，盡可能快地釋放鎖，這樣高優(yōu)先級進程就能很快得到競爭的spinlock，使得搶占延遲更確定，更短。

所謂優(yōu)先級頂棚，就是根據靜態(tài)分析確定一個spinlock的可能擁有者的最高優(yōu)先級，然后把spinlock的優(yōu)先級頂棚設置為該確定的值，每次當進程獲得該spinlock后，就將該進程的優(yōu)先級設置為spinlock的優(yōu)先級頂棚值。

Spinlock被mutex化后引入的另一個問題就是死鎖，典型的死鎖有兩種：

一種為自鎖，即一個spinlock保持者試圖獲得它已經保持的鎖，很顯然，這會導致該進程無法運行而死鎖。另一種為非順序鎖而導致的，即進程P1已經保持了spinlock LOCKA但是要獲得進程P2已經保持的spinlock LOCKB，而進程P2要獲得進程P1已經保持的spinlock LOCKA，這樣進程P1和P2都將因為需要得到對方擁有的但永遠不可能釋放的spinlock而死鎖。對這兩種情況都要進行檢測，一旦發(fā)生這種死鎖，內核將輸出死鎖執(zhí)行路徑并panic。

6、大內核鎖可搶占

大內核鎖（BKL---Big Kernel Lock）實質上也是spinlock，只是它一般用于保護整個內核，該鎖的保持時間比較長，因此它對整個系統(tǒng)的實時性影響是非常大的，大內核鎖使用了semaphore來實現，如果內核配置為前面三種搶占模式，struct semaphore是架構相關的，如對于x86，結構定義如下：

struct semaphore {

atomic_t count;

int sleepers;

wait_queue_head_t wait;

};

但對于第四種搶占模式，其結構為：

struct semaphore {

atomic_t count;

struct rt_mutex lock;

};

注意新的spinlock定義也包含字段struct rt_mutex lock，因此可搶占大內核鎖和新的spinlock共用了低層的處理代碼。使用semaphore之后，大內核鎖就可搶占了。

7、結論

Linux實時性能的逐步完善，必將大大促進嵌入式Linux在工業(yè)控制、后PC時代信息電器等領域的廣泛應用，應用的需要也會進一步促進大量新型實時算法的出現。通過對Linux的改動，就可以開發(fā)出一種可靠的且廉價的硬實時操作系統(tǒng)，具有很好的發(fā)展和應用前景。本文作者的創(chuàng)新點：通過改進延遲，優(yōu)先級繼承并增加搶占機制，改善了系統(tǒng)的實時性，為嵌入式系統(tǒng)開發(fā)打下了基礎。