程序是如何在 CPU 中運(yùn)行的(二)
筆者能力有限,如果文中出現(xiàn)錯誤的地方,還請各位朋友能夠給我指出來,我將不勝感激,謝謝~
前言
在上一篇文章中《程序是如何在 CPU 中運(yùn)行的(一)》筆者講述了程序中一條一條指令以及一條一條數(shù)據(jù)是如何在 CPU 中運(yùn)行的,在本文筆者將以 ARM Cortex M3 的內(nèi)核為背景分析指令是如何有序的執(zhí)行。
寄存器組介紹
為了更好地介紹指令是如何在 ARM Cortex M3 內(nèi)核中運(yùn)行的,在這里先介紹一下 ARM Cortex M3 的寄存器組,引用 ARM Cortex M3 權(quán)威指南的一張圖,圖片如下:
如上圖所示,寄存器組主要包含四種類型的寄存器,分別是:
通用寄存器:用于數(shù)據(jù)操作
堆棧指針:堆棧指針有兩個,但是在任一時刻只能使用其中的一個。
主堆棧指針:復(fù)位后默認(rèn)使用的堆棧指針,用于操作系統(tǒng)內(nèi)核及異常處理程序
進(jìn)程堆棧指針:由用戶的應(yīng)用程序代碼使用。
連接寄存器:當(dāng)呼叫一個子程序時,由 R14 存儲返回地址。
程序計(jì)數(shù)器:用于存儲下一條即將運(yùn)行的指令的地址。
寄存器組介紹完之后,我們來看具體的實(shí)例。
順序執(zhí)行
首先看一個順序執(zhí)行的例子,代碼如下,C 語言下面對應(yīng)的是匯編代碼,匯編代碼冒號前的是當(dāng)前指令對應(yīng)的地址。
int main(void)
{
int a = 123;
0x0800021E : MOVS r1,#0x7B
int b = 456;
0x08000220 : MOV r2,#0x1CB
int result = a + b;
0x08000224 : ADDS r3,r1,r2
return 0;
0x08000226 : MOVS r0,#0x00
}
上述代碼的匯編語言涉及到的寄存器都是通用寄存器,通過 C 語言代碼我們也可以知道對應(yīng)的匯編代碼的意思,這也印證了前面所說的通用寄存器的功能就是用于數(shù)據(jù)操作的。
那上述程序是如何運(yùn)行的呢,這時之前說到的程序計(jì)數(shù)器,也就是我們所說的 PC 指針就要派上用場了,如下圖片展示了程序計(jì)數(shù)器在上述指令運(yùn)行過程中的一個變化。
通過上圖可以看出,左邊是即將執(zhí)行的指令,中間是指令存儲的位置,那么 PC 存儲的值一直是即將執(zhí)行的下一條指令的地址,這樣程序也就可以順序的執(zhí)行下去了。
條件分支
條件分支是根據(jù)條件執(zhí)行任意地址的指令,也就是說程序不是向上述一樣順序執(zhí)行了,那 CPU 又如何處理這種情況呢?我們來看一個簡單 if 語句例子:
int main(void)
{
int a = 123;
0x0800021E : MOVS r1,#0x7B
int b = 456;
0x08000220 : MOV r2,#0x1CB
int result = a - b;
0x08000224 : SUBS r1,r2,r3
if (result > 0)
0x08000226 : CMP r1,#0x00
0x08000228 : BLE 0x0800022E
result = result + 1;
0x0800022A : ADDS r1,r1,#1
else
result = 1 - result;
0x0800022E : RSB r1,r1,#0x01
return 0;
0x08000232 : MOVS r0,#0x00
}
上述的匯編與 C 語言一一對應(yīng),很容易知道每條指令的意思,在這里筆者單獨(dú)拿出來兩個與語句跳轉(zhuǎn)相關(guān)的指令說一下:
CMP :比較(比較兩數(shù)并且更新標(biāo)志)
BLE :當(dāng)比較結(jié)果小于或者等于的時候,跳轉(zhuǎn)到某個指令的地址執(zhí)行
現(xiàn)在來看匯編代碼,比較關(guān)鍵的地方就是使用 CMP 判斷,判斷結(jié)果小于 0 ,所以跳轉(zhuǎn)到 0x0800022E 地址對應(yīng)的指令進(jìn)行執(zhí)行,也就是執(zhí)行 result = 1 - result; 同樣的,我們也用示意圖的形式表示一下在這個過程 PC 值的變化。
如上圖所示,由于使用了條件分支,程序在執(zhí)行到地址為 0x08000228 的時候,下一條要執(zhí)行的指令地址并不是 0x0800022A,而是直接跳轉(zhuǎn)到地址為 0x0800022E 的指令進(jìn)行執(zhí)行,那 PC 值的變化也就是圖中左側(cè)所示,因?yàn)闆]有沒有執(zhí)行一條指令,所以 PC 的變化次數(shù)也就比總的指令數(shù)少一條。
函數(shù)調(diào)用
函數(shù)調(diào)用和使用條件分支有所不同,因?yàn)閱渭兊奶D(zhuǎn)指令無法實(shí)現(xiàn)函數(shù)的調(diào)用。函數(shù)調(diào)用需要在完成函數(shù)內(nèi)部的處理之后,處理流程再返回到函數(shù)調(diào)用點(diǎn),也就是返回到函數(shù)調(diào)用指令的下一條指令,因此針對于函數(shù)調(diào)用來講,涉及到函數(shù)返回地址的處理。
一級函數(shù)調(diào)用
涉及到函數(shù)調(diào)用我們都有一個概念,就是說函數(shù)調(diào)用時會把函數(shù)返回地址進(jìn)行壓棧,也就是說把返回地址存入到堆棧里,函數(shù)返回時再從堆棧里取出返回地址,但是對于 ARM Cortex M3 的處理器來講,再處理一級函數(shù)調(diào)用時,它并沒有將函數(shù)返回地址進(jìn)行壓棧,而是將子程序的返回地址存放在 R14 連接寄存器里,函數(shù)返回時再從這個寄存器里取出返回值就可以了。這也印證了前文所說的這個寄存器是用于存儲子程序的返回地址的,下面用一個簡單的例子來說明這個問題:
int MyFunc(int a,int b)
{
int temp;
0x0800019A MOV r2,r0
temp = a + b;
return temp;
0x0800019C ADDS r0,r2,r1
0x0800019E BX lr
}
int main(void)
{
int a = 123;
0x08000224 MOVS r4,#0x7B
int b = 456;
0x08000226 MOV r5,#0x1C8
int result = a - b;
0x0800022A SUBS r6,r4,r5
result = MyFunc(a,b);
0x0800022C MOV r1,r5
0x0800022E MOV r0,r4
0x08000230 BL.W MyFunc (0x0800019A)
0x08000234 MOV r6,r0
return 0;
0x08000236 MOVS r0,#0x00
}
同樣的,我們給出一級函數(shù)調(diào)用的示意圖:
通過上述的匯編代碼也可以看到雖然有了函數(shù)調(diào)用,但是在這里并沒有進(jìn)行壓棧操作,整個程序的執(zhí)行流程也如圖中序號所示,在執(zhí)行到函數(shù)調(diào)用的語句時,就執(zhí)行 BL.W 指令跳轉(zhuǎn)到函數(shù)的入口地址,子函數(shù)執(zhí)行完之后,再返回至函數(shù)調(diào)用指令的下一條指令的地址,繼續(xù)執(zhí)行主函數(shù)沒有執(zhí)行完的內(nèi)容,相應(yīng)的 PC 指針寄存器的值也在發(fā)生變化。
二級函數(shù)調(diào)用
二級函數(shù)調(diào)用和多級函數(shù)調(diào)用的原理是一樣的,但是不同于一級函數(shù)調(diào)用,在進(jìn)行二級函數(shù)調(diào)用時,會涉及到兩個子函數(shù)的返回地址,但是只有一個 R14(LR) 寄存器,只能存儲一個返回地址,那要怎么辦呢?這個時候,就要使用到堆棧的機(jī)制,堆棧的特性是先入后出,在函數(shù)嵌套調(diào)用過程中,先調(diào)用的函數(shù)的返回地址要在后返回,而后調(diào)用的函數(shù)返回地址要在先返回,所以堆棧剛好能夠處理這樣的事情。同樣,我們來看一個二級函數(shù)調(diào)用的例子:
int MyFunc2(int a)
{
int temp;
0x080001AC MOV r1,r0
temp = a + 1;
return temp;
0x080001AE ADDS r0,r1,#1
0x080001B0 BX lr
}
int MyFunc(int a,int b)
{
int temp;
0x0800019A PUSH {r4-r5,lr}
0x0800019C MOV r4,r0
0x0800019E MOV r5,r1
temp = MyFunc2(temp);
0x080001A0 MOV r0,r3
0x080001A2 BL.W MyFunc2 (0x080001AC)
0x080001A6 MOV r3,r0
return temp;
0x080001A8 MOV r0,r3
0x080001AA POP {r4-r5,pc}
}
int main(void)
{
int a = 123;
0x08000238 MOVS r4,#0x7B
int b = 456;
0x0800023A MOV r5,#0x1C8
int result = a - b;
0x0800023E SUBS r6,r4,r5
result = MyFunc(a,b);
0x08000240 MOV r1,r5
0x08000242 MOV r0,r4
0x08000244 BL.W MyFunc (0x0800019A)
0x08000248 MOV r6,r0
return 0;
0x0800024A MOVS r0,#0x00
}
二級函數(shù)調(diào)用比一級函數(shù)調(diào)用要略復(fù)雜一些了,同樣的,我們給出二級函數(shù)調(diào)用的示意圖:
由于指令數(shù)有點(diǎn)多,通過省略號來替代一些與函數(shù)調(diào)用無關(guān)的指令。通過圖片我們也可以更清楚地看到函數(shù)的調(diào)用過程以及 PC 值的變化,PC 值的變化是一直跟隨著箭頭的走向的。在這小節(jié)的開頭,筆者也說到涉及到二級函數(shù)調(diào)用時,需要使用堆棧,現(xiàn)在看到匯編代碼,也的確是這樣,當(dāng)程序進(jìn)入到 MyFunc 的第一時間,就是將 LR 寄存器的值壓入堆棧,因?yàn)?MyFunc2 是最后一層函數(shù)調(diào)用,因此 MyFunc2 函數(shù)調(diào)用的返回地址不需要進(jìn)行壓棧,直接使用 LR 寄存器的值進(jìn)行返回就好,我們再看,當(dāng) MyFunc2 返回后,MyFunc 也要返回,這時候,需要出棧,即將剛剛壓入堆棧的 LR 寄存器的值賦值給 PC 指針寄存器,PC 指針寄存器永遠(yuǎn)存放的是即將指令的下一條指令的地址,MyFunc 返回主函數(shù)后執(zhí)行剩余的內(nèi)容。
總結(jié)
上述就是涉及到的順序執(zhí)行,條件分支,和函數(shù)調(diào)用的相關(guān)內(nèi)容。可以看到無論是哪一種形式,其實(shí)本質(zhì)就是 PC 值的變化,PC 值永遠(yuǎn)存儲的是即將運(yùn)行的下一條指令的地址,控制這個值就能夠控制程序的走向。另外需要注意的一點(diǎn)是,對于 ARM Cortex M3 系列的內(nèi)核來說,涉及到一級函數(shù)調(diào)用的時候,不需要進(jìn)行壓棧操作,涉及到多級函數(shù)調(diào)用的時候,才會使用到堆棧。
您的在看是對我最大的鼓勵,您的建議是對我最大的提升,歡迎點(diǎn)擊下方圖片進(jìn)入小程序進(jìn)行評論
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點(diǎn),不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!