揭曉嵌入式項(xiàng)目是如何評(píng)估系統(tǒng)所需的RAM和ROM用量
RAM(random access memory)隨機(jī)存儲(chǔ)內(nèi)存 ,這種bai存儲(chǔ)器在斷電時(shí)du將丟失其存儲(chǔ)內(nèi)容,故主要用于存儲(chǔ)短時(shí)間使用的程序。
ROM(Read-Only Memory)只讀內(nèi)存 ,是一種只能讀出事先所存數(shù)據(jù)的固態(tài)半導(dǎo)體存儲(chǔ)器。
而當(dāng)一個(gè)嵌入式項(xiàng)目在立項(xiàng)時(shí),其中有個(gè)重要的環(huán)節(jié)就是對(duì)系統(tǒng)所需的RAM和ROM用量進(jìn)行評(píng)估。
在滿足系統(tǒng)需求的前提下,盡量降低硬件成本,據(jù)說(shuō)同等大小的RAM價(jià)格大概是ROM的6倍。
大部分的資料都宣稱程序分為RO、DATA、BSS等段,RO段應(yīng)該放在ROM里,DATA段放在RAM里云云。對(duì)于DATA、BSS,這些段因?yàn)橛蓄l繁的寫操作,所肯定要放到RAM里,但是只讀數(shù)據(jù)(包括代碼段)必須放在ROM里嗎?答案是不一定。
RAM和ROM等存儲(chǔ)單元的物理地址映射是由做硬件的數(shù)字工程師確定,他們?cè)趧澐謺r(shí)主要會(huì)考慮電路的延遲,將這些儲(chǔ)存單元按照一定的方式掛在同一條AHB總線上。而嵌入式平臺(tái)軟件工程師可以通過(guò)修改鏈接腳本來(lái)設(shè)置哪些數(shù)據(jù)、代碼在程序運(yùn)行時(shí)放在ROM里,哪些放在RAM里.
這里多說(shuō)一句,RAM在系統(tǒng)剛上電的時(shí)候,其內(nèi)容是隨機(jī)的。所謂的數(shù)據(jù)、代碼放在RAM里,是指在初始化時(shí),CPU從flash里讀下載的bin文件,也有的平臺(tái)下載的是hex文件,找出其中的ram段,以類似于memcpy的方式將數(shù)據(jù)從bin文件里的對(duì)應(yīng)位置拷貝到RAM映射到的物理地址里,這才是所謂的放在RAM里.
RAM分為很多種,關(guān)于SRAM、DDR、SDRAM、PSRAM等等的概念請(qǐng)自行百度,從軟件的角度籠統(tǒng)一點(diǎn),分為片內(nèi)和片外ram。對(duì)于軟件工程師的來(lái)說(shuō),它們的區(qū)別就是訪問(wèn)速度,片內(nèi)ram一般用TCM(Tightly Coupled Memory)的方式集成在CPU芯片內(nèi)部,有單獨(dú)的數(shù)據(jù)通道,它的訪問(wèn)速度可以和cache相媲美,而片外ram的訪問(wèn)要麻煩一些,CPU發(fā)出想訪問(wèn)的地址給AHB總線控制器,它會(huì)知道對(duì)應(yīng)的地址是在片外RAM里,將訪問(wèn)請(qǐng)求遞給RAM控制器,再由RAM控制器訪問(wèn)RAM后將數(shù)據(jù)返回。
大體上片內(nèi)的訪問(wèn)速度是片外RAM的1.5~2倍。片內(nèi)ram集成在CPU芯片內(nèi)部,它是在CPU設(shè)計(jì)時(shí)就加上的,它使用和CPU幾乎一樣的制作工藝和材料,而且增加了芯片的大小,所以成本比較高,一般也就只有幾十K字節(jié),好鋼當(dāng)然要用在刀刃上,片內(nèi)ram用來(lái)存放中斷處理handler、RTOS調(diào)度器、任務(wù)上下文切換、內(nèi)存分配釋放等使用頻率最高的代碼和中斷堆棧這種讀寫頻率極高的內(nèi)存區(qū),如果有多余的部分也可以放一些經(jīng)常被引用到的全局變量。
片外RAM一般就是采購(gòu)的市面上的成品,如Samsung,Hynix,Apmemory等,價(jià)格相對(duì)便宜,其容量的可選范圍也較為寬松,從幾M到幾G的都有,它可以用來(lái)存儲(chǔ)全局變量,bss,以及我們常用到的malloc所分配的堆空間等。 還有一點(diǎn)不同的是:片內(nèi)Ram上電就可以直接使用,而片外的RAM都需要一個(gè)硬件控制器完成對(duì)其時(shí)序的控制,軟件人員則需要對(duì)該控制器編寫專用的控制驅(qū)動(dòng)
ROM一般是有兩種,一種是指集成在CPU芯片內(nèi)部的一塊只讀存儲(chǔ)區(qū)域,一般是幾K到幾十K字節(jié)大小,用來(lái)存儲(chǔ)系統(tǒng)剛上電時(shí)對(duì)cpu和一些核心外設(shè)(如時(shí)鐘,串口,MMU、DRAM、Flash等)進(jìn)行初始化的代碼,它在程序運(yùn)行中也是不可寫的,要對(duì)它執(zhí)行寫操作只能使用硬件燒寫器進(jìn)行,也就是一般所說(shuō)的下載程序,這部分的代碼在芯片測(cè)試階段可以進(jìn)行編程器下載更新,量產(chǎn)后一般就會(huì)固化,不能做任何修改的。
另一種指的就是flash。首先需要說(shuō)明的是,很多做嵌入式應(yīng)用開發(fā)的同學(xué)一直把flash比作PC上的硬盤,其實(shí)它們指的是Nand flash,而對(duì)于很多小型的嵌入式系統(tǒng),就只有一個(gè)2M或者4M的Nor Flash,它和硬盤有一個(gè)顯著的區(qū)別:flash里存放的代碼是可以由CPU直接取指并執(zhí)行的,而PC上硬盤里的程序都需要加載到內(nèi)存里才能運(yùn)行。
flash并不是絕對(duì)的運(yùn)行時(shí)不可寫,有時(shí)候應(yīng)用程序需要保存一些配置信息到flash里,類似于PC程序的配置文件,以保證掉電了之后它的內(nèi)容不會(huì)丟失,下次開機(jī)時(shí)可以直接從flash讀取到。
不過(guò),flash的寫操作要比RAM麻煩的多了,flash在寫之前需要發(fā)送多個(gè)命令字來(lái)握手,還要先對(duì)即將要寫的地址所在的扇區(qū)進(jìn)行整體擦除,就是把該扇區(qū)里的內(nèi)容全設(shè)為1,所謂寫flash就是把其中的一些bit設(shè)為0;更要命的是,flash的每個(gè)獨(dú)立bit位的寫次數(shù)是有上限的,市面上大部分的產(chǎn)品都只能寫10~100萬(wàn)次。多說(shuō)一句,每個(gè)bit位的壽命是獨(dú)立的,如果一個(gè)bit位在擦除和寫的動(dòng)作中,它的值始終為1,則不會(huì)有影響;例如反復(fù)對(duì)一個(gè)地址寫0xF0,則不會(huì)影響高4bit的壽命,而低4bit每次都要先擦成1,再寫入0,這樣就會(huì)降低其壽命。
現(xiàn)在我們討論一下RO、DATA、BSS到底應(yīng)該放在RAM里還是ROM里。
首先考慮一下,有沒(méi)有什么東西必須放在ROM里? 當(dāng)然有,引導(dǎo)程序(系統(tǒng)的初始化代碼)就必須放到ROM里。在CPU剛上電時(shí),只能去一個(gè)默認(rèn)的地址去取第一條指令,開始干活,這個(gè)地址都是映射到片內(nèi)的ROM里,原因很簡(jiǎn)單,此時(shí),作為外設(shè)的flash和DDR等都還沒(méi)有初始化,CPU根本無(wú)法從它們那里讀寫數(shù)據(jù),片內(nèi)ROM里的這些代碼就需要完成這些模塊的初始化。另外,一個(gè)項(xiàng)目的處理器和主要外設(shè)確定了以后,這部分初始化代碼在很長(zhǎng)的時(shí)間里,都不需要做任何修改的。
那有沒(méi)有什么東西必須放RAM里?當(dāng)然也有,應(yīng)用程序經(jīng)常讀寫的全局變量,堆、棧等等,都需要放在RAM里,根據(jù)訪問(wèn)的頻率,將頻率最高的少量數(shù)據(jù)放到片內(nèi)ram。
只讀數(shù)據(jù)(代碼段、程序里的const、字符串等)應(yīng)該放在哪?一般來(lái)說(shuō),這些數(shù)據(jù)應(yīng)該放在Flash里,因?yàn)樗鼈儾恍枰恍薷?,而且前面提到過(guò),rom要比ram便宜的多??赡苡腥藭?huì)有疑問(wèn),放在flash里,會(huì)不會(huì)讀取的速度很慢?讀ROM的速度是比讀RAM的數(shù)據(jù)要慢一點(diǎn),但是不要忘了,現(xiàn)代CPU都有強(qiáng)大的cache,而且數(shù)據(jù)Dcache和指令I(lǐng)cache都是分開的,在系統(tǒng)運(yùn)行中,cache的命中率可以高達(dá)80~90%,所以大部分時(shí)候CPU都可以在第一時(shí)間就拿到想要的指令和數(shù)據(jù)。
最后分享兩個(gè)案例:
1 前面提到片內(nèi)Ram是一塊非常寶貴的空間,它的優(yōu)點(diǎn)就是CPU可以在第一時(shí)間取到里面的數(shù)據(jù)。但是處于成本考慮,它的空間往往都非常有限。如果用戶有兩種比較耗時(shí)的業(yè)務(wù),需要頻繁的大量取指,但重點(diǎn)是它們不會(huì)同時(shí)運(yùn)行。這種情況下,就可以在鏈接腳本里開辟的片內(nèi)Ram空間,將該段的鏈接選項(xiàng)加上NOCROSSREFS,再將這片空間的大小定義為這兩個(gè)耗時(shí)業(yè)務(wù)代碼占空間較大的那個(gè)(例,業(yè)務(wù)一有1K代碼,業(yè)務(wù)二有2K代碼,這片空間就定義為2K),在業(yè)務(wù)一開始時(shí),將其代碼拷貝到這塊片內(nèi)ram里(一般是用DMA的方式),運(yùn)行業(yè)務(wù)一的代碼;當(dāng)業(yè)務(wù)二開始時(shí),也是拷貝其代碼到片內(nèi)ram里。這樣,兩種業(yè)務(wù)的耗時(shí)操作在運(yùn)行中都可以在第一時(shí)間里取到指令,對(duì)耗時(shí)業(yè)務(wù)做了很好的優(yōu)化。
2 曾經(jīng)遇到過(guò)這樣一個(gè)運(yùn)行時(shí)死機(jī),查看CPU寄存器可以看到是報(bào)一個(gè)取指了令異常,可是查看PC寄存器對(duì)應(yīng)的地址,發(fā)現(xiàn)CPU正在取的一條指令是正常的,起初十分費(fèi)解。后來(lái)通過(guò)仔細(xì)分析其死機(jī)前的運(yùn)行情況才定位出原因,死機(jī)前一個(gè)task正在寫flash,這時(shí)候來(lái)了一個(gè)中斷,中斷里調(diào)用了一個(gè)函數(shù),其地址就在flash里,而此時(shí)flash處于一個(gè)不可讀的狀態(tài),CPU在執(zhí)行中斷里的函數(shù)就拿不到指令,只能死機(jī)。
解決問(wèn)題的辦法有2種:一是在寫flash的過(guò)程中屏蔽所有中斷,這是一種很裸的方法,對(duì)于響應(yīng)時(shí)間很敏感的嵌入式系統(tǒng),一般都不允許隨便關(guān)中斷。二是將這個(gè)在flash里存儲(chǔ)的函數(shù)放到RAM里,避免訪問(wèn)flash的沖突。