嵌入式系統(tǒng)設(shè)計(jì)中查找內(nèi)存丟失的策略
掃描二維碼
隨時(shí)隨地手機(jī)看文章
在嵌入式系統(tǒng)設(shè)計(jì)過程中,軟件工程師在動(dòng)態(tài)內(nèi)存管理中會(huì)遇到內(nèi)存丟失的問題,本刊1月A期介紹了討論了跟蹤內(nèi)存丟失面臨的困難以及一種將堆棧中的內(nèi)存碎片降至最少的解決方案,本期將討論怎樣才能找到導(dǎo)致內(nèi)存丟失的代碼段,從而提高(中國)工程師檢測內(nèi)存丟失的能力。
在嵌入式系統(tǒng)設(shè)計(jì)過程中,要利用數(shù)組保存內(nèi)存分配的每一個(gè)塊記錄,在內(nèi)存塊釋放的同時(shí),也將該記錄從數(shù)組中刪除。在主循環(huán)的每次迭代之后,分配的內(nèi)存塊的總數(shù)目將打印出來。理想情況下,要按類型對(duì)這些內(nèi)存塊排序,但指向malloc()和free()的調(diào)用則不包含任何類型信息。內(nèi)存分配的大小是最好的標(biāo)識(shí),因此成為設(shè)計(jì)工程師需要記錄的信息。此外,還需要存儲(chǔ)分配的內(nèi)存塊地址信息,這樣,當(dāng)調(diào)用釋放函數(shù)時(shí),就可以方便地定位或刪除塊記錄。
在添加和刪除塊記錄時(shí),還需要跟蹤每種大小的內(nèi)存塊數(shù)目,程序的列表1
給出了實(shí)現(xiàn)上述功能的代碼。
隨著內(nèi)存塊的分配和釋放,數(shù)組:
=======================
typedef struct
{
void * address;
size_t size;
} BlockEntry;
======================
跟蹤當(dāng)前存在的所有內(nèi)存塊。另一數(shù)組則跟蹤當(dāng)前存在的每種大小的內(nèi)存塊總數(shù):
======================
typedef struct
{
int count;
size_t size;
} Counter;
======================
函數(shù)mDisplayTable()允許我們?cè)诿看沃餮h(huán)結(jié)束時(shí)輸出結(jié)果。如果printf()不可用,則可利用調(diào)試器中斷系統(tǒng)并檢驗(yàn)數(shù)組的內(nèi)容。
上述代碼還必須使NUM_SIZES 和 NUM_BLOCKS足夠大,以處理系統(tǒng)中的大量內(nèi)存分配;但也不能太大,從而導(dǎo)致在系統(tǒng)運(yùn)行之前就已耗盡所有的RAM。
輸出
快速地瀏覽代碼,可以注意到結(jié)構(gòu)類型Sensor的長度定義如下:
=======================
typedef struct
{
int offset;
int gain;
char name[10];
} Sensor;
======================
假定int為32位數(shù)據(jù),那么Sensor的長度將為18(4+4+10),但在測試中,結(jié)果表明為20。編譯器可以在存儲(chǔ)結(jié)構(gòu)的數(shù)據(jù)成員之間自由地添加填充,以將對(duì)齊強(qiáng)制設(shè)定為一個(gè)字邊界。特殊情況下,每個(gè)字段開始于一個(gè)已存在的字邊界,那么為什么還需要填充呢?填充添加在存儲(chǔ)結(jié)構(gòu)的最末端,如果聲明了一個(gè)數(shù)組Sensor,那么該數(shù)組的所有成員(而不僅僅是第一個(gè)成員)將會(huì)進(jìn)行字對(duì)齊。根據(jù)處理器的不同,字對(duì)齊的速度將有所差異,有時(shí)這些編譯器將提供可根據(jù)速度選擇字對(duì)齊長度的切換開關(guān)。在任何情形下,最好不要根據(jù)源代碼的定義對(duì)存儲(chǔ)結(jié)構(gòu)的長度作任何假設(shè)。
下面考察當(dāng)使用這些函數(shù)時(shí),將得到何種類型的輸出。程序清單2給出了一個(gè)顯示存儲(chǔ)動(dòng)態(tài)內(nèi)存方式的示例。程序清單2將通常作為主外部循環(huán)的迭代了10次,并在每次迭代的末尾,調(diào)用函數(shù)mDisplay-Table()輸出分配的內(nèi)存塊情況。
許多內(nèi)存塊均在初始化階段進(jìn)行分配,但我們對(duì)這些內(nèi)存塊并不感興趣,因?yàn)檫@段代碼將不會(huì)重復(fù),因此不會(huì)產(chǎn)生內(nèi)存丟失。由于我們并不希望這些內(nèi)存分配導(dǎo)致分配表混亂,因此在啟動(dòng)感興趣的迭代之前需要將該分配表清空。為了清空分配表,需要調(diào)用函數(shù)mClearTable。
主循環(huán)調(diào)用的三個(gè)不同的函數(shù)
函數(shù)replacer():指示了一個(gè)用來分配內(nèi)存塊并且直到出現(xiàn)循環(huán)迭代才釋放的指針。如果檢驗(yàn)主循環(huán)中的迭代,可以發(fā)現(xiàn)分配的內(nèi)存塊并未釋放。通過監(jiān)控總數(shù)為20的內(nèi)存塊,從表1可以看出,每次迭代之后的內(nèi)存塊總數(shù)都為1,因此沒有出現(xiàn)內(nèi)存丟失。
函數(shù)growAndShrink():管理長度為24個(gè)結(jié)構(gòu)體的鏈表,該鏈表的長度將隨時(shí)間發(fā)生變化,但我們并不希望鏈表無限增長。通過檢驗(yàn)總數(shù)為24的內(nèi)存塊,我們可以發(fā)現(xiàn),雖然任意時(shí)間內(nèi)存塊的數(shù)目都可能發(fā)生變化,但決不會(huì)超過25個(gè)。
函數(shù)growForever():處理內(nèi)存塊長度為44的情形。這里我們可以非常清晰地看到,分配的內(nèi)存塊數(shù)目在持續(xù)增長。當(dāng)首次觀察該表時(shí),可能無法找到表的源頭。我們首先只能快速而粗略對(duì)mMalloc()上的條件斷點(diǎn)進(jìn)行檢驗(yàn),該斷點(diǎn)只有當(dāng)長度參數(shù)達(dá)到44時(shí)才觸發(fā)。當(dāng)?shù)竭_(dá)該斷點(diǎn)時(shí),可以檢驗(yàn)堆棧,以確定進(jìn)行內(nèi)存分配的地方。工程師完全能夠多次執(zhí)行這樣的操作,因?yàn)檫@種長度的內(nèi)存塊可在多處進(jìn)行分配。
嚴(yán)格地說,在函數(shù)growForever()中分配的內(nèi)存不是丟失,因?yàn)樗蟹峙涞膬?nèi)存塊均帶有引用,因此理論上可以在后來釋放。如果特定應(yīng)用這樣做,那么結(jié)果就非常明顯。
長度是關(guān)鍵因素
當(dāng)不同類型的對(duì)象共享相同長度的內(nèi)存時(shí),上述技術(shù)就不那么有效了。實(shí)際中碰到這樣的情形并不多,但即便可能引發(fā)問題,仍然還有很多別的選擇。
更為先進(jìn)的方法則是為每個(gè)記錄存儲(chǔ)類型信息。這并不困難,但我卻不愿采用這種方法,因?yàn)樵摲椒ㄒ鬄楹瘮?shù)mMalloc()的標(biāo)記添加一些新東西。我們可以定義一個(gè)列出所有可能分配的類型的枚舉類型。在每次調(diào)用函數(shù)mMalloc()時(shí),將傳遞一個(gè)附加的參數(shù),并且該參數(shù)為枚舉類型中的一個(gè)元素。如果在表中該參數(shù)連同地址一起被存儲(chǔ),那么總能識(shí)別出這類對(duì)象。
這也使得我們可以將分配長度不同,但類型相關(guān)(如可變長度的字符數(shù)組)的內(nèi)存塊鏈接起來。
C++通過使我們重載或刪除按類基(per-class basis)而使得這種方法更加簡便易行。盡管這是一種有效的方法,但這里我仍然不會(huì)采用這種方法,因?yàn)槲腋鼉A向采用適合C語言環(huán)境的技術(shù)。
分配位置
有時(shí),位置信息比類型信息更為有效。幸而我們能夠靈活地使用宏定義,從而無須更換標(biāo)記即可選擇這些信息。
==========================
#define mMalloc(size_t size)
mMallocLineNo(size, __LINE__,
__FILE__)
=========================
mMallocLineNo()函數(shù)是程序清單1中函數(shù)mMalloc()的變異?,F(xiàn)在我們期望像程序清單3那樣存儲(chǔ)行號(hào)和文件名信息,為保持額外信息,結(jié)構(gòu)BlockEntry將具有如下形式:
=========================
typedef struct
{
void * addr;
size_t size;
int line;
char * file;
} BlockEntry;
==========================
通過為每個(gè)內(nèi)存塊存儲(chǔ)行號(hào)和文件名,就能精確地定位任何分配的內(nèi)存塊??梢詾樗刑囟ㄩL度的表項(xiàng)設(shè)計(jì)一個(gè)輸出行號(hào)和文件名為mDisplayLocation()的函數(shù),這樣就能輕易地識(shí)別出長度可疑的內(nèi)存塊的來源。
再次回到表1,可能我們會(huì)擔(dān)心長度為44的內(nèi)存塊。為了更多地了解這些內(nèi)存的來源,可以在函數(shù)main()的末尾添加如下代碼:
========================
mDisplayLocation(44);
=======================
這能將行44輸出50遍。
=======================
line = 162, file = listing2.c
=======================
這清晰地表明內(nèi)存塊在函數(shù)growForever()中分配。
可變的長度
某些內(nèi)存分配的長度可以發(fā)生急劇變化,例如:
==========================
char *p = malloc(strlen(name)+1);
==========================
是分配一塊足以存儲(chǔ)字符串名和字符串截止符的內(nèi)存的通用方法。在嵌入式系統(tǒng)中,不會(huì)經(jīng)常對(duì)字符串和文件進(jìn)行操作;數(shù)據(jù)結(jié)構(gòu)的分配則不是這樣,例如:
==========================
Motor *m = malloc(sizeof(Motor));
==========================
如果假定Motor為存儲(chǔ)結(jié)構(gòu),那么上述分配將總是得到相同長度的內(nèi)存塊,在上面描述的函數(shù)中,將在輸出中更簡便地識(shí)別出這些內(nèi)存塊。
在分配可變長度內(nèi)存塊時(shí),可以行號(hào)和文件名的組合為核心計(jì)算內(nèi)存分配的計(jì)數(shù)。示例中,我們存儲(chǔ)了行號(hào)和文件名,但打印的總數(shù)則取決于長度。通過行號(hào)和文件名的聚合分配將有助于在相同的位置將所有的分配組合起來,而不管分配的長度如何。某些情況下,即便可變的長度不成問題,這樣的分析仍然能帶給我們更多的啟發(fā)。
內(nèi)存表
任何含有內(nèi)存丟失的代碼都將導(dǎo)致這里給出的內(nèi)存表不斷增大,而且并非所有的丟失都能像growForever()示例那樣清晰無誤地進(jìn)行識(shí)別。即便采用其它技術(shù)進(jìn)行丟失檢測和消除,這些輸出表仍將有助于確定丟失是否已被消除。
這里給出的循環(huán)并不處理可變的輸入數(shù)據(jù)。在實(shí)際項(xiàng)目中,通常插入一些調(diào)用(如仿真鍵盤敲擊序列的調(diào)用)以模擬輸入。在實(shí)際系統(tǒng)中,還必須創(chuàng)建一些適當(dāng)?shù)妮斎?。除非自己希望改變代碼,否則完全無須訪問導(dǎo)致內(nèi)存丟失的代碼段。因此,這里的示例或許向大家提供了一個(gè)良好的開端,但任何內(nèi)存丟失仍然需要進(jìn)行一些檢測。欲了解更多信息請(qǐng)查閱/murphyslaw。
作者簡介:
Niall Murphy為用戶接口和醫(yī)療系統(tǒng)編寫軟件已經(jīng)10年。他是《為嵌入式用戶接口設(shè)計(jì)軟件》一書的作者。Murphy非常歡迎讀者反饋,可以通過nmurphy@panelsoft.com與他聯(lián)系。
參考文獻(xiàn)
1. Eckel, Bruce. Thinking in C++. Upper Saddle River, NJ: Prentice Hall, 2000.
2. Murphy, Niall. "Assert Yourself," Embedded Systems Programming, May 2001, p. 27.