嵌入式C語言開發(fā)中數(shù)組越界問題分析
因?yàn)?a href="/tags/C語言" target="_blank">C語言不檢查數(shù)組越界,而數(shù)組又是我們經(jīng)常用的數(shù)據(jù)結(jié)構(gòu)之一,所以程序中經(jīng)常會遇到數(shù)組越界的情況,并且后果輕者讀寫數(shù)據(jù)不對,重者程序crash。下面我們來分析一下數(shù)組越界的情況:
1) 堆中的數(shù)組越界
因?yàn)槎咽俏覀冏约悍峙涞?,如果越界,那么會把堆中其他空間的數(shù)據(jù)給寫掉,或讀取了其他空間的數(shù)據(jù),這樣就會導(dǎo)致其他變量的數(shù)據(jù)變得不對,如果是一個指針的話,那么有可能會引起crash
2) 棧中的數(shù)組越界
因?yàn)闂J窍蛳略鲩L的,在進(jìn)入一個函數(shù)之前,會先把參數(shù)和下一步要執(zhí)行的指令地址(通過call實(shí)現(xiàn))壓棧,在函數(shù)的入口會把ebp壓棧,并把esp賦值給ebp,在函數(shù)返回的時(shí)候,將ebp值賦給esp,pop先前棧內(nèi)的上級函數(shù)棧的基地址給ebp,恢復(fù)原?;罚缓蟀颜{(diào)用函數(shù)之前的壓入棧的指令地址pop出來(通過ret實(shí)現(xiàn))。
棧是由高往低增長的,而數(shù)組的存儲是由低位往高位存的 ,如果越界的話,會把當(dāng)前函數(shù)的ebp和下一跳的指令地址覆蓋掉,如果覆蓋了當(dāng)前函數(shù)的ebp,那么在恢復(fù)的時(shí)候esp就不能指向正確的地方,從而導(dǎo)致未可知的情況,如果下一跳的地址也被覆蓋掉,那么肯定會導(dǎo)致crash。
所謂的數(shù)組越界,簡單地講就是指數(shù)組下標(biāo)變量的取值超過了初始定義時(shí)的大小,導(dǎo)致對數(shù)組元素的訪問出現(xiàn)在數(shù)組的范圍之外,這類錯誤也是C語言程序中最常見的錯誤之一。
在C語言中,數(shù)組必須是靜態(tài)的。換而言之,數(shù)組的大小必須在程序運(yùn)行前就確定下來。由于C語言并不具有類似Java等語言中現(xiàn)有的靜態(tài)分析工具的功能,可以對程序中數(shù)組下標(biāo)取值范圍進(jìn)行嚴(yán)格檢查,一旦發(fā)現(xiàn)數(shù)組上溢或下溢,都會因拋出異常而終止程序。也就是說,C語言并不檢驗(yàn)數(shù)組邊界,數(shù)組的兩端都有可能越界,從而使其他變量的數(shù)據(jù)甚至程序代碼被破壞。
因此,數(shù)組下標(biāo)的取值范圍只能預(yù)先推斷一個值來確定數(shù)組的維數(shù),而檢驗(yàn)數(shù)組的邊界是程序員的職責(zé)。
一般情況下,數(shù)組的越界錯誤主要包括兩種:數(shù)組下標(biāo)取值越界與指向數(shù)組的指針的指向范圍越界。
一、數(shù)組下標(biāo)越界簡介
1、什么是數(shù)組訪問越界?
在C語言中,我們可以直接通過數(shù)組下標(biāo)來訪問數(shù)組中的元素;
如果一個數(shù)組定義為有n個元素,那么,對這n個元素(下標(biāo)為0 到 n-1的元素)的訪問都合法,如果對這n個元素之外的訪問,就是非法的,稱為越界,例如:
int a[5] = {0}; //等價(jià) int a[5] = {0,0,0,0,0};
a[0] = 1; // ok
a[1] = 2; // ok
a[2] = 3; // ok
a[3] = 4; // ok
a[4] = 5; // ok
a[5] = 6; // 數(shù)組下標(biāo)越界
在上面代碼中,聲明一個數(shù)組a[5],該數(shù)組中只能存放5個元素,下標(biāo)索引值取值范圍0~4,超過這個范圍就屬于下標(biāo)越界;
2、訪問越界會出現(xiàn)什么結(jié)果?
首先,它并不會 造成編譯錯誤!就是說,C,C++ 的編譯器并不判斷和指出你的代碼訪問越界了。一個明明是錯誤的東西,就這樣“順利”地通過了編譯;
數(shù)組訪問越界在運(yùn)行時(shí),它的表現(xiàn)是不定的,有時(shí)似乎什么事也沒有,程序一直運(yùn)行(當(dāng)然,某些錯誤結(jié)果已造成);有時(shí),則是程序一下子崩潰。因此在使用數(shù)組時(shí),一定要在編程中判斷是否越界以保證程序的正確性。
二、數(shù)組下標(biāo)越界案例
#include
int main()
{
int i, a[10];
for(i = 1; i <= 10; ++i)
a[i] = 0;
return 0;
}
數(shù)組中的下標(biāo)從0開始,那么在上面代碼中只能訪問:a[1]、a[2]、a[3]、a[4]、a[5]、a[6]、a[7]、a[8]、a[9];當(dāng)i自加到10時(shí),a[10]屬于數(shù)組下標(biāo)越界。
三、防止數(shù)組下標(biāo)越界方法
如果數(shù)組的長度和下標(biāo)訪問值弄錯,都會造成數(shù)組下標(biāo)越界;數(shù)組的下標(biāo)是從0開始的,最大的訪問值是數(shù)組的長度-1;
//如果是整形數(shù)組
int len = sizeof(array)/sizeof(int);
//如果是字符數(shù)組
int len = sizeof(array)/sizeof(char);
//如果是浮點(diǎn)數(shù)數(shù)組
int len = sizeof(array)/sizeof(double);
//如果是浮點(diǎn)數(shù)數(shù)組
int len = sizeof(array)/sizeof(float);
for(int i = 0;i < len ; i++)
{
//.....
}
四、數(shù)組內(nèi)存溢出簡介
溢出:想象一個桶,桶的容積是有限的,你裝滿了水以后,如何還要往里面裝,那么水就溢出到地面了。
C語言中的溢出和這個原理一樣,桶的容積就表示你定義的某一數(shù)據(jù)的內(nèi)存大小,往里面寫入數(shù)據(jù)就表示在裝水。
案例一:一個計(jì)時(shí)器,最大計(jì) 100s 的時(shí),你讓他跑了 120 秒,它就溢出了;
案例二:兩個 unsigned char,一個200,一個也是200,相加,結(jié)果也就溢出,因?yàn)?unsigned char 最大就 255 ;