因為C語言不檢查數組越界,而數組又是我們經常用的數據結構之一,所以程序中經常會遇到數組越界的情況,并且后果輕者讀寫數據不對,重者程序crash。下面我們來分析一下數組越界的情況:
1) 堆中的數組越界
因為堆是我們自己分配的,如果越界,那么會把堆中其他空間的數據給寫掉,或讀取了其他空間的數據,這樣就會導致其他變量的數據變得不對,如果是一個指針的話,那么有可能會引起crash
2) 棧中的數組越界
因為棧是向下增長的,在進入一個函數之前,會先把參數和下一步要執(zhí)行的指令地址(通過call實現)壓棧,在函數的入口會把ebp壓棧,并把esp賦值給ebp,在函數返回的時候,將ebp值賦給esp,pop先前棧內的上級函數棧的基地址給ebp,恢復原?;?,然后把調用函數之前的壓入棧的指令地址pop出來(通過ret實現)。
棧是由高往低增長的,而數組的存儲是由低位往高位存的 ,如果越界的話,會把當前函數的ebp和下一跳的指令地址覆蓋掉,如果覆蓋了當前函數的ebp,那么在恢復的時候esp就不能指向正確的地方,從而導致未可知的情況,如果下一跳的地址也被覆蓋掉,那么肯定會導致crash。
所謂的數組越界,簡單地講就是指數組下標變量的取值超過了初始定義時的大小,導致對數組元素的訪問出現在數組的范圍之外,這類錯誤也是C語言程序中最常見的錯誤之一。
在C語言中,數組必須是靜態(tài)的。換而言之,數組的大小必須在程序運行前就確定下來。由于C語言并不具有類似Java等語言中現有的靜態(tài)分析工具的功能,可以對程序中數組下標取值范圍進行嚴格檢查,一旦發(fā)現數組上溢或下溢,都會因拋出異常而終止程序。也就是說,C語言并不檢驗數組邊界,數組的兩端都有可能越界,從而使其他變量的數據甚至程序代碼被破壞。
因此,數組下標的取值范圍只能預先推斷一個值來確定數組的維數,而檢驗數組的邊界是程序員的職責。
一般情況下,數組的越界錯誤主要包括兩種:數組下標取值越界與指向數組的指針的指向范圍越界。
一、數組下標越界簡介
1、什么是數組訪問越界?
在C語言中,我們可以直接通過數組下標來訪問數組中的元素;
如果一個數組定義為有n個元素,那么,對這n個元素(下標為0 到 n-1的元素)的訪問都合法,如果對這n個元素之外的訪問,就是非法的,稱為越界,例如:
int a[5] = {0}; //等價 int a[5] = {0,0,0,0,0};
a[0] = 1; // ok
a[1] = 2; // ok
a[2] = 3; // ok
a[3] = 4; // ok
a[4] = 5; // ok
a[5] = 6; // 數組下標越界
在上面代碼中,聲明一個數組a[5],該數組中只能存放5個元素,下標索引值取值范圍0~4,超過這個范圍就屬于下標越界;
2、訪問越界會出現什么結果?
首先,它并不會 造成編譯錯誤!就是說,C,C++ 的編譯器并不判斷和指出你的代碼訪問越界了。一個明明是錯誤的東西,就這樣“順利”地通過了編譯;
數組訪問越界在運行時,它的表現是不定的,有時似乎什么事也沒有,程序一直運行(當然,某些錯誤結果已造成);有時,則是程序一下子崩潰。因此在使用數組時,一定要在編程中判斷是否越界以保證程序的正確性。
二、數組下標越界案例
#include
int main()
{
int i, a[10];
for(i = 1; i <= 10; ++i)
a[i] = 0;
return 0;
}
數組中的下標從0開始,那么在上面代碼中只能訪問:a[1]、a[2]、a[3]、a[4]、a[5]、a[6]、a[7]、a[8]、a[9];當i自加到10時,a[10]屬于數組下標越界。
三、防止數組下標越界方法
如果數組的長度和下標訪問值弄錯,都會造成數組下標越界;數組的下標是從0開始的,最大的訪問值是數組的長度-1;
//如果是整形數組
int len = sizeof(array)/sizeof(int);
//如果是字符數組
int len = sizeof(array)/sizeof(char);
//如果是浮點數數組
int len = sizeof(array)/sizeof(double);
//如果是浮點數數組
int len = sizeof(array)/sizeof(float);
for(int i = 0;i < len ; i++)
{
//.....
}
四、數組內存溢出簡介
溢出:想象一個桶,桶的容積是有限的,你裝滿了水以后,如何還要往里面裝,那么水就溢出到地面了。
C語言中的溢出和這個原理一樣,桶的容積就表示你定義的某一數據的內存大小,往里面寫入數據就表示在裝水。
案例一:一個計時器,最大計 100s 的時,你讓他跑了 120 秒,它就溢出了;
案例二:兩個 unsigned char,一個200,一個也是200,相加,結果也就溢出,因為 unsigned char 最大就 255 ;