上篇文章分享幾個實(shí)用的代碼片段(第二彈)我們分享了一段代碼:
有位讀者在朋友圈評論我的文章:(type * )0不是指向空地址嗎?(type*)0->member不是訪問非法內(nèi)存了嗎?為什么不會出錯?
這篇文章我們就來解釋這個問題。
GET_MEMBER_SIZE分析
首先,先來解釋 獲取結(jié)構(gòu)體成員大小 這個宏定義:
// 獲取結(jié)構(gòu)體成員大小 #define GET_MEMBER_SIZE(type, member) sizeof(((type*)0)->member)
雖然說這里用了 ((type*)0)->member ,看起來似乎有問題?訪問非法地址0地址?
其實(shí)不是的,注意這里用到了 sizeof操作符 。在C語言中,sizeof() 是一種內(nèi)存容量度量函數(shù),其字節(jié)數(shù)的計算是在 編譯階段 進(jìn)行的。
C語言源程序經(jīng)過編譯器進(jìn)行詞法分析、語法分析等過程生成中間語言(object后綴的文件)編譯期間會生成一個字符表和靜態(tài)分配空間(如new static 全局變量)它們所需的內(nèi)存空間可以計算出來放在鏈接庫后的可執(zhí)行文件中(虛擬內(nèi)存即磁盤),在運(yùn)行時將放在可執(zhí)行文件中的偏移量加載到內(nèi)存的堆中同時將局部變量加載到棧中。
所有內(nèi)存的開辟只有程序運(yùn)行的時候才會在物理內(nèi)存中開辟,即sizeof(((type*)0)->member)的操作不是等到程序運(yùn)行期間計算的,而是在編譯階段就計算了,所以GET_MEMBER_SIZE宏定義并沒有訪問非法內(nèi)存的操作。
進(jìn)一步的,我們看看上面那個代碼實(shí)例中,結(jié)構(gòu)體成員的字節(jié)數(shù)是不是在編譯階段計算出的,編譯出匯編文件:
gcc -S member_size.c -o member_size.s
這個匯編文件我們可能不全看懂所有指令,但大概知道如下三個指令的意思我們就大概可以知道這段匯編代碼的意思了。
-
leaq:加載有效地址指令,即將有效地址復(fù)制到寄存器中。
-
movl:數(shù)據(jù)傳送指令。
-
call指令:將當(dāng)前的 IP 或 CS和IP 壓入棧中, 轉(zhuǎn)移(jmp)。
可以看到,從上到下,依次會把立即數(shù)1、1、2、4、3、12放到esi寄存器中。
為什么是這些立即數(shù)?
我們編譯運(yùn)行一下我們的程序:
可以看到,正好就是我們需要求的結(jié)構(gòu)體各成員的大小及結(jié)構(gòu)體的大小,所以GET_MEMBER_SIZE(type, member)是在編譯階段起作用的。
其實(shí),GET_MEMBER_SIZE宏定義中的0只是看做一個隨意給的地址,方便求成員的大小,如果寫為0容易引起誤解,不妨可以寫為一個任意值,比如修改為100,也是可以計算出各結(jié)構(gòu)體成員的大小的。
最后,如果 ((type*)0)->member 在其它地方使用,會出現(xiàn)什么問題呢?自然就是這位讀者所理解的:操作非法地址。會引起段錯誤。比如添加如下一行代碼:
編譯運(yùn)行:
段錯誤的定位方法可查閱