www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 公眾號精選 > 程序喵大人
[導(dǎo)讀]對于靜態(tài)鏈接先提出兩個問題: Q: 每個目標文件都有好多個段,目標文件在被鏈接成可執(zhí)行文件時,輸入目標文件中的各個段如何被合并到輸出文件? A: 合并相似的段,將所有的.text段合并到輸出文件的.text段,將所有的.data段合并到輸出文件的.data段。 Q: 鏈接


對于靜態(tài)鏈接先提出兩個問題:


Q:

每個目標文件都有好多個段,目標文件在被鏈接成可執(zhí)行文件時,輸入目標文件中的各個段如何被合并到輸出文件?


A:

合并相似的段,將所有的.text段合并到輸出文件的.text段,將所有的.data段合并到輸出文件的.data段。




Q:

鏈接器如何為他們分配在輸出文件中的空間和地址?


A:

這里涉及到程序鏈接的兩個步驟:


  1. 空間與地址分配:掃描所有的輸入目標文件,獲得它們每個段的長度屬性和位置,收集輸入目標文件中的符號表中的所有符號定義和符號引用,統(tǒng)一放到一個全局符號表中,合并所有的段,計算出輸出文件中各個段合并后的長度和位置,并建立映射關(guān)系。


  2. 符號解析與重定位:使用第一步收集到的所有信息,讀取輸入文件中段的數(shù)據(jù)及重定位信息,進行符號解析和重定位,調(diào)整代碼中的地址,將每個段中需要重定位的指令和數(shù)據(jù)進行“修補”,使他們都指向正確的位置。




Tips:



外部符號指的是目標文件需要引用的符號,但是定義在其它目標文件中,鏈接前外部符號地址都是000000之類,鏈接后的可執(zhí)行文件就可以看見這些外部符號都是有地址的。鏈接就是把相似的段放在一起,先找到段的偏移地址,再找出符號在段中的偏移,這樣可以確定符號在整個可執(zhí)行程序中的地址。


對于那些需要重定位的符號,都會放在重定位表里,也叫重定位段,即.rel.data、.rel.text等,如果.text段有被重定位的地方,就有.rel.text段,如果.data段有被重定位的地方,就有.rel.data段。



可以使用objdump查看目標文件的重定位表。


源代碼:

int main() { printf("程序喵\n"); return 0;}gcc -c test


objdump -r test.o
test.o: file format elf64-x86-64
RELOCATION RECORDS FOR [.text]:OFFSET TYPE VALUE0000000000000007 R_X86_64_PC32 .rodata-0x0000000000000004000000000000000c R_X86_64_PLT32 puts-0x0000000000000004

RELOCATION RECORDS FOR [.eh_frame]:OFFSET TYPE VALUE0000000000000020 R_X86_64_PC32 .text

使用nm也可以查看需要重定位的符號:

nm -u test.o U _GLOBAL_OFFSET_TABLE_ U puts

對于UND類型,這種未定義的符號都是因為該目標文件中有關(guān)于他們的重定位項,在鏈接器掃描完所有的輸入目標文件后,所有這種未定義的符號都應(yīng)該能在全局符號表中找到,否則報符號未定義錯誤。

注意:我們代碼里明明用的是printf,為什么它卻引用了puts的符號呢,因為編譯器默認情況下會把只用一個字符串參數(shù)的printf替換成puts, 可以節(jié)省格式解析的時間,使用-fno-builtin會關(guān)閉這個內(nèi)置函數(shù)優(yōu)化選項,如下:

~/test$ gcc -c -fno-builtin testlink.cc -o test.o~/test$ nm test.o U _GLOBAL_OFFSET_TABLE_0000000000000000 T main U printf


Tips:



現(xiàn)在的程序和庫通常來講都很大,一個目標文件可能包含成百上千個函數(shù)或變量,當需要用到某個目標文件的任意一個函數(shù)或變量時,就需要把它整個目標文件都鏈接進來,也就是說那些沒有用到的函數(shù)也會被鏈接進去,這會導(dǎo)致鏈接輸出文件變的很大,造成空間浪費。



有一個編譯選項叫函數(shù)級別鏈接,可以使得某個函數(shù)或變量單獨保存在一個段里面,都鏈接器需要用到某個函數(shù)時,就將它合并到輸出文件中,對于沒用到的函數(shù)則將他們拋棄,減少空間浪費,但這會減慢編譯和鏈接過程,GCC編譯器的編譯選項是:
-ffunction-sections-fdata-sections

可能很多人都會以為程序都是由main函數(shù)開始執(zhí)行和結(jié)束的,但其實不是,在main函數(shù)調(diào)用之前,為了保證程序可以順利進行,要先初始化進程執(zhí)行環(huán)境,如堆分配初始化、線程子系統(tǒng)等,C++的全局對象構(gòu)造函數(shù)也是這一時期被執(zhí)行的,全局析構(gòu)函數(shù)是main之后執(zhí)行的。

Linux一般程序的入口是__start函數(shù),程序有兩個相關(guān)的段:

init段:進程的初始化代碼,一個程序開始運行時,在main函數(shù)調(diào)用之前,會先運行.init段中的代碼。
fini段:進程終止代碼,當main函數(shù)正常退出后,glibc會安排執(zhí)行該段代碼。

如何指定程序入口

在ld鏈接過程中使用-e參數(shù)可以指定程序入口,由于一段簡短的printf函數(shù)其實都依賴了好多個鏈接庫,我們也不太方便使用鏈接腳本將目標文件與所有這些依賴庫進行鏈接,所以使用下面這段內(nèi)嵌匯編的程序來打印一段字符串,這段程序不依賴任何鏈接庫就可以打印出字符串內(nèi)容,讀者如果不懂其中的含義也不用擔心,只需要了解下面介紹的鏈接知識就好。


代碼如下:


const char* str = "hello";
void print() { asm("movl $13,%%edx \n\t" "movl str,%%ecx \n\t" "movl $0,%%ebx \n\t" "movl $4,%%eax \n\t" "int $0x80 \n\t" : :"r"(str):"edx", "ecx", "ebx");}

void exit() { asm("movl $42,%ebx \n\t" "movl $1,%eax \n\t" "int $0x80 \n\t");}
void nomain() { print(); exit();}

使用如下命令生成目標文件:

gcc -c -fno-builtin test.cc


看下輸出的test.o的符號:

~/test$ nm -a test.o0000000000000000 b .bss0000000000000000 n .comment0000000000000000 d .data0000000000000000 d .data.rel.local0000000000000000 r .eh_frame0000000000000000 n .note.GNU-stack0000000000000000 r .rodata0000000000000000 t .text0000000000000026 T _Z4exitv0000000000000000 T _Z5printv0000000000000039 T _Z6nomainv0000000000000000 D str0000000000000000 a test.cc

這里由于我的源文件是.cc結(jié)尾,所以是以c++方式編譯的,所以符號變成了上面的形式,如果變成了test.c,符號如下:

~/test$ gcc -c -fno-builtin test.c -o test.o~/test$ nm -a test.o0000000000000000 b .bss0000000000000000 n .comment0000000000000000 d .data0000000000000000 d .data.rel.local0000000000000000 r .eh_frame0000000000000000 n .note.GNU-stack0000000000000000 r .rodata0000000000000000 t .text0000000000000026 T exit0000000000000039 T nomain0000000000000000 T print0000000000000000 D str0000000000000000 a test.c

再使用-e指定入口函數(shù)符號:

~/test$ ld -static -e nomain -o test test.o~/test$ ./testhello

如何使用自定義鏈接腳本實現(xiàn)自定義段的功能
在ld鏈接過程中使用-T參數(shù)可以指定鏈接腳本,通過ld -verbose可以查看默認的鏈接腳本,原文太長,這里簡單截取了一部分:

$ ld -verboseGNU ld (GNU Binutils for Ubuntu) 2.30 Supported emulations: elf_x86_64 elf32_x86_64 elf_i386 elf_iamcu i386linux elf_l1om elf_k1om i386pep i386peusing internal linker script:==================================================/* Script for -z combreloc: combine and sort reloc sections *//* Copyright (C) 2014-2018 Free Software Foundation, Inc. Copying and distribution of this script, with or without modification, are permitted in any medium without royalty provided the copyright notice and this notice are preserved. */OUTPUT_FORMAT("elf64-x86-64", "elf64-x86-64", "elf64-x86-64")OUTPUT_ARCH(i386:x86-64)ENTRY(_start)SEARCH_DIR("=/usr/local/lib/x86_64-linux-gnu"); SEARCH_DIR("=/lib/x86_64-linux-gnu"); SEARCH_DIR("=/usr/lib/x86_64-linux-gnu"); SEARCH_DIR("=/usr/lib/x86_64-linux-gnu64"); SEARCH_DIR("=/usr/local/lib64"); SEARCH_DIR("=/lib64"); SEARCH_DIR("=/usr/lib64"); SEARCH_DIR("=/usr/local/lib"); SEARCH_DIR("=/lib"); SEARCH_DIR("=/usr/lib"); SEARCH_DIR("=/usr/x86_64-linux-gnu/lib64"); SEARCH_DIR("=/usr/x86_64-linux-gnu/lib");SECTIONS{ /* Read-only sections, merged into text segment: */ PROVIDE (__executable_start = SEGMENT_START("text-segment", 0x400000)); . = SEGMENT_START("text-segment", 0x400000) + SIZEOF_HEADERS;
.init : { KEEP (*(SORT_NONE(.init))) } .plt : { *(.plt) *(.iplt) } .plt.got : { *(.plt.got) } .plt.sec : { *(.plt.sec) } .text : { *(.text.unlikely .text.*_unlikely .text.unlikely.*) *(.text.exit .text.exit.*) *(.text.startup .text.startup.*) *(.text.hot .text.hot.*) *(.text .stub .text.* .gnu.linkonce.t.*) /* .gnu.warning sections are handled specially by elf32.em. */ *(.gnu.warning) } .fini : { KEEP (*(SORT_NONE(.fini))) } .rodata : { *(.rodata .rodata.* .gnu.linkonce.r.*) } /DISCARD/ : { *(.note.GNU-stack) *(.gnu_debuglink) *(.gnu.lto_*) }}

這里自定義一個簡單的鏈接腳本test.lds

ENTRY(nomain)
SECTIONS{ . = 0x8048000 + SIZEOF_HEADERS; tinytext : { *(.text) *(.data) *(.rodata) } /DISCARD/ : { *(.comment) }}

再使用-T指定鏈接腳本:

~/test$ ld -static -T test.lds -e nomain -o test test.o~/test$ ./testhello

上面的tinytext一行是指將.text段、.data段、.rodata段的內(nèi)容都合并到tinytext段中,使用readelf查看段的信息。

~/test$ readelf -S test~/test$ There are 6 section headers, starting at offset 0x482a0:
Section Headers: [Nr] Name Type Address Offset Size EntSize Flags Link Info Align [ 0] NULL 0000000000000000 00000000 0000000000000000 0000000000000000 0 0 0 [ 1] .eh_frame PROGBITS 00000000080480b0 000480b0 0000000000000078 0000000000000000 A 0 0 8 [ 2] tinytext PROGBITS 0000000008048128 00048128 0000000000000066 0000000000000000 WAX 0 0 8 [ 3] .shstrtab STRTAB 0000000000000000 0004826e 000000000000002e 0000000000000000 0 0 1 [ 4] .symtab SYMTAB 0000000000000000 00048190 00000000000000c0 0000000000000018 5 4 8 [ 5] .strtab STRTAB 0000000000000000 00048250 000000000000001e 0000000000000000 0 0 1Key to Flags: W (write), A (alloc), X (execute), M (merge), S (strings), l (large) I (info), L (link order), G (group), T (TLS), E (exclude), x (unknown) O (extra OS processing required) o (OS specific), p (processor specific)


工具小貼士

關(guān)于靜態(tài)鏈接庫:

ar rcs libxxx.a xx1.o xx2.o 打包靜態(tài)鏈接庫ar -t libc.a 查看靜態(tài)鏈接庫里都有什么目標文件ar -x libc.a 會解壓所有的目標文件到當前目錄gcc --verbose 可以查看整個編譯鏈接步驟

關(guān)于objdump:

objdump -i 查看本機目標架構(gòu)objdump -f 顯示文件頭信息objdump -d 反匯編程序objdump -t 顯示符號表入口,每個目標文件都有什么符號objdump -r 顯示文件的重定位入口,重定位表objdump -x 顯示所有可用的頭信息,等于-a -f -h -r -tobjdump -H 幫助

關(guān)于分析ELF文件格式:

readelf -h 列出文件頭readelf -S 列出每個段readelf -r 列出重定位表readelf -d 列出動態(tài)段

關(guān)于查看目標文件符號信息:

nm -a 顯示所有的符號nm -D 顯示動態(tài)符號nm -u 僅顯示沒有定義的外部符號nm -defined-only 僅顯示定義的符號

關(guān)于符號的說明:

如果符號類型是小寫的,表明符號是局部符號,大寫表示符號是全局符號。


A:該符號的值是絕對的,在以后的鏈接過程中,不允許進行改變。這樣的符號值,常常出現(xiàn)在中斷向量表中,例如用符號來表示各個中斷向量函數(shù)在中斷向量表中的位置。
B:該符號的值出現(xiàn)在.bss段中,未初始化的全局和靜態(tài)變量。
C:該符號的值在COMMON段中,里面的都是弱符號。
D:該符號位于數(shù)據(jù)段中。
I:該符號對另一個符號的間接引用
N:debug符號
R:該符號位于只讀數(shù)據(jù)區(qū)
T:該符號位于代碼段
U:該符號在當前文件未定義,定義在別的文件中
?:該符號類型沒有定義

參考資料

https://linuxtools-rst.readthedocs.io/zh_CN/latest/tool/

《程序員的自我修養(yǎng)》




c++11新特性,所有知識點都在這了!

你的c++團隊還在禁用異常處理嗎?

內(nèi)存對齊之格式修訂版

c++11新特性之智能指針

gcc a.c 究竟經(jīng)歷了什么?

談?wù)劤绦蜴溄蛹胺侄文切┦?/span>

免責聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉