被鵝廠搞懵逼了(更正)
時(shí)間:2021-09-06 15:22:34
手機(jī)看文章
掃描二維碼
隨時(shí)隨地手機(jī)看文章
[導(dǎo)讀]??大家好,我是小林。上周發(fā)了一篇讀者面試鵝廠遇到的網(wǎng)絡(luò)問題:又被鵝廠搞懵了!當(dāng)時(shí)我的關(guān)注點(diǎn)放在了「TIME_WAIT狀態(tài)下,接收到了數(shù)據(jù)包會(huì)怎么處理?」然后那篇文章留言區(qū)有人說這題的重點(diǎn)并不是想問「在TIME_WAIT狀態(tài)下對(duì)數(shù)據(jù)包的如何處理」。而是「在FIN_WAIT_2狀態(tài)...
??大家好,我是小林。上周發(fā)了一篇讀者面試鵝廠遇到的網(wǎng)絡(luò)問題:又被鵝廠搞懵了!當(dāng)時(shí)我的關(guān)注點(diǎn)放在了「TIME_WAIT 狀態(tài)下,接收到了數(shù)據(jù)包會(huì)怎么處理?」然后那篇文章留言區(qū)有人說這題的重點(diǎn)并不是想問「在 TIME_WAIT 狀態(tài)下對(duì)數(shù)據(jù)包的如何處理」。而是 「在 FIN_WAIT_2 狀態(tài)下如何處理亂序的 FIN 報(bào)文」。隨后,我自己去看了 Linux 的源碼,驗(yàn)證了這位讀者的思路是沒問題的。果然一個(gè)人思考容易形成思維定勢,和別人交流可能才能發(fā)現(xiàn)自己沒有注意到的點(diǎn)。這道鵝廠的網(wǎng)絡(luò)題可能是提問的讀者表述有問題,因?yàn)槿绻?FIN 報(bào)文比數(shù)據(jù)包先抵達(dá)客戶端,此時(shí) FIN 報(bào)文其實(shí)是一個(gè)亂序的報(bào)文,此時(shí)客戶端的 TCP 連接并不會(huì)從 FIN_WAIT_2 狀態(tài)轉(zhuǎn)換到 TIME_WAIT 狀態(tài)。因此,我們要關(guān)注到點(diǎn)是看「在 FIN_WAIT_2 狀態(tài)下,是如何處理收到的亂序到 FIN 報(bào)文,然后 TCP 連接又是什么時(shí)候才進(jìn)入到 TIME_WAIT 狀態(tài)?」。
我這里先直接說結(jié)論:在 FIN_WAIT_2 狀態(tài)時(shí),如果收到亂序的 FIN 報(bào)文,那么就被會(huì)加入到「亂序隊(duì)列」,并不會(huì)進(jìn)入到 TIME_WAIT 狀態(tài)。等再次收到前面被網(wǎng)絡(luò)延遲的數(shù)據(jù)包時(shí),會(huì)判斷亂序隊(duì)列有沒有數(shù)據(jù),然后會(huì)檢測亂序隊(duì)列中是否有可用的數(shù)據(jù),如果能在亂序隊(duì)列中找到與當(dāng)前報(bào)文的序列號(hào)保持的順序的報(bào)文,就會(huì)看該報(bào)文是否有 FIN 標(biāo)志,如果發(fā)現(xiàn)有 FIN 標(biāo)志,這時(shí)才會(huì)進(jìn)入 TIME_WAIT 狀態(tài)。我也畫了一張圖,大家可以結(jié)合著圖來理解。TCP 源碼分析
接下來,我?guī)Т蠹铱纯丛创a,聽到要源碼分析,可能有的同學(xué)就慫了。其實(shí)要分析我們今天這個(gè)問題,只要懂 if else 就行了,我也會(huì)用中文來表述代碼的邏輯,所以單純看我的文字也是可以的。這次我們重點(diǎn)分析的是,在 FIN_WAIT_2 狀態(tài)下,收到 FIN 報(bào)文是如何處理的。在 Linux 內(nèi)核里,當(dāng) IP 層處理完消息后,會(huì)通過回調(diào)? ??
我這里先直接說結(jié)論:在 FIN_WAIT_2 狀態(tài)時(shí),如果收到亂序的 FIN 報(bào)文,那么就被會(huì)加入到「亂序隊(duì)列」,并不會(huì)進(jìn)入到 TIME_WAIT 狀態(tài)。等再次收到前面被網(wǎng)絡(luò)延遲的數(shù)據(jù)包時(shí),會(huì)判斷亂序隊(duì)列有沒有數(shù)據(jù),然后會(huì)檢測亂序隊(duì)列中是否有可用的數(shù)據(jù),如果能在亂序隊(duì)列中找到與當(dāng)前報(bào)文的序列號(hào)保持的順序的報(bào)文,就會(huì)看該報(bào)文是否有 FIN 標(biāo)志,如果發(fā)現(xiàn)有 FIN 標(biāo)志,這時(shí)才會(huì)進(jìn)入 TIME_WAIT 狀態(tài)。我也畫了一張圖,大家可以結(jié)合著圖來理解。
TCP 源碼分析
接下來,我?guī)Т蠹铱纯丛创a,聽到要源碼分析,可能有的同學(xué)就慫了。其實(shí)要分析我們今天這個(gè)問題,只要懂 if else 就行了,我也會(huì)用中文來表述代碼的邏輯,所以單純看我的文字也是可以的。這次我們重點(diǎn)分析的是,在 FIN_WAIT_2 狀態(tài)下,收到 FIN 報(bào)文是如何處理的。在 Linux 內(nèi)核里,當(dāng) IP 層處理完消息后,會(huì)通過回調(diào)?tcp_v4_rcv
?函數(shù)將消息轉(zhuǎn)給 TCP 層,所以這個(gè)函數(shù)就是 TCP 層收到消息的入口。處于 FIN_WAIT_2 狀態(tài)下的客戶端,在收到服務(wù)端的報(bào)文后,最終會(huì)調(diào)用 tcp_v4_do_rcv 函數(shù)。接下來,tcp_v4_do_rcv 方法會(huì)調(diào)用 tcp_rcv_state_process,在這里會(huì)根據(jù) TCP 狀態(tài)做對(duì)應(yīng)的處理,這里我們只關(guān)注 FIN_WAIT_2 狀態(tài)。在上面這個(gè)代碼里,可以看到如果 shutdown 關(guān)閉了讀方向,那么在收到對(duì)方發(fā)來的數(shù)據(jù)包,則會(huì)回復(fù) RST 報(bào)文。而我們這次的題目里, shutdown 只關(guān)閉了寫方向,所以會(huì)繼續(xù)往下調(diào)用 tcp_data_queue 函數(shù)(因?yàn)?case TCP_FIN_WAIT2 代碼塊里并沒有 break 語句,所以會(huì)走到該函數(shù))。在上面的 tcp_data_queue 函數(shù)里,如果收到的報(bào)文的序列號(hào)是我們預(yù)期的,也就是有序的話:- 會(huì)判斷該報(bào)文有沒有 FIN 標(biāo)志,如果有的話就會(huì)調(diào)用 tcp_fin 函數(shù),這個(gè)函數(shù)負(fù)責(zé)將 FIN_WAIT_2 狀態(tài)轉(zhuǎn)換為 TIME_WAIT。
- 接著還會(huì)看亂序隊(duì)列有沒有數(shù)據(jù),如果有的話會(huì)調(diào)用 tcp_ofo_queue 函數(shù),這個(gè)函數(shù)負(fù)責(zé)檢查亂序隊(duì)列中是否有數(shù)據(jù)包可用,即能不能在亂序隊(duì)列找到與當(dāng)前數(shù)據(jù)包保持序列號(hào)連續(xù)的數(shù)據(jù)包。