當(dāng)前位置：首頁(yè) > 公眾號(hào)精選 > 架構(gòu)師社區(qū)

為了追求更快，CPU、內(nèi)存、I/O都做了哪些努力？

時(shí)間：2020-12-21 01:45:04

關(guān)鍵字： CPU 計(jì)算機(jī)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]曾經(jīng)，我面試的時(shí)候有兩個(gè)最怕的。一怕問算法，二怕問高并發(fā)。算法這個(gè)，刷了不少LeetCode，發(fā)現(xiàn)還是有套路可循的，雖不敢說(shuō)算法能力有多強(qiáng)，至少?zèng)]有以前那么怕了（才怪）。而第二個(gè)，高性能高并發(fā)技術(shù)，感覺有好多技術(shù)要學(xué)，東學(xué)一點(diǎn)，西學(xué)一點(diǎn)，不成體系。直到有一次面試，遇到了一個(gè)大牛，問到了這方面，結(jié)果被虐的體無(wú)完膚。幸運(yùn)的是，這位大牛不但技術(shù)一流，還認(rèn)真跟我交流了學(xué)習(xí)心得，怎么樣去有體系的系統(tǒng)去梳理這方面的技術(shù)知識(shí)，而不是瞎學(xué)。

背景

曾經(jīng)，我面試的時(shí)候有兩個(gè)最怕的。一怕問算法，二怕問高并發(fā)。

算法這個(gè)，刷了不少LeetCode，發(fā)現(xiàn)還是有套路可循的，雖不敢說(shuō)算法能力有多強(qiáng)，至少?zèng)]有以前那么怕了（才怪）。

而第二個(gè)，高性能高并發(fā)技術(shù)，感覺有好多技術(shù)要學(xué)，東學(xué)一點(diǎn)，西學(xué)一點(diǎn)，不成體系。直到有一次面試，遇到了一個(gè)大牛，問到了這方面，結(jié)果被虐的體無(wú)完膚。幸運(yùn)的是，這位大牛不但技術(shù)一流，還認(rèn)真跟我交流了學(xué)習(xí)心得，怎么樣去有體系的系統(tǒng)去梳理這方面的技術(shù)知識(shí)，而不是瞎學(xué)。

CPU

不管什么樣的編程語(yǔ)言，什么樣的代碼框架，最終都是由CPU去執(zhí)行完成的（當(dāng)然這么說(shuō)不太準(zhǔn)確，也有GPU、TPU、協(xié)處理器等其他情況，當(dāng)然這不是本文探討的重點(diǎn)）。

所以要想提高性能，提高并發(fā)量，首要問題就是如何讓CPU跑的更快？

這個(gè)問題，也是一直以來(lái)CPU廠商一直在努力追求的方向。

如何讓CPU更快？CPU廠商做了兩個(gè)方面的努力：

加快指令執(zhí)行的速度
加快CPU讀取數(shù)據(jù)的速度

對(duì)于第一個(gè)方向，CPU執(zhí)行指令的快慢，是跟CPU的主頻緊密相關(guān)的，如何更快的取指令、指令譯碼、執(zhí)行，縮短CPU的指令周期，提升主頻在相當(dāng)長(zhǎng)一段時(shí)間里都是非常有效的辦法。

從幾百M(fèi)Hz，到如今到幾GHz，CPU主頻有了長(zhǎng)足的進(jìn)步，相同時(shí)間里能夠執(zhí)行的指令數(shù)變的更多了。

對(duì)于第二個(gè)方向，如何提升CPU讀取數(shù)據(jù)的速度，答案就是加緩存，利用局部性原理將內(nèi)存中經(jīng)常會(huì)訪問的數(shù)據(jù)搬運(yùn)到CPU中，這樣大大提升了存取速度。

從一級(jí)緩存，到二級(jí)緩存，乃至三級(jí)緩存，CPU緩存的層級(jí)和容量也在不斷提升，讀寫數(shù)據(jù)的時(shí)間省了不少。

但隨著時(shí)間到推移，尤其進(jìn)入21世紀(jì)之后，處理器廠商發(fā)現(xiàn)，進(jìn)一步提升主頻變得越來(lái)越困難了，CPU的緩存也很難進(jìn)一步擴(kuò)容。

怎么辦呢？既然一個(gè)人干活的速度已經(jīng)很難再提升，那何不多找?guī)讉€(gè)人一起干？于是，多核技術(shù)來(lái)了，一個(gè)CPU里面有多個(gè)核心，眾人劃槳開大船，CPU的速度再一次騰飛～

甚至，讓一個(gè)核在“閑暇時(shí)間”，利用“閑置資源”去執(zhí)行另外的線程，誕生了讓一個(gè)核“同時(shí)”執(zhí)行兩個(gè)線程的超線程技術(shù)。

上面簡(jiǎn)單交代了為了提升性能，CPU所做的努力。但是光是CPU快是沒用的，還需要我們更好的去利用開發(fā)，否則就是對(duì)CPU算力的浪費(fèi)。

上面提到了線程，是的，如何提高性能，提高并發(fā)量？使用多線程技術(shù)當(dāng)然是一個(gè)非常好的思路。

但多線程的引入，就不得不提到兩個(gè)跟線程有關(guān)的話題：

線程同步

線程阻塞

多個(gè)線程協(xié)同工作，必然會(huì)引入同步的問題，常規(guī)解決方案是加鎖，加鎖的線程一般會(huì)進(jìn)入阻塞。

線程遇到阻塞了，就需要切換，而切換是有一定的成本開銷的，不僅是系統(tǒng)調(diào)度的時(shí)間開銷，還可能有CPU緩存失效的損失。

如果線程頻頻加鎖，頻頻阻塞，那這個(gè)損失就相當(dāng)可觀了。為了提升性能，無(wú)鎖編程技術(shù)就出現(xiàn)了，利用CPU提供的機(jī)制，提供更輕量的加鎖方案。

同時(shí)，為了讓切換后的線程仍然能夠在之前的CPU核心上運(yùn)行，降低緩存損失，線程的CPU親和性綁定技術(shù)也出現(xiàn)了。

現(xiàn)代操作系統(tǒng)都是以時(shí)間片的形式來(lái)調(diào)度分配給多個(gè)線程使用。如果時(shí)間片還沒用完就因?yàn)檫@樣或那樣的原因?qū)?zhí)行機(jī)會(huì)拱手相讓，那線程也太虧了。

于是，有人提出要充分利用CPU，別讓線程阻塞，交出執(zhí)行權(quán)，自己在應(yīng)用層實(shí)現(xiàn)多個(gè)執(zhí)行流的調(diào)度，這里阻塞了，就去執(zhí)行那里，總之要把時(shí)間片充分用完，這就誕生了協(xié)程技術(shù)，阻塞了不要緊，我還能干別的，不要輕易發(fā)生線程切換。

內(nèi)存

與CPU工作相關(guān)的第一親密伙伴就是內(nèi)存了，二者協(xié)作才能唱好一出戲。

提升內(nèi)存訪問的速度，同樣是高性能開發(fā)話題重要組成部分！

那如何提升呢？硬件層面程序員是很難改變的，咱們只好從軟件層面下功夫。

內(nèi)存的管理經(jīng)歷了從實(shí)地址模式到分頁(yè)式內(nèi)存管理，如今的計(jì)算機(jī)中，CPU拿的的地址都是虛擬地址，這中間就會(huì)涉及到地址的轉(zhuǎn)換，在這里就有文章可做，有兩個(gè)方向可以努力：

減少缺頁(yè)異常

使用大頁(yè)技術(shù)

現(xiàn)代操作系統(tǒng)，基本上都會(huì)使用一個(gè)叫換頁(yè)/交換文件的技術(shù)：內(nèi)存空間有限，但進(jìn)程越來(lái)越多，對(duì)內(nèi)存空間的需求越來(lái)越大，用完了怎么辦？于是在硬盤上劃分一塊區(qū)域出來(lái)，把內(nèi)存中很久不用的數(shù)據(jù)轉(zhuǎn)移到這塊區(qū)域上來(lái)，等程序用到的時(shí)候，觸發(fā)訪問異常，再在異常處理函數(shù)中將其從硬盤讀取進(jìn)來(lái)。

可以想象，如果程序訪問的內(nèi)存老是不在內(nèi)存中，而是被交換到了硬盤上，就會(huì)頻繁觸發(fā)缺頁(yè)異常，那程序的性能肯定大打折扣，所以減少缺頁(yè)異常也是提升性能的好辦法。

從虛擬地址尋址真實(shí)的物理內(nèi)存，這個(gè)過程是CPU完成的，具體來(lái)說(shuō)，就是通過查表，從頁(yè)表->一級(jí)頁(yè)目錄->二級(jí)頁(yè)目錄->物理內(nèi)存。

頁(yè)目錄和頁(yè)表是存在內(nèi)存中的，毫無(wú)疑問，內(nèi)存尋址是一個(gè)非常非常高頻的事情，時(shí)時(shí)刻刻都在發(fā)生，而多次查表勢(shì)必是很慢的，有鑒于此，CPU引入了一個(gè)叫TLB（Translation Look- aside buffer）的東西，使用緩存頁(yè)表項(xiàng)的方式來(lái)減少內(nèi)存查表的操作，加快尋址速度。

默認(rèn)情況下，操作系統(tǒng)是以4KB為單位管理內(nèi)存頁(yè)的，對(duì)于一些需要大量?jī)?nèi)存的服務(wù)器程序（Redis、JVM、ElascticSearch等等），動(dòng)輒就是幾十個(gè)G，按照4KB的單位劃分，那得產(chǎn)生多少的頁(yè)表項(xiàng)??！

而CPU中的TLB的大小是有限的，內(nèi)存越多，頁(yè)表項(xiàng)也就越多，TLB緩存失效的概率也就越大。所以，大頁(yè)內(nèi)存技術(shù)就出現(xiàn)了，4KB太小，就弄大點(diǎn)。大頁(yè)內(nèi)存技術(shù)的出現(xiàn)，減少了缺頁(yè)異常的出現(xiàn)次數(shù)，也提高了TLB命中的概率，對(duì)于提升性能有很大的幫助。

在一些高配置的服務(wù)器上，內(nèi)存數(shù)量龐大，而CPU多個(gè)核都要通過內(nèi)存總線訪問內(nèi)存，可想而知，CPU核數(shù)上去以后，內(nèi)存總線的競(jìng)爭(zhēng)勢(shì)必也會(huì)加劇。于是NUMA架構(gòu)出現(xiàn)了，把CPU核心劃分不同的分組，各自使用自己的內(nèi)存訪問總線，提高內(nèi)存的訪問速度。

I/O

CPU和內(nèi)存都?jí)蚩炝?，但這還是不夠。我們的程序日常工作中，除了一些CPU密集型的程序（執(zhí)行數(shù)學(xué)運(yùn)算，加密解密，機(jī)器學(xué)習(xí)等等）以外，相當(dāng)一部分時(shí)間都是在執(zhí)行I/O，如讀寫硬盤文件、收發(fā)網(wǎng)絡(luò)數(shù)據(jù)包等等。

所以，如何提升I/O的速度，是高性能開發(fā)技術(shù)領(lǐng)域一個(gè)重要的話題。

因?yàn)镮/O會(huì)涉及到與外設(shè)（硬盤、網(wǎng)卡等）的交互，而這些外設(shè)又通常是非常慢（相對(duì)CPU執(zhí)行速度）的，所以正常情況下，線程執(zhí)行到I/O操作時(shí)難免會(huì)阻塞，這也是前面在CPU部分提到過的。

阻塞以后那就沒辦法干活了，為了能干活，那就開多個(gè)線程。但線程資源是很昂貴的，沒辦法大量使用，況且線程多了，多個(gè)線程切換調(diào)度同樣是很花時(shí)間的。

那可不可以讓線程執(zhí)行I/O時(shí)不阻塞呢？于是，新的技術(shù)又出現(xiàn)了：

非阻塞I/O

I/O多路復(fù)用

異步I/O

原來(lái)的阻塞I/O是一直等，等到I/O的完成，非阻塞I/O一般是輪詢，可以去干別的事，過一會(huì)兒就來(lái)問一下：好了沒有？

但每個(gè)線程都去輪詢也不是個(gè)事兒啊，干脆交給一個(gè)線程去專門負(fù)責(zé)吧，這就是I/O多路復(fù)用，通過select/poll的方式只用一個(gè)線程就可以處理多個(gè)I/O目標(biāo)。再然后，再改進(jìn)一下，用epoll，連輪詢也不用了，改用內(nèi)核喚醒通知的機(jī)制，同時(shí)處理的I/O目標(biāo)還更多了。

異步I/O就更爽了，設(shè)置一個(gè)回調(diào)函數(shù)，自己干別的事去了，回頭操作系統(tǒng)叫你來(lái)收數(shù)據(jù)就好了。

再說(shuō)回到I/O本身，會(huì)將數(shù)據(jù)在內(nèi)存和外設(shè)之間傳輸，如果數(shù)據(jù)量很大，讓CPU去搬運(yùn)數(shù)據(jù)的話，既耗時(shí)又沒有技術(shù)含量，這是對(duì)CPU算力的很大浪費(fèi)。

所以，為了將CPU從中解放出來(lái)，又誕生了一門技術(shù)：直接內(nèi)存訪問DMA，把數(shù)據(jù)的傳輸工作外包出去，交由DMA控制器來(lái)完成，CPU只在背后發(fā)號(hào)施令即可。

有了DMA，再也不用麻煩CPU去執(zhí)行數(shù)據(jù)的搬運(yùn)工作。但對(duì)于應(yīng)用程序而言，想要把文件通過網(wǎng)絡(luò)發(fā)送出去，還是要把數(shù)據(jù)在內(nèi)核態(tài)空間和用戶態(tài)空間來(lái)回折騰兩次，這兩步還得CPU出馬去復(fù)制拷貝，屬于一種浪費(fèi)，為了解決這個(gè)問題，提升性能，又進(jìn)一步產(chǎn)生了零拷貝技術(shù)，徹底為CPU減負(fù)。

算法架構(gòu)

CPU、內(nèi)存、I/O都?jí)蚩炝?，單臺(tái)計(jì)算機(jī)的性能已經(jīng)很難提升了。不過，現(xiàn)在的服務(wù)器很少是單打獨(dú)斗了，接下來(lái)就要把目光轉(zhuǎn)移到算法、架構(gòu)上來(lái)了。

一臺(tái)服務(wù)器搞不定，那就用硬件堆出性能來(lái)，分布式集群技術(shù)和負(fù)載均衡技術(shù)就派上用場(chǎng)了。

這年頭，哪個(gè)后端服務(wù)沒有數(shù)據(jù)庫(kù)？如何讓數(shù)據(jù)庫(kù)更快？該輪到索引技術(shù)上了，通過給數(shù)據(jù)庫(kù)建立索引，提升檢索速度。

但數(shù)據(jù)庫(kù)這家伙的數(shù)據(jù)畢竟是存在硬盤上的，讀取的時(shí)候勢(shì)必會(huì)慢，要是大量的數(shù)據(jù)請(qǐng)求都懟上來(lái)，這誰(shuí)頂?shù)米?？于是基于?nèi)存的數(shù)據(jù)庫(kù)緩存Redis、Memcached應(yīng)運(yùn)而生，畢竟，訪問內(nèi)存比從數(shù)據(jù)庫(kù)查詢快得多。

算法架構(gòu)這一塊的技術(shù)實(shí)在太多了，也是從一個(gè)普通碼農(nóng)通往架構(gòu)師的必經(jīng)之路，咱們下回再聊。

總結(jié)

高性能、高并發(fā)是后端開發(fā)永恒追求的話題。

每一項(xiàng)技術(shù)都不是憑空出現(xiàn)的，一定是為了解決某個(gè)問題而提出。我們?cè)趯W(xué)這些技術(shù)的時(shí)候，掌握它出現(xiàn)的原因，和其他技術(shù)之間的關(guān)聯(lián)，在自己的大腦中建立一座技術(shù)知識(shí)層級(jí)圖，一定能事半功倍。

特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容，還沒關(guān)注的小伙伴，可以長(zhǎng)按關(guān)注一下：

為了追求更快，CPU、內(nèi)存、I/O都做了哪些努力？

長(zhǎng)按訂閱更多精彩▼
如有收獲，點(diǎn)個(gè)在看，誠(chéng)摯感謝

免責(zé)聲明：本文內(nèi)容由21ic獲得授權(quán)后發(fā)布，版權(quán)歸原作者所有，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn)，不代表本平臺(tái)立場(chǎng)，如有問題，請(qǐng)聯(lián)系我們，謝謝！

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國(guó)博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變?cè)撇捎煤凸芾矸绞?/a>

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動(dòng)工具SODA V將顛覆汽車市場(chǎng)，使汽車開發(fā)時(shí)間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動(dòng) BSP

[美通社全球TMT]

從容應(yīng)對(duì)未知風(fēng)險(xiǎn)----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行，同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn)，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國(guó)游戲市場(chǎng)開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報(bào)道，騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語(yǔ)權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機(jī) 衛(wèi)星通信

[美通社全球TMT]

中國(guó)通信服務(wù)公布2024年中期業(yè)績(jī)

要點(diǎn)：有效應(yīng)對(duì)環(huán)境變化，經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升落實(shí)提質(zhì)增效舉措，毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競(jìng)爭(zhēng)力堅(jiān)持高質(zhì)量發(fā)展策略，塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字：通信 BSP 電信運(yùn)營(yíng)商數(shù)字經(jīng)濟(jì)

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動(dòng)產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]

軟通動(dòng)力與長(zhǎng)三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上，軟通動(dòng)力信息技術(shù)（集團(tuán)）股份有限公司（以下簡(jiǎn)稱"軟通動(dòng)力"）與長(zhǎng)三角投資（上海）有限...

關(guān)鍵字： BSP 信息技術(shù)