www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 公眾號精選 > CPP開發(fā)者
[導讀]↓推薦關注↓傳統(tǒng)的SystemCallI/O在Linux系統(tǒng)中,傳統(tǒng)的訪問方式是通過write()和read()兩個系統(tǒng)調用實現的,通過read()函數讀取文件到到緩存區(qū)中,然后通過write()方法把緩存中的數據輸出到網絡端口。read(file_fd,?tmp_buf,?le...



傳統(tǒng)的 System Call I/O

在 Linux 系統(tǒng)中,傳統(tǒng)的訪問方式是通過 write() 和 read() 兩個系統(tǒng)調用實現的,通過 read() 函數讀取文件到到緩存區(qū)中,然后通過 write() 方法把緩存中的數據輸出到網絡端口。


read(file_fd, tmp_buf, len);
write(socket_fd, tmp_buf, len); 下圖分別對應傳統(tǒng) I/O 操作的數據讀寫流程,整個過程涉及 2 次 CPU 拷貝、2 次 DMA 拷貝,總共 4 次拷貝,以及 4 次上下文切換。


  • CPU 拷貝:


    由 CPU 直接處理數據的傳送,數據拷貝時會一直占用 CPU 的資源。


  • DMA 拷貝:


    由 CPU 向DMA磁盤控制器下達指令,讓 DMA 控制器來處理數據的傳送,數據傳送完畢再把信息反饋給 CPU,從而減輕了 CPU 資源的占有率。


  • 上下文切換:


    當用戶程序向內核發(fā)起系統(tǒng)調用時,CPU 將用戶進程從用戶態(tài)切換到內核態(tài);


    當系統(tǒng)調用返回時,CPU 將用戶進程從內核態(tài)切換回用戶態(tài)。


讀操作

當應用程序執(zhí)行 read 系統(tǒng)調用讀取一塊數據的時候,如果這塊數據已經存在于用戶進程的頁內存中,就直接從內存中讀取數據。


如果數據不存在,則先將數據從磁盤加載數據到內核空間的讀緩存(Read Buffer)中,再從讀緩存拷貝到用戶進程的頁內存中。


read(file_fd, tmp_buf, len);
基于傳統(tǒng)的 I/O 讀取方式,read 系統(tǒng)調用會觸發(fā) 2 次上下文切換,1 次 DMA 拷貝和 1 次 CPU 拷貝。


發(fā)起數據讀取的流程如下:


  1. 用戶進程通過 read() 函數向 Kernel 發(fā)起 System Call,上下文從 user space 切換為 kernel space。
  2. CPU 利用 DMA 控制器將數據從主存或硬盤拷貝到 kernel space 的讀緩沖區(qū)(Read Buffer)。
  3. CPU 將讀緩沖區(qū)(Read Buffer)中的數據拷貝到 user space 的用戶緩沖區(qū)(User Buffer)。
  4. 上下文從 kernel space 切換回用戶態(tài)(User Space),read 調用執(zhí)行返回。

寫操作

當應用程序準備好數據,執(zhí)行 write 系統(tǒng)調用發(fā)送網絡數據時,先將數據從用戶空間的頁緩存拷貝到內核空間的網絡緩沖區(qū)(Socket Buffer)中,然后再將寫緩存中的數據拷貝到網卡設備完成數據發(fā)送。


write(socket_fd, tmp_buf, len);
基于傳統(tǒng)的 I/O 寫入方式,write() 系統(tǒng)調用會觸發(fā) 2 次上下文切換,1 次 CPU 拷貝和 1 次 DMA 拷貝。


用戶程序發(fā)送網絡數據的流程如下:


  1. 用戶進程通過 write() 函數向 kernel 發(fā)起 System Call,上下文從 user space 切換為 kernel space。
  2. CPU 將用戶緩沖區(qū)(User Buffer)中的數據拷貝到 kernel space 的網絡緩沖區(qū)(Socket Buffer)。
  3. CPU 利用 DMA 控制器將數據從網絡緩沖區(qū)(Socket Buffer)拷貝到 NIC 進行數據傳輸。
  4. 上下文從 kernel space 切換回 user space,write 系統(tǒng)調用執(zhí)行返回。

網絡 I/O

磁盤 I/O

高性能優(yōu)化的 I/O

  1. 零拷貝技術。
  2. 多路復用技術。
  3. 頁緩存(PageCache)技術。
其中,頁緩存(PageCache) 是操作系統(tǒng)對文件的緩存,用來減少對磁盤的 I/O 操作,以頁為單位的,內容就是磁盤上的物理塊,頁緩存能幫助程序對文件進行順序讀寫的速度幾乎接近于內存的讀寫速度,主要原因就是由于 OS 使用 PageCache 機制對讀寫訪問操作進行了性能優(yōu)化。


頁緩存讀取策略:當進程發(fā)起一個讀操作 (比如,進程發(fā)起一個 read() 系統(tǒng)調用),它首先會檢查需要的數據是否在頁緩存中:


  • 如果在,則放棄訪問磁盤,而直接從頁緩存中讀取。
  • 如果不在,則內核調度塊 I/O 操作從磁盤去讀取數據,并讀入緊隨其后的少數幾個頁面(不少于一個頁面,通常是三個頁面),然后將數據放入頁緩存中。
頁緩存寫策略:當進程發(fā)起 write 系統(tǒng)調用寫數據到文件中,先寫到頁緩存,然后方法返回。此時數據還沒有真正的保存到文件中去,Linux 僅僅將頁緩存中的這一頁數據標記為 “臟”,并且被加入到臟頁鏈表中。


然后,由 flusher 回寫線程周期性將臟頁鏈表中的頁寫到磁盤,讓磁盤中的數據和內存中保持一致,最后清理“臟”標識。在以下三種情況下,臟頁會被寫回磁盤:


  1. 空閑內存低于一個特定閾值。


  2. 臟頁在內存中駐留超過一個特定的閾值時。


  3. 當用戶進程調用 sync() 和 fsync() 系統(tǒng)調用時。


存儲設備的 I/O 棧

由圖可見,從系統(tǒng)調用的接口再往下,Linux 下的 IO 棧致大致有三個層次:


  1. 文件系統(tǒng)層,以 write 為例,內核拷貝了 write 參數指定的用戶態(tài)數據到文件系統(tǒng) Cache 中,并適時向下層同步。


  2. 塊層,管理塊設備的 IO 隊列,對 IO 請求進行合并、排序(還記得操作系統(tǒng)課程學習過的 IO 調度算法嗎?)。


  3. 設備層,通過 DMA 與內存直接交互,完成數據和具體設備之間的交互。


結合這個圖,想想 Linux 系統(tǒng)編程里用到的 Buffered IO、mmap、Direct IO,這些機制怎么和 Linux I/O 棧聯(lián)系起來呢?上面的圖有點復雜,我畫一幅簡圖,把這些機制所在的位置添加進去:


Linux IO系統(tǒng)


這下一目了然了吧?傳統(tǒng)的 Buffered IO 使用 read 讀取文件的過程什么樣的?假設要去讀一個冷文件(Cache 中不存在),open 打開文件內核后建立了一系列的數據結構,接下來調用 read,到達文件系統(tǒng)這一層,發(fā)現 Page Cache 中不存在該位置的磁盤映射,然后創(chuàng)建相應的 Page Cache 并和相關的扇區(qū)關聯(lián)。


然后請求繼續(xù)到達塊設備層,在 IO 隊列里排隊,接受一系列的調度后到達設備驅動層,此時一般使用 DMA 方式讀取相應的磁盤扇區(qū)到 Cache 中,然后 read 拷貝數據到用戶提供的用戶態(tài) buffer 中去(read 的參數指出的)。


整個過程有幾次拷貝? 從磁盤到 Page Cache 算第一次的話,從 Page Cache 到用戶態(tài) buffer 就是第二次了。而 mmap 做了什么?mmap 直接把 Page Cache 映射到了用戶態(tài)的地址空間里了,所以 mmap 的方式讀文件是沒有第二次拷貝過程的。


那 Direct IO 做了什么? 這個機制更狠,直接讓用戶態(tài)和塊 IO 層對接,直接放棄 Page Cache,從磁盤直接和用戶態(tài)拷貝數據。好處是什么?寫操作直接映射進程的buffer到磁盤扇區(qū),以 DMA 的方式傳輸數據,減少了原本需要到 Page Cache 層的一次拷貝,提升了寫的效率。


對于讀而言,第一次肯定也是快于傳統(tǒng)的方式的,但是之后的讀就不如傳統(tǒng)方式了(當然也可以在用戶態(tài)自己做 Cache,有些商用數據庫就是這么做的)。


除了傳統(tǒng)的 Buffered IO 可以比較自由的用偏移 長度的方式讀寫文件之外,mmap 和 Direct IO 均有數據按頁對齊的要求,Direct IO 還限制讀寫必須是底層存儲設備塊大小的整數倍(甚至 Linux 2.4 還要求是文件系統(tǒng)邏輯塊的整數倍)。


所以接口越來越底層,換來表面上的效率提升的背后,需要在應用程序這一層做更多的事情。所以想用好這些高級特性,除了深刻理解其背后的機制之外,也要在系統(tǒng)設計上下一番功夫。


I/O Buffering

如圖,當程序調用各類文件操作函數后,用戶數據(User Data)到達磁盤(Disk)的流程如圖所示。


圖中描述了 Linux 下文件操作函數的層級關系和內存緩存層的存在位置。中間的黑色實線是用戶態(tài)和內核態(tài)的分界線。


從上往下分析這張圖:


1. 首先是 C 語言 stdio 庫定義的相關文件操作函數,這些都是用戶態(tài)實現的跨平臺封裝函數。stdio 中實現的文件操作函數有自己的 stdio buffer,這是在用戶態(tài)實現的緩存。此處使用緩存的原因很簡單 — 系統(tǒng)調用總是昂貴的。如果用戶代碼以較小的 size 不斷的讀或寫文件的話,stdio 庫將多次的讀或者寫操作通過 buffer 進行聚合是可以提高程序運行效率的。


stdio 庫同時也支持 fflush 函數來主動的刷新 buffer,主動的調用底層的系統(tǒng)調用立即更新 buffer 里的數據。特別地,setbuf 函數可以對 stdio 庫的用戶態(tài) buffer 進行設置,甚至取消 buffer 的使用。


2. 系統(tǒng)調用的 read/write 和真實的磁盤讀寫之間也存在一層 buffer,這里用術語 Kernel buffer cache 來指代這一層緩存。在 Linux 下,文件的緩存習慣性的稱之為 Page Cache,而更低一級的設備的緩存稱之為 Buffer Cache。


這兩個概念很容易混淆,這里簡單的介紹下概念上的區(qū)別:Page Cache 用于緩存文件的內容,和文件系統(tǒng)比較相關。文件的內容需要映射到實際的物理磁盤,這種映射關系由文件系統(tǒng)來完成;Buffer Cache 用于緩存存儲設備塊(比如磁盤扇區(qū))的數據,而不關心是否有文件系統(tǒng)的存在(文件系統(tǒng)的元數據緩存在 Buffer Cache 中)。


作者:范桂颶 整理:極客重生


https://is-cloud.blog.csdn.net/article/details/105897963


- EOF -


本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

(全球TMT2022年7月11日訊)當前,服務器的液冷技術已成為推動數據中心減排、降低PUE的重要手段。浪潮信息作為全球領先的IT基礎設施提供商,已全棧布局液冷,實現了通用服務器、高密度服務器、整機柜服務器、AI服務器...

關鍵字: PCIE4.0 接口 全棧 I/O

(全球TMT2022年3月15日訊)工業(yè)自動化、信息化和數字化轉型企業(yè)羅克韋爾自動化發(fā)布全新Allen-Bradley FLEX 5000 模擬量安全 I/O 模塊,可以幫助過程操作員滿足故障安全要求,并在各類過程應用...

關鍵字: 模擬 自動化 I/O

現場可編程門陣列 (FPGA) 用于醫(yī)療設備、有線通信、航空航天和國防等應用。FPGA 通過提供可重新編程的電路來簡化設計過程;這種反復重新編程的能力可以實現快速原型設計,并且無需創(chuàng)建定制的專用集成電路 (ASIC)。即...

關鍵字: FPGA 電源 電流 I/O

主板,又叫主機板(mainboard)、系統(tǒng)板(systemboard)、或母板(motherboard),是計算機最基本的同時也是最重要的部件之一。主板一般為矩形電路板,上面安裝了組成計算機的主要電路系統(tǒng),一般有BIO...

關鍵字: 主板 BIOS I/O

隨著服務器系統(tǒng)的增長,包含控制電路以用來監(jiān)視服務器的輸入/輸出(I/O)卡數量和復雜程度也同比增長。零停機時間系統(tǒng)要求用戶將I/O卡插入帶電的背板。雖然許多IC供應商已經開發(fā)出能夠安全對電源和地線進行熱插拔(HotSwa...

關鍵字: 數據轉換 I/O SD LTC

Flip chip又稱倒裝片,是在I/O pad上沉積錫鉛球,然后將芯片翻轉加熱利用熔融的錫鉛球與陶瓷基板相結合此技術替換常規(guī)打線接合,逐漸成為未來的封裝主流,當前主要應用于高時脈的CPU、GPU(Graphic Pro...

關鍵字: 倒裝芯片 I/O GPU

(全球TMT2021年12月2日訊)當今片上系統(tǒng)(SoC)市場Total IP™解決方案提供商Arasan Chip Systems宣布可現貨供應符合MIPI I3C?規(guī)范v1.1的Arasan MIPI...

關鍵字: I/O

隨著服務器系統(tǒng)的增長,包含控制電路以用來監(jiān)視服務器的輸入/輸出(I/O)卡數量和復雜程度也同比增長。零停機時間系統(tǒng)要求用戶將I/O卡插入帶電的背板。雖然許多IC供應商已經開發(fā)出能夠安全對電源和地線進行熱插拔(HotSwa...

關鍵字: 數據轉換 I/O

大家好,我是小林。我在之前的圖解系統(tǒng)寫過LinuxI/O的文章,但是沒有集中在一起講。今天就跟大家分享一篇,LinuxI/O系統(tǒng)。目錄傳統(tǒng)的SystemCallI/O??讀操作??寫操作??網絡I/O??磁盤I/O高性能...

關鍵字: I/O

CPP開發(fā)者

237 篇文章

關注

發(fā)布文章

編輯精選

技術子站

關閉