www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 公眾號精選 > 架構(gòu)師社區(qū)
[導讀]分享一個很多人容易踩的一個坑:HeapByteBuffer的使用問題。我們都知道NIO分裝了ByteBuffer接口,使得filechannel的文件IOAPI變得非常的簡單。ByteBuffer主要有兩個實現(xiàn)類HeapByteBuffer堆內(nèi)內(nèi)存DirectByteBuffer...

分享一個很多人容易踩的一個坑:HeapByteBuffer 的使用問題。我們都知道 NIO 分裝了 ByteBuffer 接口,使得 filechannel 的文件 IO API 變得非常的簡單。ByteBuffer 主要有兩個實現(xiàn)類

  • HeapByteBuffer 堆內(nèi)內(nèi)存
  • DirectByteBuffer 堆外內(nèi)存
按我的個人經(jīng)驗,大多數(shù)情況,無論是讀操作還是寫操作,我都傾向于使用 DirectByteBuffer,主要是因為 HeapByteBuffer 在和 FileChannel 交互時,可能會有一些出乎大家意料的內(nèi)部操作,也就是這篇文章的標題中提到的注意事項,這里先賣個關(guān)子。

先來看看這次比賽為什么要用到 HeapByteBuffer 呢?

原因一:賽題需要設計分級存儲,并且提供了 6G 堆內(nèi)內(nèi)存 2G 堆外內(nèi)存,一個最直接的思路便是使用內(nèi)存來存儲熱點數(shù)據(jù),而內(nèi)存存儲數(shù)據(jù)最方便的數(shù)據(jù)結(jié)構(gòu)便是 ByteBuffer 了。

原因二:由于堆內(nèi) 6G 遠大于堆外 2G,且 JVM 參數(shù)不能調(diào)整,所以要想利用好堆內(nèi)富余的內(nèi)存去做緩存,非 HeapByteBuffer 莫屬了。

可能有一些讀者并沒有關(guān)注賽題,我這里簡化一下前言,可以直接理解為:有一塊 2G 的 HeapByteBuffer 用于文件 IO,我們該如何利用。

HeapByteBuffer 的復制問題

廢話不多說,直接來看 HeapByteBuffer 的坑在哪兒。

使用代碼描述 HeapByteBuffer 的文件 IO 操作,大概率會寫出如下的代碼:

public?void?readInOneThread()?throws?Exception?{
????int?bufferSize?=?50?*?1024?*?1024;
????File?file?=?new?File("/essd");
????FileChannel?fileChannel?=?new?RandomAccessFile(file,?"rw").getChannel();
????ByteBuffer?byteBuffer?=?ByteBuffer.allocate(bufferSize);
????fileChannel.read(byteBuffer);
}
上述的代碼,將文件中的數(shù)據(jù)緩存到了內(nèi)存中,無論是賽題還是生產(chǎn)場景,這個行為通常都是多線程的,例如在云原生編程挑戰(zhàn)賽的評測下,有 40 個線程進行讀寫,如果按照線程維度進行緩存,每個線程分到 50M 用于內(nèi)存緩存自然是沒有問題。

而如果你直接使用上述代碼,在評測中可能會直接得到內(nèi)存溢出相關(guān)的異常。其實我在之前堆外內(nèi)存泄漏的文章中也提到過這個問題,不過角度有所不同。原因很簡單,直接來看源碼。

FileChannel 使用的是 IOUtil 進行讀寫操作

static?int?read(FileDescriptor?var0,?ByteBuffer?var1,?long?var2,?NativeDispatcher?var4)?throws?IOException?{
????if?(var1.isReadOnly())?{
????????throw?new?IllegalArgumentException("Read-only?buffer");
????}?else?if?(var1?instanceof?DirectBuffer)?{
????????return?readIntoNativeBuffer(var0,?var1,?var2,?var4);
????}?else?{
????????ByteBuffer?var5?=?Util.getTemporaryDirectBuffer(var1.remaining());
????????int?var7;
????????try?{
????????????int?var6?=?readIntoNativeBuffer(var0,?var5,?var2,?var4);
????????????var5.flip();
????????????if?(var6?>?0)?{
????????????????var1.put(var5);
????????????}
????????????var7?=?var6;
????????}?finally?{
????????????Util.offerFirstTemporaryDirectBuffer(var5);
????????}
????????return?var7;
????}
}
可以發(fā)現(xiàn)當使用 HeapByteBuffer 時,會走到下面這個分支

Util.getTemporaryDirectBuffer(var1.remaining());
這個 Util 封裝了更為底層的一些 IO 邏輯

package?sun.nio.ch;
public?class?Util?{
????private?static?ThreadLocal?bufferCache;
????
????public?static?ByteBuffer?getTemporaryDirectBuffer(int?var0)?{
????????if?(isBufferTooLarge(var0))?{
????????????return?ByteBuffer.allocateDirect(var0);
????????}?else?{
????????????//?FOUCS?ON?THIS?LINE
????????????Util.BufferCache?var1?=?(Util.BufferCache)bufferCache.get();
????????????ByteBuffer?var2?=?var1.get(var0);
????????????if?(var2?!=?null)?{
????????????????return?var2;
????????????}?else?{
????????????????if?(!var1.isEmpty())?{
????????????????????var2?=?var1.removeFirst();
????????????????????free(var2);
????????????????}

????????????????return?ByteBuffer.allocateDirect(var0);
????????????}
????????}
????}
}
isBufferTooLarge 這個方法會根據(jù)傳入 Buffer 的大小決定如何分配堆外內(nèi)存,如果過大,直接分配大緩沖區(qū);如果不是太大,會使用 bufferCache 這個 ThreadLocal 變量來進行緩存,從而復用(實際上這個數(shù)值非常大,幾乎不會走進直接分配堆外內(nèi)存這個分支)。這么看來似乎發(fā)現(xiàn)了兩個不得了的結(jié)論:

  1. 使用 HeapByteBuffer 讀寫都會經(jīng)過 DirectByteBuffer,寫入數(shù)據(jù)的流轉(zhuǎn)方式其實是:HeapByteBuffer -> DirectByteBuffer -> PageCache -> Disk,讀取數(shù)據(jù)的流轉(zhuǎn)方式正好相反。
  2. 使用 HeapByteBuffer 讀寫會申請一塊跟線程綁定的 DirectByteBuffer。這意味著,線程越多,臨時 DirectByteBuffer 就越會占用越多的空間。
根據(jù)這兩個結(jié)論,我們再回到賽題中,如果直接按照上述的方式進行讀寫,40 個線程每個都持有一個 50M 的堆內(nèi)內(nèi)存,同時又因為 IOUtil ?的內(nèi)部行為,額外分配了 40*50M 的堆外內(nèi)存, 堆外內(nèi)存在不經(jīng)意間就被用光了!出現(xiàn)堆外內(nèi)存溢出的異常也就不奇怪了。

為什么 HeapByteBuffer 在 IO 時需要復制到 DirectByteBuffer

這個我之前也介紹過,詳情可以參考我的一篇舊文:《一文探討堆外內(nèi)存的監(jiān)控與回收》??偨Y(jié)如下:

  • 為了方便 GC 的實現(xiàn),DirectByteBuffer 指向的 native memory 是不受 GC 管轄的
  • HeapByteBuffer 背后使用的是 byte 數(shù)組,其占用的內(nèi)存不一定是連續(xù)的,不太方便 JNI 方法的調(diào)用
  • 數(shù)組實現(xiàn)在不同 JVM 中可能會不同

解決方案

其實我們本質(zhì)上是為了給每個線程維護一塊 HeapByteBuffer,用于緩存數(shù)據(jù),并沒有必要以 ByteBuffer 的大小為維度來進行 IO??梢越梃b IOUtil 中復制 DirectByteBuffer 的思路來優(yōu)化這一過程。代碼示例如下:

public?void?directBufferCopy()?throws?Exception?{
????File?file?=?new?File("/essd");
????FileChannel?fileChannel?=?new?RandomAccessFile(file,?"rw").getChannel();
????ByteBuffer?byteBuffer?=?ByteBuffer.allocate(50?*?1024?*?1024);
????ByteBuffer?directByteBuffer?=?ByteBuffer.allocateDirect(4?*?1024);
????for?(int?i?=?0;?i?12800;?i )?{
????????directByteBuffer.clear();
????????fileChannel.read(directByteBuffer,?i?*?4?*?1024);
????????directByteBuffer.flip();
????????byteBuffer.put(directByteBuffer);
????}
}
在 Java 中,從磁盤到堆內(nèi)內(nèi)存,一定無法省略堆外內(nèi)存的復制,但我們可以自己復制,從而使得這個過程更加直觀地被我們自己操控,而不是被 FileChannel 的內(nèi)部邏輯左右。

這里也需要注意

  • 單次 IO 使用的 DirectByteBuffer 不宜過大,僅僅作為一個運輸載體,起到一個運輸數(shù)據(jù)的作用。這樣在多線程場景下,才不至于占用過多的堆外內(nèi)存
  • 單次 IO 使用的 DirectByteBuffer 不宜過小,否則會出現(xiàn)讀寫放大的問題,一般建議設置 4kb 的整數(shù)倍,具體以實際測試結(jié)果為準。

其他注意事項

HeapByteBuffer 讀寫時的復制問題是本文的主角,但使用 HeapByteBuffer 作為緩存時,也需要注意一些其他問題。例如比賽場景中,你可能希望開辟一大塊 HeapByteBuffer,6G 堆內(nèi)內(nèi)存,分配個 4G 用作緩存總可以吧?可不可以我說了不算,你感興趣的話倒是可以測試一下是否可行,還需要考慮 GC 情況,需要綜合考慮老年代和新生代的配比,如果你分配了過多堆內(nèi)內(nèi)存給 HeapByteBuffer 緩存,可能會直接導致 OutOfMemory 或者觸發(fā) GC。

同時,如果 HeapByteBuffer 占用了過多內(nèi)存,留給操作系統(tǒng)的 PageCache 也會非常有限,這兩者使用的可是同一塊內(nèi)存!如果你的程序利用到了 PageCache 的特性,可能會由于 PageCache 空間不夠,導致 IO 速度變慢。

總結(jié)

本文介紹了在文件 IO 中使用 HeapByteBuffer 的注意事項,需要考慮到 FileChannel 內(nèi)部的復制問題,意識到這一過程會有堆外內(nèi)存的復制開銷。在實際使用場景中,個人更加推薦直接使用 DirectByteBuffer 進行 IO 操作。如果出于某些原因,一定需要使用 HeapByteBuffer 存儲作為緩存,可以參考文中分批使用 DirectByteBuffer 進行 IO 并復制的方案。


本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉