www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 芯聞號(hào) > 充電吧
[導(dǎo)讀]TensorFlow Lite(TFLite)現(xiàn)在支持在 Android 設(shè)備上使用 OpenCL 進(jìn)行 GPU 推理,這一改進(jìn)使得 TFLite 性能比使用現(xiàn)有 OpenGL 后端提高了約 2 倍。

TensorFlow Lite(TFLite)現(xiàn)在支持在 Android 設(shè)備上使用 OpenCL 進(jìn)行 GPU 推理,這一改進(jìn)使得 TFLite 性能比使用現(xiàn)有 OpenGL 后端提高了約 2 倍。


TensorFlow Lite 團(tuán)隊(duì)介紹了目前其使用 OpenCL 在移動(dòng) GPU 推理上所取得的進(jìn)展,并宣布正式推出基于 OpenCL 的 Android 移動(dòng) GPU 推理引擎,該引擎在大小合理的神經(jīng)網(wǎng)絡(luò)上可比現(xiàn)有的 OpenGL 后端提供高達(dá) 2 倍的性能提升。

OpenGL ES 3.1 中添加了計(jì)算著色器,但其向后兼容的 API 設(shè)計(jì)決策限制了發(fā)揮 GPU 的全部潛能。另一方面,OpenCL 從一開(kāi)始就是為使用各種加速器進(jìn)行計(jì)算而設(shè)計(jì)的,因此與移動(dòng) GPU 推理領(lǐng)域更加相關(guān)。因此,TFLite 團(tuán)隊(duì)研究了基于 OpenCL 的推理引擎,引入了一些功能,使得能夠優(yōu)化移動(dòng) GPU 推理引擎。

相比之下,新的移動(dòng) GPU 推理引擎有以下要點(diǎn):

性能分析:與 OpenGL 相比,優(yōu)化 OpenCL 后端要容易得多,因?yàn)?OpenCL 提供了良好的分析功能與高通 Adreno 很好的支持。使用這些概要分析 API,能夠非常精確地測(cè)量每個(gè)內(nèi)核調(diào)度的性能。

優(yōu)化工作組大小:高通 Adreno GPU 上的 TFLite GPU 性能對(duì)工作組大小非常敏感,選擇正確的工作組大小可以提高性能,反之亦然。借助上述 OpenCL 中的性能分析功能,能夠?qū)崿F(xiàn)針對(duì)工作組大小的優(yōu)化器,這使平均速度提高了 50%。

原生 16 位精度浮點(diǎn)(FP16):OpenCL 原生支持 FP16,并要求加速器指定數(shù)據(jù)類型的可用性。作為正式規(guī)范的一部分,即使是某些較舊的 GPU,例如 2012 年推出的 Adreno 305,也可以發(fā)揮其全部功能。

恒定內(nèi)存(constant memory):OpenCL 具有恒定內(nèi)存的概念。高通增加了一個(gè)物理內(nèi)存能力,使其非常適合與 OpenCL 的恒定內(nèi)存一起使用。對(duì)于某些特殊情況,例如在神經(jīng)網(wǎng)絡(luò)開(kāi)始或末尾非常薄的層,這被證明是非常有效的。Adreno 上的 OpenCL 通過(guò)與該物理恒定內(nèi)存和上述原生 FP16 支持的協(xié)同作用,能夠大大超越 OpenGL 的性能。

TFLite 具體展示了在 CPU(大內(nèi)核上的單線程)使用現(xiàn)有 OpenGL 后端的 GPU 以及使用新的 OpenCL 后端的 GPU 上的性能對(duì)比。

上圖分別說(shuō)明了在兩個(gè)著名的神經(jīng)網(wǎng)絡(luò) MNASNet 1.3 和 SSD MobileNet v3(大型)上使用 OpenCL 的特定 Android 設(shè)備上推理引擎的性能??梢钥吹?,新的 OpenCL 后端的速度大約是 OpenGL 后端的兩倍,并且 OpenCL 在較大的網(wǎng)絡(luò)上的性能甚至更好。

此外,因?yàn)?OpenCL 本身不屬于 Android 的一部分,某些用戶可能無(wú)法使用。為了簡(jiǎn)化開(kāi)發(fā),TFLite GPU 委托添加了一些修改,首先在運(yùn)行時(shí)檢查 OpenCL 的可用性,如果可用,將使用新的 OpenCL 后端,否則將退回到現(xiàn)有的 OpenGL 后端。實(shí)際上,OpenCL 后端自 2019 年中期以來(lái)一直存在于 TensorFlow 存儲(chǔ)庫(kù)中,并且通過(guò) TFLite GPU delegate v2 無(wú)縫集成。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉