www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 廠商動態(tài) > Arm
[導讀]深入探索這一個由 ML 驅(qū)動的時域超級采樣的實用方法

本文將從訓練、網(wǎng)絡(luò)架構(gòu)到后處理和推理等方面,深入探討 Arm 神經(jīng)超級采樣 (Arm Neural Super Sampling, Arm NSS) 的工作原理,希望為機器學習 (ML) 工程師和移動端圖形開發(fā)者來詳細解釋 Arm NSS 的運行機制,及其如何在移動端硬件上進行部署。

用神經(jīng)超級采樣取代啟發(fā)式方法的原因

時域超級采樣 (TSS),也稱為時域抗鋸齒 (TAA),已經(jīng)成為過去十年中抗鋸齒技術(shù)的行業(yè)標準解決方案。它具備諸多優(yōu)勢,包括能夠解決各類鋸齒問題,對于延遲渲染的計算效率高,并且可擴展至圖像的優(yōu)化升級。然而,該解決方案也面臨一些挑戰(zhàn)。例如,TSS 中目前常用的人工設(shè)計的啟發(fā)式方法難以擴展,并且需要在不同內(nèi)容中不斷調(diào)整,像鬼影、去遮擋偽影和時域不穩(wěn)定性等問題依然存在,并且在與圖像優(yōu)化升級技術(shù)結(jié)合時變得更加棘手。

Arm NSS 通過一套從數(shù)據(jù)中學習且經(jīng)過訓練的神經(jīng)模型,而非靜態(tài)規(guī)則來克服這些限制。它可以跨條件和內(nèi)容類型進行泛化,更有效地適應(yīng)運動動力和識別鋸齒模式。這些能力使其能夠更可靠地處理那些對 AMD 超級分辨率銳畫技術(shù) 2 (FSR2) 和 Arm 精銳超級分辨率技術(shù) (Arm Accuracy Super Resolution, Arm ASR) 等方法頗具挑戰(zhàn)的邊緣側(cè)用例。

訓練 Arm NSS 網(wǎng)絡(luò):帶反饋的遞歸學習

Arm NSS 使用以每像素一個樣本渲染的 540p 幀序列進行訓練。每幀與以每像素 16 個樣本渲染的 1080p 真實標簽 (Ground Truth) 圖像配對。序列大約包含 100 幀,以幫助模型理解圖像內(nèi)容如何隨時間變化。

解決方案的輸入包括渲染圖像的顏色、運動向量和深度,以及引擎元數(shù)據(jù),如抖動向量和攝像頭矩陣。該模型采用遞歸式訓練,在每次執(zhí)行反向傳播之前,會先對多幀序列進行前向傳播。這使得網(wǎng)絡(luò)能夠隨時間傳播梯度,并學習如何累積信息。

該網(wǎng)絡(luò)采用時空損失函數(shù)進行訓練,能對空域保真度和時域一致性方面的誤差進行懲罰??沼虮U娑扔糜诖_保單幀圖像清晰、細節(jié)豐富且視覺準確,有助于保留邊緣、紋理和精細結(jié)構(gòu);而時域穩(wěn)定性則抑制了連續(xù)幀之間可能出現(xiàn)的閃爍、抖動或其他形式的時域噪聲。

?此項訓練是在 PyTorch 中采用成熟的技術(shù)實踐進行,其中包括 Adam 優(yōu)化器、余弦退火學習率調(diào)度,以及標準數(shù)據(jù)增強策略。預處理和后處理流程使用 Slang 語言編寫,以確保靈活性和性能,而量化感知訓練則采用 ExecuTorch 完成。

網(wǎng)絡(luò)架構(gòu)和輸出設(shè)計

Arm NSS 網(wǎng)絡(luò)采用具有跳躍連接的四層級 UNet 主干架構(gòu),以保持空間結(jié)構(gòu)。它通過三個編碼器和解碼器模塊對輸入數(shù)據(jù)進行下采樣和上采樣處理。

Arm 評估了多種方法:

· 圖像預測?:易于實現(xiàn),但在量化條件下表現(xiàn)不佳,并會產(chǎn)生視覺偽影。

· 內(nèi)核預測:泛化能力良好且能有效量化,但由于需要許多大型內(nèi)核映射,導致帶寬開銷較高。

· ?參數(shù)預測(所選方法)?:為每個像素輸出少量參數(shù)。這些參數(shù)驅(qū)動后處理步驟(如濾波和樣本累積)。該方法對量化友好且?guī)捫矢摺?

該網(wǎng)絡(luò)生成三種逐像素輸出:

· 4 x 4 濾波器內(nèi)核;

· 用于累積和校正的時域系數(shù)?;

· 隱藏狀態(tài)張量?作為時域反饋傳遞至下一幀。

該網(wǎng)絡(luò)輸出服務(wù)于兩條路徑:

· 濾波器內(nèi)核與時域系數(shù)?被后處理階段用于計算經(jīng)優(yōu)化升級的最終圖像;

· 隱藏狀態(tài)被前向傳遞至下一幀推理。與 Arm ASR 此類技術(shù)依賴手動調(diào)優(yōu)的啟發(fā)式方法不同,Arm NSS 等 ML 方法具有三重優(yōu)勢:

1. Arm NSS 能估計動態(tài)內(nèi)核濾波器和參數(shù),以逐像素粒度解決鋸齒問題;

2. Arm NSS 通過利用采集多幀歷史狀態(tài)的時域反饋,實現(xiàn)更出色的時域穩(wěn)定性;

3. Arm NSS 可針對新游戲內(nèi)容進行調(diào)優(yōu),使開發(fā)者能進一步針對其特定游戲優(yōu)化圖像質(zhì)量。

通過時域反饋提升幀間一致性

Arm NSS 引入了兩種關(guān)鍵反饋機制來解決時域不穩(wěn)定性問題:

· 將先前幀的隱藏特征前向傳遞,使網(wǎng)絡(luò)能夠?qū)W習變化與持續(xù)的部分;

· 通過計算亮度導數(shù)來檢測閃爍的細微特征,從而突顯指示不穩(wěn)定的時域差異。

這些輸入幫助模型在不依賴人工設(shè)計規(guī)則的情況下保持時域穩(wěn)定性。

預處理階段:輸入準備

在推理開始之前,基于 GPU 的預處理階段會準備 Arm NSS 所需的輸入數(shù)據(jù),其中包括收集每個像素的屬性(如顏色、運動向量和深度)。此外,該階段還會計算亮度導數(shù),這是一個用于標記細微特征閃爍的時域信號,以及去遮擋掩碼,以突出顯示陳舊的歷史記錄,并重投影歷史隱藏特征。

這些數(shù)據(jù)將被整合為用于神經(jīng)網(wǎng)絡(luò)的單一輸入張量。該階段作為計算著色器運行,在推理調(diào)用前執(zhí)行,即在使用面向 Vulkan 的 ML 擴展的 GPU 上運行。

后處理:從原始輸出到最終幀

在推理完成后,作為計算著色器運行的后處理階段將構(gòu)建最終輸出顏色。所有步驟均集成至渲染圖中,并專為移動端高效運行設(shè)計,具體包括以下步驟:

· 運動向量擴張,減少重投影歷史時的鋸齒問題;

· ?歷史重投影?,采用 Catmull-Rom 濾波器降低重投影的模糊度;

· 濾波,應(yīng)用 4 x 4 內(nèi)核對當前顏色輸入執(zhí)行抗鋸齒處理;

· 稀疏優(yōu)化升級,將抖動的低分辨率樣本映射到高分辨率網(wǎng)格上,缺失像素都以零值填充,然后用 4 x 4 內(nèi)核稀疏濾波,執(zhí)行插值和抗鋸齒處理,類似于去馬賽克;

· 校正,使用預測的 theta 參數(shù)剔除陳舊歷史數(shù)據(jù);

· 樣本累積?,通過預測的 alpha 參數(shù)將新數(shù)據(jù)與歷史緩沖混合,在色調(diào)映射域執(zhí)行以避免“螢火蟲”偽影。

驗證質(zhì)量

Arm 使用了峰值信噪比 (Peak Signal-to-Noise Ratio, PSNR)、結(jié)構(gòu)相似性指數(shù) (Structural Similarity Index, SSIM) 和渲染聚焦感知誤差指標 FLIP 等指標來評估 Arm NSS。雖然這些指標未必總是匹配人類感知,但它們有助于發(fā)現(xiàn)問題案例,并通過跟蹤各種指標增強信心。

通過持續(xù)集成 (CI) 工作流回放測試序列并記錄 Arm NSS、Arm ASR 和其他基準的性能。有關(guān)視覺比較和感知評估的詳細內(nèi)容,請參閱技術(shù)白皮書。

在 540p 到 1080p 的比較中,Arm NSS 提升了穩(wěn)定性和細節(jié)保留性能,并且在快速運動、部分遮擋物體和細微幾何體場景中表現(xiàn)出色。與 Arm ASR 或 AMD FSR2 等非神經(jīng)方法不同,Arm NSS 無需反應(yīng)掩碼,即可處理粒子效果。

Arm NSS 能否實時運行?

雖然搭載神經(jīng)加速器的芯片尚未發(fā)布,但我們可以通過一些最低性能假設(shè)和執(zhí)行網(wǎng)絡(luò)推理所需的乘積累加運算 (MAC) 數(shù)量來估計 Arm NSS 是否足夠快。該分析適用于任何在吞吐量、功率和利用率方面滿足這些相同假設(shè)的加速器。我們假定在可持續(xù)的 GPU 時鐘頻率下,目標每瓦 10 TOP/s 的神經(jīng)加速是可實現(xiàn)的。

在持續(xù)的性能條件下,我們對每幀的優(yōu)化升級處理設(shè)定了?不超過四毫秒?的目標。在低時鐘頻率 GPU 上,推理前后運行的著色器階段共耗時約 ?1.4 毫秒??;诖祟A算,Arm NSS 需控制在約 ?27 GOPs ?以下。而參數(shù)預測的網(wǎng)絡(luò)使用約為 ?10 GOPs?,即使神經(jīng)網(wǎng)絡(luò)加速器的效率僅為 40%,這在該范圍內(nèi)仍綽綽有余。

早期模擬數(shù)據(jù)顯示,Arm NSS 在 1.5 倍優(yōu)化升級(平衡模式)下的運行時間約為 Arm ASR的 75%,而在兩倍優(yōu)化升級(平衡模式)下則預計性能會優(yōu)于 Arm ASR。這一效率提升得益于用簡化的推理過程取代了復雜的啟發(fā)式方法。

即刻利用 Arm NSS 進行構(gòu)建

Arm NSS 引入了一種由 ML 驅(qū)動的時域超級采樣的實用方法。它用經(jīng)過學習的濾波器和穩(wěn)定性提示取代了人工調(diào)優(yōu)的啟發(fā)式方法,并能夠在移動端硬件的實時性限制內(nèi)運行。

其訓練方法、緊湊架構(gòu)和利用面向 Vulkan 的 ML 擴展使其兼具高性能和適應(yīng)性。對于構(gòu)建神經(jīng)渲染解決方案的 ML 工程師來說,Arm NSS 是一個可部署、結(jié)構(gòu)良好,且運行于圖形管線內(nèi)的推理示例。

想要探索 Arm 神經(jīng)圖形開發(fā)套件,查看示例代碼,并探索網(wǎng)絡(luò)結(jié)構(gòu),請訪問 Arm 開發(fā)者中心的 Arm NSS 頁面。歡迎開發(fā)者使用開發(fā)套件或為自己的內(nèi)容重新訓練 NSS,并提供反饋,你的見解將有助于塑造移動設(shè)備上神經(jīng)渲染的未來。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉