Arm SME2 技術(shù)加速安卓 AI 升級,驅(qū)動移動應(yīng)用下一代功能革新
從按下快門前就對照片進行即時銳化,到通話過程中實時消除背景噪音,再到離線狀態(tài)下與人工智能 (AI) 助手互動,端側(cè) AI 正在重塑移動體驗。而 Arm 計算平臺正是實現(xiàn)這些無縫交互體驗的強勁驅(qū)動力。
隨著 AI 工作負載變得日益復雜且廣泛滲透至各個領(lǐng)域,移動開發(fā)者面臨的需求也與日俱增:他們需要在內(nèi)存、電力和熱預算等嚴格且多樣化的限制下,實現(xiàn)實時且高效的性能表現(xiàn),同時確保不會給應(yīng)用及其工作負載增加額外的復雜性。
為了應(yīng)對這些挑戰(zhàn),Arm 推出了可伸縮矩陣擴展2 (SME2) 技術(shù),以直接在移動 CPU 上加速高強度的矩陣計算工作負載——這些工作負載對計算機視覺和生成式 AI 應(yīng)用至關(guān)重要。SME2 是Armv9 架構(gòu)中的一組高級 CPU 指令,它基于 SME 升級、能夠在 AI 異構(gòu)計算框架下,高效支持圖像處理、自然語言處理、語音生成等實時移動端推理任務(wù)。
開發(fā)者如何獲取 SME2 的優(yōu)勢
移動開發(fā)者無需改動現(xiàn)有代碼、模型或應(yīng)用程序,即可直接獲取 SME2 帶來的性能提升。這得益于 Arm 的軟件加速層——Arm KleidiAI,它能夠無縫集成到主流運行時庫和 AI 框架中,為開發(fā)者提供開箱即用的性能體驗。
得益于 KleidiAI 深入且廣泛的集成,SME2 已在 Google 專為安卓系統(tǒng)優(yōu)化的神經(jīng)網(wǎng)絡(luò)推理庫 XNNPACK 中實現(xiàn)支持。此外,SME2 也被集成至多個框架中,包括阿里巴巴 MNN、Google LiteRT 和 MediaPipe、微軟 ONNX Runtime,以及 llama.cpp。這些集成意味著 SME2 已深度嵌入到軟件棧中。當設(shè)備支持并啟用 SME2 時,XNNPACK 會自動通過 KleidiAI 將矩陣計算密集型任務(wù)路由至 SME2,從而讓開發(fā)者在無需改動任何應(yīng)用邏輯或基礎(chǔ)架構(gòu)的情況下,直接實現(xiàn)性能提升。
與此同時,KleidiAI 不僅著眼于當下的性能加速,更是為滿足未來需求而設(shè)計。隨著 Arm 不斷推出新特性與架構(gòu)升級,KleidiAI 將持續(xù)為所支持的 AI 框架和運行時庫帶來自動的性能提升,而無需開發(fā)者投入額外精力。
大規(guī)模 AI 性能與能效優(yōu)化
搭載 SME2 增強硬件的安卓新機即將上市,開發(fā)者可率先通過硬件加速解鎖 AI 性能躍升。與此同時,SME2 已支持最新的 iOS 設(shè)備(完整支持機型列表詳見此處),只要應(yīng)用中使用了集成 SME2 的 AI 框架,便可自動享受這些性能提升。
在搭載 SME2 增強硬件的設(shè)備上運行 Google Gemma 3 模型時, 其聊天交互中的 AI 響應(yīng)速度比未啟用 SME2 的同款設(shè)備快六倍。此外,僅用單個 CPU 核心,Gemma 3 便可在不到一秒的時間內(nèi)啟動多達 800 字的文本摘要任務(wù)。目前,一家領(lǐng)先的獨立軟件供應(yīng)商 (ISV) 已承諾將其應(yīng)用中的大部分詞元 (token) 生成工作負載從云端遷移到移動端,這在一定程度上得益于端側(cè) AI 能力的持續(xù)突破。
Google 安卓杰出軟件工程師 Iliyan Malchev 表示:“借助 SME2 增強的硬件,更先進的 AI 模型(如 Gemma 3)能夠直接在各類設(shè)備上運行。隨著 SME2 的持續(xù)擴展,移動開發(fā)者能夠在不同生態(tài)系統(tǒng)中無縫部署下一代 AI 功能,從而為終端用戶帶來低延遲、廣泛可用的智能手機體驗。”
除了性能的提升,SME2 還為 Arm 生態(tài)系統(tǒng)(如 iOS 與安卓)提供了可移植的解決方案。目前,已有 900 萬款應(yīng)用在 Arm 計算平臺上運行,超過 2,200 萬名軟件開發(fā)者基于 Arm 平臺構(gòu)建他們的應(yīng)用和工作負載。
助力開發(fā)者構(gòu)建 AI 的未來
對安卓開發(fā)者而言,他們只要將應(yīng)用構(gòu)建在集成了 KleidiAI 的 AI 框架和運行時庫之上,就能自動獲得 SME2 帶來的性能提升,并可在各類設(shè)備上無縫部署下一代 AI 功能。
開發(fā)者若提前布局,即可確保其應(yīng)用在 SME2 增強硬件推向市場時實現(xiàn)優(yōu)化,無需改動任何一行代碼,便可為用戶帶來更快的性能、更低的延遲以及更高的能效。
此外,Arm 還發(fā)布了開發(fā)者啟動平臺,幫助移動開發(fā)者充分利用 SME2 的技術(shù)優(yōu)勢,通過豐富案例展示如何針對 KleidiAI 增強框架進行開發(fā),從而默認激活硬件層面的最新加速能力。
有關(guān)如何規(guī)劃 SME2 的更多信息,請參閱 Arm 社區(qū)博客。