Arm 全新 Lumex CSS 平臺實現(xiàn)兩位數(shù)性能提升,驅動消費電子設備“更智能、更高效、更個性化”
新聞重點:
· Arm Lumex CSS 平臺支持實時端側 AI 用例,覆蓋智能助手、語音翻譯及個性化服務;依托搭載全新 SME2 技術的 Arm CPU,該平臺可實現(xiàn)高達五倍的 AI 性能提升。
· 開發(fā)者可借助 KleidiAI 調用 SME2 技術帶來的性能優(yōu)勢;目前 KleidiAI 已集成至所有主流移動操作系統(tǒng)及 AI 框架中,包括 PyTorch ExecuTorch、谷歌 LiteRT、阿里巴巴 MNN 及微軟 ONNX Runtime。
· 針對旗艦級設備,Arm Lumex CSS 平臺創(chuàng)造了前所未有的成就——連續(xù)六年締造兩位數(shù)的每時鐘周期指令數(shù) (IPC) 性能提升。
· 全新 Mali G1-Ultra 專為游戲玩家設計,可帶來兩倍的光線追蹤性能提升,重新定義移動娛樂體驗。
Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱 Arm)今日宣布推出全新 Arm® Lumex? 計算子系統(tǒng) (Compute Subsystem, CSS) 平臺,這是一套專為旗艦級智能手機及下一代個人電腦加速其人工智能 (AI) 體驗的先進計算平臺。Lumex CSS 平臺集成了搭載第二代可伸縮矩陣擴展 (SME2) 技術的最高性能 Arm CPU、GPU 及系統(tǒng) IP,不僅能助力生態(tài)伙伴更快將 AI 設備推向市場,還可支持桌面級移動游戲、實時翻譯、智能助手及個性化應用等多樣的豐富體驗。
Arm 高級副總裁兼終端事業(yè)部總經(jīng)理 Chris Bergey 表示:“AI 已不再僅僅是一項技術功能,它已成為下一代移動與消費技術的支撐底座。依托 Arm Lumex 平臺,我們持續(xù)提升端側 AI 體驗,以滿足用戶日益增長的需求與期待。為此,我們正積極將 SME2 技術擴展至每一個 CPU 平臺。預計到 2030 年,SME 與 SME2 技術將為超過 30 億臺設備新增超 100 億TOPS 的計算能力,為端側 AI 性能帶來指數(shù)級躍升?!?
合作伙伴可靈活選擇使用 Arm Lumex 的方式,為其打造系統(tǒng)級芯片 (SoCs)。例如,他們可直接采用 Arm 交付的平臺,并借助為其需求定制的先進物理實現(xiàn)方案,從而獲得縮短產品上市時間和快速兌現(xiàn)性能價值等雙重優(yōu)勢;或者,合作伙伴也可根據(jù)他們的目標市場,對平臺寄存器傳輸級 (RTL) 設計進行配置,并自行完成核心模塊的硬化工作。
全新 Arm Lumex 平臺包含以下核心組件:
· 新一代搭載 SME2 技術的 Armv9.3 CPU 集群:包括 Arm C1-Ultra 和 Arm C1-Pro,為旗艦設備提供支持
· Arm C1-Premium:專為次旗艦市場打造,可提供一流的面積效率
· Arm Mali? G1-Ultra GPU:配備新一代光線追蹤技術,在實現(xiàn)先進的圖形和游戲體驗同時,還可提升整體 AI 性能
· Arm C1-DSU:Arm 迄今為止最靈活、高能效且具多種電源模式的 DynamIQ Shared Unit (DSU)
· 針對三納米工藝節(jié)點優(yōu)化的物理實現(xiàn)
· 跨軟件棧的深度集成,為使用 KleidiAI 軟件庫的開發(fā)者提供無縫的 AI 加速體驗
搭載 SME2 技術的 CPU:助力實現(xiàn)全場景 AI 加速
搭載 SME2 的 Arm C1 CPU 集群,為實際場景中的 AI 驅動型任務帶來了顯著的 AI 性能提升,包括:
· AI 性能提升高達五倍
· 語音類工作負載延遲降低 4.7 倍
· 音頻生成速度提升 2.8 倍
全新的 Arm CPU 在 AI 計算能力上的飛躍,讓實時的端側 AI 推理成為現(xiàn)實,為用戶在音頻生成、計算機視覺及情境助手等多種交互場景中帶來更流暢、更快速的體驗。
在實際場景中,SME2 技術將響應速度與運行效率提升至全新水平。例如,在“智能瑜伽教練”演示應用中,得益于 SME2 技術,該應用的文本轉語音生成速度提升了 2.4 倍,這意味著用戶能即時獲得姿勢反饋與指導,且全程不用擔心設備的電池續(xù)航問題。此外,通過 Arm、支付寶與 vivo 的三方合作下,將大語言模型 (LLM) 的交互響應時間縮短了多達 40%,充分證明了 SME2 可為終端設備帶來更快速的實時生成式 AI 體驗。
SME2 技術的價值不僅在于速度的提升,更在于釋放出傳統(tǒng) CPU 無法企及的 AI 驅動功能。例如,在搭載 SME2 的單個核心上運行神經(jīng)攝像頭降噪功能,可以在 1080P 分辨率下實現(xiàn)幀率超 120 幀/秒 (fps),或在 4K 分辨率下實現(xiàn)幀率達 30fps。這使得智能手機用戶即使身處光線最暗的場景,也能捕捉到更銳利、清晰的圖像,進而在日常設備上獲得更流暢的操作交互與更豐富的使用體驗。
不同于受到延遲、成本及隱私問題等挑戰(zhàn)的云優(yōu)先 AI,Lumex 將智能引入設備端,能夠在本地實現(xiàn)更快、更安全且隨時可用的智能體驗。SME2 已經(jīng)廣受業(yè)界領先生態(tài)伙伴的采用,包括阿里巴巴、支付寶、三星 System LSI、騰訊及 vivo。
為全線產品層級賦予架構自由
Arm Lumex 為合作伙伴提供了充分的自由度,使其能從高端智能手機、PC 到新興 AI 優(yōu)先設備的各類產品中,實現(xiàn)峰值性能、持續(xù)能效與芯片面積之間的靈活平衡。
Mali GPU:實現(xiàn)桌面級游戲體驗和更快的 AI 推理
隨著搭載 Arm GPU 的芯片累計出貨量突破 120 億顆,Arm 持續(xù)穩(wěn)居手游體驗領域的核心地位。全新的 Arm Mali G1-Ultra GPU 進一步突破移動游戲的性能邊界,為手游玩家?guī)砀弑U?、主機級畫質。這一突破得益于全新的第二代光線追蹤 (Ray Tracing Unit v2, RTUv2) 技術,該技術顯著提升光照、陰影與反射效果,使其光線追蹤性能相較前代提升了兩倍。在 AI 工作負載方面,Mali G1-Ultra 可將推理性能提升最高 20%,顯著增強各類實時應用的響應速度。
在各類圖形基準測試中,Mali G1-Ultra 較前代產品實現(xiàn)了 20% 的性能提升,為《暗區(qū)突圍:無限》、《堡壘之夜》、《原神》、《崩壞:星穹鐵道》等主流游戲帶來了全面的性能增強。同時,Mali G1-Premium 與 Mali G1-Pro 兩款 GPU,也為硬件資源受限的設備提供了更出色的性能與能效表現(xiàn)。
開發(fā)者友好的端側 AI 解決方案
開發(fā)者可在 Arm Lumex 平臺上獲取開機即用的 AI 開發(fā)體驗。通過 KleidiAI 與各大主流框架的集成,包括 PyTorch ExecuTorch、Google LiteRT、阿里巴巴 MNN 及微軟 ONNX Runtime,開發(fā)者無需修改任何代碼,即可自動取得 SME2 的加速能力。
對于需要構建跨平臺應用的開發(fā)者而言,Lumex 帶來了全新的可遷移性:
· Gmail、YouTube 和 Google Photos 等 Google 應用現(xiàn)已全面支持 SME2 ,搭載 Lumex 的設備一經(jīng)上市即可無縫運行
· 跨平臺可遷移性意味著針對安卓構建的優(yōu)化功能可無縫擴展至采用 Arm 架構的 Windows 及其他操作系統(tǒng)
· 支付寶等合作伙伴已成功驗證:依托 SME2 技術,終端設備上的大語言模型 (LLM) 可實現(xiàn)高效運行。
Apple、三星和 MediaTek 等科技領軍企業(yè),正積極集成 AI 加速功能,推動端側 AI 向更快速、更高效的方向發(fā)展。其中,Apple 正憑借該能力為“蘋果智能” (Apple Intelligence) 提供核心支撐;三星與 MediaTek 則借助 Google Gemini 提升翻譯、摘要、個人助手等實時 AI 應用的響應速度與運行效率。
Arm Lumex:AI 時代的平臺級智能
Arm Lumex 不僅是 Arm 面向消費計算市場的最先進 CSS 平臺,更是開啟新時代智能 AI 體驗的基石。無論是 OEM 廠商還是開發(fā)者,Lumex 均可提供所需工具,助力其在關鍵端側場景實現(xiàn)兼具個性化、隱私保障與高性能的 AI 體驗。作為專為 AI 時代打造平臺, Arm Lumex 將成為未來移動創(chuàng)新的全新起點。
###
合作伙伴證言:
“通過與 SME2 的深度集成,MNN 現(xiàn)已能在智能手機端,為通義千問等十億參數(shù)級的大模型提供低延遲的量化推理能力。這一成果充分體現(xiàn)了 Arm 與阿里巴巴在共同推動下一代可擴展移動 AI 技術發(fā)展中的創(chuàng)新實力?!?
阿里巴巴淘天集團業(yè)務技術 MNN 負責人 姜霄棠
“在 Arm、支付寶與 vivo 的三方密切協(xié)作下,支付寶已在 vivo 新一代旗艦智能手機上完成了基于 Arm SME2 技術的大語言模型推理驗證。結果顯示,在預填充 (prefill) 與解碼 (decode) 階段,性能分別實現(xiàn)了超過 40% 和 25% 的提升。這標志著 CPU 后端能力的重大突破。我們對迄今為止所取得的成果倍感鼓舞。我們相信,隨著 xNN 的持續(xù)演進,以及與 SME2 的深度融合,支付寶有望在更多場景進一步發(fā)揮 AI的 潛能,構建更智能、更安全、更個性化的服務生態(tài)?!?
支付寶終端技術負責人 翁欣旦
“得益于 SME2 技術增強的硬件,像 Gemma 3 這樣更先進的 AI 模型能夠直接在各類設備上運行。隨著 SME2 的持續(xù)擴展,移動開發(fā)者將能在整個生態(tài)系統(tǒng)中無縫部署新一代 AI 功能,最終讓終端用戶在他們智能手機上隨時享受低延遲的 AI 體驗?!?
Google 安卓平臺杰出軟件工程師 Iliyan Malchev
“AI 正在重塑我們與設備、與周圍世界的互動方式,而 Arm 生態(tài)系統(tǒng)正推動該領域的關鍵技術突破。在 Meta,我們對 Arm Kleidi 與 PyTorch 框架下 ExecuTorch 工具的集成感到興奮,這一集成將讓我們的應用得以在下一代技術平臺上無縫運行,進而為終端用戶帶來體驗的顯著加速。”
Meta 人工智能合作部總監(jiān) Sy Choudhury
“在三星,我們很高興能繼續(xù)與 Arm 合作,基于 Arm Lumex CSS 平臺開發(fā)下一代旗艦移動產品。這一合作使我們能夠持續(xù)突破端側 AI 的邊界,為用戶帶來更智能、更迅捷、更高效的體驗?!?
三星電子副總裁兼 SOC IP 開發(fā)團隊負責人 Nak Hee Seong
“SME2 技術通過突破關鍵性能瓶頸,高效助力大語言模型在移動端落地部署,如騰訊混元大模型,為端側大語言模型提供強勁加速,最終帶來更優(yōu)質的用戶體驗?!?
騰訊機器學習平臺專家 楊曉峰