Arm 全新 Lumex CSS 平臺(tái)實(shí)現(xiàn)兩位數(shù)性能提升,驅(qū)動(dòng)消費(fèi)電子設(shè)備“更智能、更高效、更個(gè)性化”
新聞重點(diǎn):
· Arm Lumex CSS 平臺(tái)支持實(shí)時(shí)端側(cè) AI 用例,覆蓋智能助手、語(yǔ)音翻譯及個(gè)性化服務(wù);依托搭載全新 SME2 技術(shù)的 Arm CPU,該平臺(tái)可實(shí)現(xiàn)高達(dá)五倍的 AI 性能提升。
· 開(kāi)發(fā)者可借助 KleidiAI 調(diào)用 SME2 技術(shù)帶來(lái)的性能優(yōu)勢(shì);目前 KleidiAI 已集成至所有主流移動(dòng)操作系統(tǒng)及 AI 框架中,包括 PyTorch ExecuTorch、谷歌 LiteRT、阿里巴巴 MNN 及微軟 ONNX Runtime。
· 針對(duì)旗艦級(jí)設(shè)備,Arm Lumex CSS 平臺(tái)創(chuàng)造了前所未有的成就——連續(xù)六年締造兩位數(shù)的每時(shí)鐘周期指令數(shù) (IPC) 性能提升。
· 全新 Mali G1-Ultra 專(zhuān)為游戲玩家設(shè)計(jì),可帶來(lái)兩倍的光線追蹤性能提升,重新定義移動(dòng)娛樂(lè)體驗(yàn)。
Arm 控股有限公司(納斯達(dá)克股票代碼:ARM,以下簡(jiǎn)稱(chēng) Arm)今日宣布推出全新 Arm® Lumex?計(jì)算子系統(tǒng) (Compute Subsystem, CSS) 平臺(tái),這是一套專(zhuān)為旗艦級(jí)智能手機(jī)及下一代個(gè)人電腦加速其人工智能 (AI) 體驗(yàn)的先進(jìn)計(jì)算平臺(tái)。Lumex CSS 平臺(tái)集成了搭載第二代可伸縮矩陣擴(kuò)展 (SME2) 技術(shù)的最高性能 Arm CPU、GPU 及系統(tǒng) IP,不僅能助力生態(tài)伙伴更快將 AI 設(shè)備推向市場(chǎng),還可支持桌面級(jí)移動(dòng)游戲、實(shí)時(shí)翻譯、智能助手及個(gè)性化應(yīng)用等多樣的豐富體驗(yàn)。
Arm 高級(jí)副總裁兼終端事業(yè)部總經(jīng)理 Chris Bergey 表示:“AI 已不再僅僅是一項(xiàng)技術(shù)功能,它已成為下一代移動(dòng)與消費(fèi)技術(shù)的支撐底座。依托 Arm Lumex 平臺(tái),我們持續(xù)提升端側(cè) AI 體驗(yàn),以滿足用戶日益增長(zhǎng)的需求與期待。為此,我們正積極將 SME2 技術(shù)擴(kuò)展至每一個(gè) CPU 平臺(tái)。預(yù)計(jì)到 2030 年,SME 與 SME2 技術(shù)將為超過(guò) 30 億臺(tái)設(shè)備新增超 100 億TOPS 的計(jì)算能力,為端側(cè) AI 性能帶來(lái)指數(shù)級(jí)躍升。”
合作伙伴可靈活選擇使用 Arm Lumex 的方式,為其打造系統(tǒng)級(jí)芯片 (SoCs)。例如,他們可直接采用 Arm 交付的平臺(tái),并借助為其需求定制的先進(jìn)物理實(shí)現(xiàn)方案,從而獲得縮短產(chǎn)品上市時(shí)間和快速兌現(xiàn)性能價(jià)值等雙重優(yōu)勢(shì);或者,合作伙伴也可根據(jù)他們的目標(biāo)市場(chǎng),對(duì)平臺(tái)寄存器傳輸級(jí) (RTL) 設(shè)計(jì)進(jìn)行配置,并自行完成核心模塊的硬化工作。
全新 Arm Lumex 平臺(tái)包含以下核心組件:
· 新一代搭載 SME2 技術(shù)的 Armv9.3 CPU 集群:包括 Arm C1-Ultra 和 Arm C1-Pro,為旗艦設(shè)備提供支持
· Arm C1-Premium:專(zhuān)為次旗艦市場(chǎng)打造,可提供一流的面積效率
· Arm Mali? G1-Ultra GPU:配備新一代光線追蹤技術(shù),在實(shí)現(xiàn)先進(jìn)的圖形和游戲體驗(yàn)同時(shí),還可提升整體 AI 性能
· Arm C1-DSU:Arm 迄今為止最靈活、高能效且具多種電源模式的 DynamIQ Shared Unit (DSU)
· 針對(duì)三納米工藝節(jié)點(diǎn)優(yōu)化的物理實(shí)現(xiàn)
· 跨軟件棧的深度集成,為使用 KleidiAI 軟件庫(kù)的開(kāi)發(fā)者提供無(wú)縫的 AI 加速體驗(yàn)
搭載 SME2 技術(shù)的 CPU:助力實(shí)現(xiàn)全場(chǎng)景 AI 加速
搭載 SME2 的 Arm C1 CPU 集群,為實(shí)際場(chǎng)景中的 AI 驅(qū)動(dòng)型任務(wù)帶來(lái)了顯著的 AI 性能提升,包括:
· AI 性能提升高達(dá)五倍
· 語(yǔ)音類(lèi)工作負(fù)載延遲降低 4.7 倍
· 音頻生成速度提升 2.8 倍
全新的 Arm CPU 在 AI 計(jì)算能力上的飛躍,讓實(shí)時(shí)的端側(cè) AI 推理成為現(xiàn)實(shí),為用戶在音頻生成、計(jì)算機(jī)視覺(jué)及情境助手等多種交互場(chǎng)景中帶來(lái)更流暢、更快速的體驗(yàn)。
在實(shí)際場(chǎng)景中,SME2 技術(shù)將響應(yīng)速度與運(yùn)行效率提升至全新水平。例如,在“智能瑜伽教練”演示應(yīng)用中,得益于 SME2 技術(shù),該應(yīng)用的文本轉(zhuǎn)語(yǔ)音生成速度提升了 2.4 倍,這意味著用戶能即時(shí)獲得姿勢(shì)反饋與指導(dǎo),且全程不用擔(dān)心設(shè)備的電池續(xù)航問(wèn)題。此外,通過(guò) Arm、支付寶與 vivo 的三方合作下,將大語(yǔ)言模型 (LLM) 的交互響應(yīng)時(shí)間縮短了多達(dá) 40%,充分證明了 SME2 可為終端設(shè)備帶來(lái)更快速的實(shí)時(shí)生成式 AI 體驗(yàn)。
SME2 技術(shù)的價(jià)值不僅在于速度的提升,更在于釋放出傳統(tǒng) CPU 無(wú)法企及的 AI 驅(qū)動(dòng)功能。例如,在搭載 SME2 的單個(gè)核心上運(yùn)行神經(jīng)攝像頭降噪功能,可以在 1080P 分辨率下實(shí)現(xiàn)幀率超 120 幀/秒 (fps),或在 4K 分辨率下實(shí)現(xiàn)幀率達(dá) 30fps。這使得智能手機(jī)用戶即使身處光線最暗的場(chǎng)景,也能捕捉到更銳利、清晰的圖像,進(jìn)而在日常設(shè)備上獲得更流暢的操作交互與更豐富的使用體驗(yàn)。
不同于受到延遲、成本及隱私問(wèn)題等挑戰(zhàn)的云優(yōu)先 AI,Lumex 將智能引入設(shè)備端,能夠在本地實(shí)現(xiàn)更快、更安全且隨時(shí)可用的智能體驗(yàn)。SME2 已經(jīng)廣受業(yè)界領(lǐng)先生態(tài)伙伴的采用,包括阿里巴巴、支付寶、三星 System LSI、騰訊及 vivo。
為全線產(chǎn)品層級(jí)賦予架構(gòu)自由
Arm Lumex 為合作伙伴提供了充分的自由度,使其能從高端智能手機(jī)、PC 到新興 AI 優(yōu)先設(shè)備的各類(lèi)產(chǎn)品中,實(shí)現(xiàn)峰值性能、持續(xù)能效與芯片面積之間的靈活平衡。
Mali GPU:實(shí)現(xiàn)桌面級(jí)游戲體驗(yàn)和更快的 AI 推理
隨著搭載 Arm GPU 的芯片累計(jì)出貨量突破 120 億顆,Arm 持續(xù)穩(wěn)居手游體驗(yàn)領(lǐng)域的核心地位。全新的 Arm Mali G1-Ultra GPU 進(jìn)一步突破移動(dòng)游戲的性能邊界,為手游玩家?guī)?lái)高保真、主機(jī)級(jí)畫(huà)質(zhì)。這一突破得益于全新的第二代光線追蹤 (Ray Tracing Unit v2, RTUv2) 技術(shù),該技術(shù)顯著提升光照、陰影與反射效果,使其光線追蹤性能相較前代提升了兩倍。在 AI 工作負(fù)載方面,Mali G1-Ultra 可將推理性能提升最高 20%,顯著增強(qiáng)各類(lèi)實(shí)時(shí)應(yīng)用的響應(yīng)速度。
在各類(lèi)圖形基準(zhǔn)測(cè)試中,Mali G1-Ultra 較前代產(chǎn)品實(shí)現(xiàn)了 20% 的性能提升,為《暗區(qū)突圍:無(wú)限》、《堡壘之夜》、《原神》、《崩壞:星穹鐵道》等主流游戲帶來(lái)了全面的性能增強(qiáng)。同時(shí),Mali G1-Premium 與 Mali G1-Pro 兩款 GPU,也為硬件資源受限的設(shè)備提供了更出色的性能與能效表現(xiàn)。
開(kāi)發(fā)者友好的端側(cè) AI 解決方案
開(kāi)發(fā)者可在 Arm Lumex 平臺(tái)上獲取開(kāi)機(jī)即用的 AI 開(kāi)發(fā)體驗(yàn)。通過(guò) KleidiAI 與各大主流框架的集成,包括 PyTorch ExecuTorch、Google LiteRT、阿里巴巴 MNN 及微軟 ONNX Runtime,開(kāi)發(fā)者無(wú)需修改任何代碼,即可自動(dòng)取得 SME2 的加速能力。
對(duì)于需要構(gòu)建跨平臺(tái)應(yīng)用的開(kāi)發(fā)者而言,Lumex 帶來(lái)了全新的可遷移性:
· Gmail、YouTube 和 Google Photos 等 Google 應(yīng)用現(xiàn)已全面支持 SME2 ,搭載 Lumex 的設(shè)備一經(jīng)上市即可無(wú)縫運(yùn)行
· 跨平臺(tái)可遷移性意味著針對(duì)安卓構(gòu)建的優(yōu)化功能可無(wú)縫擴(kuò)展至采用 Arm 架構(gòu)的 Windows 及其他操作系統(tǒng)
· 支付寶等合作伙伴已成功驗(yàn)證:依托 SME2 技術(shù),終端設(shè)備上的大語(yǔ)言模型 (LLM) 可實(shí)現(xiàn)高效運(yùn)行。
Apple、三星和 MediaTek 等科技領(lǐng)軍企業(yè),正積極集成 AI 加速功能,推動(dòng)端側(cè) AI 向更快速、更高效的方向發(fā)展。其中,Apple 正憑借該能力為“蘋(píng)果智能” (Apple Intelligence) 提供核心支撐;三星與 MediaTek 則借助 Google Gemini 提升翻譯、摘要、個(gè)人助手等實(shí)時(shí) AI 應(yīng)用的響應(yīng)速度與運(yùn)行效率。
Arm Lumex:AI 時(shí)代的平臺(tái)級(jí)智能
Arm Lumex 不僅是 Arm 面向消費(fèi)計(jì)算市場(chǎng)的最先進(jìn) CSS 平臺(tái),更是開(kāi)啟新時(shí)代智能 AI 體驗(yàn)的基石。無(wú)論是 OEM 廠商還是開(kāi)發(fā)者,Lumex 均可提供所需工具,助力其在關(guān)鍵端側(cè)場(chǎng)景實(shí)現(xiàn)兼具個(gè)性化、隱私保障與高性能的 AI 體驗(yàn)。作為專(zhuān)為 AI 時(shí)代打造平臺(tái), Arm Lumex 將成為未來(lái)移動(dòng)創(chuàng)新的全新起點(diǎn)。
###
合作伙伴證言:
“通過(guò)與 SME2 的深度集成,MNN 現(xiàn)已能在智能手機(jī)端,為通義千問(wèn)等十億參數(shù)級(jí)的大模型提供低延遲的量化推理能力。這一成果充分體現(xiàn)了 Arm 與阿里巴巴在共同推動(dòng)下一代可擴(kuò)展移動(dòng) AI 技術(shù)發(fā)展中的創(chuàng)新實(shí)力?!?
阿里巴巴淘天集團(tuán)業(yè)務(wù)技術(shù) MNN 負(fù)責(zé)人 姜霄棠
“在 Arm、支付寶與 vivo 的三方密切協(xié)作下,支付寶已在 vivo 新一代旗艦智能手機(jī)上完成了基于 Arm SME2 技術(shù)的大語(yǔ)言模型推理驗(yàn)證。結(jié)果顯示,在預(yù)填充 (prefill) 與解碼 (decode) 階段,性能分別實(shí)現(xiàn)了超過(guò) 40% 和 25% 的提升。這標(biāo)志著 CPU 后端能力的重大突破。我們對(duì)迄今為止所取得的成果倍感鼓舞。我們相信,隨著 xNN 的持續(xù)演進(jìn),以及與 SME2 的深度融合,支付寶有望在更多場(chǎng)景進(jìn)一步發(fā)揮 AI的 潛能,構(gòu)建更智能、更安全、更個(gè)性化的服務(wù)生態(tài)?!?
支付寶終端技術(shù)負(fù)責(zé)人 翁欣旦
“得益于 SME2 技術(shù)增強(qiáng)的硬件,像 Gemma 3 這樣更先進(jìn)的 AI 模型能夠直接在各類(lèi)設(shè)備上運(yùn)行。隨著 SME2 的持續(xù)擴(kuò)展,移動(dòng)開(kāi)發(fā)者將能在整個(gè)生態(tài)系統(tǒng)中無(wú)縫部署新一代 AI 功能,最終讓終端用戶在他們智能手機(jī)上隨時(shí)享受低延遲的 AI 體驗(yàn)?!?
Google 安卓平臺(tái)杰出軟件工程師 Iliyan Malchev
“AI 正在重塑我們與設(shè)備、與周?chē)澜绲幕?dòng)方式,而 Arm 生態(tài)系統(tǒng)正推動(dòng)該領(lǐng)域的關(guān)鍵技術(shù)突破。在 Meta,我們對(duì) Arm Kleidi 與 PyTorch 框架下 ExecuTorch 工具的集成感到興奮,這一集成將讓我們的應(yīng)用得以在下一代技術(shù)平臺(tái)上無(wú)縫運(yùn)行,進(jìn)而為終端用戶帶來(lái)體驗(yàn)的顯著加速?!?
Meta 人工智能合作部總監(jiān) Sy Choudhury
“在三星,我們很高興能繼續(xù)與 Arm 合作,基于 Arm Lumex CSS 平臺(tái)開(kāi)發(fā)下一代旗艦移動(dòng)產(chǎn)品。這一合作使我們能夠持續(xù)突破端側(cè) AI 的邊界,為用戶帶來(lái)更智能、更迅捷、更高效的體驗(yàn)。”
三星電子副總裁兼 SOC IP 開(kāi)發(fā)團(tuán)隊(duì)負(fù)責(zé)人 Nak Hee Seong
“SME2 技術(shù)通過(guò)突破關(guān)鍵性能瓶頸,高效助力大語(yǔ)言模型在移動(dòng)端落地部署,如騰訊混元大模型,為端側(cè)大語(yǔ)言模型提供強(qiáng)勁加速,最終帶來(lái)更優(yōu)質(zhì)的用戶體驗(yàn)?!?
騰訊機(jī)器學(xué)習(xí)平臺(tái)專(zhuān)家 楊曉峰