人工智能時代的芯片新思維:Arm構(gòu)筑AI新根基
人工智能(AI)正在全方位改變我們的生活,從智能音箱到智能汽車,每一項AI應(yīng)用的背后,都離不開強大芯片的默默支撐與高效運轉(zhuǎn)。然而,隨著AI計算需求暴增,芯片設(shè)計正面臨巨大挑戰(zhàn):如何在性能、能效和安全之間找到平衡,同時精準契合客戶的定制需求并快速推向市場?領(lǐng)先的計算平臺公司Arm近期發(fā)布了《芯片新思維:人工智能時代的新根基》行業(yè)報告。從AI芯片設(shè)計的趨勢和挑戰(zhàn),到Arm的技術(shù)創(chuàng)新,再到安全防御和生態(tài)系統(tǒng)的構(gòu)筑,Arm解決方案工程部執(zhí)行副總裁Kevork Kechichian圍繞該報告與媒體分享了AI時代芯片設(shè)計的新方向。
報告指出,通過摩爾定律實現(xiàn)半導(dǎo)體縮放的傳統(tǒng)方法已達到物理與經(jīng)濟的極限,產(chǎn)業(yè)正轉(zhuǎn)向創(chuàng)新的替代方案,如定制芯片、計算子系統(tǒng) (CSS) 以及芯粒 (chiplet),以持續(xù)提升性能與能效。如何應(yīng)對AI時代的芯片設(shè)計難題?芯片設(shè)計的未來是什么?且看Arm的洞察與解析。
一、AI推動芯片革新,聚焦能效與可持續(xù)性
想象一下,訓(xùn)練一個AI模型需要消耗相當(dāng)于幾百戶家庭一年的電量——這就是AI計算的現(xiàn)實。隨著AI應(yīng)用從云端走向手機、汽車等邊緣設(shè)備,芯片設(shè)計正迎來大變革。
該報告指出,步入AI時代,定制芯片正在被全行業(yè)廣泛采用,芯粒技術(shù)也在加速崛起。同時,行業(yè)協(xié)作越來越緊密。芯片設(shè)計不再是單打獨斗,IP提供商、晶圓代工廠、封裝廠都在聯(lián)手創(chuàng)新。這種“團隊作戰(zhàn)”讓芯片開發(fā)更快、更高效,通過標準化接口讓不同模塊無縫連接。
但AI芯片設(shè)計并非一片坦途。AI工作負載的計算需求極大,需要大量電力與能源資源來支持其運行。一大挑戰(zhàn)是如何實現(xiàn)算力和能效的平衡。對此,Kevork表示,首先需要從最底層出發(fā),從晶體管層開始,與晶圓代工廠緊密合作,確保晶體管在功耗和性能方面實現(xiàn)優(yōu)化,無論是動態(tài)功耗還是漏電功耗;再來是架構(gòu)層面,對CPU以及各類處理引擎的指令集進行針對性優(yōu)化;然后向上進入整個結(jié)構(gòu)中的更高層級,從系統(tǒng)級芯片(SoC)設(shè)計、封裝到數(shù)據(jù)中心等方面進行優(yōu)化。在此過程中,關(guān)鍵要點在于對數(shù)據(jù)及其傳輸過程的保護,降低在內(nèi)存之間傳輸數(shù)據(jù)所消耗的電力;最后,在支撐大型數(shù)據(jù)中心運行的軟件層,實現(xiàn)智能負載均衡,即針對AI的不同方面進行處理上的優(yōu)化,并合理分配工作負載,盡可能減少不同節(jié)點之間的數(shù)據(jù)傳輸。
此外,定制芯片的開發(fā)成本非常高。開發(fā)一顆新芯片需要大量人力和計算資源。而且,客戶希望芯片盡快上市,開發(fā)團隊也面臨著產(chǎn)品上市時間的壓力。如何能夠有效降低開發(fā)投入并加快產(chǎn)品上市時間?Kevork分享到,最基礎(chǔ)的方法就是從平臺的角度出發(fā),識別可復(fù)用的模塊與資源,并確保定制工作是在已有基礎(chǔ)上進行,無需一切從零開始。
AI推理在設(shè)備端的加速落地也為行業(yè)帶來了新挑戰(zhàn),比如如何在智能手機、物聯(lián)網(wǎng)等端側(cè)設(shè)備上實現(xiàn)高性能、高能效的計算。Kevork強調(diào),AI推理運算需要獨特的技術(shù)開發(fā)路徑——從計算子系統(tǒng)到SoC框架的專用架構(gòu)設(shè)計,再到實現(xiàn)這一切的軟件體系。主要的架構(gòu)差異在于對帶寬和數(shù)據(jù)傳輸?shù)年P(guān)注,這些系統(tǒng)需要針對推理工作負載和高帶寬進行優(yōu)化,以滿足不斷增長的需求。
關(guān)于在云端進行模型訓(xùn)練與在邊緣設(shè)備上運行推理的趨勢,Kevork表示,一旦模型在云端利用海量數(shù)據(jù)集完成訓(xùn)練,就可以進行優(yōu)化,使其能夠運行在較小的服務(wù)器,甚至是邊緣設(shè)備上,從而提升數(shù)據(jù)傳輸效率和整體性能。
二、應(yīng)對AI時代芯片設(shè)計挑戰(zhàn)的 “組合拳”
Arm作為計算平臺的領(lǐng)頭羊,拿出了一套應(yīng)對AI時代下芯片設(shè)計挑戰(zhàn)的“組合拳”。
持續(xù)發(fā)展計算子系統(tǒng) (CSS)
Arm Neoverse CSS 經(jīng)過驗證的核心計算功能以及靈活的內(nèi)存與 I/O 接口配置,加快了產(chǎn)品上市進程,帶來顯著的優(yōu)勢。它在確保軟件一致性的同時,為 SoC 設(shè)計人員提供了靈活性,使其能夠基于 CSS 周圍新增定制子系統(tǒng),以打造差異化的解決方案。微軟、智原科技和 Rebellions 等公司展示了 CSS 如何實現(xiàn)定制芯片的快速開發(fā),同時保留了系統(tǒng)級優(yōu)化的靈活性。這種方法不僅降低了開發(fā)門檻,還讓芯片和軟件更兼容,幫客戶在競爭激烈的市場中搶占先機。
聚焦異構(gòu)計算
基于 Arm 架構(gòu)的 CPU 正成為GPU 和 TPU 等 AI 加速器的理想搭檔——既能高效管理數(shù)據(jù)流和通用計算任務(wù),又能應(yīng)對工作流程中遇到的瓶頸。Kevork表示,該范式中的 CPU、GPU 和 TPU 能夠支持不同的工作負載。上述所有處理器都可以作為 AI 推理的處理引擎,被部署到 Arm 合作伙伴所開發(fā)的 SoC 中。
與此同時,大型 AI 模型的訓(xùn)練通常依賴高性能 GPU,而 Arm 的高能效處理器則非常適合在端側(cè)和數(shù)據(jù)中心執(zhí)行推理任務(wù)。而在可擴展性方面,Arm 架構(gòu)支持 CPU、GPU 與專用加速器的無縫集成,這對于打造優(yōu)化的 AI 系統(tǒng)至關(guān)重要。
推進芯粒技術(shù)的標準化
先進的封裝技術(shù)和工藝推動了芯粒的發(fā)展。這些技術(shù)允許多個半導(dǎo)體晶粒的堆疊和互連,在提升性能和能效的同時,開創(chuàng)了現(xiàn)代芯片設(shè)計的可能性,如晶粒間接口以及新的 2.5D 和 3D 封裝解決方案。理想情況下,芯片廠商無需重新設(shè)計一款芯片,只需添加更多芯粒以增加算力和性能,甚至可以升級現(xiàn)有芯粒,從而更快地將新產(chǎn)品推向市場。與此同時,生產(chǎn)更小的芯片還有助于提高良率,并減少制造過程中的浪費。
但芯粒也有難題:不同模塊之間該怎么通信?Arm的答案是標準化。Arm 推出的芯粒系統(tǒng)架構(gòu) (Chiplet System Architecture, CSA),旨在對各個芯粒之間及在整個系統(tǒng)內(nèi)的通信方式等多個方面實現(xiàn)標準化。此外,Arm 攜手合作伙伴共同推動 AMBA CHI 芯片到芯片互連協(xié)議等倡議的落地實施,確保來自不同供應(yīng)商的不同芯粒通過一個統(tǒng)一的接口協(xié)議來確保芯粒之間的互操作性。
Kevork強調(diào),過去標準化常被視為放棄自身的 IP 或競爭優(yōu)勢。但如今,鑒于系統(tǒng)的高度復(fù)雜性以及合作模式的演變,標準化變得尤為重要——所有參與方都將從中獲得多重益處。
三、加強應(yīng)對AI時代的安全威脅
安全威脅隨著 AI 技術(shù)的發(fā)展也在同步演進,其中 AI 驅(qū)動的網(wǎng)絡(luò)攻擊為各行各業(yè)帶來新的挑戰(zhàn)。報告指出,當(dāng)前行業(yè)面臨的安全挑戰(zhàn)不僅在于防御已知威脅,還在于打造出強大的安全功能,以適應(yīng)并抵御日益復(fù)雜的 AI 驅(qū)動型攻擊,同時保持系統(tǒng)的性能和可靠性。
當(dāng)談及如何確保芯片在復(fù)雜多變的網(wǎng)絡(luò)環(huán)境中的安全性時,Kevork 表示,Arm 正在通過構(gòu)建多層級的軟硬件防護體系,提升防御能力。比如,Arm 在芯片中直接集成加密技術(shù),并結(jié)合經(jīng) AI 強化的安全監(jiān)測系統(tǒng),使現(xiàn)代 SoC 架構(gòu)能夠抵御傳統(tǒng)攻擊與新興的威脅。
事實上,AI 本身也正日益成為抵御安全攻擊的有力助手。通過基于網(wǎng)絡(luò)的監(jiān)測與先進的代碼分析,AI 驅(qū)動的技術(shù)能夠以人類難以企及的速度和規(guī)模識別可疑行為,并發(fā)現(xiàn)潛在漏洞。Arm 正在最大限度地發(fā)揮這一優(yōu)勢。
此外,快速發(fā)展的定制芯片在顯著提升性能優(yōu)化的同時,對安全性提出了更高要求。Arm 推出的 PSA Certified 已成為安全芯片設(shè)計領(lǐng)域的黃金標準。通過對安全啟動、加密服務(wù)以及更新協(xié)議等方面制定全面的要求,PSA Certified為芯片制造商提供了清晰的路線圖,使其能將安全機制深植于定制芯片解決方案的基礎(chǔ)架構(gòu)中。作為對PSA Certified的補充,物聯(lián)網(wǎng)平臺安全評估標準 (SESIP) 為定制芯片的安全評估提供了結(jié)構(gòu)化的方法。該標準深入剖析多個關(guān)鍵安全領(lǐng)域,涵蓋從安全初始化流程到敏感數(shù)據(jù)徹底清除的全過程,確保定制芯片在整個運行生命周期內(nèi)始終保持其完整性與安全性。
寫在最后
AI時代,芯片設(shè)計就像一場高難度的平衡游戲:性能要強、能耗要低、安全要牢、開發(fā)要快。就像Kevork所說的,“計算的未來,尤其是AI的未來,取決于我們能否持續(xù)突破芯片技術(shù)的極限?!彪S著新工藝節(jié)點需要更緊密的合作,芯片設(shè)計與制造之間的傳統(tǒng)界限正在逐漸消失。新的時代需要具備創(chuàng)造力、系統(tǒng)級思維,以及對能效的不懈追求。
此外,Arm強大的生態(tài)系統(tǒng)讓行業(yè)上下游擰成一股繩,共同推動AI技術(shù)落地?!癆rm深知高效且可擴展的計算架構(gòu)在釋放 AI 潛能中的關(guān)鍵作用。通過與半導(dǎo)體生態(tài)系統(tǒng)中的合作伙伴持續(xù)協(xié)作,我們致力于應(yīng)對能效、安全性和性能等根本性挑戰(zhàn),定義計算的未來?!盞evork總結(jié)道。