從1965年沉睡到現(xiàn)在的狂熱復興,Chiplet在AI中迎來自己的黃金時代
AI時代,AI應用的普及與數(shù)據(jù)中心需求的增長齊頭并進,數(shù)據(jù)中心對高性能計算的需求進一步推動了芯片技術的發(fā)展。然而,隨著摩爾定律逐漸接近其物理極限,傳統(tǒng)的芯片設計方法難以滿足AI計算對性能和成本的雙重需求。
因此,行業(yè)正在積極尋找全新的技術路徑以應對這一挑戰(zhàn)。在此背景下,芯粒(Chiplet)技術在市場中迅速崛起,通過異構(gòu)集成的方式解決了傳統(tǒng)芯片的諸多問題,為數(shù)據(jù)中心和AI應用的發(fā)展提供了有力支持,逐漸成為業(yè)界廣泛采用的解決方案。
IDTechEx報告稱,在數(shù)據(jù)中心和人工智能(AI)等領域高性能計算需求的推動下,預計到2035年全球芯粒市場規(guī)模將達到4,110億美元。從1965年首次提出,到現(xiàn)在的狂熱復興。Chiplet正在AI中迎來自己的黃金時代。
Chiplet:突破極限,解鎖下一代計算潛力
摩爾定律過去幾乎主導了半導體產(chǎn)業(yè)的發(fā)展,它要求每兩年芯片的晶體管數(shù)量翻一番,從而實現(xiàn)計算能力的快速增長。然而,隨著晶體管尺寸逐步接近納米尺度,功耗、熱管理和制造成本等問題日益突出,傳統(tǒng)的“更多晶體管”方式難以繼續(xù)滿足市場對性能、成本和能效的多重需求,而Chiplet技術作為一種新的芯片架構(gòu),正在成為突破這一瓶頸的關鍵技術,解鎖下一代計算的潛力。
Chiplet技術的核心理念是將傳統(tǒng)單一的集成電路(IC)分解成多個功能模塊,每個模塊(或稱“芯?!保┛梢元毩⒃O計、制造和優(yōu)化。這些模塊可以是不同的計算核心、內(nèi)存、存儲單元,甚至是加速器(如GPU、NPU),然后通過高速互聯(lián)技術將它們組合成一個統(tǒng)一的系統(tǒng)。這種模塊化的設計思想打破了傳統(tǒng)芯片的集成方式,使得設計師能夠靈活地選擇和組合不同的芯粒,優(yōu)化成本、性能、功耗和開發(fā)周期。
(圖源:AM IG)
在解讀解讀Chiplet時,我們通常會聽到業(yè)界專家用樂高積木來進行類比,可以更直觀和形象幫助我們理解其概念和原理。
樂高積木——模塊化設計: 就像樂高積木有不同形狀和大小的模塊,Chiplet技術也是一種模塊化設計。每個Chiplet(芯粒)可以是一個功能單元,像樂高積木中的一個小塊,可能是處理器核心、內(nèi)存、存儲、輸入輸出模塊等。就像你可以把不同形狀和功能的樂高積木拼接在一起,Chiplet也可以根據(jù)需求組合成一個完整的系統(tǒng)。
靈活組合——自由定制: 在樂高世界里,你可以根據(jù)自己的需求,選擇不同的積木來搭建房子、車子或其他任何東西,不同的模塊可以組合成不同的結(jié)構(gòu)。同樣,Chiplet技術允許設計師根據(jù)實際應用需求,選擇不同的芯粒,并將它們組合成一個特定的芯片或系統(tǒng)。這種靈活性使得設計過程更加高效,能夠快速響應不同市場需求和技術進步。
標準接口——無縫連接: 樂高積木的所有模塊都有標準的接口(比如凹凸的連接點),使得不同的積木能夠方便地連接在一起,形成一個完整的結(jié)構(gòu)。同樣,Chiplet技術也依賴標準化的接口和高速互連技術(例如,CXL、UCIe等),使得不同功能模塊的Chiplet可以無縫連接,協(xié)同工作。
可擴展性和靈活性——不斷擴展: 在樂高模型中,如果你想擴展你的作品,只需要增加更多的積木塊,而不需要重新構(gòu)建整個模型。同樣,Chiplet技術也支持系統(tǒng)的擴展。如果需要增加更多的計算能力或功能,可以直接在現(xiàn)有的Chiplet基礎上添加更多的模塊,而不必重新設計整個芯片。
降低成本和時間——模塊化生產(chǎn): 樂高積木的生產(chǎn)是高度標準化和模塊化的,因此你可以很容易地找到任何你需要的部件,且生產(chǎn)成本較低。Chiplet技術采用模塊化設計,也有類似的優(yōu)勢。各個芯??梢愿鶕?jù)不同的需求進行獨立制造,并且可以使用不同的工藝技術,這樣不僅減少了開發(fā)和制造成本,還能加快生產(chǎn)周期。
(圖源:UCIe)
傳統(tǒng)的單芯片設計往往受到單一制造工藝和制程技術的限制。而Chiplet技術的模塊化設計使得不同功能塊可以根據(jù)需求進行選擇和組合,甚至可以采用不同的制程技術。例如,高性能的計算核心可以采用先進的制程工藝,而存儲模塊則可以選擇性價比更高的工藝,這樣能夠兼顧不同性能需求和成本控制。此外,通過優(yōu)化芯片間的互聯(lián)方式,Chiplet設計也可以實現(xiàn)更高效的通信,減少數(shù)據(jù)傳輸?shù)难舆t和能耗,提升整體系統(tǒng)的性能。Chiplet架構(gòu)的另一大優(yōu)勢是可擴展性和易于升級的特性。在傳統(tǒng)芯片設計中,升級整個芯片系統(tǒng)需要重新設計所有功能模塊。而在Chiplet架構(gòu)下,設計人員可以根據(jù)市場需求和技術進步,更換或升級單獨的芯粒,而不必完全更換整個芯片。這種靈活性使得芯片設計的生命周期大大延長,也為不同應用場景提供了更高效的解決方案。
通過標準化和模塊化的設計,Chiplet克服了傳統(tǒng)的集成電路設計周期長、成本高的挑戰(zhàn),加快了產(chǎn)品創(chuàng)新周期。當前Chiplet技術的應用領域非常廣泛,尤其在數(shù)據(jù)中心、高性能計算(HPC)、人工智能(AI)以及5G通信等領域,具有巨大的市場潛力。在數(shù)據(jù)中心領域,芯片的性能需求不斷增加,而功耗和散熱問題也日益嚴重。通過采用Chiplet技術,可以有效地在不同模塊之間分配計算負載,優(yōu)化功耗和熱管理,從而提升整個系統(tǒng)的計算能力與能效。
在人工智能和機器學習領域,尤其是推理和訓練任務中,Chiplet技術通過支持專門的硬件加速器(如神經(jīng)網(wǎng)絡處理單元,NPU)和高帶寬內(nèi)存等,能夠提升AI工作負載的處理效率。此外,5G通信的部署也對芯片提出了更高的要求,Chiplet技術通過提供靈活的網(wǎng)絡處理模塊和低延遲的數(shù)據(jù)傳輸能力,有助于滿足5G網(wǎng)絡對低功耗和高性能的需求。
隨著制造工藝不斷進步,Chiplet技術將繼續(xù)發(fā)展,未來可能會更多出現(xiàn)在更多新興應用中,包括邊緣計算、自動駕駛、物聯(lián)網(wǎng)等領域。
Chiplet成功關鍵:加速推進標準化,擴大生態(tài)繁榮
隨著Chiplet技術在半導體領域的迅猛發(fā)展,行業(yè)對其前景充滿期待。然而,技術創(chuàng)新的背后,Chiplet的成功并不僅僅依賴于模塊化設計理念本身,更在于行業(yè)能否有效推動標準化進程。標準化已成為Chiplet技術發(fā)展的核心驅(qū)動力,決定了這一創(chuàng)新能否在未來的芯片生態(tài)中占據(jù)主導地位。
在當前的半導體產(chǎn)業(yè)中,許多企業(yè)和行業(yè)組織已經(jīng)開始著手推動Chiplet的標準化工作,以解決異構(gòu)集成中的接口兼容性和互操作性問題。沒有統(tǒng)一的標準,不同廠商生產(chǎn)的Chiplet將難以實現(xiàn)跨平臺互聯(lián),進而限制Chiplet技術的廣泛應用。
而Arm致力于成為芯粒生態(tài)系統(tǒng)的基石:從推出芯粒系統(tǒng)架構(gòu) (CSA) 到近期發(fā)布首個公開規(guī)范,Arm一步步推動芯粒技術的標準化,減少行業(yè)的碎片化,加速芯片技術演進。
事實上,一直以來,Arm都在芯粒發(fā)展過程中扮演重要角色:
· 2023年10月,Arm全面設計(Arm Total Design)推動芯粒生態(tài)系統(tǒng)蓬勃發(fā)展。
· 2024年2月,Arm攜手生態(tài)系統(tǒng)制定標準,提供加速芯粒應用所需的通用框架。
· 2024年4月,Arm攜手合作伙伴共同推動AMBA CHI芯片到芯片互連協(xié)議等倡議的落地實施。
這三項舉措,體現(xiàn)了Arm推動Chiplet技術從概念到現(xiàn)實的全方位努力。
首先,Arm Total Design是Arm提出的一種全面的芯片設計系統(tǒng),匯集了專用集成電路 (ASIC) 設計公司、IP 供應商、EDA 工具提供商、代工廠和固件開發(fā)者等行業(yè)領先企業(yè),能夠加速Chiplet設計中的系統(tǒng)整合,幫助芯片設計師構(gòu)建異構(gòu)集成的系統(tǒng)。
而Arm芯粒系統(tǒng)架構(gòu) (Chiplet System Architecture, CSA),則是Arm 與 20 多位合作伙伴正在分析和界定基于芯粒的系統(tǒng)的最佳分區(qū)選擇,以提高多個供應商之間的組件(包括物理設計 IP、軟 IP 等)復用率。這項舉措的核心是通過提供通用框架和標準化接口,幫助不同廠商的芯?;ハ嗉嫒荩_保它們能夠無縫集成。標準化不僅是推動Chiplet技術發(fā)展的關鍵因素,它也能為廠商提供共同的技術基礎,減少開發(fā)成本和時間。
(圖源:CSA)
AMBA CHI協(xié)議(Arm Memory Bus Architecture Chip-to-Chip Interface)則是Arm推動的芯粒間互連協(xié)議,它專門用于芯粒之間的高效通信。AMBA CHI協(xié)議為不同芯粒間的通信提供了統(tǒng)一的高帶寬、低延遲的連接方式。通過這一協(xié)議,芯粒能夠通過標準化的連接路徑共享內(nèi)存和其他系統(tǒng)資源,確保了系統(tǒng)性能的提升。
(圖源:Arm)
設計創(chuàng)新 + 標準化 + 高效互連,Arm的三大舉措從三個核心維度入手,推動了Chiplet技術的成熟與普及。通過設計創(chuàng)新,Arm為芯粒提供了靈活的定制化設計框架;通過標準化,Arm確保了不同芯粒之間能夠高效協(xié)作,克服了異構(gòu)集成中的兼容性問題;而通過AMBA CHI協(xié)議,Arm為芯粒間的高速數(shù)據(jù)傳輸提供了可靠的技術支撐。
結(jié)語
Chiplet并非一種全新的設計思維,早在 1965 年,IBM 就使用類似模塊化的方法來開發(fā)大型處理器。但當時的半導體制造工藝和封裝技術無法支撐這種模塊化設計的廣泛應用。特別是在芯粒互連和高密度集成方面,傳統(tǒng)的單片集成電路設計在性能上具有更大的優(yōu)勢。
但隨著摩爾定律走向極致,而AI、大數(shù)據(jù)、云計算、邊緣計算等領域?qū)Ω咝阅苡嬎恪⒌凸?、高靈活性的計算需求又在不斷增加;這些因素共同促進了Chiplet技術的現(xiàn)代復興,使其在今天成為半導體行業(yè)的熱門技術方向。
行業(yè)領先企業(yè)紛紛針對Chiplet展開技術探索,并積極進行技術奠基,取得了卓越成績。
2025年1月,Arm宣布其芯粒系統(tǒng)架構(gòu)(CSA)正式推出首個公開規(guī)范,在AMBA CHI C2C統(tǒng)一接口協(xié)議基礎上,進一步推動芯粒技術的標準化,并減少行業(yè)的碎片化。目前,已有超過60 家行業(yè)領先企業(yè),如 ADTechnology、Alphawave Semi、AMI、楷登電子、云豹智能、Kalray、Rebellions、西門子和新思科技等,積極參與了 CSA 的相關工作,助力不同領域的芯片戰(zhàn)略制定并遵循統(tǒng)一的標準。
Arm、三星晶圓代工廠、ADTechnology 和Rebellions共同合作開發(fā)了基于Neoverse CSS V3 的 AI CPU 芯粒平臺;Alcor Micro 和Alphawave 也已經(jīng)推出基于臺積公司工藝的全新芯粒;這都是使用AMBA CHI C2C接口協(xié)議的生態(tài)伙伴取得的創(chuàng)新成果。
展望未來,隨著技術不斷成熟、標準逐步統(tǒng)一、生態(tài)系統(tǒng)進一步繁榮,Chiplet將推動高性能計算在性能和效率上的進一步突破,也為其他行業(yè)帶來更為可定制化的解決方案。未來,Chiplet技術能夠有效應對各種特定市場需求和挑戰(zhàn),幫助我們滿足在AI時代日益增長的各種計算需求挑戰(zhàn)。