大算力硬件“牛市”即將開(kāi)啟!戴偉民博士解讀AIGC芯片的機(jī)遇與挑戰(zhàn)
2024年7月6日下午,由上海開(kāi)放處理器產(chǎn)業(yè)創(chuàng)新中心和芯原微電子(上海)股份有限公司主辦的“RISC-V和生成式AI論壇”,在上海世博中心成功召開(kāi)。芯原股份創(chuàng)始人、董事長(zhǎng)兼總裁戴偉民博士發(fā)表了關(guān)于“AIGC芯片的機(jī)遇與挑戰(zhàn)”的精彩演講。這一演講不僅深入分析了人工智能技術(shù)的歷史發(fā)展和當(dāng)前趨勢(shì),還預(yù)測(cè)了這些技術(shù)將如何在未來(lái)塑造半導(dǎo)體行業(yè),特別是在A(yíng)IGC領(lǐng)域的應(yīng)用和發(fā)展。
群模亂舞是浪費(fèi)電,垂直領(lǐng)域微調(diào)具備更高價(jià)值
戴博士的演講首先回顧了從機(jī)械化時(shí)代到信息化時(shí)代的轉(zhuǎn)變,強(qiáng)調(diào)了人工智能從“弱智能”向“強(qiáng)智能”的轉(zhuǎn)變?nèi)绾螛O大地推動(dòng)了計(jì)算需求的增長(zhǎng)。他指出,隨著技術(shù)的進(jìn)步,AIGC的發(fā)展已從單一模式識(shí)別和響應(yīng),擴(kuò)展到更復(fù)雜的任務(wù)如自然語(yǔ)言處理和機(jī)器學(xué)習(xí)模型的自我迭代。這些技術(shù)的進(jìn)步不僅加速了人工智能的應(yīng)用,也對(duì)芯片設(shè)計(jì)和制造提出了新的要求。
但當(dāng)下的“百模大戰(zhàn)”,在戴博士看來(lái)更像是“群模亂舞”、浪費(fèi)電?!安灰f(shuō)一講起AI就要建一個(gè)訓(xùn)練中心、要很多訓(xùn)練卡,樹(shù)干是長(zhǎng)不出樹(shù)葉的、要樹(shù)枝。樹(shù)枝是什么意思?微調(diào)。垂直領(lǐng)域的微調(diào),這是在端上、然后端上再推。實(shí)際上三張卡“云上的訓(xùn)練卡、端上的微調(diào)推理卡”,應(yīng)該是端上的卡大大大于“云”上的卡?!贝鞑┦拷忉尩?。
AIGC:推動(dòng)高性能計(jì)算芯片市場(chǎng)擴(kuò)張
戴博士詳細(xì)探討了AIGC技術(shù)對(duì)半導(dǎo)體行業(yè)的具體影響。他提到,隨著模型規(guī)模的增加,對(duì)計(jì)算能力的需求也呈指數(shù)級(jí)增長(zhǎng),這直接推動(dòng)了高性能計(jì)算芯片市場(chǎng)的擴(kuò)張。在他的演講中,戴博士使用具體數(shù)據(jù)展示了從GPT-3到GPT-4模型的參數(shù)和計(jì)算需求的激增,以及這對(duì)芯片設(shè)計(jì)和生產(chǎn)技術(shù)的挑戰(zhàn)。
據(jù)悉,GPT 3擁有1750億個(gè)參數(shù),計(jì)算需求 約為 315000百億億次;GPT 4約有1.7萬(wàn)億個(gè)參數(shù),計(jì)算需求 約為 1.35億百億億次。一個(gè)擁有10萬(wàn)億參數(shù)的理論上要130億百億億次的計(jì)算量,將需要1060萬(wàn)個(gè)A100 PCle 80GB芯片或3336 個(gè)采用256 個(gè)Grace Hopper芯片的DGX GH200系統(tǒng)。
而為了實(shí)現(xiàn)這些模型加速,產(chǎn)業(yè)界也進(jìn)行了多種探索。Groq自研的一種名為張量流處理器(TSP)的新型處理單元,并定義為“語(yǔ)言處理單元 (LPU)”。通過(guò)其專(zhuān)門(mén)的架構(gòu)設(shè)計(jì)、高效的內(nèi)存帶寬、改進(jìn)的能效比、可擴(kuò)展性和未來(lái)發(fā)展?jié)摿?,在處?特定AI工作負(fù)載,尤其是大型語(yǔ)言模型時(shí),相對(duì)于GPU展現(xiàn)出顯著的先進(jìn)性。
初創(chuàng)公司Etched AI,則針對(duì)Transformer推出了專(zhuān)用ASIC“Sohu”。Sohu是基于臺(tái)積電4nm工藝,配有144GB HBM3E高帶寬內(nèi)存。能效方面明顯優(yōu)于傳統(tǒng)GPU,推理方面性能比英偉達(dá)的H100快20倍。而這種性能優(yōu)勢(shì)的建立是基于對(duì)Transformer架構(gòu)的優(yōu)化硬化,所以并不能夠支持CNN、RNN 或 LSTM等大多數(shù)AI 架構(gòu),靈活性欠佳。
戴博士引用了來(lái)自Counterpoint Research的數(shù)據(jù),該報(bào)告稱(chēng)到2030年,關(guān)鍵計(jì)算領(lǐng)域的半導(dǎo)體收入將達(dá)數(shù)萬(wàn)億美元;,生成式AI將使服務(wù)器領(lǐng)域的半導(dǎo)體收入增至三倍,達(dá)到5930億美元的規(guī)模。
下一輪“先軟后硬”的牛市正在到來(lái),芯原實(shí)現(xiàn)積極布局
芯原在應(yīng)對(duì)AIGC挑戰(zhàn)方面的創(chuàng)新舉措,包括低功耗設(shè)計(jì)、高性能計(jì)算和芯片微調(diào)技術(shù)上的突破。特別是在可穿戴設(shè)備和汽車(chē)電子領(lǐng)域,芯原開(kāi)發(fā)的芯片不僅能夠處理復(fù)雜的AI模型,還能在極低的功耗下運(yùn)行,這些技術(shù)的應(yīng)用展示了其在行業(yè)中的領(lǐng)先地位。
在今年的德國(guó)嵌入式展上,芯原還展示了谷歌Open Se Cura項(xiàng)目。這是一個(gè)由設(shè)計(jì)工具和IP庫(kù)組成的開(kāi)源框架,旨在加速安全、可擴(kuò)展、透明和 高效的AI系統(tǒng)的發(fā)展;芯原提供多個(gè)IP、低功耗芯片設(shè)計(jì)、BSP,并負(fù)責(zé)推動(dòng)該項(xiàng)目的商業(yè)化。
值得一提的是,芯原神經(jīng)網(wǎng)絡(luò)處理器 (NPU) 已在全球累積出貨超過(guò)1億顆,被72家客戶(hù)用于其128款人工智能芯片中,涉獵了超過(guò)10個(gè)市場(chǎng)應(yīng)用領(lǐng)域。芯原的圖形處理器 (GPU) 也已在全球累積出貨近20億顆,擁有70項(xiàng)專(zhuān)利,在千萬(wàn)輛車(chē)上運(yùn)行。在視頻處理器 (VPU) 方面,芯原也是全球第一。其VPU產(chǎn)品已被全球前20大云平臺(tái)解決方案提供商中12個(gè)采用,國(guó)內(nèi)前5大互聯(lián)網(wǎng)提供商種有3個(gè)也選擇了芯原的VPU。
在自動(dòng)駕駛方面,芯原Chiplet技術(shù)正在助力構(gòu)建下一代智慧駕駛平臺(tái)。在數(shù)據(jù)中心領(lǐng)域,芯原也提供了全面的產(chǎn)品組合,提供了一系列高性能AIGC芯片。
展望未來(lái),戴博士討論了AIGC技術(shù)在多個(gè)垂直市場(chǎng)中的應(yīng)用前景,如自動(dòng)駕駛、健康醫(yī)療和制造業(yè)等。他預(yù)測(cè),隨著技術(shù)的成熟,這些領(lǐng)域的需求將進(jìn)一步驅(qū)動(dòng)高性能芯片的市場(chǎng)增長(zhǎng)。此外,他強(qiáng)調(diào)了在全球范圍內(nèi)建立戰(zhàn)略合作伙伴關(guān)系的重要性,以便更好地利用全球資源和專(zhuān)業(yè)知識(shí),加速AIGC技術(shù)的商業(yè)化進(jìn)程。
“我認(rèn)為下一輪牛市2026年、最晚2027年,是因?yàn)?023年的ChatGPT?!贝鞑┦空J(rèn)為,上一輪的牛市由iphone4開(kāi)啟,是從移動(dòng)硬件創(chuàng)新到移動(dòng)互聯(lián)網(wǎng)的軟件創(chuàng)新,“先硬后軟”的節(jié)奏。而新一輪的牛市的開(kāi)啟,則是先軟后硬的節(jié)奏,以ChatGPT為代表的大模型將會(huì)引領(lǐng)大算力硬件的“牛市”。
結(jié)語(yǔ)
戴偉民博士的演講為我們提供了對(duì)AIGC技術(shù)發(fā)展的深刻洞察,以及這些技術(shù)如何影響芯片行業(yè)的全面分析。他的見(jiàn)解不僅強(qiáng)調(diào)了芯原在這一變革中的領(lǐng)導(dǎo)角色,也展示了半導(dǎo)體行業(yè)面臨的機(jī)遇與挑戰(zhàn)。隨著AI技術(shù)的快速進(jìn)步,芯原的創(chuàng)新和戰(zhàn)略布局將在未來(lái)的技術(shù)革命中扮演關(guān)鍵角色,推動(dòng)整個(gè)行業(yè)向前發(fā)展。