通過GPU技術(shù)的改進(jìn),每年將使AI推理性能成倍提升
在過去一周,圣何塞似乎變成了芯片版的瞬息全宇宙。摩爾定律在其中一個(gè)宇宙已經(jīng)死了,而在另一個(gè)宇宙依然“健在且活的挺好”。這兩個(gè)宇宙的主宰者分別是英偉達(dá)和英特爾。
9月28日,英特爾在和英偉達(dá)總部隔著一個(gè)圣何塞機(jī)場(chǎng)的麥克內(nèi)里會(huì)展中心,舉辦了Innovation線下大會(huì)。在主題演講中,英特爾CEO帕特·基辛格(Pat Gelsinger)發(fā)布了13代酷睿處理器Raptor Lake。其中i9-13900K款產(chǎn)品為24核心(8個(gè)性能核,16個(gè)能效核),32線程。它們采用的是Intel 7制程工藝和x86高性能混合架構(gòu)。而且,盡管此前曾提示會(huì)漲價(jià),但新一代的最終價(jià)格和上一代基本持平。
但外界對(duì)當(dāng)天演講的討論不只停留在新的CPU本身,在發(fā)布這款被基辛格稱為“史上最快最好的桌面處理器”之前,基辛格在演講里首先提到了摩爾定律。
“過去數(shù)十年我都處在一個(gè)爭論之中,就是摩爾定律已經(jīng)死了?!彼f?!暗鸢甘?,沒有!”
基辛格對(duì)著臺(tái)下略顯夸張的張開雙手,背后的PPT顯示出幾行大字:
Moore’s Law: Alive and Well(摩爾定律活的很好)。
“我們期待單一芯片封裝上集成的晶體管從今天的一千億個(gè),到這個(gè)十年的末尾達(dá)到一萬億個(gè)?!彼f。
“在元素周期表被窮盡前我們不會(huì)停止,我們會(huì)繼續(xù)做摩爾定律的守護(hù)者。”
這段發(fā)言被諸多媒體引用,且被認(rèn)為是對(duì)一周前英偉達(dá)CEO黃仁勛在GTC大會(huì)后的一段發(fā)言的隔空回?fù)簟?
在此前9月21日的2022 GTC線上大會(huì)上,英偉達(dá)CEO黃仁勛發(fā)布了RTX 40 系列顯卡,公布了全新 GPU 架構(gòu) Ada Lovelace等產(chǎn)品技術(shù)和服務(wù)。在會(huì)后的媒體采訪中,當(dāng)被問到充滿爭議的定價(jià)問題時(shí),黃仁勛把其歸結(jié)于摩爾定律的死亡。
“今天一個(gè)12寸晶圓的價(jià)格不是貴了一點(diǎn)而是貴了超級(jí)多。摩爾定律死了,它結(jié)束了,結(jié)束的很徹底。芯片價(jià)格會(huì)隨時(shí)間降低的故事已經(jīng)是過去時(shí)了。計(jì)算已經(jīng)不再是個(gè)芯片問題,是軟件和芯片共同的問題?!秉S仁勛說。
這其實(shí)已經(jīng)不是黃仁勛第一次嘗試為摩爾定律送終。黃仁勛認(rèn)為替代摩爾定律的方案是“加速計(jì)算”。也就是依靠AI,服務(wù)AI,通過更好的AI技術(shù)和針對(duì)具體場(chǎng)景更定制化的設(shè)計(jì)來解決性能提升的問題。
“在摩爾定律失效的當(dāng)下,如果我們真想提高計(jì)算機(jī)性能,‘黃氏定律’就是一項(xiàng)重要指標(biāo),且在可預(yù)見的未來都將一直適用?!痹诮张e辦的GTC中國峰會(huì)上,英偉達(dá)首席科學(xué)家Bill Dally做出上述發(fā)言。
所謂黃氏定律,是以英偉達(dá)首席執(zhí)行官黃仁勛(Jensen Huang)名字命名的定律,其預(yù)測(cè)GPU將推動(dòng)AI性能實(shí)現(xiàn)逐年翻倍。目前來看,雖然或多或少受到硬件與軟件影響,但黃氏定律將穩(wěn)定發(fā)展,小至個(gè)人數(shù)碼產(chǎn)品中的臉部或語音識(shí)別,大至自動(dòng)駕駛汽車、數(shù)據(jù)中心等,都受益于黃氏定律。
在半導(dǎo)體的開發(fā)競爭中,業(yè)界普遍認(rèn)為,以每兩年2倍的速度發(fā)展的摩爾定律即將走到極限。在芯片主戰(zhàn)場(chǎng)轉(zhuǎn)向于AI領(lǐng)域的背景下,由英偉達(dá)提出的黃氏定律得到重視,顯示英偉達(dá)在AI計(jì)算領(lǐng)域的領(lǐng)先地位。
當(dāng)前AI計(jì)算無處不在,進(jìn)一步向個(gè)人設(shè)備、邊緣領(lǐng)域拓展。以智能手機(jī)為例,內(nèi)置芯片搭載的神經(jīng)網(wǎng)絡(luò)引擎就為各項(xiàng)機(jī)器學(xué)習(xí)任務(wù)奠定了基礎(chǔ),如面部識(shí)別、自然語言理解、物體追蹤與規(guī)避、手勢(shì)和文本識(shí)別等。
“在整個(gè)GPU芯片設(shè)計(jì)歷史過程中,隨著工藝的發(fā)展,我們自然而然會(huì)放進(jìn)去更多的計(jì)算單元?!庇ミ_(dá)中國區(qū)工程和解決方案高級(jí)總監(jiān)賴俊杰告訴界面新聞?dòng)浾摺M瑫r(shí),英偉達(dá)依靠架構(gòu)上的創(chuàng)新,從而使GPU發(fā)展速度和性能提升呈現(xiàn)幾倍、甚至幾十倍的結(jié)果。在GPU市場(chǎng),英偉達(dá)GPU芯片的應(yīng)用早已擴(kuò)展到了游戲、圖形計(jì)算之外,在數(shù)據(jù)中心的加速計(jì)算、AI取得主要市場(chǎng)份額。
不過,雖然基本上是以AI為核心,但系統(tǒng)運(yùn)作時(shí)仍然少不了CPU參與。而Bill Dally坦承,當(dāng)工程師大幅提升某部分的運(yùn)算時(shí),其他無法再加快的部分就會(huì)成為瓶頸。
Bill Dally于2009年加入英偉達(dá),此前擔(dān)任斯坦福大學(xué)計(jì)算機(jī)科學(xué)系主任,致力于數(shù)據(jù)科學(xué)、人工智能和圖形學(xué)的研究,擁有120多項(xiàng)專利。在英偉達(dá),Bill Dally負(fù)責(zé)領(lǐng)導(dǎo)一支200多人的科學(xué)研究團(tuán)隊(duì)。
Bill Dally稱,英偉達(dá)的目標(biāo)是通過GPU技術(shù)的改進(jìn),每年將使AI推理性能成倍提升。在GTC大會(huì)上,英偉達(dá)推出一款超高能效加速系統(tǒng)MAGNet,可以讓AI推理能力達(dá)到每秒100萬億次的效率,比目前的商用芯片高出一個(gè)數(shù)量級(jí)。
自從英特爾創(chuàng)始人戈登·摩爾提出摩爾定律以來,全球的計(jì)算機(jī)和半導(dǎo)體行業(yè)都在遵循這個(gè)發(fā)展規(guī)律,該定律的具體內(nèi)容是,每過大約18個(gè)月,集成電路上的晶體管數(shù)量就會(huì)增加一倍。簡而言之,芯片的性能在兩年的時(shí)間內(nèi)就會(huì)翻倍增長,更新?lián)Q代的速度非???。
摩爾定律為芯片制程的提升帶來了基本準(zhǔn)則,這么多年來所有代工廠幾乎都無法脫離它的核心思想,包括全球第一的臺(tái)積電,也是在摩爾定律的推動(dòng)下,才慢慢達(dá)到如今的高度。但隨著芯片先進(jìn)程度的不斷提高,到了5nm時(shí)代,摩爾定律似乎要失效了。
目前能夠量產(chǎn)5nm芯片的代工廠只有兩家,除了臺(tái)積電之外就是三星,二者的工藝技術(shù)不存在太大的差距。但更為先進(jìn)的3nm芯片,對(duì)于它們而言卻是一個(gè)不容忽視的難題,因?yàn)?nm制程還沒有完全成熟,要想實(shí)現(xiàn)3nm的量產(chǎn)可能需要很長的時(shí)間。
而一旦這個(gè)時(shí)間不符合摩爾定律的預(yù)期,就說明該定律即將失效,3nm尚且如此,更何況后面的2nm和1nm芯片呢?所以說,在芯片工藝持續(xù)進(jìn)步之后,摩爾定律也許會(huì)迎來極限,到時(shí)候各大代工廠的技術(shù)提升就會(huì)變得非常緩慢。
不過,就在5月17日這一天,國內(nèi)外媒體傳來消息,臺(tái)積電聯(lián)合臺(tái)大和麻省理工在1nm芯片領(lǐng)域,取得了關(guān)鍵性的進(jìn)展,或?qū)⑻魬?zhàn)摩爾定律的極限。突破1nm芯片?很多人都對(duì)臺(tái)積電產(chǎn)生了質(zhì)疑,它到底是怎么做到的?
據(jù)了解,麻省理工學(xué)院率先發(fā)現(xiàn)通過半金屬鉍制成的二維電極,可以讓集成電路內(nèi)部的電流變得更大,并且進(jìn)一步減小電阻,實(shí)現(xiàn)趨于極限的能效。這個(gè)發(fā)現(xiàn)為1nm制程的芯片打下了基礎(chǔ),而臺(tái)積電則對(duì)“易沉積制程”進(jìn)行了優(yōu)化,成功進(jìn)入了納米階段。
也就是說,在臺(tái)積電、臺(tái)大和麻省理工的共同努力下,1nm芯片不再像之前那樣遙不可及,其中的某些技術(shù)已被攻克,量產(chǎn)也不是不可能。只是就當(dāng)下的情況來看,臺(tái)積電對(duì)此還停留在理論階段,要想真正落于現(xiàn)實(shí),還需要很長的時(shí)間。
作為芯片制造領(lǐng)域的絕對(duì)霸主,臺(tái)積電一直被外界普遍看好,7nm和5nm芯片都是由它第一個(gè)完成量產(chǎn)的。而現(xiàn)在1nm芯片也收獲了不錯(cuò)的成果,進(jìn)一步證明了臺(tái)積電的技術(shù)實(shí)力,其在芯片代工市場(chǎng)的地位也將變得更穩(wěn)固。
正是由于半導(dǎo)體產(chǎn)業(yè)的不同位置的企業(yè)、團(tuán)隊(duì)的共同推進(jìn)和成果共享,突破極限的芯片被成功應(yīng)用,摩爾定律也因此可以繼續(xù)向前推進(jìn)。
雖然在推動(dòng)半導(dǎo)體產(chǎn)業(yè)遵循摩爾定律的過程中,很多企業(yè)的投入成為“炮灰”,但從人類挑戰(zhàn)微觀世界極限的角度來看,它們非常值得尊重。
二十多年前,極紫外光刻等技術(shù)路線尚在探索中。據(jù)記載,1997年業(yè)內(nèi)就預(yù)測(cè)2006年芯片特征尺寸將縮小到100納米,而100納米是一種挑戰(zhàn),因?yàn)橹圃煨∮?00納米線寬的集成電路時(shí),光源波長將大于其特征尺寸,常規(guī)的光學(xué)光刻工藝失靈,為此必須尋找一種完全嶄新的光刻工藝。世界各大半導(dǎo)體公司、大學(xué)和研究所那時(shí)都努力探索研究這種新工藝,如英特爾公司領(lǐng)導(dǎo)的聯(lián)合體采用光源為氙氣的特別紫外線光刻,其波長小于10納米;IBM公司采用X射線光刻,其波長為5納米;美國得克薩斯大學(xué)和美國半導(dǎo)體制造技術(shù)戰(zhàn)略聯(lián)盟聯(lián)合采用紫外線光刻刻出80納米圖形,同時(shí)采用特殊的刻蝕石英掩膜,朗訊公司采用電子束光刻……這些方法復(fù)雜、昂貴,需要大批量生產(chǎn)考驗(yàn)。
當(dāng)然,最終經(jīng)受住考驗(yàn)的那個(gè)結(jié)果我們這個(gè)年代的人已經(jīng)知曉,但在當(dāng)時(shí)為了實(shí)現(xiàn)突破極限、按照摩爾定律推進(jìn)的“小目標(biāo)”,整個(gè)產(chǎn)業(yè)都勇立在原始創(chuàng)新的潮頭。
不同環(huán)節(jié)共同推進(jìn)技術(shù)發(fā)展
在硅晶上“微雕”一個(gè)縮微城市,讓每個(gè)電子都帶著正確的指令飛奔,當(dāng)然不會(huì)是光刻機(jī)“獨(dú)挑大梁”。