谷歌TPU秘密武器:六小時完成芯片設(shè)計,人工智能給予厚望
一直以來,芯片設(shè)計的難度絲毫不亞于芯片制造工藝。直到八十年代EDA技術(shù)誕生以后,芯片自動化設(shè)計的出現(xiàn)幫助芯片設(shè)計以及超大規(guī)模集成電路的難度大大降低,工程師只需要將芯片的功能用編程語言進(jìn)行描述并輸入計算機,再由EDA工具軟件將語言編譯成邏輯電路,然后再進(jìn)行調(diào)試即可。但現(xiàn)在的芯片越來越高端,動輒上百億個晶體管布局,即使依靠EDA工具進(jìn)行芯片設(shè)計,如此浩瀚的工程往往也需要幾個月的時間來完成。在設(shè)計計算機芯片時,一個更費力但也非常重要的任務(wù)是在所謂的芯片平面圖中放置零部件。所有物理部件的放置會產(chǎn)生巨大的影響,影響功耗、性能和芯片面積,需要人類設(shè)計師花費數(shù)月時間來完成。
近日,來自美國加州谷歌研究院的科學(xué)家,通過一種深度強化學(xué)習(xí)方法完成了芯片的布局設(shè)計。原本人類專家需要花費數(shù)周時間完成的過程,現(xiàn)在平均6小時內(nèi)就能完成,速度超過28倍。
一般情況下,微芯片的面積約為幾十到數(shù)百毫米平方,在一塊指甲蓋大小的硅片上排列并互連了數(shù)十億個晶體管。每個芯片上包含數(shù)了千萬個邏輯門(稱為標(biāo)準(zhǔn)單元),以及數(shù)千個存儲塊(稱為宏塊或宏)。到目前為止,尤其是在布局規(guī)劃方面還沒有任何自動化嘗試,它常常是由專業(yè)的人類工程師在數(shù)周或數(shù)月內(nèi)努力工作而出。在芯片的設(shè)計過程中,全局布線是最復(fù)雜和耗時的階段之一,也是決定芯片整體性能的關(guān)鍵。針對這一板塊的缺失,谷歌的研究團隊研究開發(fā)出一種機器學(xué)習(xí)工具,用來加速布局規(guī)劃的流程。
芯片布局無論是手動還是自動化,都需要計算、電子工程和設(shè)備物理方面的專業(yè)知識。這些技能需要時間來學(xué)習(xí),在一個生產(chǎn)微芯片以外許多其他產(chǎn)品的行業(yè)中,同樣非常需要這些技能??茖W(xué)家們將芯片的布局規(guī)劃部分設(shè)計為一個強化學(xué)習(xí)問題,開發(fā)出可完成的芯片設(shè)計神經(jīng)網(wǎng)絡(luò)。
將芯片的布局規(guī)劃看作一個深度強化學(xué)習(xí)問題,谷歌大腦團隊希望用 AI 來提升芯片設(shè)計效率。基于 AI 的最新設(shè)計方案可以在數(shù)小時內(nèi)完成人類設(shè)計師耗費數(shù)月才能完成的芯片布局,這將有可能引領(lǐng)一場新的芯片效率革命。2020 年 4 月,包括 Google AI 負(fù)責(zé)人 Jeff Dean 在內(nèi)的谷歌大腦研究者描述了一種基于 AI 的芯片設(shè)計方法,該方法可以從過往經(jīng)驗中學(xué)習(xí)并隨時間推移不斷改進(jìn),從而能夠更好地生成不可見(unseen)組件的架構(gòu)。
近日,谷歌大腦團隊聯(lián)合斯坦福大學(xué)的研究者對這一基于 AI 的芯片設(shè)計方法進(jìn)行了改進(jìn),并將其應(yīng)用于不久前 Google I/O 2021 大會上正式發(fā)布的、下一代張量處理單元(TPU v4)加速器的產(chǎn)品中。谷歌此前表示,TPUv4 可以在目標(biāo)檢測、圖像分類、自然語言處理、機器翻譯和推薦基準(zhǔn)等工作負(fù)載上優(yōu)于上一代 TPU 產(chǎn)品。
相關(guān)論文研究已經(jīng)在 Nature 上發(fā)表,Jeff Dean 為核心作者之一。據(jù)介紹,在不到六小時的時間內(nèi),谷歌 AI 芯片設(shè)計方法自動生成的芯片布局在功耗、性能和芯片面積等所有關(guān)鍵指標(biāo)上都優(yōu)于或媲美人類,而工程師需要耗費數(shù)月的艱苦努力才能達(dá)到類似效果。
這項基于強化學(xué)習(xí)的快速芯片設(shè)計方法對于資金緊張的初創(chuàng)企業(yè)大有裨益,如果谷歌公開相關(guān)技術(shù)的話,這些初創(chuàng)企業(yè)可以開發(fā)自己的 AI 和其他專用芯片。并且,這種方法有助于縮短芯片設(shè)計周期,從而使得硬件可以更好地適應(yīng)快速發(fā)展的技術(shù)研究。
谷歌工程師在論文中指出,這項工作對芯片行業(yè)有“重大影響”。這可以讓公司在設(shè)計芯片時探索架構(gòu)可能性的速度更快,為特定工作負(fù)載定制芯片也更便捷。
谷歌工程師利用芯片版面規(guī)劃數(shù)據(jù)集來訓(xùn)練一種強化的機器學(xué)習(xí)算法,其中有1萬個不同質(zhì)量的芯片版面規(guī)劃圖,一些規(guī)劃是隨機生成的。每個規(guī)劃圖所需電線長度和功耗有所不同。然后,訓(xùn)練后的算法利用這些數(shù)據(jù)來區(qū)分版面規(guī)劃的好壞,并相應(yīng)生成新的設(shè)計。
當(dāng)人工智能在棋類游戲中挑戰(zhàn)人類時,機器并不一定像人類那樣思考,而且經(jīng)常會對熟悉問題提出意想不到的解決方案。DeepMind的AlphaGo與圍棋冠軍李世石對弈時就是如此,人工智能看似不合邏輯的一步棋卻最終取得了勝利。
但這遠(yuǎn)不是人工智能輔助芯片設(shè)計的唯一應(yīng)用。谷歌還在“架構(gòu)探索”等芯片設(shè)計過程的其他部分使用人工智能,而英偉達(dá)等競爭對手也在研究其他方法來加快芯片研發(fā)工作流程。用人工智能設(shè)計人工智能芯片的良性循環(huán)似乎才剛剛開始。