在上一篇文章( 為什么AI芯片需要突破馮諾依曼架構? )中,我總結了人工智能工作負載的計算架構需求與我們在過去幾十年所熟悉的計算架構(如x86和ARM等傳統(tǒng)計算架構)有何不同。在這篇文章中,我也會提出新的AI計算架構需要材料工程在哪些方面有所突破。我將給出一些我們遇到的突破類型的例子,并描述一個新存儲領域的具體例子。
從經典的2D縮放到架構創(chuàng)新
在跨越20多年的PC和移動時代,該行業(yè)是由“經典2D縮放”驅動的,即根據(jù)1965年摩爾定律預測的幾何晶體管縮放。隨著晶體管的特性變小,性能提高,功耗降低,這與登納德定律(Dennard Scaling)一致。更高的晶體管密度也能降低每個晶體管的成本,這樣芯片總成本就降低了。在這期間,我們并沒有看到很多架構上的創(chuàng)新,很多關注都集中在一個主流架構的幾何尺度上,這加速了x86和ARM CPU架構的崛起。
你可能已經意識到,傳統(tǒng)的2D縮放已經不像以前那么有效了。它已經變得非常復雜和昂貴,而且它所帶來的收益也在減少。因此,當我們過渡到人工智能和物聯(lián)網時代時,很多重點放在了架構的變化上,以推動性能和功耗的改進。體系結構的變化(通過從根本上改變數(shù)據(jù)的處理方式)可以極大地提高性能。正如我們已經看到的谷歌的新TPUs、NVIDIA的新GPU和Microsoft的Project Brainwave,與傳統(tǒng)CPU相比,性能上的提升是數(shù)量級以上的,例如30x、50x甚至更多。與傳統(tǒng)2D縮放相比,這顯然是一個更高層次的改進(即使是在2D縮放最好的時候)。架構的進步可以通過全新的設備來實現(xiàn),或使用3D技術來擴展現(xiàn)有的邏輯和內存架構,也可以使用先進的封裝技術以新的方式將不同的硅結合在一起來執(zhí)行特定的功能。
John Hennessy和David Patterson (被公認為現(xiàn)代計算機體系結構之父)于2017年12月出版的第六版書中進行了細致的總結:近40年來處理器性能數(shù)據(jù)證明三種流行的“定律”與CPU性能進展都在逐漸消失。根據(jù)參考文獻,登納德定律(Dennard Scaling)在2003年結束,阿姆達爾定律(Amdahl’s Law)在2011年左右達到極限,摩爾定律(Moore’s Law)進步在2015年左右結束。我們對他們分析的解釋是,從經典的2D縮放到性能提升的免費搭車已經結束了,我們現(xiàn)在必須努力將架構創(chuàng)新和材料工程突破結合起來,以實現(xiàn)AI所需的性能提升。
材料工程的突破
在傳統(tǒng)的2D縮放時代,材料工程只涉及到有限的材料,如硅、二氧化硅、氮化硅和碳,但是這些材料已經達到了縮放限制。事實上,我們正在有效地用完元素周期表上的材料,這些材料在單獨情況下可以很好地工作?,F(xiàn)在我們越來越需要創(chuàng)造獨特的變化,這給了我們10種不同類型的二氧化硅和8種氮化硅。在新的人工智能時代,材料工程越來越多地涉及創(chuàng)造新的材料組合,作為一個系統(tǒng)一起工作以實現(xiàn)特定的性能。我們稱之為集成材料系統(tǒng)。
正如我在本系列的第一篇文章中所討論的,我們認為AI工作負載需要三個主要的架構改進:更高的帶寬內存、更高的數(shù)據(jù)并行性和更低的精度。
為了實現(xiàn)這些改進,我們可以借鑒材料工程的突破。例如,我們可以在現(xiàn)有的邏輯設備中集成新的內存結構。新材料可以實現(xiàn)全新的存儲(如英特爾?3D XPoint?技術);還可以使用材料工程來幫助實現(xiàn)自校準密集特性(如GPU中存在的數(shù)十億個vias);也可以用來幫助晶體管的垂直方向以獲得更大的面積密度。材料工程通過先進的封裝在異構集成中也發(fā)揮作用:獨特的基底、聚合物和硅通孔技術(TSV)可以幫助實現(xiàn)各種獨立芯片的高密度封裝。
這是一個材料工程突破的例子,用來實現(xiàn)一種新型的存儲器。下面是STT-MRAM陣列的圖片。左邊顯示了一組內存單元,包括其中一個內存單元的特寫。右邊顯示了超過15種材料是如何堆積起來形成這些設備的。每個薄膜的厚度從0.2nm到2nm不等。相比之下,你可能會想起大約十年前的一項創(chuàng)新——高k金屬門(HKMG);HKMG涉及大約6種新材料,每一種大約1納米厚。
實例:STT-MRAM
這是一個材料工程突破的例子,用來實現(xiàn)一種新型的存儲器。下面是STT-MRAM陣列的圖片。左邊顯示了一組內存單元,包括其中一個內存單元的特寫;右邊顯示了超過15種材料是如何堆疊起來形成這些設備的。每個薄膜的厚度從0.2nm到2nm不等。相比之下,你可能會想起大約十年前的一項創(chuàng)新——高k金屬門(HKMG),HKMG涉及大約6種新材料,每一種大約1納米厚。
以STT-MRAM集成材料系統(tǒng)為例,所有的加工都必須在真空環(huán)境中進行——事實上,在-9到-10托的更強的真空環(huán)境中進行,而HKMG的真空環(huán)境約為-8托(1托等于1個大氣壓的1/760)。材料薄膜層之間的相互影響被稱為界面工程,就是它定義所得到器件的性能。生產該設備需要使用各種工藝技術,包括沉積、腐蝕和改性,所有這些都在一個集成的材料系統(tǒng)中和真空環(huán)境下小心處理。應用材料越來越多地提供綜合材料解決方案,將新的架構創(chuàng)新帶入行業(yè)。這就是為什么我們的客戶越來越多地在先進的節(jié)點和設備上與我們合作,以證明這些解決方案是否可行,并為大規(guī)模生產和商用做準備。
總結
總之,有兩條關鍵信息要傳遞給你。首先,人工智能工作負載(即機器學習、深度學習)需要處理數(shù)據(jù)的新方法——我們稱之為架構創(chuàng)新。其次,人工智能架構需要材料工程的突破。在應用材料領域,我們很興奮地預見到人工智能將為材料工程帶來巨大的增長機會。