AI芯片公司的數(shù)據(jù)中心、端點或AIoT設(shè)備
目前世界各地涌現(xiàn)出許多初創(chuàng)公司,它們對如何更好的地實現(xiàn)AI提出了新的想法。小編下面給大家說說目前的幾家大的AI芯片公司的終端應(yīng)用。
數(shù)據(jù)中心的人工智能
根據(jù)位置不同,數(shù)據(jù)中心可以算作“邊緣”。邊緣計算的關(guān)鍵概念是在(或接近)生成或收集數(shù)據(jù)的相同地理位置處理數(shù)據(jù)。這包括網(wǎng)關(guān)或集線器設(shè)備,也包括加速公司單一人工智能應(yīng)用程序的內(nèi)部服務(wù)器。想想醫(yī)院或醫(yī)學(xué)研究機構(gòu)中加速x射線或CT掃描圖像分類的服務(wù)器,以及從工廠接收狀態(tài)數(shù)據(jù)并在現(xiàn)場處理的網(wǎng)關(guān)。
Graphcore
總部位于英國布里斯托爾的Graphcore公司在早期的一輪融資中獲得了超過10億美元的估值,成為首家被認定為獨角獸的西方半導(dǎo)體初創(chuàng)公司。
Graphcore的IPU(智能處理單元)芯片擁有超過1200個專業(yè)核心的大規(guī)模并行架構(gòu),每個核心可以運行6個程序線程。還有大量的片上內(nèi)存,幾百MB的RAM,更重要的是,還有45 tb的內(nèi)存帶寬。這使得整個機器學(xué)習(xí)模型可以存儲在芯片上。
Graphcore的IPU芯片可以在戴爾服務(wù)器上用于邊緣計算應(yīng)用程序。
Groq
Groq是由谷歌的一個團隊在硅谷創(chuàng)立,擁有70名員工,迄今已籌集了6700萬美元的資金。在SC ' 19,他們正式推出了他們的超大芯片,可以達到1000 TOPS。
Groq的軟件優(yōu)先的方法意味著他們的編譯器處理許多通常在硬件中會發(fā)生的控制功能,比如執(zhí)行計劃。軟件會編排所有的數(shù)據(jù)流和時間,以確保計算不會出現(xiàn)停頓,并使延遲、性能和功耗在編譯時完全可預(yù)測。
Groq正以其張量流處理器(TSP)芯片為目標,瞄準數(shù)據(jù)中心應(yīng)用和自動駕駛車輛。
Cerebras
Cerebras是以恢復(fù)圓片規(guī)模芯片的倡導(dǎo)而著稱,而這個想法早在80年代就已經(jīng)被放棄。
我們常見的處理器都是經(jīng)過封裝之后才可使用的,實際上如CPU中的核心裸片大小一般在200平方毫米以下,而GPU核心的大小也沒有超過1000平方毫米的,所以在一片晶圓上可以切割出很多核心裸片。不過這并不代表無法制造超大尺寸的芯片,在Hot Chip 31會議中,Cerebras Systems就推出了一款晶圓級深度學(xué)習(xí)芯片,尺寸達到了215×215平方毫米。幾乎占據(jù)了一整個晶圓的大小。
Cerebras龐大的46,225mm2的芯片,占用整個晶圓,其功耗15千瓦,在84個處理器塊上封裝40萬個核和18GB內(nèi)存。雖然這些數(shù)字看起來非常龐大,但請記住,這么大的芯片被設(shè)計出來,目的是代替成千上萬個GPU的。
而這么大的芯片主要就是用來進行深度學(xué)習(xí)訓(xùn)練的,而深度學(xué)習(xí)的訓(xùn)練是應(yīng)用小變化的過程,模型的大小等因素讓神經(jīng)網(wǎng)絡(luò)訓(xùn)練變得非常困難。對于粗粒度計算,需要告訴互聯(lián)才能進行訓(xùn)練,規(guī)模依舊有限且成本高昂。所以Celebras Systems設(shè)計了專門為神經(jīng)網(wǎng)絡(luò)原語優(yōu)化的核心,這種核心可編程、可以快速進行西數(shù)計算,而且具有高速互聯(lián)能力。Celebras Systems設(shè)計了非常靈活的內(nèi)核,而且可以高效的處理張量運算。
該公司表示,它已經(jīng)解決了之前困擾晶圓片規(guī)模設(shè)計的問題,如成品率(它繞過缺陷),并發(fā)明了對抗熱效應(yīng)的封裝。
Cerebras已經(jīng)籌集了超過2億美元的資金,此前曾表示,他們的rack系統(tǒng)正在少數(shù)幾個客戶數(shù)據(jù)中心運行。
Cambricon寒武紀
Cambricon是中國最早的人工智能芯片公司之一,但絕不是最后一家。Cambricon是2016年由中國科學(xué)院的兩名研究員創(chuàng)立。
由于CPU和通用GPU (GPGPU)指令集在加速神經(jīng)網(wǎng)絡(luò)方面缺乏靈活性,他們開發(fā)了自己的指令集架構(gòu)(ISA),這是一種集成了標量、向量、矩陣、邏輯、數(shù)據(jù)傳輸和控制指令的負載存儲架構(gòu)。
Cambricon的第一款產(chǎn)品Cambricon-1A被用于數(shù)千萬部智能手機,以及無人機和可穿戴設(shè)備等其他終端設(shè)備。如今,第二代芯片包括云計算的兩部分和邊緣計算芯片——思源220。這種邊緣芯片的設(shè)計是為了填補該公司在邊緣計算產(chǎn)品組合中的空白。思遠220標志著寒武紀實現(xiàn)了云、邊、端的全方位立體覆蓋。MLU220是一款專門用于邊緣計算應(yīng)用場景的AI加速產(chǎn)品(邊緣人工智能加速卡)。產(chǎn)品集成4核ARM CORTEX A55,LPDDR4x內(nèi)存及豐富的外圍接口。用戶既可以使用MLU220作為AI加速協(xié)處理器,也可以使用其實現(xiàn)SOC方案。
Cambricon(以及Horizon Robotics,見下文)目前是全球最有價值的芯片初創(chuàng)企業(yè)之一:該公司迄今已融資2億美元,使其市值達到25億美元左右。