www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 智能硬件 > 智能硬件
[導(dǎo)讀]新的革命需要新的武器??犷:万旪垈儾荒軡M足需求,人工智能計算需要新的芯片。當(dāng)我們談起處理器,我們過去談的是酷睿、GTX 和驍龍——現(xiàn)在是時候了解一些人工智能時代的芯片了。通過本文,我將用比較通俗易懂的語言為你介紹幾款主流的深度學(xué)習(xí)加速處理器。

新的技術(shù)革命需要新的武器。

如果你今天問身邊懂科技的朋友“未來是什么時代?”他八成會告訴你是人工智能的時代。

已經(jīng)開發(fā)了數(shù)十年,但在近幾年得到迅猛發(fā)展的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù),正在驅(qū)動一次人工智能革命。而革命的對象正是微信、Facebook 等主流科技產(chǎn)品背后的那些科技公司。

新的革命需要新的武器??犷:万旪垈儾荒軡M足需求,人工智能計算需要新的芯片。當(dāng)我們談起處理器,我們過去談的是酷睿、GTX 和驍龍——現(xiàn)在是時候了解一些人工智能時代的芯片了。通過本文,我將用比較通俗易懂的語言為你介紹幾款主流的深度學(xué)習(xí)加速處理器。

GPU,也就是我們常說的顯卡,得益于其硬件架構(gòu)對并行計算支持比較好,最一開始大家都用 GPU 來搞深度學(xué)習(xí)。一個很經(jīng)典的例子就是斯坦福教授吳恩達跑到 Google,帶隊用大量 GPU 做出了一個專門跑神經(jīng)網(wǎng)絡(luò)的大規(guī)模計算集群,也就是后來的 Google 大腦。

但在深度學(xué)習(xí)專家眼中,GPU 仍不是最優(yōu)的答案。它的性能很好,但耗電驚人。而且另一個搞笑的原因是,由于挖比特幣和以太坊需要,顯卡到處都缺貨,深度學(xué)習(xí)研究者經(jīng)常買不到或者買不起。神啊,賜他們一臺不挖礦,只跑深度學(xué)習(xí)的處理器可好?

即將前往麻省理工學(xué)院 (MIT) 擔(dān)任助理教授的深度學(xué)習(xí)專家韓松告訴PingWest 品玩,深度學(xué)習(xí)的計算模式和常規(guī)計算有很大不同,高度穩(wěn)定且不需要很高精確性。“1 乘以 1 可以不等于一”,這是其他計算不能允許的。

另一方面,深度學(xué)習(xí)專門硬件的特點是計算高效,缺點是很貴,需要有大量需求開發(fā)和使用才比較經(jīng)濟,韓松指出,現(xiàn)在深度學(xué)習(xí)應(yīng)用的已經(jīng)非常廣,給人工智能開發(fā)專門的計算硬件是值得的。

Facebook 人工智能研究院院長燕樂存 (Yann LeCun),20 多年前在貝爾實驗室就開發(fā)過一款名叫 ANNA 的人工智能專門芯片。那時他還在做光學(xué)字符識別 (OCR) 研究,而 ANNA 識別字符的速度達到了驚人的 1000 個/秒,比同時代其他處理器都快得多。 你也可以說,ANNA 是最早的“人工智能芯片”,或者更準(zhǔn)確來說,深度學(xué)習(xí)加速處理器之一。

現(xiàn)在?人工智能芯片多到一雙手已經(jīng)數(shù)不過來了。幾乎每一家過去的“軟件”或者“服務(wù)”公司,那些跟硬件一直沒太大關(guān)系的大型科技公司,比如 Google、亞馬遜、微軟,都已經(jīng)開始使用,或者正在研發(fā)自己的深度學(xué)習(xí)加速處理器。

Google 的人工智能驅(qū)動著每一次搜索的結(jié)果展現(xiàn),F(xiàn)acebook 用人工智能來優(yōu)化用戶的時間線,在用數(shù)千種語言發(fā)布的內(nèi)容之間互譯,騰訊也在西雅圖設(shè)立了實驗室進行人工智能基礎(chǔ)研究,嘗試將其用在微信等用戶過億的產(chǎn)品中。

而這種變化對芯片行業(yè)的巨頭們帶來了新的沖擊,他們有的發(fā)現(xiàn)自己已經(jīng)過時了,有的正在極速追趕 Google,通過收購的方式拓展自己的產(chǎn)品線,在人工智能芯片市場還未開始論資排輩之前,就先占上一把交椅。

Google:TPU

是什么: Tensor Processing Unit(張量處理單元),是 Google 開發(fā)的專門目的集成電路 (ASIC) 。

性能:TPU 已經(jīng)開發(fā)出了第二代,每顆帶寬 600GB/s,算力達到 45 TFLOPS (8位整數(shù))。

它的模組化能力出眾,Google 的用法是將 4 顆 TPU 放在一塊電路板上,組成一個 180 TFLOPS 的模組“Cloud TPU”,用它們來替換深度學(xué)習(xí)云機房里的 CPU 和 GPU,單機最多可以拼接 256 塊 Cloud TPU,算力達到驚人的 11.5 PFLOPS(下圖)。

用途:前面提到,Google 過去用顯卡組建大規(guī)模計算集群,能耗較高,訓(xùn)練速度較慢,該公司需要一個專門的計算架構(gòu),去更高效地訓(xùn)練和使用深度神經(jīng)網(wǎng)絡(luò)。所以 Google 開發(fā)了 TPU。

TPU 于面向大規(guī)模低精度的深度學(xué)習(xí)計算而設(shè)計和優(yōu)化,適合神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理(在具體用途和場景中運行神經(jīng)網(wǎng)絡(luò))?,F(xiàn)在,TPU 不僅 Google 員工的內(nèi)部工作系統(tǒng),還支持著搜索、照片、翻譯、街景等 Google 旗下產(chǎn)品。就連擊敗了李世乭、柯潔的圍棋人工智能程序 AlphaGo,也運行在 TPU 上。

微軟:HPU 和“腦波計劃”DPU

是什么:HPU 是微軟在混合現(xiàn)實頭顯 HoloLens 里自行設(shè)計,并由合作伙伴生產(chǎn)的“協(xié)處理器”。具體是用一塊 FPGA(現(xiàn)場可編程門陣列),一種非常靈活的半定制化電路實現(xiàn)的。

“腦波計劃”(Project Brainwave) 則是微軟前不久剛剛宣布的人工智能硬件加速計劃,包括一個大量芯片組成的分布式計算架構(gòu),和一套直接運行在芯片上的“操作系統(tǒng)”。腦波計劃的硬件核心是 DPU (DNN Processing Unit),也即深度神經(jīng)網(wǎng)絡(luò)處理單元——本質(zhì)上還是 FPGA。

性能:HoloLens 一代內(nèi)置的 HPU,能夠在 10W 功耗下提供 1TFLOPS 算力。微軟上個月剛剛宣布了新一代 HPU,具體細節(jié)未知,但可以預(yù)料到的是功耗會進一步降低,性能會繼續(xù)提高。

至于“腦波計劃”,它的信息十分有限,但看起來支持多種 FPGA,目前微軟展示的技術(shù)用的是英特爾的 14 納米制程 FPGA。這種芯片單顆計算力約 10 TFLOPS(單精度),功效為 80GFLOPS/W。

用途:HoloLens 一代已經(jīng)內(nèi)置了一塊英特爾的 CPU 和集成 GPU,為什么它還需要 HPU?其實,作為混合現(xiàn)實或者增強現(xiàn)實頭顯,HoloLens 需要確保佩戴者的舒適,降低運動和姿態(tài)變化和畫面變化的延時,所以它需要結(jié)合傳感器數(shù)據(jù)進行海量的計算。但 CPU 和 GPU 主要跑操作系統(tǒng)(Windows 10)和處理圖像,沒有多余的算力給傳感器。如果讓它們來做這部分的計算,不但延時高用戶會眩暈,也更費電,還搶走了操作系統(tǒng)的算力,提高了藍屏危險……

HPU 就是用來做這部分工作的。而在 HoloLens 二代里,微軟打算讓 HPU 承擔(dān)更復(fù)雜的任務(wù):本地運行深度神經(jīng)網(wǎng)絡(luò)。根據(jù)有限的信息,HPU 二代可以高功效運行類型非常豐富的深度神經(jīng)網(wǎng)絡(luò),為 HoloLens 加入更多人工智能功能(比如本地圖像識別、語音處理等)開了大門。

至于“腦波計劃”,從同樣有限的信息來看,它應(yīng)該是微軟為擴展自己的人工智能和云計算生態(tài),和 Google TPU 抗衡而推出的。它的用途和 TPU 應(yīng)該也不會有太大差異,無外乎對微軟自己的產(chǎn)品,以及其團隊的科研提供計算支持。微軟的云計算服務(wù)一直在使用 FPGA,所以向 “腦波計劃”遷移應(yīng)該比較輕松。它支持微軟自己的 CNTK 深度學(xué)習(xí)框架,同時也支持競爭對手 Google 的 TensorFlow 框架。

英偉達:Tesla 深度學(xué)習(xí)處理器

是什么:英偉達是顯卡界的王者,但你可能不知道,現(xiàn)在的顯卡功能比玩游戲多多了(別提挖礦!)GeForce 是玩游戲的,Titan 系列則步入了 GPGPU 的范疇(可以玩游戲也可以做神經(jīng)網(wǎng)絡(luò)訓(xùn)練)。而 Tesla GPU 則是英偉達專為人工智能開發(fā)的專業(yè)級服務(wù)器端顯卡。

Tesla GPU 系列最新產(chǎn)品是 V100,V 的命名來自英偉達最新也最頂級的 12 納米 Volta 微架構(gòu)。

性能:V100 所采用的 Volta 架構(gòu),是由 640 枚被英偉達命名為“張量核心” (Tensor Cores) 組成的。你不需要明白 Tensor Cores 到底是什么,只需要知道它很厲害就行。V100 的計算性能達到 15 TFLOPS(單精度)、120TFLOPS(深度學(xué)習(xí)),堪稱人工智能芯片中的核彈了。

Tensor Cores

用途:Google 最一開始宣稱 TPU 比 GPU 快 30 倍,業(yè)界對其贊嘆有加。但有個細節(jié)是,TPU 第一代只能推理,不能用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。所以當(dāng)時英偉達還可以說自己是唯一端到端(從訓(xùn)練到推理再到自動駕駛等實際場景)的人工智能計算方案提供者。而 V100 就是這個方案的硬件核心。

不過英偉達推出 V100 沒多久,Google 就開了 I/O 2017 大會,選不了訓(xùn)練和推理都能做的 TPU 二代。即便如此,V100 仍然是截至目前最適合神經(jīng)網(wǎng)絡(luò)科研的顯卡,用通用圖形處理器 (GPGPU/CUDA) 做深度學(xué)習(xí)這一派的絕對王者。

英特爾:FPGA、顯卡、至強融核和 VPU

是什么:前面提到了微軟在使用的現(xiàn)場可編程門陣列 FPGA,正是由英特爾(所收購的 FPGA 巨頭 Altera,現(xiàn)在成為了英特爾 FPGA 部門) 所開發(fā)的。簡單來說,因為 FPGA 對并行計算支持好,性能高,便于重新編程,功耗比 GPU、CPU 低,F(xiàn)PGA 也是人工智能芯片的一個重要門派(另一家FPGA 巨頭 Xilinx 的人工智能產(chǎn)品也很不錯,不過篇幅有限就不贅述了)。

英特爾還收購了 Nervana,組建了一個人工智能部門。這個部門的研究用的是顯卡。

“至強融核” (Xeon Phi) 是英特爾另一款在服務(wù)器端抗衡英偉達 GPU 的處理器產(chǎn)品。它的最新款產(chǎn)品并行計算好適合深度學(xué)習(xí),它的一個最主要優(yōu)勢是“實惠”,不跑深度學(xué)習(xí)也可以當(dāng) CPU 來用(因為它本來就是 CPU)。

VPU 則是英特爾收購的另一家愛爾蘭公司 Movidius 所開發(fā)的低功耗深度學(xué)習(xí)加速芯片,特色是超小尺寸和功耗超低。

用 VPU 制成的神經(jīng)計算棒

性能:英特爾 FPGA 產(chǎn)品線較復(fù)雜,性能多樣。顯卡方面的信息也不多

至于 Xeon Phi,計算力大約在 3.5 TFLOPS 左右?

VPU 采用該公司自研的 Myriad 架構(gòu),最大的特色是能夠在 1W 或更低功率內(nèi),實現(xiàn) 100 GFLOPS 甚至更高算力。

用途:如果英偉達一發(fā)核彈毀滅全球,那么英特爾就是通過多元化的產(chǎn)品線嘗試在深度學(xué)習(xí)市場上分一杯羹。FPGA、Xeon Phi 都是直接推向消費者的云端數(shù)據(jù)中心里的產(chǎn)品,而身材纖細的 VPU 用途更多樣,安裝到了大疆無人機、聯(lián)想手機等產(chǎn)品中,也被英特爾直接做成了即插即用的深度學(xué)習(xí)計算棒,適合機器人開發(fā)等等。

Intel, Processors

其他公司

Facebook:也在開發(fā)自己的深度學(xué)習(xí)芯片,據(jù)說在和高通合作。

百度:XPU,本質(zhì)是 FPGA,和Xilinx 合作

地平線:前百度深度學(xué)習(xí)研究院院長,也在開發(fā)人工智能定制芯片,應(yīng)該是 FPGA

蘋果:沒錯,蘋果也將在新款手機里加入“人工智能協(xié)處理器”,信息極為有限。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉