寒武紀發(fā)布新款AI訓練卡MLU370-X8

時間：2022-05-24 11:02:13

關鍵字：寒武紀 AI 互聯(lián)網

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]近日，寒武紀發(fā)布新款訓練加速卡MLU370-X8。MLU370-X8搭載雙芯片四芯粒思元370，集成寒武紀MLU-Link?多芯互聯(lián)技術，主要面向訓練任務，在業(yè)界應用廣泛的YOLOv3、Transformer等訓練任務中， 8卡計算系統(tǒng)的并行性能平均達到350W RTX GPU的155%。

近日，寒武紀發(fā)布新款訓練加速卡MLU370-X8。MLU370-X8搭載雙芯片四芯粒思元370，集成寒武紀MLU-Link?多芯互聯(lián)技術，主要面向訓練任務，在業(yè)界應用廣泛的YOLOv3、Transformer等訓練任務中， 8卡計算系統(tǒng)的并行性能平均達到350W RTX GPU的155%。

▲ 寒武紀訓練加速卡MLU370-X8

雙芯思元370架構

MLU370-X8智能加速卡提供250W最大訓練功耗，可充分發(fā)揮AI訓練加速中常見的FP32、FP16或BF16計算性能。寒武紀首次將雙芯片四芯粒思元370整合在MLU370-X8智能加速卡中，提供了兩倍于標準思元370加速卡的內存、編解碼資源，同時搭載MLU-Link?多芯互聯(lián)技術。在YOLOv3、Transformer、BERT和ResNet101訓練任務中， 8卡并行平均性能達350W RTX GPU的155%。

圖片▲ MLU370-X8中整合了雙芯片四芯粒思元370

MLU-Link?多芯互聯(lián)技術

MLU370-X8智能加速卡支持MLU-Link?多芯互聯(lián)技術，提供卡內及卡間互聯(lián)功能。寒武紀為多卡系統(tǒng)專門設計了MLU-Link橋接卡，可實現4張加速卡為一組的8顆思元370芯片全互聯(lián)，每張加速卡可獲得200GB/s的通訊吞吐性能，帶寬為PCIe 4.0 的3.1倍，可高效執(zhí)行多芯多卡訓練和分布式推理任務。

▲MLU370-X8 MLU-Link 4卡橋接

▲MLU370-X8 MLU-Link? 4卡橋接拓撲

訓推一體的Cambricon NeuWare交付優(yōu)秀訓練性能

Cambricon NeuWare支持FP32、FP16混合精度、BF16混合精度和自適應精度訓練等多種訓練方式并提供靈活高效的訓練工具，高性能算子庫已完整覆蓋視覺、語音、自然語言處理、搜索推薦和自動駕駛等典型人工智能應用，可滿足用戶對于算子覆蓋率以及模型精度的需求。

▲Cambricon NeuWare為思元370系列芯片提供訓推一體加速

在Cambricon NeuWare SDK上實測，在常見的4個人工智能模型上，MLU370-X8單卡性能與主流350W RTX GPU相當;而在多卡加速方面，MLU370-X8借助MLU-Link多芯互聯(lián)技術和Cambricon NeuWare CNCL通訊庫的優(yōu)化，在8卡環(huán)境下達到更優(yōu)的并行加速比。

▲MLU370-X8 單機8卡部署配置

▲單卡MLU370-X8性能對比

▲8卡MLU370-X8性能對比

*測試環(huán)境

250W MLU370-X8：NF5468M5/Intel Xeon Gold 5218 CPU @ 2.30GHz/MLU370 SDK 1.2.0

350W GPU：Supermicro AS-4124GS-TNR/Intel Xeon Gold 6130 CPU @ 2.10GHz/Cuda11.2

▲MLU370-X8規(guī)格表

MLU370-X8補全思元370系列產品線

寒武紀長期秉承“云邊端一體、訓推一體、軟硬件協(xié)同”的技術理念。MLU370-X8提供兩倍思元370的內存帶寬，結合MLUarch03架構和MLU-Link多芯互聯(lián)技術，將思元370芯片在訓練任務的優(yōu)勢充分發(fā)揮。MLU370-X8定位中高端，與高端訓練產品思元290、玄思1000相互結合，進一步豐富了寒武紀的訓練算力交付方式;并與基于思元370芯粒(chiplet)技術構建的MLU370-X4、MLU370-S4智能加速卡協(xié)同，形成完整的云端訓練、推理產品組合。

MLU370-X8加速卡與國內主流服務器合作伙伴的適配工作已經完成，并已對客戶實現小規(guī)模出貨。

浪潮信息人工智能和高性能產品線副總經理張強表示：“浪潮跟寒武紀目前在思元370系列產品上合作順利，攜手在互聯(lián)網、金融、制造等領域逐步落地;MLU370-X8的性能優(yōu)異，我們期待雙方可以繼續(xù)加強合作，為更多的行業(yè)和客戶帶來優(yōu)秀的人工智能計算力。”

寒武紀用產品向客戶印證自己的初心與決心：為人工智能技術的大爆發(fā)提供卓越的AI芯片產品，讓機器更好地理解和服務人類。

本站聲明：本文章由作者或相關機構授權發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者，如若文章內容侵犯您的權益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或將催生出更大的獨角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關鍵字： AWS AN BSP 數字化

[美通社全球TMT]

人工智能驅動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字：汽車人工智能智能驅動 BSP

[美通社全球TMT]

從容應對未知風險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務中斷的風險，如企業(yè)系統(tǒng)復雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性，提升韌性，成...

關鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復蘇！騰訊、網易等巨頭縮減在日本投資

8月30日消息，據媒體報道，騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術

8月28日消息，今天上午，2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行，華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字：華為 12nm EDA 半導體

[通信先鋒]

華為張平安：數字世界話語權最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數據產業(yè)博覽會上，華為常務董事、華為云CEO張平安發(fā)表演講稱，數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務公布2024年中期業(yè)績

要點：有效應對環(huán)境變化，經營業(yè)績穩(wěn)中有升落實提質增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務引領增長以科技創(chuàng)新為引領，提升企業(yè)核心競爭力堅持高質量發(fā)展策略，塑強核心競爭優(yōu)勢...

關鍵字：通信 BSP 電信運營商數字經濟

[美通社全球TMT]

NVI技術創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。活動現場 NVI技術創(chuàng)新聯(lián)...

關鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]