媲美50萬臺PC!一組動圖看懂華為全球最快AI訓練集群Atlas 900
9月18日,華為發(fā)布了前全球最快的AI訓練集群Atlas 900,可將原本需要耗時數月的工作縮短到幾秒鐘。
Atlas 900集群采用目前算力最強的AI處理器華為昇騰910,數千顆互聯,每顆都有32個達芬奇自主架構AI核心,整個集群的FP16半精度浮點算力達到256-1024PFlops,也就是秒鐘25.6-102.4億億次計算!這足以相當于50萬臺PC的計算能力。
根據實測,它只需59.8秒鐘即可完成基于ImageNet數據集訓練ResNet-50模型,而競品最快也要超過70秒。
作為大型集群網絡,Atlas 900整合了三種高速互聯方式,包括單端口速率240Gbps的華為自研HCCS片間互聯、最新的PCIe 4.0、100G RoCE以太網,同時進行了系統(tǒng)級調優(yōu),HCCL通信庫+網絡拓撲+訓練算法實現線性度大于80%。
超高的算力對于系統(tǒng)功耗、散熱也是極大的考驗,Atlas 900采用了業(yè)界頂尖的散熱系統(tǒng),尤其是業(yè)界最強的柜級密閉絕熱技術,液冷占比超過95%,可大幅減少對外散熱,同時高效節(jié)能,單液冷柜支持50千瓦的超高散熱功耗。
華為Atlas 90可廣泛應用于科學研究、商業(yè)創(chuàng)新,比如在天文領域,正在幫助國際組織SKA探索更廣闊的宇宙空間,此外在自動駕駛、氣象預測、石油勘探等特定領域也能大展拳腳。