今年八月底,余成東發(fā)布了麒麟系列的新一代旗艦處理器麒麟980,搭雙核NPU。有報道稱,麒麟980并未搭載此前謠傳的寒武紀最新一代1M IP,而是采用麒麟970搭載的1A優(yōu)化版本1H,加上雙核,圖像識別速度提升了220%。麒麟980芯片相關負責人表示原本他們是不打算做宣傳的,而是靠口碑營銷,因為“消費者只要用了就知道有多好”。
當然,華為海思確實也是這么做的,華為麒麟公眾號推送的文章在麒麟980 AI能力時更多的是從AI性能提升及應用的角度去介紹,并未對雙核NPU多做介紹。
大膽推測,麒麟900系列處理器集成寒武紀IP只是一個過渡方案,隨著昇騰系列IP以及達芬奇架構(Da Vinci)的正式發(fā)布,麒麟900系列處理器很快將集成自家的昇騰IP而非寒武紀的NPU,這或許也是華為為何一直不太愿意多說麒麟970和麒麟980里的寒武紀NPU。
在接受采訪的時候,徐直軍表示:“構建新的達芬奇架構來支持我們的人工智能芯片是基于我們對人工智能的理解自然產(chǎn)生。我們開創(chuàng)性的達芬奇架構支持從云端到邊緣端,不同物聯(lián)網(wǎng)終端場景的人工智能需求,從極致的低功耗需求到極致的大算力需求全覆蓋?,F(xiàn)在我們還沒有看到市場上有其它架構能夠做到這一點?!?/p>
華為首席網(wǎng)絡架構師黨文栓也表示:“我們設計這個芯片的時候從開始就考慮到要全場景輻射,這是我們不二選擇?!?/p>
在昇騰310芯片系列里,Ascend-Lite就是針對智能手機的IP,因此無論從成本還是昇騰處理器發(fā)展的角度來看,寒武紀NPU被麒麟900系列處理器棄用應該只是遲早的事情。但對于寒武紀這家中國大名鼎鼎的獨角獸來說,華為是其目前已知的最重要的終端客戶,如果遭到華為的棄用,結(jié)果將如何?
合作伙伴終變競爭對手
在10月10日的華為全聯(lián)接大會上徐直軍指出:“昇騰910是計算密度最大的單芯片,采用7nm工藝制程,最大功耗為350W,半精度為(FP 16)256 Tera FLOPS,比Nvidia V100的125 Tera FLOPS還要高出近1倍。若集齊1024個昇騰910,將會出現(xiàn)迄今為止全球最大的AI計算集群,性能也將達到256個P,不管多復雜的模型都能輕松訓練?!?/p>
昇騰910或許會是寒武紀更為感到不安的產(chǎn)品,為什么這么說?今年5月,寒武紀發(fā)布首款云端智能芯片 Cambricon MLU100 和板卡產(chǎn)品,實現(xiàn)了AI IP從終端到云端的布局。MLU100采用MLUv01架構,基于16nm工藝,平衡模式下等效理論峰值速度達每秒128萬億次定點運算,高性能模式下等效理論峰值速度達每秒166.4萬億次定點運算,典型板級功耗為80瓦,峰值功耗不超過110瓦。
可見,無論是在制造工藝還是性能上,寒武紀的產(chǎn)品都沒有優(yōu)勢,要知道在對算力渴望程度極高的AI領域,高算力低功耗的芯片更加受到追捧。更為嚴峻的是,寒武紀能提供的是AI板卡,華為也能提供,同時還有全棧解決方案。黨文栓在回答媒體AI投資回報的問題時就表示:“全棧解決方案更能進一步加速投資回報周期,全棧解決方案意味擁有的完整能力支撐企業(yè)級關鍵任務應用場景,而且全棧的開放性、互動性的可以更好服務企業(yè),未來也能提供更好的選擇?!?/p>
我們知道,AI的發(fā)展讓更多的公司意識到芯片與算法更加緊密結(jié)合的重要性,因此AI時代,芯片與其上層相關的工具、框架、應用都將會有更緊密的結(jié)合。從這個角度來看,像華為這樣的全棧解決方案提供商相比寒武紀具有明顯地優(yōu)勢。雖然微軟并未開始大規(guī)模采購華為的AI芯片或者AI服務器,但華為確實和微軟有接觸。當然,寒武紀和中科曙光也有著合作相當緊密,二者利用寒武紀架構打造出針對推理應用優(yōu)化的服務器。
至此不難發(fā)現(xiàn),麒麟900系列處理器棄用寒武紀NPU應該是遲早的事情,并且無論是偏向終端的昇騰310還是云端的昇騰910,華為和寒武紀都會成為競爭關系。當然,這并不意味著在AI市場只能容得下華為或寒武紀,AI是伴隨物聯(lián)網(wǎng)發(fā)展的一個技術,因此AI也將被應用到非常豐富的應用當中,有實力的AI企業(yè)相信最終都能找到合適的生存空間。
只不過,華為與寒武紀,恰好代表了AI市場里兩類典型的玩家,一個規(guī)模巨大具有生態(tài)優(yōu)勢的大玩家,另一個因AI浪潮而生有自己的技術優(yōu)勢新勢力,他們的發(fā)展都代表了一類AI企業(yè)。那么,最終結(jié)果會如何?