2025年4月29日,阿里巴巴云旗下的Qwen團(tuán)隊(duì)正式發(fā)布并開(kāi)源Qwen3,作為Qwen系列的最新一代大型語(yǔ)言模型(LLM),包含一系列密集型(Dense)和混合專(zhuān)家(MoE)模型,參數(shù)規(guī)模從0.6億至2350億不等。同日,海光信息技術(shù)股份有限公司(以下簡(jiǎn)稱(chēng)“海光信息”)在其“智能深算”戰(zhàn)略引領(lǐng)下,宣布其深算單元(DCU,Deep Computing Unit)已完成對(duì)Qwen3全部8款模型(235B、32B、30B、14B、8B、4B、1.7B、0.6B)的無(wú)縫適配與優(yōu)化,實(shí)現(xiàn)零錯(cuò)誤、零兼容性問(wèn)題、秒級(jí)部署。這一整合依托基于GPGPU架構(gòu)的生態(tài)優(yōu)勢(shì)和海光DTK軟件棧的領(lǐng)先特性,展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性,充分驗(yàn)證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢(shì),使其成為支撐AI大模型訓(xùn)練與推理的關(guān)鍵基礎(chǔ)設(shè)施。