Qwen3發(fā)布并開源,海光DCU實現(xiàn)全模型無縫適配
2025年4月29日,阿里巴巴云旗下的Qwen團隊正式發(fā)布并開源Qwen3,作為Qwen系列的最新一代大型語言模型(LLM),包含一系列密集型(Dense)和混合專家(MoE)模型,參數(shù)規(guī)模從0.6億至2350億不等。同日,海光信息技術(shù)股份有限公司(以下簡稱“海光信息”)在其“智能深算”戰(zhàn)略引領(lǐng)下,宣布其深算單元(DCU,Deep Computing Unit)已完成對Qwen3全部8款模型(235B、32B、30B、14B、8B、4B、1.7B、0.6B)的無縫適配與優(yōu)化,實現(xiàn)零錯誤、零兼容性問題、秒級部署。這一整合依托基于GPGPU架構(gòu)的生態(tài)優(yōu)勢和海光DTK軟件棧的領(lǐng)先特性,展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性,充分驗證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢,使其成為支撐AI大模型訓(xùn)練與推理的關(guān)鍵基礎(chǔ)設(shè)施。
Qwen3:開源大型語言模型的新里程碑
Qwen3是阿里巴巴云Qwen系列的最新成果,旨在通過多樣化的模型架構(gòu)滿足廣泛的AI應(yīng)用需求。其模型包括密集型模型,參數(shù)規(guī)模涵蓋0.6億、1.7億、4億、8億、14億、32億,適用于從邊緣設(shè)備到數(shù)據(jù)中心的多種部署場景;以及混合專家(MoE)模型,包括Qwen3-30B(總參數(shù)300億,推理時激活部分參數(shù))和Qwen3-235B(總參數(shù)2350億,推理時激活部分參數(shù)),通過選擇性激活專家網(wǎng)絡(luò)降低計算成本,同時保持高性能。Qwen3以Apache 2.0許可開源,模型權(quán)重通過Hugging Face、GitHub及阿里云ModelScope等平臺公開,供全球開發(fā)者與研究人員免費使用。這種開源策略促進了技術(shù)創(chuàng)新與協(xié)作,使Qwen3可廣泛應(yīng)用于金融、醫(yī)療、教育、電信等行業(yè)。
Qwen3的密集型與MoE模型組合體現(xiàn)了其在性能與效率上的平衡。密集型模型適合需要全面參數(shù)參與的復(fù)雜任務(wù),如高級自然語言處理或多模態(tài)應(yīng)用;MoE模型通過稀疏計算降低資源需求,適合計算資源受限的場景。參數(shù)規(guī)模從0.6億到2350億的設(shè)計,使Qwen3能夠覆蓋從輕量級應(yīng)用到企業(yè)級數(shù)據(jù)中心的高性能需求。作為開源模型,Qwen3延續(xù)了Qwen系列推動AI民主化的使命,開發(fā)者可基于其開發(fā)定制化解決方案,特別是在中國信息技術(shù)應(yīng)用創(chuàng)新(信創(chuàng))政策支持的行業(yè)中,Qwen3有望成為關(guān)鍵的AI技術(shù)驅(qū)動力。
海光DCU:“智能深算”戰(zhàn)略的核心支柱
海光信息的“智能深算”戰(zhàn)略以DCU為核心,聚焦高性能計算(HPC)與人工智能算力的自主研發(fā),旨在滿足中國對安全高效、自主可控算力的需求。該戰(zhàn)略順應(yīng)信創(chuàng)政策與AI市場快速增長的趨勢,推動國產(chǎn)芯片在通用計算與智能計算領(lǐng)域的應(yīng)用。DCU定位于AI、大數(shù)據(jù)處理及商業(yè)計算場景的協(xié)處理器,類似英偉達GPU,但更注重成本效益與本土化適配。海光信息自2016年通過與AMD的技術(shù)授權(quán)合作,獲得x86架構(gòu)許可,開發(fā)了通用處理器(CPU)與DCU。2019年被列入美國“實體清單”后,AMD停止技術(shù)支持,海光加速自主研發(fā),DCU成為其核心競爭力。目前,DCU已廣泛應(yīng)用于金融、電信、互聯(lián)網(wǎng)、教育、醫(yī)療、政務(wù)等領(lǐng)域,成為國產(chǎn)AI算力的重要支撐。
DCU在Qwen3適配中展現(xiàn)了卓越的技術(shù)能力。其采用通用圖形處理單元(GPGPU)架構(gòu),支持高并行計算,適合AI模型訓(xùn)練與推理,類CUDA并行計算框架兼容主流AI軟件生態(tài),確保與Qwen3等模型的無縫整合。海光的深算工具包(DTK)是一套完整的軟件開發(fā)套件,包括開發(fā)工具、庫和優(yōu)化框架,支持模型遷移、性能優(yōu)化與快速部署,助力DCU實現(xiàn)Qwen3全系列模型的秒級部署,無任何錯誤或兼容性問題。DCU支持從0.6億到2350億參數(shù)的Qwen3模型,展現(xiàn)了其適應(yīng)多樣化計算需求的靈活性,覆蓋邊緣計算到數(shù)據(jù)中心的高性能場景。其兼容全球AI框架及國產(chǎn)大模型,降低開發(fā)者遷移成本,同時內(nèi)置安全硬件,支持國密算法(如SM2、SM3)與可信計算,滿足中國對信息安全與技術(shù)自主的高要求。
DCU通過支持Qwen3的訓(xùn)練與推理,確立了其作為AI大模型關(guān)鍵基礎(chǔ)設(shè)施的地位。相較于進口GPU,DCU提供自主可控的算力解決方案,滿足金融、政務(wù)等行業(yè)對安全與效率的需求。其在信創(chuàng)市場中的應(yīng)用進一步鞏固了其作為國產(chǎn)算力核心的地位。
Qwen3與DCU的協(xié)同效應(yīng)
海光信息在Qwen3發(fā)布當(dāng)天宣布完成全部8款模型的適配與優(yōu)化,實現(xiàn)了零錯誤、零兼容性問題、秒級部署,這一技術(shù)突破彰顯了DCU在高性能計算與AI應(yīng)用中的強大能力。DCU的GPGPU架構(gòu)為Qwen3的密集型與MoE模型提供了高效的并行計算支持,能夠處理從0.6億到2350億參數(shù)的多樣化計算需求,確保推理任務(wù)的穩(wěn)定性和高吞吐量。海光的DTK軟件棧在這一過程中發(fā)揮了關(guān)鍵作用,其包含的開發(fā)工具和優(yōu)化框架支持快速模型遷移與性能調(diào)優(yōu),使Qwen3能夠在DCU上以秒級速度完成部署,且運行過程中無任何兼容性問題。這種高效適配能力源于DCU類CUDA生態(tài)的兼容性設(shè)計,使其能夠無縫支持主流AI框架,同時適配國產(chǎn)大模型的獨特需求。DCU對Qwen3全系列模型的支持,體現(xiàn)了其在處理輕量級邊緣計算任務(wù)到高強度數(shù)據(jù)中心推理任務(wù)時的通用性,進一步驗證了其作為國產(chǎn)AI算力基礎(chǔ)設(shè)施的技術(shù)成熟度。
Qwen3與DCU的成功整合對中國AI生態(tài)具有深遠(yuǎn)的戰(zhàn)略意義。首先,這一整合推動了信創(chuàng)政策目標(biāo)的實現(xiàn),Qwen3作為開源的國產(chǎn)大模型,與DCU這一自主研發(fā)的協(xié)處理器結(jié)合,顯著降低了國內(nèi)AI產(chǎn)業(yè)對國外技術(shù)的依賴,增強了技術(shù)自主性和信息安全性,特別是在金融、政務(wù)等敏感領(lǐng)域。其次,Qwen3的開源特性與DCU的生態(tài)兼容性共同促進了國產(chǎn)AI生態(tài)的建設(shè),Qwen3通過Hugging Face等全球平臺吸引開發(fā)者,而DCU的DTK工具鏈為開發(fā)者提供高效的本地化開發(fā)支持,降低了技術(shù)遷移門檻,助力構(gòu)建從算法到算力的完整產(chǎn)業(yè)鏈。此外,Qwen3+DCU的解決方案為信創(chuàng)重點行業(yè)提供了安全高效的AI能力,例如在金融領(lǐng)域支持智能客服系統(tǒng),在政務(wù)領(lǐng)域助力數(shù)據(jù)分析與決策支持,滿足行業(yè)對自主可控技術(shù)的高要求。雖然具體成本數(shù)據(jù)未披露,DCU的國產(chǎn)化生產(chǎn)與Qwen3的開源模式相較于進口GPU與閉源模型的組合,預(yù)計具有顯著的成本優(yōu)勢,使更多企業(yè)能夠采用國產(chǎn)AI技術(shù),從而推動技術(shù)的廣泛應(yīng)用和產(chǎn)業(yè)升級。
中國信創(chuàng)政策旨在推動國產(chǎn)IT解決方案的研發(fā)與應(yīng)用,構(gòu)建安全自主的技術(shù)體系。Qwen3與DCU的整合是信創(chuàng)政策的具體體現(xiàn),通過國產(chǎn)大模型與芯片的結(jié)合,打造從算法到算力的完整AI技術(shù)棧,降低對國外技術(shù)的依賴。
DCU在國內(nèi)與寒武紀(jì)、華為昇騰等AI芯片競爭,國際上則面對英偉達、AMD等巨頭。Qwen3則與DeepSeek、百度文心一言及國際模型如Llama競爭。Qwen3+DCU的開源與國產(chǎn)化優(yōu)勢,使其在信創(chuàng)市場中具備獨特競爭力。
雖然主要服務(wù)國內(nèi)需求,Qwen3的開源特性使其可吸引國際開發(fā)者,DCU的性價比優(yōu)勢也可能在發(fā)展中國家市場獲得機會。這種內(nèi)外兼顧的潛力提升了中國AI技術(shù)的全球影響力。
結(jié)語
2025年4月29日Qwen3的發(fā)布及其與海光DCU的快速適配,標(biāo)志著中國AI算力與算法生態(tài)的重大進展。Qwen3通過密集型與MoE模型滿足多樣化需求,其開源策略推動技術(shù)普及;海光DCU憑借GPGPU架構(gòu)、DTK軟件棧及自主可控特性,成為AI大模型訓(xùn)練與推理的關(guān)鍵支撐。在“智能深算”戰(zhàn)略引領(lǐng)下,Qwen3與DCU的協(xié)同效應(yīng)推動了信創(chuàng)目標(biāo)的實現(xiàn),加速了國產(chǎn)AI生態(tài)的成熟。未來,這一組合有望在金融、政務(wù)等行業(yè)深化應(yīng)用,為中國AI產(chǎn)業(yè)的自主可控與全球競爭力注入新動能。