Qwen3發(fā)布并開源，海光DCU實現(xiàn)全模型無縫適配

時間：2025-04-29 16:37:29

關(guān)鍵字： Qwen3、海光 DCU 大模型 LLM

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]2025年4月29日，阿里巴巴云旗下的Qwen團隊正式發(fā)布并開源Qwen3，作為Qwen系列的最新一代大型語言模型（LLM），包含一系列密集型（Dense）和混合專家（MoE）模型，參數(shù)規(guī)模從0.6億至2350億不等。同日，海光信息技術(shù)股份有限公司（以下簡稱“海光信息”）在其“智能深算”戰(zhàn)略引領(lǐng)下，宣布其深算單元（DCU，Deep Computing Unit）已完成對Qwen3全部8款模型（235B、32B、30B、14B、8B、4B、1.7B、0.6B）的無縫適配與優(yōu)化，實現(xiàn)零錯誤、零兼容性問題、秒級部署。這一整合依托基于GPGPU架構(gòu)的生態(tài)優(yōu)勢和海光DTK軟件棧的領(lǐng)先特性，展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性，充分驗證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢，使其成為支撐AI大模型訓(xùn)練與推理的關(guān)鍵基礎(chǔ)設(shè)施。

2025年4月29日，阿里巴巴云旗下的Qwen團隊正式發(fā)布并開源Qwen3，作為Qwen系列的最新一代大型語言模型（LLM），包含一系列密集型（Dense）和混合專家（MoE）模型，參數(shù)規(guī)模從0.6億至2350億不等。同日，海光信息技術(shù)股份有限公司（以下簡稱“海光信息”）在其“智能深算”戰(zhàn)略引領(lǐng)下，宣布其深算單元（DCU，Deep Computing Unit）已完成對Qwen3全部8款模型（235B、32B、30B、14B、8B、4B、1.7B、0.6B）的無縫適配與優(yōu)化，實現(xiàn)零錯誤、零兼容性問題、秒級部署。這一整合依托基于GPGPU架構(gòu)的生態(tài)優(yōu)勢和海光DTK軟件棧的領(lǐng)先特性，展現(xiàn)了Qwen3在DCU上的卓越推理性能與穩(wěn)定性，充分驗證了DCU的高通用性、高生態(tài)兼容性及自主可控的技術(shù)優(yōu)勢，使其成為支撐AI大模型訓(xùn)練與推理的關(guān)鍵基礎(chǔ)設(shè)施。

Qwen3：開源大型語言模型的新里程碑

Qwen3是阿里巴巴云Qwen系列的最新成果，旨在通過多樣化的模型架構(gòu)滿足廣泛的AI應(yīng)用需求。其模型包括密集型模型，參數(shù)規(guī)模涵蓋0.6億、1.7億、4億、8億、14億、32億，適用于從邊緣設(shè)備到數(shù)據(jù)中心的多種部署場景；以及混合專家（MoE）模型，包括Qwen3-30B（總參數(shù)300億，推理時激活部分參數(shù)）和Qwen3-235B（總參數(shù)2350億，推理時激活部分參數(shù)），通過選擇性激活專家網(wǎng)絡(luò)降低計算成本，同時保持高性能。Qwen3以Apache 2.0許可開源，模型權(quán)重通過Hugging Face、GitHub及阿里云ModelScope等平臺公開，供全球開發(fā)者與研究人員免費使用。這種開源策略促進了技術(shù)創(chuàng)新與協(xié)作，使Qwen3可廣泛應(yīng)用于金融、醫(yī)療、教育、電信等行業(yè)。

Qwen3的密集型與MoE模型組合體現(xiàn)了其在性能與效率上的平衡。密集型模型適合需要全面參數(shù)參與的復(fù)雜任務(wù)，如高級自然語言處理或多模態(tài)應(yīng)用；MoE模型通過稀疏計算降低資源需求，適合計算資源受限的場景。參數(shù)規(guī)模從0.6億到2350億的設(shè)計，使Qwen3能夠覆蓋從輕量級應(yīng)用到企業(yè)級數(shù)據(jù)中心的高性能需求。作為開源模型，Qwen3延續(xù)了Qwen系列推動AI民主化的使命，開發(fā)者可基于其開發(fā)定制化解決方案，特別是在中國信息技術(shù)應(yīng)用創(chuàng)新（信創(chuàng)）政策支持的行業(yè)中，Qwen3有望成為關(guān)鍵的AI技術(shù)驅(qū)動力。

海光DCU：“智能深算”戰(zhàn)略的核心支柱

海光信息的“智能深算”戰(zhàn)略以DCU為核心，聚焦高性能計算（HPC）與人工智能算力的自主研發(fā)，旨在滿足中國對安全高效、自主可控算力的需求。該戰(zhàn)略順應(yīng)信創(chuàng)政策與AI市場快速增長的趨勢，推動國產(chǎn)芯片在通用計算與智能計算領(lǐng)域的應(yīng)用。DCU定位于AI、大數(shù)據(jù)處理及商業(yè)計算場景的協(xié)處理器，類似英偉達GPU，但更注重成本效益與本土化適配。海光信息自2016年通過與AMD的技術(shù)授權(quán)合作，獲得x86架構(gòu)許可，開發(fā)了通用處理器（CPU）與DCU。2019年被列入美國“實體清單”后，AMD停止技術(shù)支持，海光加速自主研發(fā)，DCU成為其核心競爭力。目前，DCU已廣泛應(yīng)用于金融、電信、互聯(lián)網(wǎng)、教育、醫(yī)療、政務(wù)等領(lǐng)域，成為國產(chǎn)AI算力的重要支撐。

DCU在Qwen3適配中展現(xiàn)了卓越的技術(shù)能力。其采用通用圖形處理單元（GPGPU）架構(gòu)，支持高并行計算，適合AI模型訓(xùn)練與推理，類CUDA并行計算框架兼容主流AI軟件生態(tài)，確保與Qwen3等模型的無縫整合。海光的深算工具包（DTK）是一套完整的軟件開發(fā)套件，包括開發(fā)工具、庫和優(yōu)化框架，支持模型遷移、性能優(yōu)化與快速部署，助力DCU實現(xiàn)Qwen3全系列模型的秒級部署，無任何錯誤或兼容性問題。DCU支持從0.6億到2350億參數(shù)的Qwen3模型，展現(xiàn)了其適應(yīng)多樣化計算需求的靈活性，覆蓋邊緣計算到數(shù)據(jù)中心的高性能場景。其兼容全球AI框架及國產(chǎn)大模型，降低開發(fā)者遷移成本，同時內(nèi)置安全硬件，支持國密算法（如SM2、SM3）與可信計算，滿足中國對信息安全與技術(shù)自主的高要求。

DCU通過支持Qwen3的訓(xùn)練與推理，確立了其作為AI大模型關(guān)鍵基礎(chǔ)設(shè)施的地位。相較于進口GPU，DCU提供自主可控的算力解決方案，滿足金融、政務(wù)等行業(yè)對安全與效率的需求。其在信創(chuàng)市場中的應(yīng)用進一步鞏固了其作為國產(chǎn)算力核心的地位。

Qwen3與DCU的協(xié)同效應(yīng)

海光信息在Qwen3發(fā)布當(dāng)天宣布完成全部8款模型的適配與優(yōu)化，實現(xiàn)了零錯誤、零兼容性問題、秒級部署，這一技術(shù)突破彰顯了DCU在高性能計算與AI應(yīng)用中的強大能力。DCU的GPGPU架構(gòu)為Qwen3的密集型與MoE模型提供了高效的并行計算支持，能夠處理從0.6億到2350億參數(shù)的多樣化計算需求，確保推理任務(wù)的穩(wěn)定性和高吞吐量。海光的DTK軟件棧在這一過程中發(fā)揮了關(guān)鍵作用，其包含的開發(fā)工具和優(yōu)化框架支持快速模型遷移與性能調(diào)優(yōu)，使Qwen3能夠在DCU上以秒級速度完成部署，且運行過程中無任何兼容性問題。這種高效適配能力源于DCU類CUDA生態(tài)的兼容性設(shè)計，使其能夠無縫支持主流AI框架，同時適配國產(chǎn)大模型的獨特需求。DCU對Qwen3全系列模型的支持，體現(xiàn)了其在處理輕量級邊緣計算任務(wù)到高強度數(shù)據(jù)中心推理任務(wù)時的通用性，進一步驗證了其作為國產(chǎn)AI算力基礎(chǔ)設(shè)施的技術(shù)成熟度。

Qwen3與DCU的成功整合對中國AI生態(tài)具有深遠(yuǎn)的戰(zhàn)略意義。首先，這一整合推動了信創(chuàng)政策目標(biāo)的實現(xiàn)，Qwen3作為開源的國產(chǎn)大模型，與DCU這一自主研發(fā)的協(xié)處理器結(jié)合，顯著降低了國內(nèi)AI產(chǎn)業(yè)對國外技術(shù)的依賴，增強了技術(shù)自主性和信息安全性，特別是在金融、政務(wù)等敏感領(lǐng)域。其次，Qwen3的開源特性與DCU的生態(tài)兼容性共同促進了國產(chǎn)AI生態(tài)的建設(shè)，Qwen3通過Hugging Face等全球平臺吸引開發(fā)者，而DCU的DTK工具鏈為開發(fā)者提供高效的本地化開發(fā)支持，降低了技術(shù)遷移門檻，助力構(gòu)建從算法到算力的完整產(chǎn)業(yè)鏈。此外，Qwen3+DCU的解決方案為信創(chuàng)重點行業(yè)提供了安全高效的AI能力，例如在金融領(lǐng)域支持智能客服系統(tǒng)，在政務(wù)領(lǐng)域助力數(shù)據(jù)分析與決策支持，滿足行業(yè)對自主可控技術(shù)的高要求。雖然具體成本數(shù)據(jù)未披露，DCU的國產(chǎn)化生產(chǎn)與Qwen3的開源模式相較于進口GPU與閉源模型的組合，預(yù)計具有顯著的成本優(yōu)勢，使更多企業(yè)能夠采用國產(chǎn)AI技術(shù)，從而推動技術(shù)的廣泛應(yīng)用和產(chǎn)業(yè)升級。

中國信創(chuàng)政策旨在推動國產(chǎn)IT解決方案的研發(fā)與應(yīng)用，構(gòu)建安全自主的技術(shù)體系。Qwen3與DCU的整合是信創(chuàng)政策的具體體現(xiàn)，通過國產(chǎn)大模型與芯片的結(jié)合，打造從算法到算力的完整AI技術(shù)棧，降低對國外技術(shù)的依賴。

DCU在國內(nèi)與寒武紀(jì)、華為昇騰等AI芯片競爭，國際上則面對英偉達、AMD等巨頭。Qwen3則與DeepSeek、百度文心一言及國際模型如Llama競爭。Qwen3+DCU的開源與國產(chǎn)化優(yōu)勢，使其在信創(chuàng)市場中具備獨特競爭力。

雖然主要服務(wù)國內(nèi)需求，Qwen3的開源特性使其可吸引國際開發(fā)者，DCU的性價比優(yōu)勢也可能在發(fā)展中國家市場獲得機會。這種內(nèi)外兼顧的潛力提升了中國AI技術(shù)的全球影響力。

結(jié)語

2025年4月29日Qwen3的發(fā)布及其與海光DCU的快速適配，標(biāo)志著中國AI算力與算法生態(tài)的重大進展。Qwen3通過密集型與MoE模型滿足多樣化需求，其開源策略推動技術(shù)普及；海光DCU憑借GPGPU架構(gòu)、DTK軟件棧及自主可控特性，成為AI大模型訓(xùn)練與推理的關(guān)鍵支撐。在“智能深算”戰(zhàn)略引領(lǐng)下，Qwen3與DCU的協(xié)同效應(yīng)推動了信創(chuàng)目標(biāo)的實現(xiàn)，加速了國產(chǎn)AI生態(tài)的成熟。未來，這一組合有望在金融、政務(wù)等行業(yè)深化應(yīng)用，為中國AI產(chǎn)業(yè)的自主可控與全球競爭力注入新動能。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風(fēng)險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅持高質(zhì)量發(fā)展策略，塑強核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運營商數(shù)字經(jīng)濟

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]