百度開源文心大模型4.5系列模型中國(guó)算力平臺(tái)率先上線

時(shí)間：2025-07-01 11:08:32

關(guān)鍵字：百度 AI

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]6月30日消息，百度今天正式開源文心大模型4.5系列模型。與此同時(shí)，中國(guó)算力平臺(tái)模創(chuàng)空間率先上線文心大模型。

6月30日消息，百度今天正式開源文心大模型4.5系列模型。與此同時(shí)，中國(guó)算力平臺(tái)模創(chuàng)空間率先上線文心大模型。

中國(guó)算力平臺(tái)是在工信部指導(dǎo)下，中國(guó)信息通信研究院建設(shè)的平臺(tái)，匯聚“多源+多元”模型服務(wù)。

通過服務(wù)網(wǎng)關(guān)能力，實(shí)現(xiàn)模型及AI應(yīng)用的在線調(diào)用服務(wù)。模型方可以將自有模型通過API方式發(fā)布到模型市場(chǎng)，開發(fā)者可以在線調(diào)用模型進(jìn)行開發(fā)創(chuàng)作。

作為前沿人工智能成果，文心4.5創(chuàng)新運(yùn)用多模態(tài)混合專家模型預(yù)訓(xùn)練技術(shù)，以異構(gòu)混合專家結(jié)構(gòu)結(jié)合了多維旋轉(zhuǎn)位置編碼，并且在損失函數(shù)計(jì)算時(shí)，增強(qiáng)了不同專家間的正交性，提升文本生成、圖像理解以及多模態(tài)推理等任務(wù)效能。

為支持高效訓(xùn)練提出異構(gòu)混合并行和多層級(jí)負(fù)載均衡策略，在推理方面提出多專家并行協(xié)同量化方法和卷積編碼量化算法，從而實(shí)現(xiàn)高效訓(xùn)練推理框架。

對(duì)預(yù)訓(xùn)練模型進(jìn)行了針對(duì)模態(tài)的精調(diào)，大語言模型針對(duì)通用語言理解和生成進(jìn)行了優(yōu)化，多模態(tài)大模型側(cè)重于視覺語言理解，支持思考和非思考模式，滿足實(shí)際場(chǎng)景不同需求。