浪潮源1.0大模型登頂中文語言能力評測基準(zhǔn)CUGE榜首

時(shí)間：2022-06-10 14:10:16

關(guān)鍵字：模型 UG GE 智能化

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] （全球TMT2022年6月9日訊）近日，浪潮"源1.0"大模型登頂中文語言能力理解和生成評測基準(zhǔn)CUGE總榜榜首，并獲得語言理解（篇章級）、語言生成、對話交互、多語言、數(shù)學(xué)推理等5項(xiàng)評測最佳成績。在語言理解(篇章級)評測中，源1.0僅用時(shí)11分鐘，便完成數(shù)千篇閱...

（全球TMT2022年6月9日訊）近日，浪潮"源1.0"大模型登頂中文語言能力理解和生成評測基準(zhǔn)CUGE總榜榜首，并獲得語言理解（篇章級）、語言生成、對話交互、多語言、數(shù)學(xué)推理等5項(xiàng)評測最佳成績。

在語言理解(篇章級)評測中，源1.0僅用時(shí)11分鐘，便完成數(shù)千篇閱讀理解回答4000多個(gè)問題，以86.9高分的成績位居榜首，展現(xiàn)出頂尖的語言理解能力。在語言生成評測中，源1.0僅用時(shí)70秒，就完成近800條摘要內(nèi)容的生成，登頂該項(xiàng)榜單。源大模型強(qiáng)大的文本生成能力可提升智能問答與對話、新聞?wù)?、?bào)告生成等場景中AI智能化水平。在多語言機(jī)器翻譯評測中，基于源1.0大模型蒸餾出來的翻譯模型在完成近4000千對中英文互譯后，登頂榜首，領(lǐng)先第二名15%。在對話交互評測中，基于源1.0大模型蒸餾出來的對話模型回答了電影、音樂、旅行3個(gè)領(lǐng)域共近萬個(gè)主題對話，成績位居榜首，領(lǐng)先第二名成績30%。在CUGE數(shù)學(xué)推理評測中，源1.0大模型完成1000道小學(xué)數(shù)學(xué)應(yīng)用題，以76.9的高分大幅領(lǐng)先高居榜首。