浪潮源1.0大模型登頂中文語言能力評(píng)測(cè)基準(zhǔn)CUGE榜首
(全球TMT2022年6月9日訊)近日,浪潮"源1.0"大模型登頂中文語言能力理解和生成評(píng)測(cè)基準(zhǔn)CUGE總榜榜首,并獲得語言理解(篇章級(jí))、語言生成、對(duì)話交互、多語言、數(shù)學(xué)推理等5項(xiàng)評(píng)測(cè)最佳成績。

在語言理解(篇章級(jí))評(píng)測(cè)中,源1.0僅用時(shí)11分鐘,便完成數(shù)千篇閱讀理解回答4000多個(gè)問題,以86.9高分的成績位居榜首,展現(xiàn)出頂尖的語言理解能力。在語言生成評(píng)測(cè)中,源1.0僅用時(shí)70秒,就完成近800條摘要內(nèi)容的生成,登頂該項(xiàng)榜單。源大模型強(qiáng)大的文本生成能力可提升智能問答與對(duì)話、新聞?wù)?、?bào)告生成等場景中AI智能化水平。在多語言機(jī)器翻譯評(píng)測(cè)中,基于源1.0大模型蒸餾出來的翻譯模型在完成近4000千對(duì)中英文互譯后,登頂榜首,領(lǐng)先第二名15%。在對(duì)話交互評(píng)測(cè)中,基于源1.0大模型蒸餾出來的對(duì)話模型回答了電影、音樂、旅行3個(gè)領(lǐng)域共近萬個(gè)主題對(duì)話,成績位居榜首,領(lǐng)先第二名成績30%。在CUGE數(shù)學(xué)推理評(píng)測(cè)中,源1.0大模型完成1000道小學(xué)數(shù)學(xué)應(yīng)用題,以76.9的高分大幅領(lǐng)先高居榜首。