浪潮信息發(fā)布基于“源1.0”大模型生成的4個(gè)技能大模型

時(shí)間：2022-07-02 14:10:36

關(guān)鍵字：模型 MODEL SKILL 數(shù)據(jù)庫(kù)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] （全球TMT2022年7月1日訊）近日，浪潮信息發(fā)布了基于"源1.0"大模型生成的4個(gè)技能大模型(Skill Model)，分別為對(duì)話模型"源曉問(wèn)"、問(wèn)答模型"源曉搜"、翻譯模型"源曉譯"、古文模型"源曉文"。這些技能大模型在各自細(xì)分領(lǐng)域的精度業(yè)界領(lǐng)先，可直接應(yīng)用于人機(jī)交互、知...

（全球TMT2022年7月1日訊）近日，浪潮信息發(fā)布了基于"源1.0"大模型生成的4個(gè)技能大模型(Skill Model)，分別為對(duì)話模型"源曉問(wèn)"、問(wèn)答模型"源曉搜"、翻譯模型"源曉譯"、古文模型"源曉文"。這些技能大模型在各自細(xì)分領(lǐng)域的精度業(yè)界領(lǐng)先，可直接應(yīng)用于人機(jī)交互、知識(shí)檢索、語(yǔ)言翻譯和文學(xué)創(chuàng)作等領(lǐng)域，模型運(yùn)行速度最高提升9倍。更重要的是，基于大模型快速生成特定領(lǐng)域的技能大模型(Skill Model)，也意味著"源"的AI生產(chǎn)力大幅升級(jí)，能夠幫助商業(yè)組織和研究機(jī)構(gòu)實(shí)現(xiàn)對(duì)AI技術(shù)的高效、快速和低成本應(yīng)用，加速產(chǎn)業(yè)AI化。

對(duì)話模型("源曉問(wèn)")在源大模型基礎(chǔ)上，又采用了2660萬(wàn)條醫(yī)療、法律、保險(xiǎn)等不同行業(yè)，歷史、電影、娛樂(lè)等不同場(chǎng)景的對(duì)話語(yǔ)料數(shù)據(jù)進(jìn)行強(qiáng)化訓(xùn)練，在高頻閑聊、知識(shí)問(wèn)答等開(kāi)放式問(wèn)答對(duì)話上表現(xiàn)突出。翻譯模型("源曉譯")基于源大模型閱讀的海量高質(zhì)量數(shù)據(jù)集，采用維基百科、書(shū)籍、聯(lián)合國(guó)文件及字幕組等近80G高質(zhì)量數(shù)據(jù)集進(jìn)行強(qiáng)化訓(xùn)練，因此翻譯不但流暢準(zhǔn)確，同時(shí)更符合中文表述，在中譯英時(shí)表述更加專(zhuān)業(yè)地道，可輕松應(yīng)對(duì)日常對(duì)話、新聞、哲學(xué)、小說(shuō)等日常的語(yǔ)言翻譯任務(wù)。問(wèn)答模型("源曉搜")鏈接了包含了維基百科、書(shū)籍等知識(shí)的數(shù)據(jù)庫(kù)，根據(jù)用戶(hù)提問(wèn)的內(nèi)容，利用高性能檢索方法，快速地從知識(shí)數(shù)據(jù)庫(kù)中檢索到與提問(wèn)內(nèi)容相關(guān)的內(nèi)容作為背景知識(shí)，在相關(guān)專(zhuān)業(yè)知識(shí)背景下回答問(wèn)題，能夠生成符合人類(lèi)語(yǔ)言習(xí)慣的專(zhuān)業(yè)答復(fù)。古文模型("源曉文")在源大模型精讀了5000GB高質(zhì)量中文的基礎(chǔ)上，又學(xué)習(xí)了先秦到近代幾乎所有詩(shī)詞，并精選其中最優(yōu)秀的10萬(wàn)首進(jìn)行強(qiáng)化訓(xùn)練。海量學(xué)習(xí)兼針對(duì)性強(qiáng)化訓(xùn)練使得古文理解模型能夠精通古詩(shī)詞的用詞、文法及平仄格律等規(guī)則，還擅長(zhǎng)營(yíng)造意境、引經(jīng)據(jù)典，同時(shí)兼具古文解析的能力。