浪潮信息發(fā)布基于“源1.0”大模型生成的4個技能大模型
(全球TMT2022年7月1日訊)近日,浪潮信息發(fā)布了基于"源1.0"大模型生成的4個技能大模型(Skill Model),分別為對話模型"源曉問"、問答模型"源曉搜"、翻譯模型"源曉譯"、古文模型"源曉文"。這些技能大模型在各自細分領域的精度業(yè)界領先,可直接應用于人機交互、知識檢索、語言翻譯和文學創(chuàng)作等領域,模型運行速度最高提升9倍。更重要的是,基于大模型快速生成特定領域的技能大模型(Skill Model),也意味著"源"的AI生產力大幅升級,能夠幫助商業(yè)組織和研究機構實現(xiàn)對AI技術的高效、快速和低成本應用,加速產業(yè)AI化。

對話模型("源曉問")在源大模型基礎上,又采用了2660萬條醫(yī)療、法律、保險等不同行業(yè),歷史、電影、娛樂等不同場景的對話語料數(shù)據進行強化訓練,在高頻閑聊、知識問答等開放式問答對話上表現(xiàn)突出。翻譯模型("源曉譯")基于源大模型閱讀的海量高質量數(shù)據集,采用維基百科、書籍、聯(lián)合國文件及字幕組等近80G高質量數(shù)據集進行強化訓練,因此翻譯不但流暢準確,同時更符合中文表述,在中譯英時表述更加專業(yè)地道,可輕松應對日常對話、新聞、哲學、小說等日常的語言翻譯任務。問答模型("源曉搜")鏈接了包含了維基百科、書籍等知識的數(shù)據庫,根據用戶提問的內容,利用高性能檢索方法,快速地從知識數(shù)據庫中檢索到與提問內容相關的內容作為背景知識,在相關專業(yè)知識背景下回答問題,能夠生成符合人類語言習慣的專業(yè)答復。古文模型("源曉文")在源大模型精讀了5000GB高質量中文的基礎上,又學習了先秦到近代幾乎所有詩詞,并精選其中最優(yōu)秀的10萬首進行強化訓練。海量學習兼針對性強化訓練使得古文理解模型能夠精通古詩詞的用詞、文法及平仄格律等規(guī)則,還擅長營造意境、引經據典,同時兼具古文解析的能力。