搜狗推出全球首個(gè)3D AI合成主播:“新小微”亮相
近年來,人工智能越來越滲透人們的生活。
5月21日,搜狗聯(lián)合新華社推出的全球首個(gè)3D AI合成主播“新小微”正式亮相,基于搜狗人工智能核心技術(shù),為全國觀眾帶來最新的兩會(huì)新聞資訊報(bào)道。
早在2018年,基于搜狗分身技術(shù),搜狗就推出全球首個(gè)AI合成主播“新小浩”,已在新華社客戶端上持續(xù)為觀眾服務(wù)500多天,先后產(chǎn)出13000多條新聞報(bào)道,累計(jì)時(shí)長超過35000分鐘。
而此次的3D AI合成主播就是搜狗分身最新的突破性成果。較之前的2D AI合成主播,3D“新小微”不僅立體、靈活,可控,還具有同時(shí)支持多機(jī)位多景深,360°任意角度呈現(xiàn)內(nèi)容等能力,在應(yīng)用空間上擁有更多的可能性,為新聞節(jié)目多樣化制作和呈現(xiàn)帶來了更多選擇。
據(jù)了解,“新小微”以新華社記者趙琬微為原型,基于超寫實(shí)3D數(shù)字人建模、多模態(tài)識(shí)別及生成、實(shí)時(shí)面部動(dòng)作生成及驅(qū)動(dòng)、遷移學(xué)習(xí)等多項(xiàng)人工智能前沿技術(shù),使機(jī)器可以基于輸入文本生成逼真度極高的3D數(shù)字人視頻內(nèi)容。
3D AI合成主播結(jié)合了原力科技提供的業(yè)界領(lǐng)先的掃描還原、面部肌肉驅(qū)動(dòng)、表情肢體捕捉等技術(shù),生產(chǎn)出了高度還原真人發(fā)膚、形象逼真的數(shù)字人模型。
同時(shí)基于搜狗分身領(lǐng)先的端到端多模態(tài)建模技術(shù),使用語音、圖像、文本、3D肌肉運(yùn)動(dòng)數(shù)據(jù)等多模態(tài)信息完成聯(lián)合建模訓(xùn)練。
在AI算法的驅(qū)動(dòng)下,只需輸入文本內(nèi)容,“新小微”就能根據(jù)語義實(shí)時(shí)播報(bào)新聞,其表情唇動(dòng)、肢體動(dòng)作和語音表達(dá)高度契合、自然逼真。
最值得一提的是,搜狗表示,不久的將來,3D AI合成主播還會(huì)走出演播廳,支持外景播報(bào)和互動(dòng)采訪,為觀眾帶來最前沿的新聞?dòng)嵪ⅰ?