Naver宣布啟用自主研發(fā)AI,語音合成服務(wù)即將進入商用化
傳出Naver研發(fā)的語音合成服務(wù)即將進入商用化階段,最快8月就能在自家人工智能(AI)平臺Clova將聲音變?yōu)橹嚾嘶騼和改赣H的聲音,發(fā)展進度將超越Google。
據(jù)韓媒ET News與朝鮮日報報導(dǎo),Naver在2015年首創(chuàng)業(yè)界推出網(wǎng)絡(luò)新聞朗讀服務(wù)后,最近取得新的語音合成技術(shù),即將推出采用新技術(shù)的語音服務(wù)。屆時Clova智能音響的語音朗讀聲音不再單調(diào),使用者可自訂資料庫中的任何聲音,隨時調(diào)整改變。
Naver研發(fā)出的混聲引擎讓聲音資料庫必要的資料縮減至10分之1,即便簡短的聲音檔案也能進行合成,技術(shù)品質(zhì)達世界級水準,在日語的語音合成器競爭中名列第一,研發(fā)進度也超前Google。
Naver研發(fā)團隊表示,個人化語音合成的問題是錄音時間,Naver只需4小時長度的聲音檔,搭配深度學習(deep learning)技術(shù),再與WaveNet Vocoder結(jié)合提升音質(zhì),比Google的40~100小時大為縮短。
語音合成服務(wù)有利于個人化需求,未來只要對麥克風說聲“你好”,系統(tǒng)就能自動辨識聲紋特性加以模仿,機器也能以父母的聲音為兒童朗讀童話故事。Naver研發(fā)團隊準備將研發(fā)重心優(yōu)先放在辨識發(fā)話人聲音部分。
Naver規(guī)劃2018年下半推出支持語音辨識、自然語言處理、語音合成的智能音響,產(chǎn)品將可聽聲辨人,使用者登錄相關(guān)資料后,就會依照使用者朗讀專屬的LINE即時通信息,播放符合喜好的音樂。
Naver研發(fā)團隊表示,除了個人化設(shè)定之外,隨著AI語音辨識技術(shù)提升,就算使用者對機器下達的語音指令不精確,系統(tǒng)也能自動校正給予應(yīng)有的回應(yīng),這是后續(xù)研發(fā)目標。
另據(jù)韓媒Money Today報導(dǎo),Naver宣布即日起在LINE Today上啟用自主研發(fā)的AI推薦系統(tǒng)AiRS。LINE Today是LINE即時通訊軟件的延伸服務(wù),提供各類新聞資訊,目前在臺灣、香港、泰國、印尼等地開放。
LINE Today將為AiRS規(guī)劃新區(qū)塊,分析全球用戶的消費型態(tài)、個別用戶的興趣嗜好,依照結(jié)果推薦閱讀內(nèi)容,功能將在移動裝置版本啟用后,下一步擴大到電腦版本。