音視頻新技術(shù)可以讓聲音返老還童
聲音也能返老還童?當(dāng)垂垂老矣語(yǔ)音混沌時(shí),借助受損語(yǔ)音修復(fù)技術(shù)就能讓聲音完美再現(xiàn),重返青春。記者近日從天津大學(xué)獲悉,該校自動(dòng)化與信息工程學(xué)院張濤副教授帶領(lǐng)團(tuán)隊(duì),在音視頻智能分析中實(shí)現(xiàn)重大突破,借助大數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)等人工智能技術(shù)首次實(shí)現(xiàn)了受損聲音的修復(fù)和再現(xiàn)。
據(jù)介紹,老年人的喉粘膜萎縮以及聲帶老化、聲帶肌松弛等會(huì)導(dǎo)致出現(xiàn)發(fā)音無(wú)力、音質(zhì)下降等問(wèn)題,另外聲帶出現(xiàn)一些病變?nèi)缥s或肥厚、聲帶長(zhǎng)肉結(jié)或息肉等都可能導(dǎo)致聲音改變、沙啞。對(duì)由于疾病或器官衰老而引起的語(yǔ)音受損研究,目前大多著眼于病理嗓音的檢測(cè)和識(shí)別,對(duì)于受損語(yǔ)音帶來(lái)的交流方面的問(wèn)題研究則相對(duì)較少。
隨著音頻場(chǎng)景智能分析應(yīng)用越來(lái)越廣,科學(xué)家開(kāi)始借助大數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)等人工智能技術(shù)模擬修復(fù)受損聲音。張濤主持的天津大學(xué)-TI DSP聯(lián)合實(shí)驗(yàn)室也主要聚焦于音頻場(chǎng)景智能分析和受損語(yǔ)音信號(hào)修復(fù)兩個(gè)方面。在對(duì)因衰老、病變等因素造成的聲帶受損語(yǔ)音進(jìn)行修復(fù)過(guò)程。
張濤團(tuán)隊(duì)獨(dú)辟蹊徑,提出了一種新型截取信號(hào)的窗函數(shù),可以對(duì)因病變、衰老造成的聲帶發(fā)聲受損進(jìn)行有效修復(fù)。這一修復(fù)研究主要借助嗓音的聲學(xué)特征及其動(dòng)力學(xué)非線性特征參數(shù)等,通過(guò)結(jié)合神經(jīng)網(wǎng)絡(luò)等技術(shù)建立激勵(lì)和聲道模型對(duì)修復(fù)的嗓音特征重新合成,從而大大提高了受損語(yǔ)音的可懂度。目前,該實(shí)驗(yàn)室研究已經(jīng)申請(qǐng)國(guó)家專利并被采納為國(guó)家技術(shù)標(biāo)準(zhǔn)。