語(yǔ)音識(shí)別的下一段路應(yīng)該怎么走
分享一:提高語(yǔ)音識(shí)別魯棒性的三種途徑
近二十年,語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步,但識(shí)別的魯棒性問題一直阻礙著語(yǔ)音技術(shù)的進(jìn)一步發(fā)展。對(duì)于語(yǔ)音識(shí)別和聲紋識(shí)別來說,該如何提升影響準(zhǔn)確率的系統(tǒng)魯棒性?快商通首席科學(xué)家李海洲教授表示,想要從根本上提升識(shí)別準(zhǔn)確率,可以從三個(gè)方面考慮。
首先,專用系統(tǒng)轉(zhuǎn)換為通用系統(tǒng)。
語(yǔ)音識(shí)別從實(shí)驗(yàn)室走向應(yīng)用,環(huán)境適應(yīng)性一直是不容忽視的問題。實(shí)驗(yàn)室中訓(xùn)練良好的引擎,一旦處于負(fù)責(zé)的噪聲環(huán)境,其識(shí)別準(zhǔn)確率便會(huì)急劇下降。這些噪聲主要來自于信道偏差,環(huán)境噪音,被污染的測(cè)試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)的不匹配等。
因此,想要提高識(shí)別準(zhǔn)確率,需將目前針對(duì)某單一環(huán)境的專用系統(tǒng)升級(jí)為通用系統(tǒng),提高識(shí)別引擎的自我學(xué)習(xí)能力,才能使其適應(yīng)不同環(huán)境的差異性。
第二,擴(kuò)展獲取語(yǔ)音信息的渠道。
假設(shè)三種場(chǎng)景:面對(duì)面交流、視頻交流、電話語(yǔ)音交流,人在哪種情況下能聽得最清楚?毫無疑問是面對(duì)面交流,這種場(chǎng)景下溝通,人們可以看到對(duì)方的表情、手勢(shì),而這些信息也將輔助聽覺獲取更多的信息。
人類從單一的渠道獲取信息尚且會(huì)有偏差的可能,機(jī)器亦然。李教授認(rèn)為,未來將會(huì)形成語(yǔ)音、視覺等多渠道的技術(shù)手段,來幫助語(yǔ)音識(shí)別和聲紋識(shí)別進(jìn)行準(zhǔn)確率的提升。
第三,從語(yǔ)音語(yǔ)言處理走向語(yǔ)音語(yǔ)言理解。
人們普遍認(rèn)為,語(yǔ)音識(shí)別是將聲音變?yōu)槲淖帧5诳焐掏ㄊ紫茖W(xué)家李海洲教授的理解里,語(yǔ)音識(shí)別的初衷是讓機(jī)器聽懂人類說話,并不一定需要將聲音轉(zhuǎn)化為文字。就像人與人之間的交流,并不需要先將對(duì)方說的語(yǔ)音轉(zhuǎn)換成文字。
機(jī)器無法直接聽懂人類的語(yǔ)言,所以需要將語(yǔ)音轉(zhuǎn)為文字來輔助,但如果希望技術(shù)有更近一層的突破,我們需要將精力放于語(yǔ)音識(shí)別的后半段路——從語(yǔ)音語(yǔ)言處理走向語(yǔ)音語(yǔ)言理解。
分享二:中國(guó)人工智能應(yīng)用落地的三大優(yōu)勢(shì)
第四次工業(yè)革命即將來臨,世界各國(guó)已經(jīng)認(rèn)識(shí)到人工智能是未來國(guó)家之間競(jìng)爭(zhēng)的關(guān)鍵賽場(chǎng),因而紛紛爭(zhēng)奪這一輪科技革命的制高點(diǎn)。對(duì)于中國(guó)而言,人工智能的發(fā)展是一個(gè)歷史性的戰(zhàn)略機(jī)遇,政府創(chuàng)造土壤,企業(yè)奮起發(fā)力,中國(guó)在AI領(lǐng)域的實(shí)力與發(fā)展優(yōu)勢(shì)不斷被世界認(rèn)可。
基于多年海外經(jīng)歷培養(yǎng)出的國(guó)際化視角,結(jié)合專業(yè)判斷能力,快商通首席科學(xué)家李海洲教授總結(jié)出中國(guó)人工智能應(yīng)用落地的三大優(yōu)勢(shì)。
政府推動(dòng):在我國(guó),人工智能連續(xù)三年被寫入總理政府工作報(bào)告,并成為促進(jìn)新興產(chǎn)業(yè)加快發(fā)展的新動(dòng)能。政府的推動(dòng)與總體規(guī)劃,完善了人工智能基礎(chǔ)設(shè)施的建設(shè),并使得各科技企業(yè)的技術(shù)能夠穩(wěn)步落地。
數(shù)據(jù)優(yōu)勢(shì):人工智能的發(fā)展需要與深度學(xué)習(xí)和大數(shù)據(jù)緊密結(jié)合,中國(guó)在數(shù)據(jù)資源這一方面的優(yōu)勢(shì),是毋庸置疑的。僅僅在日常生活中,中國(guó)近14億的人口就能產(chǎn)生比全球其他國(guó)家更多的數(shù)據(jù)。這讓深度學(xué)習(xí)有一個(gè)用武之地。
企業(yè)環(huán)境:自2012年深度學(xué)習(xí)取得重大突破,中國(guó)人工智能企業(yè)如雨后春筍般生長(zhǎng),激烈的競(jìng)爭(zhēng)環(huán)境下,企業(yè)家們必須兼具創(chuàng)新與奮斗精神,才能在大浪淘沙中適者生存。再這樣的情況下,中國(guó)人工智能技術(shù)的創(chuàng)業(yè)環(huán)境積極向上,為優(yōu)質(zhì)的技術(shù)和企業(yè)家創(chuàng)造了健康的創(chuàng)業(yè)土壤。
來源:安防知識(shí)網(wǎng)