真正智能的語音識別系統(tǒng)離我們還有多遠(yuǎn)
(文章來源:百家號)
如果單獨(dú)是因?yàn)榭谝魡栴},現(xiàn)在這么多在研究語音識別系統(tǒng)的公司,如果合作起來,只要資源共享,這應(yīng)該不是個問題。那么,制約語音識別發(fā)展的最主要原因來了,各家公司語音識別系統(tǒng)的源數(shù)據(jù)并不共享。語音識別中最重要的就是對語音的采集和分析,這是項(xiàng)工作量非常龐大的內(nèi)容,如果想要構(gòu)建支持不同口音的語音識別系統(tǒng),這一工作量還將呈幾何倍數(shù)驟增。
所以,即使是對于蘋果或亞馬遜這樣的超大型公司來說,也不可能支持無限語種的采集和分析。因此,各家研究語音識別系統(tǒng)的公司對源數(shù)據(jù)的保密控制堪稱苛刻,想弄到其他公司的語音源數(shù)據(jù)也是根本不可能的。
除去口音問題和源數(shù)據(jù)不共享的問題,語音識別系統(tǒng)的分析能力和云計(jì)算能力也是嚴(yán)重制約語音發(fā)展的重要因素。當(dāng)用戶在使用語音系統(tǒng)時,設(shè)備端收集到語音,需要通過識別系統(tǒng)的云計(jì)算能力進(jìn)行運(yùn)算和分析。云計(jì)算能力和支持云計(jì)算的硬件、傳輸網(wǎng)絡(luò)都不是一個非常好解決的問題,需要較長時間的積累不斷完善優(yōu)化。
很多人都覺得現(xiàn)在使用的語音識別系統(tǒng)并不好用,完全達(dá)不到我們想象中那種能夠僅憑借語音就能實(shí)現(xiàn)所有操作,或者能夠幫我們節(jié)約大量時間的程度。更多時候,我們會感覺面對的不適一個智能的語音識別系統(tǒng),而是家中聽不懂我們在說什么的寵物或者小孩子,需要我們放慢語氣、用最標(biāo)準(zhǔn)的普通話、一遍一遍的和他們慢慢說。不過別著急,現(xiàn)在的語音識別系統(tǒng)還真就是個孩子,它正在以非??斓乃俣冗M(jìn)步著,相信不久以后,真正好用的語音識別系統(tǒng)就會出現(xiàn)在我們身邊。