(文章來源:AI語音新技術)
近年來,語音識別技術取得了重大進展,并已開始從實驗室走向人們的生活。 預計在未來10年內(nèi),語音識別技術將進入各個領域,如工業(yè)、家用電子產(chǎn)品、通信、汽車電子。今天小編就語音識別的公司來分析。
大致來看,語音識別可以分為以下三個梯隊:第一梯隊:科大訊飛、騰訊、百度第二梯隊:思必馳、捷通華聲、聲智科技、云之聲等,第三梯隊:客知音等創(chuàng)業(yè)公司或者背靠其他學術或技術團隊。
科大訊飛是語音識別領域的老大,無論是市場占有還是技術創(chuàng)新;騰訊和百度團隊實力毋容置疑,潛力很大。不管怎么說,第一梯隊的語音識別率和團隊的技術實力都是最強的。訊飛輸入法首發(fā)方言識別引擎,支持方言已達15種,用戶超過2.5億。百度在語音識別、語音測試等方面有十幾年的數(shù)據(jù)積累,實力雄厚。
思必馳在技術上也很不錯,整體通用識別率屬第二梯隊,對于生僻字識別也有其優(yōu)勢,主要服務于智能硬件的三個垂直領域:智能機器人、智能車載和智能家居,提供自然語言交互解決方案。捷通華聲在語音合成和語義理解上有獨特建樹。聲智科技提供從端到云的智能語音交互技術和服務方案,以及從芯片、模組、開發(fā)板到白牌產(chǎn)品的智能語音應用方案。
第三梯隊是客知音等創(chuàng)業(yè)公司依靠國外的語音技術,在單個領域的語音識別比業(yè)界通用的語音識別引擎要高,垂直聚焦于聚焦于壽險行業(yè)和政府熱線的服務。其他技術團隊有中科院聲學所和自動化所。
在未來的語音識別市場中,越來越多的公司有望參與其中。 在未來,語音識別的表現(xiàn)可能更多地體現(xiàn)在前端技術和語義理解上。如果機器想要自然地與人溝通,當然,它不能重復這套手機的語音對話規(guī)則。它必須考慮許多因素,例如用戶說話的環(huán)境,周圍環(huán)境中的噪音,用戶不準確的發(fā)音或方言。這需要前端技術更準確地模擬人體結構并模擬機器人的聽覺系統(tǒng),以達到解放雙手之間自由對話的目的。