當下語音識別技術的市場發(fā)展突飛猛進

時間：2020-05-22 08:03:02

關鍵字：科大訊飛語音識別技術思必馳模擬

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] （文章來源：AI語音新技術）近年來，語音識別技術取得了重大進展，并已開始從實驗室走向人們的生活。預計在未來10年內(nèi)，語音識別技術將進入各個領域，如工業(yè)、家用電子產(chǎn)品、通信、汽車電子。

（文章來源：AI語音新技術）

近年來，語音識別技術取得了重大進展，并已開始從實驗室走向人們的生活。預計在未來10年內(nèi)，語音識別技術將進入各個領域，如工業(yè)、家用電子產(chǎn)品、通信、汽車電子。今天小編就語音識別的公司來分析。

大致來看，語音識別可以分為以下三個梯隊：第一梯隊：科大訊飛、騰訊、百度第二梯隊：思必馳、捷通華聲、聲智科技、云之聲等，第三梯隊：客知音等創(chuàng)業(yè)公司或者背靠其他學術或技術團隊。

科大訊飛是語音識別領域的老大，無論是市場占有還是技術創(chuàng)新；騰訊和百度團隊實力毋容置疑，潛力很大。不管怎么說，第一梯隊的語音識別率和團隊的技術實力都是最強的。訊飛輸入法首發(fā)方言識別引擎，支持方言已達15種，用戶超過2.5億。百度在語音識別、語音測試等方面有十幾年的數(shù)據(jù)積累，實力雄厚。

思必馳在技術上也很不錯，整體通用識別率屬第二梯隊，對于生僻字識別也有其優(yōu)勢，主要服務于智能硬件的三個垂直領域：智能機器人、智能車載和智能家居，提供自然語言交互解決方案。捷通華聲在語音合成和語義理解上有獨特建樹。聲智科技提供從端到云的智能語音交互技術和服務方案，以及從芯片、模組、開發(fā)板到白牌產(chǎn)品的智能語音應用方案。

第三梯隊是客知音等創(chuàng)業(yè)公司依靠國外的語音技術，在單個領域的語音識別比業(yè)界通用的語音識別引擎要高，垂直聚焦于聚焦于壽險行業(yè)和政府熱線的服務。其他技術團隊有中科院聲學所和自動化所。

在未來的語音識別市場中，越來越多的公司有望參與其中。在未來，語音識別的表現(xiàn)可能更多地體現(xiàn)在前端技術和語義理解上。如果機器想要自然地與人溝通，當然，它不能重復這套手機的語音對話規(guī)則。它必須考慮許多因素，例如用戶說話的環(huán)境，周圍環(huán)境中的噪音，用戶不準確的發(fā)音或方言。這需要前端技術更準確地模擬人體結構并模擬機器人的聽覺系統(tǒng)，以達到解放雙手之間自由對話的目的。