語(yǔ)音識(shí)別發(fā)展?jié)u趨成熟，未來(lái)或成生物識(shí)別主流方式

時(shí)間：2020-05-19 23:09:02

關(guān)鍵字：語(yǔ)音識(shí)別生物識(shí)別語(yǔ)音識(shí)別技術(shù) 語(yǔ)音識(shí)別系統(tǒng)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] （文章來(lái)源：最極客） ? ? ?? 語(yǔ)音識(shí)別技術(shù)，也被稱為自動(dòng)語(yǔ)音識(shí)別（ASR）。其目標(biāo)是將人類語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的數(shù)據(jù)，如字符序列或二進(jìn)制編碼等。不過(guò)，早在計(jì)算機(jī)發(fā)明之前，人

（文章來(lái)源：最極客）
? ? ?? 語(yǔ)音識(shí)別技術(shù)，也被稱為自動(dòng)語(yǔ)音識(shí)別（ASR）。其目標(biāo)是將人類語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的數(shù)據(jù)，如字符序列或二進(jìn)制編碼等。不過(guò)，早在計(jì)算機(jī)發(fā)明之前，人類就已經(jīng)開(kāi)始了對(duì)語(yǔ)音識(shí)別技術(shù)的研究，早期的聲碼器即可看作是語(yǔ)音識(shí)別及合成的雛形。1920年代生產(chǎn)的“Radio Rex”玩具狗可能是最早的語(yǔ)音識(shí)別器。只要呼喚這只狗的名字，他就會(huì)從底座上彈出來(lái)。

1952年，貝爾研究所的Davis等人開(kāi)發(fā)了Audrey語(yǔ)音識(shí)別系統(tǒng)，成為世界上首個(gè)能夠識(shí)別10個(gè)英文數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng)。其識(shí)別方法主要是追蹤語(yǔ)音中的共振峰，該系統(tǒng)的準(zhǔn)確率為98%。到1950年代末，College of London（倫敦學(xué)院）將語(yǔ)法概率加入語(yǔ)音識(shí)別中。

1960年，英國(guó)的Denes等人研究成功了第一個(gè)計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)，同時(shí)人工神經(jīng)網(wǎng)絡(luò)被引入語(yǔ)音識(shí)別。70年代后，語(yǔ)音識(shí)別在孤立詞及小詞匯量的識(shí)別方面取得了實(shí)質(zhì)性進(jìn)展。到了80年代，研究重點(diǎn)轉(zhuǎn)向大詞匯量、非特定人連續(xù)語(yǔ)音識(shí)別。與此同時(shí)，語(yǔ)音識(shí)別的研究思路由傳統(tǒng)的基于標(biāo)準(zhǔn)模板匹配的技術(shù)轉(zhuǎn)為基于HMM（統(tǒng)計(jì)模型）的技術(shù)，并再次提出將神經(jīng)網(wǎng)絡(luò)技術(shù)引入語(yǔ)音識(shí)別領(lǐng)域的技術(shù)思路。

1981年，日本在第五代計(jì)算機(jī)計(jì)劃中提出了關(guān)于語(yǔ)音識(shí)別輸入-輸出自然語(yǔ)言的目標(biāo)。盡管沒(méi)有按照預(yù)期實(shí)現(xiàn)，但關(guān)于語(yǔ)音識(shí)別技術(shù)的研究有了大幅度的提升和進(jìn)展。1987年開(kāi)始，日本又出臺(tái)了高級(jí)人機(jī)口語(yǔ)接口和自動(dòng)電話翻譯系統(tǒng)的項(xiàng)目。進(jìn)入90年代以后，在語(yǔ)音識(shí)別的系統(tǒng)框架方面并沒(méi)有什么重大突破。但是，在語(yǔ)音識(shí)別技術(shù)的應(yīng)用及產(chǎn)品化方面出現(xiàn)了很大的進(jìn)展。

中國(guó)的語(yǔ)音識(shí)別發(fā)展研究起始于1958年，由中國(guó)科學(xué)院聲學(xué)所利用電子管電路識(shí)別10個(gè)元音。1973年，中國(guó)科學(xué)院聲學(xué)所開(kāi)始了對(duì)計(jì)算機(jī)語(yǔ)音識(shí)別的研究。由于當(dāng)時(shí)被條件所限，中國(guó)語(yǔ)音識(shí)別研究工作一直處于緩慢發(fā)展的狀態(tài)。

1986年3月，中國(guó)高科技發(fā)展計(jì)劃（863計(jì)劃）啟動(dòng)，因?yàn)檎Z(yǔ)音識(shí)別是智能計(jì)算機(jī)系統(tǒng)研究的一個(gè)重要組成部分，故而被專門(mén)列為研究課題。在863計(jì)劃的支撐下，中國(guó)開(kāi)始了有組織的語(yǔ)音識(shí)別技術(shù)的研究。由此，中國(guó)語(yǔ)音識(shí)別技術(shù)進(jìn)入了一個(gè)前所未有的發(fā)展階段。

2006年深度學(xué)習(xí)興起，2009年深度學(xué)習(xí)首次在語(yǔ)音識(shí)別任務(wù)中取得成功，基于深度學(xué)習(xí)的語(yǔ)音識(shí)別取得了很大的突破。在技術(shù)方面，語(yǔ)音識(shí)別從最初的前饋全連接神經(jīng)網(wǎng)絡(luò)，到之后的遞歸神經(jīng)網(wǎng)絡(luò)，到長(zhǎng)短時(shí)記憶模型，再到當(dāng)前包含數(shù)十層結(jié)構(gòu)的深層全卷積神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)結(jié)構(gòu)愈加復(fù)雜，但也越來(lái)越能夠契合語(yǔ)音的特性從而實(shí)現(xiàn)建模，相應(yīng)的效果也愈發(fā)顯著。

當(dāng)下，基于深度學(xué)習(xí)的語(yǔ)音識(shí)別系統(tǒng)已經(jīng)通過(guò)海量的用戶大數(shù)據(jù)訓(xùn)練得到了一個(gè)通用的識(shí)別系統(tǒng)，在日常場(chǎng)合已經(jīng)能夠?qū)崿F(xiàn)應(yīng)用。技術(shù)的成熟以及廣闊的前景使得許多互聯(lián)網(wǎng)公司也紛紛入局語(yǔ)音識(shí)別領(lǐng)域。

去年12月，阿里巴巴宣布為上海全部地鐵站的售票機(jī)安裝語(yǔ)音識(shí)別技術(shù)，用以驗(yàn)證上班族的身份?？拼笥嶏w也在安徽為醫(yī)療信息提供語(yǔ)音簽名服務(wù)，同時(shí)為警方提供語(yǔ)音識(shí)別服務(wù)。此外，百度、騰訊也分別在語(yǔ)音識(shí)別領(lǐng)域有所動(dòng)作。由此可見(jiàn)，語(yǔ)音識(shí)別技術(shù)很可能成為繼人臉識(shí)別技術(shù)后的下一個(gè)生物識(shí)別的主流方式，并逐漸受到廣泛的關(guān)注和消費(fèi)級(jí)的應(yīng)用。但在發(fā)展過(guò)程中，仍然不可避免地會(huì)遭遇一些瓶頸。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國(guó)博世”

9月2日消息，不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變?cè)撇捎煤凸芾矸绞?/a>

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動(dòng)工具SODA V將顛覆汽車(chē)市場(chǎng)，使汽車(chē)開(kāi)發(fā)時(shí)間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字：汽車(chē) 人工智能智能驅(qū)動(dòng) BSP

[美通社全球TMT]

從容應(yīng)對(duì)未知風(fēng)險(xiǎn)----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行，同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn)，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國(guó)游戲市場(chǎng)開(kāi)始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報(bào)道，騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語(yǔ)權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機(jī) 衛(wèi)星通信

[美通社全球TMT]

中國(guó)通信服務(wù)公布2024年中期業(yè)績(jī)

要點(diǎn)：有效應(yīng)對(duì)環(huán)境變化，經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升落實(shí)提質(zhì)增效舉措，毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競(jìng)爭(zhēng)力堅(jiān)持高質(zhì)量發(fā)展策略，塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字：通信 BSP 電信運(yùn)營(yíng)商數(shù)字經(jīng)濟(jì)

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動(dòng)產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]

軟通動(dòng)力與長(zhǎng)三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上，軟通動(dòng)力信息技術(shù)（集團(tuán)）股份有限公司（以下簡(jiǎn)稱"軟通動(dòng)力"）與長(zhǎng)三角投資（上海）有限...

關(guān)鍵字： BSP 信息技術(shù)