智能語(yǔ)音助手的原理_預(yù)測(cè)智能語(yǔ)音助手的未來(lái)
語(yǔ)音助手能和人類進(jìn)行深度交談的背后,離不開自然語(yǔ)言處理(NLP)和自然語(yǔ)言生成(NLG)這兩種基礎(chǔ)技術(shù)。機(jī)器學(xué)習(xí)的這兩個(gè)分支使得語(yǔ)音助手能夠?qū)⑷祟愓Z(yǔ)言轉(zhuǎn)換為計(jì)算機(jī)命令,反之亦然。
什么是NLP?NLP指在計(jì)算機(jī)讀取語(yǔ)言時(shí)將文本轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)的過(guò)程。簡(jiǎn)而言之,NLP是計(jì)算機(jī)的閱讀語(yǔ)言??梢源致缘卣f(shuō),在NLP中,系統(tǒng)攝取人語(yǔ),將其分解,分析,確定適當(dāng)?shù)牟僮?,并以人類理解的語(yǔ)言進(jìn)行響應(yīng)。NLP結(jié)合了計(jì)算機(jī)科學(xué)、人工智能和計(jì)算語(yǔ)言學(xué),涵蓋了以人類理解的方式解釋和生成人類語(yǔ)言的所有機(jī)制:語(yǔ)言過(guò)濾、情感分析、主題分類、位置檢測(cè)等。
什么是NLG?
自然語(yǔ)言處理由自然語(yǔ)言理解(NLU)和自然語(yǔ)言生成(NLG)構(gòu)成。NLG是計(jì)算機(jī)的“編寫語(yǔ)言”,它將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為文本,以人類語(yǔ)言表達(dá)。即能夠根據(jù)一些關(guān)鍵信息及其在機(jī)器內(nèi)部的表達(dá)形式,經(jīng)過(guò)一個(gè)規(guī)劃過(guò)程,來(lái)自動(dòng)生成一段高質(zhì)量的自然語(yǔ)言文本。
對(duì)于“AI語(yǔ)音識(shí)別”,每一個(gè)“語(yǔ)音識(shí)別”都是APP,這個(gè)APP里面內(nèi)置著我們常用字的“標(biāo)準(zhǔn)發(fā)音字庫(kù)“,同時(shí),為了讓軟件能否識(shí)別我們“不標(biāo)準(zhǔn)的發(fā)音”,軟件還需要AI編程語(yǔ)言對(duì)我們不標(biāo)準(zhǔn)的發(fā)音做評(píng)分,然后做比對(duì),最后選擇評(píng)分最高的那一個(gè)“標(biāo)準(zhǔn)發(fā)音”作為我們“不標(biāo)準(zhǔn)發(fā)音”的字庫(kù)!
1.語(yǔ)音識(shí)別的基本原理語(yǔ)音識(shí)別系統(tǒng)本質(zhì)上是一種模式識(shí)別系統(tǒng),包括特征提取、模式匹配、參考模式庫(kù)等三個(gè)基本單元,它的基本結(jié)構(gòu)如下圖所示:
語(yǔ)音識(shí)別系統(tǒng)構(gòu)建過(guò)程整體上包括兩大部分:訓(xùn)練和識(shí)別。訓(xùn)練通常是離線完成的,對(duì)預(yù)先收集好的海量語(yǔ)音、語(yǔ)言數(shù)據(jù)庫(kù)進(jìn)行信號(hào)處理和知識(shí)挖掘,獲取語(yǔ)音識(shí)別系統(tǒng)所需要的“聲學(xué)模型”和“語(yǔ)言模型”;而識(shí)別過(guò)程通常是在線完成的,對(duì)用戶實(shí)時(shí)的語(yǔ)音進(jìn)行自動(dòng)識(shí)別。自動(dòng)語(yǔ)音識(shí)別技術(shù)有三個(gè)基本原理:首先語(yǔ)音信號(hào)中的語(yǔ)言信息是按照短時(shí)幅度譜的時(shí)間變化模式來(lái)編碼;其次語(yǔ)音是可以閱讀的,即它的聲學(xué)信號(hào)可以在不考慮說(shuō)話人試圖傳達(dá)的信息內(nèi)容的情況下用數(shù)十個(gè)具有區(qū)別性的、離散的符號(hào)來(lái)表示;第三語(yǔ)音交互是一個(gè)認(rèn)知過(guò)程,因而不能與語(yǔ)言的語(yǔ)法、語(yǔ)義和語(yǔ)用結(jié)構(gòu)割裂開來(lái)。
2.工作原理第一步,把幀識(shí)別成狀態(tài)(難點(diǎn))。
第二步,把狀態(tài)組合成音素。
第三步,把音素組合成單詞。
3.工作流程
一般來(lái)說(shuō),一套完整的語(yǔ)音識(shí)別系統(tǒng)其工作過(guò)程分為7步:
?、賹?duì)語(yǔ)音信號(hào)進(jìn)行分析和處理,除去冗余信息。
?、谔崛∮绊懻Z(yǔ)音識(shí)別的關(guān)鍵信息和表達(dá)語(yǔ)言含義的特征信息。
?、劬o扣特征信息,用最小單元識(shí)別字詞。
?、馨凑詹煌Z(yǔ)言的各自語(yǔ)法,依照先后次序識(shí)別字詞。
⑤把前后意思當(dāng)作輔助識(shí)別條件,有利于分析和識(shí)別。
?、薨凑照Z(yǔ)義分析,給關(guān)鍵信息劃分段落,取出所識(shí)別出的字詞并連接起來(lái),同時(shí)根據(jù)語(yǔ)句意思調(diào)整句子構(gòu)成。
⑦結(jié)合語(yǔ)義,仔細(xì)分析上下文的相互聯(lián)系,對(duì)當(dāng)前正在處理的語(yǔ)句進(jìn)行適當(dāng)修正。
預(yù)測(cè)智能語(yǔ)音助手的未來(lái)1.語(yǔ)境理解提供個(gè)性化回應(yīng):目前而言,市場(chǎng)上的智能助理大多缺乏語(yǔ)境理解。
2.語(yǔ)音區(qū)分:語(yǔ)音助理或?qū)⑼ㄟ^(guò)區(qū)分語(yǔ)音,提供更多個(gè)性化體驗(yàn)。
3.不僅是手機(jī):Amazon Alexa副總裁Steve Rabuchin表示:“我們希望客戶可以隨時(shí)隨地訪問Alexa,這意味著客戶可以通過(guò)語(yǔ)音遙控他們的汽車、冰箱、恒溫器、燈具以及家中內(nèi)外的各種設(shè)備?!?/p>
4.搜索行為的變化:語(yǔ)音搜索一直是熱門話題。但語(yǔ)音的可見性將是巨大的挑戰(zhàn)。
5.語(yǔ)音通知:在移動(dòng)應(yīng)用營(yíng)銷方面,語(yǔ)音智能也提出了新的挑戰(zhàn)-用戶參與度和維護(hù)度。
6.信息安全問題:隨著語(yǔ)音支付越來(lái)越方便,更多用戶選擇語(yǔ)音支付。支持智能語(yǔ)音的智能家居設(shè)備等也涉及大量用戶隱私和用戶習(xí)慣,其安全性也成為用戶關(guān)注的焦點(diǎn)。
語(yǔ)音助手