來自語音識別的人工智能給我們帶來了什么
(文章來源:未來科技視角)
隨著技術(shù)的發(fā)展,語音識別越來越滲透到我們的日常生活中,包括亞馬遜的Alexa、Apple的Siri、Microsoft的Corana或Google的許多語音響應(yīng)特征從我們的電話、電腦、手表乃至冰箱中,我們生活的每一個新的語音互動設(shè)備都會加深我們對人工智能(AI)和機器學(xué)習(xí)的依賴人工智能和機器學(xué)習(xí)人工智能是約翰·麥卡錫于1956年首次提出的。
在最初用于分析和快速計算數(shù)據(jù)的地方,人工智能現(xiàn)在允許計算機執(zhí)行通常僅由人類執(zhí)行的任務(wù)。機器學(xué)習(xí)是人工智能的一個子集,是指一個自學(xué)系統(tǒng)。
它涉及到教授計算機識別模式,而不是使用特定的規(guī)則對其進(jìn)行編程。訓(xùn)練過程包括向算法提供大量數(shù)據(jù),并從數(shù)據(jù)中學(xué)習(xí)和識別數(shù)據(jù)。在早期,程序員必須為他們想要識別的每一個對象(如人和狗)編寫代碼;現(xiàn)在,系統(tǒng)可以通過向每個系統(tǒng)顯示許多實例來識別兩者。隨著時間的推移,這些系統(tǒng)將變得更加智能化,無需人工干預(yù)機器學(xué)習(xí)有許多不同的技術(shù)和方法這些方法之一是人工神經(jīng)網(wǎng)絡(luò),其一個例子是產(chǎn)品推薦。
電子商務(wù)公司通常使用人工神經(jīng)網(wǎng)絡(luò)來展示用戶更有可能購買的產(chǎn)品他們可以從所有用戶的瀏覽體驗中提取數(shù)據(jù),并使用這些信息提供有效的產(chǎn)品推薦。Rv的自動轉(zhuǎn)錄是由自動語音識別(ASR)和自然語言處理(NLP)驅(qū)動的。ASR將口語單詞轉(zhuǎn)換為文本,而NLP處理文本以獲得其含義。
由于人類經(jīng)常用口語體、短小和初始語說話,因此需要大量的計算機分析自然語言,才能產(chǎn)生準(zhǔn)確的轉(zhuǎn)錄。語音識別技術(shù)的挑戰(zhàn)正面臨著許多挑戰(zhàn)但范圍縮小了這些包括克服低劣的錄音設(shè)備、背景噪音、難以理解的口音和方言,以及人們聲音的變化。
教機器學(xué)習(xí)人類的口語閱讀能力還沒有達(dá)到完美。傾聽并理解一個人所說的遠(yuǎn)比聽到一個人的話更重要。作為一個人,我們通過人的眼睛、面部表情、肢體語言、語調(diào)和語調(diào)來解釋話語的意義。另一種發(fā)音的Nuance是人類傾向于縮短某些短語(例如,"我不知道"變成"我不知道")這種人工傾向?qū)φZ音識別中的機器學(xué)習(xí)構(gòu)成了另一個挑戰(zhàn)。機器學(xué)習(xí)聽口音、情緒和曲率,但仍有很長的路要走隨著技術(shù)越來越復(fù)雜并且特定的算法使用更多的數(shù)據(jù),這些挑戰(zhàn)正在迅速克服隨著人工智能的發(fā)展和機器學(xué)習(xí)所需的大量語音數(shù)據(jù)的容易挖掘,它成為下一個重要的交互界面也就不足為奇了。