語(yǔ)音技術(shù)的發(fā)展將在未來(lái)進(jìn)行普及化
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來(lái)源:資本實(shí)驗(yàn)室)
在過(guò)去,我們已經(jīng)見(jiàn)證了語(yǔ)音技術(shù)的快速發(fā)展,比如谷歌的Siri、亞馬遜的Alexa。但是,盡管它們?cè)谌粘I钪泻苡杏?,仍然沒(méi)有達(dá)到人類的預(yù)期。
語(yǔ)音是一種趨向于有機(jī)和自由流動(dòng)的媒介,這種媒介不容易轉(zhuǎn)化為數(shù)字技術(shù)。隨著人工智能和計(jì)算機(jī)學(xué)習(xí)程序在未來(lái)十年的發(fā)展,預(yù)計(jì)語(yǔ)音解釋和語(yǔ)音創(chuàng)建軟件將穿越目前的神秘山谷,進(jìn)入一個(gè)與人類更為平行的領(lǐng)域。在不遠(yuǎn)的將來(lái),語(yǔ)音命令和語(yǔ)音助手將被證明對(duì)我們的日常生活更有用,也將使各種人類技術(shù)界面之間的界限變得模糊。隨著各行業(yè)的基礎(chǔ)技術(shù)(人工智能、語(yǔ)音處理、機(jī)器學(xué)習(xí))的發(fā)展,它只會(huì)被賦予更大的技術(shù)重要性。
在語(yǔ)音技術(shù)領(lǐng)域,最前沿的一個(gè)方向是神經(jīng)語(yǔ)言規(guī)劃,即NLP。這種新的編程語(yǔ)言將使得計(jì)算機(jī)和系統(tǒng)理解語(yǔ)音的真正含義,還可以讓計(jì)算機(jī)理解潛藏在背后的人類語(yǔ)調(diào)、諷刺語(yǔ)氣、雙關(guān)語(yǔ),甚至更深層的上下文線索,如雙重含義。