智能系統(tǒng)8大展望:2013將成發(fā)展元年
2012年對許多人來說利用語音控制手機、汽車、電腦甚至是電視機都是非常平常的事了。之所以如此,是因為語音識別和自然語言理解(NLU)領域取得了重大進步。不久前還被認為是科幻小說里才會出現(xiàn)的產品功能,現(xiàn)在已經變成主流手機和消費設備的基本功能。語音用戶界面和“虛擬個人助手”已經成為福特、三星、蘋果和谷歌(微博)等企業(yè)開展廣告營銷活動時重點宣傳的一個關鍵特色,這一特色將會引起前所未有的關注和市場需求。
人們對這些全新的語音驅動用戶界面抱有很大的熱情。許多報道指出,用戶對他們的新“助手”充滿感情。不過,許多人也認識到,這些系統(tǒng)仍在不斷改進中,需要不斷的創(chuàng)新。預計,現(xiàn)有的虛擬個人助手將演變成無處不在的智能系統(tǒng),通過語音、文本、視覺、觸覺和手勢與人進行互動,并將基于周圍的環(huán)境信息,如位置等,讓所有互動具有更大的相關性。
以下是對2013年智能系統(tǒng)發(fā)展的8點展望:
1、語音識別精度更高
語音識別是智能系統(tǒng)技術的基礎,語音識別的準確性一直在穩(wěn)步提高,之所以這么說,是因為現(xiàn)在已經把更加豐富的訓練數據、更加強大的計算能力以及全新更加復雜的建模方法(如目前非常流行的基于人腦如何完成模式識別的技術“深度信念網”( Deep Belief Networks))結合在一起,提高了語音識別的精度。
2、設備將具備更強的識別能力
不管是在城市街道上,還是在汽車里或客廳里,語音識別的功能性和精確性正越來越高。一流的信號處理能夠區(qū)分不同的聲音,語音生物統(tǒng)計學有助于判定誰在說話。并排的多個麥克風能夠動態(tài)引導“聽光束”,并可在攝像頭的輔助下跟蹤用戶的位置。因此,在與用戶聯(lián)系更加緊密的移動設備上應用這項功能,將會提高移動設備的識別能力。
3、設備將具備更強的感知能力
未來完成一項任務可減少許多必需的步驟,如必須選擇設備、打開設備、找到目標應用、啟動應用,然后與應用互動。不久,用戶將可以簡單地用自然語言告訴處于睡眠狀態(tài)的設備干什么——不用觸碰它。具備這種低功耗模式狀態(tài)下聽功能的設備將可以鑒別用戶,并通過逐步喚醒其處理器的其他功能來確認要求的操作,最終按照要求完成相應的操作。
4、互動性的普遍性和連續(xù)性
隨著語音識別技術和自然語言理解技術的發(fā)展,用戶希望能夠在不同設備(智能手機、平板電腦、電視或汽車)的顯示屏上進行互動,并擁有一致的體驗。用戶可以在一臺設備上開始任務,在另一臺設備上完成任務。這種互動將通過基于客戶識別器和云識別器,以及自然語言理解引擎的框架聯(lián)系在一起。用戶的互動歷史將被聚合在云端,用來改進識別模型,以便在其他所有相關設備中應用。
5、自然語言處理和人工智能將更加智能化
自然語言理解(猜測用戶輸入并據此操作的意圖)的能力也在不斷提高。今天的一流技術把功能強大的語言框架(被稱作符號處理)、知識顯示法(知識本體)和利用大數據用觀察到的例子和模型來填充框架的機器學習結合在一起。這種互補性至關重要:過去的符號方法被證明是不可靠的,純數據驅動型自然語言理解一般僅是膚淺的理解。
智能系統(tǒng)現(xiàn)在已從對任務目標的預定程序描述遷移至以用戶的背景、參數選擇和互動歷史為條件的動態(tài)操作,系統(tǒng)據此有效地自我編程。這將允許我們從簡單的任務向更加復雜的任務過渡,可能必須訪問協(xié)調工作流中的各種應用和信息源。
比如,為了響應“核查下比爾(Bill)和艾利森(Allison)明天晚上是否來吃飯”的請求,手機個人助手將確定最喜愛的飯店,并基于通信歷史來決定你所說的是哪個比爾和艾利森,同時聯(lián)系對方的虛擬助手核對他們的安排,并草擬一份有關預定和人員組成等信息的電子郵件發(fā)給對方。
這種推理屬于人工智能范疇,不過,早期系統(tǒng)可靠性差,新一代系統(tǒng)將依靠一種被稱為“非單調推理”的更加靈活和穩(wěn)健的方法,在模糊狀態(tài)下表現(xiàn)更好,并生成近似的解決方案,盡管可能無法給出準確的解決方案。
6、語義搜索將直接訪問信息
理解用戶意圖可以穿過多個屏幕的應用圖標、文件夾和子文件夾,或一系列中間網頁。在搜索方面,頻繁提問的自然語言理解應用可以跳過搜索引擎檢索的所有象征性鏈接列表,直接導向希望的目的地。這種快速和直接訪問信息的功能非常強大,潛在地威脅到普通的搜索業(yè)務。一些搜索服務提供商也開始測試用直接應答提問來替代網頁鏈接,不過,他們現(xiàn)在還不允許用戶直接獲取想要的第三方內容。
7、用戶關注虛擬助手
用戶服務業(yè)務很難按照有效和可理解的方式組織成菜單結構——不管是在互動語音應答(IVR)系統(tǒng),還是在移動應用中。專業(yè)化虛擬助手的自然語言理解將完全繞開互動語音應答系統(tǒng)直接訪問信息,此外還將支持靈活的對話,允許用戶前瞻性地提供未受提示的信息,任意在不同聯(lián)系中心功能間切換。
8、自然語言理解將改進醫(yī)療保健
醫(yī)師利用語音識別系統(tǒng)來描述包含大量關鍵信息的接診患者病情,但這很難實現(xiàn)共享。利用自然語言理解應用,與醫(yī)學有關的事實將被篩選并被輸入電子健康記錄數據庫。自動化事實篩選的精度現(xiàn)在已經接近人工操作,使得系統(tǒng)可以幫助醫(yī)師“說清”患者的病情。改進的患者信息記錄能被進一步處理,以分配帳單代碼,節(jié)約成本,提高信息和護理的質量。
綜合利用這些進步表明新一代計算——第三代計算革命的開始,意義相當于引入圖形和觸摸用戶界面。自然語言理解和人工智能在設備功耗管理、快速網絡以及基于云的內容、服務和應用領域取得了長足的進步,并發(fā)揮了巨大作用。
2013年將是智能系統(tǒng)年,期待著那些夢幻般的智能應用能夠盡快變成現(xiàn)實。