AI專(zhuān)家:談企業(yè)級(jí)如何會(huì)話人工智能?
希臘哲學(xué)家亞里士多德認(rèn)為技術(shù)是大自然的延伸:建筑起重機(jī)延伸了人的雙手,而汽車(chē)取代了馬車(chē)。人類(lèi)的祖先如同先知和預(yù)言家,不斷尋找在不可預(yù)知的世界中前進(jìn)的線索。
但在全天候在線的世界中,超級(jí)計(jì)算機(jī)取代了人類(lèi)的神諭 - 邏輯合理的機(jī)器,其目的是幫助人類(lèi)做出決定,提供選擇或解決方案。
亞里士多德可能是對(duì)的。人工智能正在成為我們大腦100萬(wàn)億神經(jīng)連接的延伸。如果創(chuàng)造有效的人工智能是一項(xiàng)極其復(fù)雜的,即使不是幾乎不可能完成的任務(wù),它也反映了現(xiàn)代人希望人工智能能夠解決他無(wú)限的疑問(wèn)和困境的復(fù)雜真相。
人類(lèi)用戶越來(lái)越希望人工智能擁有類(lèi)似人類(lèi)的智能來(lái)揭露和解碼他的周?chē)h(huán)境。因此,AI必須破譯和解釋人類(lèi)無(wú)限的思想,以滿足他迷宮般的要求和追求。
采訪思科的AI專(zhuān)家
Vijay Ramakrishnan是思科機(jī)器學(xué)習(xí)/人工智能虛擬卓越中心的研究員,他談到了為企業(yè)會(huì)話應(yīng)用開(kāi)發(fā)機(jī)器的學(xué)習(xí)模型與對(duì)話系統(tǒng)。
會(huì)話AI意味著什么?
Vijay Ramakrishnan:會(huì)話AI是一組以機(jī)器學(xué)習(xí),自然語(yǔ)言處理和對(duì)話系統(tǒng)開(kāi)發(fā)為中心的工程學(xué)科,用于創(chuàng)建能夠智能地與人類(lèi)交互的AI代理。輸入方法傳統(tǒng)上是語(yǔ)音通過(guò)自動(dòng)語(yǔ)音識(shí)別(ASR)技術(shù)以及通過(guò)智能手機(jī)和鍵盤(pán)的文本。然而,我們看到視覺(jué)的出現(xiàn)(作為一種輸入方法)可以提高AI代理人的智能。這種系統(tǒng)的輸出可以從助理的自然語(yǔ)言響應(yīng)到屏幕上的顯示而變化。
企業(yè)的會(huì)話AI應(yīng)用程序如何與消費(fèi)者或?qū)W術(shù)環(huán)境有何不同?
Ramakrishnan:企業(yè)應(yīng)用程序與消費(fèi)者和學(xué)術(shù)應(yīng)用程序會(huì)避免多個(gè)業(yè)務(wù)知識(shí)庫(kù)深度聯(lián)系。
2018年,亞馬遜的Alexa Prize為參與者提供了一個(gè)目標(biāo),即建立一個(gè)可以與人類(lèi)聊天天氣或體育等隨機(jī)主題的代理。
在學(xué)術(shù)環(huán)境中,目標(biāo)是在閱讀理解中超越斯坦福大學(xué)的問(wèn)題/答案數(shù)據(jù)集等基準(zhǔn)數(shù)據(jù)集。該數(shù)據(jù)集是通過(guò)將維基百科的數(shù)據(jù)提供給眾包工作者進(jìn)行標(biāo)簽而構(gòu)建的。
對(duì)于企業(yè),AI應(yīng)用程序必須非常好地完成窄域任務(wù),例如預(yù)訂機(jī)票。此類(lèi)任務(wù)需要與客戶和業(yè)務(wù)數(shù)據(jù)的深層鏈接,這些數(shù)據(jù)往往是適當(dāng)?shù)?,并且尺寸小于公共?shù)據(jù)集。
因此,通過(guò)信息檢索技術(shù)解決用戶語(yǔ)音/文本到業(yè)務(wù)目標(biāo)是垂直領(lǐng)域的關(guān)鍵。其次,專(zhuān)門(mén)研究較小數(shù)據(jù)集合的機(jī)器學(xué)習(xí)模型,對(duì)于構(gòu)建準(zhǔn)確的企業(yè)級(jí)會(huì)話應(yīng)用非常重要。
在為企業(yè)設(shè)計(jì)語(yǔ)音助手時(shí),開(kāi)發(fā)者將面臨哪些挑戰(zhàn)?
Ramakrishnan:一個(gè)巨大的挑戰(zhàn)是如何從自動(dòng)語(yǔ)音識(shí)別(ASR)系統(tǒng)的錯(cuò)誤轉(zhuǎn)錄中恢復(fù)過(guò)來(lái)。企業(yè)擁有公司特定的代詞,如員工姓名,產(chǎn)品縮寫(xiě)和其他從未在ASR系統(tǒng)上接受過(guò)培訓(xùn)的專(zhuān)有名詞。
另一個(gè)挑戰(zhàn)是在企業(yè)環(huán)境中缺乏高質(zhì)量的標(biāo)簽數(shù)據(jù)。企業(yè)需要盡早投資數(shù)據(jù)收集,以獲得增量語(yǔ)言理解用戶的好處。此外,企業(yè)可以使用更大的公共數(shù)據(jù)集來(lái)增加其私有數(shù)據(jù)集,以便機(jī)器學(xué)習(xí)模型可以學(xué)習(xí)一般模式以及公司特定的文獻(xiàn)。
最后,企業(yè)需要使用更簡(jiǎn)單的機(jī)器學(xué)習(xí)模型來(lái)訓(xùn)導(dǎo)應(yīng)用程序,例如在他們的小數(shù)據(jù)集上進(jìn)行邏輯回歸。這些模型可以為大多數(shù)用例提供足夠的預(yù)測(cè)能力。隨著產(chǎn)品的成熟和培訓(xùn)數(shù)據(jù)量的增加,深度學(xué)習(xí)方法可用于獲得人類(lèi)語(yǔ)言理解的準(zhǔn)確性和精確性。
企業(yè)AI對(duì)有哪些障礙?
Ramakrishnan:將企業(yè)AI應(yīng)用程序國(guó)際化是推動(dòng)增長(zhǎng)的關(guān)鍵能力。
但是,如果團(tuán)隊(duì)不熟悉需要的語(yǔ)言,那么支持不同的語(yǔ)言是一項(xiàng)挑戰(zhàn)。在將應(yīng)用程序推廣到特定地理區(qū)域之前,企業(yè)需要制定如何支持每種語(yǔ)言的運(yùn)營(yíng)計(jì)劃,包括招聘國(guó)外的語(yǔ)言專(zhuān)家。
人工智能代理需要與人類(lèi)交互,使用語(yǔ)音,文本和視覺(jué)作為輸入方法等智能。比如亞馬遜和其他大企業(yè)正在引導(dǎo)未來(lái)。Jeff Bezos正在激勵(lì)創(chuàng)新者開(kāi)發(fā)可以與人類(lèi)談?wù)撾S機(jī)主題的AI代理。
但是對(duì)于企業(yè)而言,能夠開(kāi)發(fā)出垂直的,面向業(yè)務(wù)的任務(wù)的應(yīng)用程序至關(guān)重要,也無(wú)需那么非常完美。
當(dāng)會(huì)話式AI可以幫助客戶預(yù)訂機(jī)票或酒店時(shí),公司可以看到他們的機(jī)器學(xué)習(xí)的投資回報(bào)率。
企業(yè)會(huì)話AI傾向于使用較小的數(shù)據(jù)集,因?yàn)橐Wo(hù)相關(guān)的專(zhuān)有信息。
在商業(yè)中完善AI的另一個(gè)挑戰(zhàn)是克服專(zhuān)有名詞,公司特定縮寫(xiě),產(chǎn)品和類(lèi)似術(shù)語(yǔ)的錯(cuò)誤轉(zhuǎn)譯。開(kāi)發(fā)者可用各種方法準(zhǔn)確評(píng)估用戶的查詢,例如利用上下文信息。翻譯是另一項(xiàng)挑戰(zhàn)。公司應(yīng)該利用外語(yǔ)專(zhuān)家向開(kāi)發(fā)人員告之非母語(yǔ)的細(xì)微差別。