阿里智能對(duì)話交互實(shí)踐及范式思考
掃描二維碼
隨時(shí)隨地手機(jī)看文章
縱觀傳統(tǒng)互聯(lián)網(wǎng)時(shí)代,如果用一個(gè)詞來(lái)總結(jié)和概括的話,“連接”這詞再合適不過(guò)了,傳統(tǒng)互聯(lián)網(wǎng)時(shí)代主要建立了三種連接:第一,人和信息的連接;第二,人和人的連接;第三,人與商品服務(wù)的連接。第一種連接成就了Google和百度這樣的互聯(lián)網(wǎng)巨頭;人和人的連接成就了Facebook和騰訊這樣的互聯(lián)網(wǎng)公司,人和商品服務(wù)的連接,成就了Amazon、阿里巴巴、京東這樣的巨頭。從這個(gè)意義上看,傳統(tǒng)互聯(lián)網(wǎng)最典型的特征就是連接。
過(guò)去3-4年,我們可以看到,互聯(lián)網(wǎng)其實(shí)發(fā)生很大變化,交互的設(shè)備已經(jīng)從PC和智能手機(jī)延伸到更廣泛的智能設(shè)備。智能設(shè)備的快速發(fā)展正在改變著人類(lèi)和設(shè)備的交互方式。不難看出,無(wú)論是智能設(shè)備的發(fā)展和普及,還是用戶的接受度都在快速增長(zhǎng),都促使人和設(shè)備之間交互方式的巨大改變,我們已經(jīng)進(jìn)入“交互時(shí)代“。
正在發(fā)生的變化
那么,交互時(shí)代,人和設(shè)備究竟如何通過(guò)自然語(yǔ)言對(duì)話展開(kāi)對(duì)話交互的呢?首先,對(duì)話交互的特點(diǎn),我認(rèn)為主要有以下四點(diǎn):
1、人和智能設(shè)備的交互一定是自然語(yǔ)言。因?yàn)閷?duì)于人來(lái)說(shuō),自然語(yǔ)言是最自然的方式,也是門(mén)檻最低的方式。
2、人和設(shè)備的對(duì)話交互應(yīng)該是雙向的。
3、人和設(shè)備的對(duì)話交互是多輪的。為了完成一個(gè)任務(wù),比如定機(jī)票,這里會(huì)涉及多輪交互。
4、上下文的理解。這是對(duì)話交互和傳統(tǒng)的搜索引擎最大的不同之處,傳統(tǒng)搜索是關(guān)鍵詞,前后的關(guān)鍵詞是沒(méi)有任何關(guān)系的。對(duì)話交互實(shí)際上是要考慮到上下文,在當(dāng)前的上下文理解這句話什么意思。
從連接到對(duì)話交互,一個(gè)本質(zhì)的改變是什么?舉個(gè)例子,比如淘寶網(wǎng)首頁(yè),拋開(kāi)內(nèi)容,其本質(zhì)就是鏈接和按鈕。對(duì)于用戶來(lái)說(shuō),無(wú)論是點(diǎn)擊鏈接還是按鈕,他的行為完全是由產(chǎn)品經(jīng)理定義好的和是完全確定的,所以它是一種受控、受限的行為,這種方式并不能確保好的用戶體驗(yàn)。
而對(duì)話交互,用戶可以說(shuō)任何內(nèi)容,天文、地理,包羅萬(wàn)象。我認(rèn)為這背后的本質(zhì)改變就是從“確定性”轉(zhuǎn)變?yōu)?ldquo;不確定性”。實(shí)際上,后面無(wú)論是算法還是交互設(shè)計(jì),基本上都想辦法提高語(yǔ)言理解的確定性或者是降低交互設(shè)計(jì)的不確定性。
阿里巴巴在智能對(duì)話交互方向上的進(jìn)展和實(shí)踐
下面介紹下阿里巴巴在智能對(duì)話交互方向的進(jìn)展和實(shí)踐。先看對(duì)話交互邏輯的概況,傳統(tǒng)的對(duì)話交互大概會(huì)分以下幾個(gè)模塊,從云識(shí)別把語(yǔ)言轉(zhuǎn)成文字,語(yǔ)言理解是把用戶說(shuō)的文字轉(zhuǎn)化成一種結(jié)構(gòu)化的表示,對(duì)話管理是根據(jù)剛才那些結(jié)果來(lái)決定采取什么樣的合作。在語(yǔ)言設(shè)置這一塊就是根據(jù)acTIon生成一句話,通過(guò)一種比較自然的方式把它讀出來(lái)。
我認(rèn)為現(xiàn)在人機(jī)交互和傳統(tǒng)的人機(jī)交互一個(gè)主要不同點(diǎn)就在于數(shù)據(jù)和服務(wù)。隨著互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)和服務(wù)越來(lái)越豐富,那人機(jī)交互的目的是什么?歸根到底還是想獲取互聯(lián)網(wǎng)的信息和各種各樣的服務(wù)。