注重交互將是企業(yè)服務(wù)機器人未來大趨勢
人工智能有三大領(lǐng)域:視覺、語音、語義。其中,圖像和語音算法成熟度已經(jīng)很高,且要遠遠高于語義。在中文機器閱讀理解比賽中,人的準(zhǔn)確率大概是 95%,機器做到的最高水平只有 80%,還有 15% 的差距,這是一個挑戰(zhàn),也是一個機會。
具體應(yīng)用上,目前來看,比較多的人工智能公司,首先需要在企業(yè)服務(wù)方面落腳,這是最容易看到的商業(yè)模式,也是 AI 技術(shù)最容易被認(rèn)可的一個商業(yè)模式。
企業(yè)服務(wù)機器人 VS 聊天機器人,差別在哪?
今天主要針對企業(yè)服務(wù)機器人展開介紹。
首先說下企業(yè)服務(wù)機器人和聊天機器人的差別。第一,聊天機器人一般是虛擬形象,說話不要求很嚴(yán)謹(jǐn),反而是比較風(fēng)趣,這種機器人一般叫情感陪護型機器人。而企業(yè)服務(wù)機器人代表企業(yè)形象,代表企業(yè)去服務(wù)顧客,表達和對話都比較嚴(yán)謹(jǐn),說話要負責(zé),不能隨便回答。
第二,兩種機器人的技術(shù)路徑也不一樣,企業(yè)服務(wù)機器人是一個垂直領(lǐng)域,在專業(yè)領(lǐng)域和用戶對話,而不是開放的聊天,從這個角度來看技術(shù)難度變輕了;但是和通用機器人相比,它對準(zhǔn)確率要求更高。
然后接下來,我們來探討怎么做好企業(yè)服務(wù)機器人。
想做一個客服機器人,核心要把語義理解、意圖理解做好。舉個例子,一個電商產(chǎn)品不同用戶有不同的反饋,比如“要買的裙子怎么沒有腰帶?”或者“充電器為什么沒有一起寄過來?”這些問題看起來很雜,但背后語義都是同一個,就是商品零配件少發(fā)了。
在解決意圖理解上,技術(shù)路線上經(jīng)歷了好幾輪變遷。2000 年左右就已經(jīng)有企業(yè)服務(wù)機器人這種產(chǎn)品形態(tài),只是當(dāng)時解決意圖理解的技術(shù)比較簡陋。早期是用本體 + 句法模板的方式來實現(xiàn),比如用本體完成理解詞的問題,用句法模板完成理解對句的問題。
隨后像百度、Google 等公司興起以后,搜索技術(shù)也被用在客服機器人里。在這個階段,一般用同義詞的方式解決詞關(guān)系的問題,用詞權(quán)重解決抽象核心語義的問題,用文本相關(guān)性解決匹配的問題。
再后來深度學(xué)習(xí)技術(shù)出現(xiàn),在語義理解上,深度學(xué)習(xí)相比之前的技術(shù)有很大提升。
基于深度學(xué)習(xí)的語義理解
那么深度學(xué)習(xí),又是如何解決語義理解?
在計算機里面,用文本方式表示的語言,比如漢語和英文,是一種符號,但這不是計算機能理解的符號。計算機可以理解的是向量和矩陣,無論是語音、圖像還是語言,深度學(xué)習(xí)都是把這些原始信號轉(zhuǎn)換成計算機能理解的向量和矩陣,才能更好地做計算。
首先完成將語言當(dāng)中的詞轉(zhuǎn)換為向量,然后通過一個深度神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)化成句的向量,再通過句的向量進行更豐富的計算。
這個過程中,會用到注意力模型,注意力模型最早來源于圖像理解。舉個例子,人進入到會議室,首先不會去注意有多少板凳,雖然板凳這些信息占據(jù)面挺大,但人首先會挑選自己注意的東西去看,比如說注意來了哪些人,因為人在觸摸信號時會選擇性地去挑選。語言也是這樣,用戶說了很長一段話,注意力模型能夠在很長的文本中,發(fā)現(xiàn)用戶主要表達的信號。比如一個用戶說“昨天剛收到貨,今天天氣不錯,和朋友一起出去玩,一劈腿褲子開衩了”,前面的話都沒有意義,他最想表達的意思是褲子開縫了,是想退貨或換貨。對于一個客服機器人來說,這是它要抓住的重點。
注意力模型之后是映射層,相當(dāng)于完成一個歸一化,之后機器人才知道怎么去回復(fù)用戶。
閱讀理解
剛才講的都是需要人事先把知識庫整理好給機器人用,為在線機器人去解析、調(diào)用、推理。還有一類,可能所有的知識都是一些原始文檔,它們沒有形成知識庫。比如一家銀行有很多線下商家優(yōu)惠活動的書面文檔,這類活動經(jīng)常更新替換,沒有人可以完全記住這些文檔內(nèi)容,反而是機器比較擅長做這個事情。假設(shè)有一個用戶問題,需要從文檔當(dāng)中找答案,首先機器要找到哪個文檔可以解答,再找到文檔當(dāng)中哪一句話可以解答,這個過程叫閱讀理解。
閱讀理解在國外比賽已經(jīng)做的挺久,國內(nèi)才剛剛開始,這一塊的技術(shù)還是比較新。
機器人知識庫的運營
剛才講了客服機器人在線處理用戶的請求,理解用戶的請求,其實客服機器人還做了很多離線的工作。一個機器人并不僅僅是一個在線的服務(wù),它是一個離線服務(wù)和在線服務(wù)同時包含的系統(tǒng)工程。
機器人解答不了用戶的問題,有時候并不是因為意圖理解不夠好,而是機器人沒有知識去應(yīng)對當(dāng)前的回答。這就是知識庫運營所要解決的問題,有幾個方面:
一是新知識點的發(fā)現(xiàn)。有些熱點的知識點用戶已經(jīng)在問,但是知識庫里面是缺失的,這部分問題可以交給運營人員添加相應(yīng)的問題回答。
二是知識點的細化。一開始機器人的知識點沒有深入到用戶的問題細節(jié)里面,這種情況可以細化,把一個知識點拆分成多個知識點。
三是知識點的優(yōu)化。比如說客戶看到了機器人回答,但是仍然轉(zhuǎn)人工了,這是因為答案并沒有解決問題,說明答案需要進一步優(yōu)化。
機器人的產(chǎn)品能力
除了返回用戶答案外,機器人還需要更多能力,優(yōu)化產(chǎn)品和運營。
一是熱點分析。比如在一個電商后臺系統(tǒng)中,用戶請求有集中性或爆發(fā)性,那很可能是產(chǎn)品上集中的事故,這種現(xiàn)象跟產(chǎn)品運營息息相關(guān)。
二是輿情分析,可以挖掘用戶在客服渠道里面經(jīng)常會問什么問題。舉個電商的例子,用戶在問到奶粉這個詞時,最關(guān)注的正品、渠道商、產(chǎn)地,還有品牌。通過這個方法,可以判斷用戶在關(guān)注某個商品的時候更關(guān)注哪些點。
三是情感分析。用戶在訪問機器人時,是正向情感、中性情感還是負向情感?這些可以通過技術(shù)手段識別出來。我們做過某個客戶的統(tǒng)計,在售后客服機器人場景,中性和負向的情感占比較高,那就說明售后來找客服都是吐槽的。可以把這些負向的情感反應(yīng)細化處理,比如分幾個檔次,分別對應(yīng)后續(xù)不同的處理。負向情感比較嚴(yán)重,就可以讓機器人自動轉(zhuǎn)人工。
最后是敏感分析,這一點對于客服機器人非常重要。我們發(fā)現(xiàn),不同行業(yè)有不同敏感信息定義。比如外賣,比較敏感的信息就是食品健康。對于電商,假貨就是比較敏感的信息。一般遇到這些敏感信息機器人會主動轉(zhuǎn)人工,交給人工客服處理。
機器人大趨勢:將來更注重交互
前面我們講了企業(yè)服務(wù)機器人的特點、如何解決語義理解、背后依托知識庫以及產(chǎn)品能力,最后我想講下企業(yè)服務(wù)機器人趨勢。
大家一開始認(rèn)為企業(yè)服務(wù)機器人是客服機器人,主要是解決節(jié)省人工成本,后來發(fā)現(xiàn),它其實是企業(yè)的虛擬助手。包括 Gartner 最近的報告,預(yù)測到 2020 年有 20% 的用戶訪問企業(yè)服務(wù)時,首選的是對話式的入口。
以前 PC 時代訪問銀行網(wǎng)站,網(wǎng)頁每個菜單對應(yīng)辦理某個業(yè)務(wù)的入口。到移動手機時代,屏幕沒有那么大,APP 能放的入口也沒有那么多,客戶都想快速找到業(yè)務(wù)入口。如果放搜索框放在 APP 最上面,通過搜索功能,搜索“修改密碼”會出來十幾條修改密碼的入口,用戶也不知道哪一條,體驗并不好。
所以,將來可能更多會是對話交互的方式,這是未來的趨勢。比如說修改密碼,機器就會反問你想修改什么密碼,再根據(jù)你提供的信息,給你具體操作頁面。
通過用戶和機器人的交互,把用戶畫像沉淀下來,跨越時間和空間把用戶畫像融合在一起,對營銷、推薦和風(fēng)控做一些數(shù)據(jù)上的支持。客服中心從一個成本中心轉(zhuǎn)變?yōu)橐粋€用戶研究中心,這也是一個趨勢。
以上是我今天分享的企業(yè)服務(wù)機器人內(nèi)容,感謝聆聽,謝謝大家!
如何去判斷一個人的情緒,然后根據(jù)他的情緒進行之后的問答操作?
這個就是剛才講到的情感分析,它包括兩個方面,一個是文本,一個是語音,文本里通過相關(guān)詞語可以去識別,語音會包含一些聲調(diào)、語速。對情感的判斷是滿意還是不滿意,也是用深度學(xué)習(xí)的方法,相當(dāng)于是文本分類來解決這個問題,每個人溝通表達的方式不一樣,想識別出來還是有點難的。如果是用關(guān)鍵詞的方法,這個問題確實是很難解決好,用深度學(xué)習(xí)的方法會好很多。
現(xiàn)在的語音識別的瓶頸?
方言這一塊大家都做的不太好,訊飛是做的比較好的一家。這需要數(shù)據(jù)的積累,沒見過的方言仍然識別不出來,這是一個門檻。另一個門檻是垂直領(lǐng)域,如果語音識別系統(tǒng),沒有一個垂直行業(yè)的訓(xùn)練數(shù)據(jù),也做不好。現(xiàn)在人工智能對數(shù)據(jù)依賴還是比較高的,人工智能的競爭有時候就是數(shù)據(jù)競爭。
券商這一類的主要是應(yīng)用到哪些場景?
券商對知識圖譜要求比較高,希望通過機器人能夠做到問股選股,比如查詢“市盈率大于 20、小于 25 的股票”,比如查詢“A 公司去年和今年相比市盈率變化多少”。在機器人的知識庫沒有現(xiàn)成的答案,需要通過推理才獲得答案,再把它過濾出來。另外是投資教育這一塊比較多,經(jīng)常會問港股通怎么收費等等。還有資料查詢,主要是問某支股票的信息,比如說法人、去年的財報。