叮咚智能音箱發(fā)布《第三方平臺接入語音交互系統(tǒng)用戶體驗標準》

時間：2020-08-12 07:15:02

關鍵字：人工智能智能音箱語音交互

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 4月20日，北京靈隆科技有限公司《第三方平臺接入叮咚語音交互系統(tǒng)用戶體驗標準》（以下簡稱《標準》），這也是我國首份在智能語音領域針對第三方服務和內容接入語音交互系統(tǒng)的開發(fā)標準。該《標準》將對語音

4月20日，北京靈隆科技有限公司《第三方平臺接入叮咚語音交互系統(tǒng)用戶體驗標準》（以下簡稱《標準》），這也是我國首份在智能語音領域針對第三方服務和內容接入語音交互系統(tǒng)的開發(fā)標準。該《標準》將對語音交互產(chǎn)品體驗有重要的指導性意義，讓語音交互更符合用戶的使用習慣。同時對于未來將接入語音交互接口的第三方服務和內容行業(yè)來說，能夠幫助他們以最快的速度和最簡潔的方法接入語音交互接口，以達到最優(yōu)用戶體驗。

語音交互被視為人機交互的下一代入口

兩會期間，人工智能被寫入了2017年政府工作報告。而在人工智能領域，智能語音交互被作為人機交互的入口。未來與智能家居、可穿戴設備、機器人等溝通，語音將是最佳人機交互模式。

目前，智能音箱、智能電視等智能硬件都開始嘗試鍥入語音交互系統(tǒng)。在此方面，科大訊飛作為中國語音產(chǎn)業(yè)的拓荒者到世界語音產(chǎn)業(yè)的領軍者。叮咚智能音箱作為國內首款智能音箱，充分發(fā)揮科大訊飛出色的語音技術及人工智能技術優(yōu)勢和京東在智能產(chǎn)業(yè)鏈方面的優(yōu)勢，一直致力于智能家庭場景下智能語音交互系統(tǒng)的研究和發(fā)展，本次《標準》基于叮咚用戶常年的體驗反饋和技術積累所得。

語音交互的核心：識別用戶的語義和意圖

《第三方平臺接入叮咚語音交互系統(tǒng)用戶體驗標準》是國內首份第三方服務和內容接入語音交互系統(tǒng)的詳細介紹。《標準》進一步明確了人機交互的反饋流程和設計標準，其中定義了兩個智能語音交互的關鍵指標，即“語義”和“意圖”，通過語義和意圖的轉化來完成交互的核心步驟。

當前，人機主要交互模式是界面交互，通過“一對一”的指令溝通。而語音交互則不同，由于不同地域、不同文化、不同表達習慣，在人機交互過程中往往是“多對一”的指令溝通。也就是說同一種意圖，在用戶那里會有多種形式的提問方式，這就要求語音交互必須大量學習人們的日常語言習慣，甚至做到理解用戶的語義的“弦外之音”。這對機器來說無疑是巨大的挑戰(zhàn)。

在語音交互流程設計及體驗中，叮咚主要研究的是識別用戶語義意圖、反饋用戶語音需求，處理人機對話錯誤三個方面。對于研究成果，在《標準》的第三部分做了進一步闡述，從如何更好的獲得用戶意圖、如何將信息更好的展現(xiàn)給用戶和如何更好的處理對話中的錯誤進行解釋，并通過實例和講解相配合的模式整個報告內容清晰易讀易懂，為第三方服務接入提供了切實可遵循的規(guī)范標準。

靈隆科技研發(fā)中心負責人周正友在會上以游戲接入為例，說明《標準》里是如何明確地告訴用戶需要怎樣的回答。

用戶：“叮咚叮咚，我想玩一下音樂游戲廳”

較好的回答：“您好，歡迎來到音樂游戲廳，我們現(xiàn)在有：我愛記歌詞、猜猜大明星，趣味哼唱，您想玩哪一個？”

不好的回答：“您好，歡迎來到音樂游戲廳，我們現(xiàn)在有：我愛記歌詞、猜猜大明星，趣味哼唱，請您在以上三個選項中選擇？”

叮咚智能音箱捅破智能語音交互時代的窗戶紙

“叮咚智能音箱捅破智能語音交互時代的窗戶紙。”叮咚智能音箱靈隆科技營銷副總裁方律表示。“對于智能語音交互在家庭場景中的應用來說，行業(yè)大規(guī)模爆發(fā)的核心在于，第一，產(chǎn)品接入的服務足夠全面和豐富，可以滿足用戶在該場景下的各種需求。這個目前叮咚已經(jīng)做到了。第二是，用戶體驗可以突破可用這層窗戶紙，達到易用和好用的狀態(tài)。本次我們發(fā)布的用戶體驗優(yōu)化標準就是出于‘讓所有的第三方服務語音交互更好用’的目的。目前，我們對于所有第三方應用的合作方，都采取開放的態(tài)度，希望越來越多的服務/功能的開發(fā)者，能夠接入叮咚的平臺，為用戶輸出更多的更豐富的內容和服務。”

結語

“偉大的產(chǎn)品往往不是由巨大的技術進步驅動的，而是技術綜合產(chǎn)品恰如其分的一小步，驅動用戶體驗一大步的飛躍。”《第三方平臺接入叮咚語音交互系統(tǒng)用戶體驗標準》是叮咚智能音箱在追求提升用戶每一份體驗上的努力，《標準》發(fā)布后或將成為用戶體驗升級和行業(yè)大規(guī)模爆發(fā)的推動力。