當前位置：首頁 > 智能硬件 > 人工智能AI

可定制的人工智能對話是怎樣的

時間：2020-05-28 09:03:01

關(guān)鍵字：人工智能

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] “在這個時代，如果想要獲取信息，你很難不通過嘴?！?思必馳首席科學家、聯(lián)合創(chuàng)始人俞凱在上海市北·GMIS 全球人工智能峰會的現(xiàn)場演講中的短短一句話，卻總結(jié)了目前人類的交互習慣發(fā)展趨勢。

“在這個時代，如果想要獲取信息，你很難不通過嘴?！?思必馳首席科學家、聯(lián)合創(chuàng)始人俞凱在上海市北·GMIS 全球人工智能峰會的現(xiàn)場演講中的短短一句話，卻總結(jié)了目前人類的交互習慣發(fā)展趨勢。

思必馳首席科學家、聯(lián)合創(chuàng)始人俞凱

在智能終端時代，有人認為 AR 眼鏡或許會是人類需要的 “最后一塊屏”，這種感覺在語音交互技術(shù)出現(xiàn)后可能表現(xiàn)得更加強烈。前瞻產(chǎn)業(yè)研究院發(fā)布的《2018-2023 年中國物聯(lián)網(wǎng)行業(yè)細分市場需求與投資機會分析報告》曾發(fā)布了初步估算的數(shù)據(jù)：2017 年全球物聯(lián)網(wǎng)設(shè)備數(shù)量達到 84 億，比 2016 年的 64 億增長 31%，2020 年物聯(lián)網(wǎng)設(shè)備數(shù)量將達到 204 億。在這些智能設(shè)備中，屏幕已經(jīng)越來越小，而語音交互能力幾乎成了標配?？梢?，智能語音交互擁有極具誘惑力的諾大市場。

不過，在這個百家爭鳴的科技時代，有趣的不僅是宏觀的市場增量。企業(yè)在實踐摸索出規(guī)律，并對未來進行大膽、前瞻性的判斷，才更值得津津樂道。作為語音技術(shù)領(lǐng)域的平臺交互型公司，同時也是行業(yè)前列的探索者，思必馳對于如何打造更加人性化的語音交互技術(shù)也提出了自己的新見解。

“通用的語音識別率基本上能到 95% 以上，語義識別率能到 90% 以上。但是語音交互本身是一個鏈條，盡管每個體系可達到 90% 的可用度，但是技術(shù)加在一起的整體可用率會降低很多。” 俞凱先提出了現(xiàn)在語音交互行業(yè)面臨的技術(shù)問題。他認為，導致問題的原因主要是 “沒有做聯(lián)合優(yōu)化”，即大家都是在每個任務(wù)上是獨立優(yōu)化。為了提高整個語音交互技術(shù)的可用性，思必馳實行了技術(shù)上的全鏈路，如以語義理解為目標來優(yōu)化語音識別，即目標不是看字的錯誤率，而是看理解上的偏差。簡單來說，思必馳的技術(shù)全鏈路 AI 可以把語音交互技術(shù)中，前面產(chǎn)生的錯誤在后面環(huán)節(jié)中自動做糾正，提高整體的可用率。

當然，除了技術(shù)層面的優(yōu)化，優(yōu)質(zhì)的語音交互技術(shù)還需要產(chǎn)品設(shè)計的加持，以保證體驗升級。此前，有很多基于語音交互技術(shù)的產(chǎn)品，如娛樂、教育機器人等遭到了用戶的 “拋棄”。這給企業(yè)帶來了技術(shù)邊界與用戶期望之間關(guān)系的深思。我們目前的語音技術(shù)究竟足夠支撐多強大的產(chǎn)品？什么樣的語音產(chǎn)品會減小用戶的失望程度？

“技術(shù)邊界和用戶期望平衡的核心點是產(chǎn)品設(shè)計?！?俞凱表示，合理的產(chǎn)品設(shè)計可以有效地 “揚長避短”。他認為，以目前的技術(shù)發(fā)展狀態(tài)來看，需要做一些用戶可配合的場景應(yīng)用，即場景的可控性較高?！白層脩粼诤线m的情況下去做一些交互，那么產(chǎn)品的性能就比較有保障?！?他以思必馳和順豐合作的語音下單機器人為例說明：這就是典型的比較窄的任務(wù)，用戶目的明確，所以用戶的期望比較可控。總之，在技術(shù)發(fā)展的階段中，企業(yè)不僅在自己做產(chǎn)品的時候需要實事求是，對于用戶也要誠實。

值得一提的是，思必馳主要是為企業(yè)和開發(fā)者提供自然語言交互解決方案，包括 DUI 開放平臺、企業(yè)級智能服務(wù)、人機對話操作系統(tǒng)、人工智能芯片模組等。那么，對于思必馳而言，他們?nèi)绾位谧陨砑夹g(shù)實力為企業(yè)類客戶帶來新體驗？

俞凱稱，近幾年人工智能產(chǎn)業(yè)鏈發(fā)生了比較深刻的變革——專業(yè)化分工的加速。在這樣的背景下，人工智能企業(yè)分為三層，一是基礎(chǔ)技術(shù)支撐層。他們就像發(fā)電廠商；二是中間層。他們以提供技術(shù)賦能為核心的智能交互層，像是輸電的企業(yè)；三是應(yīng)用層，集成各種各樣不同的從語音到圖像各種各樣不同的 AI 技術(shù)，形成綜合的產(chǎn)品解決方案，就像做電器的企業(yè)。而智能交互層出現(xiàn)了一個主要矛盾，即：越來越強的通用技術(shù)，與使用者高度靈活化，高度可配置的個性化需求之間的矛盾。

“面對這樣的矛盾，作為平臺型的驅(qū)動企業(yè)，思必馳希望打造可定制的對話式人工智能?！?俞凱說道。

“定制化” 并不是新鮮詞，但是思必馳打造的可定制的對話式人工智能，兼具定制化和可規(guī)模化。眾所周知，一般來說，定制化意味著很難規(guī)?；?。但俞凱表示可定制的對話式人工智能就像是 “柔性制造” 技術(shù)，可定制，可批量生產(chǎn)，可實現(xiàn) “千人千面”。

關(guān)于具體實現(xiàn)可定制的對話式人工智能的關(guān)鍵點，俞凱從三個方面分享：

一是工程支撐方面，首先是以全鏈路對話交互技術(shù)為核心，實現(xiàn) “高可用”，即讓更多的人可以定制，另外也要支持定制地規(guī)模化；

二是需要相應(yīng)的資源支撐，比如識別領(lǐng)域，需要方言、多語種、多個精細化語義領(lǐng)域的支撐，才能夠形成完整的模型；

三是算法支撐（個性化智能自適應(yīng)）。智能地自適應(yīng)要解決三個難點：一是目標發(fā)現(xiàn)，即向誰做自適應(yīng)學習。二是小數(shù)據(jù)的自適應(yīng)，傳統(tǒng)的深度學習需要喂大數(shù)據(jù)來訓練模型，而現(xiàn)在需要用很小的數(shù)據(jù)實現(xiàn)。三是在線的學習更新，即當語義理解不精確，或者出現(xiàn)語音識別錯誤時，人和機器在真實場景當中可繼續(xù)交互下去，就需要一個聰明的決策。機器系統(tǒng)怎樣通過問話，或者通過引導使對話更平滑地繼續(xù)下去，能夠更好地把意圖推理出來。

“未來我們看到的對話智能，并不是一種通用的技術(shù)，而是可以在每一個產(chǎn)業(yè)里面有自己獨立個性的定制化對話式人工智能?！?俞凱說道。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅持高質(zhì)量發(fā)展策略，塑強核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運營商數(shù)字經(jīng)濟

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]