www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 通信技術(shù) > 通信技術(shù)
[導(dǎo)讀]四十多年前,專家們曾宣稱,語音識(shí)別將在“五到十年內(nèi)”發(fā)展為一項(xiàng)成熟的技術(shù)??啥嗄赀^后,他們依然重復(fù)著一模一樣的說辭。語音識(shí)別的發(fā)展確實(shí)費(fèi)了不少工夫好在,時(shí)隔多年以后,我們總算開發(fā)出了一套質(zhì)量

四十多年前,專家們曾宣稱,語音識(shí)別將在“五到十年內(nèi)”發(fā)展為一項(xiàng)成熟的技術(shù)??啥嗄赀^后,他們依然重復(fù)著一模一樣的說辭。

語音識(shí)別的發(fā)展確實(shí)費(fèi)了不少工夫好在,時(shí)隔多年以后,我們總算開發(fā)出了一套質(zhì)量過硬的識(shí)別技術(shù)。不僅如此,我們還把這玩意應(yīng)用到了移動(dòng)設(shè)備上(盡管還得靠服務(wù)器提供一大堆技術(shù)支持)。

然后問題就來了有了這樣的技術(shù),我們?yōu)槭裁催€是得整天瞅著自己的手機(jī)屏幕鼓搗來鼓搗去,卻無法直接開口跟自己的手機(jī)對話交談?

回答這個(gè)問題的關(guān)鍵,在于提供一個(gè)語音交互界面,遠(yuǎn)比理解一打單詞來得復(fù)雜尤其是對手機(jī)而言。我們還必須得理解用戶的“意圖”。要知道,除了語音技術(shù)本身以外,人機(jī)語音交流中還有其他因素在作怪輸出方式,互動(dòng)形式還有語境。

  多元化的輸出:既能秀,也能說

如今投入使用的語音系統(tǒng),識(shí)別的效果一般都過于極端化要么一字不差,要么謬以千里。事實(shí)上,當(dāng)我們查詢一條去某大街的路線時(shí),要是系統(tǒng)能精確無誤地從數(shù)據(jù)庫的上千個(gè)條目中識(shí)別出我們想要的那一條,還是挺令人稱奇的。不幸的是,如果識(shí)別有誤或者街名不準(zhǔn),我們的搜索就只能乖乖從頭再來。

要想在現(xiàn)有的語音技術(shù)上有所突破,我們必須得認(rèn)識(shí)到一點(diǎn):我們現(xiàn)有的系統(tǒng),不過就是最原始的識(shí)別技術(shù)而已識(shí)別技術(shù)本身沒啥問題;但除了這套技術(shù)以外,我們的系統(tǒng)只是一個(gè)空殼罷了。而我們需要的,其實(shí)是創(chuàng)造一個(gè)語音交互界面說白了,就是一整套基于語音的互動(dòng)模式。

理解用戶的“意圖”,意味著系統(tǒng)要判斷出用戶真正需要的事物,而這通常得依靠交談來實(shí)現(xiàn)。這就是說,系統(tǒng)要了解用戶為什么問這個(gè)問題一般來說,這就要求系統(tǒng)去知曉對方在做什么;與此同時(shí),這也要求系統(tǒng)根據(jù)用戶所處的情形合理應(yīng)答。這可決不是一項(xiàng)輕松的任務(wù)畢竟,用戶只是把移動(dòng)設(shè)備握在手中而已,他們可能有著大把的事情,要忙著分神去處理。

互動(dòng)是一種雙向的溝通,意味著我們在提供輸入的同時(shí)還得留意輸出;而這些能發(fā)聲的應(yīng)用是怎么回答我們的呢?最常見的方式,是直接向用戶回復(fù)他們所想要的信息。那些提供實(shí)時(shí)駕駛指南的“殺手級(jí)應(yīng)用”就是個(gè)典型的例子:用戶雙眼注視路況,雙手把好方向盤,然后嚴(yán)格按照語音提示說的做就行這種情況下,這樣的應(yīng)答方式也確實(shí)管用。

12

但另一些時(shí)候,這招就不那么靈了。比如,當(dāng)我們詢問下班公交什么時(shí)候到站時(shí),讓系統(tǒng)自顧自地把整張時(shí)刻表背下來就是個(gè)不折不扣的餿主意。即使它只是回復(fù)一句“下班車9點(diǎn)12分到站”,效果也好不到哪去這時(shí)候,說“下班車12分鐘內(nèi)到站”才是王道。

這其中的關(guān)鍵在于,語音只是瞬時(shí)性的一句話,說完就完了。要是我們一時(shí)不小心分神了,或者一下子沒來得及把消息印到腦子里,我們就得再問一遍。說不定還得問上一遍又一遍。

這就是我們不應(yīng)該拋棄用戶界面的原因:它好歹能幫我們少占用一些記憶容量。未來的語音技術(shù)所迫切需要的,是多元化的輸出:既能秀,也能說。舉個(gè)例子,如果我正忙著趕路的話,何不讓移動(dòng)設(shè)備既在屏幕上給我秀一下時(shí)刻表,也在耳邊跟我說一聲“下班車12分鐘后到站”?

理解背后的“意圖”

這也引出了未來的語音技術(shù)所需的第三個(gè),也是最重要的一個(gè)因素:語境。人們的對話里包含著豐富的語境信息:詞匯表達(dá)的意思,代詞指代的對象,還有那些被重讀的單詞。這其中牽涉到一系列細(xì)微的語言模式(心理語言學(xué)家赫伯·克拉克稱其為“定位”),使得一句像“你懂了沒?”這樣的短問句,就足以暗示一段微妙、共有的經(jīng)歷因?yàn)閷υ捴械牧硪环角宄闼抵傅氖鞘裁础?/p>

而這些語境,正是手機(jī)可以大展身手的場合,尤其是考慮到語音技術(shù)發(fā)展的現(xiàn)狀與未來的話:手機(jī)知道它自己身處何處;它能夠識(shí)記我在不在上班、在哪里上班;它清楚我都跟誰打過電話,誰是對我更重要的人。

如果我用的是清一色的安卓或者iOS應(yīng)用的話,手機(jī)還能掌握我的郵件信息、日程安排,還有我的興趣愛好。于是,當(dāng)我問“公交是幾點(diǎn)來著?”的時(shí)候,手機(jī)就會(huì)聽懂我說的是哪趟車、哪一站、哪個(gè)方向,甚至還包括我要將花多久才能趕到車站。事實(shí)上,說不定在我發(fā)問之前,手機(jī)里的鬧鐘就會(huì)自動(dòng)響起,提醒我該起身出門趕車去了,還能順帶一句“別忘帶雨傘哦”就像一個(gè)稱職的管家一樣。

對語境的分析,不僅有助于我們理解一詞一句,更能幫我們理解其背后的“意圖”。盡管在一些手機(jī)應(yīng)用中,我們多多少少已經(jīng)體驗(yàn)到了這些功能;但就語音而言,相關(guān)技術(shù)還遠(yuǎn)未成熟。至少目前看來還言之尚早。畢竟,我們不能忽視社會(huì)因素的影響:在公共場合,我們未必會(huì)和手機(jī)“交談”,可能是因?yàn)槲覀儾幌氪驍_他人,也可能是因?yàn)槲覀儾辉副┞峨[私。

但事情總是在變化的。我是美國最早用上第一代手機(jī)(摩托羅拉MicroTac)的人之一。當(dāng)年我打著大哥大走在馬路上的時(shí)候,周圍的人看我就像看個(gè)瘋子一樣即使是在MIT這樣遍地技術(shù)狂的校園里也毫不例外。而現(xiàn)在,看到那些戴著藍(lán)牙耳機(jī)自顧自聊天的路人,我們都已經(jīng)見怪不怪了要知道,從前這可都是瘋子的標(biāo)志呢。

12
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉