智能家電中的語音新技術(shù),一次喚醒連續(xù)對話
(文章來源:天極網(wǎng))
? ? ?? 語音交互技術(shù)是人工智能領(lǐng)域的一大重點,近年來已經(jīng)應(yīng)用到手機(jī)、智能家電、智能硬件等貼近消費(fèi)電子領(lǐng)域。不過在實際應(yīng)用中,語音操控的體驗并不是非常好,仍然有不少痛點,繼續(xù)在改善中。
有一個痛點,以前的AI語音是用戶每說一句話都要喊一聲它的名字,如果在下一個命令前沒有再次叫它,它就不會反應(yīng)。這樣一來,問幾句話就要叫幾聲,真是很累人。
還好,隨著人工智能語音技術(shù)的進(jìn)步,近半年來推出的一些智能新產(chǎn)品已經(jīng)增加了一種語音新技術(shù):連續(xù)語音,或者叫語音連續(xù)識別,總之,這一新技術(shù)能夠做到“一次喚醒,連續(xù)識別,多輪對話”,能夠解決上面所說的這種慘痛用戶體驗。
以小米家的小愛同學(xué)為例,就可以做到一次喚醒,用戶可以連續(xù)發(fā)送語音指令,并且能隨時打斷它,重新發(fā)出新的指令。米家的一些新產(chǎn)品就已經(jīng)增加了這一功能。百度的AI也有這種一次喚醒多輪對話的語音功能,并且也實際應(yīng)用到了其AI音箱中,以及其它跟其合作的智能家電產(chǎn)品中。
創(chuàng)維的智能電視、智能空調(diào)等新產(chǎn)品都具有智能語音功能,他們的AI語音是內(nèi)置了百度的。這些智能家電支持用遙控器發(fā)出語音,還支持遠(yuǎn)場語音,用戶可以直接對著電視、空調(diào)喊話發(fā)指令來操作。近期推出的一些新品也是增加了連續(xù)識別功能,在用“小維小維”喚醒AI后,AI會待命一段時間,這段時間里用戶可以一直與AI對話,不用每交待一個指令之前都要叫一聲小維喚醒它;如果一會沒有用戶指令了,AI才會重新沉睡。實際的體驗相當(dāng)流暢,可以說完全改善了上文所敘述的痛點。
舊的AI語音大多只能進(jìn)行單輪對話,無法支持多輪對話,也就是說,AI在你的上一句指令和下一句指令之間建立邏輯聯(lián)系。
單輪對話是指對話內(nèi)容不包含情景,沒有關(guān)聯(lián)上下文內(nèi)容。這種對話模式導(dǎo)致語音交互更偏向于簡短的操作任務(wù),過于復(fù)雜的操作任務(wù),則需要分解成簡短的口令。而新的多輪對話則可以支持在前后幾個命令間建立邏輯關(guān)聯(lián)。
指令給出的結(jié)果并不是科幻電影中的美國電影,而是又重新進(jìn)行了一次美國電影的搜索。這一結(jié)果當(dāng)然不夠智能。當(dāng)然,這說的是一年以前的舊產(chǎn)品,大約2019年以來的新產(chǎn)品都會支持多輪對話了。
除了這些以后,目前還有一些語音技術(shù)未成熟,但如果成熟應(yīng)用的話會給用戶帶來很多便利。比如說,聲紋識別,AI可以識別各個不同人不同用戶的聲音特點,建立用戶檔案,進(jìn)行個性化推薦,目前這一技術(shù)未大規(guī)模應(yīng)用。
? ? ?