從語(yǔ)音識(shí)別發(fā)展到語(yǔ)義識(shí)別還需要突破多少困難
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來(lái)源:曉芯智能語(yǔ)音)
? ? ?? 語(yǔ)音識(shí)別作為打造良好交互體驗(yàn)的重要前提,今年的發(fā)展可謂是持續(xù)火爆。在智能音箱市場(chǎng),令人首先想到的就是Amazon的Echo。Echo作為將自然語(yǔ)音轉(zhuǎn)化為在線指令的設(shè)備,其效率之高毋庸置疑,并且可保持在線的自然環(huán)境中的自然語(yǔ)言識(shí)別。
而國(guó)內(nèi)語(yǔ)音識(shí)別領(lǐng)域也開(kāi)始爭(zhēng)奪大戰(zhàn)。以科大訊飛聽(tīng)見(jiàn)系列產(chǎn)品為例,自2015年發(fā)布以來(lái),總用戶突破1000萬(wàn),應(yīng)用于30余個(gè)行業(yè)。目前,已經(jīng)形成了以聽(tīng)見(jiàn)智能會(huì)議系統(tǒng)、訊(詢)問(wèn)筆錄系統(tǒng)、聽(tīng)見(jiàn)轉(zhuǎn)寫(xiě)網(wǎng)站、錄音寶APP、聽(tīng)見(jiàn)智能會(huì)議服務(wù)等以智能語(yǔ)音轉(zhuǎn)寫(xiě)技術(shù)為核心的產(chǎn)品和服務(wù)體系。
曉芯電話機(jī)器人就是基于語(yǔ)音識(shí)別技術(shù)的一種應(yīng)用產(chǎn)品。曉芯智能以服務(wù)低端勞力密集型企業(yè)為宗旨,幫助企業(yè)突破人工客服效率低、工作時(shí)間長(zhǎng)的瓶頸,從而幫助企業(yè)擴(kuò)大規(guī)模和提升業(yè)績(jī)。
我們所期望的語(yǔ)音識(shí)別實(shí)質(zhì)上是人機(jī)交互,大致上可以理解為人與機(jī)器之間無(wú)障礙溝通。在通信側(cè)音源質(zhì)量限制的情況下,曉芯機(jī)器人在對(duì)音源質(zhì)量通過(guò)算法進(jìn)行智能降噪以及通信側(cè)持續(xù)優(yōu)化之后,仍然能以80%的識(shí)別率達(dá)到行業(yè)領(lǐng)先的水準(zhǔn)。但即便是達(dá)到100%也還是沒(méi)有實(shí)現(xiàn)真正的人機(jī)交互
而我們曉芯電話機(jī)器人有很多的客戶都問(wèn)我們能不能達(dá)到語(yǔ)義識(shí)別?
目前來(lái)說(shuō)確實(shí)不能,要從語(yǔ)音識(shí)別成功轉(zhuǎn)變成真正意義上的語(yǔ)義識(shí)別,在智能電話客服的技術(shù)實(shí)現(xiàn)上依舊存在難點(diǎn),大量的多音字和同音詞是干擾機(jī)器人識(shí)別精準(zhǔn)度的的主要障礙。首先要獲得大量的數(shù)據(jù),用這些數(shù)據(jù)不斷訓(xùn)練,來(lái)提高識(shí)別的準(zhǔn)確率。這一步的跨越還存在多種難關(guān)要攻克。就目前的市場(chǎng)分析來(lái)看,語(yǔ)義識(shí)別只是慢慢滲透到我們的生活中,還沒(méi)有成熟的在行業(yè)中應(yīng)用自如。隨著技術(shù)不斷地成熟,曉芯智能也必定會(huì)將語(yǔ)義識(shí)別技術(shù)融合進(jìn)曉芯電話機(jī)器人。
語(yǔ)義識(shí)別的三個(gè)層次,1、應(yīng)用層:包括行業(yè)應(yīng)用和智能語(yǔ)音交互系統(tǒng),2、NLP技術(shù)層:包括以語(yǔ)言學(xué)、計(jì)算機(jī)語(yǔ)言等學(xué)科為背景的,對(duì)自然語(yǔ)言進(jìn)行詞語(yǔ)解析、信息抽取、時(shí)間因果、情緒判斷等等技術(shù)處理,最終達(dá)到讓計(jì)算機(jī)“懂”人類的語(yǔ)言的自然語(yǔ)言認(rèn)知,以及吧計(jì)算機(jī)數(shù)據(jù)轉(zhuǎn)化為自然語(yǔ)言的生成。3、底層數(shù)據(jù)層:詞典、數(shù)據(jù)集、語(yǔ)料庫(kù)、知識(shí)圖譜,以及外部世界常識(shí)性知識(shí)等都是予以是被算法木星的基礎(chǔ)。
語(yǔ)義識(shí)別技術(shù)可以分析網(wǎng)頁(yè)、文件、郵件、音頻、論壇、社交媒體中的大亮數(shù)據(jù),應(yīng)用領(lǐng)域廣泛,既可以直接應(yīng)用與醫(yī)療、教育、金融等行業(yè)。也可以通過(guò)技術(shù)接口應(yīng)用于所有智能語(yǔ)音交互場(chǎng)景,如智能家居、車載語(yǔ)音、可穿戴設(shè)備、VR、機(jī)器人等,從交互的方式上,也可以分為:事實(shí)問(wèn)答、知識(shí)檢索、分類問(wèn)題等。智能語(yǔ)音交互被看做未來(lái)人工智能技術(shù)中最值得期待的應(yīng)用場(chǎng)景。
人工智能作為國(guó)家戰(zhàn)略發(fā)展規(guī)劃之一,足見(jiàn)其重要性。在這個(gè)政策的驅(qū)動(dòng)下,各種資源包括國(guó)家型自然科學(xué)基金、產(chǎn)業(yè)基金、地方政府財(cái)稅優(yōu)惠政策、人工智能相關(guān)實(shí)驗(yàn)室、科技產(chǎn)業(yè)園區(qū)等切實(shí)促進(jìn)人工智能的發(fā)展落地,為自動(dòng)駕駛、計(jì)算機(jī)視覺(jué)、語(yǔ)音/語(yǔ)義識(shí)別創(chuàng)業(yè)提供了更好的條件和基礎(chǔ)設(shè)施。