中文智能語音識別難度標(biāo)準(zhǔn)出臺,人工智能產(chǎn)品的“聽”“說”能力打分有了標(biāo)準(zhǔn)
帶方言口音的普通話人工智能能聽懂嗎?在嘈雜的環(huán)境中,知道要“聽”哪些聲音而忽視另一些聲音嗎?“聽”到不同表述方式,能夠理解嗎?
隨著智能音箱、人機(jī)互動家電等應(yīng)用人工智能的產(chǎn)品進(jìn)入人們生活,大家對機(jī)器“聽”人講話并給出回應(yīng)已經(jīng)不陌生。但是,到底怎樣“聽”才算“聽得懂”,卻并無統(tǒng)一標(biāo)準(zhǔn)。
不過,這一局面有望改變。記者9月12日獲悉,由上海企業(yè)平安好醫(yī)生與智能語音識別技術(shù)公司云知聲共同起草的《中文語音識別難度分級認(rèn)證規(guī)范》討論稿(以下簡稱《認(rèn)證規(guī)范》)已經(jīng)完成,并在中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)2018年聯(lián)盟會員大會的標(biāo)準(zhǔn)化與推廣工作組專項討論會議上進(jìn)行了標(biāo)準(zhǔn)框架匯報,得到專家認(rèn)可。這是國內(nèi)首個關(guān)于中文智能語音識別難度的標(biāo)準(zhǔn)規(guī)范,有望為形形色色人工智能產(chǎn)品的“聽”“說”能力打分,避免“假智能”濫竽充數(shù)。
近年來,國內(nèi)人工智能語音領(lǐng)域各大廠商深耕技術(shù)研發(fā),中文語音識別率提升至90%以上,云知聲在醫(yī)療等垂直行業(yè)識別率則達(dá)到97%以上。隨著智能語音識別技術(shù)的飛速發(fā)展,智能家居、智慧車載、智慧醫(yī)療、智慧教育等領(lǐng)域均廣泛應(yīng)用智能語音交互解決方案,實現(xiàn)了人機(jī)互動,也因其便利性吸引了大量用戶。艾瑞咨詢發(fā)布的《中國智能家居行業(yè)研究報告》數(shù)據(jù)顯示,2017年,我國智能家居市場規(guī)模就達(dá)到3342.3億元,同比增長24.8%,這也意味著智能語音識別技術(shù)的應(yīng)用前景廣闊。
然而,由于缺乏應(yīng)用層面的統(tǒng)一標(biāo)準(zhǔn)規(guī)范,企業(yè)在研發(fā)及推廣相關(guān)產(chǎn)品時,缺乏足夠的市場公信力,而用戶選擇相關(guān)產(chǎn)品時,也沒有權(quán)威的技術(shù)指標(biāo)加以參考。標(biāo)準(zhǔn)缺失成為制約行業(yè)發(fā)展的主要障礙之一。在國際上,IBM、Microsoft、AT&T等跨國公司對語音技術(shù)的研究已持續(xù)多年,并積極參與語音技術(shù)領(lǐng)域的標(biāo)準(zhǔn)制定,以期在激烈競爭中處于技術(shù)的制高點。中國雖已開始推廣架構(gòu)、接口等技術(shù)層面的標(biāo)準(zhǔn),但應(yīng)用層面的標(biāo)準(zhǔn)規(guī)范長期空白,不利于中國智能語音識別技術(shù)及產(chǎn)業(yè)的發(fā)展。
2017年12月,平安好醫(yī)生與云知聲合資成立上海澔醫(yī)智能科技有限公司,共同探索以智能語音識別等技術(shù)為基礎(chǔ)的家庭智慧醫(yī)療服務(wù)終端建設(shè)。針對企業(yè)及行業(yè)發(fā)展需要,平安好醫(yī)生與云知聲經(jīng)過半年多的聯(lián)合研究,根據(jù)中文語音的自身特性,起草了《認(rèn)證規(guī)范》框架。
《認(rèn)證規(guī)范》將中文語音識別難度分為L1-L4四個等級,并分別從聲學(xué)和語言學(xué)兩個維度確定了信噪比、普通話水平、說話習(xí)慣、語言句式等十余個影響因素,對智能語音交互類產(chǎn)品在實際應(yīng)用場景下的識別率提供了定級依據(jù)。因此,這一《認(rèn)證規(guī)范》的推出,有望為我國智能語音識別技術(shù)及產(chǎn)業(yè)發(fā)展,提供切實可行、可加以全面推廣的技術(shù)標(biāo)準(zhǔn)。
中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟是由中國信息通信研究院牽頭會同中國電子技術(shù)標(biāo)準(zhǔn)化研究院、國家工業(yè)信息安全發(fā)展研究中心等單位,以及全國300余家人工智能相關(guān)企業(yè)、機(jī)構(gòu)等共同發(fā)起組建,在行業(yè)內(nèi)具有較高權(quán)威性和公正性。針對《認(rèn)證規(guī)范》討論稿,相關(guān)專家一致認(rèn)為,該規(guī)范切中產(chǎn)業(yè)發(fā)展痛點,針對應(yīng)用層面的中文智能語音識別技術(shù)的難度和能力提出了分級評價的關(guān)鍵參數(shù)體系,對于產(chǎn)業(yè)應(yīng)用推廣具有重要意義。