人工智能語音識(shí)別與人類差距竟只有0.4%
日前,美國一家公司宣稱專業(yè)速記員在記錄對(duì)話時(shí),轉(zhuǎn)錄詞錯(cuò)率為5.1%,而該公司最新研發(fā)的語音識(shí)別系統(tǒng)詞錯(cuò)率已達(dá)到5.5%,超越之前的歷史最佳水平,樹立了新的里程碑。語音識(shí)別,是人工智能領(lǐng)域的核心問題之一,0.4%的差距似乎意味著機(jī)器即將比肩人類。
語音識(shí)別被科學(xué)家稱為“機(jī)器的聽覺系統(tǒng)”,因?yàn)樵摷夹g(shù)可以讓機(jī)器通過識(shí)別和理解,把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令,等于是人工智能的“耳朵”。
語音識(shí)別的研究源頭可追溯至1950年,計(jì)算機(jī)科學(xué)之父阿蘭·圖靈在《思想》(Mind)雜志上發(fā)表了題為“計(jì)算的機(jī)器和智能”的論文,首次提出了機(jī)器智能的概念,論文還提出了鼎鼎有名的“圖靈測(cè)試”——讓人和機(jī)器進(jìn)行交流,如果人無法判斷對(duì)象是人還是機(jī)器,就說明這個(gè)機(jī)器真正具有人工智能。
進(jìn)入二十一世紀(jì)初,由于互聯(lián)網(wǎng)、社交媒體的大爆發(fā),大數(shù)據(jù)時(shí)代正式來臨。大數(shù)據(jù)成為人工智能發(fā)展的助推器,語音識(shí)別系統(tǒng)通過豐富的語料及數(shù)據(jù),使用統(tǒng)計(jì)模型來進(jìn)行數(shù)據(jù)的概率推算,促使技術(shù)不斷完善??萍及l(fā)展至今天,人工智能科技逐漸得到普及,從智能手機(jī)、智能電視到智能冰箱、空調(diào),針對(duì)日常生活的智能產(chǎn)品已有不少,智能生活成為未來科技發(fā)展的重要方向。
過去我們只能在電影里看到的情節(jié),如今都開始一一在生活里實(shí)現(xiàn),瞳孔識(shí)別、遠(yuǎn)距離操控、貼身電子管家等等,隨著對(duì)人工智能的研發(fā)不斷深入,我們與電子產(chǎn)品的交流從單一的控制,變?yōu)榛?dòng)的交流。過去我們認(rèn)為在電視上通過互聯(lián)網(wǎng)搜索、得到相應(yīng)結(jié)果就很智能了,而如今我們渴望根據(jù)自己的喜好獲得個(gè)性化的推薦,未來的電視交互界面應(yīng)該是用戶可以隨意和它對(duì)話,它就能滿足你的一切需求。
事實(shí)上,這種屬于未來的電視機(jī),已經(jīng)提前出現(xiàn)了!創(chuàng)維Wallpaper搭載的人工智能貼身管家——薩曼莎,擁有全方位幫你完成所有指令的智能中控,能夠?qū)崿F(xiàn)自然語言交互,讓用戶能夠與電視進(jìn)行簡(jiǎn)單地對(duì)話,通過云端大數(shù)據(jù)提供用戶需要的內(nèi)容,解決用戶的需求。
從語音識(shí)別來看,下一個(gè)前沿是從識(shí)別走向理解,使得智能產(chǎn)品從過去的被動(dòng)智能轉(zhuǎn)向主動(dòng)智能,甚至可以代替人進(jìn)行思考、決策和執(zhí)行。人工智能將賦予產(chǎn)品主動(dòng)思考的能力,感知用戶的喜好,再通過思考和推理,從而滿足用戶的需求。創(chuàng)維認(rèn)為從技術(shù)和平臺(tái)緯度來看,要做到真正的人工智能化還需要通過技術(shù)上的沉淀與積累,通過不斷地升級(jí)和革新,才能打造出滿足消費(fèi)者需求的智能產(chǎn)品,為消費(fèi)者帶來更好的生活體驗(yàn)。
亞里士多德曾說過,如果機(jī)器能干很多活,豈不是能讓人類解放出來。創(chuàng)維正是為此而努力,解放消費(fèi)者的雙手,為消費(fèi)者帶來更智慧、更便捷的生活。