眼下,行業(yè)巨頭都在打造自己的智能語(yǔ)音生態(tài)系統(tǒng),國(guó)外有IBM、微軟、Google等,國(guó)內(nèi)則有百度、阿里、科大訊飛、搜狗和云知聲。但這一次,四大AI獨(dú)角獸之一的依圖科技也正式拿到入場(chǎng)券了。12月11日消息
核心算法已經(jīng)可在Github上的開源軟件中可用,它實(shí)現(xiàn)了一個(gè)在線二值化錯(cuò)誤率(DER),在NIST SRE 2000 CALLHOME基準(zhǔn)上是7.6%,這對(duì)于實(shí)時(shí)應(yīng)用來(lái)說(shuō)已經(jīng)足夠低了,而谷歌之前使用的方法DER為8.8%。
新浪科技訊 北京時(shí)間9月25日早間消息,人工智能機(jī)器人和自動(dòng)駕駛汽車可能是媒體關(guān)注焦點(diǎn),但谷歌搜索業(yè)務(wù)負(fù)責(zé)人本·戈麥斯(Ben Gomes)表示,科技的下個(gè)飛躍將是語(yǔ)音技術(shù)的發(fā)展。他認(rèn)為,更好地理解普
語(yǔ)音識(shí)別(Speech Recognition)是機(jī)器通過(guò)訓(xùn)練和匹配過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。關(guān)于語(yǔ)音識(shí)別技術(shù),先后出現(xiàn)了動(dòng)態(tài)時(shí)間彎折(DTW)、隱馬爾可夫和人工神經(jīng)網(wǎng)絡(luò)三種主要方法[1]。由于每種方法都涉及大量的乘加運(yùn)算,并且計(jì)算精度是算法性能的有效保障,因此對(duì)處理器的運(yùn)算能力要求較高。近年大規(guī)模集成電路的快速發(fā)展,為
據(jù)國(guó)外媒體報(bào)道,雖然人工智能機(jī)器人和自動(dòng)駕駛汽車可能成為未來(lái)的頭條新聞,但谷歌搜索負(fù)責(zé)人本·戈麥斯(Ben Gomes)表示,技術(shù)領(lǐng)域的下一個(gè)重大飛躍將是語(yǔ)音服務(wù)的進(jìn)步。戈麥斯表示,更好地理解通用語(yǔ)言對(duì)互聯(lián)網(wǎng)的未來(lái)發(fā)展至關(guān)重要。
語(yǔ)音識(shí)別研究的根本目的是研究出一種具有聽覺功能的機(jī)器,能直接接受人的口呼命令,理解人的意圖并做出相應(yīng)的反映。語(yǔ)音識(shí)別系統(tǒng)的研究涉及微機(jī)技術(shù)、人工智能、數(shù)字信號(hào)處理、模式識(shí)別、聲學(xué)、語(yǔ)言學(xué)和認(rèn)知科學(xué)等許多學(xué)科領(lǐng)域,是一個(gè)多學(xué)科綜合性研究領(lǐng)域。近年來(lái),高性能數(shù)字信號(hào)處理芯片DSP(Digital Signal Process)技術(shù)的迅速發(fā)展,為語(yǔ)音識(shí)別的實(shí)時(shí)實(shí)現(xiàn)提供了可能,其中,AD公司的數(shù)字信號(hào)處理芯片以其良好的性價(jià)比和代碼的可移植性被廣泛地應(yīng)用于各個(gè)領(lǐng)域。因此,我們采用AD公司的定點(diǎn)DSP處理芯片ADSP
“未來(lái)人工智能的研究領(lǐng)域會(huì)體現(xiàn)在兩個(gè)方向,這兩個(gè)方向與人類大腦相吻合?!痹?018世界人工智能大會(huì)“AI前沿與行業(yè)賦能主題論壇”上,微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋表示,其中一個(gè)是探索人腦機(jī)制對(duì)AI技術(shù)的改善,另一個(gè)則是AI應(yīng)用于人腦研究中,“在這些方向背后,需要進(jìn)行大量的基礎(chǔ)研究。”
戈麥斯說(shuō):“語(yǔ)音識(shí)別和對(duì)語(yǔ)言的理解是未來(lái)搜索和信息的核心。但是有很多難題,比如理解引用語(yǔ)是如何起作用的,理解‘他’、‘她’或‘它’在句子中指的是什么。在語(yǔ)音服務(wù)角度,這只是其面臨的數(shù)以百萬(wàn)計(jì)的問題之一。
9月25日消息,谷歌搜索業(yè)務(wù)負(fù)責(zé)人本·戈麥斯(Ben Gomes)在接受記者采訪時(shí)做出了一次驚人的預(yù)言,他表示科技的下一個(gè)轉(zhuǎn)折點(diǎn)將是語(yǔ)音識(shí)別技術(shù)。戈麥斯認(rèn)為如何讓機(jī)器更好的對(duì)普通語(yǔ)言進(jìn)行認(rèn)知將決定著互聯(lián)網(wǎng)時(shí)代未來(lái)的發(fā)展。
近年來(lái)機(jī)器翻譯發(fā)展越來(lái)越成熟,機(jī)器翻譯和語(yǔ)音助手結(jié)合是不是能成為超級(jí)令人敬佩的同傳了呢,顯然沒有那么簡(jiǎn)單。科大訊飛為了凸顯自家的AI同傳多厲害,竟然把人類翻譯的內(nèi)容當(dāng)作AI的勞動(dòng)成果。
隨著DSP技術(shù)的進(jìn)步,計(jì)算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn),使3G手機(jī)上植入更精確更復(fù)雜的自動(dòng)語(yǔ)音識(shí)別(ASR)功能成為可能。目前,基本ASR應(yīng)用可以分成三大類:1. 語(yǔ)音-文本轉(zhuǎn)換(語(yǔ)音輸入);2. 講者識(shí)別;3. 語(yǔ)音命令控制(語(yǔ)音控制)。
羅文指出,要從四個(gè)方面推動(dòng)深圳市人工智能芯片產(chǎn)業(yè)加快發(fā)展,一是對(duì)接國(guó)家戰(zhàn)略。國(guó)家已經(jīng)在人工智能領(lǐng)域發(fā)布了系列規(guī)劃,企業(yè)應(yīng)按照國(guó)家的規(guī)劃部署要求,積極將產(chǎn)品規(guī)劃和國(guó)家戰(zhàn)略相結(jié)合。
本文介紹了一種采用ARM處理器作為控制核心的非特定人語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)方案。方案中的系統(tǒng)利用IC Route公司的非特定語(yǔ)音識(shí)別芯片LD3320與ARM Cortex M3內(nèi)核ST公司的32位高性能單片機(jī)STM32F103C8T6組成功能主體,在系統(tǒng)中實(shí)現(xiàn)SD卡文件系統(tǒng)。
一種基于DSP芯片的語(yǔ)音識(shí)別和數(shù)字錄音系統(tǒng)。在該系統(tǒng)中,DSP(單片ADSP2185)完成語(yǔ)音識(shí)別和數(shù)字錄音功能,MCU完成用戶界面處理。該系統(tǒng)可以實(shí)現(xiàn)語(yǔ)音名片(電路號(hào)碼、工作單位、地址等)存儲(chǔ)及聲控查詢、記事錄音及聲控回放、日歷、簡(jiǎn)單計(jì)算器等功能。
自從IBM的Shoebox和Worlds of Wonder的玩具娃娃Julie doll發(fā)布以來(lái),語(yǔ)音識(shí)別技術(shù)一直在不斷地發(fā)展。到2018年底,Google Assistant支持超過(guò)30種不同的語(yǔ)言。
服務(wù)機(jī)器人以服務(wù)為目的,因此人們需要一種更方便、更自然、更加人性化的方式與機(jī)器人交互,而不再滿足于復(fù)雜的鍵盤和按鈕操作?;诼犛X的人機(jī)交互是該領(lǐng)域的一個(gè)重要發(fā)展方向。目前主流的語(yǔ)音識(shí)別技術(shù)是基于統(tǒng)計(jì)模
盡管困難重重,但這并不會(huì)阻止技術(shù)的發(fā)展,時(shí)代巨輪的前進(jìn)。比如在語(yǔ)音識(shí)別率方面,目前一些主流平臺(tái)的識(shí)別率可以達(dá)到95%以上,這無(wú)疑為語(yǔ)音技術(shù)落地提供了大大的技術(shù)支持。
文中闡述的是家庭監(jiān)護(hù)機(jī)器人項(xiàng)目中語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)的部分,通過(guò)DSP、DMA和ARM Cortex-A8的并行處理,利用雙緩沖的方法,在嵌入式Linux上實(shí)現(xiàn)了基于ATK的實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)。文中對(duì)該系統(tǒng)的軟硬件進(jìn)行了設(shè)計(jì)。在硬件方面,給出語(yǔ)音識(shí)別系統(tǒng)的硬件組成原理,并提供了關(guān)鍵部分原理圖;在軟件方面,提出實(shí)時(shí)語(yǔ)音識(shí)別的方法,給出應(yīng)用程序?qū)崿F(xiàn)
摘要:采用VC++和Matlab混合編程搭建了一個(gè)高效的基于HMM的語(yǔ)音識(shí)別實(shí)驗(yàn)驗(yàn)證平臺(tái)。結(jié)合FPGA的特點(diǎn),直接使用加法器、乘法器、比較器等建立一個(gè)Viterbi算法結(jié)構(gòu),采用改進(jìn)方法計(jì)算Viterbi得分,實(shí)現(xiàn)一種簡(jiǎn)單的基于HMM的語(yǔ)