www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 消費(fèi)電子 > 觸控感測(cè)
[導(dǎo)讀] 走出實(shí)驗(yàn)室的聲紋識(shí)別技術(shù)因其廣闊的應(yīng)用場(chǎng)景和價(jià)值,從特定領(lǐng)域到民用領(lǐng)域,在國(guó)內(nèi)外正迎來(lái)第一波商用化浪潮。而與此同時(shí),關(guān)于聲紋識(shí)別技術(shù)研究的成熟度以及安全可靠性,一直是應(yīng)用領(lǐng)域討論的重點(diǎn),本文基于

走出實(shí)驗(yàn)室的聲紋識(shí)別技術(shù)因其廣闊的應(yīng)用場(chǎng)景和價(jià)值,從特定領(lǐng)域到民用領(lǐng)域,在國(guó)內(nèi)外正迎來(lái)第一波商用化浪潮。而與此同時(shí),關(guān)于聲紋識(shí)別技術(shù)研究的成熟度以及安全可靠性,一直是應(yīng)用領(lǐng)域討論的重點(diǎn),本文基于時(shí)下聲紋識(shí)別技術(shù)研究的前沿觀點(diǎn),總結(jié)出五大發(fā)展趨勢(shì):

1、聲紋識(shí)別研究朝著深度學(xué)習(xí)和端到端方向發(fā)展

語(yǔ)音作為語(yǔ)言的聲音表現(xiàn)形式,不僅包含了語(yǔ)言語(yǔ)義信息,同時(shí)也傳達(dá)了說(shuō)話人語(yǔ)種、性別、年齡、情感、信道、嗓音、病理、生理、心理等多種豐富的副語(yǔ)言語(yǔ)音屬性信息。以上這些語(yǔ)言語(yǔ)音屬性識(shí)別問(wèn)題從整體來(lái)看,其核心都是針對(duì)不定時(shí)長(zhǎng)文本無(wú)關(guān)的句子層面語(yǔ)音信號(hào)的有監(jiān)督學(xué)習(xí)問(wèn)題,只是要識(shí)別的屬性標(biāo)注有不同。

近年來(lái),聲紋識(shí)別的研究趨勢(shì)正在快速朝著深度學(xué)習(xí)和端到端方向發(fā)展,其中最典型的就是基于句子層面的做法。在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)、數(shù)據(jù)增強(qiáng)、損失函數(shù)設(shè)計(jì)等方面還有很多工作去做,還有很大的提升空間。

2、提升聲紋識(shí)別系統(tǒng)的短時(shí)語(yǔ)音情況

在實(shí)際應(yīng)用中,由于對(duì)基于語(yǔ)音的訪問(wèn)控制需求的不斷增長(zhǎng),提升聲紋識(shí)別系統(tǒng)在短時(shí)語(yǔ)音情況下的性能變得尤為迫切。短時(shí)語(yǔ)音中說(shuō)話人信息不足以及注冊(cè)和測(cè)試語(yǔ)音的文本內(nèi)容不匹配,對(duì)于主流的基于統(tǒng)計(jì)建模的聲紋識(shí)別系統(tǒng)是一個(gè)嚴(yán)峻的挑戰(zhàn)。

3、改進(jìn)現(xiàn)有的深度說(shuō)話人學(xué)習(xí)方法

目前采用的深度說(shuō)話人識(shí)別方法首先利用神經(jīng)網(wǎng)絡(luò)提取前端的幀級(jí)特征,然后通過(guò)池化映射獲得可以表示說(shuō)話人特性的段級(jí)向量,最后采用LDA/PLDA等后端建模方法進(jìn)行度量計(jì)算。

相對(duì)于傳統(tǒng)的i-vector生成過(guò)程,基于深度學(xué)習(xí)的說(shuō)話人識(shí)別方法優(yōu)勢(shì)主要體現(xiàn)在區(qū)分性訓(xùn)練和利用多層網(wǎng)絡(luò)結(jié)構(gòu)對(duì)局部多幀聲學(xué)特征的有效表示上。如何進(jìn)一步改進(jìn)現(xiàn)有的深度說(shuō)話人學(xué)習(xí)方法是現(xiàn)階段的一個(gè)研究熱點(diǎn)。

4、深度對(duì)抗學(xué)習(xí)在聲紋識(shí)別技術(shù)中的應(yīng)用

生成式對(duì)抗網(wǎng)絡(luò)(GAN)的主要目的是用在數(shù)據(jù)生成、降噪、等很多場(chǎng)景里面。它還被用在領(lǐng)域自適應(yīng)里面,形成一個(gè)新的分布。第三個(gè)廣泛的應(yīng)用是生成對(duì)抗樣本,這會(huì)對(duì)分類系統(tǒng)產(chǎn)生大的困擾。很多研究者用對(duì)抗樣本攻擊機(jī)器學(xué)習(xí)的系統(tǒng),在原始數(shù)據(jù)上增加一些擾動(dòng),生成樣本,經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)之后就有可能識(shí)別成完全不同的結(jié)果。這個(gè)思想在圖像處理領(lǐng)域非?;钴S,會(huì)造成錯(cuò)誤識(shí)別,引起了自動(dòng)駕駛,安全等領(lǐng)域的研究人員的廣泛關(guān)注。

在語(yǔ)音領(lǐng)域,GAN可以用在語(yǔ)音識(shí)別、口音自適應(yīng)上,通過(guò)多任務(wù)學(xué)習(xí)和梯度反轉(zhuǎn)層來(lái)進(jìn)行口音或信道的自適應(yīng),然后加上其他方法可以得到較好的效果。聲紋識(shí)別也存在各種不匹配的問(wèn)題,在聲紋識(shí)別上也可以使用這一思想。同樣的思想也用在了TTS語(yǔ)音合成領(lǐng)域,目的是把不同的音素解耦成說(shuō)話人,風(fēng)格等,去除噪聲對(duì)建模的影響。

5、深度嵌入學(xué)習(xí)是進(jìn)行聲紋識(shí)別和反欺騙的一個(gè)重要途徑

說(shuō)話人識(shí)別和欺騙檢測(cè)近年來(lái)受到學(xué)術(shù)界和業(yè)界的廣泛關(guān)注,人們希望在實(shí)際應(yīng)用中設(shè)計(jì)出高性能的系統(tǒng)?;谏疃葘W(xué)習(xí)的方法在該領(lǐng)域得到了廣泛的應(yīng)用,在說(shuō)話人識(shí)別和反欺騙方面取得了新的里程碑。然而,在真實(shí)復(fù)雜的場(chǎng)景下,面對(duì)短語(yǔ)音、噪聲的破壞、信道失配、大規(guī)模等困難,開(kāi)發(fā)一個(gè)魯棒的系統(tǒng)仍然是非常困難的。深度嵌入學(xué)習(xí)是進(jìn)行說(shuō)話人識(shí)別和反欺騙的一個(gè)重要途徑,在這方面已有一些著名的研究成果。如之前的d-vector特征和當(dāng)前普遍使用的x-vector特征。

結(jié)語(yǔ):

目前,指紋識(shí)別、人臉識(shí)別已經(jīng)被大眾所熟知,但同樣作為生物識(shí)別的聲紋識(shí)別,還處于技術(shù)挑戰(zhàn)的前沿地帶。據(jù)聲紋識(shí)別企業(yè)快商通分析,當(dāng)下全球生物識(shí)別產(chǎn)業(yè)規(guī)模龐大,僅聲紋識(shí)別這一細(xì)分方向的市場(chǎng)規(guī)模就將近百億美元,預(yù)計(jì)2020年更是有望超過(guò)200億美元(合1346億元人民幣),占整個(gè)生物識(shí)別市場(chǎng)的22.4%。

以國(guó)內(nèi)公共安全領(lǐng)域?yàn)槔?,公安部面向全?guó)推廣聲紋技術(shù),與指紋庫(kù)、DNA庫(kù)類似,聲紋庫(kù)建設(shè)是一項(xiàng)有著重要實(shí)戰(zhàn)價(jià)值的工作,具體表現(xiàn)在聲紋特征具有非接觸式采集的優(yōu)點(diǎn),和已有DNA庫(kù)、指紋庫(kù)相結(jié)合,可形成立體生物特征庫(kù),建成后直接為多警種服務(wù),是利用高科技手段在偵破案件和訴訟活動(dòng)中應(yīng)用的一個(gè)新的增長(zhǎng)點(diǎn),將能有效提高公安機(jī)關(guān)偵查破案的效率和能力,成為落實(shí)科技強(qiáng)警的重要實(shí)踐之一。目前,公安部已在聲紋庫(kù)建設(shè)方面進(jìn)行了重點(diǎn)布局,并選擇快商通等通過(guò)公安部標(biāo)準(zhǔn)檢測(cè)的廠商作為聲紋采集設(shè)備提供方,力求雙發(fā)共同完成這項(xiàng)專業(yè)技術(shù)性強(qiáng)、應(yīng)用領(lǐng)域廣、建設(shè)難度大的系統(tǒng)工程。

來(lái)源:安防知識(shí)網(wǎng)

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動(dòng)電源

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢(shì)抑制與過(guò)流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動(dòng)電源

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問(wèn)題卻十分常見(jiàn),不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問(wèn)題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動(dòng)電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動(dòng)電源

電動(dòng)汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字: 電動(dòng)汽車 新能源 驅(qū)動(dòng)電源

在現(xiàn)代城市建設(shè)中,街道及停車場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動(dòng)電源 LED

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動(dòng)電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問(wèn)題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對(duì)周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來(lái)解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動(dòng)電源

開(kāi)關(guān)電源具有效率高的特性,而且開(kāi)關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字: LED 驅(qū)動(dòng)電源 開(kāi)關(guān)電源

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動(dòng)電源
關(guān)閉