LD3320語(yǔ)音識(shí)別模塊:LDV7模塊使用詳解
LD3320是非特定人(不用針對(duì)指定人)語(yǔ)音識(shí)別芯片,即語(yǔ)音聲控芯片。最多可以識(shí)別50條預(yù)先內(nèi)置的指令。
工作模式:
LD3320(LDV7)語(yǔ)音模塊可以工作在以下三種模式:普通模式:直接說(shuō)話,模塊直接識(shí)別;按鍵模式:按鍵觸發(fā)開(kāi)始ASR進(jìn)程;口令模式:需要一級(jí)喚醒詞(口令);推薦使用口令模式,這樣避免嘈雜環(huán)境下誤動(dòng)作。
應(yīng)用場(chǎng)景:
家居智能控制
智能小車(chē)DIY設(shè)計(jì)
畢業(yè)設(shè)計(jì)創(chuàng)新功能
個(gè)人DIY設(shè)計(jì)
語(yǔ)音控制嵌入式產(chǎn)品設(shè)計(jì)
我購(gòu)買(mǎi)的LDV7語(yǔ)音識(shí)別模塊,內(nèi)置單片機(jī),LD3320語(yǔ)音識(shí)別芯片的驅(qū)動(dòng)是靠模塊上自帶的STC11L08單片機(jī)驅(qū)動(dòng)的,我們可以修改模塊自帶工程的Demo程序,修改里面的關(guān)鍵詞,然后將識(shí)別的結(jié)果通過(guò)串口打印出來(lái),我們使用另外一個(gè)MCU與該模塊進(jìn)行串口通信,解析收到的串口指令,進(jìn)而做響應(yīng)的指令動(dòng)作。
例如
我們說(shuō)口令:當(dāng)前時(shí)間(dang qian shi jian)
》》 模塊識(shí)別之后,串口輸出:PrintCom("{\"VoiceCommandCode\":2}");
》》 MCU接收串口信息之后,對(duì)該串口指令進(jìn)行解析(可以使用cJSON解析此字符串);
》》 然后通過(guò)TTS文字轉(zhuǎn)語(yǔ)音模塊播放當(dāng)前時(shí)間,即完成本次語(yǔ)音識(shí)別控制過(guò)程。
識(shí)別原理:
就是你說(shuō)一句話,然后模塊用拼音去和你的發(fā)音做比較,在關(guān)鍵詞中找出哪些預(yù)設(shè)值的詞語(yǔ)與發(fā)音的接近程度大于多少的(假定50%),然后再?gòu)囊欢汛笥冢?0% )里面輸出一個(gè)最接近的。
這里就會(huì)造成一個(gè)問(wèn)題,容易造成誤識(shí)別太多。
如果你只有一個(gè)關(guān)鍵詞:時(shí)間
然后你說(shuō)了一句:‘時(shí)刻’,他識(shí)別到‘時(shí)’這個(gè)發(fā)音,所以有50% 以上的相似,但是候選詞中沒(méi)有‘時(shí)刻’這個(gè)比他更接近的關(guān)鍵詞,所以他就會(huì)輸出‘時(shí)間’的結(jié)果。這樣子他就是錯(cuò)誤了。
如果你設(shè)置一些擬聲詞,有可能隨隨便便就觸發(fā)了。
解決方案:
在設(shè)定好要識(shí)別的關(guān)鍵詞語(yǔ)后,為了進(jìn)一步降低誤識(shí)別率,可以再添加一些其他的任意詞匯進(jìn)識(shí)別列表,用來(lái)吸收錯(cuò)誤識(shí)別,從而達(dá)到降低誤識(shí)別率的目的。我們把這樣一些關(guān)鍵詞語(yǔ)稱(chēng)之為“垃圾關(guān)鍵詞語(yǔ)”。
比如,某個(gè)應(yīng)用場(chǎng)景中,需要識(shí)別的關(guān)鍵詞語(yǔ)是 4 條,“前進(jìn)”,“后 退”,“開(kāi)門(mén)”,“關(guān)門(mén)”。在把這 4 個(gè)關(guān)鍵詞語(yǔ)設(shè)置進(jìn) LD3320 后,可以再另外設(shè)置10~30個(gè)詞語(yǔ)進(jìn)LD3320,比如“前門(mén)”,“后門(mén)”,“阿阿阿”,“嗚 嗚”等等。所以最好把一些擬聲詞或者容易混淆的詞語(yǔ)設(shè)置為垃圾關(guān)鍵詞,即,識(shí)別后不進(jìn)行輸出。
只有識(shí)別結(jié)果是 4 個(gè)關(guān)鍵詞語(yǔ)之內(nèi)的,才認(rèn)為識(shí)別有效。如果識(shí)別結(jié)果是 “垃圾關(guān)鍵詞語(yǔ)”,則說(shuō)明是其他的聲音導(dǎo)致的誤識(shí)別,產(chǎn)品應(yīng)該重新開(kāi)始一 次識(shí)別過(guò)程。這樣,可以非常有效地降低誤識(shí)別率。極大地提高終端用戶的主觀使用體驗(yàn)。
移植過(guò)程:
1、向LD模塊中添加關(guān)鍵詞
2、用戶執(zhí)行函數(shù)User_handle(nAsrRes); 處理語(yǔ)音識(shí)別結(jié)果
3、根據(jù)不同結(jié)果,串口打印不同的指令
PrintCom("{\"VoiceCommandCode\":1}");
4、MCU根據(jù)指令不同,執(zhí)行不同的動(dòng)作
以JSON格式發(fā)送數(shù)據(jù)至串口,與語(yǔ)音識(shí)別模塊相連的MCU接收此結(jié)果,然后對(duì)此字符串進(jìn)行解析,進(jìn)而得到當(dāng)前識(shí)別的命令是什么,進(jìn)而做相應(yīng)的動(dòng)作。
//LD3320
if(USART5_RX_STA&0x8000)
{
uart5Len=USART5_RX_STA&0x3f; //得到此次接收到的數(shù)據(jù)長(zhǎng)度
receive_json = cJSON_Parse(USART5_RX_BUF); //創(chuàng)建JSON解析對(duì)象,返回JSON格式是否正確
if (!receive_json)
{
printf("JSON格式錯(cuò)誤:%s \r\n", cJSON_GetErrorPtr()); //輸出json格式錯(cuò)誤信息
}
else
{
printf("JSON格式正確:%s \r\n",cJSON_Print(receive_json) );
item_obj = receive_json->child; //獲取name鍵對(duì)應(yīng)的值的信息
while(item_obj)
{
char * string = item_obj->string;
if(!strcmp(string,"VoiceCommandCode"))
{
if(item_obj->valueint==0)
{
printf("收到一級(jí)口令 智能報(bào)時(shí) ... \r\n");
}
else if(item_obj->valueint==1)
{
printf("“現(xiàn)在幾點(diǎn)了”命令識(shí)別成功 \r\n");
m_nCurrentVoicePlayTimes++;
while(U5152_BSY){}
if(m_nCurrentVoicePlayTimes%2==0)
{
sprintf((char*)dtbuf,"[v5][s5][m3]當(dāng)前時(shí)間為%02d時(shí)%02d分%02d秒 \r\n",NowHour,NowMinute,NowSecond);
}
else
{
sprintf((char*)dtbuf,"[v5][s5][m51]當(dāng)前時(shí)間為%02d時(shí)%02d分%02d秒 \r\n",NowHour,NowMinute,NowSecond);
}
printf((char*)dtbuf);
XFS_FrameInfo((char*)dtbuf) ;
delay_ms(10);while(U5152_BSY){delay_ms(500);printf("while(U5152_BSY) \r\n");}
}
}
item_obj = item_obj->next;
printf("while(item_obj) \r\n");
}
}
cJSON_Delete(receive_json);
USART5_RX_STA=0;
memset(USART5_RX_BUF, 0, sizeof(USART5_RX_BUF)); //清空數(shù)組
}
LDV7模塊固件下載:
1、打開(kāi)編譯后的.hex文件
2、選對(duì)串口號(hào),芯片型號(hào)后,選擇“下載/編程”按鈕,然后給STC單片機(jī)上電或者復(fù)位。
3、發(fā)出語(yǔ)音,測(cè)試語(yǔ)音識(shí)別結(jié)果
然后其他與LDV7模塊相連的MCU只要解析接收到的串口數(shù)據(jù)即可。
喜歡請(qǐng)關(guān)注微信公眾號(hào):程序員小哈
有啥想玩的模塊,留言給我,咱們一起玩
如果有其他的問(wèn)題可以評(píng)論區(qū)指出,有問(wèn)必答,知無(wú)不言。
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!