當(dāng)前位置：首頁 > 智能硬件 > 軍用/航空電子

基于無人機(jī)的視覺傳感網(wǎng)和圖像識別中心的建設(shè)

時間：2020-07-27 10:33:01

關(guān)鍵字：卷積神經(jīng)網(wǎng)絡(luò) 無人機(jī) 深度學(xué)習(xí)

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀] 無人機(jī)技術(shù)的發(fā)展十分迅速。從美軍無人機(jī)的使用，到現(xiàn)在無人機(jī)在研究、民用等多方面的普及，無人機(jī)已成為一種新的潮流[1-2]。隨之而來也帶來很多新問題，此前無人機(jī)險撞戰(zhàn)機(jī)事件的發(fā)生，就給人們敲響了警

無人機(jī)技術(shù)的發(fā)展十分迅速。從美軍無人機(jī)的使用，到現(xiàn)在無人機(jī)在研究、民用等多方面的普及，無人機(jī)已成為一種新的潮流[1-2]。隨之而來也帶來很多新問題，此前無人機(jī)險撞戰(zhàn)機(jī)事件的發(fā)生，就給人們敲響了警鐘。因此，無人機(jī)警察系統(tǒng)的搭建勢在必行。本文的研究重點為：建立視覺傳感網(wǎng)，用于無人機(jī)的圖像捕捉和信息存儲；引入深度學(xué)習(xí)對無人機(jī)進(jìn)行識別，及時發(fā)現(xiàn)“黑飛無人機(jī)”，并采取相應(yīng)報警措施，實現(xiàn)對無人機(jī)的全面監(jiān)管。

1、視覺傳感網(wǎng)

整個視覺傳感網(wǎng)（Visual Sensor Networks，VSNs）由多個節(jié)點組成，每個節(jié)點都將由攝像機(jī)陣列構(gòu)成，這將作為整個系統(tǒng)的基礎(chǔ)部分[3]，如圖1。

城市環(huán)境下一個節(jié)點的安置示意圖如圖2。

為了減輕對居民的干擾，可以修改攝像機(jī)焦距參數(shù)，從而限制攝像機(jī)的拍攝范圍。通過多臺攝像機(jī)交叉覆蓋，成功地將中間的空地區(qū)域全方位地納入監(jiān)控之中。

考慮到多節(jié)點所提供的龐大數(shù)據(jù)量以及優(yōu)化控制結(jié)構(gòu)的需要，將數(shù)據(jù)網(wǎng)絡(luò)設(shè)計成三層結(jié)構(gòu)。位于最底層的第三層由數(shù)量不等的節(jié)點構(gòu)成一系列簇組成，每個簇內(nèi)的節(jié)點統(tǒng)一將數(shù)據(jù)發(fā)往一臺次級處理服務(wù)器。整個網(wǎng)絡(luò)內(nèi)的次級處理服務(wù)器構(gòu)成網(wǎng)絡(luò)的第二層，將數(shù)據(jù)送往位于第一層的中央高級服務(wù)器。

2、基于深度學(xué)習(xí)的圖像識別中心

無人機(jī)警察系統(tǒng)中關(guān)鍵組成是圖像識別中心，其任務(wù)是將視覺傳感網(wǎng)中的圖像信息進(jìn)行分析和處理，從圖像中識別出無人機(jī)，從而實現(xiàn)對無人機(jī)的監(jiān)控，屬于目標(biāo)識別領(lǐng)域。目前這一領(lǐng)域已經(jīng)有了大量的優(yōu)秀成果出現(xiàn)。最常見有行人檢測問題，可用的特征包括：Haar、HOG、CSS、LBP等多種，這些特征表達(dá)了人體的各個重要部分，并且充分考慮了遮擋等情形。王曉剛和歐陽萬里更提出了基于深度學(xué)習(xí)的行人檢測手段，通過聯(lián)合學(xué)習(xí)行人檢測中的4個重要組成部分——特征提取、人體部件形變處理、遮擋處理和分類，最大化了各自的作用[4]。他們在傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上，加入了形變處理層，最終習(xí)得的特征具有很強(qiáng)的判別力，優(yōu)于HOG等特征。王曉剛團(tuán)隊的方案，是深度學(xué)習(xí)在目標(biāo)識別領(lǐng)域的成功應(yīng)用，給本文的研究提供了研究參考。再比如人臉識別問題[5-6]，則具有更復(fù)雜的變化，因為人臉受種族、膚色、表情、情緒、光照環(huán)境、物體遮擋等眾多因素的影響。推廣到各種特定物體的識別乃至場景識別、深度學(xué)習(xí)也有很多方案[7]。由于無人機(jī)警察系統(tǒng)中圖片信息量豐富，且無人機(jī)的飛行狀態(tài)多樣，因此識別難度較大。為此，本文將引入深度學(xué)習(xí)算法，并以卷積神經(jīng)網(wǎng)絡(luò)作為圖像識別中心。

2.1 卷積神經(jīng)網(wǎng)絡(luò)

2006年，Hinton等人首次提出深度學(xué)習(xí)的概念[8]，并開啟了深度學(xué)習(xí)的研究浪潮，其認(rèn)為：多隱層的人工神經(jīng)網(wǎng)絡(luò)能夠更好地模擬人腦的思考過程，具有更加優(yōu)異的學(xué)習(xí)能力，能夠?qū)?shù)據(jù)進(jìn)行更本質(zhì)的刻畫，從而提高可視化或者分類的能力。

卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中第一個真正多層結(jié)構(gòu)學(xué)習(xí)算法，其在圖像識別領(lǐng)域優(yōu)勢明顯。它利用感受野、局部連接等概念極大地減少了參數(shù)量，降低了網(wǎng)絡(luò)模型的復(fù)雜度，提高了訓(xùn)練效率，且網(wǎng)絡(luò)對于平移、縮放的各種變形都具備高度不變性。

卷積神經(jīng)網(wǎng)絡(luò)屬于前饋多層神經(jīng)網(wǎng)絡(luò)的一種，每層由多個二維平面組成，多個神經(jīng)元組成了每個平面，其結(jié)構(gòu)如圖3所示。

卷積神經(jīng)網(wǎng)絡(luò)利用了一系列的卷積層，降采樣層構(gòu)建了多層網(wǎng)絡(luò)，來模擬人腦感知視覺信號的逐層處理機(jī)制，從而提取圖像的多層次特征。

通過加入卷積層，可以實現(xiàn)局部連接網(wǎng)絡(luò)，有效減少了需要訓(xùn)練的網(wǎng)絡(luò)參數(shù)。例如，對一張大的圖片輸入，其尺寸為r&TImes;c，隨機(jī)采樣為a&TImes;b的小圖片，如果隱含節(jié)點為k個，那么最終學(xué)習(xí)到的特征數(shù)為：

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風(fēng)險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機(jī) 衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅持高質(zhì)量發(fā)展策略，塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運(yùn)營商數(shù)字經(jīng)濟(jì)

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]