智能視頻監(jiān)控處理過程
掃描二維碼
隨時(shí)隨地手機(jī)看文章
視覺監(jiān)控的主要目的,是從一組包含人的圖像序列中檢測、識(shí)別、跟蹤人體,并對其行為進(jìn)行理解和描述。大體上這個(gè)過程可分為底層視覺模塊(low-levelvision)、數(shù)據(jù)融合模塊(intermediate-level vision)和高層視覺模塊(high-levelvision)。
其中,底層視覺模塊主要包括運(yùn)動(dòng)檢測、目標(biāo)跟蹤等運(yùn)動(dòng)分析方法;數(shù)據(jù)融合模塊主要解決多攝像機(jī)數(shù)據(jù)進(jìn)行融合處理問題;高層視覺模塊主要包括目標(biāo)的識(shí)別,以及有關(guān)于運(yùn)動(dòng)信息的語義理解與描述等。
如何使系統(tǒng)自適應(yīng)于環(huán)境,是場景建模以及更新的核心問題。有了場景模型,就可以進(jìn)行運(yùn)動(dòng)檢測,然后對檢測到的運(yùn)動(dòng)區(qū)域進(jìn)行目標(biāo)分類與跟蹤。接下來是多攝像機(jī)數(shù)據(jù)融合問題。最后一步是事件檢測和事件理解與描述。通過對前面處理得到的人體運(yùn)動(dòng)信息進(jìn)行分析及理解,最終給出我們需要的語義數(shù)據(jù)。