0 引 言
新時代之際,計算機(jī)視覺技術(shù)席卷而來?;跈C(jī)器視覺的圖像識別技術(shù)在農(nóng)業(yè)領(lǐng)域得到了廣泛應(yīng)用。最初的圖像識別扮演著實用工具的角色,目的是將物理圖像轉(zhuǎn)換為數(shù)字圖像,而今天,圖像識別技術(shù)開始著重于機(jī)器層面上的智能識別。于農(nóng)業(yè)而言,十九大報告中指出 :世界各國農(nóng)業(yè)的發(fā)展從最初的體力為主的農(nóng)業(yè) 1.0,到農(nóng)業(yè)機(jī)械為主的農(nóng)業(yè) 2.0, 再到自動化裝備齊全的農(nóng)業(yè) 3.0,直到現(xiàn)如今的以物聯(lián)網(wǎng)、人工智能等為主的農(nóng)業(yè) 4.0。因此,怎樣通過有限的耕地資源生產(chǎn)出盡可能多的農(nóng)產(chǎn)品已成為我國農(nóng)業(yè)發(fā)展所面臨的一個重要問題。針對這一挑戰(zhàn),基于圖像識別與圖像處理技術(shù)的農(nóng)作物識別、農(nóng)作物生長監(jiān)測等被眾多學(xué)者提出,已成為學(xué)術(shù)界研究的主流 [1-6]。
圖像識別技術(shù)在被廣泛應(yīng)用的同時,大家對于圖像的各 項要求也越來越高,需求越來越多。同時,在我們使用手機(jī)、照相機(jī)等進(jìn)行圖像拍攝、傳輸?shù)倪^程中,可能會導(dǎo)致斑點的 產(chǎn)生,使得圖像模糊不清,此時便需要針對所處理的圖像進(jìn) 行去噪、圖像增強、圖像分割等操作 [7];圖像分割技術(shù)中, 若需要提取圖像的邊緣信息,則需要熟悉邊緣提取操作,而 圖像識別技術(shù)的邊緣提取會涉及許多算法 [8];若需要進(jìn)行去除噪聲以及圖像孤立點的操作,則需要使用均值濾波、中值 濾波 [9]、形態(tài)學(xué)濾波 [8]等 ;若數(shù)字圖像比較模糊,則需要通過圖像增強來提高圖像的清晰度,如直方圖均衡化 [10]操作 ; 我們也可以通過角點檢測 [11]算法或者圖像壓縮 [12]算法來簡化圖像數(shù)據(jù),進(jìn)而提取出有用的特征參數(shù)??傊?,圖像分割技術(shù)應(yīng)用廣泛。目前,國內(nèi)外學(xué)者仍然熱衷于圖像預(yù)處理相關(guān)算法的改進(jìn)與完善,因而它并非十全十美,相關(guān)算法需要我們深度理解,盡自己所能去改進(jìn)算法,為圖像處理技術(shù)創(chuàng)新盡自己的綿薄之力。
1 國內(nèi)外研究
現(xiàn)在幾乎每個人都有手機(jī),手機(jī)上的攝像頭分辨率也在迅速提高。使用機(jī)器識別用手機(jī)拍攝的植物圖片顯然比使用其他傳感器收集數(shù)據(jù)更方便,更容易推廣。基于圖像處理的機(jī)器識別方法也成為近年來的研究熱點。
植物類型的視覺識別對植物學(xué)家來說可能很容易,但對機(jī)器來說,這是一項復(fù)雜且計算成本高昂的任務(wù)。Puja 等 [13] 設(shè)計了一種葉片識別系統(tǒng),該系統(tǒng)是植物病害識別的前置步驟。作者使用了兩步算法,包括分割和分類。系統(tǒng)采用主成分分析法進(jìn)行降維,支持向量機(jī)作為分類器,縮放不同大小的植物圖像。該方法的準(zhǔn)確率為 77.96%,可以通過加入更多的葉片特征來提高準(zhǔn)確率。Lavania 和 Matey[14] 設(shè)計了一種基于尺度不變特征變換的葉片識別方法,旨在避免人類參與特征提取過程。該方法利用尺度不變特征變換(SIFT)的關(guān)鍵描述符進(jìn)行邊緣檢測和分類,采用平均投影算法作為第二種基于輪廓的邊緣檢測方法。他們以葉片圖像作為輸入,進(jìn)行特征提取,之后進(jìn)行關(guān)鍵點計算,并存儲計算出的關(guān)鍵點,然后與數(shù)據(jù)集中的葉片圖像進(jìn)行匹配,從而進(jìn)行植物分類。作者將該方法與基于 SIFT 和輪廓的邊緣檢測方法進(jìn)行了對比,并將該方法與 Flavia 數(shù)據(jù)集進(jìn)行了基于 Zernike 矩和定向梯度直方圖的植物識別研究,準(zhǔn)確率為87.5%。
Salve 等 [15] 利用 Zernike 矩和梯度方向直方圖(HOG)作為形狀描述符特征,在 50 種不同植物的數(shù)據(jù)集上對該方法進(jìn)行了測試。首先對圖像進(jìn)行預(yù)處理,然后應(yīng)用 Zernike 矩和梯度方向直方圖進(jìn)行特征提取。由于健壯性和特性持久性,HOG 的性能優(yōu)于 Zernike 矩,報告準(zhǔn)確率為 84.66%。將上述特征與一些基于葉子的特征相結(jié)合,可以進(jìn)一步改善其結(jié)果。另一項研究基于一種新的形狀描述符,他們使用周期小波描述符(PWD)創(chuàng)建了一個包含不同植物物種特征的數(shù)據(jù)庫,首先利用反向傳播神經(jīng)網(wǎng)絡(luò)對 PWD 特征進(jìn)行訓(xùn)練, 然后對葉片進(jìn)行識別,識別準(zhǔn)確率 [16] 達(dá) 90%。
還有一種基于形狀生長模式的物體識別技術(shù),這項工作是對形狀進(jìn)行膨脹,從而計算出具有重要特征的圖像的更新尺寸。這項工作被證明對噪音有彈性,但涉及到計算開銷和目標(biāo)識別能力,且要求較高。文獻(xiàn) [17] 提出了一種自動亮度調(diào)節(jié)系統(tǒng),可用于更好地識別目標(biāo)。這項工作通過獲取 CIE 實驗室空間的 RGB 和“L”分量來調(diào)整圖像的亮度,由模糊推理系統(tǒng)計算每個像素的調(diào)整系數(shù)。該工作聲稱圖像的自動亮度調(diào)節(jié)有助于更好地識別目標(biāo),可用于目標(biāo)識別系統(tǒng)的預(yù)處理階段。
2 圖像分割技術(shù)原理
圖像分割是由圖像處理到圖像分析的關(guān)鍵步驟,一直以來都是圖像處理技術(shù)中的難點之一。時至今日借助各種理論模型提出的分割算法已達(dá)上千種,但如何高效地將特征目標(biāo)從復(fù)雜的源圖像中分割出來始終是一個熱點話題。圖像分割的重要性和實用性在引起廣泛研究的同時,在自動式和交互式方面還提出了大量方法,如強度、顏色、紋理等。雖然在科學(xué)文獻(xiàn)中已出現(xiàn)了很多分割技術(shù),基本可以分為基于圖像域的分割技術(shù)、基于物理的分割技術(shù)和基于特征空間的分割技術(shù) [18],但圖像分割過程包括前期的圖像預(yù)處理、顏色特征的選擇、圖像分割算法的設(shè)計與圖像后處理。
2.1 圖像灰度化
我們可以將灰度圖像看作是灰度值介于黑色和白色之間的圖像,或者說是提取出不同顏色種類的不同程度的亮度值 [19]。若是對彩色圖像進(jìn)行灰度化,等價于將一幅彩色圖像轉(zhuǎn)化為灰度圖像的過程。比如大家平時接觸的黑白圖像就可以看作是灰度圖像。一般情況下,彩色圖像可以劃分為 R,G,B 三種分量(R 為紅色分量,G 為綠色分量,B 為藍(lán)色分量),將其灰度化等價于使 R,G,B 三個分量相等的過程。我們?nèi)粘I钪兴吹降膱D像擁有不同的顏色是因為圖像的每一個像素點的灰度值是不同的,灰度值最大值為 255,顯示為白色,灰度值最小值為 0,顯示為黑色,灰度圖像每個像素點都有其對應(yīng)的灰度值,大小在 0 ~ 255 之間?;叶然慕?jīng)典算法主要包括分量法、最大值法及加權(quán)平均法。
2.2 圖像平滑
若存在僅僅有一幀帶有噪聲的圖像,用以上方法則無法消除噪聲,由噪聲的特點可知其灰度與周圍灰度間存在明顯的灰度差,即我們所說的視覺障礙,因此圖像平滑(Image Smoothing)將是一個有效的工具。
圖像平滑又稱作平滑或者濾波,又或者平滑濾波。它屬于低頻增強的空間域濾波技術(shù)。圖像平滑是視頻信息處理與分析領(lǐng)域的一項傳統(tǒng)任務(wù),其核心內(nèi)容或者難點在于將邊緣部分和噪聲部分進(jìn)行區(qū)分,且僅僅去除噪聲。圖像能量具有高低頻之別,低頻部分的內(nèi)容是其有用信息的儲存之地,高頻部分則是噪聲以及邊緣信息的存儲段,因此在去除噪聲時, 很容易將其邊緣信息一同消除,這就要求我們尋找一個適當(dāng)?shù)姆椒▽崿F(xiàn)在去除噪聲的同時保留圖像的邊緣部分。
圖像平滑可分為空頻域以及頻域法兩大類。我們將濾波器理解為是一個含有加權(quán)系數(shù)的窗口,當(dāng)需要濾波器進(jìn)行平滑處理時,將其窗口置于圖像之上,通過該窗口即可觀察到處理得到的圖像。濾波器的種類繁多,主要包括6 種濾波方法, 即盒式濾波、均值濾波、高斯濾波、中值濾波、雙邊濾波以及引導(dǎo)濾波,其主要目的或者作用是去除圖像的噪聲以及提取出所需特征。
2.3 圖像閾值分割算法
圖像閾值分割作為圖像分割方法的一種經(jīng)典方法,具有操作簡化、性能較穩(wěn)定、運算速率高、準(zhǔn)確率高等特點。主要思想是基于所選擇的灰度級數(shù),從原圖像中分割出感興趣的目標(biāo)物,或者將其劃分為不同部分 [20]。在實驗中,選取合適的閾值進(jìn)行圖像分割是實驗的難點,但因其計算需使用灰度值,因此使用簡單高效。如果原圖像目標(biāo)與背景差異較大, 全局閾值分割法是個很好的選擇 ;反之,若兩者差異不大或多個目標(biāo)的灰度值相近,則可以選擇局部閾值或動態(tài)閾值分割法。
針對綠色作物圖像而言,將作物與土壤背景進(jìn)行分割極其重要,它會受噪聲、光照等因素的影響。上述方法已較好地去除了部分噪聲影響,除此之外,我們還可以通過兩者間顏色、形狀及紋理的差異進(jìn)行分割。Naidu 等提出了一種利用螢火蟲優(yōu)化算法優(yōu)化模糊熵的多級圖像閾值分割方法 [21]。伍艷蓮等 [22] 在利用改進(jìn)均值漂移算法的基礎(chǔ)上,獲取圖像顏色指數(shù)信息之后,將其與空間信息進(jìn)行結(jié)合,最后進(jìn)行 Otsu 閾值分割。閾值分割流程如圖 1 所示。
3 實驗分析
本次實驗,使用苗期小麥作為實驗?zāi)繕?biāo),首先對圖像進(jìn)行灰度處理?;叶忍幚淼娜N方法效果如圖 2 ~圖 4 所示。可以發(fā)現(xiàn),對于本實驗而言,使用加權(quán)平均法較好,但在大多數(shù)情況下,我們選擇系統(tǒng)自帶灰度函數(shù)進(jìn)行灰度化處理。圖像經(jīng)過灰度化、平滑等技術(shù)去除噪聲之后,使用閾值進(jìn)行分割,其結(jié)果如圖 5 所示。
圖 1 閾值分割流程
圖2 平均值法圖3 加權(quán)平均法
圖4 最大值法圖5 小麥閾值分割結(jié)果
4 結(jié) 語
圖像分割算法眾多,基于閾值的圖像分割算法因為其高效的運算過程以及簡單的操作被廣泛應(yīng)用到各個領(lǐng)域,但同時也存在不足,若是目標(biāo)物與背景差異較小或者兩者灰度范圍重疊,則會發(fā)生過分割或者欠分割的情況 ;另外因其僅僅考慮灰度信息,抗噪性能差,從而導(dǎo)致其邊緣信息分割效果較差??傊瑢τ谌绾螐膹?fù)雜的背景之下獲取農(nóng)田作物的算法眾多,而選擇基于圖像識別技術(shù)進(jìn)行提取,對圖像目標(biāo)識別的精確度或者及時性要求較高,因此如何快速對綠色作物進(jìn)行精準(zhǔn)分割仍然是學(xué)術(shù)界研究的難點所在。
數(shù)據(jù)采集通常有兩種解釋:一種是從數(shù)據(jù)源收集、識別和選取數(shù)據(jù)的過程。另一種是數(shù)字化、電子掃描系統(tǒng)的記錄過程以及內(nèi)容和屬性的編碼過程。
關(guān)鍵字: 數(shù)據(jù)采集 數(shù)據(jù)源 識別作者|小白來源|?小白學(xué)視覺了解圖像分割當(dāng)我們在做一個圖像分類任務(wù)時,首先我們會想從圖像中捕獲感興趣的區(qū)域,然后再將其輸入到模型中。讓我們嘗試一種稱為基于聚類的圖像分割技術(shù),它會幫助我們在一定程度上提高模型性能,讓我們看...
關(guān)鍵字: 圖像分割摘要:作為物聯(lián)網(wǎng)和電子商務(wù)的關(guān)鍵應(yīng)用技術(shù),二維碼識別技術(shù)在整個物聯(lián)網(wǎng)的發(fā)展中被認(rèn)為是最好的實現(xiàn)手段之一,其便利,性已經(jīng)體現(xiàn)在生活的諸多方面。通過掃描二維碼,人們可以輕松地讀到二維碼內(nèi)所包含的信息,然后通過移動網(wǎng)絡(luò)功能,參...
關(guān)鍵字: 二維碼 識別 電子商務(wù) 應(yīng)用爆發(fā)