人工智能版“薄霧君” 人工智能植物種類識別
深度學(xué)習(xí)是人工智能技術(shù)的一種方法,它通常利用大型的數(shù)據(jù)集來訓(xùn)練神經(jīng)網(wǎng)絡(luò),最終以較高的準(zhǔn)確率得出問題的結(jié)果。深度學(xué)習(xí)(Deep Learning)從快速發(fā)展到實(shí)際應(yīng)用,短短幾年時(shí)間里,已經(jīng)改變了語音識別、圖像分類、文本理解等眾多領(lǐng)域的算法設(shè)計(jì)思路。最近,科學(xué)家又成功將深度學(xué)習(xí)算法應(yīng)用到復(fù)雜的植物分類領(lǐng)域。
據(jù)發(fā)表在 8 月 11 日的 BMC 進(jìn)化生物學(xué)雜志上的一項(xiàng)研究顯示,研究人員運(yùn)用深度學(xué)習(xí)方法成功地對數(shù)千種植物標(biāo)本的圖像進(jìn)行了自動識別,而且,人工智能成功做出了正確的分類。這是研究人員首次嘗試將人工智能技術(shù)運(yùn)用到物種識別領(lǐng)域上。賓夕法尼亞州立大學(xué)的古植物學(xué)家 Peter Wilf 說,這是第一次嘗試,但肯定不會是最后一次嘗試。這種技術(shù)是博物學(xué)界物種識別分類領(lǐng)域的未來。
此次研究人員用了 26 萬份植物標(biāo)本的掃描圖像來訓(xùn)練深度學(xué)習(xí)算法,這些植物標(biāo)本的物種數(shù)超過了 1000 個(gè)。該算法最終以接近 80% 的準(zhǔn)確率識別出了這些物種。Wilf 說,這可比人類的分類學(xué)家做得好多了。
如今,世界各地的自然歷史博物館都在競相將他們的標(biāo)本藏品數(shù)字化,把他們的標(biāo)本放在公開的數(shù)據(jù)庫中,讓任何地方的研究人員都可以通過這些數(shù)據(jù)庫對標(biāo)本進(jìn)行使用。比如,美國國家科學(xué)基金會的 iDigBio 項(xiàng)目,其實(shí)就是一個(gè)數(shù)據(jù)聚合器,它擁有超過 1.5 億張來自全國各地的植物和動物的收藏標(biāo)本圖片。
世界上大約有 3000 個(gè)植物標(biāo)本館,據(jù)估計(jì)這些植物標(biāo)本館擁有 3.5 億份標(biāo)本,其中只有一小部分被數(shù)字化。但是,不斷膨脹的標(biāo)本數(shù)據(jù)集,以及計(jì)算機(jī)技術(shù)的進(jìn)步,吸引了來自哥斯達(dá)黎加理工學(xué)院的計(jì)算機(jī)科學(xué)家 Erick Mata-Montero 和法國農(nóng)業(yè)研究中心的植物學(xué)家 Pierre Bonnet 的關(guān)注,他們總覺得這些龐大的標(biāo)本數(shù)據(jù)會有一些其他的用途。
Bonnet 的團(tuán)隊(duì)已經(jīng)通過 pl@ntnet 項(xiàng)目實(shí)現(xiàn)了植物識別的自動化。pl@ntnet 是法國研究人員基于深度學(xué)習(xí)技術(shù)開發(fā)的一個(gè) APP,它已經(jīng)積累了數(shù)以百萬計(jì)的植物圖像,并能對部分植物進(jìn)行自動識別,它的這些植物圖像通常是人們用智能手機(jī)拍照上傳得來的,圖像數(shù)據(jù)越多,它識別的準(zhǔn)確率就越大。此外,它還會向拍照者詢問圖像里的植物是一朵花還是一片葉子等,以增加識別的準(zhǔn)確度。
Bonnet 說,雖然這種人工智能技術(shù)極大地提高了植物學(xué)家進(jìn)行植物識別分類的效率,但是有一些植物學(xué)家擔(dān)心,這種高效技術(shù)會降低植物學(xué)領(lǐng)域的門檻,會讓民眾覺得植物學(xué)家已沒有什么專業(yè)技術(shù)價(jià)值。但是 Bonnet 卻堅(jiān)持認(rèn)為,這種人工智能技術(shù)是很有作為的,因?yàn)樗腔谌祟惖膶I(yè)知識。它永遠(yuǎn)不會消除人類的專業(yè)知識。何況,植物學(xué)家還需要對這種技術(shù)的結(jié)果進(jìn)行最后驗(yàn)證。
這種新技術(shù)可以幫助植物標(biāo)本館快速地處理新樣本,簡化一項(xiàng)需要數(shù)小時(shí)工作的艱巨任務(wù)。另外,Bonnet 說,這種技術(shù)還可以更有效地幫助小型植物標(biāo)本館進(jìn)行物種識別。他的研究小組發(fā)現(xiàn),從大型植物標(biāo)本館中獲得的大型數(shù)據(jù)集的深度學(xué)習(xí)算法改進(jìn)了對世界上相對數(shù)據(jù)缺乏的標(biāo)本館的植物物種的識別。這一發(fā)現(xiàn)對于那些生物多樣性豐富但擁有很少植物標(biāo)本收藏的地區(qū)來說尤其有用。
這種人工智能物種識別技術(shù)并不只是局限于植物標(biāo)本。Nelson 目前正在努力實(shí)現(xiàn)對蠅幼蟲的自動識別。此外,古植物學(xué)家 Peter Wilf 正在與人合作來對植物化石進(jìn)行類似的分析識別。對植物化石的分析相當(dāng)困難,因?yàn)橹参锘男问蕉喾N多樣,比如石化了的水果和花朵,石化樹干或壓印在巖石里的石化樹葉。相比之下,植物標(biāo)本的識別就容易多了,它們扁平,干燥,而且通常是放在標(biāo)準(zhǔn)尺寸的紙上的。
總之,包括 Wilf 在內(nèi)的一些博物界研究人員非常確信,這種深度學(xué)習(xí)技術(shù)將會逐步解決各種識別分類問題,并且會最終成為物種識別領(lǐng)域的基本技術(shù)手段。