2019年6月,Plant Phenomics刊發了由來自美國愛荷華州立大學、日本東京大學等機構的科學家撰寫的題為A weakly supervised deep learning framework for sorghum headdetection and counting的研究論文,介紹了一種用於高粱頭狀花序檢測和計數的弱監督深度學習框架。
高粱(Sorghum bicolor L. Moench)等穀類作物的產量取決於頭狀花序在不同分枝結構中的分布。因此,如果育種家要在具體的育種領域進行基因型變異的相互關聯,計數單位面積的頭狀花序至關重要。然而,手工測量這些表型性狀是一個非常耗時費力的過程,並且存在人為錯誤和效率低下等問題。此外,這一過程幾乎不可能用於大規模育種種植園或大規模實驗。基於機器學習的方法[如基於深度卷積神經網絡(CNN)的目標檢測器]是進行目標檢測和計數的有前景的方法。然而,這種基於深度學習的方法的一個顯著局限是,它們通常需要大量手工標記的圖像來進行訓練,這仍然是一個繁瑣的過程。
在此,本文提出了一個主動學習啟發弱監督深度學習的框架,在無人機圖像中進行高粱頭狀花序的檢測和計數。研究人員證明,使用半訓練的CNN模型(即,用有限的標記數據進行訓練)進行綜合標註,可以顯著減少人工標註工作而不損失最終的模型性能(人工計數和機器計數之間的R2為0.88)。此外,研究人員還可視化了網絡學習的技術參數。這些改善可以使用戶更好地理解和信任經過訓練的深度學習模型所做出的決策,從而提高可信度。
RetinaNet: the deep learning architecture adopted in our framework.
從此研究中總結出的結論如下:
本研究提出的弱監督方案顯著提高了訓練數據的生成效率,否則這將是一個極其繁瑣、昂貴和耗時的過程。
只需很少的手工標記的數據樣本(40張圖像)就可以得到理想的結果。
本研究提出的深度學習模型對於不同位置和不同光照條件下獲得的圖像具有足夠的魯棒性。
在本研究的1260張圖像測試集上,mAP(平均精度均值)為0.94,IoU(交並比)≥0.5,且實現了高精度計數(在小區水平上R2= 0.8815)。
通過這項研究,一個直觀且有趣的觀察是,對於農業領域的目標檢測,標記相似的圖像不會增加模型的準確性。這裡的「相似」圖像是指具有相同高粱基因型實例的兩個不同的圖像樣本,即圖像具有的高粱頭狀花序形狀,大小和顏色非常相似。
未來的研究方向將包括(但不局限於):
將目前的弱監督方案演變為功能完備的主動學習方法。
通過在無人機/地面機器人和智慧型手機上部署訓練過的模型實現實時計數。
將更多樣性的圖像(如白高粱的頭狀花序圖像)納入訓練數據集。
開發一種基於知識域的方案,自動且智能地選擇「不同」的訓練圖像。
本文數據作者團隊已經開源開始深度學習比賽使用,有興趣的讀者可以參與,一等獎獎金1500美元,也歡迎參加討論會議。https://www.register.extension.iastate.edu/mlcas2019/competition
Sambuddha Ghosal, Bangyou Zheng, Scott C. Chapman, et al., 「A Weakly Supervised Deep Learning Framework for Sorghum Head Detection and Counting,」 Plant Phenomics, vol. 2019, Article ID 1525874, 14 pages, 2019. https://doi.org/10.34133/2019/1525874.
《植物表型組學》(Plant Phenomics)是由南京農業大學和美國科學促進會(AAAS)合作創辦的英文學術期刊,於2019年1月正式上線發行,是Science合作出版的第二本期刊。採用開放獲取形式,刊載植物表型組學交叉學科熱點領域具有突破性科研進展的原創性研究論文、綜述、數據集和觀點。具體範圍涵蓋高通量表型分析的最新技術,基於圖像分析和機器學習的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農業實踐中的表型組學新應用,與植物表型相結合的分子生物學、植物生理學、統計學、作物模型和其他組學研究,表型組學相關的植物生物學等。
點擊「在看」,助力傳播