導語:面對目前愈加嚴峻的野生動物生態系統,DeepMind開發了一個新的機器學習系統來為研究人員們提供更高效的解決方案。
智東西11月6日消息,前段時間,DeepMind與生態學家和環保人士合作開發了一個新的機器學習方法,來幫助坦尚尼亞的塞倫蓋蒂國家公園(Serengeti National Park)研究整個非洲動物群落的動物行為。
DeepMind通過利用一個含有豐富野生動物照片的數據集來訓練機器學習模型,以自動檢測、識別和計算動物數量。
據DeepMind官方表示,目前該機器學習系統能夠正確識別大約50種大型物種,和人類的標記員一樣準確。
一、野生動物群落受人類影響被迫改變
塞倫蓋蒂平原是世界最大的野生動物保護區之一,它擁有完整的大型哺乳動物群落。
由於塞倫蓋蒂獨特的地質條件和多樣的棲息地類型,該地區的生物多樣性十分豐富,大約有70種大型哺乳動物和500種鳥類。野生動物們在這片土地上遊蕩,還有些動物在季節性降雨後會遷徙數千英裡,橫跨多個國家。
但隨著農業、偷獵和氣候異常等人類影響的增加,這些動物為了生存不得不改變自己的行為,導致種群動態的變化。
然而,這些變化往往發生在空間和時間尺度上,研究人員很難用傳統的研究方法對這些變化進行檢測,他們迫切需要找出一個合理有效的方法來了解這些原始生態系統的動態,了解這些動物群落是如何隨著人類的影響而變化,並制定有效的管理計劃來保護生物多樣性。
為此,DeepMind與生態學家和環保主義者共同開發了一個能夠研究動物行為的機器學習方法,來幫助塞倫蓋蒂野生動物保護區進行研究。
二、用含50種不同物種的數據集訓練機器學習模型
大約在十年前,塞倫蓋蒂在進行獅子研究項目(Serengeti Lion Research program)時,工作人員在保護區的核心地帶安裝了數百臺高靈敏度運動捕捉相機(motion-sensitive cameras),以捕捉野生動物圖像,並研究動物的行為、分布和統計。
過去的九年裡,該項目團隊已經收集並存儲了數百萬張動物照片。截至目前,來自世界各地的志願者幫助工作人員識別和統計照片中的物種,形成了一個豐富的數據集,名叫Snapshot Serengeti,並且該數據集具有50種不同物種的標籤和數量。
一般來說,對圖片的注釋過程需要花大量的人力和時間,其中從動物觸發相機拍攝圖像,到志願者注釋標籤,整個過程耗時長達一年,阻礙了研究人員進行基礎研究的能力。
因此,DeepMind和其他研究人員們利用Snapshot Serengeti數據集來訓練機器學習模型,以自動檢測、識別和計算動物數量。
三、正確識別50種物種,流程縮短9個月
實際上,使用機器學習來對野生動物進行保護並不是件新鮮事。例如,有研究人員曾利用旅遊照片和YouTube視頻來追蹤動物,並利用音頻記錄來依據動物叫聲識別物種。
但有一個問題是,利用高靈敏度運動捕捉相機來拍攝動物圖像具有很多不確定性。有時拍攝的動物照片會跑焦,或是動物離鏡頭的距離和位置太近。
因此,在生態學家和環保主義者Meredith Palmer博士的幫助下,DeepMind的這個AI項目迅速成型。
目前,該機器學習模型能夠正確地識別大約50種大型物種,其準確度幾乎可以和人類標記員媲美,甚至更出色。
最重要的是,這種機器學習方法將數據處理流程縮短了9個月,這對於該領域的研究人員來說具有巨大的幫助。
四、準備實地部署機器學習系統
當然,這項工作十分具有挑戰性,並充滿了意外和危險。例如電線故障、網際網路訪問受限或無法訪問。
目前,DeepMind正在準備實地部署機器學習系統,並研究如何在只具有適量硬體要求和少量網際網路訪問的情況下,安全地運行他們的預訓練模型。
一旦部署到位,塞倫蓋蒂的研究人員將能夠直接使用該工具,以獲得最新的物種信息,以更好地進行保護野生動物的工作。
結語:為解決當前世界難題提供新研究方向
這次DeepMind開發的機器學習模型,既能用於檢測和分析野生動物種群的數據,進行數據整合,還能進一步幫助非洲地區的野生動物保護區逐漸建立人工智慧系統。
接下來,研究人員則需要實地部署該機器學習模型,對該模型的工作進展進行跟蹤,以驗證機器學習模型的能力。
而DeepMind的科學團隊也一直通過利用AI技術來研究和應對各種挑戰,這不僅促進了人工智慧技術的發展,也為目前世界上所面臨的難題提供了一種新的研究思路和方向。
文章來源:DeepMind Blog