本文系網易智能工作室(公眾號smartman 163)出品。聚焦AI,讀懂下一個大時代!
【網易智能訊 1月26日消息】Facebook本周宣布Detectron開放原始碼正式向大眾公開,該項目也是Facebook基於深度學習框架進行設計的關於計算機視覺對象檢測算法平臺。該公司表示,開放該項目的動機是加速計算機視覺研究,並且Facebook公司內部團隊正在使用該代碼進行各種應用測試,其中就包括針對增強現實技術的研究。
在我最近發表的一篇文章中,詳細介紹了當今增強現實技術即將面臨的三大挑戰,在這其中我注意到計算機進行實時對象分類是我們最大的技術難區之一:
不僅僅只觀察一個形狀,讓計算機利用視覺去理解「杯子」的物體含義是一個值得深究的問題。這就是為什麼多年以來,我們在看到的增強現實技術演示中發現人們將基準標記附加到觀察對象上,從而促進機器與觀察物體之間更細緻的跟蹤和交互。
為什麼難?我們要提到的第一個技術挑戰是如何進行視覺分類。我們了解到,杯子有數千種形狀,大小,顏色和紋理。有些杯子有特殊的屬性,它們是為了特殊目的而製造的(如燒杯),這意味著它們在不同的地方和環境中有多種多樣的用法。
讓我們來想像關於如何寫一個能幫助計算機理解所有我們在上面提到的這些概念的算法有多難,而且這只是為了能夠在多個杯子中辨認出其中一個目標的杯子。我們還可以想想,關於寫一個能夠幫助電腦區分杯子和碗的代碼是另一項需要完成的挑戰。
我還談到了為什麼「深度學習」技術是實時對象分類問題的一個潛在的解決方案,它能夠做到「培訓」一臺計算機來解釋它所看到的,而不是用人工編程不斷的一行行進行檢測。 Facebook本周已經開發出了他們自創的對象檢測算法,這可能會加速系統的開發,使系統能夠進行實時對象分類,從而使增強現實技術真正得到廣泛使用。
關於增強現實技術與我們周圍物體實際相互作用的方式,在粗略地了解附近特定的場景之前並不用針對特定環境進行預先編程。例如,如果您戴著AR眼鏡,並希望能夠將烤箱溫度投影到烤箱上方,然後還需要將冰箱中需要拿出來的食物的列表在AR眼鏡中顯示出來,則您的眼鏡需要分辨烤箱和冰箱的樣子。鑑於各種烤箱和冰箱以及它們生產地方的不同和放置位置的不同,這是一項極具挑戰性的任務。
Facebook的人工智慧研究團隊最近一直在研究計算機視覺對象檢測問題,並且它們正在嘗試通過深度學習使計算機能夠得出關於場景中存在什麼物體的結論。在Facebook宣布基於Caffe2深度學習框架的對象檢測算法開發的被稱為Detectron的平臺向大眾開放後,現在任何人都可以在GitHub上利用該算法進行試驗。 Facebook公司希望Detectron平臺將使世界各地的計算機視覺研究人員能夠嘗試並不斷改進最新的技術。
我們從項目的GitHub主頁信息了解到,「Detectron的目標是為物體檢測研究提供高質量,高性能的代碼庫。它的設計目的是通過靈活的方式來支持關於新穎技術的快速應用和評估的研究。」
該算法能通過檢查視頻輸入信息,從而猜測離散對象來構成對應場景。諸如檢測和識別人與物體相互作用(Gkioxari等)的研究項目已經使用了Detectron作為了解人類在環境中的行為的基礎平臺,該項目朝著幫助計算機充分理解我們正在做的事情的正確方向邁出了正確的步伐,從而使機器觀察以後能夠即時提供有價值的信息。
除了進行人工智慧技術研究之外,Detectron也被Facebook內部廣泛使用。該公司在Detectron宣布開放的消息中寫道:「我們團隊使用這個平臺來培訓各種應用的定製模型,其中包括增強現實技術和檢查數據信息完整性的相關應用。」
具體哪些團隊將使用Detectron應用增強現實技術並未公布,但是我們現在知道Oculus很可能會使用它,因為他的首席科學家Michael Abrash最近就增強現實技術將如何以及何時改變我們的生活發表了長篇演講。
(選自:roadtovr編譯:網易見外 參與:付曾)
關注網易智能公眾號(smartman163),獲取人工智慧行業最新報告。