CVPR 2018:用狗的數據訓練AI 華盛頓大學研發模擬狗行為的AI系統

2021-01-15 新智元

來源:TechCrunch

編譯:肖琴

【新智元導讀】一般的機器學習系統都是以人的視角建立,但華盛頓大學和艾倫人工智慧研究所的研究人員試圖用狗的行為數據訓練AI系統。研究人員通過傳感器等設備採集了一隻愛斯基摩犬的運動數據,並以此來訓練AI系統實現三個目標:1、像狗一樣行動,預測未來動作;2、像狗一樣計劃任務;3、從狗行為中學習。論文已被CVPR 2018接收。這項工作的意義在於理解視覺數據,讓智能體採取行動並執行任務。

我們已經訓練機器學習系統來識別物體,進行導航,或識別面部表情,但儘管可能很難,機器學習甚至沒有達到可以模擬的複雜程度,例如,模擬一隻狗。那麼,這個項目的目的就是做到這一點——當然是用一種非常有限的方式。通過觀察一隻非常乖巧的狗的行為,這個AI學會了如何像狗一樣行動的基礎知識。

這是華盛頓大學和艾倫人工智慧研究所合作的研究,論文發表在今年6月舉辦的CVPR。

摘要

我們研究了如何直接建模一個視覺智能體(visually intelligent agent)。計算機視覺通常專注於解決與視覺智能相關的各種子任務。但我們偏離了這種標準的計算機視覺方法;相反,我們試圖直接建模一個視覺智能的agent。我們的模型將視覺信息作為輸入,並直接預測agent的行為。為此,我們引入了DECADE數據集,這是一個從狗的視角搜集的狗的行為數據集。利用這些數據,我們可以模擬狗的行為和動作規劃方式。在多種度量方法下,對於給定的視覺輸入,我們成功地對agent進行了建模。此外,與圖像分類任務訓練的表示相比,我們的模型學習到的表示能編碼不同的信息,也可以推廣到其他領域。特別是,通過將這種狗的建模任務作為表示學習,我們在可行走表面預測(walkable surface estimation)和場景分類任務中得到了非常好的結果。

理解視覺數據:模仿狗,學習狗

為什麼做這個研究?雖然已經有很多工作在研究模擬感知的子任務,例如識別一個物體並將其撿拾起來,但是「理解視覺數據,達到可以讓agent在視覺世界中採取行動並執行任務的程度」,這樣的研究很少。換句話說,不是模擬眼睛的行為,而是模擬控制眼睛的主體。

那麼為什麼選擇狗?因為狗是非常複雜的智能體,研究者說:「它們的目標和動機往往是沒法預知的。」換句話說,狗狗很聰明,但我們不知道它們在想什麼。

作為對這一研究領域的初步嘗試,該團隊希望通過密切監視狗狗的行為,並將狗狗的運動和行動與所它看到的環境相對應,來觀察是否能夠建立一個能夠準確預測這些行動的系統。

將一套傳感器裝在一直愛斯基摩犬身上,收集數據

為了達到這一目的,研究者把一套基礎傳感器裝在一隻名叫Kelp M. Redmon的愛斯基摩犬身上。他們在Kelp的頭部裝上一個GoPro相機,6個慣性測量單元(分別在腿、尾巴和身體上)用以判斷物體的位置,一個麥克風以及一個把這些數據綁在一起的Arduino開發板。

他們花了許多小時記錄狗狗的活動——在不同的環境中行走,取東西,在狗公園玩耍,吃東西——並把狗的動作與它看到的環境同步。結果是形成了一個在狗的環境中以狗自身為視角的行為數據集(Dataset of Ego-Centric Actions in a Dog Environment),簡稱為DECADE數據集。研究者用這個數據集來訓練一個新的AI智能體。

對這個agent,給定某種感官輸入——例如一個房間或街道的景象,或一個飛過的球——以預測狗在這種情況下會做什麼。當然,不用說特別細節,哪怕只是弄清楚它的身體如何移動,移向哪裡,已經是一項相當重要的任務。

華盛頓大學的Hessam Bagherinezhad是研究人員之一,他解釋道:「它學會了如何移動關節以走路,學會了再走路或跑步是如何避開障礙物。」「它學會了追著松鼠跑,跟隨者主人走,追逐飛起來的狗玩具(玩飛盤遊戲時)。這些都是計算機視覺和機器人技術的一些基本AI任務(例如運動規劃、可步行的表面、物體檢測、物體跟蹤、人物識別),我們一直試圖通過為每個任務收集單獨的數據來解決。」

研究提出三個問題:(1) 模仿狗的行為:根據狗之前的行為圖像,預測狗接下來的行為;(2) 像狗一樣規划行動;(3)從狗的行為學習:例如,預測一個可供行走的區域。

這些任務可以產生一些相當複雜的數據:例如,狗模型必須知道,就像真的狗狗一樣,當它需要從一個地點移動到另一地點的時候,它可以在哪些地方行走。它不能在樹上或汽車上行走,也不能在沙發上行走(取決於房子)。因此,這個模型也學會了這一點,它可以作為一個計算機視覺模型單獨部署,用以找出一個寵物(或一個有足機器人)在一張給定圖像中可以到達的位置。

用於預測狗的行為的模型架構

用於學習狗的規劃方式的模型架構

用於預測可行走區域的模型架構

研究人員說,這只是一個初步的實驗,雖然取得了成功,但結果有限。後續研究可能會考慮引入更多的感官(例如嗅覺),或者看看一隻狗(或許多狗)的模型可以如何推廣到其他狗身上。他們的結論是:「我們希望這項工作為我們更好地理解視覺智能和其他生活在我們世界裡的智能生物鋪平道路。」

論文地址:https://arxiv.org/pdf/1803.10827.pdf

相關焦點

  • 教育界的阿爾法狗:孩子學習效率提升10倍,復購率達80% | 松鼠AI
    松鼠AI個性化匹配就像AlphaGo模擬圍棋大師,松鼠AI系統模擬特級教師給孩子一對一量身定做教育方案並且一對一實施教育過程,據稱該系統能夠比傳統教育效率提升5到10倍。知識圖譜是核心,大數據支撐算法訓練「一套完整的人工智慧自適應學習系統包含測、教、學、練等多個環節,每個環節都至關重要。」周偉表示,知識圖譜是松鼠AI產品的核心。知識圖譜突破了原來「知識點」的概念,將知識點拆分成了更精細的「學習點」,因為知識點拆得的越細,對學生的測評就越準確,學生的學習效率就越高,因此知識點的精細程度是提高學生學習效率的關鍵。
  • 2017⇆2019,AI三年浮沉記
    到 2017 年底,超強版 AlphaGo Zero 完全不依賴於人類數據,在只知道比賽規則的情況下自我對弈,3 天訓練後就以 100 比 0 戰勝了 AlphaGo。 AlphaGo 的成功不僅讓人們看到了強化學習和隨機模擬技術(也稱「蒙特卡羅」技術)的魅力,也讓深度學習變得更加炙手可熱。 冷靜之餘,人們認識到 AlphaGo 的算法更適用於大規模概率空間的智能搜索,其環境和狀態都是可模擬的。DeepMind 的創始人德米斯·哈薩比斯表示,對於那些環境難以模擬的決策問題(如自動駕駛),這些算法也無能為力。
  • AI看面相預測犯罪有八成準確率?這篇引發抗議的論文差點登上頂刊
    該研究名為「利用圖像處理技術預測犯罪行為的深度神經網絡模型」,研究人員聲稱已經創建了一個面部識別系統,「能夠預測某人是否有可能成為罪犯……有80%的準確率,沒有種族偏見,」在一份現已刪除的新聞稿中稱。該論文的作者包括哈裡斯堡大學博士生、前紐約警察局警官喬納森·科恩(Jonathan W. Korn)。論文稱,該算法「僅憑一張人臉照片就能預測一個人是否是罪犯」。
  • 支持108種語言的谷歌翻譯如何用AI讓翻譯質量越來越好?
    在2019年5月至2020年5月之間,通過人工評估和BLEU(一種基於系統翻譯與人工參考翻譯之間相似性的指標)進行衡量,谷歌翻譯在所有語言中平均提高了5分或更多,在50種最低水平的翻譯中平均提高了7分或更多。
  • 2018年6個最佳的免費在線人工智慧課程!
    【IT168 資訊】圍繞人工智慧(AI)、自動化和認知系統的原則和實踐中,無論您的業務領域、專業知識或專業如何,都有可能變得越來越有價值。幸運的是,今天的你不需要花費幾年時間在大學學習,才能熟悉這個看起來非常複雜的技術。近年來,越來越多的在線課程湧現出來,涵蓋從基礎到高級實施的所有內容。
  • 小愛觸屏音箱和小愛ai音箱的區別
    小愛觸屏音箱帶有屏幕,小米ai音箱沒有屏幕;WIFI頻段:小愛觸屏音箱支持2.4GHz,小米ai音箱為2.4/5GHz雙頻;揚聲器:小愛觸屏音箱為1.5英寸,小愛觸屏音箱為2英寸。  小愛觸屏音箱和小愛ai音箱的區別:  1.小愛觸屏音箱帶有屏幕,小米ai音箱沒有屏幕;  2.WIFI頻段:小愛觸屏音箱支持2.4GHz,小米ai音箱為2.4/5GHz雙頻;  3.揚聲器:小愛觸屏音箱為1.5英寸,小愛觸屏音箱為2英寸;
  • 專注AI技術研發 獨角獸雲天勵飛IPO總募資30億元
    一、三年多營收6.8億元,研發投入超5億!根據招股書可知,雲天勵飛在報告期內業務規模出現高速增長。2017 年、2018 年、2019 年及2020年1~9 月,公司營收達0.502億元、1.331億元、2.304億元及2.673億元,合計6.81億元。
  • 全球首例,Adversarial T-shirt讓你在AI目標檢測系統中隱身
    基於 AI 目標檢測系統生成的對抗樣本可以使穿戴者面對攝像頭「隱身」。由美國東北大學林雪研究組,MIT-IBM Watson AI Lab 和 MIT 聯合研發的這款基於對抗樣本設計的 T-shirt (adversarial T-shirt),讓大家對當下深度神經網絡的現實安全意義引發更深入的探討。
  • AI相親,單身狗的福音還是有情人的噩夢?-虎嗅網
    根據艾瑞監測報告顯示,2018 Q2中國網絡婚戀交友服務PC端覆蓋人數依次為938萬人、1018萬人和886萬人,而在移動端,用戶日均有效使用時長持續增長,Q2各月分別為6720萬分鐘、6847萬分鐘和7058萬分鐘,環比增長依次為-0.2%、1.9%和3.1%,網絡婚戀移動端用戶粘性持續提高。
  • 手相ai 人一出生命運就已註定在你的手上
    超準算卦/運勢/合婚/看相/八字/生肖/求籤/解夢長按二維碼 立即查看每日寄語:(手相ai內十八格「飛天祿馬格」此格以庚壬二日用子字多!例如六庚日癸日以子衝午字,庚日以子衝午中丁火為官星;手相ai若四柱中丁字並午字,則減分,歲君亦忌。比如六壬日以子衝午中己土為官星,四柱有己字並午,則減分,歲君大運,亦須忌之。內十八格「飛天祿馬格又格」手相ai以辛癸為日用亥字!衝巳中丙戊為官星;要四柱有申字並酉字或醜字,得一字可合為妙。假令癸日以亥衝巳,若四柱有戌字,則亥不能去衝,歲君大運亦忌。
  • 從頭部企業看人工智慧:雲測數據將AI數據做到了極致
    未來,高精度數據將成人工智慧訓練階段追逐熱點,具備主要需求方穩定的特點,存量市場將穩步增長;而隨著人工智慧對長尾場景的數據需求進一步擴大,3-5年內,場景化數據將擁有更廣闊的增量空間,成為行業加速發展的新引擎;同時,底層技術+服務能力將愈發重要直至成為核心競爭點,人工智慧更需要能提供一體化數據解決方案的服務商。
  • AI控制深腦刺激開始人體測試,為治療嚴重精神疾病提供新方法
    【AI星球(微信ID:ai_xingqiu)】11月29日報導(編譯:福爾摩望)根據人的感受和行為來傳遞電脈衝的大腦植入物正首次在人體上進行測試。於上周在華盛頓特區舉辦的神經科學學會(SfN)會議上,研究人員展示了研究結果。該結果將最終為治療排斥現行療法的嚴重精神疾病提供新的方法。它也引起了棘手的道德問題,因為這項技術將會讓研究人員在一定程度上實時獲取一個人的內在情緒。被稱為深腦刺激的一般方法是使用大腦植入物來傳遞控制神經活動的電脈衝。它常被用來治療如帕金森氏症等運動障礙疾病,但是在檢測情緒障礙疾病上卻很少成功。
  • AI在國外水行業中有哪些應用 AI應用方案
    人工智慧(AI)是由機器,特別是計算機系統,模擬人類的智能過程。通過在水行業中應用AI,可為世界各地的人們建立新的可持續水供應和管理系統。加拿大市政供水系統在供水時由於水管的滲漏爆裂每年平均損失13%的淨水。基礎設施較老的國家在這方面損失率更高。加拿大滑鐵盧大學研究人員與行業夥伴合作開發,通過使用新型水聽傳感器和AI技術,顯著降低了城市供水管道中嚴重的水損失。
  • 黃仁勳北京激情演講2小時:搞定國內10大科技巨頭 發布最強AI引擎...
    投入30億美元研發。搭載了英偉達那個花費30億美元研製出來的Volta架構的顯卡和8個CPU,被英偉達稱之為迄今為止最複雜的片上系統,支持L4/L5級別自動駕駛能力。Drive PX Xavier 2018年第一季度為早期合作夥伴推出,第四季度全面出貨。  光有硬體不行,為了讓開發者更好的使用PX2與PX Xavier系列產品,英偉達也很貼心的推出了配套的開發者工具——英偉達DriveWorks。
  • 日本政府出大招:投入20億日元支持「AI配對」
    日本內閤府(Cabinet Office)表示,在日本47個提供介紹個人愛好和興趣的婚介服務的縣中,有50%現在都在使用人工智慧系統。日本地方政府已經開始使用人工智慧配對系統來配對,但許多地方政府只考慮收入和年齡等標準。通常,人工配對服務會使用標準化的表格:比如列出你的政治觀點、喜好、目標和分手理由,可以通過人工智慧將你與最匹配的人聯繫起來。
  • 新基建下的AI+教育:如何拯救你,AI招牌下的「算命先生」
    有AI方面的專家對此表示:「在底層數據沉澱和AI技術發展的前期,『AI個性化課程』定製的方式並無不妥,也有一定的作用。其本質就是用機器模擬老師和學生的交流,是一個搜集信息的過程,只是當前的技術遠遠無法還原人腦立體活動,深度學習程度不夠,其結果就是準確度就不夠。」另一名在AI領域深耕八年的程式設計師稱:「這類算法可大可小,底層數據足夠大,就可以看起來足夠智能。
  • AI速配愛情,單身狗的福音還是有情人的噩夢?
    通過大數據,深度學習,AI能夠不斷挖掘人們的相親需求,進而使得相親流程更加高效化和清晰化,在配對後期,AI還能對這段關係進行更長期的關注,提供測試、諮詢等功能,這都是人工難以顧及到的。國內就有科技公司打出了「夫妻相」的噱頭,利用人臉識別系統對用戶進行匹配。通過人臉,我們確實可以獲得一些特徵——今年,來自墨爾本大學的研究人員就設計了一種AI生物識別鏡,可以根據人的臉部照片檢測和顯示其個性特徵和外貌上的魅力,最多可以分析14項性格特徵,包括性別、年齡、種族,以及魅力、性格古怪之處和情緒穩定度等。日前被刷屏的「AI測面相」,更是號稱能測出人的運勢吉兇。
  • 漢語拼音9《ai ei ui》一線老師說小學一年級拼音就要這樣學
    今天我們將會繼續漢語拼音9《ai ei ui》的學習。將單韻母組合,又可以得到複韻母「ai ei ui」等等。今天我們就來學習複韻母ai、ei、ui。學寫韻母小學一年級拼音基礎(漢語拼音)ai的寫法和「a」「i」的寫法相同,都佔四線三格的中格,在寫這兩個韻母時,要靠得緊湊一些。
  • AI測面相調查:寵物狗81分「中年平順」,分銷推廣月入十幾萬
    南都記者用同一照片在「微算面相」中進行了二次測試。上一份報告還顯示「面相較好」,這一次卻顯示「面相一般」。之前對眼睛的描述還是「個性孤僻,不合群,性情急躁易怒,」這一次就變成了「個性隨和,溫良厚重,易相處。」用該照片在不同的「AI測面相」平臺上進行了測試,各個平臺測試出來的結果也並不相同。僅從五官描述中的「上庭」來看,就出現了上庭較短、上庭較長兩種矛盾的結果。