「CVPR 2018」機器也能感知時間,AI系統可預測5分鐘內的未來!

2021-01-08 新智元

新智元 今天

新智元編譯

來源:TechCrunch,arXiv

編輯:文強、肖琴

【新智元導讀】德國伯恩大學的研究人員設計了一個軟體,能夠看視頻並預測未來5分鐘會發生的事件,準確率在15%到40%之間。研究人員表示,對於具有大量不同動作的長視頻,他們的方法也能夠準確預測未來,甚至可以處理嘈雜或錯誤的輸入信息。

從幾百萬年前起,第一個原始人類仰望星空,對宇宙產生好奇開始,我們人類對周遭世界的理解和把控,已經達到了相當嫻熟的程度。

我們已經可以超音速飛行,可以轉基因,還能治療癌症。但是,有一件事情是我們一直沒有做得很好的,那就是對「時間」的感知——如何從當下推斷未來,如何最大限度的利用這種推測?

現在看,機器似乎可以幫助我們做到這一點。

德國波恩大學的計算機科學家設計出了一種軟體,能夠預測未來5分鐘的序列事件,準確率在15%到40%之間。

雖然從數值上看,這個精度並不高,但研究人員Juergen Gall表示,這代表了機器學習超越了單步預測(single-step prediction),向新的領域邁進了一步。相關的研究論文已經被CVPR 2018接收。

Juergen Gall團隊展示他們的預測未來系統

超越單步預測

Gall和他同事們的研究目標——教會計算機預測未來——並不是現在才有,實際上,這是機器學習和計算機視覺領域的一個主要課題,有大量的研究人員都在從事相關的工作。

但是,這項工作特殊的地方在於其方法:到目前為止,這些領域的研究集中在對當前行動的解釋,或者對預期的下一步行動進行預測上面,也即前面提到的「單步預測」。

單步預測,也就是預測未來往前一步的結果。這是預測未來模式的基礎,歸結為一個回歸問題,輸入變量,預測結果。

在進行這樣的預測時,目前的研究已經取得了比較好的結果。其中一個例子是,史丹福大學吳恩達團隊設計了一種深度學習算法,在對臨終關懷的預測中,實現了高達90%的準確性。

在他們的實驗中,斯坦福的研究人員使用了200萬份病歷對他們設計的神經網絡進行訓練,通過這些數據,網絡能夠發現醫生發現不了的模式和規律,並以此為基礎,對新的病人的情況(患者在接下來3~12個月內的死亡率)進行預測。

這項研究面臨的變量十分複雜,而且取得了很高的精度,論文也獲得了IEEE生物信息學和生物醫學組最佳學生論文獎。但是,這樣的算法是基於過往(retrospective),而且只進行單步預測。

多步預測:用CNN和RNN預測未來的兩種結構

在Gall和他團隊的最新研究中,他們提出了兩種方法,對相當長時間的未來發生的大量行動進行預測。他們訓練了一個CNN和一個RNN,根據之前看過的視頻內容,學習未來視頻的「標籤」。

「我們表明,即使對於具有大量不同動作的長視頻,我們的方法也能夠準確預測未來,甚至可以處理嘈雜或錯誤的輸入信息。」作者在論文中這樣寫道。

下面的圖例展示了研究人員設計的兩個方法。首先來看RNN的設計。

在RNN系統的結構中,輸入是一個序列,網絡預測最近觀察到的動作的剩餘長度,以及下一個動作的標籤和長度。將預測結果附加到原始輸入,就可以預測下一個動作片段。

而在CNN系統的結構中,輸入序列和輸出序列都被轉換成矩陣的形式。其中,C表示類(class)的數量,S則對應於特定長度的視頻片段的數量。矩陣的二進位值表示每個視頻片段的標籤。

讓機器預測長時間的未來,有望實現真正的人機協作

在他們的實驗中,Gall和他的團隊使用數小時的視頻數據來演示不同的烹飪動作(例如煎雞蛋、拌沙拉等),並僅向軟體展示其中的一部分動作。軟體根據「已經學到的」來預測接下來的動作步驟。通過這種方法,Gall希望該領域能夠向真正的人機共生邁進一步。

「[業界]人們談論人類和機器人協作,但最終人和機器之間仍存在分離; 他們並沒有真正密切地合作,」Gall說。

Gall建議說,通過使用適當的硬體,這個軟體可以通過直觀地了解任務來幫助人類完成任務,進而在工業環境中幫助人類工作。

Gall說:「老年人越來越多,值得努力在家庭中推廣這種機器人來照顧老年人,」Gall說: 「我相信10年後服務機器人將能夠在家照顧老年人。」

根據人口統計局的報告,今天65歲以上的美國人的數量約為4600萬,預計到2060年將翻一番。根據2014年美國疾病控制與預防中心(CDC)的報告,這些老年人中約140萬將生活在養老院。日本已經探索過使用這樣的軟體帶來的影響。例如用於療愈的海豹型機器然PARO,軟銀的伴侶機器人Pepper等。在日本,四分之一人口是老年人。

隨著這類技術的進步,或許會在人類代際之間造成進一步的分化——把愛和關懷外包給一臺機器。對於一個尚未成熟的行業來說,很難說這條路將通向何方,但最終決定權掌握在開發人員手中,而不是掌握在他們開發的軟體或機器人手中。

相關論文

When will you do what? - Anticipating Temporal Occurrences of Activitie

http://pages.iai.uni-bonn.de/gall_juergen/download/jgall_anticipation_cvpr18.pdf

TechCrunch報導:https://techcrunch.com/2018/06/15/teaching-computers-to-plan-for-the-future/

相關焦點

  • 機器之心「AI00」十一月最新榜單:兩家國內公司新上榜
    向 OpenAI 、「斯坦福人工智慧百年研究」和「Open Source」致敬。為此,我們將邀請人工智慧領域的科學家、技術專家、產業專家、專業投資人和讀者加入進來,共同完成這項人工智慧的長期研究。大家可在公眾號對話框回復「AI00」(註:字母 AI 加數字 00)查看具體的參與方式。第一期的榜單中得到了來自投資界、人工智慧產業界和學界的眾多反饋,我們也依此對榜單的信息作出了一些訂正和調整。在 11 月的榜單中,我們新增了芋頭科技和大象聲科兩家公司。
  • 2020-2021「AI中國」機器之心年度獎項揭榜(上)
    本屆「AI 中國」機器之心 2020 年度評選,為順應產業變化,體現產業趨勢,在傳統的六大榜單之外,新增設「新基建領軍企業」、「產業數智化領軍企業」、「最強技術生態」及「智能國民應用」四大分榜,共計形成十大榜單200個獎項。經過市場環境的大浪淘沙,更多優秀的企業和項目成為了成就時代的智能勢力,「智在實業 慧及平常」是機器之心對2020年我國人工智慧產業發展的總結。
  • 預測未來?Google 用 AI 模型實現了「近乎實時」的天氣預報
    對人類來說,時間一直是最大的敵人,超越時間一直是人類的夢想,「預測未來」就是人類想要超越時間的一種方式。天氣預報就是生活中最常見的一種「預測未來」,但就像剛才說的,預測天氣同樣也是非常困難的一件事。▲ 圖片來自:British Council Learn EnglishGoogle 最近在官方的博客中分享了一項新的研究,該研究聲稱 Google 實現了「近乎實時」的天氣預報。
  • 圖靈獎「擁抱」深度學習
    ACM(國際計算機協會)在美國當地時間 3 月 27 日公布了 2018 年圖靈獎的授予結果。ACM 將本屆圖靈獎頒給了深度學習領域,並且讚譽三位獲獎人為「深度學習之父」。「人工智慧是現在所有科學中發展最快的領域之一,也是社會上談論最多的話題之一。」ACM 主席 Cerri M. Pancake 說,「人工智慧的發展很大程度上歸功於由三位奠定基礎的深度學習領域內的最新成就。」「只要口袋裡有智慧型手機的人都可以切實體會到自然語言處理和計算機視覺方面的技術進步,這在十年前是無法想像的。
  • 意念加AI算法「復原」每個手指,智能義肢登上Nature子刊封面
    機器之心報導參與:張倩、杜偉、李澤南使用「意念」控制機械,讓肢體缺失的殘疾人過上正常人的生活,這聽起來像是出現在電影中的場景。用 AI 算法解碼「意念」在此前,科學家們對於機械臂控制研究很多,但充其量也只能控制單個手指,而且其研究成果也僅限於在四肢健全的人群中實現離線的「義肢控制」。EPFL 提出的新系統,在神經學上的關鍵理念是對來自現有運動神經的信號進行解碼,這些運動神經旨在為手指發出活動的信號。
  • AI 或可預測夫妻吵架,準確率 79.6%
    來源:HyperAI超神經 新奇 AI 或可預測夫妻吵架 準確率 79.6% 夫妻之間吵架是常見的場景
  • AI Challenger 2018完整獲獎名單公布,中科院成最大贏家
    原標題:AI Challenger 2018完整獲獎名單公布,中科院成最大贏家 雷鋒網 AI 科技評論按,12 月 19 日下午,「AI Challenger 2018 全球 AI 挑戰賽」年度總決賽頒獎典禮在京舉辦。
  • 2020-2021「AI中國」機器之心年度獎項揭榜(下)
    本屆「AI 中國」機器之心 2020 年度評選,為順應產業變化,體現產業趨勢,在傳統的六大榜單之外,新增設「新基建領軍企業」、「產業數智化領軍企業」、「最強技術生態」及「智能國民應用」四大分榜,共計形成十大榜單200個獎項。經過市場環境的大浪淘沙,更多優秀的企業和項目成為了成就時代的智能勢力,「智在實業 慧及平常」是機器之心對2020年我國人工智慧產業發展的總結。
  • 人機對戰又添新領域:這篇論文讓機器在「你畫我猜」中擊敗你
    機器之心報導SketchX 實驗室「你畫我猜」是一種廣泛流傳在不同文化中的人類通識遊戲,其形式簡單但高度體現人類的認知智慧。即給定一個視覺概念,Pixelor 能夠像人類競爭者一樣快速甚至更快地畫出一幅人類和機器均能識別的目標對象草圖。
  • 歷年 CVPR 最佳論文盤點(2000 年——2018 年)
    、準確預測身體關節 3D 位置的方法。論文展示了該集成系統在挑戰真實世界數據方面的表現,該數據集顯示了擁堵市區內的汽車行駛情況。該框架允許任意物體探測器進行「無痛」替換,且便於擴展至包括圖像理解在內的其他方面。最終實驗結果證實該綜合方法的優勢。
  • 開發以中文「與數據對話」的AI決策系統,「訊能集思」要做人工智慧...
    「訊能集思」即是一家專注人工智慧決策的人工智慧公司。通過增強型分析,其人工智慧決策平臺 Xavier能讓基礎數據分析人員和有數據分析需求的業務人員完成數據分析,並利用自動化機器學習(auto-ML)為企業業務提供多樣化的數據決策方案,助力企業的數位化和智能化轉型。
  • 韓國UNIST合作研發AI系統 可預測未來5至15分鐘交通狀況
    圖片來源:Korea Bizwire)蓋世汽車訊據外媒報導,韓國蔚山國立科學技術研究所(Ulsan National Institute of Science and Technology)Ko Sung-ahn教授牽頭的一個研究小組與美國普渡大學(Purdue University)和亞利桑那州立大學(Arizona State University)合作,研發出一個人工智慧(AI)系統
  • 機器之心GMIS 2017圓滿閉幕,兩天時間全面解讀前沿研究、產業落地...
    2017 年 5 月 27 日上午,機器之心主辦的第一屆全球人工智慧峰會(GMIS 2017)在北京 898 創新空間順利開幕,中國科學院自動化研究所複雜系統管理與控制國家重點實驗室主任王飛躍致開幕辭,他說道:「我認為,再過幾年,我們 90% 的工作都會是人工智慧提供的,就像我們今天大部分工作是機器提供的一樣。人工智慧會給我們提供一個更美好的未來。」
  • AI+醫療「最佳掘金案例」榜單出爐,致敬寒冬中的「持炬者」
    從「替代醫生」到「輔助醫生」,從「單點突破」到「全病種理念」,從「技術研發」到「商業落地」。短短三年時間裡,AI醫療經歷了一個急劇變化的過程。2017年11月,雷鋒網聯合數十家風險投資公司、傳統上市企業、機關單位領導以及海內外高校,啟動了業內首個人工智慧商業案例評選活動:「AI最佳掘金案例年度榜單」,從商業維度出發,尋找各個行業用戶/客戶問題解決能力強的最佳產品和解決方案。
  • AI加持的精準天氣預報將從深圳開始:兩小時內,一平方公裡範圍
    機器之心報導作者:李澤南在天氣預報中,我們常常會聽到「局部地區」這樣的字眼。隨著技術的發展,「局部」出現的次數正越來越少。在深圳,大數據和人工智慧的融入將在不久之後為我們帶來「精準到街區」的個性化天氣預報服務。
  • 騰訊AI 王者「絕悟」升級了
    但受到練習時間與精力限制,很少有人能精通所有英雄,但「絕悟」做到了。 那麼,王者再進化,將有多強? 據了解,「絕悟」一年內掌握的英雄數從 1 增加到 100+,王者榮耀英雄池也實現了完全解禁,不但掌握了所有英雄的全部技能,能應對高達 10 的 15 次方的英雄組合數變化,甚至還「自帶軍師」,可做出最佳的英雄博弈策略選擇,綜合自身技能與對手情況等多重因素,派出最優英雄組合。
  • 配送機器人圈再多兩款新品:AI運維+道路預測,最早2020年量產
    九號機器人為此在2018年與美團聯合發布了「Segway配送機器人S1」,據王野稱:過去一年與美團等行業合作夥伴已經持續產生5000多公裡的運行裡程,每百公裡人工幹預次數從5次改善到1.5次。基於此,九號機器人再次發布配送機器人新品:「Segway配送機器人S2」。
  • 機器之心年度盤點:2018年重大研究與開源項目
    它們為深度學習開拓了新方向,也為未來提供了更多選擇。在這篇文章中,機器之心從想法到實踐介紹了 2018 年令人矚目的研究工作,它們共同構建了機器學習的當下。我們主要按領域從模型到開源工具展開,其中算法或模型的選擇標準主要是效果和潛力,而開源工具的選擇主要憑藉 GitHub 的收藏量與效果。
  • 神經符號系統、跨學科交互,李飛飛等16名學者共同探討AI未來
    她談到了語言的重要性,並表示語言是「生成任務的推理」。她認為:「我們人類執行的是即時推理,這將成為未來 AI 發展的關鍵和根本性挑戰之一。」他認為了解大腦還需要一兩百年的時間,所以從大腦機械基質中尋求靈感來加速 AI 發展是錯誤的,這與 Marblestone 的觀點形成了鮮明對比。他表示:「這與人造物體的特性完全不同。」
  • 騰訊AI Lab 2020 年度回顧
    雙軌並行邁向通用人工智慧:虛實集成世界與機器人 通用人工智慧(AGI)是騰訊 AI Lab 成立伊始便已確立的核心長遠目標,即創造能感知和理解真實世界並能有效執行各種不同任務的 AI 系統。為了實現這一目標,我們既需要軟體上的突破,也需要硬體的迭代創新,還更需要目前行業普遍缺乏的軟硬體的有效整合與集成。