GAITC專題論壇丨楊易:訓練機器自主學習提高檢測效率

2020-12-22 泡泡網

GAITC專題論壇丨楊易:訓練機器自主學習提高檢測效率

2020年07月29日 10:55作者:網絡編輯:宏偉

  7月26日,由中國人工智慧學會主辦、新浪新聞聯合浙江大學承辦的2020全球人工智慧技術大會(2020GAITC)「AI時代下的新媒體與社交娛樂」專題論壇拉開帷幕,新浪集團首席信息官、新浪AI媒體研究院院長王巍,浙江大學特聘教授,雪梨科技大學教授、百度研究院訪問教授楊易共同擔任論壇主席。

  浙江大學特聘教授,雪梨科技大學教授、百度訪問教授楊易在本次專題論壇上,與來自業界、學術界的嘉賓們分享了《媒體的智能理解、分析與合成》。

  楊易認為,大規模網絡視頻智能分析面臨許多挑戰,如視頻數據複雜度高,標註數據量少且標註過程緩慢等。如何利用無標註的海量網絡視頻協助視頻特徵學習,並提升模型性能是視頻分析領域重要的研究問題。

  他提到,以前訓練一個模型做一件事,現在更多的是讓機器自主學習,培養機器的自我學習能力。不僅讓機器學會做事,更要教會它怎麼去學習,這是元學習的基本想法。比如,讓機器學會怎麼去做事,新的任務就很容易做自適應。

  圖註:浙江大學特聘教授、雪梨科技大學教授、百度研究院訪問教授楊易作主題演講。

  以下為楊易演講實錄,內容經編輯略有刪減:

  尊敬的李院士,新浪的王總,以及在場的各位嘉賓和網上觀看今天會議的朋友們大家好!今天我的報告比較偏技術一點,因為視頻在網絡媒體傳播裡面是最重要的載體,而且今天李院士也講了,跨媒體是人和設備,計算機交互最重要的一個載體,我覺得視頻它有聲音,也有文字的信息,可能還有視覺的信息,所以可能是最接近跨媒體信息的媒體類型。

  我今天給大家分享一下我們怎麼樣能夠比較智能的去分析、理解和利用、推薦視頻的內容。今天是娛樂論壇,其實在娛樂這個領域,我們用得場景視頻還是比較多的,比如說體育運動類的視頻,比如說社交媒體的視頻,電影和電視裡的視頻。為什麼我們要做視頻的分析和理解?接下來我將用幾個比較典型的應用展開論述。

  當我們在發布媒體內容的時候,我們希望對它做比較好的管理和分類。我們希望媒體對這個內容做推薦,我們也希望媒體對這個內容做審查。不管是在國外還是國內都有這種需求,在國外很多的時候有的人會通過媒體發一些極端主義的內容,所以我們無論是推薦,還是審查,還是組織、檢索,都需要對視頻的內容做比較智能的分析。

  實際上為什麼視頻分析是比較難的,因為視頻的規模是非常大的,它和圖像比起來,時間和空間的信息複雜度會很高,而且現在我們學術界用的數據相較於我們真實的網絡視頻和我們要處理的視頻還是有一些差距的。比如說這個是我們在訓練神經網絡用得比較多的數據,但是這些數據可能是運動數據,可是我們真正遇到的數據是用戶拍攝的數據,這些數據和我們學術界訓練神經網絡的數據有一定的鴻溝。另外,我們現在和圖像比起來,我們可以訓練一個相對比較好的神經網絡來做圖像的表達。但是視頻數據我們可以訪問到、標註好的數據規模非常小,而且視頻數據又比圖像數據更複雜,所以一方面我們的訓練數據少,另一方面我們數據的內容又非常的複雜,所以在這種情況下,就使得訓練一個很好的可用的神經網絡變得非常有挑戰性。

  我舉個例子,我們對視頻的理解其實是非常主觀的,因為圖像相對內容比較簡單,所以我標註的時候比較容易,但是對於視頻來說,主觀性會造成很大的區別,標註有的時候不一致。可能這個小朋友玩的是小朋友的獨輪車,這種也是自行車的一種,很多人就把它直接標註成了騎自行車,但是有的時候大人騎自行車,甚至騎一些電動車,也會被標註成騎自行車,所以這個時候,我們標註和現實是非常不統一的。

  另外一個問題,我們在做視頻研究的時候遇到了一個很大的問題,現在大家標註的視頻很多都是與場景相關的視頻,大家標註的比較多,真正我們做動作識別,很多時候其實做的是場景識別,不是真正的時序建模。在我們做動作識別的時候,什麼動作識別得好呢,是遊泳,打籃球這類的運動,為什麼這類識別得好呢?因為遊泳我們只要識別遊泳池我就知道是遊泳了,打籃球我只要識別籃球場,就知道是在打籃球。

  所以很多時候,我們視頻分析裡面做得好的這些動作還是和場景相關的,但是真正有動作的,比如說這是舉手還是把手放下來,我是站起來,還是坐下,中間的狀態,時序建模現在做的是不太好的。一方面是因為資料庫非常少,現在有一個專門講物體和人的交互的數據集,人的時序建模的數據現在有一些了,但是還是非常少。

  現在的深度學習靜態的識別已經很好了,我們再進一步是給網絡規模的視頻做分析,我認為最大的一個挑戰是效率的問題。實際上圖像為什麼快,一方面是因為它是沒有時間特徵的,我們計算機做時序建模是非常耗費資源的。另外因為一分鐘視頻就有上百幀,所以視頻幀數本來就很大。

  另外還有一個效率的問題,我們標註視頻的效率也很低,如果人,比如我看到這個的時候,這是一個會場,我一下子就標記出來了,但是如果給大家一個一小時的視頻,我讓你標出來什麼時候人在跑,什麼時候人在吃東西,什麼時候人在切割。那麼我標註視頻的標註量也是非常大的。而且我在大量的視頻中找相關的視頻,比如說在100段視頻中找人在切黃瓜的視頻就是非常困難的。

  所以整個來說,我覺得一方面是計算機計算的效率要提高,另一方面我們標註的效率也要提高,我大概主要是圍繞效率問題在講。

  第一個我在講怎麼樣提高視頻的標註效率,視頻有一個很重要的應用,我要把它定位出來,一個是空間定位,這有車,另外一個是時間定位,比如說我知道這一段視頻有一個小松鼠,我知道它什麼時候在進食,其實這個視頻可能總共有10分鐘或者20分鐘,但是只有幾幀是在進食。大家可以想像,如果我是一個動物學家,要看它的生活習性,看動物是怎麼吃東西的,可能我就是對這一部分感興趣,定位實際上是比較複雜的。我要在很長的視頻裡面,把這個定位出來,計算量是非常大的。

  不僅計算量是很大的,人要標註的也很多。傳統方法下的視頻定位操作是比較多的。人工做視頻,每一段視頻,小松鼠什麼時候開始吃,什麼時候完成吃,把這一段都要標出來,這個標註工程的工作量是非常大的。

  因此大家就提出了弱監督做定位,我有一段視頻可能有10分鐘,我知道這裡面至少有一段視頻是小動物在吃東西,那麼在這種情況下,這段視頻有小東西在吃東西的鏡頭,但是可能10分鐘長的視頻只有5秒在吃東西,這種效果雖然標註很快。

  這是我們今年和Facebook合作的一個工作,我們能不能這樣做,這段視頻,我標註它有小動物在吃東西,但是我不用標註它的起始幀和結束幀,我在瀏覽這個視頻的時候,我發現這一幀它在吃東西,我只標一幀,我滑鼠點一下就好了,這個時候我在視頻中標註一幀,這樣計算機基於單幀標註可以逐漸的擴展信息。其實這個東西Facebook最早就想做這樣的概念,但是我們把這個東西做完之後,他們產品部門去研究,說這個技術是可行的,現在可能是在往產品裡面加入。

  這是我們研究的一個過程,簡單來說其實就是這樣的,我標了一幀之後,我通過單幀監督的數據不斷的擴展,往兩邊擴展,在時間軸上不斷的擴展,通過內容分析,可能這些都是進食的幀,或者相關的幀,然後把這個例子自動的照出來再不斷的擴展,這是一個迭代的過程。

  另外還有一個比較重要的問題,我要做背景的檢測,其實我要找最接近正例的背景,我們一般是通過置信度,也是找出正例和負例不斷的擴展。這個是在講我們在做視頻檢測的時候怎麼提高檢測的效率。

  這是一個快閃的視頻,我們的任務是讓機器人去檢測,這是不是在快閃,大家想想我們人在檢測的時候是怎麼檢測的?現在計算機都是這樣做的,從頭到尾把視頻看完,然後說,這是快閃。

  那麼,其實真的要讓人去看,人可能剛開始發現這些內容不相關,我就快進或者跳過去,中間看了幾幀我發現這個地方就是快閃,就不用看完了。我看了大概1/3,前面快進,後面看了1/3部分的視頻,我說這就是快閃,所以我就不看了。這個方法我們用強化學習去做,我們訓練一個機器,跟人看視頻一樣,不是從頭到尾每一幀都看,我有的時候發現剛開始這些信息不重要,都是字幕介紹,我就用16秒的速度快進。到後來我發現越來越有內容,內容越來越多,我就把快進的速度降低。然後我發現這真的是和快閃相關了,我就一秒一秒認真的看,我看了四幀之後發現這就是快閃,我就不用看完了。

  所以,這個例子裡我可能看四幀就知道了,我不需要均勻採樣,然後把它檢測出來。這是我們的做法,大概我們看1/60的幀,我們得到的結果和全看差不多。我們的題目當時是說,你只看很小的一部分,就和全看是一樣了,我們是策略性的去挑,模仿人怎麼去識別視頻的內容。

  這個是我們在檢測的過程中怎樣提高效率,這個方法實際上是說模型怎麼樣快。檢測的時候我只看幾幀就可以了,但是模型還是很複雜的。因為我們做視頻分析用,凡是涉及到時間序列的檢測,複雜度是呈指數級在增加的。但是視頻有一個特點,冗餘度非常高。比如說這是一個人在跳舞大家可以看到,這是從0到3秒,我都把它列出來,冗餘度非常高。我們怎麼去利用這個冗餘度來降低模型的複雜度呢?一般我們是說,模型越大,越複雜。如果模型越複雜,它的性能越好,但是如果是做簡單的模型,雖然複雜度下降很多,可能有N個小模型,因為它有冗餘度,所以我用複雜的大模型帶若干個小模型之後,這樣我用N個小模型取代原來要做的N個大模型。

  在這種情況下,我們希望把模型的效率提高,這有一個問題,一個大模型帶N個小模型,怎麼樣累加起來,性能還很好?這是我們用的模型,實際上我們提出了一種快速的循環神經網絡的思想,對模型做融合。實際上大家可以看性能是非常好的,比大模型都好。

  最重要的是,大家可以看到,我們的計算量大概是削減了10倍,但是我們的結果還是很好的。這個技術也是和Facebook合作的,我們在所有公開的數據集上做的試驗,基本上性能是最好的,同時我們的複雜度降低了10倍。一個大模型帶若干個小模型,如果我們有好的方法,不但會更快,而且會更好。

  這是我們今年新做的一個工作,因為視頻標註太複雜了,所以我們想能不能用機器自主學習的方法去做,這個時候我們就說能不能使用視頻裡面自己蘊含的信息,我們能夠把好的神經網絡訓練出來。其中我們用到了教學視頻,有一個很好的特性,比如說我做飯,第一步切黃瓜,第二步黃瓜裡面放鹽,第三步我倒醬油,第四步放到鍋裡,第五步炒。所以一邊說一邊做這個動作,這個時候給我們提供了很好的監督信息,我們就不用在標數據,我們就是用教學視頻去訓練機器的。

  這個就是Google提出的自主訓練的方法,基本上像填空,這些技術細節就不細說了,後來有人把它放到圖像這部分,我們的工作把它擴展到三個支路,一支是做的動作的特徵,另一部分我們做區域的檢測,另外因為它有一邊說一邊做,所以我們有自然語言的模型。這個有一點像跨媒體的思想在裡面,我們把圖像的特徵,時序的動作的特徵和自然語言的信息放到一起再訓練。這個結果是非常好的,我們在這上面訓練出來的模型,在所有的下遊任務上都提高了性能,而且這個是我們不需要標註的。整個過程不需要人工的標註。但是我們比如說在視頻的文本摘要,在做視頻動作切割以及做視頻的動作定位和跨媒體檢索和視頻問答,所有的下遊任務裡我們都取得了最好的性能。

  最後我講一下,以前的時候我們訓練一個模型做一件事,我們現在就想能不能讓機器自主學習,培養機器的自我思考能力。我們不僅讓設備學會做這件事,更要教會它怎麼去學習,這是元學習的基本。所以說我現在訓練你,我讓你學會怎麼去做這件事,這樣一來新的任務就很容易做自適應。所以我們提出複合記憶網絡,是深度學習的一個機制。我們提出了複合記憶網絡,它有幾個好處,一是我們用摘要模型可以做快速的檢索,另外用分塊模型去做視頻的匹配,這個工作是一個小樣本,因為機器學東西就像我們小學、初中、高中上完之後,我再去大學裡面學專業的知識,可能很快就學會了。但是如果說,小學、初中,高中學的東西跟大學學的沒有關係,比如大學專業是學計算機、人工智慧,但是我不上小學、初中、高中直接去上大學我又學不好,所以我們還是讓計算機有自主學習的能力,另外我們基於這個工作加了無監督的數據,我們教會機器自主學習,機器有了學習的能力之後,小樣本數據就能學得很好了,在此基礎上,我們再加入大量的無監督的數據,沒有標註的數據,我們的性能就又能提高一部分。

  機器學會自主學習後大概就是這樣,基本上檢測每一個視頻,大概檢測兩三個樣本就可以得到較好的結果,我的分享結束,謝謝大家。

相關焦點

  • 機器學習平臺搭建及應用分享
    加入京東零售以來,一直從事算法平臺相關工作,從零打造了京東零售的「九數算法平臺」,平臺聚焦易用性、高性能,為算法人員提供了一站式算法解決方案,廣泛賦能京東零售、京東數科、京東雲、京東物流、京東健康等,極大提高了算法迭代效率,推動了業務的高速增長。
  • GAITC將至 新浪新聞承辦AI時代新媒體與社交娛樂論壇
    作為本次大會專題論壇之一,新浪新聞、浙江大學聯合承辦的「AI時代下的新媒體與社交娛樂」專題論壇,將由新浪首席信息官王巍和雪梨科技大學教授楊易共同擔任主席,邀請中國科學院自動化研究所模式識別國家重點實驗室研究員胡衛明、新加坡國立學院(NUS)計算機學院院長Mohan Kankanhalli、喬治亞理工大學互動計算學院教授Amy Bruckman、清華大學大學新聞與傳播學院學術委員會主任金兼斌、美聯社戰略和企業發展高級副總裁
  • 找到加分項,訊飛智能學習機X2pro\Z1提高孩子自主學習
    今年的上半年,由於疫情,許多學生都只能在家裡進行線上學習,雖然說線上教學的方式更加安全,也能保證知識的傳遞,但是因為不能面對面交流,針對每一個學生進行因材施教,而且隔著屏幕,學生的自覺性不高,導致網課的效率變低,學生的成績也出現下滑。
  • 家庭領讀人 | 科學記憶,提高學習效率
    越是怕忘記越記不起來日常學習、工作需要記的事情不少如何通過科學的方式進行訓練提高我們的記憶力呢?書中還有許多提高記憶的好方法,我向大家推薦《海馬記憶法》這本書。謝謝大家!感謝劉冉同學分享她的學習秘籍!《海馬記憶法》是日本連續五年銷量第一的記憶書。著名腦科學家池谷裕二,經過多年研究和實驗,總結出一套切實有效的海馬活化記憶訓練體系。
  • 學生上網課學習效率不容樂觀 「授人以漁」引導學生自主在線學習
    學生上網課學習效率不容樂觀 「授人以漁」引導學生自主在線學習 2020-03-04 09:36:47 來源:法制日報  |  作者:韓丹東 | 字號:A+ | A- 各地響應「停課不停學
  • 程少條碼數學:培養自主學習從培養正確思維習慣開始
    在多年的教學中,蹊徑課堂的程少條碼數學主講老師程玲海被家長問得最多的就是孩子平時學習很努力,但為什麼數學成績總是不好?  不僅家長感到焦慮,當學生拿到不理想的成績,自信心也會受損,有的同學甚至對自己產生了懷疑,學習積極性大打折扣。
  • 「食品安全快篩快檢中心」:檢測效率大提高
    11月5日下午,在位於新北區的生物醫藥孵化器的快檢快篩中心檢測室,檢驗員劉開龍正在對剛取樣回來的醬醃菜進行多項指標的檢測,桌面上,蘿蔔乾、雪裡紅、醬黃瓜、榨菜等多品種的醬醃菜被封在透明塑膠袋裡,他依次通過試劑與抽樣產品的提取成份相互作用反應,檢測某些成份是否超標。  「餐桌上蔬菜必不可少,但是農藥會不會殘留?」
  • 知點一對一:怎麼提高日語閱讀學習效率?
    提升閱讀能力提升閱讀能力最快的方法自然是提高閱讀量,通過大量的閱讀來提升自己的閱讀理解能力和閱讀速度。而日語能力測試中,「讀解」題量大,難度高,是最容易丟分的地方,「讀解」的試題通常選自報刊中的專欄,雜誌,普及讀物等的隨筆或有關自然科學以及涉及日本人和日本文化方面的書籍。因此,在日常的學習中,要多閱讀習慣此類文章的文體、構成及表達方式等。
  • 如何安排力量訓練,一周訓練幾次,才能提高健身效率?
    健身訓練的時候,我們不僅需要進行有氧運動,更不能忽略力量訓練。力量訓練可以鍛鍊自身肌肉,提高身材線條,提升自身的曲線魅力。但是,很多人不知道如何科學的安排力量訓練,才能提高健身效果。
  • 機器視覺對於物聯網來說是什麼位置
    這使攝像機可以對接收到的數據做出相應的響應,從而減少了通過網絡發送視頻的需求,並提高了整體操作效率。 將檢查設備的機器視覺元素連接到物聯網,可為正在對工廠性能進行分析的企業系統提供更多數據。機器視覺可以提供適合此類企業系統的抽象級別的信息,而不是原始數據。
  • 告訴初中生,考前別傻傻熬夜,提高晚上學習效率的7個絕招在這裡!
    大家按照自己的實際情況來選擇,並且平時學習就要提高效率。課後題一般是針對本課內容設置的檢測題,用來檢驗自己是否真的學會了這一課的知識,具有檢驗知識是否掌握的功能,所以一定要做。 (2)同步練習冊。課後題一般是偏於基礎,並且與課本例題太相似,起不到鞏固知識和檢驗掌握程度的目的,想有效提高對課文知識的理解,這些同步題也是必做的。
  • 提高學習效率,強本領,寬肩膀
    習近平總書記明確告知全黨:中國共產黨人依靠學習走到今天,也必然要依靠學習走向未來。同時,他還非常有針對性地要求「領導幹部不僅要有擔當的寬肩膀,還得有成事的真本領」。因為,如果黨內存在能力不足、本領不強的領導幹部,不僅黨的領導和執政效率會大打折扣,更會影響黨在人民群眾中的形象和地位。
  • 如何讓小學生在數學學習上形成自主學習的能力
    也就是說,基礎教育課程改革,既要加強學生的基礎性學力,又要提高學生的發展性學力和創造性學力,從而培養學生終身學習的願望和能力。因此,本人在教改實驗中,就改變學生的學習方式作了如下幾方面的探索。一、自主學習自主學習,顧名思義就是學生依靠自己的努力,自覺、主動、積極地獲取知識。自主學習能力則是學生在學習活動中表現出來的一種綜合能力。
  • 2020-2021「AI中國」機器之心年度獎項揭榜(下)
    一流科技 · OneFlow 分布式深度學習訓練框架OneFlow 是北京一流科技有限公司研發的人工智慧領域的深度學習框架開源產品,是一款用全新架構設計,世界領先的工業級通用深度學習框架,也是目前世界上唯一一款由創業團隊研發的開源深度學習框架。
  • 運用好大腦學習的「黃金時間」,提高學習效率,實現「彎道超車」
    每個家長都對自己的孩子寄予厚望,想盡各種辦法幫助孩子提高學習成績。其實,提高學習成績的一個有效方法就是提高學習效率,這樣我們學習起來就能事半功倍!而提高學習效率的有效方法就是讓孩子運用好大腦學習的「黃金時間」,實現「彎道超車」!
  • 「案例」星環科技助力商業銀行機器學習平臺建設
    星環科技機器學習平臺提供的AI建模工具服務於後期用戶畫像、企業畫像以及實體模塊的構建。建設一個從數據倉庫、數據處理、模型建設、模型發布、模型共享、運維管理全流程為一體的大數據與機器學習平臺。將模型訓練完成後,結合流計算引擎產品,上線到生產環境用於線上業務,支持毫秒級實時決策,有助於提取數據中蘊含的商業價值數據,提高企業核心競爭力。
  • 大塘小魚深度專訪:《最強大腦》總冠軍「腦王之王」楊易
    楊易:應該關注孩子真正需要的是什麼,目前我的學生主要屬於學齡前兒童和小學階段的孩子,大腦正處於成長發育階段,這也是培養孩子思維的黃金階段,所以我們的課程不只需要教給孩子知識,更需要傳遞一些方式來幫助孩子訓練思維。比如,我在數學思維課上,每節課設置都是一半數學知識;一半時間用遊戲、故事來幫助孩子練習思維。
  • 這個假期,提高學習效率的3個方法,家長快快轉發
    在這個延長版的假期中,打破了原有的計劃、學習節奏,現在面臨的是重新修訂計劃,還要長時間做好假期計劃的制定,計劃中也要充分考慮計劃的可行性。怎樣的計劃才能提高在家學習效率呢。這最重要的是他們養成了良好的學習,做事的習慣,有計劃,有規律。這個習慣當然不是一天兩天形成的,但是無論困難有多大,只要你刻意去做,難度都會大大折扣,好習慣也會養成。來高效學習,也可以通過刻意練習形成,這樣訓練試一試:剛開始可以按照30分鐘一個周期,前25分鐘集中精力學習,後五分鐘休息,這樣循環進行。
  • 【平語新時代丨圖解】《習近平談治國理政》第三卷專題解讀:提高...
    新聞中心 > 央廣網國內 > 國內滾動 【平語新時代丨圖解
  • 2020百度雲智峰會智能產業專題論壇召開,諸多最新行業解決方案亮相
    上午的主論壇展現了百度智能雲的最新成績和產業智能化成果。「雲智一體」成百度智能雲獨特的競爭力,在各行各業加快規模化落地。在下午的智能產業專題論壇上,百度副總裁李碩發表了題為「精工數聯,智贏未來」的主旨演講。會上展示了百度在推動AI產業化的多項進展,涵蓋工業、金融、TMT、物流、商業地產、城市交通、客服營銷等諸多行業智能化解決方案。