「雲」頂會ICLR 2020來襲,RealAI朱軍教授團隊錄用論文數世界第二...

2021-01-11 站長之家

4 月 25 日- 30 日,機器深度學習領域頂級會議——國際表徵學習大會(ICLR,International Conference on Learning Representations)正式舉行。根據此前發布的論文接收結果,RealAI首席科學家朱軍教授帶領的TSAIL團隊共發表 7 篇,位居世界第二,朱軍教授與喬治亞理工學院宋樂教授並列 ICLR 2020 華人貢獻榜首位。

由於受到全球範圍疫情爆發的影響,本屆ICLR完全改為線上「雲」會議,但這絲毫沒有影響全球人工智慧學者和研究人員的熱情。據統計,本屆會議共有 2594 篇投稿、 687 篇收錄,接收率為 26.5% 。相比去年的 1591 篇論文投稿,今年也將會是ICLR史上規模最大的一次會議。

在所有收錄的論文中,共有 48 篇被接收為口頭報告論文, 107 篇被接收為亮點論文, 532 篇作為牆報論文。TSAIL團隊發表的 7 篇文章包括一篇口頭報告論文(收錄率低於1.9%),一篇亮點論文(收錄率低於6%)。

作為深度學習領域的國際頂級會議之一,ICLR論文評審的透明性和廣泛性獨樹一幟,被認為是業界做得最公開的一個會議,當然,這也意味著論文被接收的難度之大。在此背景下,TSALL團隊的亮眼成績也再度展現了清華學者在人工智慧領域國際領先的科研硬實力。

其實,在人工智慧頂級會議和期刊上,清華大學的成果長期位居國際前列。根據全球計算機科學專業排名榜CSRankings發布的2010- 2020 共 10 年間AI科研成果客觀排名,清華大學名列世界第二,其中,朱軍教授名列清華第一。

TSAIL團隊長期從事機器學習、貝葉斯統計等基礎理論、高效算法及相關應用研究,在國際重要期刊與會議發表學術論文 100 餘篇。此次被接收的 7 篇論文涵蓋博弈論、強化學習、對抗魯棒學習、貝葉斯深度學習等前沿領域。我們將 7 篇文章提前做了整理,下面逐篇做亮點解讀。

論文1:多智能體強化學習的後驗採樣:求解不完全信息的擴展型博弈

摘要:強化學習(RL)是通過從與環境的迭代交互中獲取信息來改進策略,目前設計RL算法的一個典型問題就是如何實現以最少的交互次數找到最優策略。強化學習的後驗採樣(PSRL)為未知環境下的決策問題提供了一個有用框架。比如在單智能體強化學習(SARL)中,PSRL採用最大期望回報作為交互策略,被視為最優方法之一。不過儘管PSRL在單智能體強化學習問題上表現良好,但如何將PSRL應用於多智能體強化學習問題卻尚未得到研究。本文將PSRL拓展到具有不完全信息(TEGI)的二人零和博弈,這是一類多智能體強化學習任務 (MARL)。這裡的不完全信息意味著主體可以保留私有信息,比如撲克遊戲中私有卡的規則設置,針對不完全信息擴展型博弈的研究對於眾多應用具有實際意義。本文主要提出將PSRL與反事實遺憾最小化算法(CFR)相結合,其中CFR是TEGI在已知環境下的領先算法,這為不完全信息拓展式博弈中的RL問題設計了一種有效的新交互策略。

論文2:Lazy-CFR:不完全信息擴展型博弈中快速且接近最優的遺憾最小化算法

摘要:反事實遺憾最小化(CFR)方法是解決具有不完全信息的二人零和博弈的有效方法。但是CFR的一個限制就是它需要在每一輪中遍歷整個遊戲樹,這在大型遊戲中非常耗時。目前用於提高CFR算法速度的方法主要有兩類:基於剪枝的CFR(Pruning-based CFR)和蒙特卡洛CFR (MC-CFR) ,但這兩種方法都有所局限。本文主要提出一種新算法Lazy-CFR,通過利用延遲更新技術來避免CFR遍歷整個遊戲樹。Lazy-CFR將時間範圍劃分為若干段,僅在每段開頭更新策略,並在每段內保持策略不變,從而實現只需要訪問遊戲樹的一小部分即可。將Lazy-CFR與普通CFR算法相比較發現,兩者的虛擬遺憾值基本相同,但Lazy-CFR遺憾最小化的上界接近最優,而且在收斂速度上,Lazy-CFR顯著快於普通CFR算法。

論文3:SVQN:SequentialVariational Soft Q-Learning Networks

摘要:部分可觀測馬爾可夫決策過程(POMDP)是現實世界中應用廣泛的決策模型,該模型主要基於過去觀察的信息來做出最佳決策。標準強化學習算法不適用於求解部分可觀測馬爾可夫決策過程,因為它難以推斷出未觀察到的狀態。本文主要提出一種新的POMDP算法,稱為SVQN(SequentialVariational Soft Q-Learning Networks),該算法在統一的圖模型下能夠結構化隱性推理和最大熵強化學習(MERL) ,並對兩個模塊進行了聯合優化。本文也進一步設計了一個深度遞歸神經網絡以減少算法的計算複雜性。實驗結果表明,SVQN能夠基於過去的信息來實現有效的推理決策,在一些具有挑戰性的任務上效果也優於其他基線。同時SVQN具有隨時間推移的泛化能力,對觀測擾動也具有較強的魯棒性。

論文4:利用混合推理更好地防禦對抗樣本攻擊

摘要:眾所周知,對抗樣本能夠很容易欺騙深度神經網絡,這主要由於神經網絡在輸入樣本附近的非線性。混合訓練模型則提供了一種有效的防禦機制,在訓練中引入了全局線性行為,從而提升模型的泛化性能和魯棒性。但是,此前混合訓練的模型只是對輸入樣本做直接分類,並不能夠很好的利用引入的全局線性,所以面對對抗樣本攻擊時只是被動防禦。本文主要對混合訓練模型開發了一個名為「混合推理」(MI)新推理原理,將輸入樣本與其他隨機純淨樣本混合,如果輸入樣本是對抗性的,則縮小並傳遞等效擾動。通過在CIFAR- 10 和CIFAR- 100 數據集上驗證表明,MI可以進一步提高由混合訓練模型及其變體訓練模型的魯棒性。

論文5:對Softmax交叉熵損失函數提升對抗魯棒性的再思考

摘要:先前的工作表明,提高機器學習模型的對抗魯棒的泛化性往往需要更大的樣本複雜度,例如常用的CIFAR-10數據集可以訓練一個高精度的分類模型,但往往難以訓練出對抗魯棒的模型。但收集新的訓練數據成本較高,因此通過在特徵空間中選擇引入高樣本密度的區域來集中利用給定數據,能夠獲得局部足夠樣本進行對抗魯棒的學習。本文首先分析表明Softmax交叉熵(SCE)損失函數及其變體傳遞了不恰當的監督信號,這促使學習獲得的特徵點在訓練過程中稀疏地散布在整個空間中。在此思路的啟發上,本文主要提出MMC損失函數(Max-Mahalanobis)方法,以明確誘發密集的特徵區域提高對抗魯棒性。也就是說,MMC損失函數促使模型專注於有序和緊湊的學習表示,這些表示聚集在預先設定的最優中心周圍,用於不同的類。根據經驗證明,即使在強自適應攻擊下,應用MMC損失函數也能顯著提高魯棒性,同時在不需要額外計算的情況下,在純淨輸入樣本上保持與SCE損失相當的高精度。

論文6:SUMO:隱變量模型對數邊際概率的無偏估計

摘要:隱變量模型是用於表述數據分布和理解高維數據的強大工具,能夠高度結構化概率先驗。近年來,如何將深度神經網絡與非線性概率隱含模型相結合以提高模型的可解釋性成為一大熱門研究方向。但要隱變量模型的參數擬合工作很具有挑戰性,需要對邊際似然的對數進行高質量的估計。本文主要構造了一個無偏估計的對數邊際似然,在相同的期望計算成本下,無偏估計可以訓練隱變量模型,並獲得比下限估計更高的測試對數似然。更重要的是,在存在問題的情況下,該無偏估計允許優先使用下界估計進行優化。這一方法可應用包括後驗推理的隱變量建模和高維空間的強化學習,在高維空間中,該方法構建的模型具有高表達性,採樣效率也更高。

論文7:使用ADVIL來減少訓練MRF的煩惱

摘要:本文提出了一種對抗變分推理學習(AdVIL)的黑盒學習算法,能夠在一般的馬爾可夫隨機域(MRF)中進行推理和學習。AdVIL採用兩種變分分布來近似推斷隱含變量並估計MRF的配分函數。這兩個可變的分布提供了MRF的負對數似然估計作為極小極大優化問題,可以通過隨機梯度下降來解決。AdVIL在某些條件下被證明具有收斂性。一方面,與對比散度相比,AdVIL對模型結構的假設最少,可以處理更廣泛的MRF類別。另一方面,與現有的黑盒方法相比,AdVIL提供了更嚴格的對數配分函數估計,並獲得了更好的經驗結果。

近年來,在人工智慧頂級會議中,中國學者的研究力量正快速崛起,其中清華大學人工智慧團隊擁有著比肩世界頂級名校團隊的科研創新能力,並且始終保持對前沿技術的敏感和基礎技術的研發先手,多次在人工智慧領域最前沿的競技舞臺上取得亮眼成績。

而且作為國內最早從事人工智慧技術研究的高校機構之一,清華大學不僅湧現出一批學術大咖、學術新星,還積極推動學術界與工業界的深度融合,孵化出一批新興AI企業,促進人工智慧產學研結合。可以預見,這些「中國科技新力量」將在未來支撐起中國人工智慧行業新一輪的產業變革。

關於RealAI

RealAI瑞萊智慧是亞洲首家安全可控人工智慧技術及行業解決方案提供商,作為孵化自清華大學的團隊,RealAI由清華大學人工智慧研究院院長張鈸院士、清華大學人工智慧研究院基礎理論研究中心主任朱軍教授擔任首席科學家。

RealAI致力於研究和推廣安全、可靠、可信的第三代人工智慧,基於安全可控的核心算法技術,提高企業級人工智慧解決方案可靠性與安全性。一方面提升AI本身的安全性,解決AI技術應用引起的安全問題,檢測和防範AI系統漏洞及濫用風險;另一方面,通過安全可控的AI賦能高價值產業,服務於金融、工業、公共治理等領域。目前,RealAI已經與多家大型金融機構、工業企業、政府部門開展合作,提供信貸風控、反欺詐、設備資產運營優化、人工智慧系統安全性檢測、AI防火牆、內容審查等產品和服務。

免責聲明:「站長之家」的傳媒資訊頁面文章、圖片、音頻、視頻等稿件均為自媒體人、第三方機構發布或轉載。如稿件涉及版權等問題,請與我們聯繫刪除或處理。稿件內容僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性,更不對您的投資構成建議。我們不鼓勵任何形式的投資行為、購買使用行為。

相關焦點

  • 頂會灌水越來越難,AI頂會總錄用率已經連續下降多年
    而IJCAI2019 收錄的 850 篇論文中,有 327 篇來自中國,佔比 38%。可以猜想今年的IJCAI 2020論文收錄還是中國人佔大頭。不過,今年的情況具體如何,等到大會召開恐怕才能知曉。網友評論:12.6%的錄用率,夠狠!論文結果尚未給出時候,知乎話題《如何看待IJCAI 2020錄用結果?》
  • ICLR首次雲會議開啟:可視化交互論文,視頻直聊作者,不用翻牆
    會議仍然按原定日期舉行: 2020年4月26日舉行研討會,2020年4月27日至30日舉行主題會議。  無論身在何處,所有人都可以通過ICLR門戶網站參與會議。https://github.com/iclr/iclr.github.io/  不少參與者目前已經在twitter等社交平臺發布了參會反饋,今年的線上會議內容充實,形式也十分炫酷,不僅可以直接加入線上視頻主題演講,還可以隨時發言提問,與演講者直接交流。
  • 西電陳渤團隊兩篇論文被頂級會議錄用
    今年,雷達信號處理國家級重點實驗室陳渤教授課題組的兩篇文章被NeurIPS2020錄用。(a) bi-CPGDS模型的整體結構;(b) bi-CPGDS的生成模型(左)與推理模型(右)的具體結構值得注意的是此工作是本科生參與合作完成的,來自電院16級的劉毅成同學於2019年因為對相關方向的濃厚興趣加入陳渤教授團隊從事概率統計模型科研實習,本篇論文也是他繼今年人工智慧頂級會議IJCAI2020之後參與的又一篇成果
  • 中國高質量國際論文數位列世界第二
    中國高質量國際論文數位列世界第二 2020-12-30 02:10:56 來源:科技日報 作者:房家梁 責任編輯:房家梁
  • ICLR 2020被曝47%的審稿人沒發過相關論文
    乾明 魚羊 發自 凹非寺量子位 報導 | 公眾號 QbitAI決定你論文是否中選頂會的人,可能自己都沒有發過相關論文。
  • EMNLP 2020即將召開,中國學者最高產:單人9篇主會論文!
    與此同時,在全球範圍內,邴立東博士同清華大學劉知遠、Salesforce AI的 Xiong Caiming 並列為本次大會最高產作者,同時,哈工大劉挺教授此次也有7篇主會論文入選。 以下AI科技評論對這四位作者本次EMNLP 2020論文錄取情況做簡單介紹。
  • 我高質量國際論文數位列世界第二
    科技日報北京12月29日電 (記者劉垠)29日,中國科學技術信息研究所在線發布2019年度中國科技論文統計結果。統計結果顯示,我國高質量國際論文數排名世界第2位,多所高校和科研機構闖入前10;高被引論文、熱點論文數量繼續保持世界第2位,增長率分別達到20%和30%。
  • 每人300萬,北大謝濤清華朱軍等50人獲獎,騰訊這個大獎公布
    在昨日剛剛結束的第二屆「科學探索獎」頒獎典禮上,北京大學謝濤、清華大學朱軍等幾位學者成為了信息電子領域的獲獎者,以表彰他們在各自領域做出的傑出貢獻。11 月 14 日,在北京釣魚臺國賓館,第二屆「科學探索獎」頒獎典禮舉行。典禮公布了 50 位獲得該獎項的青年科學家,他們將在未來 5 年內,每人獲得騰訊基金會 300 萬元人民幣獎金。
  • 高瓴人工智慧學院師生8篇論文被CCF-A類會議SIGIR2020錄用
    近日,高瓴人工智慧學院師生撰寫的8篇長文論文被SIGIR 2020錄用。這次會議共收到來自555篇長文投稿,僅有147篇長文被錄用,錄用率約26%。Personal Word Embeddings for Personalized Search」論文概述:個性化搜索模型會根據用戶興趣對文檔進行重排序以更好地滿足用戶的查詢需求。
  • 從ISSCC2021論文看未來技術發展趨勢
    ISSCC2021共錄用202篇論文,錄用率達33.6%。許雲翔博士進一步指出,ISSCC 2021論文的12個技術分類中,論文數量比較多的是高速網絡、5G、WiFi、影響應用和機器學習。從這幾個領域可以看到技術發展的方向,有線傳輸的論文數量佔比從ISSCC2020的6%提高到9%,這主要是雲端數據中心火熱帶來的結果;機器學習方面的論文數量佔比也從ISSCC2020的3%提升到7%,可以看到行業對這個技術的關注。 從論文來源看,全球共有15個國家和地區有論文錄用。
  • 一位博士生選擇自殺,在論文中了頂會之後
    乾明 郭一璞 發自 凹非寺 量子位 報導 | 公眾號 QbitAI頂會召開前9天,論文確定入選的中國籍博士生,自盡終結了生命
  • 西華大學這個跨學科團隊2年發表20多篇高質量論文!
    在西華有這樣一個團隊,成立時間不到兩年卻碩果纍纍,老師學生都是SCI、CSSCI高質量論文的高產戶;這個團隊學術氛圍濃厚,思想碰撞激烈,師生之間你追我趕,奮力拼搏;這個團隊的學生一早就起床學習,每天都要到研究室坐班;這個團隊國際交流頻繁,他們研究的都是世界一流、國際前沿、當下最新的學術和實踐熱點。這個團隊就是西華大學國際經濟與管理研究院。
  • 直播預告丨ICLR 2020:動作語義網絡,考慮多智能體系統中動作的影響
    CVPR 2020 系列論文解讀公開課第四期,就在4月23日(本周四)20:00 整(北京時間)進行。AI科技評論出品針對目前國際疫情形勢越發嚴峻,無法現場參會進行學術交流的情況,AI研習社聯合AI科技評論組織策劃了頂會系列專題活動,這其中就包括【ICLR 2020 專題】系列活動。
  • 985博導團隊重大成果,涉及隱私保護領域,已在騰訊的業務中應用
    近日,南開大學網絡空間安全學院劉哲理教授帶領的數據安全團隊的研究成果,正式收到了第三十屆USENIX Security國際頂級安全會議的全文錄用通知。值得一提的是,被錄用的論文"How to Make Private Distributed Cardinality Estimation Practical, and Get Differential Privacy for Free"是天津轄區高校首次在該頂級會議上發表論文。
  • 這是ICLR 2021最全論文主題分析
    與其他頂會一樣,該會議旨在為深度學習提供一個專業化的交流平臺。數據的應用表徵對機器學習的性能有著重要的影響,表徵學習對於計算機視覺、語音處理、自然語言處理等多個領域都起著至關重要的作用,ICLR 旨在打造這一領域交流研究的平臺。ICLR 2021 將於 2021 年 5 月 4 日至 6 月 8 日以線上形式舉辦。
  • ICLR 2021最全論文主題分析
    與其他頂會一樣,該會議旨在為深度學習提供一個專業化的交流平臺。數據的應用表徵對機器學習的性能有著重要的影響,表徵學習對於計算機視覺、語音處理、自然語言處理等多個領域都起著至關重要的作用,ICLR 旨在打造這一領域交流研究的平臺。ICLR 2021 將於 2021 年 5 月 4 日至 6 月 8 日以線上形式舉辦。
  • 逐鹿最佳論文!程學旗團隊獲ECML-PKDD最佳學生論文獎
    作者 | 陳大鑫 進入2020年後,國內最優秀的人工智慧研究團隊,都在暗暗地調整自己的目標——頂會論文數量已不是最終目標,逐鹿Best Paper
  • 新進程:恭賀我校工程技術協同創新中心主任肖罡及其團隊多篇論文被...
    自2020年6月,江西應用科技學院工程技術協同創新中心成立以來,肖罡博士及其團隊全身心投入,在學術與實踐兩方面同時發力,穩步推進清潔能源應用技術研究突破,取得了多項專利成果,多篇論文被領域內權威雜誌收錄。
  • 1冠軍5亞軍1季軍,西電智能學子在ECCV 2020大顯身手
    DramaQA數據集DramaQA 競賽亞軍:郭志成、趙嘉璇在8月15日結束的GigaVision2020挑戰賽中,由焦李成教授,劉芳教授、屈嶸教授、侯彪教授、張小華副教授、劉旭博士、黃鐘健、李洋、張俊等博士生指導的學生團隊「尹淑婷、陳大帆、馬成聰慧、聶世超」獲得目標檢測賽道
  • 天大學子兩年申請9項專利和軟體著作權 ,2篇論文被錄用!
    天大學子兩年申請9項專利和軟體著作權 ,2篇論文被錄用!)天津市優秀學生校三好學生天津大學優秀共青團員建工學院第十五屆十佳傑出青年(提名)曾任天津大學土木工程學科國際同行評議會代表獲得39項校級及以上榮譽申請9項專利和軟體著作權2篇論文已被錄用