Paper 研習社每日精選論文推薦 12.30 - 雷鋒網

2021-01-08 雷鋒網

Hi 歡迎來到Paper 研習社每日精選欄目,Paper 研習社(paper.yanxishe.com)每天都為你精選關於人工智慧的前沿學術論文供你參考,以下是今日的精選內容——

目錄

Scalable Fine-grained Generated Image Classification Based>Merging Weak and Active Supervision for Semantic ParsingDetecting GAN generated errorsA Billion Ways to Grasp: An Evaluation of Grasp Sampling Schemes>Look, Read and Feel: Benchmarking Ads Understanding with Multimodal Multitask LearningImproved Mixed-Example Data AugmentationA Baseline for Few-Shot Image Classificatio Mixup Inference: Better Exploiting Mixup to Defend Adversarial AttacksExtracting urban water by combining deep learning and Google Earth EngineFacial Synthesis from Visual Attributes via Sketch using Multi-Scale Generators

基於深度度量學習的可擴展細粒度生成圖像分類

Scalable Fine-grained Generated Image Classification Based>作者:Xuan Xinsheng /Peng Bo /Wang Wei /Dong Jing

發表時間:2019/12/10

論文連結:https://paper.yanxishe.com/review/7899

推薦理由:最近,生成的圖像可以達到非常高的質量,即使人眼也無法分辨真實圖像。儘管目前在法醫界已經有一些檢測生成圖像的方法,但是這些方法大多數都用於檢測生成圖像的一種類型。生成的新型圖像層出不窮,現有的檢測方法無法很好地應對。這些問題促使作者提出了一種基於深度度量學習的可擴展的多類別分類框架,旨在對生成的圖像進行更好的分類。

此外,作者增加了框架的可伸縮性,以應對不斷湧現的新型生成圖像,並通過微調使模型對新型生成數據獲得更好的檢測性能。

合併弱監督和主動監督以進行語義解析

Merging Weak and Active Supervision for Semantic Parsing

作者:Ni Ansong /Yin Pengcheng /Neubig Graham

發表時間:2019/11/29

論文連結:https://paper.yanxishe.com/review/7900

推薦理由:語義解析器將來自用戶的自然語言命令(NL)映射到可執行的含義表示(MR),然後在特定環境中執行這些以獲得所需的結果。對此類解析器的全監督培訓需要NL / MR對,並由領域專家進行注釋,這使得收集它們的成本很高。

但是,僅從成對的NL和預期的執行結果中學習了弱監督的語義解析器,從而使MR變得很隱蔽。雖然薄弱的監督成本較低,但是從這些投入中學習仍然很困難。它要求解析器以非常弱的學習信號搜索較大的空間,並且很難避免以錯誤的方式獲得正確答案的虛假MR。這些因素導致在弱監督和全監督環境下訓練的解析器之間的性能差距。

為了彌合這一差距,作者研究了弱監督與主動學習之間的交集,這使學習者可以主動選擇示例並查詢人工注釋作為額外的監督,以改進在弱監督下訓練的模型。本文研究了用於選擇示例進行查詢的各種主動學習啟發式方法,以及針對此類查詢的各種形式的額外監督。作者在兩個不同的數據集上評估了其方法的有效性。WikiSQL上的實驗表明,通過僅注釋1.8%的示例,作者將最新的弱監督基線提高了6.4%,達到了79.0%的準確度,與經過訓練的模型僅相距1.3%在充分監督下。在WikiTableQuestions上使用人工注釋器進行的實驗表明,作者的方法僅使用100個活動查詢就可以提高性能,尤其是對於從冷啟動中學到的弱監督解析器。

檢測GAN產生的錯誤

Detecting GAN generated errors

作者:Zhu Xiru /Che Fengdi /Yang Tianzi /Yu Tzuyang /Meger David /Dudek Gregory

發表時間:2019/12/2

論文連結:https://paper.yanxishe.com/review/7901

推薦理由:儘管最新的GAN在生成超逼真的圖像方面具有令人印象深刻的性能,但GAN鑑別器仍然難以評估單個生成樣本的質量。這是因為評估所生成圖像的質量的任務不同於確定圖像是真實的還是偽造的。生成的圖像可能很完美,除了在單個區域之外,但仍被檢測為偽造的。

相反,作者提出了一種新穎的方法來檢測生成的圖像中錯誤的位置。通過將實際圖像與生成的圖像進行比較,作者為每個像素計算其屬於真實分布還是生成的分布。此外,作者利用注意力來建立遠程依賴模型。這允許檢測局部上合理但不是整體上的錯誤。

為了進行評估,作者表明,與FID和IS不同,實驗的錯誤檢測可以作為單個圖像的質量指標。作者利用改進的Wasserstein,BigGAN和StyleGAN來顯示基於本文的指標的排名與FID分數有著顯著的相關性。

作者的工作為更好地了解GAN以及從GAN模型中選擇最佳樣本的能力打開了大門。

十億種方式:基於密集的,基於物理的抓取數據集的抓取採樣方案的評估

A Billion Ways to Grasp: An Evaluation of Grasp Sampling Schemes>作者:Eppner Clemens /Mousavian Arsalan /Fox Dieter

發表時間:2019/12/11

論文連結:https://paper.yanxishe.com/review/7902

推薦理由:機器人抓取通常被公式化為學習問題。隨著物理仿真速度和質量的提高,生成用於學習算法的大規模抓取數據集變得越來越流行。一個經常被忽略的問題是如何生成構成這些數據集的掌握信息。

在本文中,作者回顧,分類和比較了不同的抓取抽樣策略。作者的評估基於SE(3)的細粒度離散化,並使用基於物理的模擬來評估相應的平行下頜抓握的質量和魯棒性。具體來說,作者認為YCB數據集中的21個對象中的每個對象都擁有超過10億個抓取。這個密集的數據集使作者可以評估現有的採樣方案w.r.t. 他們的偏見和效率。

作者的實驗表明,一些流行的採樣方案包含很大的偏差,並且沒有涵蓋可以抓住物體的所有可能方式。

看,讀和感覺:用多模態多任務學習對廣告的理解進行基準測試

Look, Read and Feel: Benchmarking Ads Understanding with Multimodal Multitask Learning

作者:Zhang Huaizheng /Luo Yong /Ai Qiming /Hou Nana /Wen Yonggang

發表時間:2019/12/21

論文連結:https://paper.yanxishe.com/review/7892

推薦理由:這篇論文要解決的是廣告內容理解的問題。

由於廣告行業的巨大市場和在線多媒體內容(如視頻)的急劇增長,將廣告與多媒體內容一起推廣的方式逐漸流行起來。然而要為提供的內容找尋相應的廣告將耗費大量人力,因此一些自動化的廣告技術發展起來。為了進一步提升用戶體驗,理解廣告的主題與情感是必要的。這篇論文的貢獻在於提出了一種新的深度多模態多任務框架,來整合多個模態以獲得目標廣告的有效主題與情感,使得理解更容易。具體而言,所提模型首先從廣告裡抽取多模態信息並學習一個高層級和可比較的表示向量。廣告的可視化元素在無監督的情況下解碼,獲得的特徵隨後被帶入所提的分層多模態注意力模塊中,用以學習為了作出最終預測而在特定任務下獲得的表示向量。另外,這篇論文還設計了一個多任務損失函數來聯合訓練主題與情感預測模型。在最新與最大規模的廣告數據集上的實驗表明所提方法取得了最佳效果。

改進的混合示例數據增強

Improved Mixed-Example Data Augmentation

作者:Summers Cecilia /Dinneen Michael J.

發表時間:2018/5/29

論文連結:https://paper.yanxishe.com/review/7909

推薦理由:為了減少過擬合,通常會使用數據增強來訓練神經網絡,這是通過現有訓練實例的保留標籤的變換人工生成額外訓練數據來完成的。儘管這些類型的轉換具有直覺上的意義,但最近的工作表明,即使是不保留標籤的數據增強也很有效果,它通過實例對的線性組合實現數據擴充。儘管它們有效,但對於這種方法為何起作用知之甚少。

在這項工作中,作者旨在探索這種類型的數據增強的一種新的更通用的形式,以確定這種線性是否必要。通過考慮「混合實例數據增強」的更廣泛範圍,作者發現了實用增強技術的更大空間,其中包括對現有技術進行改進的方法。這種概括所帶來的好處超出了提高性能的希望,它揭示了許多混合實例數據增強類型,這些類型與先前工作中所考慮的完全不同,這提供了證據表明此類方法有效性的理論是不完整的,並表明任何這樣的理論都必須解釋更廣泛的現象。

小樣本圖像分類的基準

A Baseline for Few-Shot Image Classification

作者:Dhillon Guneet S. /Chaudhari Pratik /Ravichandran Avinash /Soatto Stefano

發表時間:2019/9/6

論文連結:https://paper.yanxishe.com/review/7912

推薦理由:對經過標準交叉熵損失訓練的深度網絡進行微調是進行小樣本學習的一個強基準。如果對它們進行傳導性微調,它的性能將優於標準數據集(如Mini-Imagenet,Tiered-Imagenet,CIFAR-FS和FC-100)中具有相同超參數的最新技術。

這種方法的簡單性使作者能夠在Imagenet-21k數據集上演示最初的幾次學習結果。

作者發現使用大量的元訓練類,即使對於大量的測試類,也能獲得極高的準確率。作者不提倡他們的方法作為小樣本學習的解決方案,而只是使用結果突出顯示當前基準和小樣本學習的局限性。作者對基準數據集進行了廣泛的研究,以提出量化測試集「硬度」的指標。此度量標準可用於以更系統的方式說明小樣本學習算法的性能。

Mixup推論:更好地利用Mixup來防禦對抗性攻擊

Mixup Inference: Better Exploiting Mixup to Defend Adversarial Attacks

作者:Pang Tianyu /Xu Kun /Zhu Jun

發表時間:2019/9/25

論文連結:https://paper.yanxishe.com/review/7913

推薦理由:人們已經普遍認識到,對抗性的實例可以很容易地被用來愚弄深層網絡,而深層網絡的愚弄主要來源於輸入實例附近的局部非線性行為。

在訓練過程中應用mixup,可以有效地提高泛化性能和模型的魯棒性,在訓練實例之間引入全局線性行為。然而,在以往的工作中,混合訓練模型只是通過直接對輸入進行分類,被動地防禦對抗性攻擊,而誘導的全局線性並沒有得到很好的利用。也就是說,由於對抗擾動的局部性,通過模型預測的全局性主動打破局部性將更為有效。

在簡單幾何直覺的啟發下,作者發展了一種用於混合訓練模型的推理原理,稱為混合推理(MI)。MI將輸入與其他隨機乾淨的樣本混合,如果輸入是對抗性的,則可以收縮並傳遞等效擾動。

作者在CIFAR-10和CIFAR-100上的實驗表明,MI可以進一步提高mixup及其變形訓練的模型的對抗魯棒性。

結合深度學習和谷歌地球引擎提取城市水系

Extracting urban water by combining deep learning and Google Earth Engine

作者:Wang Y. D. /Li Z. W. /Zeng C. /Xia G. S. /Shen H. F.

發表時間:2019/12/23

論文連結:https://paper.yanxishe.com/review/7895

推薦理由:這篇論文要解決的是城市水系信息提取的問題。

城市水系對於城市生態而言至關重要。使用遠程感知數據的精準高效水系檢測對城市規劃與管理有著顯著作用。這篇論文提出了一種新方法來結合谷歌地球引擎和多粒度卷積神經網絡,通過離線訓練與預測的方式,從陸地衛星圖像中抽取城市水系信息。

這是一篇深度學習應用於水利行業的應用,可以啟發更多計算機技術在其他領域應用的研究。

基於多尺度生成器的基於草圖的視覺屬性人臉合成

Facial Synthesis from Visual Attributes via Sketch using Multi-Scale Generators

作者:Di Xing /Patel Vishal M.

發表時間:2019/12/17

論文連結:https://paper.yanxishe.com/review/7894

推薦理由:這篇論文要解決的是人臉合成的問題。

從視覺屬性自動合成人臉對於計算機視覺領域而言是個重要的任務,並在法律與娛樂方面都有廣泛的落地場景。隨著深度生成卷積神經網絡的發展,從屬性合成人類圖像和文本描述的研究已有不少工作。這篇論文則是將這個問題為一個分階段學習問題:首先基於可視化屬性合成面部草圖,然後基於合成的草圖生成面部圖像。所提框架基於兩個不同的生成對抗網絡:1. 一個草圖生成網絡,以從輸入屬性中合成真實的草圖;2. 一個面部生成器,從合成的草圖中合成人臉圖像。擴展實驗證明了所提方法的有效性。

雷鋒網雷鋒網雷鋒網

相關焦點

  • Paper 研習社本周論文推薦精選 | 第二期
    「本周論文推薦精選」是 Paper 研習社推出的全新欄目,展現社友們在研習論文的過程中,推薦自己所閱讀到的優秀論文,幫助大家一起學習、討論每個領域最新、最精彩的學術論文。論文連結:https://www.ijcai.org/proceedings/2019/0514.pdf推薦人:琴•福克納 (清華大學信息與通信工程,Paper 研習社特約作者)②#計算機視覺#【
  • 今日Paper | 新聞推薦系統;多路編碼;知識增強型預訓練模型等
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI 研習社重磅推出【今日 Paper】欄目,每天都為你精選關於人工智慧的前沿學術論文供你學習參考。Thesis]作者:Moreira Gabriel de Souza Pereira發表時間:2019/12/29論文連結:https://paper.yanxishe.com/review/9113?
  • arXiv 每日論文集 190 篇 02.19 更新
    今日 arXiv 論文集「今日 arXiv 論文集」是 AI 研習社論文板塊推出的全新欄目,每日為你自動抓取arXiv上更新的論文並且按照不同領域分類打包成集,方便社區用戶以最快的速度,最便捷的方式一件打包下載學術成果,獲取知識養分。
  • 今日Paper|人臉數據隱私;神經符號推理;深度學習聊天機器人等
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。
  • 今日Paper|小樣本學習;視覺情感分類;神經架構搜索;自然圖像摳像等
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI 研習社重磅推出【今日 Paper】欄目,每天都為你精選關於人工智慧的前沿學術論文供你學習參考。>發表時間:2020/1/12論文連結:https://paper.yanxishe.com/review/8988?
  • 今日Paper | TRANSFORMER結構;圖像到圖像翻譯;缺失標註目標檢測...
    論文名稱:Image-to-Image Translation with Text Guidance作者:Li Bowen /Qi Xiaojuan /Torr Philip H. S. /Lukasiewicz Thomas發表時間:2020/2/12論文連結:https://paper.yanxishe.com/review/11541?
  • 今日Paper | 可視問答模型;神經風格差異轉移;圖像壓縮系統 ;K-SVD...
    /Barnes Nick發表時間:2020/1/20論文連結:https://paper.yanxishe.com/review/9627?from=leiphonecolumn_paperreview0211推薦原因這篇論文考慮的是視覺問答的問題。
  • 今日Paper|可視問答模型;神經風格差異轉移;圖像壓縮系統;K-SVD...
    from=leiphonecolumn_paperreview0211推薦原因這篇論文了介紹一種自動創建字體的方法,找到兩種不同字體之間的字體樣式差異,並使用神經樣式轉移將其轉換為另一種字體。這篇論文提出了一種新的神經風格差異和內容差異損失神經風格轉移方法。根據這些損失,可通過在字體中添加或刪除字體樣式來生成新字體。
  • 今日Paper | 跨模態行人重識別;對抗時尚遷移;學會注意錯誤;凸混合...
    from=leiphonecolumn_paperreview0311推薦原因本文主要是解決紅外線-RGB跨模態行人重識別的問題。from=leiphonecolumn_paperreview0311推薦原因形狀匹配 (Shape Matching) 是計算機視覺、圖形學等眾多領域的基本問題,其主要是研究如何在兩個形狀之間建立對應的問題。
  • 今日Paper | 多人姿勢估計;對話框語義分析;無監督語義分析;自然...
    論文名稱:Grounded Unsupervised Semantic Parsing作者:Hoifung Poon發表時間:2017/5/13論文連結:https://paper.yanxishe.com/review/9234推薦原因核心問題:這是一篇做語義解析的工作,具體來說就是通過無監督的方式,將自然語言轉成精準的資料庫查詢
  • 300篇 CVPR 2019 Oral 論文精選匯總,值得一看的 CV 論文都在這裡
    今年有超過 5165 篇的大會論文投稿,最終錄取 1299 篇,其中 Oral 論文近 300 篇。為了方便社區開發者和學術青年查找和閱讀高價值論文,AI 研習社從入選的 Oral 論文中,按應用方向挑選了部分精華論文,貼在本文。
  • 清華大學豈凡超:義原的介紹和義原的自動推薦 | AI 研習社第 76 期...
    近日,在雷鋒網 AI 研習社公開課上,清華大學計算機系在讀博士豈凡超就分享了採用機器學習的方法為中文新詞自動推薦義原,並進一步為其他語言的詞語推薦義原。公開課回放視頻網址:http://www.mooc.ai/open/course/555?
  • 今日Paper|梯度剪切;命名實體識別;自然語言處理;免強度函數學習等
    論文連結:https://paper.yanxishe.com/review/10858?from=leiphonecolumn_paperreview0212推薦原因核心問題:本文是完成是nlp領域中經典的命名識別識別的問題,本論文可以說是承上啟下的作用,它的做法改變了之前的做法,並且之後的很多任務都是使用這樣的基本結構。
  • arXiv 每日論文集 107 篇 02.18 更新
    「今日 arXiv 論文集」是 AI研習社論文板塊推出的全新欄目,每日為你自動抓取arXiv上更新的論文並且按照不同領域分類打包成集,方便社區用戶以最快的速度,最便捷的方式一件打包下載學術成果,獲取知識養分。
  • 今日Paper|2019-nCoV傳播預測;行人重識別;協同時態建模;舞蹈生成等
    of 2019-nCoV Transmission Ending via Comprehensive Methods作者:Zeng Tianyu /Zhang Yunong /Li Zhenyu /Liu Xiao /Qiu Binbin發表時間:2020/2/12論文連結:https://paper.yanxishe.com/review/11431?
  • 今日Paper|動態圖像檢索;實時場景文本定位;感知場景表示;雙重網絡等
    from=leiphonecolumn_paperreview0303推薦原因這篇論文被CVPR 2020接收,考慮的是基於草圖的細粒度圖像檢索,即在給定用戶查詢草圖的情況下檢索特定照片樣本的問題。繪製草圖花費時間,且大多數人都難以繪製完整而忠實的草圖。
  • 今日Paper|縮放神經網絡;形變的LSTM;知識圖譜複雜問答;陰影著色等
    from=leiphonecolumn_paperreview0310推薦原因這是百度發表在AAAI 2020上的工作,用於估計遠處和被遮擋物體的3D姿勢檢測問題。這篇論文提出了一個名為ZoomNet的新型框架,用於對3D立體圖像進行對象檢測任務。
  • 今日Paper|動態手勢識別;領域獨立無監督學習;基於BERT的在線金融...
    /Li Yuqi /Xie Xijiong發表時間:2019/12/31論文連結:https://paper.yanxishe.com/review/9221這篇論文要解決的是手勢識別問題。>發表時間:2020/1/14論文連結:https://paper.yanxishe.com/review/9219推薦原因這篇論文通過級聯語音增強和說話人處理,提出了一個新的說話人識別模型,在語音信號被噪聲破壞時提高說話者識別模型的性能表現
  • ...AI研習社定製雙肩包和保溫杯?邀請朋友學習「CMU 深度學習課程...
    自 AI 研習社「小組」產品上線以來,收穫了很多社區用戶的支持,同時也得到了大量的意見和建議。所以,為了幫助社區用戶認識更多有技術有想法的朋友,為了讓社區用戶更好地相互學習,AI 研習社決定發起「邀朋友,送福利」活動 —— 自本文發布之時起,到 11 月 26 日(下周一)晚 12 點為止,小組邀請榜單前 15 名用戶將會獲得 AI 研習社提供的大量福利獎品。
  • 今日Paper|模態平衡模型;組合語義分析;高表達性SQL查詢;多人姿態...
    推薦原因這篇論文考慮的是視覺對話問題。>論文連結:https://paper.yanxishe.com/review/9324這篇論文研究的是深度神經網絡的對抗性攻擊。發表時間:2017/1/5論文連結:https://paper.yanxishe.com/review/9239推薦原因核心問題:SQL語言具有特定的語法結構,這就導致要想熟練使用SQL語言需要較高的門檻,本論文就是解決這個問題,