今日Paper | 問答系統;3D人體形狀和姿勢;面部偽造檢測;AdderNet等

2021-01-10 雷鋒網

為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。以下是今日的精選內容——

Reading Wikipedia to Answer Open-Domain Questions

Machine Learning from a Continuous Viewpoint

Score and Lyrics-Free Singing Voice Generation

Learning 3D Human Shape and Pose from Dense Body Parts

Face X-ray for More General Face Forgery Detection

Effective Data Augmentation with Multi-Domain Learning GANs

Job Prediction: From Deep Neural Network Models to Applications

Combining Deep Learning and Verification for Precise Object Instance Detection

A Gentle Introduction to Deep Learning for Graphs

AdderNet: Do We Really Need Multiplications in Deep Learning?

論文名稱:Reading Wikipedia to Answer Open-Domain Questions

作者:Danqi Chen /Adam Fisch /Jason Weston /Antoine Bordes

發表時間:2017/4/28

論文連結:https://paper.yanxishe.com/review/7918

推薦理由:本文建議使用Wikipedia作為獨特的知識源來解決開放域問題的解答:任何事實類問題的答案都是Wikipedia文章中的文本範圍。

大規模的機器閱讀任務將文檔檢索(查找相關文章)與機器理解文本(識別這些文章的答案範圍)的挑戰結合在一起。作者的方法將基於bigram哈希和TF-IDF匹配的搜索組件與經過訓練以檢測Wikipedia段落中的答案的多層遞歸神經網絡模型相結合。

作者在多個現有QA數據集上的實驗表明,(1)兩個模塊相對於現有同類產品都具有很高的競爭力;(2)使用遠程監督對其組合進行多任務學習是解決這一艱巨任務的有效完整系統。

論文名稱:Machine Learning from a Continuous Viewpoint

作者:E Weinan /Ma Chao /Wu Lei

發表時間:2019/12/30

論文連結:https://paper.yanxishe.com/review/7942

推薦理由:作為經典的數值分析和統計物理學的精神,作者提出了一種連續的機器學習形式,作為變化和微分積分方程的一個問題。作者證明了常規的機器學習模型和算法,例如隨機特徵模型,淺層神經網絡模型和殘差神經網絡模型,都可以作為不同連續公式的特定離散化而全部恢復。

作者還介紹了新模型的示例,例如基於流的隨機特徵模型,以及新算法(例如平滑粒子法和光譜法)的示例,這些新算法自然地源於這種連續公式。作者在文中討論了如何在此框架下研究泛化誤差和隱式正則化問題。

論文名稱:Score and Lyrics-Free Singing Voice Generation

作者:Liu Jen-Yu /Chen Yu-Hua /Yeh Yin-Cheng /Yang Yi-Hsuan

發表時間:2019/12/26

論文連結:https://paper.yanxishe.com/review/7944

推薦理由:用於唱歌聲音的生成模型主要與「唱歌聲音合成」的任務有關,即,根據樂譜和文本歌詞來產生唱歌聲音波形。

在本文中,作者探索了一種新穎而又具有挑戰性的替代方法:在訓練和推理時間中無需預先分配樂譜和歌詞的情況下演唱語音。特別是,作者提出了三種無條件或弱條件的歌聲生成方案。作者概述了相關的挑戰,並提出了解決這些新任務的渠道。這涉及開發用於數據準備的源分離和轉錄模型,用於音頻生成的對抗網絡以及用於評估的定製度量。

論文名稱:Learning 3D Human Shape and Pose from Dense Body Parts

作者:Zhang Hongwen /Cao Jie /Lu Guo /Ouyang Wanli /Sun Zhenan

發表時間:2019/12/31

論文連結:https://paper.yanxishe.com/review/7941

推薦理由:儘管通過最新的基於學習的方法獲得了令人鼓舞的結果,但從單眼圖像重建3D人體形狀和姿勢仍具有挑戰性。常見的不對齊是由於以下事實:從圖像到模型空間的映射是高度非線性的,並且人體模型的基於旋轉的姿勢表示易於導致關節位置的漂移。

在本文中,作者研究了從人體部位的密集對應關係中學習3D人體形狀和姿勢的問題,並提出了分解和聚合網絡(DaNet)來解決這些問題。DaNet採用密集的對應貼圖作為中間表示,以密集地在2D像素和3D頂點之間建立一座橋梁,以促進2D到3D映射的學習。DaNet的預測模塊被分解為一個全局流和多個局部流,以分別實現形狀和姿勢預測的全局和細粒度感知。來自本地流的消息被進一步聚合以增強對基於旋轉的姿勢的魯棒性預測,其中提出了位置輔助旋轉特徵細化策略以利用人體關節之間的空間關係。此外,還引入了基於零件的剔除(PartDrop)策略,以在訓練過程中從中間表示中剔除密集信息,從而鼓勵網絡專注於更多互補的身體部位以及相鄰的位置特徵。作者方法的有效性在室內和實際數據集(包括Human3.6M,UP3D和DensePose-COCO數據集)上均得到驗證。

實驗結果表明,與以前的最新方法相比,該方法顯著提高了重建性能。我們的代碼將通過此 URL(https://hongwenzhang.github.io/dense2mesh/)公開提供。       

論文名稱:Face X-ray for More General Face Forgery Detection

作者:Li Lingzhi /Bao Jianmin /Zhang Ting /Yang Hao /Chen Dong /Wen Fang /Guo Baining

發表時間:2019/12/31

論文連結:https://paper.yanxishe.com/review/7940

推薦理由:在本文中,作者提出了一種新穎的圖像表示形式,稱為面部X射線,用於檢測面部圖像中的偽造。輸入的面部圖像的面部X射線是灰度圖像,可顯示輸入圖像是否可以分解為來自不同來源的兩個圖像的混合。它通過顯示偽造圖像的混合邊界和不存在真實圖像的混合來實現。

作者觀察到,大多數現有的面部操作方法都有一個共同的步驟:將更改後的面部混合到現有的背景圖像中。因此,面部X射線提供了一種檢測大多數現有面部操縱算法所產生的偽造的有效方法。面部X射線的一般意義是僅假設存在混合步驟,並且不依賴於與特定面部操作技術相關的偽影的任何知識。事實上,確實可以訓練用於計算面部X射線的算法且無需使用任何最新的面部操縱方法生成的偽造圖像。大量的實驗表明,當將X射線應用於由看不見的面部操縱技術產生的偽造時,面部X射線仍然有效,而大多數現有的面部偽造檢測算法的性能都會明顯下降。

論文名稱:Effective Data Augmentation with Multi-Domain Learning GANs

作者:Yamaguchi Shin'ya /Kanai Sekitoshi /Eda Takeharu

發表時間:2019/12/25

論文連結:https://paper.yanxishe.com/review/7934

推薦理由:這篇論文考慮的是數據增強的問題。

這篇論文提出了一種有效的基於生成對抗網絡)的數據增強方法,其主要思想是通過使用多領域學習GAN將外部數據所包含的知識導入到目標模型中。多領域學習GAN能夠同時學習外部數據集和目標數據集,並能夠為目標任務生成高保真度和多樣性強的新樣本。文章表明即使只有極少量的目標數據集,研究人員也可以通過使用這些新生成的樣本來獲得目標任務的準確模型。這篇論文在CIFAR-100, FGVC-Aircraft和Indoor Scene Recognition這三個數據集上評估了其提出的數據增強方法,表明了它具有更好的分類準確性,並且能夠提高所生成樣本的質量。

論文名稱:Job Prediction: From Deep Neural Network Models to Applications

作者:Van Huynh Tin /Van Nguyen Kiet /Nguyen Ngan Luu-Thuy /Nguyen Anh Gia-Tuan

發表時間:2019/12/27

論文連結:https://paper.yanxishe.com/review/7937

推薦理由:這篇論文考慮的是基於簡歷信息判斷工作勝任程度的問題。

如何根據簡歷上的信息,例如學歷、技能描述等,來判斷一份工作是否適合求職者是一個困難的自然語言處理問題。反過來,公司挑選最適合這份工作的人才也是困難的。這篇論文嘗試利用不同的深度神經網絡模型來學習預測職業,這些模型包括TextCNN,Bi-GRU-LSTM-CNN,以及Bi-GRU-CNN,並用到了基於網際網路職業數據集訓練的多種預訓練詞嵌入。這篇論文還提出一種簡單但高效的集成模型以包含不同的深度神經網絡模型。實驗結果表明,所提方法獲得了最高為72.71%的F1值。

這篇論文試圖利用自然語言處理的技術來幫助網際網路上的求職者找到更適合自己的職業發展方向。

論文名稱:Combining Deep Learning and Verification for Precise Object Instance Detection

作者:Ancha Siddharth /Nan Junyu /Held David

發表時間:2019/12/27

論文連結:https://paper.yanxishe.com/review/7928

推薦理由:深度學習對象檢測器通常會以很高的置信度返回誤報。儘管它們優化了通用檢測性能,例如平均平均精度(mAP),但它們並不是為可靠性而設計的。對於可靠的檢測系統,如果進行了高置信度檢測,作者將希望高度確定確實已檢測到對象。為此,作者開發了一套驗證測試,建議的檢測必須通過該測試才能被接受。

作者建立了一個理論框架,可以證明在某些假設下,作者的驗證測試不會接受任何誤報。基於此框架的近似值,作者提出了一種實用的檢測系統,該系統可以高精度地驗證基於機器學習的對象檢測器的每次檢測是否正確。作者表明,這些測試可以提高基本檢測器的整體精度,並且公認的示例很有可能是正確的。這允許檢測器在高精度狀態下操作,因此可以作為可靠的實例檢測方法用於機器人感知系統。

論文名稱:A Gentle Introduction to Deep Learning for Graphs

作者:Bacciu Davide /Errica Federico /Micheli Alessio /Podda Marco

發表時間:2019/12/29

論文連結:https://paper.yanxishe.com/review/7947

推薦理由:圖形數據的自適應處理是一個長期存在的研究主題,最近已被整合為深度學習社區的主要興趣主題。相關研究的數量和廣度迅速增加是以缺乏知識的系統化和對早期文獻的關注為代價的。

本文中作者的這項工作旨在作為圖的深度學習領域的教程介紹。相對於對最新文獻的闡釋,它主張對主要概念和體系結構方面進行一致且漸進的介紹,讀者可參考其中的可用調查。本文對問題進行了自上而下的研究,介紹了一種基於局部和迭代方法來結構化信息處理的圖形表示學習的廣義公式。它介紹了基本的構建基塊,可以將其組合起來設計出新穎而有效的圖形神經模型。方法論的闡述是對本領域有趣的研究挑戰和應用的討論的補充。

 【北大/諾亞/鵬城/悉大】AdderNet:能否讓深度學習擺脫乘法運算?

論文名稱:AdderNet: Do We Really Need Multiplications in Deep Learning?

作者:Chen Hanting /Wang Yunhe /Xu Chunjing /Shi Boxin /Xu Chao /Tian Qi /Xu Chang

發表時間:2019/12/31

論文連結:https://paper.yanxishe.com/review/7948

推薦理由:這是一篇來自華為諾亞方舟實驗室的論文,於2020年1月1日上線arXiv。本文探究的目標為更高效的深度卷積神經網絡。(似乎稱作「模型壓縮」不太妥當?因為參數量、運算量、參數精度都未減少,但是將乘法替代為加法為推斷效率提供了極大的增長空間)

為了提升深度神經網絡的運行效率、減少不必要的運算,常見的方法有網絡剪枝、知識蒸餾等等。本文則另闢蹊徑,嘗試讓卷積神經網絡擺脫乘法而只使用高效的加法運算。

卷積神經網絡的實現中,卷積運算是通過卷積核與輸入特徵的互相關(cross-correlation)運算實現的,而這涉及大量浮點數的乘法運算——要知道,計算機完成一次32位浮點乘法運算往往是加法運算的幾倍!如果能將互相關運算替代為效果相近而僅涉及加法的運算,豈不是可以極大地提升CNN的運行效率?                     

32位浮點運算的相對能耗

那麼問題來了:互相關的本質是什麼呢?是衡量卷積核與輸入特徵的相似度。這裡,作者大膽地使用L1距離的相反數代替互相關運算,作為衡量相似度的另一種途徑。

使用互相關實現的卷積運算,X為輸入特徵,F為卷積核,S()為乘法,Y為層的輸出

將S()換為L1距離

那麼問題又來了:模型如何通過反向傳播優化?如果對L1距離求導,那麼結果只能是0和±1(認為L1距離等於0時導數為0),相當於對X(m+i,n+j,k)-F(i,j,k,t)求的符號函數——這並不能很好地使得模型向最優的方向優化。因此,作者在這裡使用了X與F的差作為每層「卷積」核的梯度進行反傳:         

同樣,X也需要梯度來回傳至上層,而且與F的梯度不同的是:這個梯度還會影響到上面的所有的層(存在梯度爆炸的可能性),更需要精心的設計。因此,在這裡作者使用了HardTanh(即將y=x用±1截斷,防止梯度過大)使得梯度值(F-X)處於±1範圍之內。

除此之外,本文還提出了針對加法網絡的自適應性學習率調整策略。將所有卷積層替換為加法層的AdderNet-ResNet50在ImageNet上達到了74.9%的Top-1準確率和91.7%的Top-5準確率(使用乘法運算實現卷積的ResNet50準確率才不過76.2%和92.9%),在性能損失極少的條件下大大地減少了運算時間。

註:儘管卷積層完全未使用乘法,AdderNet-ResNet50仍然在層間採用了涉及乘法運算的批歸一化(Batch Normalization)(畢竟L1距離的相反數一定是非正的)。但是與卷積層的乘法運算相比,批歸一化的乘法運算量完全不在一個數量級上,因此可以被忽略不計。

雷鋒網(公眾號:雷鋒網)雷鋒網雷鋒網

相關文章:

Paper 研習社每日精選論文推薦 12.31

Paper 研習社每日精選論文推薦 12.30

Paper 研習社每日精選論文推薦 12.27

Paper 研習社每日精選論文推薦 12.26

Paper 研習社每日精選論文推薦 12.25

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 今日Paper|TRANSFORMER結構;圖像到圖像翻譯;缺失標註目標檢測解決...
    這個新方法由4個關鍵組成部分組成:1、實施詞性標註以過濾掉給定描述中的非語義詞;2、採用仿射組合模塊來有效融合不同形式的文本和圖像特徵;3、一種新的精細多級架構,以增強判別器的判別能力和生成器的糾正能力;4、一種新的結構損失,進一步提升了判別器的性能,以更好地區分真實圖像和合成圖像。COCO數據集上的實驗表明了這篇論文提出的方法在視覺真實性和語義一致性方面均具有出色的性能表現。
  • 科學證實人體精微能量系統的存在
    就我們自身而言,除了看得見的身體,還客觀存在著看不見的精微能量系統,主要包括三條經脈Nadis和七個輪穴Chakras,他們構成了人體內精微能量運作的網絡系統,照管著人的身體、情緒、精神等層面。「輪穴」一詞由印度的詞彙Chakra翻譯而來,就是精微能量順時針像輪子一樣旋轉形成人體內的能量中心,故稱之為「輪穴」。
  • Carbon利用3D列印數字光合成技術,快速鼻咽拭子用於COVID-19檢測
    介紹新型冠狀病毒病(2019 - COVID-19)是由新出現的高傳染性冠狀病毒SARS-CoV-2引起的,可侵入呼吸道、肺部等器官系統。病毒感染的快速檢測對於準確跟蹤和緩解疫情傳播至關重要(1)。大規模推廣COVID-19檢測的一個主要障礙是缺乏用於收集病毒樣本的鼻咽拭子。最大的NP棉籤製造商之一位於義大利倫巴第,這是歐洲受COVID-19影響最嚴重的地區之一(2)。
  • 駐杜拜總領館:2人偽造新冠檢測報告,將嚴肅追究其相應法律責任
    駐杜拜總領館網站11月17日消息,駐杜拜總領館就兩起偽造新冠病毒檢測報告事件發布通報: 為減少新冠肺炎疫情跨境傳播,中國駐阿聯使領館於近日發布通知,自2020年11月7日起,自阿聯出發,搭乘航班赴華的中、外籍乘客,須憑新冠病毒核酸和血清IgM抗體雙陰性證明,申領帶「HS」標識的綠色健康碼或健康狀況聲明書。
  • 全球首例,Adversarial T-shirt讓你在AI目標檢測系統中隱身
    目前該文章已經被 ECCV 2020 會議收錄為 spotlight paper(焦點文章)。論文連結:https://arxiv.org/pdf/1910.11099.pdf在人臉識別和目標檢測越來越普及的今天,如果說有一件衣服能讓你在 AI 檢測系統中「消失無形」,請不要感到驚訝。
  • 駕駛漏檢車 還想用偽造駕駛證矇混過關?
    駕駛漏檢車 還想用偽造駕駛證矇混過關?執勤交警進一步調查發現,該車駕駛人出示的機動車駕駛證存在偽造嫌疑,系統也無法查詢到該駕駛人的信息。執勤交警依法扣留其車輛並傳喚駕駛人作進一步詢問。
  • 【健康小貼士】_政務_澎湃新聞-The Paper
    岔氣多由迸氣用力、姿勢不當、筋肉過度牽拉導致,從而引起氣機阻滯、經絡受阻。中醫認為,不通則痛,這時人體就會發出警告信號——岔氣。支溝穴是手少陽三焦經的經穴(十二經脈各有一個經穴,位置多在腕﹑踝關節附近),其循行路線從鎖骨上窩(缺盆)進入胸腔,分布在羶中(兩乳之間),脈氣散布聯絡心包,向下貫穿膈肌。而我們岔氣的部位正是在肋間及膈肌,為手少陽三焦經主管。
  • 面部算法分析能否窺測你的內心?
    目前甚囂塵上的研究認為人的頭部和臉部形狀能夠揭示性格特徵,與被遺棄已久的面相偽科學有著令人不安的相似性。現在,計算機更擅長於掃描人體生理學上微小的細節,現代研究人員由此認為,他們所得出的推論更加可靠。而在另一面,批評者認為這純屬無稽之談。他們指出,幾乎沒有證據表明,外在的身體特徵或其他特徵能夠預測行為。
  • 環境空氣顆粒物(PM10和PM2.5)連續自動監測系統技術要求及檢測方法...
    【能源人都在看,點擊右上角加'關注'】北極星環境監測網訊:各有關單位:為貫徹《中華人民共和國環境保護法》,保護生態環境,保障人體健康,提高生態環境管理水平,規範生態環境監測工作,我部決定製定《環境空氣顆粒物(PM10和PM2.5)連續自動監測系統技術要求及檢測方法》
  • 阿里巴巴達摩院黑科技再次亮相雲棲大會--【足幫幫】3D腳型掃描儀
    「足幫幫」阿里巴巴達摩院,率先打造3D足部建模檢測,AR體驗的智能製造的一雲四端解決方案。基於三維視覺AI技術實現足部健康還原檢測,致力於用人工智慧技術實現鞋類企業的降本增效,配合行業科研和醫療健康產業的方案升級。
  • 「金字塔」 觸發核輻射檢測系統警報!瑞宏能量公司涉嫌傳銷
    上周五錢江海關駐郵局辦事處的通道式核輻射監測系統發出了警報聲,工作人員立刻停止作業,第一時間啟動應急預案並按照預案做好防護措施,在現場實施封控,疏散郵政人員,就地對觸發報警系統的郵包開箱進行放射性檢測。
  • 男女面部骨骼特徵
    今天跟大家分享一下男女及不同人種面部骨骼結構的差異。我們先來看一下整體,頭部可以簡單劃分為頭頂、前額、顳部及面部四大面,今天主要來講不同性別、人種面部五官結構的特徵。首先強調一個問題,顳部與前額、頭頂交界的位置叫顳線,畫額頭的時候要注意這個轉折,這是分開正面和側面的重要位置,一定要注意這裡的光影變化。
  • 駐日使領館指定檢測機構名單更新
    具體要求請見《關於自日本搭乘航班赴華人員須憑健康碼登機的最新通知》和《申請健康碼常見問題》。為進一步規範檢測方式,降低疫情跨境傳播風險,中國駐日本使領館對現有檢測機構做出部分調整。自2021年1月10日(含)起,赴華乘客需在新版指定機構名單(請點擊底部「閱讀原文」查看附件)中選擇檢測機構進行「雙檢測」。
  • 古代的聖旨都是黃色的嗎 8月26日螞蟻莊園今日問答
    古代的聖旨都是黃色的嗎 8月26日螞蟻莊園今日問答時間:2020-08-25 23:45   來源:今日頭條   責任編輯:毛青青 川北在線核心提示:原標題:古代的聖旨都是黃色的嗎 8月26日螞蟻莊園今日問答 古代的聖旨都是黃色的嗎,8月26日螞蟻莊園今日問答,歡迎大家來到這裡,能進來的小夥伴都有玩螞蟻莊園的,支付寶螞蟻莊園每天都會在小課堂更新一道題目
  • 什麼檢測系統能夠查重日文論文
    國內有很多外國語學校針對於寫論文也是有語言的標準通常情況下要用自己的語言進行擬寫,那麼日文論文檢測用什麼檢測好?學術家論文查重:www.xueshujia.com針對於日文論文國內大多數的學校都是選擇使用知網論文查重檢測系統對日文論文進行查重檢測,在查重檢測語種的範圍上並不是可以查重檢測中文的論文
  • 3d常見知識科普二:3d眼鏡的類型
    說的3d眼鏡,細心的朋友可能發現,有的眼鏡很薄,有的眼鏡很厚重,需要充電。這是為什麼呢?與什麼有關呢?其實3d眼鏡的類型,和播放設備有關。首先,3d眼鏡主要分為三兩種:1,快門式快門式需要充電,工作原理是左右眼同一時間只有其中一隻眼可以看到,另一隻眼被擋住,通過快速的交替產生視覺延遲,產生3d的效果。快門式的優點是色彩還原度高,亮度損失少,缺點就是因為在不停閃爍(雖然肉眼感覺不到),眼睛容易疲勞。2,偏光式不用充電,可以做的很薄,攜帶方便。
  • 人體免疫系統動畫片—人體內的四大名捕,有創意
    原標題:人體免疫系統動畫片—人體內的四大名捕,有創意 (馬上點標題下藍字"高中生物"關注可獲取更多學習方法、乾貨) 精彩文章 |
  • 窺視人體內部:迄今最詳細人體解剖照片
    她的父親大衛·巴塞特當時是華盛頓大學的解剖專家,他用17年時間,創造出被認為是最詳細的人體圖片,不僅有人體外表照片,還有內臟照片,甚至有立體圖片。 巴塞特合作夥伴名叫威廉·格魯比爾。格魯比爾是「視覺大師」的發明人,這是一個三維視圖系統,並在60年代被一家公司開發成玩具。1962年,巴塞特創作出25卷「人體解剖立體圖」。這些圖片立即引起轟動,成為醫學院學生的重要資源。
  • 從人體面部器官動態看吉凶徵兆
    張鑫龍/文 中國傳統民俗認為,人體的面部器官在一天之中的動態是冥冥之中吉凶徵兆的外在表現
  • 自動監控設備留「漏洞」,安徽一公司涉嫌偽造監測數據被查
    自動監控設備留「漏洞」,安徽一公司涉嫌偽造監測數據被查 微信公眾號「安徽生態環境」 2019-08-05 21:47