目錄
用於語義場景完成的3D門控遞歸融合
用於大姿態人臉正面化的雙注意力GAN
Universal-RCNN:基於可轉移圖R-CNN的通用目標檢測器
用於圖像深度估計的無監督域自適應
嵌套命名實體識別的神經分層模型
用於語義場景完成的3D門控遞歸融合
論文名稱:3D Gated Recurrent Fusion for Semantic Scene Completion
作者:Liu Yu /Li Jie /Yan Qingsen /Yuan Xia /Zhao Chunxia /Reid Ian /Cadena Cesar
發表時間:2020/2/17
論文連結:https://paper.yanxishe.com/review/12074?from=leiphonecolumn_paperreview0226
推薦原因
這篇論文要解決的是語義場景補全任務中的數據融合問題。
RGB圖像包含對象的紋理細節,而深度圖像能捕獲與形狀補全任務具有高度相關性的幾何線索,因此同時使用RGB和深度圖像可以進一步提高語義場景補全模型的精度。基於此,這篇論文提出了名為GRFNet的3D門控遞歸融合網絡,該網絡可以自適應地選擇並通過使用門和存儲模塊來融合深度圖像和RGB的相關信息。在單級融合的基礎上,這篇論文還進一步提出了一種多級融合策略,可以對網絡中不同級之間的相關性進行建模。在兩個基準數據集上進行的實驗證明了GRFNet在語義場景補全任務中進行數據融合優於現有的方法。
用於大姿態人臉正面化的雙注意力GAN
論文名稱:Dual-Attention GAN for Large-Pose Face Frontalization
作者:Yin Yu /Jiang Songyao /Robinson Joseph P. /Fu Yun
發表時間:2020/2/17
論文連結:https://paper.yanxishe.com/review/12073?from=leiphonecolumn_paperreview0226
推薦原因
這篇論文要解決的是人臉正面化的問題。
人臉正面化為人臉數據的增強提供了一種有效的方法,進一步提高了極端姿勢場景下的人臉識別性能。這篇論文提出了一種新的雙注意力生成對抗網絡(DA-GAN),通過在GAN訓練過程中同時捕捉上下文相關性和局部一致性來實現真實感人臉正面化。DA-GAN包含一種基於自注意力的生成器,來集成具有遠距離依賴性的局部特徵以產生更好的特徵表示和一個基於面部注意力的新型判別器,用於強調人臉區域的局部特徵,從而增強了合成正面人臉的真實感。
Universal-RCNN:基於可轉移圖R-CNN的通用目標檢測器
論文名稱:Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN
作者:Xu Hang /Fang Linpu /Liang Xiaodan /Kang Wenxiong /Li Zhenguo
發表時間:2020/2/18
論文連結:https://paper.yanxishe.com/review/12072?from=leiphonecolumn_paperreview0226
推薦原因
這篇論文要解決的是通用對象檢測的問題。
這篇論文提出了一種名為Universal-RCNN的新的通用對象檢測器,結合圖遷移學習可在多個數據集之間傳播相關語義信息,以達到語義一致性。Universal-RCNN首先通過整合所有類的所有高級語義表示來生成全局語義池。然後,域內推理模塊在空間感知圖卷積網絡指引下的一個數據集中學習並傳播稀疏圖表示。最後,Universal-RCNN中的域間傳輸模塊利用所有域之間的多種傳輸依賴關係,通過全局參與和傳輸語義上下文來增強區域特徵表示。大量實驗表明,Universal-RCNN明顯優於現有的多分支模型,並在多對象檢測基準上達到最新水平。
用於圖像深度估計的無監督域自適應
論文名稱:Unsupervised Domain Adaptation for Depth Prediction from Images
作者:Tonioni Alessio /Poggi Matteo /Mattoccia Stefano /Di Stefano Luigi
發表時間:2019/9/9
論文連結:https://paper.yanxishe.com/review/11952?from=leiphonecolumn_paperreview0226
推薦原因
論文的目標是利用無監督算法,將在大量合成數據上預訓練的深度模型遷移到沒有標籤監督的目標域上來。作者首先利用傳統的深度估計算法為目標域的圖像標記含有噪聲的偽標籤,並生成一個逐像素的置信圖。論文的創新點在於提出了一種新穎的置信度引導損失函數,它用來衡量哪些像素需要納入深度模型預測出的深度值與傳統方法計算出的深度值的誤差中。作者還將控制用來計算損失的像素值的超參數設置成一個可學習的變量,進一步提升了模型的泛化能力。論文被TPAMI接收,為無監督深度估計算法提供了新的解決思路。
嵌套命名實體識別的神經分層模型
論文名稱:A Neural Layered Model for Nested Named Entity Recognition
作者:Meizhi Ju /Makoto Miwa /Sophia Ananiadou
發表時間:2018/6/1
論文連結:https://paper.yanxishe.com/review/11812?from=leiphonecolumn_paperreview0226
推薦原因
1. 本文解決了大多數命名實體識別系統不能有效處理內部嵌套實體的問題,如在生物醫藥領域,嵌套實體出現非常頻繁,使用本文提出的方法可以在此背景下捕獲更細粒度的語義信息。
2. 本文提出了一種動態分層模型,能夠充分利用內部實體信息來加強外部實體的識別。模型基於由LSTM和CRF組成的flat NER層,因此模型能夠捕獲輸入序列的上下文表示,並在不依賴於特徵工程的情況下在flat NER層上全局解碼預測標籤。該模型針對於特定數據集(具有多種類別和嵌套的實體),嵌套的實體越多層次越深,實驗效果越好。
3. 本文所提出的模型針對自然語言處理中命名實體識別問題,能夠改善嵌套實體識別的情況,而實體識別是之後如實體對齊,構建知識圖譜等問題的基礎,因而意義很大。
論文作者團隊招募
為了更好地服務廣大 AI 青年,AI 研習社正式推出全新「論文」版塊,希望以論文作為聚合 AI 學生青年的「興趣點」,通過論文整理推薦、點評解讀、代碼復現。致力成為國內外前沿研究成果學習討論和發表的聚集地,也讓優秀科研得到更為廣泛的傳播和認可。
我們希望熱愛學術的你,可以加入我們的論文作者團隊。
加入論文作者團隊你可以獲得
1.署著你名字的文章,將你打造成最耀眼的學術明星
2.豐厚的稿酬
3.AI 名企內推、大會門票福利、獨家周邊紀念品等等等。
加入論文作者團隊你需要:
1.將你喜歡的論文推薦給廣大的研習社社友
2.撰寫論文解讀
雷鋒網雷鋒網雷鋒網