今日Paper|可視問答模型;神經風格差異轉移;圖像壓縮系統;K-SVD...

2020-12-18 雷鋒網

目錄

準確性與複雜性:可視問答模型中的一種權衡神經風格差異轉移及其在字體生成中的應用基於GAN的可調整的圖像壓縮系統基於原始-對偶活動集算法的K-SVD圖像去噪神經閱讀理解與超越

準確性與複雜性:可視問答模型中的一種權衡

論文名稱:Accuracy vs. Complexity: A Trade-off in Visual Question Answering Models

作者:Farazi Moshiur R. /Khan Salman H. /Barnes Nick

發表時間:2020/1/20

論文連結:https://paper.yanxishe.com/review/9627?from=leiphonecolumn_paperreview0211

推薦原因

這篇論文考慮的是視覺問答的問題。

為了驗證AI的推理能力,視覺問答(Visual Question Answering,VQA)被用作一種視覺圖靈測試。現有VQA模型的關鍵是將圖像的視覺特徵與給定問題的語義特徵相結合而學習到聯合嵌入。大量的研究聚焦於利用視覺注意力機制來設計複雜的聯合嵌入策略,以有效捕捉視覺與語義間的交互作用。但是,在高維空間構建視覺與語義特徵計算量極大,模型越來越複雜,對VQA準確率帶來的提升卻很小。這篇論文系統地研究了模型複雜度和性能兩方面的折中策略,並且特別關注了這些模型在多模態融合方面的效果。通過實驗,這篇論文給出了如何優化以降低複雜性和如何優化以實現當前最佳VQA性能的提升這兩個方面的建議。

神經風格差異轉移及其在字體生成中的應用

論文名稱:Neural Style Difference Transfer and Its Application to Font Generation

作者:Atarsaikhan Gantugs /Iwana Brian Kenji /Uchida Seiichi

發表時間:2020/1/21

論文連結:https://paper.yanxishe.com/review/9626?from=leiphonecolumn_paperreview0211

推薦原因

這篇論文了介紹一種自動創建字體的方法,找到兩種不同字體之間的字體樣式差異,並使用神經樣式轉移將其轉換為另一種字體。這篇論文提出了一種新的神經風格差異和內容差異損失神經風格轉移方法。根據這些損失,可通過在字體中添加或刪除字體樣式來生成新字體。基於各種輸入字體組合的實驗結果,這篇論文還討論了所提方法的局限性和未來的工作。

基於GAN的可調整的圖像壓縮系統

論文名稱:A GAN-based Tunable Image Compression System

作者:Wu Lirong /Huang Kejie /Shen Haibin

發表時間:2020/1/18

論文連結:https://paper.yanxishe.com/review/9625?from=leiphonecolumn_paperreview0211

推薦原因

這篇論文考慮的是圖像壓縮的問題。

在基於深度神經網絡的有損圖像壓縮中,重要性圖方法被廣泛應用,以根據圖像內容的重要性來實現比特分配,然而這種方法容易出現嚴重失真。這篇論文提出使用生成對抗網絡重構非重要區域,將多尺度金字塔分解方法應用於編碼器和判別器,以實現高解析度圖像的全局壓縮。同時這篇論文還提出了一種可調整的壓縮方案,將圖像壓縮為任何特定的壓縮率,而無需重新訓練模型。實驗結果表明,與最新的基於GAN的方法相比,這篇論文提出的方法在MS-SSIM數據集實現了10.3%以上的改進。

基於原始-對偶活動集算法的K-SVD圖像去噪

論文名稱:Image denoising via K-SVD with primal-dual active set algorithm

作者:Xiao Quan /Wen Canhong /Yan Zirui

發表時間:2020/1/19

論文連結:https://paper.yanxishe.com/review/9624?from=leiphonecolumn_paperreview0211

推薦原因

這篇論文改進了用於圖像去噪的K-SVD算法。在K-SVD的稀疏編碼步驟中,一旦噪音等級變高,尋找貪心近似解的效果就下降了。這篇論文提出了一種新的名為K-SVD_P的框架,加入了原始對偶有效集(Primal-Dual Active Set,PDAS)算法。K-SVD_P與基於貪心算法的K-SVD不同,發展出一套利用KKT條件的選擇策略,並在稀疏編碼階段產生有效的更新。由於K-SVD_P使用簡單的顯式表達式來迭代地尋找對偶問題的等效解決方案,可以在去噪的速度與質量上取得更好的效果。論文中的實驗也驗證了K-SVD_P的降噪性能。

神經閱讀理解與超越

論文名稱:NEURAL READING COMPREHENSION AND BEYOND

作者:Danqi Chen

發表時間:2019/12/21

論文連結:https://paper.yanxishe.com/review/9622?from=leiphonecolumn_paperreview0211

推薦原因

這篇論文是陳丹琦的博士論文,作為nlp領域的大牛,這篇文章很是優秀推薦給大家,這篇論文已經成為了NLP研究者的必讀論文,這篇論文難得可貴的是向nlp研究者們展示了,如何在研究過程中面對挑戰解決問題。

這篇論文可以看作是綜述類文章,裡面既有其它人的研究,也有自己的研究,推薦大家閱讀。

論文作者團隊招募

為了更好地服務廣大 AI 青年,AI 研習社正式推出全新「論文」版塊,希望以論文作為聚合 AI 學生青年的「興趣點」,通過論文整理推薦、點評解讀、代碼復現。致力成為國內外前沿研究成果學習討論和發表的聚集地,也讓優秀科研得到更為廣泛的傳播和認可。

我們希望熱愛學術的你,可以加入我們的論文作者團隊。

加入論文作者團隊你可以獲得

1.署著你名字的文章,將你打造成最耀眼的學術明星

2.豐厚的稿酬

3.AI 名企內推、大會門票福利、獨家周邊紀念品等等等。

加入論文作者團隊你需要:

1.將你喜歡的論文推薦給廣大的研習社社友

2.撰寫論文解讀

雷鋒網雷鋒網雷鋒網

相關焦點

  • 今日Paper | 可視問答模型;神經風格差異轉移;圖像壓縮系統 ;K-SVD...
    >準確性與複雜性:可視問答模型中的一種權衡神經風格差異轉移及其在字體生成中的應用基於GAN的可調整的圖像壓縮系統基於原始-對偶活動集算法的K-SVD圖像去噪神經閱讀理解與超越論文名稱:Accuracyfrom=leiphonecolumn_paperreview0211推薦原因這篇論文了介紹一種自動創建字體的方法,找到兩種不同字體之間的字體樣式差異,並使用神經樣式轉移將其轉換為另一種字體。這篇論文提出了一種新的神經風格差異和內容差異損失神經風格轉移方法。根據這些損失,可通過在字體中添加或刪除字體樣式來生成新字體。
  • 今日Paper | 問答系統;3D人體形狀和姿勢;面部偽造檢測;AdderNet等
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。
  • 今日Paper|縮放神經網絡;形變的LSTM;知識圖譜複雜問答;陰影著色等
    目錄ZoomNet:用於3D對象檢測的部分感知自適應縮放神經網絡ForecastNet:一種用於多步超前時間序列預測的時變深度前饋神經網絡結構形變的LSTM基於消息傳遞的知識圖譜複雜問答ZoomNet首先使用一個普通的2D對象檢測模型,獲取成對左右邊界框。然後為了進一步利用RGB圖像中豐富的紋理信息來進行更準確的視差估計,ZoomNet使用了一個模塊-自適應縮放塊,同時將2D實例邊框的大小調整為統一的解析度,並相應地調整了相機的固有參數。同時,這篇論文還提出學習局部位置信息來進一步提升模型性能,並提出了一個3D擬合評分以更好地估計3D檢測模型的質量。
  • 今日Paper | 模態平衡模型;組合語義分析;高表達性SQL查詢;多人...
    important;">論文名稱:Compositional Semantic Parsing>作者:Panupong Pasupat /Percy Liang發表時間:2015/1/24論文連結:https://paper.yanxishe.com/review/9240推薦原因核心問題:本文完成的是一個問答系統
  • 今日Paper | 新聞推薦系統;多路編碼;知識增強型預訓練模型等
    from=leiphonecolumn_paperreview0118這是一篇來自巴西航空理工學院的博士畢業論文,主要討論了基於深度學習的新聞推薦系統的設計方法 —— 不是討論某個具體的架構,而是討論如何設計架構,也就是「元架構」。
  • 今日Paper | 多人姿勢估計;對話框語義分析;無監督語義分析;自然...
    還有一種是將自然語言直接轉換為計算機可以理解並且執行的語言,本文就是解決這個問題創新點:面向任務的對話框系統的分層語義表示,它可以對組合查詢和嵌套查詢建模。提出了一個語義解析的層次化注釋方案,它允許組合查詢的表示,並且可以被標準的選區解析模型高效準確地解析。而且還發布了一個由44k個帶注釋的查詢1組成的數據集。
  • 今日Paper|人臉數據隱私;神經符號推理;深度學習聊天機器人等
    from=leiphonecolumn_paperreview0115推薦原因:現代的人臉識別系統數據集包含數十萬張特定人臉圖像,研究人員用於訓練深度卷積神經網絡,最近,大規模的面部識別培訓數據集(如MS-Celeb-1M和MegaFace)的來源和隱私問題受到了公眾的密切關注,因為許多人不願意讓自己的臉被用於培訓能夠實現大規模監控的兩用技術。
  • 數學推導+純Python實現機器學習算法28:奇異值分解SVD
    ,SVD用於PCA降維以及圖像去噪與壓縮等。我們可以嘗試將SVD用於圖像的壓縮算法。其原理就是保存像素矩陣的前k個奇異值,並在此基礎上做圖像恢復。由SVD的原理我們可以知道,在SVD分解中越靠前的奇異值越重要,代表的信息含量越大。     下面我們嘗試對一個圖像進行SVD分解,並分別取前1~50個奇異值來恢復該圖像。需要恢復的圖像如下(厚著臉皮拿筆者自己作為示例):
  • 今日Paper|從純圖像重建世界;層次遞歸網絡序列;注意力神經網絡...
    目錄層次遞歸網絡序列標註的轉移學習注意力神經網絡序列標記模型中的特徵基於雙向LSTM-CNNs的命名實體識別通過雙向LSTM-CNNs-CRF進行端到端序列標記更好的物體表徵,更好地從純圖像重建世界層次遞歸網絡序列標註的轉移學習論文名稱:TRANSFER LEARNING FOR SEQUENCE TAGGING WITH HIERARCHICAL RECURRENT NETWORKS
  • 今日Paper|小樣本學習;視覺情感分類;神經架構搜索;自然圖像摳像等
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI 研習社重磅推出【今日 Paper】欄目,每天都為你精選關於人工智慧的前沿學術論文供你學習參考。>在神經架構搜索裡使用權值共享真的有效、可靠嗎?作者們也設計了一系列方法優化模型的表現。最終,他們在幾個小樣本學習數據集上都刷新了最好成績。在神經架構搜索裡使用權值共享真的有效、可靠嗎?
  • 數據科學中需要知道的5個關於奇異值分解(SVD)的應用
    事實上,SVD是推薦系統的基礎,而推薦系統是谷歌,YouTube,亞馬遜,Facebook等大公司的核心。我們將在本文中介紹SVD的五個超級有用的應用,並將探討如何在Python中以三種不同的方式使用SVD。1.
  • 神經風格遷移指南(第一部分)
    這些圖像表示如何幫助進行風格轉換?那麼編碼表示本身的這種性質是風格轉移的關鍵,它用於計算生成的圖像與內容和樣式圖像之間的損失。由於每個類在數萬個圖像上訓練模型,因此模型能夠為許多不同的圖像生成相似的特徵表示,因為它們屬於同一類或具有相似的內容或樣式。
  • 深度學習模型壓縮方法
    2015年,Han發表的Deep Compression  (https://arxiv.org/abs/1510.00149)是一篇對於模型壓縮方法的綜述型文章,將裁剪、權值共享和量化、編碼等方式運用在模型壓縮上,取得了非常好的效果,作為ICLR2016的best paper,也引起了模型壓縮方法研究的熱潮。
  • 今日Paper | 物體渲染;圖像和諧化;無偏數據處理方法;面部偽造檢測...
    from=leiphonecolumn_paperreview0319推薦原因本文被ICLR 2020接收!文章提出了一種基於學習的圖像引導的渲染技術,該技術將基於圖像的渲染和基於GAN的圖像合成相結合,可以生成重建對象的高真實感渲染結果。
  • 三篇論文,解讀神經網絡壓縮
    神經網絡壓縮方向是目前深度學習研究的一個熱門的方向,其主要的研究方向是壓縮,蒸餾,網絡架構搜索,量化等。在 ICCV2019 中,不少的研究單位和學者都發表了神經網絡壓縮方向的論文。本文主要以其中三篇論文來研究神經網絡壓縮的目前發展趨勢。
  • 深入講解|運用神經風格轉化訓練出高清優質的圖像!
    深入探討有效轉換神經風格的技巧深入到神經風格轉換的領域。你就會發現儘管NST在概念上很容易理解,但要生成高質量圖像卻出奇地困難。為了獲得良好的結果,必須正確實施許多複雜的細節和未提及的技巧。在本文中,我們將深入研究神經風格轉換的知識,並詳細研究這些技巧。
  • 模型壓縮真的有用嗎?
    一般人和公司真是玩不起。模型壓縮領域的「有志之士」的終極目標是能夠讓「貧苦的深度學習愛好者」也玩得起,他們進行了一些列的研究,他們發現使用壓縮後(更小的)模型也能夠達到原始模型類似的效果。3. 常見的模型壓縮方法有哪些?
  • 今日Paper | TRANSFORMER結構;圖像到圖像翻譯;缺失標註目標檢測...
    from=leiphonecolumn_paperreview0221推薦原因這篇論文提出了一個新的圖像到圖像遷移方法,通過生成對抗網絡將可控因素(即自然語言描述)嵌入到圖像到圖像的遷移中,從而使文字描述可以確定合成圖像的視覺屬性。
  • 神經風格遷移(NST)的基本機制及實現
    深度學習可以捕獲一個圖像的內容並將其與另一個圖像的風格相結合,這種技術稱為神經風格遷移。但是,神經風格遷移是如何運作的呢?在這篇文章中,我們將研究神經風格遷移(NST)的基本機制。這裡需要注意的是,卷積神經網絡(CNN)並不知道圖像是什麼,但他們學會了編碼特定圖像所代表的內容。卷積神經網絡的這種編碼特性可以幫助我們實現神經風格遷移。卷積神經網絡如何用於捕獲圖像的內容和風格VGG19網絡用於神經風格遷移。
  • 今日Paper|TRANSFORMER結構;圖像到圖像翻譯;缺失標註目標檢測解決...
    from=leiphonecolumn_paperreview0221推薦原因這篇論文提出了一個新的圖像到圖像遷移方法,通過生成對抗網絡將可控因素(即自然語言描述)嵌入到圖像到圖像的遷移中,從而使文字描述可以確定合成圖像的視覺屬性。