今日Paper|RevealNet;時間序列預測;無監督問答;實時語義立體匹配等

2020-12-18 雷鋒網

目錄

F, B, Alpha Matting

使用一種基於符號化方法的LSTM網絡進行時間序列預測

RevealNet:窺探RGB-D掃描場景中的每個物體

BERT還不足以稱之為知識庫:無監督問答任務中BERT對事實性的知識和基於名稱的推理學習能力對比

實時語義立體匹配

F, B, Alpha Matting

論文名稱:F, B, Alpha Matting

作者:Marco Forte /Franois Pitié

發表時間:2020/3/17

論文連結:https://paper.yanxishe.com/review/14460?from=leiphonecolumn_paperreview0331

推薦原因

本文已經被提交到ECCV2020。Image Matting是眾多圖像編輯應用中的一個關鍵技術,其需要將對象從圖片分割出來並估計其不透明蒙版。基於深度學習的方法也取得了很大的進展,但大多數現有網絡僅預測alpha遮罩,需要藉助後處理方法來恢復透明區域中的原始前景色和背景色。雖然最近也有兩種新的方法來同時估計前景色,但其需要大量的計算和存儲成本。

本文提出了對Matting網絡的低成本修改,使其能夠同時預測前景色和背景色。作者研究了訓練方式的變化,並探索了大量現有的和新穎的損失函數用於聯合訓練。文章方法在Adobe Composition-1k數據集上實現了alpha遮罩和複合顏色質量的最先進表現,並在在線評價系統alphamatting.com上取得目前第一的排名。

使用一種基於符號化方法的LSTM網絡進行時間序列預測

論文名稱:Time Series Forecasting Using LSTM Networks: A Symbolic Approach

作者:Steven Elsworth and Stefan Guttel

發表時間:2020/3/12

論文連結:https://paper.yanxishe.com/review/14428?from=leiphonecolumn_paperreview0331

推薦原因

本文使用LSTM對時間序列數據進行預測,為了提高訓練的速度,使用了基於聚類的ABBA表徵方法,對數據集進行預處理轉換為符號的形式,並最終將符號進行數位化,以供LSTM網絡使用。

本文對數據符號化的方法進行了優化,採用了插值的方法,讓轉化出來的時間序列數據更加緊密和平滑,此外,作者從對超參數的敏感度等方面研究了使用預處理過的數據進行訓練能比直接使用原始數據進行訓練的速度更快的原因。

我以前做車流量預測的時候,突發奇想嘗試過將車流量值轉化為符號表示,再使用LSTM+attention的網絡結構進行訓練,效果十分好,這篇文章解答了我當時很多的疑惑。很多數值化的序列數據,經過預處理,能使用自然語言處理的方法來預測,從而能得到更加豐富的上下文信息,不知這樣理解是否是對的?

RevealNet:窺探RGB-D掃描場景中的每個物體

論文名稱:RevealNet: Seeing Behind Objects in RGB-D Scans

作者:Hou Ji /Dai Angela /Niener Matthias

發表時間:2019/4/26

論文連結:https://paper.yanxishe.com/review/14282?from=leiphonecolumn_paperreview0331

推薦原因

本文已被CVPR2020接收。在3D重建的過程中,人體通常無法掃描每個視圖下的所有單個對象,這會導致掃描數據的的丟失,進而限制很多應用,如機器人需要了解一個沒見過的幾何體以進行精確的抓取。

本文作者介紹了一個語義實例補全的任務:從一個不完全的RGBD掃描場景數據,來檢測每個物體實例並推斷其完整的幾何形狀。為了解決這個問題,作者提出了一個端到端的3D神經網絡架構RevealNet,通過數據驅動的方法來聯合檢測實例對象並預測其完整的幾何形狀。這使得掃描的場景能夠被有語義的分割為獨立的完整的3D物體,包括遮擋的和沒有觀察到的物體部分。文章方法比目前的最優方法在mAP@0.5的衡量標準下效果有大幅提升,在ScanNet數據集上有15的提升,在SUNCG數據集上有18的提升。

文章介紹了一個3D機器學習任務:語義實例補全,並提出了一個有效的框架RevealNet解決該任務。

BERT還不足以稱之為知識庫:無監督問答任務中BERT對事實性的知識和基於名稱的推理學習能力對比

論文名稱:BERT is Not a Knowledge Base (Yet): Factual Knowledge vs. Name-Based Reasoning in Unsupervised QA

作者:Nina Poerner and Ulli Waltinger and Hinrich Schutze ¨

發表時間:2019/11/9

論文連結:https://paper.yanxishe.com/review/14281?from=leiphonecolumn_paperreview0331

推薦原因

作者發現一些特殊問題:很難從句子中的實體名稱推理而出但是實際上並不困難,對於BERT而言很難處理,從而質疑BERT能從名稱推理出答案,但是並不足以稱之為一個知識庫。同時提出了一種將由維基百科預料中學到的詞向量嵌入到BERT模型中的擴展模型,得到了比BERT和ERNIE更好的結果。

作者提出的擴展模型,引入了詞向量嵌入,在特定的任務上提升了BERT的效果,相對於需要在額外知識庫中進行預訓練得到的嵌入信息,更加簡便,可解釋性也更強。

實時語義立體匹配

論文名稱:Real-Time Semantic Stereo Matching

作者:Dovesi Pier Luigi /Poggi Matteo /Andraghetti Lorenzo /Martí Miquel /Kjellstrm Hedvig /Pieropan Alessandro /Mattoccia Stefano

發表時間:2019/10/1

論文連結:https://paper.yanxishe.com/review/14231?from=leiphonecolumn_paperreview0331

推薦原因

這篇論文提出了第一實時的語義立體匹配網絡RTSSNet,即將語義分割和雙目深度估計兩個任務用同一個端到端的網絡來實現,並且達到實時的速度。之前的論文有將語義分割和立體匹配相結合(如SegStereo),但是他們並沒有達到實時的速度。這篇論文提出的RTSSNet結構包括4個金字塔模塊,(1)特徵提取模塊;(2)視差估計模塊;(3)語義分割模塊;(4)協同視差優化模塊。第一個模塊是兩個任務共享的;第二和第三個模塊分別對應兩個任務,並且具有解析度逐漸遞增的三個階段,用來平衡準確率和速度;第四個模塊用來進一步的將語義信息和深度信息融合,獲得更準確的視差圖。這篇論文發表在機器人頂會ICRA 2020上,關注的智慧機器人在場景感知上的需求——既要知道目標在哪裡(深度信息),還要知道目標是什麼(語義信息)。具有很強的實際用途。

雷鋒網雷鋒網雷鋒網

相關焦點

  • 今日Paper | 3D手勢估計;自學習機器人;魯棒語義分割;卷積神經網絡...
    (paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。以from=leiphonecolumn_paperreview0108推薦理由:隨著高容量,低精度計算技術的發展以及認知人工智慧啟發式系統的應用研究,通過具有實時學習功能的神經網絡的機器學習解決方案引起了研究界以及整個行業的極大興趣。
  • 今日Paper|縮放神經網絡;形變的LSTM;知識圖譜複雜問答;陰影著色等
    目錄ZoomNet:用於3D對象檢測的部分感知自適應縮放神經網絡ForecastNet:一種用於多步超前時間序列預測的時變深度前饋神經網絡結構形變的LSTM基於消息傳遞的知識圖譜複雜問答from=leiphonecolumn_paperreview0310推薦原因這是百度發表在AAAI 2020上的工作,用於估計遠處和被遮擋物體的3D姿勢檢測問題。這篇論文提出了一個名為ZoomNet的新型框架,用於對3D立體圖像進行對象檢測任務。
  • 今日Paper|虛擬試穿網絡;人群計數基準;聯邦元學習;目標檢測等
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。
  • 今日Paper | 人臉旋轉;BiLSTM-CRF;神經注意模型;Abigail等
    from=leiphonecolumn_paperreview0413推薦原因本文已經被CVPR2020接收。近些年來人臉旋轉取得了快速的發展,但缺乏高質量的配對訓練數據仍然是現有方法的一大障礙。本文提出了一種新穎的無監督框架,可以只使用單視角自然圖片來合成逼真的旋轉後的人臉。文章方法的核心是在3D空間旋轉人臉,再將其重新渲染至2D圖像平面,以此作為一個強的自監督。
  • 今日Paper|強化學習;可重構GANs;BachGAN;時間序列分類等
    from=leiphonecolumn_paperreview0409推薦原因本文的研究目的和創新點:本文針對生成文本摘要任務,提出了一種新的模型,該模型的框架依託深度遞歸生成解碼器(DRGN),它是一種面向序列到序列的編/解碼器模型。
  • 美團智能問答技術探索與實踐
    這需要提供一套智能"問題解決"能力,實時從各類信息中找出準確的信息來回答用戶問題,輔助用戶決策。本文在簡單介紹完智能問答技術框架之後,著重介紹Document QA,Community QA, KBQA三類"問答解決"能力。
  • 今日Paper|人臉旋轉;BiLSTM-CRF;神經注意模型;Abigail等
    from=leiphonecolumn_paperreview0413推薦原因本文已經被CVPR2020接收。近些年來人臉旋轉取得了快速的發展,但缺乏高質量的配對訓練數據仍然是現有方法的一大障礙。本文提出了一種新穎的無監督框架,可以只使用單視角自然圖片來合成逼真的旋轉後的人臉。
  • 今日Paper|可視問答模型;神經風格差異轉移;圖像壓縮系統;K-SVD...
    圖像去噪神經閱讀理解與超越準確性與複雜性:可視問答模型中的一種權衡論文名稱:Accuracy vs./Barnes Nick發表時間:2020/1/20論文連結:https://paper.yanxishe.com/review/9627?
  • AAAI 2020 提前看 | 三篇論文解讀問答系統最新研究進展
    生成模式概率和複製模式概率相結合,得到最終的單詞分布:使用負對數似然來計算序列-序列的損失:句子級語義匹配(Sentence-level Semantic Matching):通過門控融合得到了改進的答案感知句子向量 z。對於解碼器(單向 LSTM),採用最後一個隱藏狀態 s_n 作為問題向量。
  • AAAI 2020 提前看|三篇論文解讀問答系統最新研究進展
    生成模式概率和複製模式概率相結合,得到最終的單詞分布:使用負對數似然來計算序列-序列的損失:句子級語義匹配(Sentence-level Semantic Matching):通過門控融合得到了改進的答案感知句子向量 z。對於解碼器(單向 LSTM),採用最後一個隱藏狀態 s_n 作為問題向量。
  • 今日Paper|TRANSFORMER結構;圖像到圖像翻譯;缺失標註目標檢測解決...
    /Lukasiewicz Thomas發表時間:2020/2/12論文連結:https://paper.yanxishe.com/review/11541?COCO數據集上的實驗表明了這篇論文提出的方法在視覺真實性和語義一致性方面均具有出色的性能表現。
  • 今日Paper | TRANSFORMER結構;圖像到圖像翻譯;缺失標註目標檢測...
    from=leiphonecolumn_paperreview0221推薦原因核心問題:自從BERT取得了巨大的效果的時候,transform就成為了大多數nlp任務的標配,但是它存在一些問題,比如訓練速度慢,佔用內容大,還有無法處理長序列,本論文就是解決這些問題。
  • 8篇論文深入學習深度估計:深度預測;自我運動學習;觀看《冰雪奇緣...
    這個模型可在圖像或視頻上實時運行。這篇論文提出的方法是使用CNN進行深度估計。該模型是完全卷積的,並包含跟蹤高維回歸問題的有效殘留向上採樣模塊(向上投影)。網絡的第一部分基於ResNet50,並使用預訓練的權值進行初始化。第二部分是卷積和解池層的序列,利用它們來指導網絡學習其 upscaling 。然後應用Dropout,進行最後的卷積,得到最終的預測。
  • 通過Python 代碼實現時間序列數據的統計學預測模型
    統計模型與統計要素時間序列分析常用統計模型單變量時間序列統計學模型,如:平均方法、平滑方法、有/無季節性條件的 ARIMA 模型。多變量時間序列統計學模型,如:外生回歸變量、VAR。結構化時間序列模型,如:貝葉斯結構化時間序列模型、分層時間序列模型。在本篇文章中,我們主要關注 SARIMA 和 Holt-winters 方法。
  • 時間序列預測法的分類:天真預測、平均法與平滑法以及OMTS與FMTS
    樸素模型又稱為隨機漫步法,有時也被稱作無變化模型,因為,它預測未來時期的結果和過去觀察到的實際結果完全一樣,沒有變化。但市場是動態變化的,認為未來和過去完全一樣當然過於天真,於是,將這種隨機漫步法稱為天真預測。
  • 醫藥流向終端名稱精準匹配技術
    流向終端匹配任務提供面向標準行業庫的映射能力,需要處理大量不規範的終端名稱,其中包含商業公司特定的中英文簡稱編碼、省略連鎖總部信息的連鎖門店、包含特殊字符的終端名稱等等。 如何在任務處理階段清除無效信息並提取有效的判定信息,通過特定搜索策略尋找到語義匹配的目標終端?
  • 乾貨|時間序列預測類問題下的建模方案探索實踐
    而時間序列就是該種現象某一個統計指標在不同時間上的數值,按時間先後順序排列而形成的序列。時間序列分析主要針對時間序列類問題的兩個領域,一個是對歷史區間數據的分析,通過對過往數據特徵的提煉總結來進行異常檢測和分類;另一類就是對未來數據的分析,根據過去時間點的數據對未來一個時間點或者幾個時間點的狀態或實際值進行預測。
  • 自然語言處理中的卷積深度語義匹配模型簡介
    但是,由於C-DSSM只考慮了滑動窗口內單詞的順序,所以無法表達句子中遠距離的依存關係和複雜語義。DSSM和C-DSSM的相似之處是,先用一個深度模型把文本映射為一個向量,然後用簡單的函數,如內積或餘弦相似度,來計算兩個文本的匹配關係。
  • 百度研究院2021年十大科技趨勢預測:生物計算迎爆發、無監督學習...
    1月13日,百度研究院發布2021年十大科技趨勢預測,包括人工智慧、生物計算、AI晶片、量子計算等前沿技術及相關產業,技術創新與產業應用發展緊密融合,既有技術前瞻性也具備產業指導價值。 結合知識圖譜和深度學習技術的知識增強的跨模態深度語義理解,讓AI具備持續學習的能力,像人一樣「活到老學到老」。   以此為基礎,結合3D建模、情緒識別、智能推薦等多種技術打造的數字人、虛擬人可以看、聽、說,還能與人自然交流。2021年,數字人、虛擬人的生產門檻將進一步降低,並大規模應用在網際網路、金融、電商、醫療等行業,給客戶帶來專業貼心、千人千面的服務。
  • Meal Kit 的時間序列數據預測實踐
    在時間序列中,缺失的數據可能會隱藏起來,因為數據可能在時間步長(1周)內不一致,這將在構建模型時可能會導致問題。對每個供應中心標識的數據進行分組。其中一些食材並非每周訂購/提供的,那麼將這幾周的需求量取為0,但是價格設置為組內食材的平均值。我們假設這些食材在缺失的幾周內是有提供的,但是沒有人買。在研究了餐盒市場後,人們意識到大部分成本來自易腐商品。