今日Paper | COVID-19感染者篩查;生成式摘要;圖像融合數據集;端到...

2020-12-01 雷鋒網


異常呼吸模式分類器可能有助於以準確和不顯眼的方式對COVID-19感染者進行大規模篩查基於單句和雙句打分的生成式摘要

MFFW:一種新的多聚焦圖像融合數據集

基於互連卷積神經網絡的端到端臉部分析

AAAI2020|基於多任務驅動特徵模型的熱紅外目標跟蹤

  異常呼吸模式分類器可能有助於以準確和不顯眼的方式對COVID-19感染者進行大規模篩查

論文名稱:Abnormal respiratory patterns classifier may contribute to large-scale screening of people infected with COVID-19 in an accurate and unobtrusive manner

作者:Wang Yunlu /Hu Menghan /Li Qingli /Zhang Xiao-Ping /Zhai Guangtao /Yao Nan

發表時間:2020/2/12

論文連結:https://paper.yanxishe.com/review/11537?from=leiphonecolumn_paperreview0220

這篇論文提出根據呼吸特徵對新型冠狀病毒的患者進行篩查。最新臨床研究,COVID-19的呼吸模式與流感和普通感冒的呼吸模式不同。感染COVID-19的人有呼吸暫停現象,並且呼吸更快。這篇論文提出使用深度相機和深度學習來完成這項篩查任務,然而現實世界中的數據量不足以進行深度模型訓練。這篇論文首先提出了一種新的呼吸模擬模型,來彌補訓練數據不足的問題。隨後這篇論文首次利用雙向注意力機制的GRU模型來對6種臨床上重要的呼吸模式進行分類。這篇論文提出的方法可以拓展到大型的應用場景中,對現有的篩查方法形成補充。

論文名稱:Scoring Sentence Singletons and Pairs for Abstractive Summarization

作者:Logan Lebanoff /Kaiqiang Song†

發表時間:2019/6/7

論文連結:https://paper.yanxishe.com/review/11534?from=leiphonecolumn_paperreview0220

1.本文的核心:本文是對於採用生成式自動文本摘要方法的探索,重點研究了關於生成式中目前探究的將文本內容選擇和摘要生成分開處理的問題。其中本論文提出的模型,第一部分採用BERT給單句和句子對評分,第二部分作者根據MMR準則進行評分,選擇出評分高的句子和句子對,從而生成文本摘要。

2.本文的創新點:基於生成式中目前探究的將文本內容選擇和摘要生成分開處理的問題,本文創新性的提出了一種用來將單句和成對句子映射到一個統一的空間進行排序的思想,採用當下最火爆的BERT模型來學習實例的特徵,將學到的表徵用一個分類任務來fine-tune生成對應的概率進行排序,然後根據這個排序,有針對性的選擇出摘要中有重要價值的單句和成對句子,最後通過對單個句子壓縮,其中在句子對融合時,作者選擇pointer-generator(PG)networks來將單句壓縮,最終得到我們需要的文本摘要。

3.本文的研究意義:本文針對當下生成式文本摘要中單句和句子對之間尚未形成有效的融合問題,有針對性的提出了一種在文本摘要中關於句子對融合的方法。其中,本文提出的將句子融合引入到了文本摘要中,這是這方面最有意義的嘗試。

論文名稱:MFFW: A new dataset for multi-focus image fusion

作者:Xu Shuang /Wei Xiaoli /Zhang Chunxia /Liu Junmin /Zhang Jiangshe

發表時間:2020/2/12

論文連結:https://paper.yanxishe.com/review/11536?from=leiphonecolumn_paperreview0220

這篇論文為多焦點圖像融合問題提供了一個新的數據集。

以往的多焦點圖像融合方法都是在模擬圖像集或Lytro數據集上評估的,然而散焦散布效應在這些數據集中並不明顯。這篇論文構建了一個名為MFFW的新數據集。該數據集包含在網際網路上收集的19對多焦點圖像。這篇論文收集所有成對源圖像,並提供部分成對的聚焦圖和參考圖像。與Lytro數據集相比,MFFW中的圖像明顯受到散焦散布效果影響。此外,MFFW場景更加複雜。實驗表明,MFFW數據集上的大多數當前最佳方法都無法可靠地生成令人滿意的融合圖像。作為一個新的基準數據集,MFFW可以用來測試多焦點圖像融合算法是否能處理散焦散布效應。

論文名稱:End-to-End Face Parsing via Interlinked Convolutional Neural Networks

作者:Yin Zi /Yiu Valentin /Hu Xiaolin /Tang Liang

發表時間:2020/2/12

論文連結:https://paper.yanxishe.com/review/11535?from=leiphonecolumn_paperreview0220

這篇論文要解決的是臉部分析的問題。

臉部分析需要對臉部(例如眼,鼻,嘴等)進行精確的像素分割,為進一步實現臉部分析、修改、其他應用程式提供基礎。這篇論文提出了一個名為STN-iCNN的簡單的端到端人臉解析框架,該框架通過在兩個獨立階段間添加一個空間Transformer網絡(Spatial Transformer Network,STN)來擴展互連卷積神經網絡(interlinked Convolutional Neural Network,iCNN)。STN-iCNN使用STN來提供到原始兩級iCNN管道的可訓練連接,從而使端到端聯合訓練成為可能。STN還提供了比原始裁切更精確的裁切圖像部分。

  AAAI2020|基於多任務驅動特徵模型的熱紅外目標跟蹤                     

論文名稱:Multi-Task Driven Feature Models for Thermal Infrared Tracking

作者:Qiao Liu /Xin Li /Zhenyu He /Nana Fan /Di Yuan /Wei Liu /Yonsheng Liang

發表時間:2019/11/26

論文連結:https://paper.yanxishe.com/review/5848?from=leiphonecolumn_paperreview0220

推薦原因

解決的核心問題:當前基於深度特徵的熱紅外跟蹤方法普遍使用的是可見光跟蹤器中用到的特徵模型。這些特徵模型通常學習自可見光圖像,既沒有學習熱紅紅外圖像特有的判別性模式,又沒有考慮熱紅外圖像目標的細粒度特徵。因此,已存的這些特徵模型不能有效的表示熱紅外目標,尤其是難以區分同類的熱紅外目標。

創新點:為了獲得更有效的熱紅外目標表示,我們提出了一個熱紅外專用的特徵模型。該模型由一個熱紅外專用的鑑別性特徵和一個細粒度關聯的特徵模型組成。為了集成這兩種互補的特徵,我們設計了一個基於多任務匹配的框架同時優化他們。此外,我們構建了一個大規模的熱紅外圖像序列數據集用於訓練提出的模型。該數據集是當前熱紅外視覺領域規模最大的,目標類別最為豐富的數據集。

研究意義:提出的熱紅外特徵模型為熱紅外目標跟蹤領域提供了新的研究思路。提出的熱紅外訓練數據集為基於深度學習的熱紅外跟蹤方法提供了數據基石。

為了更好地服務廣大 AI 青年,AI 研習社正式推出全新「論文」版塊,希望以論文作為聚合 AI 學生青年的「興趣點」,通過論文整理推薦、點評解讀、代碼復現。致力成為國內外前沿研究成果學習討論和發表的聚集地,也讓優秀科研得到更為廣泛的傳播和認可。

我們希望熱愛學術的你,可以加入我們的論文作者團隊。

加入論文作者團隊你可以獲得

    1.署著你名字的文章,將你打造成最耀眼的學術明星

    2.豐厚的稿酬

    3.AI 名企內推、大會門票福利、獨家周邊紀念品等等等。

加入論文作者團隊你需要:

    1.將你喜歡的論文推薦給廣大的研習社社友

    2.撰寫論文解讀

如果你已經準備好加入 AI 研習社的論文兼職作者團隊,可以添加運營小姐姐的微信,備註「論文兼職作者」

雷鋒網雷鋒網雷鋒網(公眾號:雷鋒網)

相關焦點

  • 今日Paper|小樣本學習;機器學習;單幅圖像去霧;零樣本目標檢測等
    from=leiphonecolumn_paperreview0212推薦原因這篇論文被AAAI 2020接收,考慮的是圖像去霧問題。大部分現有的基於學習的圖像去霧方法並非完全端到端的,而是遵循傳統的去霧步驟:首先評估傳輸介質和大氣光線,隨後恢復基於大氣散射模型的無霧圖像。
  • 今日Paper|強化學習;可重構GANs;BachGAN;時間序列分類等
    摘要在CNN和DailyMail數據集上的表現均優於已知模型。對於DRGN模型而言,他的學習目標是模型中遞歸潛在的隨機隱含信息,通過學習這些隨機隱含信息,對於提高生成文本摘要的質量極為重要。最後,作者在基準數據集上進行了大量實驗,實驗表明,DRGD模型可以有效的解決文本摘要任務。
  • 今日Paper|隨機微分方程;流式自動語音識別;圖像分類等
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。
  • 今日Paper|可視問答模型;神經風格差異轉移;圖像壓縮系統;K-SVD...
    目錄準確性與複雜性:可視問答模型中的一種權衡神經風格差異轉移及其在字體生成中的應用基於GAN的可調整的圖像壓縮系統基於原始-對偶活動集算法的K-SVD現有VQA模型的關鍵是將圖像的視覺特徵與給定問題的語義特徵相結合而學習到聯合嵌入。大量的研究聚焦於利用視覺注意力機制來設計複雜的聯合嵌入策略,以有效捕捉視覺與語義間的交互作用。但是,在高維空間構建視覺與語義特徵計算量極大,模型越來越複雜,對VQA準確率帶來的提升卻很小。這篇論文系統地研究了模型複雜度和性能兩方面的折中策略,並且特別關注了這些模型在多模態融合方面的效果。
  • Google Cloud 發布 COVID-19 數據集,可構建 AI 模型來對抗疫情
    雷鋒網(公眾號:雷鋒網)了解到,在這個所謂的公共數據集項目中,其數據包括約翰·霍普金斯大學系統科學與工程中心(JHU CSSE)數據集、來自世界銀行的全球健康數據和 OpenStreetMap 數據,所有這些都將免費存儲在 Google Cloud 上——Google 也表示將與這些數據集背後的的組織提前接觸。
  • 今日Paper|蚊子叫聲數據集;提高語音識別準確率;對偶注意力推薦...
    以下是今日的精選內容——目錄提高有噪聲情況下的語音識別準確率——而且用常見工具就可以基於對偶圖注意力網絡多方面社交影響的推薦系統想研究蚊子、阻止瘧疾,你需要一個蚊子叫聲數據集用於類遞增目標檢測的交叉數據集訓練卷積均值:一種簡單的用於照度估計的卷積神經網絡提高有噪聲情況下的語音識別準確率——而且用常見工具就可以論文名稱:Improved Robust
  • 今日Paper|3D門控遞歸融合;雙注意力GAN;通用目標檢測器;無監督域...
    from=leiphonecolumn_paperreview0226推薦原因這篇論文要解決的是語義場景補全任務中的數據融合問題。RGB圖像包含對象的紋理細節,而深度圖像能捕獲與形狀補全任務具有高度相關性的幾何線索,因此同時使用RGB和深度圖像可以進一步提高語義場景補全模型的精度。
  • MIT 更新最大自然災害圖像數據集,囊括 19 種災害事件
    [ 摘要 ]麻省理工學院在最近 ECCV 2020 上提交的一篇論文中,發布了一套自然災害圖像數據集。>該研究團隊還重磅發布了一個新的事件數據集:xBD 數據集。據介紹,xBD 數據集是迄今為止第一個建築破壞評估數據集,是帶注釋的高解析度衛星圖像中規模最大、質量最高的公共數據集之一。
  • 今日Paper | 空間注意力網絡;深度信念網絡;GhostNet;位置預測等
    作者在V-COCO和HICO-DET兩個數據集上徹底地評價了VSGNet,實驗結果表明,VSGNet在V-COCO中的性能比目前最優方法高出8%或4 mAP,在HICO-DET中有16%或3 mAP的提升。
  • 從數據集到2D和3D方法,一文概覽目標檢測領域進展
    RGB-D 格式的數據集包括 Pascal VOC、COCO、ImageNet 等。雷達數據對目標檢測問題也很有用。雷達數據的收集方式是:先向目標表面發射聲波,然後使用反射信息來計算目標的速度以及與目標的距離。但是,僅靠雷達可無法收集到用於檢測和分類的信息,因此不同類型數據的融合是非常重要的。點雲數據是三維坐標系中的一組向量。
  • 生成英文維基百科文章的方法可以概述為源文檔的多文檔摘要
    在此前的研究中,監督模型的輸入範圍包括文章的第一句到整個文本,並且要對其進行端到端的訓練以預測參考摘要。由於語言理解是生成流暢摘要的先決條件,因此進行這種端到端的操作需要大量的並行的文章—摘要對。 相反,我們考慮了多文檔摘要的任務,其中,輸入是相關文檔的集合且其摘要是精煉過的。以往研究工作的著重點在提取式摘要上,從輸入中選擇句子或短語以形成摘要,而不是生成新的文本。抽象神經方法的應用存在一定的局限性,一個可能的原因是缺少大型的已標記數據集。
  • 圖鴨科技獲CVPR 2018圖像壓縮挑戰賽單項冠軍,技術解讀端到端圖像...
    、深度學習等一些新的方式引入到圖像壓縮領域。:我們展示了一種用於低碼率圖像壓縮的端到端可訓練圖像壓縮框架。引言   近期,機器學習方法被應用於有損圖像壓縮,並利用自編碼器取得了很有潛力的結果。基於典型神經網絡的圖像壓縮框架由多個模塊構成,例如自編碼器、量化器(quantization)、先驗分布模型、碼率評估和率失真優化。自編碼器用於將圖像像素 x 轉換為編碼空間 y 中的數據,編碼空間由編碼器和解碼器構成。圖像的像素值通過編碼器轉換到編碼空間。
  • 床旁診斷系統在COVID-19中的應用現狀—最新外文文獻翻譯
    僅在病毒活躍複製時才檢測到抗原。因此,此類測試最適合用於識別急性或早期感染。測試的效果取決於幾個因素:包括疾病發作的時間,標本中病毒的濃度,從人身上採集的標本的質量與其處理方式以及試劑的配方。此外,某些測試還可能識別出COVID-19以外的病毒抗原(例如來自人類冠狀病毒的抗原),這樣可能會出現假陽性結果。如果抗原檢測試驗均顯示出足夠的準確度和穩定性,那麼就可以將其用於快速篩查可能患有COVID-19的患者,從而減少或消除對昂貴的分子檢測的需求。
  • 咳兩聲就能鎖定是否為感染者!AI辨別無症狀感染者,效果顯著
    感染者咳嗽聲的AI。用戶可以每天登錄,錄下咳嗽聲到他們的手機中,並立即獲得有關他們是否可能被感染的信息。Subirana在包含了1000多個小時語音的有聲讀物數據集上訓練了神經網絡,以從「 the」和「 then」等其他詞中挑選出「 them」一詞。
  • 先融合再填充,上海交大提出少樣本圖像生成新方法F2GAN
    少樣本圖像生成(few-shot image generation)任務是指用已知類別(seen category)的大量圖片訓練出一個生成模型,然後給定某個未知類別(unseen category)的少量圖片,即可為該未知類別生成大量真實且多樣的圖片。少樣本圖像生成屬於圖像數據增廣的範疇,可用來輔助很多下遊任務,如少樣本圖像分類等。
  • 新冠檢測新方法:用咳嗽聲診斷無症狀感染者,準確率達100%
    有數據顯示,世界50%新冠(COVID-19)病例由無症狀感染者傳染。該AI算法已通過迄今為止最大的咳嗽數據集測試,無症狀感染者的診斷準確率可達到100%。第一個神經網絡代表一個人聲帶的強弱,利用有聲讀物數據集(含1000h語音)進行訓練;第二神經網絡用來區分言語中的情緒狀態。據了解,AD患者的神經功能衰退較一般人更為普遍,經常會表現出沮喪、悲傷等負面情緒。因此,研究人員利用演員表達不同情緒的大型語音數據集,開發了情緒語音分類器。第三個神經網絡在自建的咳嗽數據集上訓練,用來辨別肺和呼吸功能的變化。
  • 一文概覽目標檢測領域進展(數據集/2D/3D
    大多數點雲數據都由 3D 掃描設備生成,比如雷射雷達(2D/3D)、立體相機和 TOF(飛行時間)相機。這些設備可自動測量目標表面上大量點的信息,然後以 .LAS 和 .LAZ 這兩種標準文件格式輸出點雲。這些點雲數據是由掃描設備採集的。在用於訓練的數據集中,除了點雲數據,還有相應的 RGB 圖像。這類數據集包括 KITTI [4]、nuScenes [5]、Waymo Open [6] 等。
  • ACM MM最佳論文全文:通過多對抗訓練,從圖像生成詩歌
    Description: Generating Poetry from Images by Multi-Adversarial Training》(超越敘事描述:通過多對抗訓練,從圖像生成詩歌 )由京都大學和微軟亞洲研究院合作完成。
  • COVID-19大流行的現象動力學:調整參數的綜合分析
    本文由機器翻譯,僅供參考,感興趣請查閱論文原文核心速遞COVID-19大流行的現象動力學:調整參數的綜合分析使用SIR模型的修訂版對C0VID-19在義大利的擴散進行建模;逃脫流行病:通過少數者博弈優化運動;關於預測COVID-19流行過程的數據驅動模型的說明;全國性措施對COVID-19大流行的影響研究
  • 新冠檢測新方法:MIT用咳嗽聲診斷無症狀感染者,準確率達100%
    有數據顯示,世界50%新冠(COVID-19)病例由無症狀感染者傳染。無發燒、乏力、頭暈等明顯特徵的無症狀感染者,已在不知不覺中成為新冠病毒傳播和復發的最大威脅。近日,麻省理工學院(MIT)研究團隊聲稱其利用AI開發了一種無症狀感染檢測新方法。有意思的是,該方法利用的是人的生物特徵——咳嗽聲。