為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。以下是今日的精選內容——
目錄
Weak Supervision for Fake News Detection via Reinforcement LearningUnsupervised Detection of Sub-events in Large Scale DisastersQuantum Logic Gate Synthesis as a Markov Decision ProcessDeep neural network models for computational histopathology: A surveyRecognizing Instagram Filtered Images with Feature De-stylizationTextScanner: Reading Characters in Order for Robust Scene Text RecognitionOrdered Reliability Bits Guessing Random Additive Noise DecodingPublishing computational research -- A review of infrastructures for reproducible and transparent scholarly communicationLet's Share: A Game-Theoretic Framework for Resource Sharing in Mobile Edge Clouds 基於強化學習的虛假新聞檢測弱監督
論文名稱:Weak Supervision for Fake News Detection via Reinforcement Learning
作者:Wang Yaqing /Yang Weifeng /Ma Fenglong /Xu Jin /Zhong Bin /Deng Qiang /Gao Jing
發表時間:2019/12/28
論文連結:https://paper.yanxishe.com/review/7954
推薦理由:這篇論文被AAAI 2020接收,考慮的是虛假新聞檢測的問題。
通過社交媒體平臺,虛假新聞可以以前所未有的速度進行傳播。最近基於深度學習的方法在虛假新聞檢測任務中取得了令人欣喜的性能表現,但是訓練此類模型需要大量標註數據,同時由於新聞的動態性質,帶標註的樣本可能會很快過時,無法代表新出現事件的新聞報導。因此如何獲得新鮮且高質量的標註樣本是將深度學習模型用於虛假新聞檢測的主要挑戰。為了解決這個問題,這篇論文提出了一個基於強化學習的弱監督虛假新聞檢測算法WeFEND,該框架利用用戶報告作為弱監督數據,從而擴大了訓練數據的規模。WeFEND主要由標註模塊,強化選擇模塊和虛假新聞檢測模塊構成。其中標註模塊可以根據用戶的報告為未標註的新聞自動分配弱標籤,基於強化學習的強化選擇模塊從弱標註數據中選擇高質量的樣本,並過濾掉那些可能降低檢測器預測性能的低質量樣本,虛假新聞檢測模塊則專注於根據新聞內容識別假新聞。文章在微信官方帳戶發布的大量新聞文章和相關的用戶報告上測試了其提出的WeFEND,實驗結果表明,與最新的方法相比,WeFEND模型具有最佳的性能表現。
大規模災害中子事件的無監督檢測
論文名稱:Unsupervised Detection of Sub-events in Large Scale Disasters
作者:Arachie Chidubem /Gaur Manas /Anzaroot Sam /Groves William /Zhang Ke /Jaimes Alejandro
發表時間:2019/12/13
論文連結:https://paper.yanxishe.com/review/7955
推薦理由:在自然災害(例如颶風,大型火災)發生期間及之後,社交媒體往往扮演重要角色,因為人們在社交媒體上提供了有關實情的有用信息。給定大量的用戶發帖,難點是如何從中得到可靠而重要的信息,以便急救人員可以及時計劃和部署資源。這篇論文要解決的正是自動識別重要子事件的問題(這些子事件存在於大規模緊急事件中,例如颶風)。具體而言,研究者提出一種新的無監督學習框架,可以檢測推文中的子事件,以進行回顧性危機分析。這個框架首先從原始推文中抽取動名詞對和短語作為子事件的候選,然後從抽取到的詞對和短語上學習一個語義嵌入,並與一個危機專用譜系對比進行關聯度排序。接著過濾掉噪音和不正確的信息,然後將動名詞對和短語進行聚類,使得排在前面的候選是描述最重要子事件的。通過在Hurricane Harvey和2015 Nepal Earthquake這兩個真實數據集上的實驗證明了這篇論文提出的框架取得了最佳性能。
量子邏輯門綜合作為馬爾可夫決策過程
論文名稱:Quantum Logic Gate Synthesis as a Markov Decision Process
作者:Alam M. Sohaib
發表時間:2019/12/27
論文連結:https://paper.yanxishe.com/review/7949
推薦理由:強化學習見證了量子編程中各種任務的最新應用。基本假設是,這些任務可以建模為馬爾可夫決策過程(MDP)。
本文中,作者通過探索該假設對量子編程中兩個最簡單的任務的影響來研究該假設的可行性:狀態準備和門編譯。通過形成離散的MDP,僅專注於單量子位的情況,就可以通過策略迭代來精確求解最優策略。作者找到了與門的最短可能序列相對應的最佳路徑,以準備狀態或編譯門,達到某種目標精度。例如,作者發現長度為11的H和T門的序列對於(HT)^ {n} | 0>形式的狀態產生約99%的保真度,其值最大為n = 10 ^ {10}。。這項工作提供了有力的證據,說明強化學習可以用於較大的量子位空間的最佳狀態準備和門編譯。
用於計算組織病理學的深度神經網絡模型:一項調查
論文名稱:Deep neural network models for computational histopathology: A survey
作者:Srinidhi Chetan L. /Ciga Ozan /Martel Anne L.
發表時間:2019/12/28
論文連結:https://paper.yanxishe.com/review/7950
推薦理由:組織病理學圖像包含豐富的表型信息,可用於監測促成疾病進展和患者生存結果的潛在機制。
最近,深度學習已成為分析和解釋癌症組織學圖像的主流方法論選擇。在本文中,作者對組織病理學圖像分析中使用的最新深度學習方法進行了全面回顧。通過對130餘篇論文的調查,作者根據不同機器學習策略的方法論方面(例如有監督,弱監督,無監督,遷移學習和這些方法的其他子變量)回顧了領域的進展。作者還概述了適用於特定疾病的預後任務的基於深度學習的生存模型。最後,其總結了幾個現有的開放數據集,並重點介紹了當前深度學習方法的關鍵挑戰和局限性以及未來研究的可能途徑。
利用特徵去樣式化識別Instagram過濾圖像
論文名稱:Recognizing Instagram Filtered Images with Feature De-stylization
作者:Wu Zhe /Wu Zuxuan /Singh Bharat /Davis Larry S.
發表時間:2019/12/30
論文連結:https://paper.yanxishe.com/review/7953
推薦理由:這篇論文被AAAI 2020接收,考慮的是深度神經網絡模型對於照片濾鏡的魯棒能力。
這篇論文研究一些著名的預訓練模型是如何被Instagram自帶濾鏡影響的,進而引入一個ImageNet的帶濾鏡數據集ImageNet-Instagram,其中對每一張ImageNet圖像使用了20種有名的Instagram濾鏡。研究發現,那些簡單保留結構的濾鏡,例如僅僅只對一幅圖的整體作修飾,能導致卷積特徵空間極大的不同。為提高模型的泛化能力,研究者引入一種輕量級去風格化(de-stylization)模塊,該模塊能預測用於變粒度或特徵轉換的參數,以撤銷被濾鏡處理過的圖像。研究者進一步證明所提模塊能插入CNN結構。在所構建的新數據集上的對比實驗表明了所提模塊的有效性。
TextScanner:讀取字符以實現健壯的場景文本識別
論文名稱:TextScanner: Reading Characters in Order for Robust Scene Text Recognition
作者:Wan Zhaoyi /He Mingling /Chen Haoran /Bai Xiang /Yao Cong
發表時間:2019/12/28
論文連結:https://paper.yanxishe.com/review/7951
推薦理由:這是曠視研究院的工作,要解決場景文本識別的問題。
在場景文字識別問題上,基於RNN注意力的方法在該領域佔主導地位,但這些方法在某些情況下會存在注意力漂移問題。最近基於語義分割的算法已被證明可以有效地識別不同形式(水平方向、其他方向或者彎曲)的文本,但是這些方法可能會產生虛假字符或遺漏真實字符。為了解決這些問題,這篇論文提出了一個新方法TextScanner,其主要有以下三個特徵:1、它針對字符類、位置和順序生成了像素級的多通道分割圖;2、它也採用RNN進行上下文建模;3、此外它對字符位置和類別進行並行預測,並確保以正確的順序轉錄字符。在標準基準數據集上進行的實驗表明,TextScanner的性能優於最新方法,而且TextScanner在識別較困難的文本(例如中文成績單)方面顯示出巨大優勢。
猜測隨機加性噪聲解碼的有序可靠性比特
論文名稱:Ordered Reliability Bits Guessing Random Additive Noise Decoding
作者:Duffy Ken R.
發表時間:2020/1/2
論文連結:https://paper.yanxishe.com/review/7960
推薦理由:猜測隨機加性噪聲解碼(GRAND)可以解碼任何前向糾錯塊代碼。原始算法假設解碼器僅接收經過解調的硬判決,以告知其解碼。由於已知合併軟信息可提高解碼精度,因此作者在此引入有序可靠性位GRAND,即對於長度為n的二進位塊代碼,其不超過與代碼本無關的log2(n)位的量化 每個接收位的軟檢測信息,以確定準確的解碼。
事實證明,ORBGRAND具有比CA-SCL(一種最新的CA-Polar解碼器)更好的塊錯誤率性能,並且複雜度低。用ORBGRAND解碼的相同速率的隨機線性代碼顯示出可比的塊錯誤和複雜性性能。
發布計算研究-審查可重複且透明的學術交流的基礎架構
論文名稱:Publishing computational research -- A review of infrastructures for reproducible and transparent scholarly communication
作者:Konkol Markus /Nüst Daniel /Goulier Laura
發表時間:2020/1/2
論文連結:https://paper.yanxishe.com/review/7961
推薦理由:資助機構越來越多地要求申請人將數據和軟體管理計劃納入提案中。此外,科學期刊和會議的作者指南通常包含有關數據可用性的聲明,並且一些審稿人拒絕不可重複的提交。開放科學的趨勢增加了作者的壓力,要求他們提供訪問其科學論文中計算結果基礎的原始碼和數據的權限。儘管如此,發布可複製的文章仍然是一項艱巨的任務,而不能僅通過提供對代碼腳本和數據文件的訪問來實現。因此,一些項目開發了解決方案,以支持可執行分析的發布以及考慮了上述利益相關者需求的文章。
本文的主要貢獻是對應用程式的綜述,該應用程式解決了發布可執行的計算研究結果的問題。作者比較了與所涉利益相關者相關的屬性之間的方法,例如提供的功能和部署選項,還嚴格討論了趨勢和局限性。審查可以支持出版商決定將哪種系統集成到其提交過程中,編輯可以為研究人員推薦工具,以及科學論文的作者遵循可重複性原則。
讓我們分享:移動邊緣雲中資源共享的博弈論框架
論文名稱:Let's Share: A Game-Theoretic Framework for Resource Sharing in Mobile Edge Clouds
作者:Zafari Faheem /Leung Kin K. /Towsley Don /Basu Prithwish /Swami Ananthram /Li Jian
發表時間:2020/1/2
論文連結:https://paper.yanxishe.com/review/7959
推薦理由:移動邊緣計算試圖為不同的延遲敏感型應用程式提供資源。因為邊緣雲服務提供商可能沒有足夠的資源來滿足所有資源請求,所以這是一個具有挑戰性的問題。此外,將可用資源最佳地分配給不同的應用程式也具有挑戰性。不同邊緣雲服務提供商之間的資源共享可以解決上述限制,因為某些服務提供商可能擁有可被其他服務提供商``租用''的可用資源。但是,邊緣雲服務提供商可以有不同的目標或\ emph {utilities}。因此,需要一種有效且有效的機制來在服務提供商之間共享資源,同時考慮各種提供商的不同目標。
本文中作者將資源共享建模為一個多目標優化問題,並提出了基於\ emph {合作博弈論}(CGT)的解決方案框架。作者考慮以下策略:每個服務提供商首先將資源分配給其本機應用程式,然後與其他服務提供商的應用程式共享剩餘的資源。我們證明,對於單調,不遞減的效用函數,該博弈是規範的和凸的。因此,\ emph {core}不為空,大聯盟穩定。我們提出兩種算法\ emph {博弈論的帕累託最優分配}(GPOA)和\ emph {基於一夫多妻制的帕累託最優分配}(PPMPOA),它們從核心提供分配。因此,所獲得的分配是\ emph {Pareto}最優的,並且所有服務提供商的總體聯盟都是穩定的。
實驗結果證實,作者提出的資源共享框架提高了邊緣雲服務提供商的實用程序和應用程式請求的滿意度。
雷鋒網雷鋒網雷鋒網