作者 | 陳大鑫
10月19日-10月23日,第29屆國際計算機學會信息與知識管理大會(CIKM 2020)在線上召開,官網:https://www.cikm2020.org/ 。
CIKM是CCF推薦的B類國際學術會議,是信息檢索和數據挖掘領域頂級學術會議之一。
今年共有兩篇論文
1、一作新加坡國立大學的《FANG: Leveraging Social Context for Fake News Detection Using Graph Representation》,
2、一 作皇家墨爾本理工大學《D o People and Neural Nets Pay Attention to the Same Words? Studying Eye-tracking Data for Non-factoid QA Evaluation》
共同獲得了最佳長論文獎:
以下介紹這兩篇最佳長論文。
1
最佳長論文一
論文連結:
https://dl.acm.org/doi/pdf/10.1145/3340531.3412046
論文介紹:
本文提出了一種新的框架FANG,它可以用於虛假新聞檢測的圖形化社會語境(上下文)表徵和學習。
FANG框架
與之前的上下文模型以性能為目標不同,本文的重點是表徵學習。與直接推理(transductive)模型相比,FANG不需要維護所有節點,在訓練中具有可伸縮性,並且在推理時效率高,無需重新處理整個圖。
FANG學習算法步驟:
我們的實驗結果表明,與最新的圖形和非圖形模型相比,FANG更善於將社會上下文信息捕捉到高保真(high fidelity )的表示中。
特別是,FANG在虛假新聞檢測方面有了顯著的提升,並且在訓練數據有限的情況下具有很強的魯棒性。
本文進一步證明FANG所學到的表徵還可以推廣到相關的任務上,例如預測新聞媒體的報導真實性。
2
最佳長論文二
論文連結:http://marksanderson.org/publications/my_papers/CIKM__Do_People_and_Neural_Networks_Pay_Attention_to_the_Same_Words_.pdf
論文介紹:
本文調查了用戶如何評估Non-factoid問題的文章長度的答案。
作者進行了一項研究,在這個研究中,答案會呈現給用戶,有時會自動高亮顯示單詞。
無高亮:
有高亮:
用戶的任務是評估答案的質量、正確性、完整性和簡潔性。答案中的單詞也會被注釋:既通過用戶標記顯式地標註,也通過從眼球追蹤獲得的用戶注視數據中隱式標註。
結果表明,答案的正確性很大程度上取決於答案的完備性,而簡潔性並不重要。對注釋詞的分析表明正確答案和不正確答案的評價是不同的。
自動 高亮顯示幫助用戶在保持準確性的同時可以更快地評估答案,特別是當高亮顯示與注釋類似時。
本文對一個Non-factoid 問答任務的BERT模型進行了微調,以檢查該模型是否關注與注釋的單詞相似的單詞。
因此,本文提出了一種利用BERT注意力圖生成建議的方法,模擬用戶評價時的眼球注視。
最後,文末附上今年所有最佳長論文的提名:
AI 科技評論將會在留言區選出 15名讀者,每人送出《機器學習實戰:基於Scikit-Learn、Keras和TensorFlow(原書第2版)》一本(在其他公號已獲贈本書者重複參加無效)。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.