ACL 是計算機語言學領域的頂級學術會議,ACL 2018 於 7 月 15 日-7 月 20 日在墨爾本召開。雷鋒網整理了多家國內企業的錄用論文。
百度
2018 年,百度有多篇論文被 ACL 2018 大會錄用。在論文《Multi-Passage Machine Reading Comprehension with Cross-Passage Answer Verification》中,百度提出了一種新的多文檔校驗的深度神經網絡建模方法 V-NET,通過注意力機制使不同文檔產生的答案之間能夠產生交換信息互相印證,從而預測出更好的答案。在論文《Joint Training of Candidate Extraction and Answer Selection in Reading Comprehension》中,百度利用強化學習的方法對串行的多文檔閱讀理解模塊進行聯合訓練。
更多論文解讀可參考《百度四篇論文被 ACL 2018 錄用,閱讀理解新進展一覽》
此外,針對多文檔閱讀理解任務,百度自然語言處理團隊發布了面向真實搜索應用的最大中文開放領域閱讀理解數據集 DuReader(包含 30 萬問題、150 萬文檔和 72 萬答案),並基於此數據集舉辦了 2018 中文閱讀理解技術評測(http://mrc2018.cipsc.org.cn/),評測共有 1062 個隊伍報名,累計提交結果 1489 次。該評測推動了機器閱讀理解技術,尤其是中文閱讀理解技術的發展。DuReader 數據集以及評測方法的論文也均被 ACL 2018 閱讀理解研討會(Workshop on Machine Reading for Question Answering)所錄用。
騰訊
騰訊 AI Lab 今年共有 5 篇論文入選,涉及到神經機器翻譯、情感分類和自動評論等研究方向。
詳細解讀可訪問《ACL 2018 | 騰訊 AI Lab 五篇入選論文》了解。
京東
京東AI研究院易津峰錄用論文《Attacking Visual Language Grounding with Adversarial Examples: A Case Study on Netural Image Captioning》。
京東矽谷研發中心 Shengqi Yang 錄用論文《A Multi-lingual Multi-task Architecture for Low Resource Sequence Labeling》。
字節跳動
《Modeling Past and Future for Neural Machine Translation》
摘要:現有的神經機器翻譯系統並沒有顯示地對已翻譯和未翻譯的內容做建模。本文提出了一種全新的機制在解碼過程中動態地將源端信息分成兩個部分:已經翻譯的內容(Past)和未翻譯的內容(Future),並且設計了兩個不同的循環神經網絡層對這兩部分進行建模。已翻譯和未翻譯的信息被動態地輸入到注意力模型和解碼器狀態中,以便使得整個神經翻譯模型更好地在當前狀態下區分已翻和未翻的內容。實驗結果表明,本文提出的模型在中英,德英和英法三個標準數據集上可以顯著地提高基線系統的性能,並且相比於覆蓋率模型獲得更好的翻譯質量和對齊質量。
以上事件在雷鋒網旗下學術頻道AI科技評論資料庫產品「AI 影響因子」中有相應加分。