論文太長不看?這個AI已經會一句話概括論文了

2020-12-09 騰訊網

原文作者:Jeffrey M. Perkel & Richard Van Noorden

某搜尋引擎的論文總結工具可以使瀏覽論文變得更簡單。

某科研搜尋引擎的開發者推出了一款可以自動用一句話概括論文的軟體,他們說該軟體可以幫助科學家更快地瀏覽論文。

這款免費工具可以生成團隊稱之為TLDR(網絡流行語「Too long, didn’t read」的首字母縮寫)的一句話總結,近日已在非營利性的艾倫人工智慧研究所(AI2)開發的搜尋引擎Semantic Scholar上線。目前,該軟體只適用於Semantic Scholar收錄的1000萬篇計算機科學論文,但是再過一個月左右,等軟體調試完畢後,它也將適用於其他學科論文,艾倫人工智慧研究所Semantic Scholar工作組負責人Dan Weld說。

Weld說初步測試顯示,該軟體能讓讀者以比瀏覽標題和摘要更快的速度梳理搜索結果,尤其是在手機上,「大家看起來挺喜歡它的。」

科研搜尋引擎Semantic Scholar的TLDR工具可以用一句話總結計算機科學論文。來源:Agnese Abrusci/Nature

4月,arXiv預印本伺服器首先發布了描述該軟體的論文,11月在一場自然語言處理大會上經過同行評議後,論文已被接收發表。研究人員已經免費公開代碼和演示網站,任何人都可以試用。

「我預計未來這種工具將成為學術檢索的標配。事實上,考慮到這方面的需求,直到現在才看到這種工具面世,讓我挺詫異的。雖然它不完美,但是方向絕對是對的。」華盛頓大學的信息科學家Jevin West說,他應《自然》的請求,對該軟體進行了測試。

Semantic Scholar的搜索結果附帶TLDR總結,圖為智慧型手機視圖。來源:Semantic Scholar

Weld開發TLDR軟體的靈感有一部分來自他的同事,這些同事會用一些精煉的語句在推特上介紹論文。和其他語言生成軟體一樣,這種工具採用的是經過大量文本訓練的深度神經網絡。該團隊收錄了上萬篇與標題匹配的研究論文,使神經網絡可以學習如何生成簡潔的句子。之後,研究人員對軟體進行了微調,並利用一套新的數據集進行訓練,數據集包含幾千篇計算機科學論文和相應的論文總結——部分由論文作者所寫,部分由一群本科生所寫。研究人員已經收集了另外16個領域的訓練實例,以提高軟體的性能;預計生物醫學論文的總結功能會最先推出。

TLDR軟體不是唯一的科學論文總結工具:Paper Digest網站自2018年起就開始提供論文總結,但是它似乎只是從原論文中提取關鍵句子,而非生成新的句子,Weld說。TLDR可以從論文摘要、引言和結論中生成一句話——基於正文內的關鍵詞組,因此,這些總結完全以已經理解論文術語的專業讀者為目標。但是,Weld說他的團隊也在開發面向非專業讀者的論文總結生成軟體。

研究團隊還計劃把這項技術授權給出版商,拓展它們的服務範圍,為領域內的關鍵論文提供個性化研究摘要。「我們才剛剛達到AI技術生成的創新論文總結能夠為人所接受的這一步。」Weld說。

參考文獻:

1. Cachola, I., Kyle, L., Cohan, A. & Weld, D. S. Preprint at https://arxiv.org/abs/2004.15011 (2020).

原文以tl;dr: this AI sums up research papers in a sentence為標題發表在 2020年11月23日的《自然》的新聞版塊上

nature

doi: 10.1038/d41586-020-03277-2

點擊閱讀原文查看英文原文

版權聲明:

本文由施普林格·自然上海辦公室負責翻譯。中文內容僅供參考,一切內容以英文原版為準。歡迎轉發至朋友圈,如需轉載,請郵件China@nature.com。未經授權的翻譯是侵權行為,版權方將保留追究法律責任的權利。

2020 Springer Nature Limited. All Rights Reserved

喜歡今天的內容嗎?喜歡就給我們一個「三連」(轉發,將公眾號設為星標,在看)吧!

相關焦點

  • 太長不看:一句話概括論文,這個AI有點東西
    某搜尋引擎的論文總結工具可以使瀏覽論文變得更簡單。某科研搜尋引擎的開發者推出了一款可以自動用一句話概括論文的軟體,他們說該軟體可以幫助科學家更快地瀏覽論文。科研搜尋引擎Semantic Scholar的TLDR工具可以用一句話總結計算機科學論文。來源:Agnese Abrusci/Nature4月,arXiv預印本伺服器首先發布了描述該軟體的論文,11月在一場自然語言處理大會上經過同行評議後,論文已被接收發表。研究人員已經免費公開代碼和演示網站,任何人都可以試用。
  • AI 軟體TLDR:可用一句話概括文章
    如果摘要太長或者邏輯混亂,就會失去它讓人快速瀏覽的意義,很有可能讓人忽略掉一篇正文內容還不錯的文章。那麼,是否可以在摘要的基礎上進一步提煉,用一句話概括文章? 答案是:AI 可以做到。 近日,一款科學搜尋引擎在其官網上就推出了這樣一款 AI 軟體——TLDR,即「太長了,沒有讀」(too long,didn’t read)的意思,該軟體可以自動生成研究論文的一句話總結。這款軟體的開發者認為,這樣可以幫助研究人員更快地瀏覽論文,減少閱讀摘要的時間。 TLDR 經常被用於網上關於科學論文的非正式討論(比如,Twitter 或 Reddit)。
  • 論文太長不想讀?「懶人神器」要不要
    作者 |徐銳 中國科學報論文太長不想讀怎麼辦?一個軟體就可以搞定。據《自然》報導,一位科學搜尋引擎的創造者推出了一款軟體,可自動為研究論文概括生成一句話摘要,他們說,這有助於科學家更快地瀏覽論文。這個免費工具被創建它的團隊稱為TLDRs(「太長,沒讀過」的縮寫),已於日前在科學搜尋引擎「語義學者」上投入使用。
  • 懶人的勝利:這年頭,連學術論文都有太長不看了丨一周科技
    論文作者在Github公開了相關設計文件、軟體以及使用指導[2]。即使是缺少專業技術培訓的人也可以自己搭建這些顯微鏡。除推動研究之外,拼裝顯微鏡也可以用於教育,幫助學生理解顯微鏡的光學原理。太長不看這年頭,連學術論文都有太長不看了。
  • 論文標題太長?分享幾個精簡標題方法
    看到一位同學的論文,瞬間被他的論文標題吸引了。論文標題40個字都不夠他用的了,那個長。百家號的文章標題限字30個,小編這篇文章是短篇文,標題字數正好卡在30個字,是不是覺得題目過於囉嗦,沒有重點?論文是具有科學性,研究性,權威性的文章,論文標題一定要關鍵詞突出,內容高度概括,且能提綱挈領。切記不能過於冗長,缺乏中心,讓讀者沒有拜讀下去的興趣。當然太短也不行,標題太短會讓讀者覺得你對論文缺乏嚴肅性。
  • 論文標題太長了?分享幾個精簡標題方法
    看到一位同學的論文,瞬間被他的論文標題吸引了。論文標題40個字都不夠他用的了,那個長。百家號的文章標題限字30個,小編這篇文章是短篇文,標題字數正好卡在30個字,是不是覺得題目過於囉嗦,沒有重點?論文是具有科學性,研究性,權威性的文章,論文標題一定要關鍵詞突出,內容高度概括,且能提綱挈領。切記不能過於冗長,缺乏中心,讓讀者沒有拜讀下去的興趣。當然太短也不行,標題太短會讓讀者覺得你對論文缺乏嚴肅性。
  • AI基礎:入門人工智慧必看的論文
    來,看看這個!EfficientNet模型的論文地址如下:https://arxiv.org/pdf/1905.11946.pdf No9  Grad-CAM模型論文:如果你能把神經元搞得透徹,你也會想到這個點子。不想聊太多!一個字「絕」!這TMD才叫卷積網絡的可視化!
  • 2020最佳AI論文,都在這裡了
    這個 AI 也有很大用處,比如警察辦案查找疑犯,或者各種需要大量「真」人頭像填充的設計用途。但同時值得提及的是,不合理的使用這項技術可能會引發道德問題。比如,今年就有一些海外媒體曾被爆出,一些評論員文章的作者其實都是假的,這些人有偽造的姓名、供職單位和教育經歷,再配上一張頭像,創建一個社交網絡帳號,迷惑性極強。
  • sci論文等的時間太長能撤稿嗎
    不是所有發表的sci論文都會在期刊規定期限左右給出答覆。等的時間太長,雖不常見但也存在,怎麼辦?作者想撤稿卻又不知道能不能。那麼,sci論文等的時間太長能撤稿嗎?撤稿是發表sci論文過程中一種常見狀況。依照相關規定,只要sci論文沒有見刊,就可以撤稿。
  • 論文標題取名指南
    這個結果你猜到了嗎? 剛剛這個例子,是我舉的個例呢,還是一種普遍現象,下面來給大家具體分析一下。 回想一下,你在什麼場景下會比較關注一篇文章的標題,我列舉一些場景。 看到一篇參考文獻,論文標題好像和你的研究相關。
  • 太實用了!學術論文的「八股」寫作法
    題名是反映一篇學術論文研究範圍、論點與水平的第一個重要信息。常言說看書先看皮(書名),看文先看題(標題),其重要性可概括為一句話「題好一半文」。一般學術論文不需要副題名,但是下列情況可以有副題名:題名語意未盡,用副題名補充說明報告論文中的特定內容;論文分冊出版,或是一系列工作分幾篇報導,或是分階段的研究結果,各用不同副題名區別其特定內容;其他有必要用副題名作為引申或說明者。
  • 斯坦福發布2019全球AI報告:中國論文數量超美國,但論文影響力比美國低50%
    報告顯示中國AI論文數量超美國,但論文影響力美國比中國高50%;AI人才辭去學術界教職進入產業界的速度加快;自動駕駛最受投資者的青睞……現在戳右邊連結上 新智元小程序 了解更多!2019年已經接近尾聲,今年AI發展如何呢?近日,斯坦福聯合MIT、哈佛、OpenAI等院校和機構發布了"2019年度AI指數報告"。
  • APA格式論文寫作方法
    最近,有同學在學習的過程中不知道怎麼用APA格式寫出一篇上乘的論文,特別來找小光求助。小光明白同學們在英語寫作課中了解了一些方法,但由於隔得時間太長以及之前上傳作業的網站更改了地址而不能很好地複習。第三段寫造成這個現象的原因,舉出一些例子簡單說明一下即可。第四段寫我們研究這個課題的目標以及期望找到什麼樣的結果。第五段正式寫出我們研究的課題。
  • AI基礎:論文寫作工具
    在Overleaf使用Latex進行論文編輯,隨時可以轉化成PDF看效果;寫一句話時,塑料英語不知道如何下筆,谷歌翻譯中翻英幫忙確立句子輪廓;粘貼到Grammarly中進行修改,過程中根據語法錯誤提示,避免低級錯誤,對那些常用詞進行同義替換(常見詞往往不精準);如果遇到了一些詞語不知道如何搭配,Linggle通過通配符匹配,給出文獻中使用的頻率和例句。
  • 看國外的逗逼們怎麼向外行人描述自己的畢業論文?
    (圖片來自Discovery節目HOW WE GOT HERE)一篇長達幾十頁、甚至上百頁的畢業論文中融匯了人們的學習和思考成果,但對於大多數人來說,許多論文標題看上去就深澀無比,更別提裡面的內容了。論文概述:水母和人類不太一樣。(哈佛大學,人類學)
  • 一篇優秀的SCI論文標題該怎麼處理?這個技巧同樣適用於SSCI論文
    如今很多學術人對小易說,論文的標題不知道怎麼去起,遇到這些難題的人,相信不再少數,小易要和你說,標題很重要,不要說什麼標題黨之類的話,沒有一個好標題,讀者可能連看的興趣都沒有,那還怎麼去傳播呢?讀者的閱讀順序一定是先看標題,再看摘要、然後是圖表,如果依然感興趣,那麼就會閱讀全文。
  • 【學術技巧】論文答辯,老師會仔細看論文內容嗎?
    有同學問,我要參加學位論文答辯,老師會仔細看論文內容嗎?看看大家怎麼回答?不過本科論文就真沒啥好說了……大部分本科論文只要你別抄的太過火就不會卡。而且答辯老師貌似的確不咋看本科論文,總共不到兩三萬字,真沒什麼仔細看的必要,聽你在臺上講五分鐘基本上心裡就有數了。當然牛x大學的本科論文另算。這方面還是要具體諮詢各校自己人,沒法統一講。
  • 【源頭活水】NeurIPS 2020 Federated Learning(一句話論文系列)
    不知不覺,距離上次寫完ICML 2020的Federated Learning論文解讀系列已經兩個月了。
  • 2018 年重磅復盤:中國產出全球 25% AI 論文、政府署名 AI 論文...
    神經網絡論文在 2010 年——2014 年的複合年增長率(CAGR)為 3 %,而這個數值在 2014 年——2017 年期間則是 37 %。2014 年,30% 的 AI 專利源自美國,韓國和日本分別以 16% 排在第二、第三。
  • 圍觀騰訊 AI Lab 的4篇 ICML 入選論文 | ICML 2017
    作者們在所提的算法中加入了一個約束邊界,它是網絡大小和拓撲形式的函數,對於更小的圖或者連接狀況更好的圖,這個邊界就會越小。根據兩個真實的大規模數據集進行的多類別分類任務實驗表明了所提算法帶來的計算優勢,並且驗證了理論的約束邊界。