論文「太長不想讀」?人工智慧新軟體可生成一句話摘要

2020-12-02 光明網
TLDR軟體為科學搜尋引擎「語義學者」上的一篇計算機科學論文生成一句話摘要。圖片來源:Agnese Abrusci/Nature

論文太長不想讀怎麼辦?一個軟體就可以搞定。

據《自然》報導,一位科學搜尋引擎的創造者推出了一款軟體,可自動為研究論文概括生成一句話摘要,他們說,這有助於科學家更快地瀏覽論文。

這個免費工具被創建它的團隊稱為TLDRs(「太長,沒讀過」的縮寫),已於日前在科學搜尋引擎「語義學者」上投入使用。「語義學者」是美國艾倫人工智慧研究所(AI2)創建的搜尋引擎。

AI2語義學者小組管理者Dan Weld表示,目前,TLDR軟體只用於語義學者所涵蓋的1000萬篇計算機科學論文,軟體經過微調後——預計在12月左右,其他學科的論文應該也能通過該軟體自動生成一句話摘要。

初步測試表明,與查看標題和普通論文摘要相比,TLDR軟體能夠幫助讀者更快對搜索結果進行排序,尤其是在手機上。「人們似乎真的很喜歡這個工具。」Weld說。

Weld創造TLDR軟體的靈感來源於同事在推特上分享的一些標記文章的簡短句子。與其他語言生成軟體一樣,該工具採用基於大量文本的深層神經網絡學習。研究團隊創建了數萬篇與標題匹配的研究論文,這樣網絡就可以學會生成簡潔的句子。然後,研究人員對該軟體進行微調,訓練一個新的數據集,將論文和摘要匹配起來,這些數據集由幾千篇計算機科學論文組成,其中一些論文的摘要由論文作者撰寫,另一些論文摘要則由本科生撰寫。該團隊已經收集了一些培訓實例,以提高該軟體在其他16個研究領域的性能,其中生物醫學可能是第一位的。

一份描述TLDR軟體的論文4月1日在預印本平臺arXiv上首次發布,並在11月接受同行評審後發表。研究人員已經免費提供了代碼,還有一個可以使用該軟體的演示網站,任何人都可以試用這個工具。

「我預測這種工具在不久的將來會成為學術搜索的標準功能。事實上,考慮到需求,我很驚訝過了這麼久才將其投入實際應用。」華盛頓大學信息科學家Jevin West說,他應《自然》的要求對該工具進行了測試。「這個工具並不完美,但絕對是朝著正確方向邁出的一步。」(徐銳)

來源: 《中國科學報》

相關焦點

  • 論文「太長不想讀」?人工智慧新軟體可生成一句話摘要
    「語義學者」上的一篇計算機科學論文生成一句話摘要。論文太長不想讀怎麼辦?一個軟體就可以搞定。據《自然》報導,一位科學搜尋引擎的創造者推出了一款軟體,可自動為研究論文概括生成一句話摘要,他們說,這有助於科學家更快地瀏覽論文。
  • 自動生成一句話摘要的人工智慧新軟體問世—新聞—科學網
  • 論文太長不想讀?「懶人神器」要不要
    作者 |徐銳 中國科學報論文太長不想讀怎麼辦?一個軟體就可以搞定。據《自然》報導,一位科學搜尋引擎的創造者推出了一款軟體,可自動為研究論文概括生成一句話摘要,他們說,這有助於科學家更快地瀏覽論文。這個免費工具被創建它的團隊稱為TLDRs(「太長,沒讀過」的縮寫),已於日前在科學搜尋引擎「語義學者」上投入使用。
  • 論文太長不看?這個AI已經會一句話概括論文了
    Perkel & Richard Van Noorden 某搜尋引擎的論文總結工具可以使瀏覽論文變得更簡單。 某科研搜尋引擎的開發者推出了一款可以自動用一句話概括論文的軟體,他們說該軟體可以幫助科學家更快地瀏覽論文。
  • 太長不看:一句話概括論文,這個AI有點東西
    某搜尋引擎的論文總結工具可以使瀏覽論文變得更簡單。某科研搜尋引擎的開發者推出了一款可以自動用一句話概括論文的軟體,他們說該軟體可以幫助科學家更快地瀏覽論文。這款免費工具可以生成團隊稱之為TLDR(網絡流行語「Too long, didn’t read」的首字母縮寫)的一句話總結,近日已在非營利性的艾倫人工智慧研究所(AI2)開發的搜尋引擎Semantic Scholar上線。
  • AI 軟體TLDR:可用一句話概括文章
    如果摘要太長或者邏輯混亂,就會失去它讓人快速瀏覽的意義,很有可能讓人忽略掉一篇正文內容還不錯的文章。那麼,是否可以在摘要的基礎上進一步提煉,用一句話概括文章? 答案是:AI 可以做到。 近日,一款科學搜尋引擎在其官網上就推出了這樣一款 AI 軟體——TLDR,即「太長了,沒有讀」(too long,didn’t read)的意思,該軟體可以自動生成研究論文的一句話總結。這款軟體的開發者認為,這樣可以幫助研究人員更快地瀏覽論文,減少閱讀摘要的時間。 TLDR 經常被用於網上關於科學論文的非正式討論(比如,Twitter 或 Reddit)。
  • NeurIPS』20大意了沒有閃,被一句話超短摘要偷襲1900篇論文!
    他們說我這個不行,我說我這個行,他們說他們甚至懶得讀論文的摘要,我說好吧,那嫩們要不要試試看我的閃電閱讀法:好吧,閃電閱讀法可能有些難學,今天陳老師給大家介紹一個刷NeurIPS論文列表的神器,幫助大家高效地有選擇性的閱讀。
  • arXiv灌水機:自動生成論文標題、摘要信息,還有40+奇妙AI應用
    梅寧航 發自 凹非寺量子位 報導 | 公眾號 QbitAI「無聊的人類」,還在為寫不出論文摘要發愁嗎?無趣的直立猿,還在為辛辛苦苦湊字數撓頭嗎?有個網站適合你,無聊的人類。真的叫無聊的人類。△boredhumans這個網站目的在於「通過網際網路向大眾展示人工智慧。」
  • arXiv灌水機:機器自動生成論文標題、摘要信息,還有40+奇妙AI應用
    △boredhumans這個網站目的在於「通過網際網路向大眾展示人工智慧。」裡面可以說應有盡有,從簡單的寫文章到畫油畫,乃至於人臉生成都可以,足足有40+款應用。眼花繚亂,應有盡有。讓AI幫我們寫篇論文摘要吧,畢竟,生產力才是最重要的。
  • 摘要翻譯、論文寫作、信息檢索、抄襲檢測……人工智慧延伸科學...
    據介紹,運用自然語言處理技術,小柯以英文論文摘要為基礎,能夠快速寫出中文科學新聞底稿,然後由專業人士和報社的編輯進行把關和信息完善,幫助科學家以中文方式快速獲取全球高水平英文論文中的最新科研進展。  目前小柯的作品已經上線。人工智慧的觸角,也在伸向各個領域。
  • 滴滴KDD 2019 論文詳解:基於深度學習自動生成客服對話摘要
    本次KDD大會首次採用雙盲評審制,共吸引了全球範圍內約1879篇論文投遞。其中,Applied Data Science track收到約 700 篇論文投稿,最終45篇被接收為Oral論文,100篇被接收為Poster論文;而Research track 共收到了 1179 篇投稿,最終111篇被接收為Oral論文,63篇被接收為Poster論文。
  • 沈向洋:讀論文的三個層次
    另外,現在在網上很容易找到與你閱讀相關的東西,所以坐下來長時間專注於閱讀一篇長文章或者一本書變得比以前困難很多。著名科學家Don Geman曾提到:一篇論文實際上有標題、摘要、引言、論文主體(The restof the paper)組成,論文四個部分的每一部分都需要花同樣的時間進行撰寫。所以,對論文進行快速閱讀需要著重關注論文的標題、摘要和引言,如此便能了解論文是否值得讀、能夠從論文中讀到些什麼。論文最重要,也是最難寫的部分是引言。
  • 如何撰寫跨學科論文摘要?
    將研究成果與其他領域聯繫起來說實話,很多人並不會讀摘要以外的部分,要麼是因為他們時間有限,要麼是因為他們沒有訪問全文的權限。當您撰寫摘要時,請想像一下讀者腦海中的問題:「這項研究和我的研究問題有什麼關係?」當您嘗試與更大的讀者群體建立聯繫時,這一點尤其重要。針對這個問題,我們建議您強調研究成果對其他學科或日常生活的意義。
  • Pointer Network 生成文本摘要
    而文章摘要是 NLP 中一個比較重要的領域,常見的文章摘要方法可以分為抽取式摘要和生成式摘要。抽取式摘要主要從源文檔中提取現成的句子作為摘要句,一般在語句流暢程度上比生成式摘要好,但是容易引入較多的冗餘信息。生成式摘要主要根據源文檔內容,通過算法模型生成摘要,而非提取原文的句子。
  • 文章太長不想看?ML 文本自動摘要了解一下
    但是,如果將一篇很長的文章歸納成一個能夠涵蓋原文中心思想的小段落,則需要我們耗費大量時間。本文介紹了自然語言處理中的兩種文本自動摘要生成方法——抽取式和抽象式文本摘要。這兩種方法通過計算文本中句子成分的權重來生成摘要,可以大大節省通讀全文以及歸納總結主要信息的時間,為讀者提供方便。你是否曾將一篇冗長的文檔歸納為一個小的段落?你用了多長時間呢?手動歸納總結耗費時間、枯燥乏味。
  • 太實用了!學術論文的「八股」寫作法
    題名是反映一篇學術論文研究範圍、論點與水平的第一個重要信息。常言說看書先看皮(書名),看文先看題(標題),其重要性可概括為一句話「題好一半文」。一般學術論文不需要副題名,但是下列情況可以有副題名:題名語意未盡,用副題名補充說明報告論文中的特定內容;論文分冊出版,或是一系列工作分幾篇報導,或是分階段的研究結果,各用不同副題名區別其特定內容;其他有必要用副題名作為引申或說明者。
  • 不可不知8個超強大英國論文查重率及reference生成軟體
    所以剛來英國讀書的小夥伴們要注意,英國的論文和中國大學式的論文區別還是很大的,英國對待論文抄襲的態度非常謹慎嚴格,除了口頭警告恐嚇,還要籤署保證文件。有些小夥伴認為,論文大部分都是自己寫的,肯定不存在抄襲問題。可這也不一定,畢竟英語語法句式就那麼幾種,描述同一個意思的詞彙又不像中文那樣多樣性,因此還是會存在被認為是抄襲的機率。
  • 寫論文摘要需要注意什麼?哪款翻譯軟體最好用?
    摘要是論文的重要組成部分,是文章的靈魂,那麼摘要具體該怎麼寫呢?用什麼翻譯軟體比較好?既然論文的摘要部分這麼重要,那麼今天我們就來分享一下論文摘要的寫作注意要點以及好用的翻譯軟體。一、論文摘要寫作的注意要點:1、 結構要嚴謹,語義表達確切。寫摘要的時候要根據邏輯順序來安排先寫什麼,後寫什麼,句子之間要相互呼應,上下連貫。句型要簡單明了,慎用複雜長句。每句話要表達清楚內容,無空乏籠統之詞。
  • 各類論文摘要寫作方法全解
    本文詳細介紹摘要的作用和目的、摘要的基本要求、五個要素的具體要求與相關句型及舉例、摘要的基本結構。本文所考慮的摘要既適合期刊論文、也適合學位論文和其它研究報告。四、要素二的具體要求、句型與舉例(動機)摘要的動機一般要求簡練,除非要另外聲明研究目標的意義。一般情況下,動機可以用簡短的一句話概括。例如,a) 這裡,我們證明/研究/提出/解決/報導...。
  • 科技論文英文摘要的寫作基本要領分析
    科技論文英文摘要的寫作目的,主要是讓國外讀者了解該論文的主要信息,同時也為科技情報研究人員提供文獻檢索途徑。因此,科技論文英文摘要文體應當具有相對獨立性,是一篇完整的並獨立於科技論文正文的短文,可作為一種閱讀和檢索的功能文體,能夠被單獨使用。