論文「太長不想讀」?人工智慧新軟體可生成一句話摘要

2020-12-02 騰訊網

TLDR軟體為科學搜尋引擎「語義學者」上的一篇計算機科學論文生成一句話摘要。圖片來源:Agnese Abrusci/Nature

論文太長不想讀怎麼辦?一個軟體就可以搞定。

據《自然》報導,一位科學搜尋引擎的創造者推出了一款軟體,可自動為研究論文概括生成一句話摘要,他們說,這有助於科學家更快地瀏覽論文。

這個免費工具被創建它的團隊稱為TLDRs(「太長,沒讀過」的縮寫),已於日前在科學搜尋引擎「語義學者」上投入使用。「語義學者」是美國艾倫人工智慧研究所(AI2)創建的搜尋引擎。

AI2語義學者小組管理者Dan Weld表示,目前,TLDR軟體只用於語義學者所涵蓋的1000萬篇計算機科學論文,軟體經過微調後——預計在12月左右,其他學科的論文應該也能通過該軟體自動生成一句話摘要。

初步測試表明,與查看標題和普通論文摘要相比,TLDR軟體能夠幫助讀者更快對搜索結果進行排序,尤其是在手機上。「人們似乎真的很喜歡這個工具。」Weld說。

Weld創造TLDR軟體的靈感來源於同事在推特上分享的一些標記文章的簡短句子。與其他語言生成軟體一樣,該工具採用基於大量文本的深層神經網絡學習。研究團隊創建了數萬篇與標題匹配的研究論文,這樣網絡就可以學會生成簡潔的句子。然後,研究人員對該軟體進行微調,訓練一個新的數據集,將論文和摘要匹配起來,這些數據集由幾千篇計算機科學論文組成,其中一些論文的摘要由論文作者撰寫,另一些論文摘要則由本科生撰寫。該團隊已經收集了一些培訓實例,以提高該軟體在其他16個研究領域的性能,其中生物醫學可能是第一位的。

一份描述TLDR軟體的論文4月1日在預印本平臺arXiv上首次發布,並在11月接受同行評審後發表。研究人員已經免費提供了代碼,還有一個可以使用該軟體的演示網站,任何人都可以試用這個工具。

「我預測這種工具在不久的將來會成為學術搜索的標準功能。事實上,考慮到需求,我很驚訝過了這麼久才將其投入實際應用。」華盛頓大學信息科學家Jevin West說,他應《自然》的要求對該工具進行了測試。「這個工具並不完美,但絕對是朝著正確方向邁出的一步。」(徐銳)

來源:《中國科學報》

—— 分享新聞,還能獲得積分兌換好禮哦 ——

相關焦點

  • 論文太長不想讀?「懶人神器」要不要
    作者 | 徐銳論文太長不想讀怎麼辦?一個軟體就可以搞定。據《自然》報導,一位科學搜尋引擎的創造者推出了一款軟體,可自動為研究論文概括生成一句話摘要,他們說,這有助於科學家更快地瀏覽論文。這個免費工具被創建它的團隊稱為TLDRs(「太長,沒讀過」的縮寫),已於日前在科學搜尋引擎「語義學者」上投入使用。「語義學者」是美國艾倫人工智慧研究所(AI2)創建的搜尋引擎。
  • AI攢論文指日可待?Transformer生成論文摘要方法已出
    在開始正文前,請讀者們先讀下面一段摘要:譯文:「我們提出了一種通過神經摘要為超過數千詞的長文本生成抽象摘要的方法。我們先在生成摘要之前執行一個簡單的抽取步驟,然後再將其用於在相關信息上調整 transformer 語言模型,之後將其用於生成摘要。我們表明這個抽取步驟能顯著提升摘要結果。
  • 摘要翻譯、論文寫作……人工智慧延伸科學交流觸角
    | 字號:A+ | A- 摘要翻譯、論文寫作、信息檢索、抄襲檢測……人工智慧延伸科學交流觸角近日,一款看起來挺有文化的寫稿機器人上線了。據介紹,運用自然語言處理技術,小柯以英文論文摘要為基礎,能夠快速寫出中文科學新聞底稿,然後由專業人士和報社的編輯進行把關和信息完善,幫助科學家以中文方式快速獲取全球高水平英文論文中的最新科研進展。目前小柯的作品已經上線。人工智慧的觸角,也在伸向各個領域。
  • arXiv灌水機:自動生成論文標題、摘要信息,還有40+奇妙AI應用
    梅寧航 發自 凹非寺量子位 報導 | 公眾號 QbitAI「無聊的人類」,還在為寫不出論文摘要發愁嗎?無趣的直立猿,還在為辛辛苦苦湊字數撓頭嗎?有個網站適合你,無聊的人類。真的叫無聊的人類。△boredhumans這個網站目的在於「通過網際網路向大眾展示人工智慧。」
  • 懶人的勝利:這年頭,連學術論文都有太長不看了丨一周科技
    本周好消息:現在,有些paper連摘要也不用看了……拼裝顯微鏡本周發表於《自然-通訊》的一篇論文展示了一種可以自行拼裝的廉價光學顯微鏡[1]。通過「拼裝顯微鏡」可以得到與市面上產品類似的成像效果,同時所需的花費則低得多,而且使用方法也更加靈活。
  • arXiv灌水機:機器自動生成論文標題、摘要信息,還有40+奇妙AI應用
    △boredhumans這個網站目的在於「通過網際網路向大眾展示人工智慧。」裡面可以說應有盡有,從簡單的寫文章到畫油畫,乃至於人臉生成都可以,足足有40+款應用。眼花繚亂,應有盡有。讓AI幫我們寫篇論文摘要吧,畢竟,生產力才是最重要的。
  • 摘要翻譯、論文寫作、信息檢索、抄襲檢測……人工智慧延伸科學...
    據介紹,運用自然語言處理技術,小柯以英文論文摘要為基礎,能夠快速寫出中文科學新聞底稿,然後由專業人士和報社的編輯進行把關和信息完善,幫助科學家以中文方式快速獲取全球高水平英文論文中的最新科研進展。  目前小柯的作品已經上線。人工智慧的觸角,也在伸向各個領域。
  • 不可不知8個超強大英國論文查重率及reference生成軟體
    所以剛來英國讀書的小夥伴們要注意,英國的論文和中國大學式的論文區別還是很大的,英國對待論文抄襲的態度非常謹慎嚴格,除了口頭警告恐嚇,還要籤署保證文件。有些小夥伴認為,論文大部分都是自己寫的,肯定不存在抄襲問題。可這也不一定,畢竟英語語法句式就那麼幾種,描述同一個意思的詞彙又不像中文那樣多樣性,因此還是會存在被認為是抄襲的機率。
  • 沈向洋:讀論文的三個層次
    另外,現在在網上很容易找到與你閱讀相關的東西,所以坐下來長時間專注於閱讀一篇長文章或者一本書變得比以前困難很多。講完了論文的類型和邏輯結構,接下來進入關於快速閱讀和仔細閱讀的細節介紹。著名科學家Don Geman曾提到:一篇論文實際上有標題、摘要、引言、論文主體(The restof the paper)組成,論文四個部分的每一部分都需要花同樣的時間進行撰寫。所以,對論文進行快速閱讀需要著重關注論文的標題、摘要和引言,如此便能了解論文是否值得讀、能夠從論文中讀到些什麼。
  • 原來讀論文不能先讀摘要,教你如何正確閱讀一篇文獻
    閱讀一篇論文的時候,相信很多朋友都是直接從摘要開始讀起的,但是呢,這種閱讀方法其實是很糟糕的,摘要一般是整篇論文的概況,看完摘要,對於後面的內容,我們就容易帶著先入為主的態度進行閱讀了。 那麼如何正確、高效的閱讀一篇文獻呢?別急,下面我們就一起來看看吧!
  • 深度| 機器的自我進化:走向自主編程的人工智慧(附提交ICLR 2017的...
    華麗的消費產品往往會捕獲人們的眼光,但計算機背後的深層領域——軟體開發的方式——卻鮮有人關注。 想像一下計算機學會理解自我存在後它會做什麼。當然,它們很快就會的,現代科技就可以做到,而且相信我們不會再等上太久。直到現在,機器學習的專家們仍傾向於訓練執行特定任務的人工智慧,例如面部識別、自動駕駛汽車、語音識別、甚至搜尋引擎。
  • 年度必讀:2018最具突破性人工智慧論文Top 10
    當然,還有很多具有突破性的論文值得一讀,但本文作者認為這是一個很好的列表,你可以從它開始。當然,還有很多具有突破性的論文值得一讀,但本文作者認為這是一個很好的列表,你可以從它開始。並強調若是沒有良好的基礎,直接讀單個的論文是十分困難的,因為論文通常在頁數上是有限的,所以在上下文理解上還是有一定局限性。 而近期,作者Mariya Yao在Topbots上發表一篇文章,對今年AI論文Top10做了大盤點。
  • 被言情小說泡大的人工智慧 隨便寫幾行字都是情詩
    根據你的觀看記錄,在YouTube上向你推薦的視頻就是由谷歌大腦控制的,同樣的還有安卓手機上的語音識別軟體。  假以時日,谷歌大腦一定會像我們這些人類一樣,變得愈加成熟。  「我想和你說說話。」「我想和你在一起。」「我不要和你在一起。」我不要和你在一起她不想和他在一起 那麼,機器詩人如何學習語言?
  • 如何寫論文摘要?悄悄告訴你寫論文摘要的方法!別再走彎路了
    如何寫論文摘要呢?寫論文,摘要是必不可少的,那麼摘要怎麼寫呢?有什麼要求呢?一般要寫多少字數呢?這些問題,大家都弄清楚了嗎?還沒弄清楚的話,也沒關係,今天小編就和大家簡單講講論文摘要吧~一、論文摘要1、摘要的基本要求摘要的篇幅不需要太長,它一般以短小精悍、言簡意賅為主。
  • 論文的引言與摘要有啥區別,應該怎麼寫?
    ,目的是向讀者說明本研究的來龍去脈,吸引讀者對論文產生興趣,一般讀者讀了引言以後,可清楚地知道作者為什麼選擇該題目進行研究。2、摘要:摘錄要點。二、側重點不同1、前言:前言是論文正文的第一部分,用於介紹問題的背景,他人的研究成果和不足(簡要的文獻綜述),以引出自己的研究動機和本論文的意義所在。2、摘要:摘要是對整篇論文的概述,能讓讀者快速了解「這篇論文解決了什麼問題,結果如何。」通常包括背景、目的、方法和結果等幾個部分。
  • DeepMind 論文三連發:如何在仿真環境中生成靈活行為
    掌握這種精密複雜的運動控制是物理智能(physical intelligence)成熟的標誌,同時也是人工智慧研究中的關鍵一環。  真正的運動智能需要學習控制和協調身體的靈活性從而完成複雜環境之中的任務。控制物理仿真類人身體的嘗試來自多個領域,包括計算機動畫和生物力學(biomechanics)。存在一種使用手工對象(有時帶有動作捕捉數據)生成特定行為的趨勢。
  • 史上最火 ECCV 已開幕,這些論文都太有意思了
    行人重識別《請別打擾我:在其他行人幹擾下的行人重識別》單位:華中科技大學,中山大學,騰訊優圖實驗室摘要:傳統的行人重識別假設裁剪的圖像只包含單人。然而,在擁擠的場景中,現成的檢測器可能會生成多人的邊界框,並且其中背景行人佔很大比例,或者存在人體遮擋。
  • 各類論文摘要寫作方法全解
    本文詳細介紹摘要的作用和目的、摘要的基本要求、五個要素的具體要求與相關句型及舉例、摘要的基本結構。本文所考慮的摘要既適合期刊論文、也適合學位論文和其它研究報告。四、要素二的具體要求、句型與舉例(動機)摘要的動機一般要求簡練,除非要另外聲明研究目標的意義。一般情況下,動機可以用簡短的一句話概括。例如,a) 這裡,我們證明/研究/提出/解決/報導...。
  • 論文讀不懂不怪你英語差,濫用「黑話」的作者確實越來越多了
    其實,許多人讀論文的時候也會產生同樣的感受。一項研究指出,科學論文中的縮略語(acronym)變得越來越多了,這不僅對大眾和媒體理解科學構成了困難,也為年輕研究者和想要轉向新領域的研究者設置了不必要的障礙。
  • IJCAI 2018|騰訊知文等提出結合主題信息和強化訓練生成更優摘要
    不同於抽取式摘要,生成式方法能夠針對源文檔的核心思想重新組織摘要語言,並確保所生成的摘要語法正確且保證可讀性;這更接近於人類做摘要的方式,因此也是本論文關注的方法。在本論文中,我們提出了一種新方法,該方法基於卷積神經網絡的 sequence to sequence 框架(ConvS2S)[Gehring et al., 2017],引入結合主題模型的注意力機制。就我們所知,這是生成式文本摘要中首個採用卷積框架結合聯合注意力機制引入主題信息的研究,這能將主題化的和上下文的對齊信息提供到深度學習架構中。