太長不看:一句話概括論文,這個AI有點東西

2020-12-13 木木西裡科技

某搜尋引擎的論文總結工具可以使瀏覽論文變得更簡單。

某科研搜尋引擎的開發者推出了一款可以自動用一句話概括論文的軟體,他們說該軟體可以幫助科學家更快地瀏覽論文。

這款免費工具可以生成團隊稱之為TLDR(網絡流行語「Too long, didn’t read」的首字母縮寫)的一句話總結,近日已在非營利性的艾倫人工智慧研究所(AI2)開發的搜尋引擎Semantic Scholar上線。目前,該軟體只適用於Semantic Scholar收錄的1000萬篇計算機科學論文,但是再過一個月左右,等軟體調試完畢後,它也將適用於其他學科論文,艾倫人工智慧研究所Semantic Scholar工作組負責人Dan Weld說。

Weld說初步測試顯示,該軟體能讓讀者以比瀏覽標題和摘要更快的速度梳理搜索結果,尤其是在手機上,「大家看起來挺喜歡它的。」

科研搜尋引擎Semantic Scholar的TLDR工具可以用一句話總結計算機科學論文。來源:Agnese Abrusci/Nature

4月,arXiv預印本伺服器首先發布了描述該軟體的論文,11月在一場自然語言處理大會上經過同行評議後,論文已被接收發表。研究人員已經免費公開代碼和演示網站,任何人都可以試用。

「我預計未來這種工具將成為學術檢索的標配。事實上,考慮到這方面的需求,直到現在才看到這種工具面世,讓我挺詫異的。雖然它不完美,但是方向絕對是對的。」華盛頓大學的信息科學家Jevin West說,他應《自然》的請求,對該軟體進行了測試。

Semantic Scholar的搜索結果附帶TLDR總結,圖為智慧型手機視圖。來源:Semantic Scholar

Weld開發TLDR軟體的靈感有一部分來自他的同事,這些同事會用一些精煉的語句在推特上介紹論文。和其他語言生成軟體一樣,這種工具採用的是經過大量文本訓練的深度神經網絡。該團隊收錄了上萬篇與標題匹配的研究論文,使神經網絡可以學習如何生成簡潔的句子。之後,研究人員對軟體進行了微調,並利用一套新的數據集進行訓練,數據集包含幾千篇計算機科學論文和相應的論文總結——部分由論文作者所寫,部分由一群本科生所寫。研究人員已經收集了另外16個領域的訓練實例,以提高軟體的性能;預計生物醫學論文的總結功能會最先推出。

TLDR軟體不是唯一的科學論文總結工具:Paper Digest網站自2018年起就開始提供論文總結,但是它似乎只是從原論文中提取關鍵句子,而非生成新的句子,Weld說。TLDR可以從論文摘要、引言和結論中生成一句話——基於正文內的關鍵詞組,因此,這些總結完全以已經理解論文術語的專業讀者為目標。但是,Weld說他的團隊也在開發面向非專業讀者的論文總結生成軟體。

研究團隊還計劃把這項技術授權給出版商,拓展它們的服務範圍,為領域內的關鍵論文提供個性化研究摘要。「我們才剛剛達到AI技術生成的創新論文總結能夠為人所接受的這一步。」Weld說。

相關焦點

  • 論文太長不看?這個AI已經會一句話概括論文了
    Perkel & Richard Van Noorden 某搜尋引擎的論文總結工具可以使瀏覽論文變得更簡單。 某科研搜尋引擎的開發者推出了一款可以自動用一句話概括論文的軟體,他們說該軟體可以幫助科學家更快地瀏覽論文。
  • AI 軟體TLDR:可用一句話概括文章
    AI 軟體TLDR:可用一句話概括文章 學術頭條 發表於 2020-11-27 17:00:50 摘要在一篇文章中有著至關重要的作用,它濃縮了整篇文章的精華,可以讓你快速了解該篇文章的研究背景
  • 論文太長不想讀?「懶人神器」要不要
    作者 |徐銳 中國科學報論文太長不想讀怎麼辦?一個軟體就可以搞定。據《自然》報導,一位科學搜尋引擎的創造者推出了一款軟體,可自動為研究論文概括生成一句話摘要,他們說,這有助於科學家更快地瀏覽論文。這個免費工具被創建它的團隊稱為TLDRs(「太長,沒讀過」的縮寫),已於日前在科學搜尋引擎「語義學者」上投入使用。
  • 懶人的勝利:這年頭,連學術論文都有太長不看了丨一周科技
    論文作者在Github公開了相關設計文件、軟體以及使用指導[2]。即使是缺少專業技術培訓的人也可以自己搭建這些顯微鏡。除推動研究之外,拼裝顯微鏡也可以用於教育,幫助學生理解顯微鏡的光學原理。太長不看這年頭,連學術論文都有太長不看了。
  • 論文標題太長?分享幾個精簡標題方法
    看到一位同學的論文,瞬間被他的論文標題吸引了。論文標題40個字都不夠他用的了,那個長。百家號的文章標題限字30個,小編這篇文章是短篇文,標題字數正好卡在30個字,是不是覺得題目過於囉嗦,沒有重點?論文是具有科學性,研究性,權威性的文章,論文標題一定要關鍵詞突出,內容高度概括,且能提綱挈領。切記不能過於冗長,缺乏中心,讓讀者沒有拜讀下去的興趣。當然太短也不行,標題太短會讓讀者覺得你對論文缺乏嚴肅性。
  • 論文標題太長了?分享幾個精簡標題方法
    看到一位同學的論文,瞬間被他的論文標題吸引了。論文標題40個字都不夠他用的了,那個長。百家號的文章標題限字30個,小編這篇文章是短篇文,標題字數正好卡在30個字,是不是覺得題目過於囉嗦,沒有重點?論文是具有科學性,研究性,權威性的文章,論文標題一定要關鍵詞突出,內容高度概括,且能提綱挈領。切記不能過於冗長,缺乏中心,讓讀者沒有拜讀下去的興趣。當然太短也不行,標題太短會讓讀者覺得你對論文缺乏嚴肅性。
  • 《前任3》孟雲和林佳,用《香蜜》中一句話就能概括,太現實了!
    《前任3》孟雲和林佳,用《香蜜》中一句話就能概括,太現實了!哈嘍,親愛的家人們大家好,很高興你們來閱讀小編寫的文章,我是最可愛的資訊小幫手,不知道大家有沒有想我,相信小編會習慣每天你們的存在,每天小編都會播報最好玩的故事給大家,喜歡就趕緊關注吧!
  • 期刊論文上能學到很多東西?怎樣從論文期刊上學習想要的東西?
    期刊論文上能學到很多東西?怎樣從論文期刊上學習想要的東西?從期刊論文上能學到的東西很多,尤其對於那些導師很忙,基本上屬於放養式的同學來說,如何學習期刊上的東西,並且運用到自己寫論文的過程中,是一門技術活。
  • 畢業論文要寫什麼?論文檢測系統會檢測哪些東西?
    明年要畢業的大學生有的都開始弄畢業論文了,其實很多人應該對此或多會少都會有一些疑惑或者問題,不知道寫什麼?具體內容,還有傳說中的論文檢測系統查重會查哪些地方。跟大家解解惑吧。畢業論寫什麼?1、標題,就是題目,簡單來說要能概括你的論文中心的內容,最好簡短、確切、精煉、鮮明;2、目錄,這個其實就相當於一個大綱一樣,條理和層次要分明,並且要帶上頁碼,也要把參考文獻、索引、附錄等等東西都註明;
  • 論文標題取名指南
    這個就是論文標題的藝術了,如果一篇文章的標題沒有取好,就很難吸引別人的關注。 一篇好文章,它的標題是自帶特點的。下面討論一下,如何給你的論文取一個恰當好處,又能夠吸引讀者的標題。
  • AI基礎:入門人工智慧必看的論文
    如果想了解更多,還可以參考原論文,具體地址如下:https://arxiv.org/abs/1706.03762 No17-18  孿生注意力論文:好比LSTM與GRU一樣,注意力他們家也除了一對雙胞胎,長得略微有點不同。但是功能一樣,都能吃能喝,還能注意。老虎老鼠傻傻的不清楚!
  • 看動畫《小豬佩奇》看出了什麼?童真童趣但又有點別的東西
    想必大家都聽過這樣一句話「小豬佩奇身上紋,我敬你是社會人」。佩奇就是動畫《小豬佩奇》裡的主角,動畫圍繞了佩奇一家和她的朋友們為故事而展開。那麼在看《小豬佩奇》的時候你看到了些什麼?童真童趣但又有點別的東西!
  • 一句話概括騰訊的夢想
    這個夢想太大以至於就像內褲一樣,雖然有,但不太適合時時掛在嘴邊。畢竟上一個天天把夢想掛在嘴邊的人,現在還在美國造汽車,下周才回國。騰訊的夢想究竟是什麼?先從這篇閱讀過的百萬《騰訊沒有夢想》說起。今日頭條和抖音被對標微博和微視被推上這個臺子。有點尷尬的是,張一鳴本人並不太認同這種誇獎。畢竟從商業模式的成熟度上,今日頭條還有太多值得吐槽的地方。那麼用今日頭條來反觀騰訊的產品能力是否合適呢?
  • 名字超級長的動漫,第二位的名字其實只要四個字就能概括了!
    故事講述的就和名字說的一樣,男主角銳太因為被真涼要挾而和真涼成為假情侶,而銳太身邊同時也匯聚著幾位十分可愛的青梅竹馬們,她們對銳太都抱有戀慕之情,於是一場慘烈的修羅場就此展開。可以說是標題就已經劇透了一切內容,後來的展開基本上不看你都知道發生了啥。不過雖然名字長,作品的內容還是不錯的,而且真涼真的好漂亮,部長超喜歡的!
  • 附AI和DS專業選校推薦
    就算你僥倖過了筆試,到面試環節,他們也會問你,有沒有項目經驗,有沒有在國際期刊上發表過論文。英國的一年制碩士,你懂的,既不需要發表論文,也沒有項目經驗,畢業論文根本不算。但能不能錄取,全看硬實力說話,這是我這幾個月投簡歷的感想。很多大公司看在我是c校學生的份上都邀請我筆試/面試。但最後我都沒過,一沒項目經驗,二沒發表論文,三筆試一堆技術問題不會。最後,如果有人頭鐵,不信這個邪,非要去念的話,我給一些選校建議。
  • 大學生如何寫好論文、時事評論和讀書報告
    同樣是寫此次新冠疫情,如果你寫一篇《從新冠疫情看我國制度的優越性》《從戰疫行動中看年輕一代的擔當》等等,這是論文;但如果你寫《致敬逆行者》一類的抒發感情的東西,就不是論文。 既然是要求寫論文,就要先問一下自己:準備在材料中得出一個什麼結論?然後圍繞著這個論點來展開。
  • sci論文等的時間太長能撤稿嗎
    不是所有發表的sci論文都會在期刊規定期限左右給出答覆。等的時間太長,雖不常見但也存在,怎麼辦?作者想撤稿卻又不知道能不能。那麼,sci論文等的時間太長能撤稿嗎?撤稿是發表sci論文過程中一種常見狀況。依照相關規定,只要sci論文沒有見刊,就可以撤稿。
  • 太實用了!學術論文的「八股」寫作法
    題名是反映一篇學術論文研究範圍、論點與水平的第一個重要信息。常言說看書先看皮(書名),看文先看題(標題),其重要性可概括為一句話「題好一半文」。一般學術論文不需要副題名,但是下列情況可以有副題名:題名語意未盡,用副題名補充說明報告論文中的特定內容;論文分冊出版,或是一系列工作分幾篇報導,或是分階段的研究結果,各用不同副題名區別其特定內容;其他有必要用副題名作為引申或說明者。
  • 長文分享:AI算法工程師煉成之路
    不花錢報班,全靠自學,最初是因為窮,後來發現「開源」的世界真是太美好了!我是因為什麼開始接觸敲代碼?我的第一個模型是什麼?這裡的「算法」和計算機CS的「算法」還不太一樣,AI算法是偏數學推導的,所以數學底子還是需要點的,學的越深,要求越高。面試的時候,很少讓手寫代碼,90%都是在問模型摳算法細節。在學校我是一個不愛記筆記的人,甚至是一個不愛上課的人。
  • 用一句話來概括炒股紀律,你覺得是什麼?
    如果用一句話來概括炒股紀律,那麼,我喜歡用——賺大虧小,本金第一。什麼叫賺大虧小呢?就是說在每次交易中都力爭讓利潤奔跑,都力爭獲取更大的利潤。只有這樣才可能在最終賺到錢。只有長年這樣的大賺小虧下來,才能夠最終獲得投資的總體收益為證。小虧是指每次的虧損額度都要控制在儘可能小的範圍內。很多股民一次虧損就達到了40%,甚至50%以上,這麼操作永遠是賺不到錢的,因為這個虧損幅度太大了,一次就把你前面賺的錢虧了一半以上,那你還怎麼賺錢呢?