TLDR軟體為科學搜尋引擎「語義學者」上的一篇計算機科學論文生成一句話摘要。圖片來源:Agnese Abrusci/Nature
論文太長不想讀怎麼辦?一個軟體就可以搞定。
據《自然》報導,一位科學搜尋引擎的創造者推出了一款軟體,可自動為研究論文概括生成一句話摘要,他們說,這有助於科學家更快地瀏覽論文。
這個免費工具被創建它的團隊稱為TLDRs(「太長,沒讀過」的縮寫),已於日前在科學搜尋引擎「語義學者」上投入使用。「語義學者」是美國艾倫人工智慧研究所(AI2)創建的搜尋引擎。
AI2語義學者小組管理者Dan Weld表示,目前,TLDR軟體只用於語義學者所涵蓋的1000萬篇計算機科學論文,軟體經過微調後——預計在12月左右,其他學科的論文應該也能通過該軟體自動生成一句話摘要。
初步測試表明,與查看標題和普通論文摘要相比,TLDR軟體能夠幫助讀者更快對搜索結果進行排序,尤其是在手機上。「人們似乎真的很喜歡這個工具。」Weld說。
Weld創造TLDR軟體的靈感來源於同事在推特上分享的一些標記文章的簡短句子。與其他語言生成軟體一樣,該工具採用基於大量文本的深層神經網絡學習。研究團隊創建了數萬篇與標題匹配的研究論文,這樣網絡就可以學會生成簡潔的句子。然後,研究人員對該軟體進行微調,訓練一個新的數據集,將論文和摘要匹配起來,這些數據集由幾千篇計算機科學論文組成,其中一些論文的摘要由論文作者撰寫,另一些論文摘要則由本科生撰寫。該團隊已經收集了一些培訓實例,以提高該軟體在其他16個研究領域的性能,其中生物醫學可能是第一位的。
一份描述TLDR軟體的論文4月1日在預印本平臺arXiv上首次發布,並在11月接受同行評審後發表。研究人員已經免費提供了代碼,還有一個可以使用該軟體的演示網站,任何人都可以試用這個工具。
「我預測這種工具在不久的將來會成為學術搜索的標準功能。事實上,考慮到需求,我很驚訝過了這麼久才將其投入實際應用。」華盛頓大學信息科學家Jevin West說,他應《自然》的要求對該工具進行了測試。「這個工具並不完美,但絕對是朝著正確方向邁出的一步。」(徐銳)
來源:《中國科學報》
—— 分享新聞,還能獲得積分兌換好禮哦 ——