死磕論文前,不如先找齊一套好用的工具

2021-01-11 百家號

選自 Medium

作者:Eddie Smolyansky

機器之心編譯

參與:劉曉坤、王淑婷

還在機器學習論文的海洋裡忘我沉淪?先花幾分鐘學些新工具,不虧,論文閱讀、評論、社交、管理、搜索、復現、寫作全不誤。

作為像深度學習這樣高產領域的研究人員,我們經常會發現自己被論文的汪洋所淹沒。這些論文是如此之多,想全部讀完並跟蹤最新研究似乎很難很難。我覺得形成這種局面的一個重要原因是,我們沒有充分利用現有工具和服務來讓工作變得更加簡單。另一個原因是缺少能夠在一個界面下滿足我們所有需求的真正好產品,不過說到這個就得另寫一篇博客了。

最近,我開始了解 ML 的一個子領域,對該子領域相關文獻的優先排序、閱讀和管理讓我感到非常沮喪……最後我選擇找些工具來幫忙處理這項任務,我想把這些好用的產品和服務分享給你們。希望能夠幫那些需要和科學論文打交道的人改善工作流程。

我主要關注的是論文閱讀和展示的問題(而非寫作):

Reference Manager(也叫論文庫)用社交平臺來分享知識運用自動論文分析算法來獲取額外的元數據(關鍵詞、相關數據集、重要引用等)

Reference Manager(也叫論文庫)

你可以在這些平臺上創建和管理所有以前和未來的閱讀清單,添加個人筆記並和小組分享。這些庫會被同步到雲端,也就是說你在任何地方都能打開論文。看書可以用 goodreads,不過看論文的話,最好從下列工具中選擇:

Mendeley:這款產品雖然顏值不咋地,但它有免費的商業模式,支持 web、PC、Mac 和移動手機等多個平臺。除了一般的論文筆記,你還可以直接注釋和高亮顯示 PDF。它的雲存儲是有限額的,超過幾百篇論文之後就得付費。Paperpile:它需要付費訂閱(沒有免費版本,可以用谷歌帳號免費試用 30 天),但看起來很潮,用起來也感覺不錯。你可以非常輕鬆地把論文庫從其它服務平臺上導入到這款產品中。你還可以把庫同步到自己的谷歌雲,這算是它的一個優勢。目前它只能在谷歌瀏覽器上使用。Zotero:這是一個免費和開源的實現,你只需為超額的雲存儲付費。類似 Mendeley,不過功能沒它多。

Mendeley:https://www.mendeley.com/Paperpile:https://paperpile.com/Zotero:https://www.zotero.org/

當然,你還有很多選擇,不過這幾個是我用過並且感覺還不錯的。如果讓我選的話我會選 Mendeley,因為它支持很多平臺而且還免費。

Mendeley 的界面

Zotero 的界面

arXiv 進化版

arXiv 於 1991 發布,並在近十年內鮮有變化,儘管論文發表數大幅增長(到 2016 年 10 月提交論文數已經達到了每月超過 10000 篇)。當然,我們現在對論文資源庫提供的功能已經有很多新的需求。我們想要能執行論文分析的算法,想找到實現論文結果的代碼,希望有能共享信息的社交平臺,我們還可能對雙列格式的 pdf 文檔感到厭煩。

在網上搜索現有解決辦法之後,我找到很多此類工具。

社交平臺

Shortscience:這是一個能共享論文概述的平臺,目前有超過 1000 篇論文概述,並仍在持續增長;OpenReview:這是一個能提供公開論文評審過程的平臺,所有提交的論文會公開作者姓名等信息,同時接受同行的評價及提問,可以匿名或實名地對論文進行評價。公開評審結束後,論文作者也能夠調整和修改論文。Openreview 目前僅對特定學術會議提供評審功能,例如 ICLR,並且由於受到廣泛質疑,ICLR 在 Openreview 上的評審也被改成了雙盲評審。除了官方評審之外,近期很多論文的評論區也能看到讀者和作者之間的積極交流。Scirate:能看到熱度較高的 arXiv 論文,並按學科分門別類,還能瀏覽相關論文的評論。但其熱度排序基於該網站內的點讚數,而這個網站的活躍度並不高。

Shortscience:http://www.shortscience.org/OpenReview:https://openreview.net/Scirate:https://scirate.com/

Shortscience 的論文概述示例

Openreview 上的 ICLR 2019 論文及評審示例

找到論文的代碼實現

Papers With Code:自動把論文連接到實現代碼的 GitHub 資源庫和數據集,並根據 GitHub 的收藏量排序。每篇論文可能有多個合併的條目。Github pwc:以相當簡潔的列表關聯論文和代碼實現,包含最新的 NIPS 論文。GitXiv:每個項目可以方便地展示為 arXiv+GitHub+連結+討論,可惜的是這個項目不再維護了。

Papers With Code:https://paperswithcode.com/Github pwc:https://github.com/zziz/pwcGitXiv:http://www.gitxiv.com/

Papers With Code 界面。

GitHub pwc 頁面上的一些連結。

其它工具

arXiv-sanity:相比於 arXiv 有很大的改進,包括在瀏覽中顯示摘要、評論和非常基本的社交、庫功能。這個整合了很多便捷功能的網站,是 Andrej Karpathy 在空閒時開發的。arXiv-vanity:可以將來自 arXiv 的論文渲染成響應式網頁,從而讓人們不用再看 pdf 文檔。

arXiv-sanity:http://arxiv-sanity.com/arXiv-vanity:http://arxiv-vanity/

arXiv-sanity 界面

arXiv-vanity 轉換論文示例

論文搜索和分析

Google scholar:如今搜索論文的首選,可以在這裡查看論文統計和引用參考文獻,還能通過關注作者或者論文獲得新論文更新提醒,以及利用自動化推薦來提供一個基本庫。Semantic scholar:可以結合外部材料整合進行論文的語義分析。功能包括:展示引用和參考文獻、度量論文影響力、展示論文圖表、自動生成關鍵詞(根據標題)、分析作者、在網際網路尋找額外資源(例如,相關 youtube 視頻),以及推薦論文。

Google scholar:https://scholar.google.co.il/Semantic scholar:https://www.semanticscholar.org/Semantic Scholar: author profile page

Semantic Scholar:作者簡介界面

適用於作者的工具

Overleaf:支持多人協作的在線 LaTeX 編輯器,好比用谷歌文檔寫論文,很好實現。Authorea:一種支持多人協作在線撰寫論文的方法,旨在減少 LaTeX 的使用,支持現代 WYSIWYG 編輯器。支持內聯代碼和數據,促進可復現性,支持內聯公共評論和其它合理功能。Code ocean:基於雲計算的再現性平臺。我的理解是你將自己的研究作為 Jupyter 環境代碼上傳,然後在線運行,並復現作者曾取得的相同圖表/輸出。

Overleaf:https://www.overleaf.com/Authorea:https://www.authorea.com/Code ocean:https://codeocean.com/

[如果你覺得前文太長,可以選擇……不看]

我的建議

管理閱讀庫:Mendeley閱讀和寫論文評論:shortscience 和 openreview將論文和 GitHub 資源庫匹配:paperswithcode 和 pwc論文和作者分析:Semantic scholar寫論文:Overleaf

順便提一下,谷歌最近發布的 Dataset Search 也是搜索數據集的神器哦。

最後,希望這篇博客裡推薦的服務平臺中至少有一個能讓你改善工作流程。嘻嘻~

arXiv 上不同主題的提交量,數據來自其統計頁面。

原文地址:https://towardsdatascience.com/finding-and-managing-research-papers-a-survey-of-tools-and-products-9151810d1b4d

本文為機器之心編譯,轉載請聯繫本公眾號獲得授權。

相關焦點

  • 論文查重軟體哪個最好用 性價比高論文查重工具推薦
    有什麼好的論文查重軟體  國內三大論文檢測系統,知網、萬方、維普,都是非常優秀的論文查重工具。萬方、維普性價比高,適合前期修改。知網和學校結果一致,適合定稿使用。  3.在知網查詢價格是千字/10元,非常昂貴,而在一些代理網站如某寶某東價位會很低,但質量卻不如知網官方的質量,檢測時間也不如知網官方的長,在知網需要購買會員卡才能進行查重。  萬方查詢  1.萬方也是查重系統中很官方的網站,較廣泛的應用於專科類大學,一部分本科類大學也在使用萬方系統查重。
  • 論文課題怎麼選?有什麼好用的文獻翻譯工具?
    論文寫作,首先考慮的就是選題。而選題的過程,往往要經歷大量的英文文獻閱讀。為了提高效率,我們可以用英語翻譯工具來翻譯文獻。今天小編就來分享一下,如何選擇合適的論文課題,以及超實用的文獻翻譯工具推薦。第一次寫論文,完全沒有頭緒很正常,那麼如何明確目標呢?我們可以從三個方面入手:所學專業、嚮導師請教、了解近期熱門話題。只要你發散思維、留心觀察,一定可以發現一個或多個關鍵詞或話題。
  • 碩博士建議掌握的高效論文工具
    發表論文,是每個科研人的必經之路!說到論文,我讀博的朋友小瑋就被論文折磨得快崩潰了,甚至念叨著要放棄。一篇論文好不好,全看有沒有詳實的文獻支撐和數據、案例佐證。面對海量信息,如何快速搜集你想要的資料就顯得尤為重要。小瑋向發過幾次SCI的師姐求助。
  • 給菜鳥出招:教你焊接洞洞板的好方法
    一、跟風之作:仿MBL6010前級 兩三年前,論壇裡面仿MBL6010之風是如火如荼,小弟涉世未深,也跟著前輩們>DIY了一套。,之後才好排位布局。關鍵的萬能板應該選一些質量好一點的,像我用這種就不錯。(個人感覺,方焊盤的比圓焊盤的要容易操作)然後,把元件排位,要排得合理一點,要美觀,易於走線,電氣分布合理。
  • SCI論文怎麼發表?好的期刊選擇工具推薦一波
    很多同學嘔心瀝血寫完一篇論文之後,往往就會產生疑惑,搞不清自己的論文到底適合哪個期刊。有的同學可能在這個時候就會亂投了,亂投的時候唄退稿的機率就會很大,因為你的論文有可能真的不適合這個期刊。狗子今天就推薦給大家幾個好的期刊選擇工具,導師再也不會擔心你的論文亂投了。
  • 如何選擇一個好的學位論文題目?
    論文是用來取得學位用的。 1、學位論文必須嚴格按照本學科、本專業、本研究方向擇定選題。 80%因為選題落敗的論文,都是內容或者研究對象不符合本學科的要求。
  • 鷹眼自認不如白鬍子,象徵性的攻擊一下後就走了,網友:你用全力了?
    然而就是這麼一個強大的人,自認不如白鬍子。當初他來到頂上戰爭的時候,就是為了測試自己和白鬍子之間的差距。 然後鷹眼在頂上戰爭攻擊了白鬍子,非常普通的一道劍氣。這道劍氣被馬爾科攔下來後,鷹眼就不在攻擊了。認為自己和白鬍子之間的差距太大,看到這一幕的網友們立即吐槽:你真的用全力了?
  • 前研乾貨丨英語科技論文寫作技巧-結果與討論
    寫作一篇科技論文,從某種意義上來說,是一個結構化寫作的過程,又或者像是電影的腳本,有開幕,有起承轉合,有高潮,有謝幕,有套路可尋。一般的科研論文包括摘要、引言、方法(儀器)、結果描述與討論、結論等,其中結果和討論的作用是對利用所描述方法或使用相關儀器得到的結果進行描述或者討論,進而對引言中提出的科學問題做出回應。
  • excel的升級版access也不如它好用
    微軟Office是使用最為廣泛的辦公軟體,Excel則是其中集電子表格、數據處理、圖表統計多為一體的生產力工具,每個工作領域幾乎都能看到這款軟體身影。     Excel的定位是簡單快捷的數據分析展現工具。但Excel的本質問題就是它實際上還是一款單機軟體,對於共享Excel數據方面只能藉助微軟開發的其它軟體。因此不適合作數據收集和大數據的管理。Access的定位在數據管理,尤其在維護數據完整性方面更加規範,同時彌補了Excel在多用戶訪問需求上的不足。
  • 簡單好用FTP上傳工具及使用方法
    向網站空間上傳程序或文件是我們建站網站不可或缺的一個步驟,此時需要藉助一款FTP上傳工具——flashfxp,下邊就給新手使用者講一下這款超級好用的FTP上傳工具的使用方法。1、打開伺服器空間根目錄htdocs,(備註:不同空間商根目錄不一樣,建議先讀圖示中的「1」;因為我用的阿里雲伺服器,根目錄是htdocs)2、點擊左側框右上角的下三角,找到欲上傳的文件。
  • 3秒搞定社科論文綜述 | 試用神器「論文知識圖譜」工具
    你還在用Google學術搜論文嗎?給你推薦一個找論文神器:只需輸入網址或標題,短短幾秒,就可得到相關論文圖表。你以為他只是參考文獻?不,它是與你的問題相關的論文知識圖譜。只需幾秒,最常引用的、最新的、相似的論文,全部以圖表的形式打包送給你!
  • 盆景製作要用什麼工具
    製作盆景的工具有很多很多,許多初入門的盆友都不知道該如何選擇,大魚為大家做個簡單的介紹。首先是剪子。修枝剪,此剪屬萬用,剪枝剪葉剪根,較細的鋁線也照剪不誤,一剪在手,天下我有。修枝剪現在也有電動版的,據說動力嘎嘎的。
  • 碩博士都在用的高效論文工具,強烈建議你了解一下!
    寫論文有多難? 01 論文的痛,都是它惹的禍 一篇論文好不好,全看有沒有詳實的文獻支撐和數據、案例佐證。 面對海量信息,如何快速搜集你想要的資料就顯得尤為重要。
  • 切割瓷磚用什麼工具?
    劃針割瓷磚使用方法如下:    用手握牢劃針,用力下壓,在需要割開部分用角尺靠好,單向滑動幾次,即可將瓷磚表面釉層割破,將割縫處滴水浸透,然後將瓷磚割縫置於某個桌面或者臺面直角處    2、在尺杆上調好需要切割的尺碼,確認後用手旋緊固定螺杆。    3、將瓷磚擱放在平臺上。    4、切割時,先將推拉杆拉至後端,讓刀片輕壓在瓷磚上面,沿順主軸向前推至前控堅槽,匣腳擱放在瓷磚上面,輕打一下推拉柄尾端,瓷磚便可隨著刀痕斷裂。    維護說明    1.不使用時應收回刀輪。
  • 論文工具箱:新時代論文寫作場景下的神器
    (原標題:論文工具箱:新時代論文寫作場景下的神器) 論文寫作、查重市場接近飽和的狀態下
  • LED大燈「那麼好」為什麼老司機卻不愛用?關鍵時候不如滷素燈!
    看文章前先點擊右上角的「關注」按鈕哦,一不小心退出後就找不到文章了!關注後每天不錯過各種汽車資訊!LED大燈「那麼好」為什麼老司機卻不愛用?車主說:關鍵時刻不如滷素燈汽車大燈是保證我們夜間行車安全最基礎的一個配置,也有人會用車燈的亮度來考量一臺車的檔次。如今比較流行的汽車燈光只有三種分別是滷素大燈、氙氣大燈和LED大燈,其中檔次最高價格最貴的是LED大燈,一般在價格比較高或者同車型的高配車型才會標配。其次到氙氣大燈最後檔次最差價格最便宜的是滷素大燈。
  • 讀SCI論文需要翻譯?這個翻譯工具了解一下!
    做科研的朋友們,都希望能發表SCI,同時也免不了閱讀他人的SCI論文。而在閱讀時,英語的翻譯問題總會難倒很多人。今天給大家分享的這個文檔翻譯工具,就可以幫助你把英文SCI論文翻譯成中文。或許有人會問,由於SCI論文的專業性會比較高,通常會有較多的各行業領域方面的專業詞彙或者表達方式,有時候機器翻譯不一定能夠將原文的意思很好地表達成中文,怎麼解決這個問題呢?翻譯狗充分考慮到這一點,為大家提供了專業術語庫和語料庫的特色功能。
  • Keras官方出調參工具了,然而Francois說先別急著用
    近日,Keras 官方發布了一個調參工具 Keras Tuner,提供一種 Keras 內的簡單便捷調參方式,以及可視化和分析服務。然而目前發布的版本還不成熟,Keras 作者 Franois Chollet 表示:大家先別用,API 還不穩定。
  • 這「新工具」一出,鋼捲尺沒人用了,好用又不貴,人人買得起
    ,特別是五金工具,它們的重要地位,已經不亞於人類的左右手了。在這個科技發展迅速的時代,我們已越來越離不開各種各樣的工具和設備,例如工廠的各種機械,公司、家庭的各種日常設備,有了這些工具和設備,才能使我們的生產效率大大提高,生活更加舒適便利。就拿這新式「五金工具」來說,作為有車一族,就都會對汽車維修有一定的了解,所以車主們就無法避免的要和維修工具多打交道。