查閱arXiv論文新神器,一行代碼比較版本差別,Github新開源!

2021-01-11 量子位

賈浩楠 發自 凹非寺量子位 報導 | 公眾號 QbitAI

在arXiv上發現了一篇中意的論文,當然是下載保存慢慢研究!

然而,等你好不容易看完了文章,發現作者又上傳了V2、V3,一眼望去卻看不出差別,這種情況令人頭疼不已,難道又要花幾個晚上時間研究新版本?

Github上的一個比較預印本論文版本差別的工具也許能幫到你,而且只需一行代碼就能實現。

使用教程

運行這個工具你需要安裝PyPI包、以及帶有pdflatex和latexdiff的文本分布工具。

對於Linux系統,可以通過運行這個指令來安裝文本分布工具:

sudo apt-get install texlive-full

MacOS系統通過這個指令安裝:

brew cask install mactex

前提是你已經安裝過了Homebrew。

使用環境都配置好以後,直接使用指令安裝comparxiv工具:

pip install comparxiv

或從項目地址安裝:

git clone https://github.com/temken/comparxiv.gitcd comparxivpython setup.py install

安裝完成就可以開始使用了。

如果我們要比較某一篇論文的最近兩個版本,只需要提供論文的ID:

comparxiv hep-ph/0612370

如果要比較第N和N-1版本,運行這個指令:

comparxiv 1709.06573vN

比較兩個特定版本N、M,運行:

comparxiv 1905.06348 N M

或者:

comparxiv 1905.06348vN M

如果運行成功,會輸出一個pdf文件並自動打開:

此外,還有一些實用指令,輸入:

comparxiv —help

可查看,包括:

One more thing

這個項目於4月24日上傳Github,作者聲明現在還處在b測階段,除了一些測試的論文實例,無法應用在所有的arXiv論文上。

但是從已有的測試結果來看,完全稱得上便捷實用。

所以建議你先馬後看,等待正式版本問世,大概率會是一個人見人愛的實用工具。

相關焦點

  • 論文繪圖神器:一行代碼繪製不同期刊格式圖表,哈佛博士後開源
    現在,這個論文神器已經在Github開源,@愛可可老師 也在微博推薦,收穫大量轉發好評。安裝工具包推薦使用Python3環境,並且要預裝Matplotlib原始包。安裝這款補充包可以通過pip用一行代碼完成:pip install git+https://github.com/garrettj403/SciencePlots.git你也可以選擇手動安裝工具包,把Github上的項目克隆到本地以後,直接將*.mplstyle的所有文件放到Matplotlib的風格(style)路徑下。
  • GAN快速入門資料推薦:17種變體的Keras開原始碼,附相關論文
    論文中描述的模型,可以生成符合1000個ImageNet類別的128×128圖像。在論文中,研究人員給出了用MNIST和多倫多人臉數據集 (TFD)訓練的模型所生成的樣本。Efroshttps://arxiv.org/abs/1703.10593>論文原作者開源了Torch和PyTorch的實現代碼,詳情見項目主頁:https://junyanz.github.io/CycleGAN/DCGAN
  • 資源|17類對抗網絡經典論文及開原始碼(附源碼)
    原標題:資源|17類對抗網絡經典論文及開原始碼(附源碼) 全球人工智慧 文章來源:Github 對抗網絡專題文獻集> 第一篇論文 [Generative Adversarial Nets](the first paper about it) [Paper]:https://arxiv.org/abs/1406.2661
  • 學界| Facebook新論文介紹相似性搜索新突破:在GPU上實現十億規模
    近日,Facebook 人工智慧研究團隊在 arXiv 發布的新論文《Billion-scale similarity search with GPUs》宣稱在這一問題上取得了重大進展,在 GPU 上實現了十億規模級的相似性搜索。該團隊已經將相關實現的代碼進行了開源。機器之心在此對該研究論文及其代碼項目進行了簡單介紹。
  • 網絡表示學習領域(NRL/NE)必讀論文匯總
    我們在幾個常見數據集上評估這些最先進的方法,並比較它們的性能。我們最終呈現了我們開發的開源 Python 庫,名為 GEM(圖嵌入方法,可在 https://github.com/palash1992/GEM 上獲得),它提供了所有在統一界面中提到的算法。作者:Hongyun Cai, Vincent W.
  • 從噹噹看打造高星 GitHub 開源項目的經驗
    每個開發者都或多或少的使用過開源產品。在使用開源的同時儘量的反饋社區,讓開源成為良性循環。1.4.2 吸取社區精華。使用的人越多,看代碼的人越多,項目的缺陷和風險就會越小。而且眾多社區成員的使用,有助於疑難問題重現。比如:我們公司內部的 ZooKeeper 環境比較快,延遲低,一些分布式的問題就較少發生。
  • 谷歌開源TensorFlow Object Detection API物體識別系統
    API 將谷歌內部使用的物體識別系統(2016 年 10 月,該系統在 COCO 識別挑戰中名列第一)開源給更大的社區,幫助打造更好的計算機視覺模型。今天,我們很高興通過 TensorFlow Object Detection API 把該系統開源給更大的研究社區。這個代碼庫是一個建立在 TensorFlow 頂部的開源框架,方便其構建、訓練和部署目標檢測模型。我們設計這一系統的目的是支持當前最佳的模型,同時允許快速探索和研究。
  • Facebook開源TTS神經網絡VoiceLoop:基於室外聲音的語音合成
    近日,Facebook 在題為《Voice Synthesis for in-the-Wild Speakers via a Phonological Loop》的論文中提出一個文本轉語音(TTS)的新神經網絡VoiceLoop,它能夠把文本轉化為在室外採樣的聲音中的語音。目前 VoiceLoop 已在 GitHub 上開源並附有 PyTorch 實現。機器之心對論文摘要進行了編譯。
  • Mask R-CNN原始碼終於來了,還有它背後的物體檢測平臺
    夏乙 編譯整理量子位 出品 |「等代碼吧。」從Mask R-CNN論文亮相至今的10個月裡,關於它的討論幾乎都會以這句話收尾。現在,官方版開原始碼終於來了。Detectron是Facebook的物體檢測平臺,今天宣布開源,它基於Caffe2,用Python寫成,這次開放的代碼中就包含了Mask R-CNN的實現。
  • 谷歌EfficientNet縮放模型,PyTorch實現出爐,登上GitHub熱榜
    郭一璞 發自 凹非寺 量子位 報導 | 公眾號 QbitAI谷歌上個月底提出的EfficientNet開源縮放模型,在ImageNet的準確率達到了84.1%,超過Gpipe,已經是當前的state-of-the-art了。
  • 輸入示例,自動生成代碼:TensorFlow官方工具TF-Coder已開源
    最近,谷歌 TensorFlow 開源了一個幫助開發者寫 TensorFlow 代碼的程序合成工具 TF-Coder。論文地址:https://arxiv.org/pdf/2003.09040.pdf用過 TensorFlow 框架的應該都知道,在操縱張量時,需要跟蹤多個維度、張量形狀和數據類型兼容性,當然還需要考慮數學正確性。
  • GitHub 的 App 會開源嗎?
    開源的定義開源的概念,在電腦誕生前就已經出現了。最早的開源可能是發生在「吃」的領域,為了生存下去、提升食物的品質,人類學會了分享食譜。而目前對於開源比較認可的定義,由 Debian 的創始人 Bruce Perens 提出:自由再散布(Free Distribution):允許獲得原始碼的人可自由再將此原始碼散布。
  • ACL 2019 27 篇論文實現代碼(持續更新中)
    有需要的同學可以自行下載:https://ai.yanxishe.com/page/resourceDetail/898以下是特意整理的 ACL 2019 相關論文實現代碼集合,請查收:27.《Learning Deep Transformer Models for Machine Translation》(ACL 2019) 論文地址:https://arxiv.org/abs/1906.01787GitHub地址:https://github.com/wangqiangneu
  • 6月份Github上熱門的開源項目
    6月份GitHub上熱門的開源項目排行已經出爐啦,一起來看看上榜詳情吧!Corona-Warn-App(簡稱CWA)意思是「新冠病毒預警 App」,基於蘋果和谷歌的 Exposure Notification API(曝光通知 API)。
  • 一行代碼即可調用18款主流模型!PyTorch Hub輕鬆解決論文可復現性
    新智元報導 來源:PyTorch編輯:元子【新智元導讀】為了解決日益增長的論文可復現性需求,Facebook推出了PyTorch Hub,類似TensorFlow Hub的一個模型共享庫,加載ResNet、BERT、GPT、VGG、PGAN還是MobileNet等經典模型只需一行代碼。
  • 基於TensorFlow2.0的中文深度學習開源書來了!GitHub趨勢日榜第一
    因為這是一本基於TensorFlow 2.0 正式版的中文深度學習開源書。還包含電子書和配套原始碼。話不多說,一起來看看這本爆款書籍吧!從代碼來看,上手也是較為容易。安裝首先確保使用的Python版本是3.x。
  • ECCV 2020 論文匯總:遙感與航空影像處理識別
    | https://arxiv.org/abs/2007.10891代碼 | https://github.com/raziehkaviani/rdosr備註 | ECCV 2020本文研究開集土地覆蓋分類的問題,在測試過程中識別屬於未知類的樣本,同時保持已知類的性能。
  • 直接對梯度下手,阿里提出新優化技巧,一行代碼即可改善現有優化器
    只需一行代碼即可嵌入現有的 DNN 優化器中,還可以直接對預訓練模型進行微調。優化技術對於深度神經網絡 (DNN) 的高效訓練至關重要。以往的研究表明,使用一階和二階統計量(如平均值和方差)在網絡激活或權重向量上執行 Z-score 標準化(如批歸一化 BN 和權重標準化 WS)可以提升訓練性能。
  • Python代碼轉Latex公式,這個開源庫用一行代碼幫你搞定
    近日,GitHub 上一個名叫 handcalcs 的開源庫就解決了這個問題。項目地址:https://github.com/connorferster/handcalcshandcalcs 庫:將 Python 計算代碼轉換為 Latex 公式handcalcs 庫可將 Python 計算代碼自動渲染為 Latex 公式,呈現方式類似於手寫的公式計算:先編寫符號公式,再代入具體數字,最後得出結果。
  • CVPR 2020 Oral:一行代碼提升遷移性能,中科院計算所研究生一作
    考慮不同類別響應的線性相關性,如果兩個響應屬於不同類別,那麼響應會差別較大線性無關,如果屬於相同類別則近似線性相關:1、[0.9,0.1]與[0.1,0.9]線性無關2、[0.9,0.1]與[0.8,0.2]近似線性相關。那麼預測類別數也就是矩陣中最大的線性無關向量數,即矩陣的秩。