論文LaTeX、項目README:無腦套用格式、開源模板最高10萬贊

2021-01-11 機器之心Pro

選自GitHub

機器之心整理

參與:Jamin、思、一鳴

即使是最具創意性的機器學習研究者,也不得不面對枯燥無味的論文和項目文檔寫作。這項工作還怠慢不得,因為一旦少了重要的部分,很有可能對研究造成影響。在這裡,機器之心整理了一些高贊開源項目 Readme、Gitignore 文檔和論文的 LateX 模板。即使是初次研究的人也可以迅速上手。

從搞研究到做項目,模板都是提高生產力的好工具。因為開發者比較注重效率(因為懶),很多細枝末節而又略微繁瑣的工作,都會在 GitHub 上放出模板。比如說 Git 用的 gitignore 文件,模板放到 GitHub 上竟然能有 9.6 萬的 Star 量,這些小而好用的模板項目,確實能省不少事。

gitignore 模板做項目

不論是做研究,還是平常寫一些小項目,Git 總是必不可少的。若不用 Git 追蹤所有代碼修改痕跡,總感覺改代碼、測試代碼會比較心虛。一般使用 Git,又少不了 將代碼託管到 GitHub,尤其目前 GitHub 已經支持免費的私有項目。

然而做項目時,每次查看修改了哪些文件時,總會有一些奇奇怪怪的臨時文件,編譯器緩存、系統緩存等等,此外數據集太大一般也不會傳到 GitHub。為了看著舒服,大概率你會寫一個 . gitignore 文件,將需要 Git 忽略的所有文件、所有類型的文件都忽略掉。

比如說,早幾天清華大學開源的深度學習框架「計圖」,它的 .gitignore 文件是這樣的:

可以想到,清華的研究者肯定是在構建項目的過程中,一條條把不希望添加到 GitHub 的文件排除在外。雖然要排除的文件每個項目都不一樣,但是有一些肯定都是共通的,例如 __pycache__ 等。這裡我們介紹一個 GitHub 官方 gitignore 模板,它目前擁有高達 9W+的 Star 量。

這一系列模板非常好用,如果我們用 Python 做項目,直接下載對應的.gitignore 文件就行了。這個文件內部大概是這樣的:

它會從不同的角度展示 Python 項目到底哪些文件是應該排除在外,不能上傳到代碼庫。總文件有 143 行,我們直接下載用就行,只要再加上幾行描述自己項目的語句,.gitignore 就完美了。

項目做完了,README 也不可少,是的,它也有模板。

README 模板

而 README 方面更是家常便飯,首先肯定的是 Readme 的本質,讓讀者能夠以最快速度去了解如何安裝或是使用項目。以前為了寫一份 README 還要先去找一個成熟項目作為參照,比如耳熟能詳的 由 RichardLitt 發起的「Standard Readme」,簡單直白的告訴應該寫哪些內容,應該如何排版等。

但此次向讀者們介紹的是專門針對於 Machine Learning 論文且附代碼的 README 書寫標準及模板,讓你不必在 README 的結構,排版上花更多時間。話不多說,來看參考圖:

第一部分肯定是論文的標題,以及包括了可選擇一些圖表來簡單說明所使用的方法、主要結構或者是 bibtex 類型等。接著要簡要說明安裝要求,比如如何設置環境,如何使用 pip / conda / docker 命令,如何下載數據集等。

而接下來要針對訓練來介紹。描述如何訓練模型,並在論文中用示例命令去說明該如何訓練模型,包括完整的訓練過程以及適當的超參數等。

「Evaluation」此一項要介紹如何根據論文中的基準去評估訓練後的模型。而之後針對預訓練模型,要提供有效連結,如何下載預訓練模型,以及簡要介紹他們是如何被訓練的。而最後,則是輸出結果,結果對比以及排行榜等。

其實,從邏輯上看並不難,README 大部分操作是較為麻煩且花時間的,如果有了此模板,很多固定的格式就可以直接套用,省去了不少時間。

LaTeX 模板寫論文

如果實驗做完了,README 也寫好了,發現了驚人的效果,現在該投論文了。不同的大會都有一些格式上的要求,有時候他們也會在 GitHub 上發布 LaTex 論文模板。作為最後一步,本文推薦清華大學的畢業論文模板,它包含了完整的 LaTeX 文件,下載下來並修改內容後,一鍵就能生成標準的 PDF。

該學位論文 LaTeX 模板,包括本科綜合論文訓練、碩士論文、博士論文以及博士後出站報告。

項目地址:https://github.com/xueruini/thuthesis

有了這些項目,枯燥無味的文書工作都可以變得更有效率,還不會出錯。

相關焦點

  • 論文繪圖神器:一行代碼繪製不同期刊格式圖表,哈佛博士後開源
    賈浩楠 發自 凹非寺量子位 報導 | 公眾號 QbitAI「一篇論文投多個期刊,每個期刊對圖表格式要求不一,同一組數據要用多種工具分別繪圖。」不光是你,哈佛大學天文研究所的博士後,也不堪忍受論文重複繪圖之苦。
  • SCI論文那些事兒——學會套用寫作的一般格式
    這一期我給大家分享的是關於SCI論文寫作的一般格式。我從研究生到工作,基本都是採用這一種格式來寫中文、英文的期刊和會議論文。我覺得,這個還是挺管用的,希望能幫助大家!SCI論文通常具有以下幾個部分·Title Page·Abstract·Introduction·Materials and Methods·Results·Discussion·Acknowledgments·References雖然這種格式不是一成不變的,但大多數
  • Scientific Reports論文寫作模板已在AJE官網上線
  • 數學公式編輯神器——LaTeX
    LaTex非常適合用於科技類和數學類文檔書籍的排版、編輯;可以生成高質量的專業書籍、學術海報、幻燈片(beamer)等PDF格式文檔。相比Word,LaTeX生成的文檔更精美漂亮。LaTexTeX系統是由美國的Donald E. Knuth教授研製的計算機排版系統。
  • 使用LaTeX進行TeX格式的論文排版,完美解決複雜表格和數學公式!
    不得改變任何一個字母的大小寫,以免和「latex」(乳膠)混淆。Lamport開發的LaTeX是當今世界上最流行和使用最為廣泛的TeX宏集。它構築在Plain TeX的基礎之上,並加進了很多的功能以使得使用者可以更為方便的利用TeX的強大功能。使用LaTeX基本上不需要使用者自己設計命令和宏等,因為LaTeX已經替你做好了。
  • 論文格式模板範文大公開,大學畢業生們快快學起來!
    畢業論文的寫作由兩部分組成,一部分是論文內容的寫作,另一部分是論文格式的設置。下面給大家一篇大學論文格式模板範文,幫助大家更好地完成論文。大學論文格式模板範文:(題目) XXXXXXXXXXXXXXX (三號黑體居中)(副標題)一一XXXXXXXXXXXXXXX ( 宋體四號居中)作者(宋體四號居中)(xx大學xX學院,班級學號) (宋體小五號居中)摘 要: (宋體小五號加粗) XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXxxxxxxxxxxxxxxxxxxxxxxxxx
  • SCI期刊有沒有寫作格式模板?
    SCI期刊有沒有寫作格式模板?任何論文的寫作都是有模板可參照的,SCI論文的寫作中,模板似乎更加重要一些,因為SCI論文需要英語寫作,英文的表達方式和語法與中文是不同的,這給不少打算發表SCI論文的作者帶來不小的麻煩,尤其一些英語基礎比較差的作者,英語基礎不好是不是就真的沒有辦法發表SCI論文了?
  • 寫下LaTeX代碼就要看結果?這款編輯器讓你「所見即所得」
    它通過代碼的形式,讓寫出來的報告和論文保持良好的格式,因此受到歡迎。LaTeX 有一個小小的缺點——寫好的 LaTeX 代碼並不能夠立刻表現為真實的排版效果。近日,GitHub 出現了一個新的項目,是一個名為 SwiftLaTeX 的可視化編輯器。該項目最大的亮點在於:你編寫的 LaTeX 代碼能夠立刻展示實際的效果,所見即所得。這個編輯器還是基於瀏覽器的,還支持雲文件存儲。
  • 論文格式排版你真的做對了嗎? 常用格式及其LaTeX書寫方法介紹
    論文格式排版是你的文章留給審稿人的第一印象,一篇排版糟糕的文章很難會使審稿人相信這篇文章提出了卓有建樹的思想。
  • Python代碼轉Latex公式,這個開源庫用一行代碼幫你搞定
    數學是數據科學和機器學習的重要基礎,數學運算的結果對於機器學習項目而言是至關重要的。在編寫代碼時,我們常常需要定義數學公式的計算形式。像 S=r^2 這樣簡單的數學公式,大概不會出現拼寫錯誤。但如果是下面這樣的公式呢?圖源:知乎用戶 @馬啃菠籮還記得數學老師密密麻麻的板書嗎?人們習慣於手寫公式的運算過程。
  • 數學論文、幻燈片、書籍編輯,如何快速入門LaTeX?
    LaTeX是科學排版系統,可以用於學位畢業論文、學術期刊論文的編輯;個人簡歷、學術海報的製作;以及滿足專業書籍、演示文稿、試卷等不同需求。所以國內外的知名大學、出版社和學術會議都有自己的LaTeX模板。作者只需要在模板中編輯內容,作為新手只需對LaTeX有個基礎入門即可,如果在寫作過程中,遇到表格、插圖、公式編輯的需要或問題,再去查找相關的內容,比如買一本關於LaTeX的書,作為工具書使用。基於個人的需求,選擇合適的模板。因為模板已經設計好格式框架,作者只需要專注於內容,而非花時間在調整框架上。
  • 從論文到測試:Facebook Detectron開源項目初探
    大家對Facebook的計算機視覺研究項目的開源期盼已久,經過1年多的漫長等待,今天Facebook終於開源了Detectron,Detectron開源項目使用caffe2和python接口。實現了10多篇計算機視覺最新的成果。下面我們簡單介紹一下Detectron所實現的論文。並且對Detectron進行初次測試,我們會在隨後的博客中更新我們自己測試得到的Detectron訓練模型和速度標準。
  • 整套的PPT模板怎麼用?如何套用下載好的PPT模板?
    現如今大部分人都會製作PPT,雖然有好有一般,但大概方式都是懂得的,不過很多新手在製作PPT時候都會藉助PPT模板來進行製作自己的PPT,這個時候就有不少人想知道怎麼套用別人的PPT模板了,今天我們來分享一下PPT模板該怎麼用?
  • 百度開源2020年度報告:兩大開源平臺、九個捐贈項目
    目前,飛槳累計開發者265萬,服務企業超過10萬家,基於飛槳開源深度學習平臺產生了34萬+個模型。飛槳助力開發者快速實現AI想法,快速上線AI業務。幫助越來越多的行業完成AI賦能,實現產業智能化升級。,穩定性>=99.99%;14w節點廣告聚屏案例生產環境檢驗;2020年9月,超級鏈成為首個捐贈給開放原子開源基金會的項目;2020年10月,開放原子開源基金會宣布成立國內首個區塊鏈開源工作組,工作組由百度發起,與浪潮、招商銀行等知名企業共同成立,在開放原子開源基金會指導下進行區塊鏈相關事務的專項管理。
  • 6月,機器學習最受歡迎的十大開源項目
    過去的一個月中,我們在將近250個機器學習開源項目中,綜合各種條件進行打分排序,最終評選出十大最新、最棒的機器學習開源項目。這份Top10名單包括NLP構架、圖像壓縮等項目。它們在GitHub上的平均標星數量是760多顆。希望你可以從中找到感興趣的項目。
  • Reference格式 Chigago格式
    芝加哥引注格式在美國比在英國的應用更多,這一格式的基準是《芝加哥引注格式使用指南》(The Chicago Manual of Style),但是也有很多用戶把凱特杜拉賓(Kate Turabian)為學生編寫的《學期、學位、學術論文寫作指南》(A Manual for Writers of Term Papers,
  • 函數與條件格式的完美結合:會變色的Excel銷售統計查詢模板
    今天小編再分享一個銷售統計查詢模板,支持動態查詢,並且查詢的數據會突出顏色顯示。需要模板的可以評論區留言或私信我。先來看效果圖:實現這個效果圖用到了條件格式和數據驗證功能,用到的主要函數有SUM、MATCH、OFFSET等函數。
  • 直接套用適合、精美的模板
    我的話,平時使用迅捷畫圖比較多,常常用它畫思維導圖,直接套用裡面的精美模板就ok。對畫腦圖有興趣的話,小夥伴們不妨耐心閱讀下去,和我一起去探索做思維導圖的技巧哦。進入到網站首頁,把頁面往下拉,大家可以直接搜索出自己想要的腦圖模板哦。
  • Github累積1.6萬顆星,這家AI公司的開源項目有望讓程式設計師少加班
    OpenMMLab 是商湯科技開源的一個計算機視覺領域的 AI 算法框架。自 2018 年 10 月逐步開源以來,OpenMMLab 在軟體原始碼託管服務平臺 Github 上共累積了 1.6 萬個星。開發 OpenMMLab 對於商湯來說意味著什麼?商湯對於未來 OpenMMLab 又會有怎樣的發展計劃?