「主編講堂」預印本平臺arXiv簡介

2020-12-16 中國科技論文在線

Wiki百科關於arXiv的介紹為,arXiv的發音是archive,其中ch用希臘字母χ替代,是一個在多個學科領域獲取預印本和科技論文的網站。近年來,預印本平臺因其快速高效的發表速度,越來越得到廣大科研工作者的歡迎,很多平臺可以將長達半年到一年的期刊出版時間大幅縮短到以天計算。各學科預印本平臺層出不窮,而作為最早的預印本老大哥,是arXiv.org開創並引領了這一進程。

始於1991年8月的arXiv由Paul Ginsparg創建,可以說它和全球資訊網(WWW)是同時代的前輩。arXiv的免費和快速受到了同行們的歡迎,高能物理學家們很快就接受了這種新的交流方式,並積極地參與進來。當時物理學家們需要儘快發布自己的成果,他們等不及期刊漫長的發表時間,因為那意味著可能會把本來屬於自己的「光榮」拱手讓給同行,甚至是獲得諾貝爾獎的機會。因此這些科學家們已經習慣於互相交換自己最新工作的論文預印本。因此,可以說arXiv的意義是重大的,它使全世界的物理學研究「一體化」了,創建人Ginsparg也因此獲得了2002年的麥克阿瑟獎。

2001年arXiv將平臺的運營、編輯、經濟和管理轉移到康奈爾大學圖書館。arXiv最初用於高能物理和粒子物理學家之間的交流,如今,它不僅改變了物理學多個領域的學術交流方式,且延伸到了數學,非線性科學,計算機科學,數量生物學,數量金融學,統計學等多個領域,發揮著越來越重要的作用。平臺擁有免費獲取的科技論文167萬餘篇。

註冊

arXiv平臺使用郵箱作為註冊用戶名,對研究者來說郵箱用學校或者科研單位的後綴,如.edu或.ac,來表明學者身份;如果只能用非科研機構的個人郵箱,則需要有一個背書(endorser)的過程,即需要聯繫一位在arXiv的相應領域內已發布過多篇論文的學者,讓他來認可你的專業背景。註冊信息填寫完畢後,你的註冊郵箱會接受到一個驗證碼,填入後就成功註冊了。

提交論文

註冊完成後就可以將論文預印本提交到ArXiv.org上了,只需要按提示一步步操作即可。

首先是一系列信息確認和授權工作。arXiv有六種不同的授權方式,其中提供4種遵循CC版權協議的授權方式供作者選擇。

ArXiv可以接收(La)TeX, AMS(La)TeX, PDFLaTeX文檔;PDF文檔;PostScript和HTML with JPEG/PNG/GIF images幾種格式的文件。不包括.doc格式的文件,並且文件名需要是英文或數字。如果使用LaTex編寫論文的作者要注意,需要提交LaTex源文件、與源文件同名的.bbl格式引文文件,需要上傳圖片的話最好一幅一幅單獨上傳。ArXiv推薦的文件上傳格式和版本為:TeX Live 2016.

提交成功之後,可以預覽編譯的結果,如果沒有問題,就可以提交,之後會收到郵件提醒,一般一兩天之內arxiv.org上就可以顯示了。

檢索

arXiv.org提供多種檢索模式,搜索和篩選都非常方便。可以通過學科領域、論文題目、作者、摘要、期刊名稱、DOI、OSID等多種條件檢索需要的文獻,在庫的文獻還包括了很多已經被NIPS,AAAI等等行業頂級會議接受的會議論文。所有這些文章都可以直接免費下載pdf原文。

值得注意的是,直接點擊標題下方感興趣的作者名字,所有他發表過的文章都會被列出來,完全不用擔心其他搜尋引擎中常常發生的同名同姓作者的麻煩。

版權

arXiv基本上遵循CC版權聲明,也就是你可以自由分享,自由改動但是你必須提供按原作者指定方式的署名並且同樣遵循CC協議,這極大地鼓勵了科研領域知識的分享。並且CC署名授權並不排斥作品的商業使用,因此arXiv上的某些文章也可以被用於商業用途。

如果文章作者希望同時在一些期刊或出版社發表的話,就可能存在潛在的協議衝突。就是說arXiv和學術期刊出版商的版權政策可能存在牴觸。這是一個很值得深思的問題。因為,很多科研工作者仍然認為,他們的論文被一些公認的商業刊物發表是傳播其影響力的最有效途徑。但是,在一篇作品發表之前,出版商會要求作者同意並籤署他們制定的版權轉讓協議,這些協議囊括了儘可能多的作者擁有的版權,並且很多都被要求享有獨家權力,這有可能和arXiv的做法相牴觸,無論你是在文章發表以前還是以後,要想也在arXiv上發布,必須考慮這些法律問題。

好在arXiv倡導的這種自由分享的精神逐漸形成一種潮流,讓越來越多的出版商逐漸接受了和自由分享共存的價值觀。已經有部分出版商在他們的版權協議中支持或不反對作者也提交其文章到arXiv。

目標

arXiv 的學術交流模式非常明顯的是「學者自治」。因為科研工作者是學術文章的著作權擁有者,他們有權力決定自己作品的命運。中國的科研工作者應該更加善於運用國內外的預印本平臺,更加優先使用中文預印本平臺,讓科研成果能第一時間實現全球共享,也讓智慧財產權能保留在中國。

可以預見,以arXiv為代表的預印本平臺,將有效提升知識分享的廣度與速度,而知識的分享將會極大地促進人類進步,科學研究本身更是需要深度交流。(責任編輯馬徵,榮譽主編李志民)

相關焦點

  • 習慣arXiv的今天,我們的論文應該引用預印本嗎?
    近日,一篇討論是否應該引用預印本論文的文章引起了廣泛討論。本文作者 Jon Tennant 來自英國帝國理工大學,地球物理博士學位,他也是古生物學預印本平臺 PaleorXiv 的創建者之一。在這篇文章之後,機器之心還整理了兩條對本文意見不一的評論,你有什麼看法呢,不妨在評論中和我們討論。本文內容不代表機器之心的觀點。
  • 全美學界停擺24小時:arXiv、Nature、Science全部暫停更新
    在美國黑人弗洛伊德去世的十幾天後,反種族歧視的抗議又一次引發了學術界「地震」。當地時間周二,美國高校學術界和科技界聯合向同行發起倡議,呼籲科學家和學者在本周三一起參與大罷工,用中止學術和中止科研等方式支持「黑人的命也是命」的遊行示威。這項聲援美國反種族主義遊行的活動,名為「ShutDownSTEM」。
  • 拿到參考資料的預訓練模型,太可怕了!
    (預訓練+微調),實驗表明預訓練語言模型能夠從海量數據中學習到廣泛的世界知識,「這些知識以參數的形式存儲在模型中,經過適當的微調就能在下遊任務中取得SOTA表現,而不需要訪問或檢索額外的外部知識庫」,比如GPT-3就可以被當作是一個參數化的大規模隱式知識庫。
  • 中國首次實現量子優越性;華為諾亞等預訓練圖像處理Transformer
    機器之心 & ArXiv Weekly Radiostation參與:杜偉、楚航、羅若天本周的重要研究包括首次實現中國量子優越性的量子計算原型機「九章」以及華為諾亞、北京大學等聯合提出的預訓練圖像處理 Transformer。
  • 印順思想整理芻議
    依藍吉富教授歸納,臺灣佛學界紹述弘揚印順思想的人或道場有如下諸處:1、昭慧法師主導的弘誓弘法團體,2、傳道法師住持的妙心寺, 3、宏印法師主導的學佛團體, 4、福嚴精舍及慧日講堂。此外,其他道場用印順法師著作為教材的也不少。
  • 170多萬篇論文,存儲量達1.1 TB,Kaggle上線arXiv完整數據集
    與此同時,Kaggle 通常是數據科學家和機器學習工程師尋求有趣數據集、公開筆記和賽題的重要平臺。研究者可以利用 Kaggle 上廣泛的數據探索工具,輕鬆地與他人共享相關腳本和輸出。所以,是不是可以將 arXiv 上的巨量學術論文打包放在 Kaggle 上呢?
  • 一天刷到 5 篇「x is All You Need」,當學術論文開始標題黨……
    2017 年 6 月,Transformer 橫空出世,迅速成為自然語言處理領域中的主流預訓練模型,並在近期迎來了在計算機視覺等多個領域中的跨界應用熱潮。但此類「X is All You Need」論文篇篇都有高含金量嗎?X 真的重要到「All You Need」的程度嗎?還是論文作者把這個句式當做「財富密碼」?或許我們可以從其「通貨膨脹」程度一窺究竟。
  • 阿里達摩院自動駕駛新成果;邱錫鵬預訓練模型論文綜述
    」的 165 頁長篇論文,有網友表示「現在要取得科學上的新突破,把物理與數學緊密結合形成團隊進行深入研究是非常有效的一種方式。像以前僅僅靠單打獨鬥的方式或者只考慮自己本學科的研究體系已經不適應當今科學發展的需要。交叉學科的有機融合將會帶來科學大發展的新一輪機遇。」
  • Papers with Code攜手arXiv,上傳論文、提交代碼一步到位
    機器之心報導作者:魔王剛剛,機器學習資源網站 Papers with Code 宣布與論文預印本平臺 arXiv 進行合作,論文作者在 arXiv 上上傳論文時可以同步上傳官方和社區代碼最近,它又有了新舉措:與論文預印本平臺 arXiv 展開合作,支持在 arXiv 頁面上添加代碼連結。現在,arXiv 上機器學習論文摘要頁面的下方出現了一個 Code 按鈕,它可以連結論文相關的官方和社區代碼實現:arXiv 論文頁面新增的 Code 部分(Papers with Code 提供支持)。
  • 全關東最大「無印良品 東京有明」臺場開幕在即
    全東京最大的無印良品即將登場!位於臺場地區的「無印良品 東京有明」即將在2020年12月3日開幕,佔地約1,400坪,賣場坪數超越銀座無印良品,號稱為超級全方位的「百八貨店」!▋千坪賣場超好逛!「無印良品 東京有明」榮登關東最大級「無印良品 東京有明」預計2020年12月3日開幕,地點就位在臺場的「有明GARDEN購物中心」一樓至三樓,商場坪數約1,400坪(含餐廳),正式超越了銀座MUJI商場的1,206坪,除了販售無印良品全系列商品之外,更網羅日常生活食、衣、住、樂所有產品,以「百八貨店」為概念,打造最全方位的
  • 因低劣新冠論文泛濫,最大預印本網站開始拒稿新冠論文
    截至 5 月 11 日,作為主要的新冠研究預發布平臺,medRxiv 和 bioRxiv 收錄相關預印本論文 3174 篇,其中有 2546 篇收錄在 medRxiv,628 篇收錄在 bioRxiv。
  • 期刊投稿準則:「應該」與「不該」做的事
    有很多人在信中將收件人的稱呼誤寫為另一本期刊的主編(顯然論文剛被那一本期刊拒絕),這顯然會給主編留下不好的第一印象!應該 推薦最多五位合適的審閱者,並從編輯委員群中推薦一位委員雖然指定哪些審閱者是由主編決定,但實際上,期刊工作人員的工作量都很大,如果您願意做一點背景調查提供協助,便能減輕他們的壓力。
  • 無印良品的「中國式」崛起與潰敗
    如今,用簡單的「文青退潮」、「市場變化」,都不能粉飾無印良品在品牌管理上的失策。企業一旦不知道居安思危,必然積重難返。在最近大量批評無印良品定價過高、缺乏護城河的聲音裡,我們想要釐清幾個問題:無印良品的發展過程中,到底忽視了哪幾次危機信號?
  • 7 Papers & Radios | 阿里達摩院自動駕駛新成果;邱錫鵬預訓練模型...
    圖片來源:Lucy Reading-Ikkanda/Quanta Magazine推薦:針對這篇「不明覺厲」的 165 頁長篇論文,有網友表示「現在要取得科學上的新突破,把物理與數學緊密結合形成團隊進行深入研究是非常有效的一種方式。像以前僅僅靠單打獨鬥的方式或者只考慮自己本學科的研究體系已經不適應當今科學發展的需要。
  • 砥礪奮進的五年③|堅守「三美理想」全力打造「立德樹人」國美模式
    學校官方微信「微國美」關注人數逾45萬,年閱讀量超500萬次,長期保持在全國高校官方微信影響力前30和浙江省前2;拓展海外宣傳平臺,打造中國美術學院英文網和英文臉譜(Facebook)、推特(Twitter)、Instagram美圖專頁和Youtube視頻,連續兩年中國大學海外網絡傳播力位居內地高校第三;順應短視頻發展潮流,進駐抖音、嗶哩嗶哩、人民號等熱門自媒體平臺,形成立體傳播;在全省高校範圍內率先啟動校園網絡直播
  • 「元學習」解析:學習如何梯度下降與學習新的算法
    在這篇文章中,Cody 介紹了元學習的基本概念和方法類別,討論了「元學習」到底在學什麼、又有哪些限制。當我第一次聽到「元學習」的時候,它的概念是如此地令我沉醉:這個項目要構建不僅能夠進行學習的機器,這些機器還能學習「如何學習」的方法。
  • 無印良品的中國學徒,和他們的「製造力」夥伴
    任曉華的孚日集團成立於 30 年前,靠海外市場和外貿生意發家;支撐他們走到今天的,是來自歐美、日本的客戶訂單,包括無印良品、迪士尼和沃爾瑪。長期以來,來自國內電商平臺的訂單只能算得上是孚日收益來源的「毛毛雨」;然而,從 2016 年開始,這場「雨」越下越「密」了。
  • 大航法師:我與印順導師的思想是不同的
    留日返臺後,本擬暫住慧日講堂一陣子後,便找個地方靜修。然此時正逢福嚴由女眾學院改為男眾之際,亟需男眾法師,前院長真華長老特意親自來慧日講堂邀我到福嚴授課,見長老如此用心,不敢違逆,便答應先教學一年。後又因學院缺少訓導主任,故於翌年受請擔任主任之職。該屆畢業後,本已決定隨真華院長、慧天教務主任兩位老法師一齊離開福嚴。
  • 來自「無印良品」的白噪音,讓你體驗什麼是真正的「性冷淡」#...
    一定有不少人早已計劃好了周末晚上的各種活動了吧,工作一周給自己放鬆一下當然無可厚非,不過除了喝酒、聚餐、逛街、看電影……這些「動態」的放鬆方式以外,有沒有想過試試更「安靜」一些的放鬆方式,比如——聽聽白噪、放空腦袋……,這樣的方式也許會更有效些。 「MUJI to Relax」就是今天簡要推薦給大家的一款可以幫助我們放空腦袋、放鬆神經的優質白噪軟體。
  • 170多萬篇論文打包下載,1.1 TB,Kaggle上線arXiv完整數據集
    與此同時,Kaggle 通常是數據科學家和機器學習工程師尋求有趣數據集、公開筆記和賽題的重要平臺。研究者可以利用 Kaggle 上廣泛的數據探索工具,輕鬆地與他人共享相關腳本和輸出。所以,是不是可以將 arXiv 上的巨量學術論文打包放在 Kaggle 上呢?