「主編講堂」預印本平臺arXiv簡介

2021-01-11 中國科技論文在線

Wiki百科關於arXiv的介紹為,arXiv的發音是archive,其中ch用希臘字母χ替代,是一個在多個學科領域獲取預印本和科技論文的網站。近年來,預印本平臺因其快速高效的發表速度,越來越得到廣大科研工作者的歡迎,很多平臺可以將長達半年到一年的期刊出版時間大幅縮短到以天計算。各學科預印本平臺層出不窮,而作為最早的預印本老大哥,是arXiv.org開創並引領了這一進程。

始於1991年8月的arXiv由Paul Ginsparg創建,可以說它和全球資訊網(WWW)是同時代的前輩。arXiv的免費和快速受到了同行們的歡迎,高能物理學家們很快就接受了這種新的交流方式,並積極地參與進來。當時物理學家們需要儘快發布自己的成果,他們等不及期刊漫長的發表時間,因為那意味著可能會把本來屬於自己的「光榮」拱手讓給同行,甚至是獲得諾貝爾獎的機會。因此這些科學家們已經習慣於互相交換自己最新工作的論文預印本。因此,可以說arXiv的意義是重大的,它使全世界的物理學研究「一體化」了,創建人Ginsparg也因此獲得了2002年的麥克阿瑟獎。

2001年arXiv將平臺的運營、編輯、經濟和管理轉移到康奈爾大學圖書館。arXiv最初用於高能物理和粒子物理學家之間的交流,如今,它不僅改變了物理學多個領域的學術交流方式,且延伸到了數學,非線性科學,計算機科學,數量生物學,數量金融學,統計學等多個領域,發揮著越來越重要的作用。平臺擁有免費獲取的科技論文167萬餘篇。

註冊

arXiv平臺使用郵箱作為註冊用戶名,對研究者來說郵箱用學校或者科研單位的後綴,如.edu或.ac,來表明學者身份;如果只能用非科研機構的個人郵箱,則需要有一個背書(endorser)的過程,即需要聯繫一位在arXiv的相應領域內已發布過多篇論文的學者,讓他來認可你的專業背景。註冊信息填寫完畢後,你的註冊郵箱會接受到一個驗證碼,填入後就成功註冊了。

提交論文

註冊完成後就可以將論文預印本提交到ArXiv.org上了,只需要按提示一步步操作即可。

首先是一系列信息確認和授權工作。arXiv有六種不同的授權方式,其中提供4種遵循CC版權協議的授權方式供作者選擇。

ArXiv可以接收(La)TeX, AMS(La)TeX, PDFLaTeX文檔;PDF文檔;PostScript和HTML with JPEG/PNG/GIF images幾種格式的文件。不包括.doc格式的文件,並且文件名需要是英文或數字。如果使用LaTex編寫論文的作者要注意,需要提交LaTex源文件、與源文件同名的.bbl格式引文文件,需要上傳圖片的話最好一幅一幅單獨上傳。ArXiv推薦的文件上傳格式和版本為:TeX Live 2016.

提交成功之後,可以預覽編譯的結果,如果沒有問題,就可以提交,之後會收到郵件提醒,一般一兩天之內arxiv.org上就可以顯示了。

檢索

arXiv.org提供多種檢索模式,搜索和篩選都非常方便。可以通過學科領域、論文題目、作者、摘要、期刊名稱、DOI、OSID等多種條件檢索需要的文獻,在庫的文獻還包括了很多已經被NIPS,AAAI等等行業頂級會議接受的會議論文。所有這些文章都可以直接免費下載pdf原文。

值得注意的是,直接點擊標題下方感興趣的作者名字,所有他發表過的文章都會被列出來,完全不用擔心其他搜尋引擎中常常發生的同名同姓作者的麻煩。

版權

arXiv基本上遵循CC版權聲明,也就是你可以自由分享,自由改動但是你必須提供按原作者指定方式的署名並且同樣遵循CC協議,這極大地鼓勵了科研領域知識的分享。並且CC署名授權並不排斥作品的商業使用,因此arXiv上的某些文章也可以被用於商業用途。

如果文章作者希望同時在一些期刊或出版社發表的話,就可能存在潛在的協議衝突。就是說arXiv和學術期刊出版商的版權政策可能存在牴觸。這是一個很值得深思的問題。因為,很多科研工作者仍然認為,他們的論文被一些公認的商業刊物發表是傳播其影響力的最有效途徑。但是,在一篇作品發表之前,出版商會要求作者同意並籤署他們制定的版權轉讓協議,這些協議囊括了儘可能多的作者擁有的版權,並且很多都被要求享有獨家權力,這有可能和arXiv的做法相牴觸,無論你是在文章發表以前還是以後,要想也在arXiv上發布,必須考慮這些法律問題。

好在arXiv倡導的這種自由分享的精神逐漸形成一種潮流,讓越來越多的出版商逐漸接受了和自由分享共存的價值觀。已經有部分出版商在他們的版權協議中支持或不反對作者也提交其文章到arXiv。

目標

arXiv 的學術交流模式非常明顯的是「學者自治」。因為科研工作者是學術文章的著作權擁有者,他們有權力決定自己作品的命運。中國的科研工作者應該更加善於運用國內外的預印本平臺,更加優先使用中文預印本平臺,讓科研成果能第一時間實現全球共享,也讓智慧財產權能保留在中國。

可以預見,以arXiv為代表的預印本平臺,將有效提升知識分享的廣度與速度,而知識的分享將會極大地促進人類進步,科學研究本身更是需要深度交流。(責任編輯馬徵,榮譽主編李志民)

相關焦點

  • 習慣arXiv的今天,我們的論文應該引用預印本嗎?
    近日,一篇討論是否應該引用預印本論文的文章引起了廣泛討論。本文作者 Jon Tennant 來自英國帝國理工大學,地球物理博士學位,他也是古生物學預印本平臺 PaleorXiv 的創建者之一。在這篇文章之後,機器之心還整理了兩條對本文意見不一的評論,你有什麼看法呢,不妨在評論中和我們討論。本文內容不代表機器之心的觀點。
  • 全美學界停擺24小時:arXiv、Nature、Science全部暫停更新
    在美國黑人弗洛伊德去世的十幾天後,反種族歧視的抗議又一次引發了學術界「地震」。當地時間周二,美國高校學術界和科技界聯合向同行發起倡議,呼籲科學家和學者在本周三一起參與大罷工,用中止學術和中止科研等方式支持「黑人的命也是命」的遊行示威。這項聲援美國反種族主義遊行的活動,名為「ShutDownSTEM」。
  • 「中國天眼」計劃啟動地外文明搜索,尋找外星人
    而未來「中國天眼」將是最有可能發現外星生命的望遠鏡。全球最大單口徑,最靈敏射電望遠鏡:「中國天眼」「中國天眼」是500米口徑球面射電望遠鏡(Five-hundred-meter Aperture Spherical Telescope),簡稱FAST。
  • 來自「無印良品」的白噪音,讓你體驗什麼是真正的「性冷淡」#...
    一定有不少人早已計劃好了周末晚上的各種活動了吧,工作一周給自己放鬆一下當然無可厚非,不過除了喝酒、聚餐、逛街、看電影……這些「動態」的放鬆方式以外,有沒有想過試試更「安靜」一些的放鬆方式,比如——聽聽白噪、放空腦袋……,這樣的方式也許會更有效些。 「MUJI to Relax」就是今天簡要推薦給大家的一款可以幫助我們放空腦袋、放鬆神經的優質白噪軟體。
  • 170多萬篇論文,存儲量達1.1 TB,Kaggle上線arXiv完整數據集
    與此同時,Kaggle 通常是數據科學家和機器學習工程師尋求有趣數據集、公開筆記和賽題的重要平臺。研究者可以利用 Kaggle 上廣泛的數據探索工具,輕鬆地與他人共享相關腳本和輸出。所以,是不是可以將 arXiv 上的巨量學術論文打包放在 Kaggle 上呢?
  • 知乎發布讀讀日報:個體推薦人人都是主編
    在讀讀,「總有一個日報適合你」。人人都可以成為主編   讀讀日報通過鼓勵用戶創建自己的主題日報,它讓人們的鑑別力和判斷力成為信息篩選的節點,從而使得讀者們能夠依靠「人」的推薦,減少信息篩選的成本,快速找到網際網路上真正適合自己口味的,好看的內容。
  • 強強聯合,Papers with Code攜手arXiv,上傳論文、提交代碼一步到位
    澎湃新聞·澎湃號·湃客 機器之心報導作者:魔王剛剛,機器學習資源網站 Papers with Code 宣布與論文預印本平臺
  • 「主編講堂」全球學術英國篇(九)英國皇家學會簡介
    1660年,全稱為「倫敦皇家自然知識促進學會」,最開始是由約12位科學家自發組織而成,當時稱作「無形學院」(invisible college),於1662年由國王查理二世授予皇家證書,是世界上歷史最長而又從未中斷過的科學學會,對外代表英國科學界,發揮著英國的國家科學院作用,在世界上享有極高的聲譽,我們在昨天推送的《全球學術英國篇(七)英國的院士制度介紹》一文中也介紹過學會的起源、歷史及組織機構等,本篇主要針對其作用和影響展開
  • 「主編講堂」什麼是新文科
    (責任編輯楊碩,榮譽主編李志民)參考文獻:[1] 新文科建設要做到三個「新」[N]. 北京青年報,2019-05-21(A02)[2] 麥可思, 王慧. 一場新文科的嘗試[N].
  • 170多萬篇論文打包下載,1.1 TB,Kaggle上線arXiv完整數據集
    與此同時,Kaggle 通常是數據科學家和機器學習工程師尋求有趣數據集、公開筆記和賽題的重要平臺。研究者可以利用 Kaggle 上廣泛的數據探索工具,輕鬆地與他人共享相關腳本和輸出。所以,是不是可以將 arXiv 上的巨量學術論文打包放在 Kaggle 上呢?
  • 百度推「一次包會」模型:「一次性」教會智能體認知新事物
    在雷鋒網旗下學術頻道 AI 科技評論的資料庫項目「AI影響因子」中,憑藉百度 PaddlePaddle 開源平臺負責人王益專訪、百度數據可視化實驗室的成立及NLP 團隊在微軟 MARCO 閱讀理解數據集上的突出表現、被ACL 2018 接收的論文「Interactive Language Acquisition with One-shot Visual Concept Learning
  • arXiv無償捐贈170萬篇論文給Kaggle,BERT版審稿人要來了!
    「我不知道,但是給BERT的話應該訓練出來一個審稿人」! 在1990年左右,喬安妮·科恩(Joanne Cohn)開始通過電子郵件將物理預印本發送給同事,但很快,因為發送的論文數量太多,郵箱「爆倉」了。
  • 印力匯德隆奧體印象城封頂,這個杭州項目的確「很有聊」
    這其中幾個品牌都讓我很驚喜:「酒吞」,魔都人氣日料,多家店鋪均在點評上排行所在區域日料第一名。深耕上海13年,酒吞憑藉著新鮮的食材、地道的料理在日料界牢牢佔據著一席之地。酒吞在南翔印象城MEGA、七寶萬科廣場均有入駐,此次進軍杭州又選擇與印力攜手,無疑是對多年來愉快合作的再度肯定。
  • ImageNet 帶來的預訓練模型之風,馬上要吹進 NLP 領域了
    但是自然語言處理領域的研究人員和開發人員們似乎並不是這樣做的 —— 等等,也許 NLP 領域的「ImageNet 時代」馬上就要帶來了。現今 ULMFiT、ELMo 和 OpenAI Transformer 相當於給自然語言處理社區帶來了「語言任務的 ImageNet」,也就使得模型能夠學習到文本中更高層次的細微差別;這類似於 ImageNet 上的預訓練使得計算機視覺模型學習到了圖像的通用特徵。
  • PTMs|2020最新NLP預訓練模型綜述
    以下文章來源於蘑菇先生學習記 ,作者蘑菇先生蘑菇先生學習記本篇文章主要介紹邱錫鵬老師在2020年發表的一篇預訓練模型的綜述:「Pre-trained Models for Natural Language Processing: A survey
  • 《原神》全新角色介紹-「刻晴:七星之玉衡」
    璃月,受巖王帝君「摩拉克斯」治理,享有長久的繁榮昌盛。源遠流長的歷史已證明,追隨帝君的腳步是正確的。然而,與一年才降臨一次的帝君不同,「璃月七星」才是密切注視著璃月的治理者。作為「人」的他們,並非都安於聽從「神」命,比如七星中的玉衡星,刻晴——  「帝君?哼,說句不好聽的,他真的什麼都懂嗎?」
  • 「主編講堂」全球學術日本篇(一)日本的科研機構簡介
    (責任編輯遊丹,榮譽主編李志民)
  • 「主編講堂」全球學術加拿大篇(一)加拿大的科研機構簡介
    (責任編輯邵鶴楠,榮譽主編李志民,圖片來源於網絡)【參考文獻】[1]www.aecl.cn[2]https://baike.baidu.com/item/%E5%8A%A0%E6%8B%BF%E5%A4%A7%E5%9C%B0%E8%B4%A8%E8%B0%83%E6%9F%A5%E6%89%80/6393251?
  • Open Access Library (OALib)簡介
    OALib學科知識庫則是為廣大科研工作者提供的一個免費存儲文獻資料的空間,文獻以元數據、文章預印本和後印本的形式免費存儲在對應的311個領域類別中。4)對於作者發布權力,OALib網站上做了詳細說明:預印本在同行評審之前,後印本在同行評審之後,作者仍持有文章的版權,所以作者可以將他們的初稿發布在任何資料庫或者網站上。OALib並未剝奪作者的此項權利。一旦文章經同行評審和同意出刊之後,作者將給予OALib非專有版權。OALib在得到非專有版權後方可以OALib Journal的模板對文章進行排校。