2018 年重磅復盤:中國產出全球 25% AI 論文、政府署名 AI 論文...

2020-12-05 雷鋒網

雷鋒網(公眾號:雷鋒網) AI 科技評論按:美國史丹福大學創立的 AI Index 項目旨在追蹤人工智慧的活動和進展,以可靠、可驗證數據為基礎,研究人工智慧對人們生活的影響。2018 年度的《AI Index》在 2018 年 12 月 17 日如期發布,從學界和業界的角度對全球的 AI 生態進行了全盤總結。

AI Index 最早可追溯至美國史丹福大學一個名叫「AI100」的項目,其首要目標是持續地去調查、總結人工智慧未來 100 年在學術研究、經濟、道德倫理、法律等方面的進展和對此的展望,然而遺憾的是,該報告每五年推出一次,不能及時跟蹤 AI 的發展。2016 年,史丹福大學計算機科學院教授,前谷歌首席科學家 Yoav Shoham 決定退出「AI100」的領導小組,並和 Ray、Erik、Jack 和 Kelven 等人開始領導、開發一項旨在及時跟蹤並反映人工智慧當前發展的現狀的一個指標體系——AI Index。

第一份報告《AI Index 2017》於 2017 年 12 月份正式推出,上個月 17 日,第二份報告《AI Index 2018》如期發布。

經雷鋒網 AI 科技評論分析,與上一年相比,《AI Index 2018》的分析指標更全面細緻,同時不再只注重於北美地區的 AI 活動分析。具體內容方面,有幾個亮點值得我們關注:

  • 中國在 2017 年產出全球 25% 的 AI 論文(排名第一的歐洲也才 28%),AI 論文發表數量與 2007 年相比,增幅將近 150%,然而論文影響力部分依然存在增長空間。

  • 美國依然是全球論文引用影響力最高的地區,美國學者的論文引用影響力要比全球平均水平高出 83%。

  • 自 2007 年以來,中國政府署名 AI 論文經歷了 400% 的增長,而同期中國企業署名 AI 論文增長只有 73%。

  • 中國擁有最高比例的固守類 AI 學者(76%),其次為歐洲(52%)和美國(38%)。固守類 AI 學者即那些未曾在家鄉以外地區發表過論文的活躍研究人員。中國的非固守類學者雖然佔比較小,然而論文出版率卻高於其他兩個地區的非固守類學者,說明中國的非固守類學者更有效率。

  • 自 2014 年開始,計算機視覺與模式識別一直是 arXiv 上為數最多的 AI 子類論文。

  • 神經網絡論文在 2010 年——2014 年的複合年增長率(CAGR)為 3 %,而這個數值在 2014 年——2017 年期間則是 37 %。

  • 2014 年,30% 的 AI 專利源自美國,韓國和日本分別以 16% 排在第二、第三。

由於報告信息體量較大,雷鋒網 AI 科技評論挑選了其中大部分的學術章節與小部分的業界章節進行翻譯,其他內容可自行查閱:

http://cdn.aiindex.org/2018/AI%20Index%202018%20Annual%20Report.pdf

活動體量

【AI 學術論文發表情況】

1)主題

下圖展示不同主題的學術論文的年度發表情況(與 1996 年對比),報告將這些主題劃分為:AI 、計算機科學以及所有領域。

數據來源:Scopus

結果表明:

2)地區

下圖展示不同地區的 AI 論文的年度發表情況。

數據來源:Elsevier

結果表明:

  • 歐洲繼續穩坐 AI 論文發表戶的頭把交椅,在 2017 年產出全球 28% 的 AI 論文。

  • 緊隨其後的中國在 2017 年產出全球 25% 的 AI 論文,AI 論文發表數量與 2007 年相比,增幅將近 150%(儘管 2008 年前後曾出現異常波動)。

  • 排名第三的美國在 2017 年產出全球 17% 的 AI 論文。

3)子類別

下圖展示不同子類別的 AI 論文的發表情況。需要強調的是,這些子類別之間並非排他關係。

數據來源:Elsevier

結果表明:

  • 機器學習與概率推理論文佔到 2017 年論文總數的 56%,而這個比例在 2010 年時只有 28 %。

  • 相較 2010 年——2014 年,大部分子類別的論文發表率在 2014——2017 年期間經歷了高速增長。

  • 值得注意的是,神經網絡論文在 2010 年——2014 年的複合年增長率(CAGR)為 3 %,而這個數值在 2014 年——2017 年期間則是 37 %。

4)arXiv

下圖展示幾個關鍵子類別的 AI 論文在 arXiv 上的發表數量。右軸是 arXiv 上所有 AI 論文的總和(由灰色虛線進行表示)。

數據來源:arXiv

結果表明:

5)側重領域

下圖展示美國、歐洲與中國的 Relative Activity Index (RAI 指數)——RAI 指數通過將具體某個地區的 AI 研究活動與全球進行對比,從而近似某個地區的 AI 研究側重。

如果指數是 1,說明與全球保持一致,大於 1 意味重視,小於 1 則意味較少被關注。

數據來源:Elsevier

結果表明:

6)署名機構

下圖展示 Scopus 上由政府、企業和醫療機構署名的論文總量,涉及中國、美國和歐洲 3 個地區。此外,我們也展示了企業署名論文與政府署名論文的增長情況。

數據來源:Elsevier

數據來源:Elsevier

結果表明:

  • 2017 年,中國政府署名 AI 論文的產量幾乎是中國企業署名論文的 4 倍。自 2007 年以來,中國政府署名 AI 論文經歷了 400% 的增長,同期中國企業署名 AI 論文的增長只有 73%。

  • 美國的 AI 論文很大比例都是由企業產出的,單就 2017 年而言,其企業署名 AI 論文的比例是中國的 6.6 倍,歐洲的 4.1 倍。

  • 需要強調的是,三個地區的高校署名論文(圖中未顯示)在數量上都超過了政府、企業和醫療機構。

7)論文引用影響力

下圖展示不同地區 AI 學者的科研論文影響力(Field Weighted Citation Impact,簡稱 FWCI)——FWCI 將某地區 AI 學者的論文引用平均值除以了所有 AI 學者的論文引用平均值。圖中的 FWCI 被我們重新進行調整,其引用影響力是相對於世界平均值進行展示的。

如果其指數是 1,說明論文的引用影響力與世界平均值保持一致,如果指數是 0.85,說明論文的引用影響力要比世界平均值低 15%。

數據來源:Elsevier

結果表明:

  • 作為全球每年發布 AI 論文最多的地區,歐洲 AI 論文的引用影響力維持在相對平穩的水平,基本與全球平均水平相當。

  • 中國的論文引用影響力有明顯增長,中國學者在 2016 年的論文引用影響力要比 2000 年高出 44%。

  • 美國依然是全球論文引用影響力最高的地區,美國學者的論文引用影響力要比全球平均水平高出 83%。

8)學者流動性與論文發表的關係

下圖展示流動性如何對論文發表率以及 AI 學者的論文引用影響力造成影響。

我們主要關注這 4 種流動類型的學者:固守(Sedentary)、短暫流出(Transitory)、流入遷移(Migratory Inflow)和流出遷移(Migratory Outflow)。固守類學者是指那些未在家鄉以外地區發表過論文的活躍研究人員;短暫流出類學者是指那些曾在家鄉以外地區發表過兩年或以下論文的研究人員;遷移類學者是指那些曾在家鄉以外地區發表過兩年或以上論文的研究人員,至於屬於「流出」還是「流入」,主要取決於圖表的視角。

x 軸展示的是論文相對發表率(每個類別作者的平均出版數除以該區域的整體平均出版數);y 軸展示的是 FWCI(每個類別作者的平均論文引用數除以該區域的整體平均論文引用數)。本章節的分析只考慮 AI 學者,即寫過的論文中起碼有 30% 是關於 AI 的研究人員。學者的家鄉則取決於他第一篇論文的發表地區。

數據來源:Elsevier

結果表明:

  • 無論是美國、中國還是歐洲,固守類學者的論文發表率都是最低的。

  • 無論是美國、中國還是歐洲,遷移類學者(包括流入遷移與流出遷移)的論文引用影響力(FWCI)都是最高的。這說明經常流動的學者往往擁有更多的論文引用,並傾向於頻繁發表論文。

  • 在上述 3 個地區當中,中國擁有最高比例的固守類學者(76%),其次為歐洲(52%)和美國(38%)。中國的非固守類學者雖然佔比較小,然而論文出版率卻高於其他兩個地區的非固守類學者,說明中國的非固守類學者更有效率。

  • 流動性強的學者在論文引用數與論文發布頻率上都要更高。

9)頂會論文發表

下圖展示了 2018 年 AAAI 大會的論文提交與接收情況(按國別統計),大會於 2018 年 2 月份在美國路易斯安那州紐奧良市舉行。

數據來源:AAAI

結果表明:

  • 70% 的提交論文來自中國和美國,中國以 1242 篇排名第一。

  • 就接收論文數量方面,中國與美國相差無幾,分別為 265 篇(接收率 21%)和 268 篇(接收率 29%)。

  • 德國與義大利的論文接收率最高,達到了 41%,然而兩者提交的論文數量較少。

10)高校 AI 課程報讀情況

下圖展示了美國地區以外幾所計算機學科處於領先地位的大學,它們的 AI + ML 相關課程的註冊情況。第一張圖展示這些院校在 2010 年——2017 年的課程註冊增長情況,第二張圖則展示的是 2016 年——2018 年的課程註冊增長情況。關於院校的選擇標準、實際入學人數及完整高校名稱可參閱報告中的「附錄」。

數據來源:高校數據

結果表明:

11)大型頂會參會情況

下圖分別展示了大型頂會的出席人數以及對比 2012 年的增長情況。這裡的「大型」指的是那些 2017 年出席人數超過 2000 人的頂會。

數據來源:頂會數據

結果表明:

  • NeurIPS (原 NIPS )、 CVPR 和 ICML 作為出席率最高的 AI 頂會,它們的出席增長率(自 2012 年以來)同樣也是最高的,當中又以 NeurIPS 和 ICML 的增長速度最快,分別達到 2012 年的 4.8 倍 & 6.8 倍,說明 ML 作為 AI 子領域持續受到大家的密切關注。

  • 與此同時,專注符號推理(symbolic reasoning)的大型頂會的增長率相對較小。

12)小型頂會參會情況

下圖分別展示了小型頂會的出席人數以及相比 2012 年的增長情況。這裡的「小型」指的是那些 2017 年出席人數少於 2000 人的頂會。

數據來源:頂會數據

結果表明:

【AI 業界應用情況】

1)AI 初創企業融資情況

下圖展示了在特定年份中獲得風險投資支持的美國初創企業數量。藍線(左軸)顯示的是 AI 領域的初創企業,灰線(右軸)則顯示的是綜合領域的初創企業(含 AI 初創公司)。這些數據是逐年積累的。

數據來源:Sand Hill Econometrics

結果表明:

2)AI 初創企業融資情況

下圖展示了風險投資向不同階段美國初創企業提供的的年度融資金額。藍線(左軸)顯示的是 AI 初創企業的融資金額,灰線(右軸)則顯示的是綜合初創企業(含 AI 初創公司)的融資金額。這些數據是年度總結而非逐年累積的。

數據來源:Sand Hill Econometrics

結果表明:

  • 從 2013 到 2017 年,AI 初創企業的融資金額增加了 4.5 倍,綜合初創企業則增加了 2.08 倍。

  • 1997 年—2000 年的爆發性增長可用網際網路泡沫(dot-com bubble)來進行解釋。

  •  2014 年與 2015 年小幅度爆發增長反映了當時的經濟繁榮增長。

3)崗位所需 AI 技能

下圖分別展示了 AI 型崗位的歷年缺口及增長情況。需要注意的是,這些崗位所需的 AI 技能之間並非排他關係。

數據來源:Monster.com

結果表明:

4)AI 專利

下圖展示了不同區域 AI 專利的增長情況。這些 AI 專利通過 IPC 專利碼進行匯總,主要集中在認知與意義理解(Cognition and meaning understanding)和人機互動領域。按時間追蹤專利發布情況是一項富有挑戰性的事情,關於指標的注釋和差異說明,請參閱報告的「附錄」。

數據來源:amplified

結果表明:

5)AI 在企業中的使用情況(按地區)

下圖展示的是麥肯錫公司針對 2135 名企業僱員的調查結果,可以反映 AI 技能在企業業務中的使用情況,涉及地區包括北美洲、發展中國家(含中國)、歐洲、亞太地區、印度、中東與北非和拉丁美洲,

數據來源:麥肯錫公司

結果表明:

6)Github 星標數量

下圖展示了不同 AI 和 ML 軟體包在 GitHub 上的星標數量,從中可以初步判斷不同 AI 編程框架的流行程度。

數據來源:Github

結果表明:

衍生測量指標

本章節試圖分析前邊提及的趨勢之間的關係。

學界-業界動態分析(Academia-Industry Dynamics)

為了探索 AI 分別在學界和業界的趨勢之間的關係,我們首先從前邊內容中選取了一些有代表性的測量指標,尤其是 Scopus 上的 AI 論文發表情況、美國多所大學的入門級 AI 課程註冊情況,以及 AI 初創公司的融資情況。

由於這些指標無法直接進行對比,為了能夠更好分析趨勢之間的關係,我們從 2010 年起開始對每個指標進行標準化,以確保顯示的是增長情況,而非絕對數字。

數據來源:Sand Hill Econometrics、Scopus 以及大學數據

AI 活躍指數(The AI Vibrancy Index)

該指數將論文發表、課程註冊以及風險投資 3 個學術-業界指標匯總成一個衡量標準,以量化 AI 作為獨立領域活躍程度。和學界-業界動態分析(Academia-Industry Dynamics)一樣,AI 活躍指數(The AI Vibrancy Index)在 2010 年是進行了統一標準化。

數據來源:Sand Hill Econometrics、Scopus 以及大學數據

AI 活躍指數在很大程度上由風險投資推動,這是因為相對其他兩個指標,風險投資的增長幅度最大。不過三個指標的權重是相等的。我們鼓勵讀者們自行下載我們的數據,並對指標和權重進行調整,進而創建出一個最符合個人需求的 AI 活躍指數。

via http://cdn.aiindex.org

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • AI研究實力最強的25所高校,據NIPS2017論文數統計
    NIPS 2017在加州長灘舉辦,吸引了8000名參會者,從3240篇提交的論文中接收了679篇,接收率為21%。根據這679篇論文,統計得到以下結果。根據論文統計,全球TOP25的大學:1.>20.Cornell U,康奈爾大學21.Technion,以色列理工學院22.USC,南加州大學23.UT Austin,德克薩斯大學奧斯汀分校24.UCLA,加州大學洛杉磯分校25
  • AI 遇冷?斯坦福年度 AI 報告來揭秘
    值得一提的是,史丹福大學此次還發布了兩個工具,一個是可以在學術論文預印網站 arXiv 上檢索人工智慧論文的「人工智慧指數arXiv 監測器」 (arxiv.aiindex.org);另一個是「全球人工智慧活力工具」 (vibrancy.aiindex.org) ,公眾可以通過 34 個指標比較 28 個國家/地區的表現。
  • AIOpenIndex發布全球人工智慧創新城市榜單,中國32個城市進入世界...
    近日,清華-中國工程院知識智能聯合研究中心、清華大學人工智慧研究院聯合推出了 2020 年全球人工智慧最具創新力城市榜單(以下簡稱全球 AI 城市榜單)。該榜單根據城市頂級 AI 學者數、AI 論文影響力、AI 產業活躍度等數據,全方位地展示 21 世紀前 20 年在人工智慧領域居於全球最前列的創新城市,並據此分析其 AI 基礎創新力和應用創新力。榜單上呈現出全球 500 個城市的 AI 創新指數信息,為評價城市創新力提供了客觀、可靠、專業的數據。
  • 2018中國AI英雄風雲榜商業創新人物候選人之沈亦晨
    2018中國AI英雄風雲榜商業創新人物新銳獎獲得者。沈亦晨於2016年畢業於MIT(麻省理工學院),獲得博士學位。2014年讀博期間,他在《科學》雜誌上以第一作者身份發表了題為《寬波段光學的角度選擇》的論文,首次實現了在材料尺度上對光的傳播方向的選擇。同年,此項研究被《探索》雜誌評為全球年度前50重大科學發明創新。
  • 2019中國國際科技論文產出態勢評述:中國科技論文正向高質量轉型
    根據2019中國科技論文統計結果,2009年至2019年(截至2019年10月)我國科技人員共發表國際論文260.64萬篇,比2018年統計時增加了14.7%;論文共被引用2845.23萬次,與上一個統計年度相比,增加了25.2%,連續三年排在世界第二位。
  • 2019全球智博會分論壇議程重磅公布,六大AI開放創新平臺將同臺展示
    隨著會議的臨近,分論壇議程也重磅公布,具體安排如下。雷鋒網 AI 科技評論將作為全球智博會獨家戰略合作媒體,第一時間帶來最新報導。他目前同時擔任 IEEE 和 ACM 視覺與多媒體彙刊(IEEE TIP, IEEE TCSVT 和 ACM TOMM)等頂級學術期刊的編委,並且是 2018 年 ACM Multimedia 的程序委員會主席和 2019 年 IEEE ICME 的大會共同主席。他是 IEEE 信號處理學會傑出工業演講者,並且擔任中國科學技術大學、復旦大學和香港中文大學(深圳)的客座教授。Dr.
  • 2019 AI Index 報告出爐:AI 領域取得的進展很多,但結果憂喜參半
    今年報告的一些要點如下:人工智慧成為了最受計算機科學博士青睞的領域,而在 2018 年,有 21% 的畢業生畢業於機器學習或人工智慧專業。從 1998 年到 2018 年,經過同行評審的人工智慧研究增長了 300%。
  • 漫畫翻譯、嵌字 AI,東京大學論文被 AAAI』21 收錄
    OpenMantra 漫畫翻譯評估數據集論文地址:https://arxiv.org/abs/2012.14271數據格式:帶注釋的 JSON 文件和原始圖像數據內容:1593 個句子、848 個場景、214 頁漫畫數據大小:36.8 MB更新時間:2020 年 12 月 7 日下載地址:https:/
  • 你願意讓AI來審稿你的論文嗎?
    他是位於倫敦的初創公司Wizdom.ai的董事會成員,該公司隸屬於泰勒弗朗西斯集團(Taylor & Francis),目前正在研發可以挖掘論文資料庫、發掘不同學科和概念之間聯繫的軟體。他指出,這類工具很快就可以應用在同行評議之外的地方,比如撰寫經費申請或文獻綜述。
  • 一篇Nature署名近6萬名作者!這些論文徹底刷新了我的認知!
    但凡是一些大的科研項目,如腦的研究、人類基因組學、全球氣候變化的研究等,需要科學家之間、學術團體之間、國內外科學家之間的合作才能完成,所以署名作者相應也會很多。幾十人甚至幾百人已經不是新鮮事情了,可是6萬個作者署名的論文,你見過沒?下面,小編就來盤點一下那些作者過千的硬核文章。一、5700多人署名的Nature:通過多人聯機遊戲預測蛋白質結構!
  • 全球三十大最佳 AI 創業公司公布
    機器之心根據研究實力、技術與產品、市場與行業潛力、運營能力、資本與財務狀況、創新性與實用性等多項標準,評選出四項大獎:全球三十大最佳 AI 創業公司、中國十大最強 AI 研究實力企業、中國十大最具潛力早期 AI 公司、三十大最佳 AI 應用案例。Drive.ai、流利說、追一科技等GGV紀源資本被投企業入選榜單。
  • 2018年中國卓越科技論文超31萬篇,臨床醫學論文數最多
    新華社北京11月19日電 中國科學技術信息研究所19日發布的中國卓越科技論文產出狀況報告顯示,2018年中國卓越科技論文共計31.59萬篇,比2017年增加12.4%,包括卓越國際科技論文14.45萬篇,卓越國內科技論文17.15萬篇。
  • 校長張希:關於科技論文署名的一點思考
    科技論文的署名作者有多有少,一些論文僅有一個作者;一些論文只有一個第一作者,而有些論文出現了多名共同第一作者;一些論文只有一個通訊作者,而一些論文出現了多名共同通訊作者,等等。這是否是合理的現象?誰應該是論文的署名作者?通訊作者意味著什麼?第一作者又意味著什麼?署名作者如何排序?與師生們分享一孔之見。
  • 2019全球AI人才報告:美國和中國是世界兩強
    報告發現,2018年有22400人在一或多個機器學習的頂級會議上發表了論文,比2015年提升了36%,比去年也漲了19%。同行評審的出版物數量也比2015年提高了25%,比去年提高了16%。不過在這些會議上發表文章的研究人員當中,女性僅佔18%,顯得名額不足。報告還發現,全球的AI人才池是高度流動的,大概有1/3的研究人員的僱主所在國家與其獲得博士學位所在國家是不一樣的。
  • Nature解析中國AI現狀,2030年能引領全球嗎?
    學術影響力微軟學術對高引用人工智慧論文的一項研究表明,中國的影響力十分強大。來自艾倫人工智慧研究院的分析師發現,中國作者在最頂級的 10% 高引用論文中提升了 10% 的佔比,於 2018 年達到了頂峰(26.5%),接近美國的 29%,而且美國的佔比在下跌。
  • 分析17萬篇AI頂會論文,揭示了計算資源貧富分化的證據
    作為「非精英大學」的代表,他們分析了60場全球頂級人工智慧峰會(包括ACL, ICML, and NeurIPS )的171394篇論文後得出結論,學術界算理的不平等正在加劇,特別是排名中下的大學,學術資源每年都在被蠶食。
  • 2020最佳AI論文,都在這裡了
    由於全球新冠疫情仍未結束,今年不少學術會議延期或取消,召開的也大多在線上舉行。儘管2020年發生了很多事情,研究者們仍然為人工智慧技術的進步做出了大量重要的貢獻。位於蒙特婁的 AI 內容創作者 Louis Bouchard (他的 YouTube 帳號叫 What's AI) 匯總了一份2020年最值得關注的 AI 論文名單(https://github.com/louisfb01/Best_AI_paper_2020 )。除了在相關領域內的各項指標上創造了新紀錄,在應用層面帶來了新的思路,這些論文也對偏見等 AI 道德方面的議題有所探討。
  • 吉林大學校長:關於科技論文署名的一點思考
    科技論文的署名作者有多有少,一些論文僅有一個作者;一些論文只有一個第一作者,而有些論文出現了多名共同第一作者;一些論文只有一個通訊作者,而一些論文出現了多名共同通訊作者,等等。 這是否是合理的現象?誰應該是論文的署名作者?通訊作者意味著什麼?第一作者又意味著什麼?署名作者如何排序?與師生們分享一孔之見。
  • 25+ 智能駕駛重磅嘉賓、1000+ 業內人士齊聚,蘇州相城到底有什麼...
    聯合創始人,研發與工程總監王弢……超過 25 位智能駕駛領域演講嘉賓、1000 名行業人士將相聚在同一個地方——蘇州相城。朱西產 1996 年調入中國汽車技術研究中心從事汽車安全研究工作,任國家汽車質量監督檢驗中心副總工程師,從 2000 年至 2005 年被聘任為中國汽車技術研究中心汽車被動安全重點學科的首席專家。他在汽車碰撞安全性研究領域、交通事故分析鑑定領域和基於用戶實際載荷譜的汽車可靠性技術研究方面具有深厚的基礎和行業知名度。
  • 一篇Nature署名近6萬位作者!這些論文徹底刷新了我的認知
    2008年,華盛頓大學研究蛋白結構的大佬級人物David Baker因工作不順,想出了個歪點子,不自己去湊蛋白質結構了,轉去開發了一款遊戲Foldit,就是給定一個目標蛋白,讓玩家用各種胺基酸進行組裝,最終拼湊出這個蛋白的完全體。這個遊戲對全球開放下載,可以在線聯網進行遊戲,還能上傳自己的成績與全世界玩家進行比拼。