2018 年重磅復盤:中國產出全球 25% AI 論文、政府署名 AI 論文...

2020-12-15 雷鋒網

雷鋒網(公眾號:雷鋒網) AI 科技評論按:美國史丹福大學創立的 AI Index 項目旨在追蹤人工智慧的活動和進展,以可靠、可驗證數據為基礎,研究人工智慧對人們生活的影響。2018 年度的《AI Index》在 2018 年 12 月 17 日如期發布,從學界和業界的角度對全球的 AI 生態進行了全盤總結。

AI Index 最早可追溯至美國史丹福大學一個名叫「AI100」的項目,其首要目標是持續地去調查、總結人工智慧未來 100 年在學術研究、經濟、道德倫理、法律等方面的進展和對此的展望,然而遺憾的是,該報告每五年推出一次,不能及時跟蹤 AI 的發展。2016 年,史丹福大學計算機科學院教授,前谷歌首席科學家 Yoav Shoham 決定退出「AI100」的領導小組,並和 Ray、Erik、Jack 和 Kelven 等人開始領導、開發一項旨在及時跟蹤並反映人工智慧當前發展的現狀的一個指標體系——AI Index。

第一份報告《AI Index 2017》於 2017 年 12 月份正式推出,上個月 17 日,第二份報告《AI Index 2018》如期發布。

經雷鋒網 AI 科技評論分析,與上一年相比,《AI Index 2018》的分析指標更全面細緻,同時不再只注重於北美地區的 AI 活動分析。具體內容方面,有幾個亮點值得我們關注:

  • 中國在 2017 年產出全球 25% 的 AI 論文(排名第一的歐洲也才 28%),AI 論文發表數量與 2007 年相比,增幅將近 150%,然而論文影響力部分依然存在增長空間。

  • 美國依然是全球論文引用影響力最高的地區,美國學者的論文引用影響力要比全球平均水平高出 83%。

  • 自 2007 年以來,中國政府署名 AI 論文經歷了 400% 的增長,而同期中國企業署名 AI 論文增長只有 73%。

  • 中國擁有最高比例的固守類 AI 學者(76%),其次為歐洲(52%)和美國(38%)。固守類 AI 學者即那些未曾在家鄉以外地區發表過論文的活躍研究人員。中國的非固守類學者雖然佔比較小,然而論文出版率卻高於其他兩個地區的非固守類學者,說明中國的非固守類學者更有效率。

  • 自 2014 年開始,計算機視覺與模式識別一直是 arXiv 上為數最多的 AI 子類論文。

  • 神經網絡論文在 2010 年——2014 年的複合年增長率(CAGR)為 3 %,而這個數值在 2014 年——2017 年期間則是 37 %。

  • 2014 年,30% 的 AI 專利源自美國,韓國和日本分別以 16% 排在第二、第三。

由於報告信息體量較大,雷鋒網 AI 科技評論挑選了其中大部分的學術章節與小部分的業界章節進行翻譯,其他內容可自行查閱:

http://cdn.aiindex.org/2018/AI%20Index%202018%20Annual%20Report.pdf

活動體量

【AI 學術論文發表情況】

1)主題

下圖展示不同主題的學術論文的年度發表情況(與 1996 年對比),報告將這些主題劃分為:AI 、計算機科學以及所有領域。

數據來源:Scopus

結果表明:

2)地區

下圖展示不同地區的 AI 論文的年度發表情況。

數據來源:Elsevier

結果表明:

  • 歐洲繼續穩坐 AI 論文發表戶的頭把交椅,在 2017 年產出全球 28% 的 AI 論文。

  • 緊隨其後的中國在 2017 年產出全球 25% 的 AI 論文,AI 論文發表數量與 2007 年相比,增幅將近 150%(儘管 2008 年前後曾出現異常波動)。

  • 排名第三的美國在 2017 年產出全球 17% 的 AI 論文。

3)子類別

下圖展示不同子類別的 AI 論文的發表情況。需要強調的是,這些子類別之間並非排他關係。

數據來源:Elsevier

結果表明:

  • 機器學習與概率推理論文佔到 2017 年論文總數的 56%,而這個比例在 2010 年時只有 28 %。

  • 相較 2010 年——2014 年,大部分子類別的論文發表率在 2014——2017 年期間經歷了高速增長。

  • 值得注意的是,神經網絡論文在 2010 年——2014 年的複合年增長率(CAGR)為 3 %,而這個數值在 2014 年——2017 年期間則是 37 %。

4)arXiv

下圖展示幾個關鍵子類別的 AI 論文在 arXiv 上的發表數量。右軸是 arXiv 上所有 AI 論文的總和(由灰色虛線進行表示)。

數據來源:arXiv

結果表明:

5)側重領域

下圖展示美國、歐洲與中國的 Relative Activity Index (RAI 指數)——RAI 指數通過將具體某個地區的 AI 研究活動與全球進行對比,從而近似某個地區的 AI 研究側重。

如果指數是 1,說明與全球保持一致,大於 1 意味重視,小於 1 則意味較少被關注。

數據來源:Elsevier

結果表明:

6)署名機構

下圖展示 Scopus 上由政府、企業和醫療機構署名的論文總量,涉及中國、美國和歐洲 3 個地區。此外,我們也展示了企業署名論文與政府署名論文的增長情況。

數據來源:Elsevier

數據來源:Elsevier

結果表明:

  • 2017 年,中國政府署名 AI 論文的產量幾乎是中國企業署名論文的 4 倍。自 2007 年以來,中國政府署名 AI 論文經歷了 400% 的增長,同期中國企業署名 AI 論文的增長只有 73%。

  • 美國的 AI 論文很大比例都是由企業產出的,單就 2017 年而言,其企業署名 AI 論文的比例是中國的 6.6 倍,歐洲的 4.1 倍。

  • 需要強調的是,三個地區的高校署名論文(圖中未顯示)在數量上都超過了政府、企業和醫療機構。

7)論文引用影響力

下圖展示不同地區 AI 學者的科研論文影響力(Field Weighted Citation Impact,簡稱 FWCI)——FWCI 將某地區 AI 學者的論文引用平均值除以了所有 AI 學者的論文引用平均值。圖中的 FWCI 被我們重新進行調整,其引用影響力是相對於世界平均值進行展示的。

如果其指數是 1,說明論文的引用影響力與世界平均值保持一致,如果指數是 0.85,說明論文的引用影響力要比世界平均值低 15%。

數據來源:Elsevier

結果表明:

  • 作為全球每年發布 AI 論文最多的地區,歐洲 AI 論文的引用影響力維持在相對平穩的水平,基本與全球平均水平相當。

  • 中國的論文引用影響力有明顯增長,中國學者在 2016 年的論文引用影響力要比 2000 年高出 44%。

  • 美國依然是全球論文引用影響力最高的地區,美國學者的論文引用影響力要比全球平均水平高出 83%。

8)學者流動性與論文發表的關係

下圖展示流動性如何對論文發表率以及 AI 學者的論文引用影響力造成影響。

我們主要關注這 4 種流動類型的學者:固守(Sedentary)、短暫流出(Transitory)、流入遷移(Migratory Inflow)和流出遷移(Migratory Outflow)。固守類學者是指那些未在家鄉以外地區發表過論文的活躍研究人員;短暫流出類學者是指那些曾在家鄉以外地區發表過兩年或以下論文的研究人員;遷移類學者是指那些曾在家鄉以外地區發表過兩年或以上論文的研究人員,至於屬於「流出」還是「流入」,主要取決於圖表的視角。

x 軸展示的是論文相對發表率(每個類別作者的平均出版數除以該區域的整體平均出版數);y 軸展示的是 FWCI(每個類別作者的平均論文引用數除以該區域的整體平均論文引用數)。本章節的分析只考慮 AI 學者,即寫過的論文中起碼有 30% 是關於 AI 的研究人員。學者的家鄉則取決於他第一篇論文的發表地區。

數據來源:Elsevier

結果表明:

  • 無論是美國、中國還是歐洲,固守類學者的論文發表率都是最低的。

  • 無論是美國、中國還是歐洲,遷移類學者(包括流入遷移與流出遷移)的論文引用影響力(FWCI)都是最高的。這說明經常流動的學者往往擁有更多的論文引用,並傾向於頻繁發表論文。

  • 在上述 3 個地區當中,中國擁有最高比例的固守類學者(76%),其次為歐洲(52%)和美國(38%)。中國的非固守類學者雖然佔比較小,然而論文出版率卻高於其他兩個地區的非固守類學者,說明中國的非固守類學者更有效率。

  • 流動性強的學者在論文引用數與論文發布頻率上都要更高。

9)頂會論文發表

下圖展示了 2018 年 AAAI 大會的論文提交與接收情況(按國別統計),大會於 2018 年 2 月份在美國路易斯安那州紐奧良市舉行。

數據來源:AAAI

結果表明:

  • 70% 的提交論文來自中國和美國,中國以 1242 篇排名第一。

  • 就接收論文數量方面,中國與美國相差無幾,分別為 265 篇(接收率 21%)和 268 篇(接收率 29%)。

  • 德國與義大利的論文接收率最高,達到了 41%,然而兩者提交的論文數量較少。

10)高校 AI 課程報讀情況

下圖展示了美國地區以外幾所計算機學科處於領先地位的大學,它們的 AI + ML 相關課程的註冊情況。第一張圖展示這些院校在 2010 年——2017 年的課程註冊增長情況,第二張圖則展示的是 2016 年——2018 年的課程註冊增長情況。關於院校的選擇標準、實際入學人數及完整高校名稱可參閱報告中的「附錄」。

數據來源:高校數據

結果表明:

11)大型頂會參會情況

下圖分別展示了大型頂會的出席人數以及對比 2012 年的增長情況。這裡的「大型」指的是那些 2017 年出席人數超過 2000 人的頂會。

數據來源:頂會數據

結果表明:

  • NeurIPS (原 NIPS )、 CVPR 和 ICML 作為出席率最高的 AI 頂會,它們的出席增長率(自 2012 年以來)同樣也是最高的,當中又以 NeurIPS 和 ICML 的增長速度最快,分別達到 2012 年的 4.8 倍 & 6.8 倍,說明 ML 作為 AI 子領域持續受到大家的密切關注。

  • 與此同時,專注符號推理(symbolic reasoning)的大型頂會的增長率相對較小。

12)小型頂會參會情況

下圖分別展示了小型頂會的出席人數以及相比 2012 年的增長情況。這裡的「小型」指的是那些 2017 年出席人數少於 2000 人的頂會。

數據來源:頂會數據

結果表明:

【AI 業界應用情況】

1)AI 初創企業融資情況

下圖展示了在特定年份中獲得風險投資支持的美國初創企業數量。藍線(左軸)顯示的是 AI 領域的初創企業,灰線(右軸)則顯示的是綜合領域的初創企業(含 AI 初創公司)。這些數據是逐年積累的。

數據來源:Sand Hill Econometrics

結果表明:

2)AI 初創企業融資情況

下圖展示了風險投資向不同階段美國初創企業提供的的年度融資金額。藍線(左軸)顯示的是 AI 初創企業的融資金額,灰線(右軸)則顯示的是綜合初創企業(含 AI 初創公司)的融資金額。這些數據是年度總結而非逐年累積的。

數據來源:Sand Hill Econometrics

結果表明:

  • 從 2013 到 2017 年,AI 初創企業的融資金額增加了 4.5 倍,綜合初創企業則增加了 2.08 倍。

  • 1997 年—2000 年的爆發性增長可用網際網路泡沫(dot-com bubble)來進行解釋。

  •  2014 年與 2015 年小幅度爆發增長反映了當時的經濟繁榮增長。

3)崗位所需 AI 技能

下圖分別展示了 AI 型崗位的歷年缺口及增長情況。需要注意的是,這些崗位所需的 AI 技能之間並非排他關係。

數據來源:Monster.com

結果表明:

4)AI 專利

下圖展示了不同區域 AI 專利的增長情況。這些 AI 專利通過 IPC 專利碼進行匯總,主要集中在認知與意義理解(Cognition and meaning understanding)和人機互動領域。按時間追蹤專利發布情況是一項富有挑戰性的事情,關於指標的注釋和差異說明,請參閱報告的「附錄」。

數據來源:amplified

結果表明:

5)AI 在企業中的使用情況(按地區)

下圖展示的是麥肯錫公司針對 2135 名企業僱員的調查結果,可以反映 AI 技能在企業業務中的使用情況,涉及地區包括北美洲、發展中國家(含中國)、歐洲、亞太地區、印度、中東與北非和拉丁美洲,

數據來源:麥肯錫公司

結果表明:

6)Github 星標數量

下圖展示了不同 AI 和 ML 軟體包在 GitHub 上的星標數量,從中可以初步判斷不同 AI 編程框架的流行程度。

數據來源:Github

結果表明:

衍生測量指標

本章節試圖分析前邊提及的趨勢之間的關係。

學界-業界動態分析(Academia-Industry Dynamics)

為了探索 AI 分別在學界和業界的趨勢之間的關係,我們首先從前邊內容中選取了一些有代表性的測量指標,尤其是 Scopus 上的 AI 論文發表情況、美國多所大學的入門級 AI 課程註冊情況,以及 AI 初創公司的融資情況。

由於這些指標無法直接進行對比,為了能夠更好分析趨勢之間的關係,我們從 2010 年起開始對每個指標進行標準化,以確保顯示的是增長情況,而非絕對數字。

數據來源:Sand Hill Econometrics、Scopus 以及大學數據

AI 活躍指數(The AI Vibrancy Index)

該指數將論文發表、課程註冊以及風險投資 3 個學術-業界指標匯總成一個衡量標準,以量化 AI 作為獨立領域活躍程度。和學界-業界動態分析(Academia-Industry Dynamics)一樣,AI 活躍指數(The AI Vibrancy Index)在 2010 年是進行了統一標準化。

數據來源:Sand Hill Econometrics、Scopus 以及大學數據

AI 活躍指數在很大程度上由風險投資推動,這是因為相對其他兩個指標,風險投資的增長幅度最大。不過三個指標的權重是相等的。我們鼓勵讀者們自行下載我們的數據,並對指標和權重進行調整,進而創建出一個最符合個人需求的 AI 活躍指數。

via http://cdn.aiindex.org

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 中國居全球第四!自然指數首次聚焦AI研究產出
    (AI)領域的研究排名,中國2015~2019年科研產出增長最快,但AI領域自然指數文章總份額前50強機構中,歐美研究機構居主導地位。 12月10日出版的自然指數(Nature Index)增刊首次聚焦全球人工智慧(AI)領域的研究排名。在最新榜單中,2015~2019年,美國的AI研究產出高居榜首,英國、德國緊隨其後,中國位居第四位,但發展勢頭強勁。
  • AI專家們推薦的13篇「必讀」論文
    Shalini Ghosh,三星研究美國公司智能電視部門首席科學家(全球)和機器學習研究團隊負責人Long Short-Term Memory (1997) - Sepp Hochreiter and Jürgen Schmidhuber這篇1997年的開創性論文的思想是超前於那個時代的。
  • 關於論文署名鬧起來的那點事(上)
    論文作者署名,一直以來都是個很容易出點什麼事的話題,近一點的有雲南小學生署名結腸癌研究論文,遠一點的有某中科院碩士狀告導師署名自己論文敗訴。甚至連兩位諾貝爾獎獲得者,李政道與楊振寧也曾因為論文署名問題決裂,分道揚鑣,成為華人物理學界一段著名的公案。
  • 2018 年 Top 10 影響力 AI 研究論文
    雷鋒網 AI 科技評論按:Topbots 總結了他們眼中2018 年裡 10 篇最為重要的 AI 研究論文,帶領大家領略過去的一年中機器學習領域的關鍵進展。不得不說,考慮到這個領域極快的發展速度和極多的論文數量,肯定還有一些值得閱讀的突破性論文沒能包括在這份榜單中。不過這份清單是一個好的開始。1.
  • Jeff Dean在谷歌成眾矢之的:開除「論文不合格」AI倫理研究員,被...
    Timnit Gebru最知名的研究是她在2018年發現,面部識別軟體對黑人女性有高達35%的錯誤率,而對白人男性幾乎完全正確。幾天時間裡,雙方隔空喊話,聲勢愈演愈烈,已有1400名谷歌員工和1900名AI學術圈人士對谷歌的行為表示譴責,其中不乏AI圈的大佬。
  • 中國科學技術信息研究所發布2016年中國科技論文統計結果-新聞稿
    ,每年定期公布中國科技論文發表狀況和趨勢,並在此基礎上拓展到對中國在專利產出、科技期刊、學術圖書出版等領域情況的統計分析。    三、發表在各學科最具影響力國際期刊上的論文數量連續六年排在世界第2位。各學科領域影響因子最高的期刊可以被看作是世界各學科最具影響力期刊。2015年中國在這些期刊上發表的論文數為8286篇,比2014年增加2781篇,佔世界的15.2%。中國在這些高影響力期刊上發表的論文中有54.6%是受國家自然科學基金資助產出的。
  • 重磅!諾貝爾生理與醫學獎得主被曝涉嫌論文造假!
    2019年,諾貝爾生理與醫學獎聯合授予William G. Kaelin Jr、Sir Peter J. Ratcliffe和Gregg L. Semenza,以表彰他們「對細胞感知和適應氧氣供應的發現」。近日卻有消息稱,Gregg L. Semenza涉嫌論文造假。
  • 2019年十大精彩AI學術論文盤點
    雷鋒網(公眾號:雷鋒網) AI 科技評論按:2019 年馬上就要結束了,這一年裡我們又一同見證了雪片般密集(越來越密集)的論文,見證了全世界研究人員在各種問題上的新探索。雷鋒網 AI 科技評論參考 TopBots、Heartbeat、New World AI 等機構的 2019 論文榜單,總結出 2019 年發表的具有研究風向代表性的、有學術影響力、內容也精彩的 AI 論文。其中一些論文把現有的技術思路改進得更加完善,有一些加深了我們對機器學習/深度學習整件事的理解,也有的嘗試了全新的假說、打開了新的探索方向。
  • ACL 2019 27 篇論文實現代碼(持續更新中)
    ACL 2019 共接收了 765 篇論文,目前官網已經全部公布了,官方連結:http://www.acl2019.org/EN/program/papers.xhtml但是官網沒有公布連結,部分論文也沒有展示出來。所以AI研習社給大家整理了343篇論文,供大家學習!
  • 2016-2019年中國大學CNS論文排行榜,中國農業大學居第16位
    日前,全國第三方大學評價諮詢機構艾瑞深校友會網公布了"校友會2016-2019年中國大學CNS論文排行榜",中國農業大學居排行榜第16位。CNS論文是衡量中國高校原創性重大理論和創新性科技成果產出水平的重要標尺之一,是反映我國高校基礎研究能力與學術創造力的重要指標之一,是衡量中國高校學術研究水平的重要指標之一。
  • 001ai翻譯耳機亮相2019年中國電子信息博覽會
    7ba9c8f5b5024a6c98c4c383eea9280d.jpeg" style="border-width: 0px; border-style: initial; border-; vertical-align: middle; padding: 0px; margin: 0px auto; display: block;" />零零么(深圳)科技有限公司(簡稱001ai
  • 高校AI論文影響力排名,清華引用最多,中科大任少卿化身頂梁柱!
    如今國內最火的學科就是AI了,在近10年,我國的AI人才增長了近10倍,國內最有影響力的人工智慧研究機構是哪所呢?以及最具影響力的研究學者有哪些?很多朋友都非常好奇,今天小易就給大家講一講,最近上海交通大學電子信息與電氣工程學院教授王新兵帶領的Acemap團隊最近推出了一份各大研究機構、學者的論文發表及引用情況的排名。
  • LetPub發布2018中國高校發表SCI論文排行榜
    今日,LetPub在其官網發布了2018年中國高校發表SCI論文綜合排名報告:《2018年中國高校發表SCI論文數量排名》和《2018年中國高校發表SCI論文增長率排名》
  • 指導學生論文不能署名 是什麼逼大學教師造假
    「我有能力指導學生寫論文,為什麼沒有資格署名?」張民生老師說,當著學生的面造假讓他備感屈辱。   2004年9月,南京理工大學MBA畢業生張民生來到淮陰工學院從教。早在2002年,他就與校方籤訂了就業協議,對方承諾,給予他講師的崗位津貼,在淮陰工學院經管學院任職。
  • AIOpen 預訓練語言模型專刊徵稿
    2018 年 ELMo、BERT 和 GPT 的成功發布,表明了預訓練語言模型(PLM)的成功,隨後又在自然語言理解和生成方面取得了重大突破。* Applications of PLMs in various areas, such as information retrieval, social computation, and recommendation二、提交稿件需要滿足以下要求:* 提交給該期刊以供發表的論文必須是原創的
  • 陽光學院青年學者畢港在Nature發表論文——首次精準復盤比薩斜塔...
    中國教育在線訊 聞名世界的義大利比薩斜塔的傾斜問題及其糾偏措施,長期以來為世人與專家所關注。6月21日,國際頂級學術刊物Nature研究系列期刊《科學報告》(Scientific Reports)在線發表了陽光學院青年學者畢港博士的研究論文Creep in Primary Consolidation with Rate of Loading Approach(從加載率與蠕變互換思路看主固結中的蠕變行為),首次精準復盤了比薩斜塔近兩百多年來的傾斜過程。
  • 25+ 智能駕駛重磅嘉賓、1000+ 業內人士齊聚,蘇州相城到底有什麼...
    聯合創始人,研發與工程總監王弢……超過 25 位智能駕駛領域演講嘉賓、1000 名行業人士將相聚在同一個地方——蘇州相城。圍繞當下智能駕駛的熱點話題——如何打造智能汽車、智能駕駛關鍵技術應用以及智能駕駛核心傳感器應用等,超過 25 位智能駕駛領域的學術大師、技術專家、獨角獸企業代表等將分享自己的觀點,探尋智能駕駛產業的爆點。距全球智能駕駛峰會正式開幕還有兩個月,先讓雷鋒網劇透部分已確認出席的重磅學術嘉賓與明星創業公司:
  • AAAI 2018,騰訊AI Lab 11篇錄用論文全解讀
    雷鋒網 AI 科技評論按:2 月 2 日至 2 月 7 日,AAAI在本次大會上,騰訊 AI Lab 有 11 篇論文被錄用,論文錄用名單及摘要解讀如下:1  學習用於圖像描述的引導解碼(Learning to Guide Decoding for Image Captioning)圖像描述領域近來取得了很多進展,而且已經有一種編碼器-解碼器框架在這一任務上得到了出色的表現。
  • 2018中國年度AI評選揭曉!10大領航企業,50家明星公司
    2018年DuerOS激活設備超2億,L4級無人車阿波龍實現商業化量產,Apollo3.5發布後,還推動城市無人駕駛貨運商業化落地,百度AI技術和實力,亦是全球最前沿水平參照。2018年,百度AI還驅動公司營收邁步千億規模水平。 華為 中國芯實力的頭雁代表。
  • 為什麼論文發表那麼難丨數說
    近年來,這個總數在呈現著不斷緊縮的態勢,從2017年的8944篇,到2018年的8234篇,降幅為7.9%,2018年至2019年的降幅則為6.5%。全國政協委員、中國社會科學院文學研究所研究員、博士生導師劉寧在2020年的兩會討論中指出,不少期刊存在「一看是博士生論文就直接拒絕了,或者讓學生加上導師名字再投」的現象。根據她的統計,人文社科核心期刊發表博士生作者獨立署名的論文,佔總發稿量的比例大多在4%以下,碩士生作者獨立署名的論文已基本絕跡。因此她呼籲改進期刊管理機制,對青年學者獨立發表論文給予更多鼓勵和支持。