作者 | 蔣寶尚
編輯 | 陳彩嫻
近日,著名科技網站venturebeat發表了一篇名為「深度學習時代,計算鴻溝正在集中權力,加劇不平等」的文章。
在文中,作者引用了幾篇論文,從頂會論文發表、研究資金投入和科研人才流動等方面說明了以下幾個現象:
QS排名前五十的學校平均發表66篇頂會論文,是第二、三層次學校(QS51-100、QS101-200)的近乎兩倍,而AI相關公司的生產力也遠超這些學校,平均發表約42篇論文。
自深度學習興起以來,QS 301-500的大學在頂會中的論文平均減少了六篇,比預期少了25%。
2004年至2018年之間學術界前所未有的人才流失。
對於這些現象的背後原因,文章作者歸納為:GPU。作者表示,以GPU為代表的AI資源正在像大企業和頂級名校集中,會導致兩極分化的馬太效應。
1
學界不平等的來源:研究方式的轉變
在文章中,作者引用的第一篇論文是來自維吉尼亞理工大學和韋仕敦大學的合著「The De-democratization of AI: Deep Learning and the Compute Divide in Artificial Intelligence Research」。這篇論文研究了從2000到2019年,包括ACL、ICML和NeurIPS在內57個頂會,涵蓋的領域包括:計算機視覺、數據挖掘、機器學習和自然語言學習等,調查樣本總數多達171394篇論文。
在這篇論文中,作者也證明了:「計算」在人工智慧研究中發揮的作用越來越大。
作者認為,當前計算機科學研究依然依賴算法、硬體、以及專用軟體的綜合作用 。而計算在人工智慧歷史中,起到了「突破」和「確定研究方向」的作用。換句話說,在決定研究方向方面,計算機可以發揮超乎尋常的作用,算法或軟體在其中起到的作用相對弱一些。
硬體確實改變了人工智慧的研究格局。2012年之前,研究人員主要依賴通用硬體或者CPU。因此,那個時候,大多數研究人員使用相同的軟體和硬體,比拼的是算法的優越性。
然而,在現代人工智慧的研究中,由於有專門的硬體可用,因此,研究人員並不處於平等的地位。
另外,在一些大公司中,它們往往擁有高質量的專有數據集,用這些訓練數據集,有助於產生高度精確的深度學習模型。最近的研究表明,Facebook、谷歌和亞馬遜等大公司憑藉其專有數據在人工智慧研究中擁有優勢,而其他資源不充足的機構卻無法獲得這些計算以及大型數據集。
在人才方面,這些有錢的企業往往也更能招聘和留住人才,當然這些人才藉助優勢的計算的數據也更能發揮自己的能力。
放眼整個人工智慧的發展,正如2019年美國白宮在一份人工智慧報告中,將核心問題歸納為:「[……]工業憑藉其持續的資金支持,以及對先進計算設施和數據集的獲取,對學術研究和教學人才產生了強大的推動作用。」
2
近二十年頂會調查:名校大廠佔據半壁江山
上圖展示的是57個人工智慧和非人工智慧會議匯總數據,以會議年為單位,涵蓋2000~2019近20年的非平衡面板數據。論文總數達171394篇。
根據上述「描述性」表格,我們得知,大學機構排名和平均「出版」之間存在很強的相關性,一些有著精英名號的大學,在計算機領域也有著非常強的影響力,這些大學平均每個會議年發表66篇論文。世界排名(QS)51~100的大學,則只有35篇論文。而排名在101-200之間的近100所大學,只發表了32篇論文。
在公司層面,每年平均發表42篇,而大公司卻有23篇,佔比一半以上。
圖註:0.30表示某一年該會議上,30%的論文至少有一位合著者是公司員工
為了更加直觀的體現公司在科研中的作用,作者用上圖展示了在一段時間內,與公司相關的論文在人工智慧會議上的份額。上圖表明,在最「著名」的十個會議中,都在經歷「公司力量」的上升趨勢。
此外,上圖也說明了,各領域校企合作論文的比例都有不同程度的上漲,其中KDD(數據挖掘頂級會議)中合作論文在2020年比例超過50%,ICCV(國際計算機視覺大會)達到45%。
上圖展示了非人工智慧會議中,公司所佔份額,此圖展示的結果和上圖不同,在大多數情況下,公司發表論文的情況是相對穩定的。值得注意的一點是,2012年前,人工智慧和非人工智慧會議的企業參與率相似,只有在2012年ImageNet取得震撼成績之後,才有更多的公司參與到人工智慧中來。
此外,根據medium博主,Gleb Chuvpilo在2019年統計的年度AI研究排名,史丹福大學、MIT、卡內基梅隆大學,加州大學伯克利分校和微軟列為領先AI研究會議的六大貢獻者。
3
學界人才流失:加劇鴻溝的另一個原因
學界不平等的鴻溝的另一個表現是學界人才大量流入資本,在上述那篇論文中也證實了這種人才流動導致的科技水平變化。
作者表示,自深度學習興起以來,QS 301-500的大學在頂會中的論文平均減少了六篇,比預期少了25%,而世界500強、科技巨頭和頂尖大學論文發表情況卻截然不同。
對於,這種趨勢,英國衛報曾經有過一份秘密調查,顯示了科技公司招聘狂潮的影響。調查發現,許多頂級院校現在正努力滿足那些大規模擴大人工智慧研究團隊的科技公司的需求。
這份報告說,自2014年以來,英國科技公司的人工智慧崗位數量激增了485%。據一份公司內部的數據顯示,每一位合格的求職者其實都身兼數職。離開學界的大多數人都去了谷歌、Facebook、亞馬遜和蘋果等等公司。
換句話說,這些頂尖人才沒有「分散」在社會中做出貢獻,而是把自己的才華都集中到了少數公司。
另外,對於許多大學來說,從事AI研究越早的人員,流失越嚴重。更為直觀的表現是:獲得 2018 年圖靈獎的三位資深學者中,兩位早已投身業界,其中 Geoffrey Hinton 在谷歌,Yann LeCun 在 Facebook。
科學家的大量下海,可能對研究課題、研究質量、學院文化以及對本科生和研究生的培養產生負面影響。
卡耐基梅隆大學的計算機科學副教授 Ariel Procaccia 對 AI 人才紛紛投身業界表示擔憂:如果業界不斷地挖走頂尖學者,那麼由誰來培養 AI 領域的下一代創新者呢?
顯然,學界人才不斷流失,人工智慧研究不平等的鴻溝在學界和業界之間也會不斷加深。
那麼,如何縮小鴻溝呢?當前已經有過很多討論,文章作者提出的方案是:建立國家統一的AI研究雲是很有必要的。這一舉措,美國已經開始實行,例如今年6月,美國多所大學、科技公司和參議院議員都表示支持建立國家AI研究雲,通過共享公共數據集幫助算力不夠的機構訓練和測試AI模型。
但是,小編在這想提到一個大膽的想法供讀者討論:平均是否是一種進步?換句話說,不平均是否阻礙技術的發展?縱觀人類發展歷史,從相對平均原始社會到目前「不平均」現代社會,好像我們的經濟、科技、文化一直是螺旋式的前進。
這個問題,小編沒有答案,留給讀者探討。