和谷歌搶人,挖微軟牆角,Facebook AI實驗室5年逆襲之路

2020-12-13 鎂客網

下一個5年,FAIR或許能給我們帶來一些驚喜。

堅持5年能得到什麼?

馬雲說,「對於一家創業公司而言,能堅持做5年,就一定是『牛』的。」

同理,對於一家傳統網際網路公司而言,能堅持5年用新技術為原有業務改頭換面,更牛。

而從2013年12月10日對外正式宣布成立AI實驗室FAIR至今,Facebook真真正正做AI正好5年時間了。這家在科技創新上素來以「落後、跟隨」之姿發展的公司,如今也正在期待著憑藉AI再創網際網路社交傳奇。

傳統社交數據的爆發式增長

「沒有深度學習,現在的Facebook就無法正常運營,因為它已經深入到Facebook的方方面面了。」FAIR創辦者&首席AI科學家、卷積神經網絡發明者之一的Yann LeCun在總結Facebook這5年發展時說道,「但實際上,在2013年之前,Facebook高層並不贊同成立這個實驗室。」

眾所周知,Facebook以傳統社交網際網路起家。而因初初創立時,扎克伯格還是哈佛大學的一名學生,所以這個社交平臺一開始也只在哈佛大學的學生中被廣泛熟知。

得益於網際網路的快速發展,以及社交這一「有點就可擴散至面」的特性,Facebook很快便成為了美國高校學生日常社交的常用工具。

隨著用戶範圍的擴大、開闢廣告業務以及接入第三方服務,到2009年年初,Facebook的用戶數就已超1.5億,用當時扎克伯格的話說,「如果Facebook是一個國家,那麼它將是世界上人口第八多的國家,比日本、俄羅斯和奈及利亞等國都多。」

但1.5億的用戶量和主要以圖片為信息承載的社交模式,顯然還不足以讓扎克伯格為數據優化及處理憂心,而素來「後知後覺」的公司高層最關心也依舊是產品線的拓展。直到2013年的一次宴會,這一現狀才有所改變。

其實,Facebook並不是不重視技術的發展,只是真的很「後知後覺」。這點,從歷年來的F8大會就可以窺見一二。

2007年,Facebook召開了第一屆F8大會,推出了面向開發者的社交圖譜。次年,又推出了社交工具Facebook Connect。但實際上,這些只是基於Facebook現有業務所做的調整,而非技術創新性突破。

也因此,2009年的F8大會因沒有新進展而停辦。

此後兩年時間裡,雖然其做了多番調整,相繼推出了新社交插件、Timeline、開放式圖譜協議、圖譜API等。但依舊可以看出,這些技術及產品不具備創新改革的能力。

為此,2013年的F8大會再次停辦了,這對才上市不久的Facebook,是個不小的打擊。

相關數據統計,到2013年年初,Facebook全球日活躍用戶數已然超過了6.5億。加之第三方服務、廣告業務、視頻直播、Instagram等產品線的發展,以及各產品間數據共享需求的增加,傳統網際網路技術儼然開始無法繼續支撐下去了。

而此時,諸如谷歌、微軟、蘋果等同類網際網路公司,早已開始向科技公司轉型,如谷歌早在2010年就成立了谷歌X實驗室,更是在2011年成立了谷歌大腦。而蘋果更是在2011年就推出了智能語音助理Siri,將機器語音學習從實驗室帶到了大眾的生活中。

此時的Facebook,顯然已經落後了。

「Facebook CTO Mike Schroepfer此前一直不同意成立AI實驗室,但事實顯示,AI對於Facebook未來發展越來越重要。」LeCun回憶說,「在去扎克伯格家赴宴時,我和他詳談了AI的重要性。幸運的是,扎克伯格當時也認為『開放創新』應該成為Facebook發展的重點。」

「之後沒多久,FAIR就成立了。」

追趕深度學習

從成立之初,FAIR的定位便是一個負責研究技術的部門,其研究重點也大多聚焦在解決推理、預測、規劃、無監督學習等底層技術問題上。

當然,技術研發離不開人才,但Facebook於AI方面的積累幾乎為0。所幸,扎克伯格肯投入,除LeCun外,5年時間裡,FAIR還相繼吸引來了包括VC維和SVM的締造者Vladimir Vapnik,提出隨機梯度下降法的Léon Bottou,做出高性能PHP虛擬機HHVM的Keith Adams、ICCV 2017最佳論文得主何凱明等在內的多位深度學習頂級專家,甚至還用7位數年薪與Deepmind展開了搶人大戰以及大力挖角微軟。截止到目前,FAIR的團隊規模就已擴大至了近200人。

如此大的人才投入下去,成果自然也不會少。

· Caffe2

沿襲Caffe的大量設計,2017年4月FAIR推出了兼具擴展性、高性能和便攜性的Caffe2,一個輕量化和模塊化的深度學習框架,可在行動裝置上進行訓練和預測。

· PyTorch

2017 年初,FAIR發布了基於Python開發的PyTorch。因其集成了Caffe2和ONNX 的模塊化、面向生產的功能,提供從研究原型到生產部署的無縫路徑,並與雲服務和技術提供商進行深度集成,在GPU速度和內存使用率方面都極具優勢。

今年10 月,Facebook還舉辦了第一屆 PyTorch開發者大會,來自加州理工學院、FAIR、fast.ai、谷歌、微軟、英偉達、特斯拉等多位行業頂級專家均有參與。

· FastText

為了加快機器文本分類和學習速度,2016 年FAIR推出FastText,可對數十億個單詞量文本進行快速分類。截止到目前,FastText已經可以對157 種語言的文本進行分類,也被應用於諸如「消息回復建議」等的場景中。除此之外,FastText還和DeepText相結合,進行自然語言理解和翻譯。

· Fairseq機器翻譯模型

基於CNN,FAIR推出了集速度、準確性和學習能力為一體的NMT神經機器翻譯架構——Fairseq,其速度較谷歌的RNN提高了9倍。

而為了避免需要翻譯大量的數據集(通常稱為語料庫),FAIR在去年發布了MUSE,通過監督和無監督式學習的方式,學習和翻譯110種雙語詞典以及自我構建新的雙語詞典。

· bAbI

長期記憶能力不足是神經網絡的缺陷之一,為此,FAIR開發了一個支持內存網絡的機器學習模型,它能夠參考此前的對話內容做記憶性回答。比如,在學習了《魔界》這部電影的劇情後,其就能概括出故事的最後戒指是出現在了Mount Doom中。

而為了讓模型有足夠的數據學習,FAIR還構建了一個問答任務數據集——bAbI,包含數千個對話示例,可以提高模型理解文本的準確性。

· Mask R-CNN

作為一個以圖片分享為核心的社交平臺,每天上傳至Facebook上的圖片數據量是極為龐大的。而為了在合適的時間為用戶展示合適的圖片,FAIR通過理解圖片中的不同部分的像素,以理解圖片的特殊含義,比如分析人手部動作的具體含義,實現圖像實例分割。

目前,Mask R-CNN已被應用於檢測劣質內容等場景中。未來,Facebook還將會應用它為AR、智能相機等業務賦能。

5年堅持下的「煥新」

可以看到,5年時間,Facebook在AI,尤其是深度學習基礎技術研發上已初具規模。當然,任何高端技術在走出實驗室之前,都無法創造實際價值。為此,在FAIR技術成果轉化過程中,Facebook還成立了其第二大人工智慧實驗室AML,旨在研究AI技術的具體應用。

一般而言,如這樣分成兩個部門應該存在著很大的溝通交流問題,不過很顯然,Facebook在這方面做的很好。所有來自FAIR的預測推理、視覺、語義理解技術都被廣泛應用到Facebook的各個產品中,如其圖片濾鏡已可以跟Snapchat媲美,不同用戶主頁News Feed上呈現的內容是由機器圖像分析後決定的以及清除垃圾數據、內容及郵件翻譯、智能攝像監控、簡化版數字助理「M」等,都是AI賦能的結果。

而在Facebook近年大力發展的VR/AR業務方面,上述中多項技術都有所應用。甚至還有消息稱,Facebook內部已經在緊鑼密鼓的研發語音助理,代號為 「Aloha」。

可以說,AI已經成為了網際網路社交外,Facebook最核心的部分。從2014年開始,即便在今年遭遇重大數據洩露問題的情況下,F8大會再未出現停辦的情況,也或多或少都有較為亮眼的新產品或技術推出。Facebook也終於在2016年發布的「十年版圖」中,將AI、VR等技術放在了戰略核心的位置上。

就連那位此前一直反對成立人工智慧實驗室的Mike Schroepfer也終於承認,「AI是Facebook未來三大重點發展領域之一,其餘兩個是虛擬實境和讓更多的人連上網絡。」

成果來之不易,堅持更是難上加難。雖然較之於谷歌、微軟這樣在底層技術方面素來領先的公司而言,Facebook目前還未能有突破性領先成果,但5年時間裡,FAIR的多項成果及相關應用也足以說明,Facebook正在試圖,或者說期待憑藉AI再創其在網際網路時代的社交傳奇。

就連LeCun都說,「在FAIR創辦之前,Facebook做的都是一些短期的工程項目,最長的項目周期也不過6個月。」由此可以期待,下一個5年,FAIR或許能給我們帶來更多的驚喜。

最後,記得關注微信公眾號:鎂客網(im2maker),更多乾貨在等你!

相關焦點

  • 微軟籌謀已久的AI實驗室終於公布, 將成為對標谷歌Deepmind的利器
    作為科技巨頭之一的微軟,本身也在推動產品「全線人工智慧化」的發展。在7月12日,中不僅包括了對人工智慧領域的期待與願景,更是帶來了一個重磅消息——微軟將在華盛頓州Redmond的總部建立一個AI實驗室。,這個實驗室將成為微軟旗下的「Deepmind」。
  • AI在這張「問卷」上首次超越人類,SuperGLUE被微軟谷歌兩家「攻破」
    一個是來自微軟的DeBERTa,一個是來自谷歌的T5+Meena。超越人類的兩大NLU模型對NLP領域的人來說,微軟DeBERTa模型並不陌生,早在去年8月微軟就開源了該模型的代碼,並提供預訓練模型下載。
  • 微軟組建通用人工智慧實驗室:挑戰谷歌 DeepMind
    北京時間7月13日早間消息,微軟將建立新的人工智慧實驗室,專門開發更加通用的機器學習系統。這個新的實驗室名為微軟研究院AI,位於微軟雷蒙德總部。
  • 谷歌、微軟等科技巨頭都在鑽研哪些「黑科技」?12個項目帶你一探...
    本文介紹的12個科技項目都是目前由谷歌、facebook、微軟等大型網際網路公司主導研究的科技項目,通過這些或許我們能夠窺探一下未來世界的模樣。科技公司Blue Origin 和Virgin Galactic :「太空旅遊」將在2018年實現
  • 谷歌和 Facebook 是如何給工程師定職級和薪水的?
    在谷歌,工程師的級別是從 Level 3 開始的。蘋果公司工程師有 5 個級別,從 ICT2 到 ICT6。微軟的工程師從 59 開始,可以做到 80 級別的「技術合伙人」,或者是某個領域的負責人。級別越高,得到的報酬就越高。與 Musa 和 Mohiuddin 一樣,剛進入這個行業的年輕人對這些評級系統有很多疑問。
  • 實錘了:「AI 翻車」事件已超1000+,特斯拉,微軟、谷歌、蘋果等全部...
    https://incidentdatabase.ai/在這些事故中,有的可能只是鬧了個笑話,但有的已經對人類造成了實質性的傷害,或者為國家完全埋下了隱患。此外還可以看到,特斯拉、谷歌、微軟、亞馬遜、蘋果等頗具影響力的科技巨頭在這份「翻車」列表中也頻頻出現。
  • ...成TensorFlow最大競爭對手,微軟、亞馬遜、Facebook 合作聯盟...
    2017年開源深度學習框架圖景目前,從GitHub的star和fork數量,以及Stack Overflow活躍度來看,谷歌的TensorFlow似乎是最常用的深度學習框架。有人預計,伴隨著TensorFlow的推出,谷歌將主導這個市場多年。但是,看起來其他框架確實也吸引了越來越多的充滿熱情的用戶群。值得一提的是PyTorch的開發和發展。
  • 實錘了:「AI 翻車」事件已超 1000+,特斯拉,微軟、谷歌、蘋果等...
    此外還可以看到,特斯拉、谷歌、微軟、亞馬遜、蘋果等頗具影響力的科技巨頭在這份 「翻車」列表中也頻頻出現。「自動駕駛」頻翻車從列表來看,自動駕駛是 AI「翻車」事故較為頻繁且影響惡劣的領域。包括特斯拉、Uber 等大型車企均發生過多起受傷,或致死等交通事故。就在上個月,特斯拉還因險些造成事故登上了微博熱搜。
  • 谷歌、臉書、微軟等公司都有豐厚的試管嬰兒補貼,竟因這個不忍直視...
    :39:58 美國科技媒體Techcrunch近日統計出了為員工提供生育福利最好的十家美國科技公司,facebook,谷歌、微軟都名列其中
  • 萬字長文看懂阿里、微軟和谷歌的接班人系統
    馬雲還給阿里巴巴設定了一個小目標:2002年上市。大家一起湊了50萬,就這樣開始了新的創業之路。那年5月,幫朋友談收購事宜的蔡崇信和馬雲談了一次,產生了加入這個團隊的衝動。蔡崇信畢業於美國耶魯大學法學院,而後在一家全球知名投資公司工作,當時的年薪70萬美元(當時約合人民幣580萬)。來見馬雲時,他的家庭即將迎來第一個小孩。而馬雲說,他只能出得起500塊錢一個月。
  • 揭秘谷歌AI實驗室:我們不做產品,我們只是AI界的「遊戲玩家」
    是谷歌人工智慧實驗項目中最成功的案例,也許它也是對該公司價值的最好詮釋。AI Experiments(人工智慧實驗)基於谷歌創意實驗室,由一個程式設計師、設計師和作家組成的團隊創建,工作內容就是用谷歌的技術製造出酷炫好玩的產品。這一項目運營僅僅一年,它通過有趣的產品或遊戲,為揭開前沿技術提供了途徑,同時也為向谷歌的研究人員和工程師們介紹新想法提供了渠道。
  • 谷歌自曝醫療AI臨床結果不佳:實驗室豐滿,臨床骨感
    白交 發自 凹非寺量子位 報導 | 公眾號 QbitAI實驗室數據不斷刷新記錄的Google Health,最近公布了一項臨床診斷試驗結果。不理想。不僅診斷結果不一致,而且實際操作方法和在實驗室裡壓根不一樣。這項系統是檢測糖尿病性視網膜病變(DR)的症狀,對糖尿病進行一個早期的篩查。這。。
  • 華為悄悄在倫敦開設了一個實驗室,緊挨Facebook和谷歌
    華為已在倫敦市中心悄悄開設了一個新的研究實驗室,有60位計算機視覺工程師,實驗室在新的Facebook和谷歌辦事處旁邊。消息人士表示,華為尚未正式宣布新實驗室,但已邀請貴賓下個月參觀新實驗室。一位了解華為計劃的消息人士稱,華為最終計劃在實驗室中配備200名專注於人工智慧的工程師,並特別重視計算機視覺這一人工智慧領域,可以使計算機「識別」物體或人。該實驗室專注於自動駕駛汽車技術以及人工智慧的廣泛應用。該實驗室的存在凸顯了英國對全球公司作為人工智慧人才樞紐的重要性,也證明了華為即使在面臨西方政府對間諜指控的日益嚴格審查的同時仍在繼續擴張。
  • 『AI翻車』事件已超1000+,特斯拉,微軟、谷歌、蘋果等全部...
    此外還可以看到,特斯拉、谷歌、微軟、亞馬遜、蘋果等頗具影響力的科技巨頭在這份「翻車」列表中也頻頻出現。「自動駕駛」頻翻車從列表來看,自動駕駛是AI「翻車」事故較為頻繁且影響惡劣的領域。包括特斯拉、Uber等大型車企均發生過多起受傷,或致死等交通事故。就在上個月,特斯拉還因險些造成事故登上了微博熱搜。
  • WPS的逆襲發家之路
    而金山WPS的堅守與逆襲之路要從1988年說起。在移動端逆襲,從工具型應用到生態型平臺1988年求伯君寫出第一行代碼開啟了金山WPS的風雨路程,微軟Office1994年進入中國以來一直與WPS相愛相殺。
  • 蘋果Facebook谷歌微軟等加盟W3C
    網易科技訊10月8日消息,據國外媒體報導,為了建立適用於所有開源Web技術的「權威性參考資料」,蘋果、Adobe、Facebook、谷歌、HP、微軟、Mozilla、諾基亞以及Opera均已加入全球資訊網聯盟W3C,合力推出一個名為「
  • 收購Drive.ai,蘋果造車能追趕谷歌嗎?
    2018年5月,Drive.ai在美國德州弗裡斯科市投放了3-4輛自動駕駛廂式車,開啟無人駕駛商業化試點運營服務。5個月後,Drive.ai宣布正式在德州阿靈頓向居民、僱員和旅遊者推自動駕駛打車服務。對於當時成立才3年的Drive.ai來說,這樣的落地速度的確令人驚訝。
  • 微軟亞洲研究院:20年20人-虎嗅網
    量子位盤點了這20年來,從業經歷與微軟亞洲研究院密不可分的20人。他們之中,有人依然身處研究院,有人在致力於探索技術的商業化之路,也有人進入了創投領域,為更多創業者提供支持。湯曉鷗發明的人臉識別技術,是世界上第一個超過人眼識別能力的計算機算法。其在香港中文大學創辦的多媒體實驗室,2016年與麻省理工、斯坦福等著名大學一道,入選世界十大人工智慧先鋒實驗室。湯曉鷗的研究領域包括多媒體、計算機視覺、模式識別及視頻處理,已在這些領域發表論文200餘篇。同微軟合作已申請近40項專利。
  • 蘋果挖牆角!Apple Music推安卓桌面插件
    原標題:蘋果挖牆角!Apple Music推安卓桌面插件   據外媒報導,蘋果和谷歌一直是水火不相容,但是這並不妨礙蘋果和谷歌在對方的平臺山大展拳腳。今天,蘋果卻針對Android平臺的Apple Music用戶推出了一款全新的桌面小部件,可以在智慧型手機或平板電腦的主屏幕上使用。
  • 谷歌發布tf.Transform微軟劍橋推出DeepCoder|AI研習社周刊
    首先是谷歌發布了全新的 tf.Transform 組件,大大簡化了機器學習中的數據預處理問題;同時,從去年秋天開始傳聞的GPU雲端加速服務也終於在谷歌雲平臺實現了;另外,微軟公司聯合劍橋大學在最近發布的論文中闡述了一個機器學習系統DeepCoder,擁有了基礎編程能力,為不會編程的人提供了製作簡易程序的可能。最後,我們推薦幾個本周內雷鋒網出品的「高能」開發者資源合集,祝各位周末愉快。