深度學習2018下半年關鍵技術大盤點:模型、社區與框架

2020-12-11 騰訊網

新智元報導

來源:Medium

編輯:智能禪師

【新智元導讀】本文總結了2018年下半年,最火的開源框架、模型,以及社區。同時還提到一個有趣的現象,每20分鐘就有一篇AI論文現世。最後作者為新智元讀者推薦3本經典深度學習教程。

禪師從來沒有感受過像2018這麼冷的寒冬。所有的行業,仿佛都像中了冰凍減速一樣,又慢,又冷。

可就在這一片冷清中,有一個領域卻成了這個冬天裡,為數不多的火爐:深度學習(Deep Learning)。

距離聖誕節還有2周;離元旦還有3周。眼看今年的餘額就要用完了,可各大論文網站卻依然沒有任何,要盤點這半年來深度學習技術發展的跡象。

於是兩個人坐不住了。他們是Ross Taylor和Robert Stojnic,兩人想辦法搞到了Papers With Code的數據。

Papers With Code是一個社區,致力於將DL研究論文和代碼實現相結合。

本文由原作者Ross Taylor授權新智元發布。Ross Taylor來自倫敦,畢業於劍橋大學。Atlas ML公司聯合創始人,CTO。

兩個小夥子,就這麼對著這些天真無邪的數據,下手了!花了兩個星期,總結出2018下半年,深度學習最關鍵性的技術發展。

大廠發布的最受歡迎開源模型

第一名必須是Google AI發布的BERT

業界有種說法,NLP是人工智慧最後的皇冠,顯然BERT是目前這個皇冠上最璀璨的明珠。

BERT模型全稱Bidirectional Encoder Representations from Transformers,是一種新型的語言模型,通過聯合調節所有層中的雙向Transformer來訓練預訓練深度雙向表示。

只需要一個額外的輸出層,對預訓練BERT進行微調,就可以滿足各種任務,根本沒有必要針對特定任務對模型進行修改。這就是為什麼BERT模型能做在11項 NLP 任務上取得突破進展的原因。

Google AI的BERT論文,在10月份一經發布就獲得廣泛關注。隨後Google AI開源了BERT,在Github上已經獲得超過8000星。

第二名是NVIDIA(英偉達)的vid2vid (Video-to-Video Synthesis)

這個模型最厲害的地方在於,可以根據已有視頻,渲染出非常逼真的新視頻。比如,禪師跳舞非常沒有天賦,但是禪師又很希望能跳的跟抖音啊、B站啊、快手上的網紅一樣好。

於是禪師就可以找一段網紅跳舞的視頻,同時把自己的形象作為輸入,交給vid2vid。最終,vid2vid可以渲染出一段禪師跳舞的視頻,跳的跟網紅一樣好。

圖中右邊的男生是論文合作作者,他最後對著鏡頭說「這是機器生成的,不是我跳的」。

第三名是Google DeepMind的graph_nets

圖形網絡可以概括和擴展各種類型的神經網絡,以在圖形上執行計算。 它可以實現關係歸納偏差,這是一種用於推理對象間關係的技術。

圖形網絡框架基於圖形到圖形模型,每個圖的功能都有三個特徵:

節點

邊緣:節點之間的關係

全局屬性:系統級屬性

圖形網絡將圖形作為輸入,從邊緣,節點和全局屬性執行所需的操作和計算,然後返回新圖形作為輸出。

Graph_nets探索如何在深度學習架構中使用關係歸納偏差來促進對實體,關係和組成它們的規則的學習。

最火的開源框架和最活躍的領域

框架方面。兩級分化嚴重,市場基本被兩個巨頭壟斷了。

首先感謝Gogole的用力推廣,TensorFlow毫無疑問的成為最受歡迎的DL框架。

另一個巨頭PyTorch並沒差太多,同樣擁有可觀的用戶量。

而最活躍的領域是NLP和GAN們。

最火的DL社區

第一名是DeOldify項目

創建者Jason Antic實現了生成建模領域的多篇論文中的技術,包括Ian Goodfellow領頭提出的自注意力機制GAN、Progressive Growing GANs、two time-scale update rule。在GitHub上有超過4,000星。

第二名是BERT implementation for PyTorch

社區由Junseong Kim創建。雖說BERT用TensorFlow是順理成章的事情,但PyTorch也有不少簇擁,所以也獲得了不少關注。

第三名是使用Keras/TensorFlow實現Mask R-CNN的社區

項目創建者是Waleed Abdulla。該項目使用FPN和ResNet101 backbone,並且該庫可用於許多應用場景,例如3D建築物重建、自動駕駛汽車的物體檢測、檢測地圖中的建築物類型等。

番外

除了這幾個最火的東西外,還有一些比較有趣的數據,值得回味。

平均每隔20分鐘就會誕生一篇機器學習相關論文

按照這個速度,再過25天,我們就能看到機器學習的論文要突破30000篇了。什麼概念同志們?比4萬少一萬,比2萬多一萬吶!

按照成年人平均閱讀速度300單詞/分鐘來算,20分鐘基本上也讀不完一篇論文。禪師掐指一算,恐怕人工智慧論文審核人員,是唯一不僅不擔心被人工智慧搶走飯碗,反而急切盼望人工智慧來輔助工作的人了。

只有12%的論文包含代碼

經過爬取超過近5年來6萬篇機器學習論文,發現只有12%左右的論文包還有代碼。哪些沒有代碼的論文,意思是讓讀者自己腦補代碼嗎?恐怕不是這樣吧,那麼具體什麼原因呢?恐怕大家心裡也有數。

不過這種情況正在好轉。今年下半年,包含代碼的論文佔有所提升,漲到了15%。

前景展望

可復用性代碼造福更多開發者

社區在可復用性代碼方面雖然取得了不小的進展,但事實上我們只有1/7的覆蓋率,意味著我們還有更多的工作要做。

因此我們認為,在未來,更多的社區將在可復用的開源ML代碼方面,發揮重要作用,從而可以服務更廣大開發者,而不用像過去那樣,只能依賴特定的研究人員。

獨立機器學習社區蓬勃發展

「機器學習獨立社區」,就是那些獨立於在Google或Facebook等大廠之外、由用戶、愛好者自發創建的社區。

獨立社區的發展,將有助於推動代碼的研究發展,以及驗證論文結果是否成功。

BONUS

作者向新智元的讀者推薦了3本對他幫助最大的機器學習、深度學習書籍,分別是:

《深度學習》(又稱「花書」)作者Ian GoodFellow。本書的權威性不用多說,甚至很多知識付費社區會請一個AI相關專業的人作為老師,帶領學員共同學習這本書。有點高考補習班的感覺

《機器學習基於概率論觀點》作者Bishop。注意不是Murphy版本!相比而言,B的教材對數學的要求高,更偏重概率論;M版本話題更寬泛,章節之間獨立性相對較強

《信息理論、推理和學習算法》作者Sir David MacKay。Ross認為本書部分內容與當代科技有所脫節,但整體而言仍然非常經典,值得一讀

希望對有志於投身機器學習的開發者、學者有所幫助。

https://medium.com/atlas-ml/state-of-deep-learning-h2-2018-review-cc3e490f1679

【加入社群】

新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號:aiera2015_2入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。

相關焦點

  • 2018年國外深度學習技術發展綜述
    從以上人工智慧的會議看,近年來人工智慧領域越來越關注深度學習,特別是深度學習中的強化學習技術。本文將主要闡述2018年國外深度學習技術的發展,以期提供有益的參考。深度強化學習是開發業務應用程式中的通用技術之一,對於訓練模型,它所需要的數據更少;而且其中另一個優點在於可以通過模擬來訓練模型,這完全消除了傳統深度學習技術對標記數據的嚴重依賴。
  • 深度學習框架比較,我該選擇哪一個?
    使用深度學習框架完成模型構建有如下兩個優勢: 節省編寫大量底層代碼的精力:屏蔽底層實現,用戶只需關注模型的邏輯結構。同時,深度學習工具簡化了計算,降低了深度學習入門門檻。
  • 報名| ONNX Workshop首次登陸中國,探討AI模型格式標準
    ,開源框架內的人工智慧技術發展得尤其活躍。為了推動人工智慧研究的互操作性,讓任何深度學習框架在任何晶片與任何設備上都能運行,微軟、Facebook, AWS 在 2017 年 9 月發起了「開放神經網絡交換(ONNX)」項目。2017 年底華為、AMD、英偉達、英特爾、高通等企業宣布支持 ONNX,目前已有超過 20 家人工智慧領域的公司加入社區。
  • 2016深度學習統治人工智慧?深度學習十大框架
    那麼,2016 年是否能看作深度學習正式統治人工智慧的一年?如果是這樣,我們又能為此做好什麼準備?新智元整理了業內人士關於 2016 年的深度學習技術展望,以及 2015 年深度學習最流行的 10 大框架。
  • AI 四巨頭 Google、DeepMind、Microsoft、Uber 深度學習框架大比拼
    GPipe、Horovod、TF Replicator和DeepSpeed分別是這四家公司開發應用的深度學習框架,它們結合了深度學習研究及其基礎設施的前沿技術,以提高深度學習模型的訓練效率。這四個深度學習框架各有什麼特點和優勢呢?本文將對此做一個基本介紹。
  • 盤點2018下半年最為重要的10場會議
    盤點2018下半年最為重要的10場會議 李倩 發表於 2018-08-27 09:09:03 AI相關領域正在以驚人的速度前進,技術、學術、產業變化之快,如果想跟上最前沿的研究,開發者們必須要關注AI最新資訊
  • 王敏捷 - 深度學習框架這十年!
    王敏捷  ACM'07紐約大學博士,亞馬遜上海研究院應用科學家內容概覽 介紹了深度學習框架發展的三個時期:工具包時代(2014年前)、數據流時期(2014-2018)、新時代(2019年後)。強調了深度學習框架的重要性與推動因素,介紹了3位ACM人李沐、陳天奇和他一起將各自的技術Parameter Server、CXXNet、Minerva融合併創造了新的深度學習框架MXNet。敏捷學長也指出了在深度學習新時代,隨著可微分編程、圖神經網絡等新領域的出現以及專用晶片的發展,深度學習框架會迎來更多機遇與挑戰。深度學習的浪潮其實到現在僅僅發展了十幾年的時間。
  • 通過對比深度學習各大框架的優缺點尋找最優
    開源的深度學習神經網絡正步入成熟,而現在有許多框架具備為個性化方案提供先進的機器學習和人工智慧的能力。那麼如何決定哪個開源框架最適合你呢?本文試圖通過對比深度學習各大框架的優缺點,從而為各位讀者提供一個參考。你最看好哪個深度學習框架呢?
  • Keras vs PyTorch:誰是第一深度學習框架?
    兩大框架的連結:  Keras:https://github.com/keras-team/keras (https://keras.io/)  PyTorch:https://github.com/pytorch/pytorch  你想學習深度學習嗎?
  • 阿里巴巴深度學習框架X-Deep Learning,要開源了
    阿里媽媽研究人員介紹,XDL整體上跟TensorFlow和PyTorch是同級的,它們很好地解決了目前已有開源深度學習框架分布式運行能力不足,以及大規模稀疏特徵表徵學習能力不足的問題。 XDL 採用了「橋接」的架構設計理念。這種架構使得 XDL 跟業界的開源社區無縫對接。
  • 回望2017,基於深度學習的NLP研究大盤點
    在這篇文章中,我將細數 2017 年裡基於深度學習技術的自然語言處理所取得的一些進步。另外由於實在是存在著太多的相關論文、框架和工具,所以我並不打算進行詳盡的介紹。我只是想和大家分享一下今年產出的我所喜歡的工作,而且我認為 2017 年自然語言處理領域取得的成績斐然。
  • 2020年深度學習發展大盤點及對2021年深度學習的未來展望|極客雲算
    深度學習框架作為AI底層工具,對個人而言是進入深度學習世界的一把鑰匙,掌握深度學習框架並不等於理解了深度學習,要在AI開發中有所作為,關鍵還是要真正理解框架背後的技術、實踐和生態。隨著近年來的人工智慧發展,2020年深度學習依然是發展最快的領域之一,直奔未來工作。其發展是多方面的,而且是多方位的。
  • 百度CTO王海峰:深度學習的核心東西是深度學習框架
    王海峰指出,深度學習已經廣泛應用,它的核心的東西是深度學習框架,可以說深度學習框架是智能時代的作業系統,它向下會對接晶片,晶片會針對深度學習框架裡面的這些運算來進行優化,向上是支撐各種應用,核心的部分有訓練框架,有了很多數據,跟應用相關的數據,然後進行訓練,訓練得到模型。然後預測框架會基於已經訓練好的模型,針對應用與應用相結合,最後實現真正的應用。
  • 微軟打造深度學習開源框架「自動翻譯機」:不同框架輕鬆切換
    【新智元導讀】微軟Cortana智能和機器學習小組的數據科學家最新在Giuhub開源項目,對各個深度學習框架進行了基準測試,提供了很多有參考價值的數據以及GPU優化代碼。眾多的深度學習框架,就像世界上各種不同的語言一樣,但是,不會「外語」並不可怕,他們希望構建一個深度學習框架的羅塞塔石碑,讓開發人員和研究者能在這個眾多框架並存的環境中,好好生存。
  • 常用機器學習算法的目前主要有深度學習領域的各種模型及框架
    中國人工智慧四個代表職位之一的「算法工程師」——數據科學家,是近年來在網際網路和人工智慧領域顯示出極大發展潛力的新興職位,是在計算機科學、工程技術等諸多領域中分別涉及的領域內的一個綜合領域。很多初期從事人工智慧相關工作的人,受限於對本專業知識認識有限,在對人工智慧了解尚淺之時,就開始應聘。甚至有人剛開始著手做招聘工作時,就拿數據科學家這個工作的名稱誤導了初入門人工智慧行業的從業者。
  • 大神擼了個暗黑系深度學習框架...
    深度學習框架平臺佔據人工智慧產業生態的核心地位,具有統領產業進步節奏、帶動終端場景與雲端服務協同發展的重要作用,處於承上啟下的關鍵地位,其意義媲美移動網際網路作業系統。隨著深度學習框架的不斷演進,以深度學習為代表的人工智慧將大放異彩。
  • AAAI 2017講座:8大主流深度學習框架超詳細對比(90PPT)
    這一講座介紹了深度學習框架設計原則的基本知識,其目標是為希望在自己的工作任務中利用深度學習的研究者 和AI 實踐者提供關於選擇合適框架的指導。當下,深度學習中的一些軟體框架,比如 TensorFlow 和 Caffe,已經被許多深度學習系統採納,以加速研究和發展速度。深度學習在 AI 的核心技術中扮演基礎性的作用,其中包括圖像和語音識別、計劃和自然語言處理。在
  • 輕量級部署,騰訊優圖開源深度學習推理框架TNN
    機器之心發布機器之心編輯部6 月 10 日,騰訊優圖實驗室宣布正式開源新一代移動端深度學習推理框架 TNN。從學界到工業界,「開源」已經成為 AI 領域的關鍵詞。6 月 10 日,騰訊優圖實驗室宣布正式開源新一代移動端深度學習推理框架 TNN,通過底層技術優化實現在多個不同平臺的輕量級部署落地。該框架性能優異、簡單易用。基於 TNN,開發者能夠將深度學習算法輕鬆移植到手機端並高效執行,開發人工智慧 APP,真正將 AI 帶到指尖。
  • 「2017深度學習框架大事記」PyTorch成TensorFlow最大競爭對手...
    新智元編譯 深度學習的圖景在不斷變化。Theano是第一個被廣泛採用的深度學習框架,由Yoshua Bengio領導的MILA創建和維護。但情況已經發生改變。今年9月,MILA宣布,在發布Theano的最新版本後,2018年將終止Theano的開發和維護。這個消息並不令人感到意外。
  • 開源大咖齊聚2020啟智開發者大會 共探深度學習技術未來趨勢
    大會以「啟智築夢 開源先行」為主題,立足於國際國內開源大環境和發展趨勢。開源領域頂尖專家學者和企業領軍人物共聚一堂,探討開源開放呈現出的新形勢、新格局、新機遇。百度飛槳全面參與,並承辦深度學習專場,展現了飛槳的最新技術進展及成果。