「大神」,是很多人對李沐的印象。作為一經推出便大受追捧的 MXNet 深度學習框架的主要貢獻者之一,李沐功不可沒。值得注意的是,這個由 DMLC(Distributed Machine Learning Community)打造的深度學習框架,創建者都是中國人,以陳天奇、李沐、解浚源等為代表。現在,包括 AWS 在內的很多企業都將 MXNet 作為主流支持框架。
作為深度學習「大神」,李沐的開掛人生經歷並不被所有人熟知。為了加深大家對李沐的了解,我們對其學習、職業和研究生涯做了一個簡單的總結。
ACM班、百度、CMU、亞馬遜,李沐的傳奇人生
以倒敘時間線來看,李沐目前為止的職業和學習生涯大致是這樣的:
現狀:在亞馬遜發光發熱
按照李沐的領英個人頁面介紹,他在亞馬遜的工作職責主要有:領導 AWS AI 科學團隊,使深度學習易於使用,包括
減少深度學習的機器成本:
這其中提到的教授深度學習筆記,就是李沐在 2019 年 1 月在 UC 伯克利上線的深度學習入門課程 Introduction to Deep Learning。同授這門課程的還有李沐的亞馬遜同事 Alex Smola。課程內容大致是按照李沐老師的開源新書《動手學深度學習》來安排的。
課程主頁:http://courses.d2l.ai/berkeley-stat-157/index.html
GitHub:https://github.com/d2l-ai/berkeley-stat-157
2017 年,李沐在其個人微博上總結了這一年他所在的亞馬遜人工智慧部門的兩大重點工作:更靈活的前端 Gluon 和更可拓展的後端 NNVM compiler。
其實早在 CVPR 2017 上,李沐就提出了 MXNet 的重要新接口 Gluon,還撰文介紹MXNet/Gluon 的教程:https://github.com/mli/cvpr17
隨後,在 2017 年 10 月,亞馬遜 AWS 和微軟共同宣布推出深度學習庫 Gluon。Gluon 為各種水平的深度學習開發人員設計,幫助開發者在雲端、App 和其他設備上設計原型,創建、訓練和部署複雜的深度學習模型。目前,Gluon 已經與深度學習引擎 Apache MXNet 合作,並已支持另一個深度學習引擎——微軟認知工具包(CNTK)。
2017 年 10 月 7 日,亞馬遜和華盛頓大學合作發布了開源的端到端深度學習編譯器 NNVM compiler。NNVM 是華盛頓大學博士陳天奇等人 2016 年發布的模塊化深度學習系統,2017 年 8 月中旬,他們又推出了將深度學習工作負載部署到硬體的端到端 IR 堆棧 TVM,支持將包括 MXNet、Pytorch、Caffe2、CoreML 等在內的深度學習模型編譯部署到硬體上並提供多級別聯合優化,使得速度更快,部署更加輕量級。NNVM compiler 對 CoreML 的支持,讓開發者可以在非 iOS 設備上部署 CoreML 模型。
自帶光環的過去
說完了李沐大神的現狀,現在我們來簡單回顧下他帶有傳奇色彩的人生經歷。
ACM 班「沐哥」
2004 年,李沐從上海交通大學計算機系 ACM 班畢業,在學校人留下「沐哥」的傳說。在同期同學的眼中,李沐作為 ACM 班的典型代表,是個頗有領袖氣質的人,以至於自然而然地獲得一個「沐哥」的稱號。他還是一個德智體美勞全面發展優秀學生,從專業課到個人大學四六級考試成績都名列前茅,且興趣廣泛。在上海交通大學,他又度過了四年碩士生涯。
在後,2011 年 4 月-2012 年 8 月,他在百度擔任高級研究員,創建了一套分布式機器學習廣告系統。同年,在接到 CMU 的 offer 之後,他決定赴美深造。在李沐於 2017 年發布的文章《博士這五年》中,他提及了這段經歷。
2011 年,李沐收到 CMU 的offer,在當時還在百度的餘凱和張潼的引薦下,李沐決定辭職離開百度,開啟 CMU 博士生涯。
CMU 師從 Alex Smola 和 Dave Andersen
在 CMU,李沐師從機器學習大師 Alex Smola 和 分布式系統教授 Dave Andersen,在兩個導師的輔導下,李沐迅速成長。
此後,李沐加入了餘凱的百度「少帥計劃」,他選擇了與相熟的陳天奇一起,把 CXXNet 作為起點,開始做深度學習相關項目。
創建 MXNet
此後,在陳天奇寫 xgboost 的分布式啟動腳本時,他們發現很多基礎部件例如啟動腳本,文件讀取應該是可以多個項目共同使用,而不是每個項目都造一個輪子,於是李沐與陳天奇在 Github 上創建了一個叫 DMLC 的組織,用來加強合作和溝通。也就是這個組織,此後創建了全世界最受歡迎的深度學習框架之一——MXNet。
MXNet 創建的背後,還有一段小故事:當時 CXXNet 其實已經達到了一定的成熟度,但它的靈活性有局限性,用戶只能通過一個配置項來定義模型,而不是交互式的編程。此時,李沐同時還負責另外一個項目 Minerva,這是一個類似 numpy 的交互式編程接口,但這個靈活的接口對穩定性和性能優化帶來很多挑戰。同時給兩個項目做分布式擴展的李沐很自然地想到,也許可以把兩個項目合併起來,取長補短。
在召集了兩個項目的開發人員討論了幾次之後,新項目就此誕生,並被命名為 MXNet,意為 mixed-net,即 Minerva 和 CXXNet 的組合。
當時,李沐同時在做 difacto 和 MXNet 兩個項目,在同吳恩達的一次見面之後,李沐聽從了他的建議,把全部精力放在了 MXNet。這樣,在谷歌 Jeff Dean 牽頭創建的 TensorFlow 開源壓力之下,MXNet 專注於自己的所長,才有了後面的大獲成功。
《動手學深度學習》熱賣
最後再提一點,《動手學深度學習》這本由李沐,美國伊利諾伊大學香檳分校計算機科學博士 Aston Zhang,李沐在 CMU 的導師 Alex Smola ,以及來自社區的 100 多位貢獻者合著的深度學習書籍,推出之後便大受歡迎,曾在 6 月份登上京東 24 小時熱銷榜 Top 1。
目前,這本書的交互式版本已推出了在線預覽版,面向在校學生、工程師和研究人員,旨在幫助讀者從入門到深入、動手學習深度學習,即使是零基礎的讀者也完全適用。
好消息!李沐親授「深度學習實訓營」
這裡,我們要告訴大家一個好消息,那就是 AI ProCon 2019 邀請到了亞馬遜首席科學家@李沐,在大會的前一天(9.5)親授「深度學習實訓營」,通過動手實操,幫助開發者一站式掌握 AI 核心技術,迅速上手深度學習應用。
除了深度學習「實訓營」,李沐還將在第二天(9 月 6 日)作為 AI開發者大會(AI ProCon )的 Keynote 嘉賓,分享他對人工智慧領域技術發展與行業應用的洞見。
2019 AI開發者大會(AI ProCon),我們集結了國內外來自阿里、華為、Google Brain、Amazon、微軟中國、百度、京東、小米、快手、科大訊飛、商湯、曠視、圖森、雲知聲、思必馳等60+ 技術大咖,在 Keynote 和機器學習、計算機視覺、自然語言處理、知識圖譜、推薦系統、5G 驅動 AIoT、AI 開源、AI+小程序、AI+DevOps 9 大技術論壇上分享硬核 AI 技術,深剖行業痛點,助力開發者職業發展!
更多嘉賓正在確認之中......(最終出席嘉賓以現場為準)
豐富的機器學習相關話題和問題討論,相信會帶給觀眾全新的想法與思考。還在等什麼?迅速行動起來,到現場感受人工智慧領域產學研大神、頂尖開發者匯聚一堂的熱烈氣氛,與大神一起頭腦風暴,刷新你對 AI 技術的認知!
2019 AI 開發者大會(AI ProCon)詳情及報名通道 https://aiprocon.csdn.net/?utm_source=wbpt
【免責聲明:CSDN本欄目發布信息,目的在於傳播更多信息,豐富網絡文化,稿件僅代表作者個人觀點,與CSDN無關。其原創性以及中文陳述文字和文字內容未經本網證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本網不做任何保證或者承諾,請讀者僅作參考,並請自行核實相關內容。凡註明為其他媒體來源的信息,均為轉載自其他媒體,轉載並不代表本網贊同其觀點,也不代表本網對其真實性負責。您若對該稿件由任何懷疑或質疑,請即與CSDN聯繫,我們將迅速給您回應並做處理。】