陳天奇為你講解ML System經典論文(內附視頻)

2021-02-08 伯禹人工智慧學院

現今,人工智慧有眾多細分領域,技術發展日新月異。10 Mins Paper是伯禹推出的共創、共享的人工智慧領域論文解讀系列。每一期我們邀請優秀的老師、學長,針對其研究領域,為大家挑選最值得一讀的經典/前沿論文。用10分鐘時間,為大家深入淺出地講解論文中的思想與方法,帶大家領略這一研究領域的獨特魅力。

本期10 Mins Paper將由陳天奇博士以及上海交通大學APEX實驗室的本科生為大家帶來,希望大家能夠從視頻中有所收穫。


掃描下方二維碼,前往伯禹 10 MIns Paper網站獲取視頻~(PS:也可在B站搜索「伯禹人工智慧學院」觀看)

人工智慧和機器學習的發展離不開基礎軟硬體的進步,硬體計算能力的提高恰恰是這一波人工智慧和深度學習浪潮的起點。而優美的理論和算法要落到實處,要成為真正可以改變人們生活的技術,必然需要可靠的高性能的系統作為支撐。而機器學習系統正是連接理論與實踐、硬體和算法的橋梁。正如任何一個計算機系的學生都要學習體系結構、作業系統一樣,機器學習系統對於對人工智慧感興趣的同學來說也非常重要。

陳天奇是上海交大ACM班06級學生,也是APEX實驗室13屆畢業的碩士生,美國華盛頓大學(UW)博士生。他研發的XGBoost、MXNet和TVM三項機器學習系統獲得了學術界和工業界的一致好評,被業界認為是新一代機器學習系統領域最具有影響力的華人學者之一。今年6月,陳天奇宣布將在一年後加入卡耐基梅隆大學(CMU)擔任助理教授。

陳天奇到底有多厲害?讓我們縱覽一下他研發的這三項機器學習系統對工業界的影響:

1.XGBoost,作為梯度提升樹模型的極致實現,具有極強的預測能力和極高的運行效率,在學術界和工業界應用十分廣泛。可以說,隨便進到中國一所前200名的大學的大數據相關的實驗室,裡面一定有學生在跑XGBoost的實驗,隨便進入中國一個三線城市的一所民居內的大數據創業公司,裡面的算法工程師一定用XGBoost做過一些預測任務。

2.MXNet,是在深度學習時代產生的主流開原始碼之一,天奇和李沐是MXNet的兩位最主要的貢獻者。後來MXNet被Amazon選為AWS深度學習的代碼基礎,和谷歌的TensorFlow,Facebook的PyTorch並駕齊驅,成為最有影響力的深度學習框架之一。

3.TVM,是一個面向深度學習代碼的編譯器,利用機器學習自動編譯成下層硬體執行的機器碼。TVM對於工業界有著深遠的貢獻,這意味著新的深度學習硬體突破硬體巨頭的前後端產品體系封鎖成為可能,這將促使面向人工智慧的硬體產業全面開花。

本期10 mins paper主要介紹了七篇機器學習系統的論文:

1.TVM:An Automated End-to-End Optimizing Compiler for Deep Learning(TVM是一個可用於CPU,GPU和各種硬體加速器的開源深度學習編譯器技術棧,是陳天奇博士的代表工作之一。)

2.AutoTVM : Learning to Optimize Tensor Programs(在TVM的基礎上,進一步講解了AutoTVM的基於學習的優化框架。)

3.TASO: Optimizing Deep Learning Computation with Automatic Generation of Graph Substitutions(TASO是一個使用自動生成graph substitution的計算圖優化器,能讓 CNN 更好得並行,跑得更快。)

4.Parameter Hub:A Rack-Scale Parameter Server for Distributed Deep Neural Network Training(一種硬軟體結合的優化,大幅度降低了雲伺服器上分布式訓練的通信和同步消耗,大幅度提升了訓練速度。)

5.Ray:A Distributed Framework for Emerging  AI  Applications(在此之前,沒有能有效支持訓練、服務、模擬緊密聯繫的通用用途的系統, 為了展現這些核心構件並滿足新興人工智慧應用的需求, Ray統一了actor和任務並行兩個編程模型。)

6.Towards Federated Learning at Scale: System Design(本文實現了基於 Federated Learning 算法的分布式機器學習系統,該分布式機器學習系統能夠靈活、高效、健壯地處理大量非集中存儲的數據。)

7.PipeDream:generalized pipeline parallelism for DNN training(PipeDream利用流水線技術改進神經網絡並行計算,在不同的場景下相比原來的並行方法有了成倍的提升。)


論文#1: 

TVM:An Automated End-to-End Optimizing Compiler for Deep Learning

伯禹學堂:

https://www.boyuai.com/videos/10minspaper/T46V7xNHqyer7nibSigJR

B站:

https://www.bilibili.com/video/av77177061    

陳天奇,在華盛頓大學保羅·g·艾倫計算機科學與工程學院獲得博士學位,與卡洛斯·格斯特林合作研究機器學習與系統的交叉。創建了三個被廣泛採用的主要學習系統:XGBoost、TVM和MXNet(聯合創建者)。是機器學習谷歌博士獎學金的獲得者。

這篇文章是TVM的技術報告。TVM是一個可用於CPU,GPU和各種硬體加速器的開源深度學習編譯器技術棧,它旨在架起多種深度學習前端框架與後端硬體之間的橋梁,能夠將深度學習模型高效地部署到異構的後端上並進行自動調優。

深度學習、編譯原理、GPU、並行計算、Halide

論文#2 :

AutoTVM : Learning to Optimize Tensor Programs

伯禹學堂:

https://www.boyuai.com/videos/10minspaper/0H9XnepUGa3-gS6CpdHGx

B站:

https://www.bilibili.com/video/av76587731

侯博涵,上海交通大學APEX實驗室、ACM班本科生,研究興趣為機器學習系統、計算機體系結構。

本視頻介紹了Learning to Optimize Tensor Programs這篇文章,主要講解了AutoTVM的基於學習的優化框架。

Halide,tvm,GBDT,TreeGRU,transfer learning

在學習Architecture、Operating System、Compiler和Networking這些課程的時候,我感受到了計算機系統設計在近半個世紀以內的演變和進化,我們何以構造如此神奇的計算機器?我們能製造的機器的極限又在哪裡?這些問題是迷人的。「Simplicity favors regularity」」Do one thing, do it well.」先驅們用簡單的哲學和優雅的設計為這些問題的回答做了完美的演示,而我想追隨他們的腳步。

論文#3:  

TASO: Optimizing Deep Learning Computation with Automatic Generation of Graph Substitutions

伯禹學堂:

https://www.boyuai.com/videos/10minspaper/c5bdXzYsVuOtUyIJPgu6c

B站:

https://www.bilibili.com/video/av76588144

徐逸凡,上海交通大學APEX實驗室、ACM班本科生,研究興趣為機器學習系統。

本視頻介紹了TASO,一個自動生成graph substitution的計算圖優化器。

我對機器學習系統的興趣源於機器學習課程的一個大作業。這個大作業的任務是ctr的預測,我使用了一個叫XGboost的庫,在使用XGboost的過程中,我發現這個庫非常強大,在性能和準確率上優於同類的庫。後來,我了解到XGboost是由ACM班陳天奇學長開發的,霎時間就對學長充滿了敬仰。於是我就漸漸開始接觸機器學習系統的相關知識,並想在今後做一些機器學習系統的工作。在學習機器學習系統的相關知識時,僅僅讀一些論文,不僅會流於表面,而且也沒有太多的進步。在循序漸進的過程中,我發現學習不僅僅包含讀論文,更需要學習相關的基礎知識,看代碼,進行各方面的知識或能力的鞏固,扎紮實實,才能取得進步並在未來做出有用的工作。

論文#4: 

Parameter Hub:A Rack-Scale Parameter Server for Distributed Deep Neural Network Training

伯禹學堂:

https://www.boyuai.com/videos/10minspaper/AvHINHHNzoIYfyBjhl4yV

B站:

https://www.bilibili.com/video/av76587622

馮思遠 ,上海交大APEX實驗室、ACM班本科生,研究方向為machine learning system, urban data computing和reinforcement learning

 一種硬軟體結合的優化,大幅度降低了雲伺服器上分布式訓練的通信和同步消耗,大幅度提升了訓練速度。

隨著機器學習的不斷升溫,機器學習系統的需求也在不斷上升。從cpu到gpu到tpu/npu的變化在硬體層面大幅提升了訓練推理速度。另一方面,從sklearn到tensorflow pytorch再到現在的tvm,軟體層面也在不斷優化,不斷適配全新的硬體系統。我很榮幸能夠和天奇學長共事,一起推進tvm這個偉大的開源深度學習編譯器。在此期間我深刻感受到tvm在學術界工業界的廣泛影響力:無論是AWS, NVIDIA還是Alibaba,許多大廠都會密切關注tvm的最新動態。任何感興趣的feature和PR企業都會主動聯繫你。我之前實現了tvm對tensorcore的支持,就收到了多個大廠的郵件和實習邀請,甚至直接與阿里團隊展開了部分合作。我相信在未來的3-5年內,tvm依舊會是最熱門的深度學習編譯器。

論文#5 :

Ray:A Distributed Framework for Emerging  AI  Applications

伯禹學堂:

https://www.boyuai.com/videos/10minspaper/T46V7xNHqyer7nibSigJR

B站:

https://www.bilibili.com/video/av76587468

蔡亞星,上海交通大學APEX實驗室、ACM班本科生。

在此之前,沒有能有效支持訓練、服務、模擬緊密聯繫的通用用途的系統, 為了展現這些核心構件並滿足新興人工智慧應用的需求, Ray統一了actor和任務並行兩個編程模型。僅僅用了一個動態任務圖以及運用了一個由全局控制存儲系統以及自底向上分布式調度器支持的可拓展架構。系統評估方面展現了達到180萬個任務每秒的線性拓展性,以及可見的容錯性,和在幾個時下強化學習任務的顯著性能提升。

我選擇機器學習系統作為研究方向的原因是因為機器學習系統非常有趣。但是在做機器學習系統研究的過程中往往也會遇到很多問題,而且一些複雜困難的問題往往會令人束手無策,產生恐懼感。但是在解決問題的過程中,我明白了:不管我們遇到什麼困難都不要害怕,微笑著面對它!消除恐懼的最好辦法就是面對恐懼!堅持,才是勝利。加油!奧利給!

論文#6:  

Towards Federated Learning at Scale: System Design

伯禹學堂:

https://www.boyuai.com/videos/10minspaper/CwTMLz-cl_jAEogSl721z

B站:

https://www.bilibili.com/video/av76587958

錢蘇澄,上海交通大學APEX實驗室、ACM班本科生,研究興趣包括機器學習系統。

在人們隨身攜帶的行動裝置中,存儲了大量可被分析利用的用戶數據;在多樣的移動應用中,部署了個性化的推薦系統、輸入法單詞預測等基於數據的服務。這種機器學習任務的數據不是集中存儲在伺服器,而是分散在各行動裝置上,為學習系統的設計提出了新的挑戰。本文實現了基於 Federated Learning 算法的分布式機器學習系統,該分布式機器學習系統能夠靈活、高效、健壯地處理大量非集中存儲的數據。Federated Learning 將計算分散到行動裝置上,以此來應對數據的用戶隱私、所有權、和局域性等特點。該系統解決了諸多實際問題,已部署在大規模應用中。

TensorFlow機器學習框架、基本的系統知識。

論文#7: 

PipeDream:generalized pipeline parallelism for DNN training

伯禹學堂:

https://www.boyuai.com/videos/10minspaper/s5PLPemDOlNCgihJIGbf1

B站:

https://www.bilibili.com/video/av76588050


蘇起冬,上海交通大學APEX實驗室、ACM班本科生。

神經網絡的訓練是一個非常耗時的過程,如果使用並行化可以大大加快訓練速度。PipeDream利用流水線技術改進神經網絡並行計算,在不同的場景下相比原來的並行方法有了成倍的提升。

機器學習和人工智慧的大發展離不開基礎軟硬體的進步。正是硬體計算能力的提高,使大規模神經網絡的訓練成為了可能。優美的理論公式要落到實處,要成為真正可以改變人們生活的技術,必然需要可靠的高性能的系統作為支撐。而機器學習系統正是連接理論與現實的橋梁,非常有趣。正如任何一個計算機系的學生都要學習體系結構、作業系統一樣,機器學習系統對於對人工智慧感興趣的同學來說也非常重要。

知乎10mins文章的留言板,提出你想與大咖交流的問題或學習paper後的感想

我們會將留言與問題匯總整理給天奇老師哦~優質問題將有機會得到天奇老師的親自解答哦!

同時,留言集滿10個大拇指的同學,都將獲得伯禹ElitesAI系列課程大禮包哦~


掃描下方二維碼即可跳轉至知乎「伯禹人工智慧學院」陳天奇專題,快來留言板寫下你想交流的內容吧~


以上便是本期由上海交通大學APEX實驗室帶來的10 Mins Paper精彩分享。

同時,伯禹誠意邀請更多AI領域的優秀工作者來製作自己的10 Mins Paper,將自己的科研成果分享給更多的AI從業者與愛好者~

10 Mins Paper 是伯禹推出的共創、共享的人工智慧領域論文解讀系列。

——面向人工智慧方向的工業界學術界的學生和在職人員,旨在以視頻形式講解經典論文及前沿熱點的算法。方便大家以更高效的方式學習了解AI領域前沿論文,同時促進對論文的深入探討。

人工智慧領域的發展日新月異,伯禹希望通過高質量的短視頻講解,幫助大家快速了解前沿論文。

未來,我們希望聚集更多的AI領域學者,參與10 Mins Paper系列,產出更多優質視頻。我們加入了打賞功能與促進學術交流的討論區,希望構建人工智慧領域的論文學習交流社群。

boyuai.com/elites 或B站、知乎搜索「10 mins paper」

如果你有意向成為最強大腦中的一員,與大家分享解讀經典或前沿論文:

講者要求:高校人工智慧方向研究生/博士生  或 相關領域從業者   

請聯繫微信 @小魚在伯禹(添加好友時請標註:報名10 Mins講者)

相關焦點

  • 10 Mins Paper:斯坦福博後王鴻偉為你講解推薦系統經典論文
    10 Mins Paper是伯禹推出的共創、共享的人工智慧領域論文解讀系列。每一期我們邀請優秀的老師、學長,針對其研究領域,為大家挑選最值得一讀的經典/前沿論文。用10分鐘時間,為大家深入淺出地講解論文中的思想與方法,帶大家領略這一研究領域的獨特魅力。本期10 Mins Paper將由斯坦福博後王鴻偉及上海交通大學Apex實驗室學生為大家帶來,希望大家能夠從視頻中有所收穫。
  • 人物 | 陳天奇:機器學習科研的十年
    作者:陳天奇陳天奇,華盛頓大學計算機系博士生,研究方向為大規模機器學習。當然沒有如果,賭上了兩年半的時間的我留下的只是何時能夠發表論文的緊張心情。焦慮的我開始打算換一個方向,因為RBM當時有一個比較經典的文章應用在了推薦系統上,我開始接觸推薦系統和kddcup。比較幸運的是,這一次我並沒有把RBM作為唯一的一個方法,而是更加廣泛地去看了推薦系統中的矩陣分解類的算法,並且在實驗室搭建了一個比較泛用的矩陣分解系統。
  • 內附2.75G視頻講解
    內附2.75G視頻講解作為一個合格的建築工程人來說,三維圖集在日常工作中就很常見,主要為施工人員提供標準的建築做法和設計,很多剛入行包括已經入行很多年的老師傅來說2.75G高清視頻講解今天扛把子給各位工程人整理了16G101建築三維圖集和能夠支持在線編輯的CAD
  • 【訪談】人物專訪——陳天奇
  • 陳天奇:機器學習科研的十年
    機器之心轉載作者:陳天奇陳天奇是機器學習領域著名的青年華人學者之一,本科畢業於上海交通大學ACM班,博士畢業於華盛頓大學計算機系,研究方向為大規模機器學習。上個月,陳天奇在Twitter上宣布自己將於2020年秋季加入CMU任助理教授,成為加入CMU的年輕華人學者之一。
  • 陳天奇回憶--機器學習科研的十年
    ★,與你不見不散本文轉載於陳天奇知乎,點擊原文跳轉知乎原文連結剛剛,陳天奇在知乎上發帖回憶了他自己的十年科研歷程!這個方向有一個經典的方案GK-sketch的論文,但是只能夠解決數據點沒有權重的情況。經過一兩天的推導,我在一次去爬山的路上終於把結論推廣到了有權重的情況。有趣的是新的證明比起原來的證明看起來簡單很多。這個結論沒有單獨發表,但是後來意想不到地被用到了分布式XGBoost算法中,證明也收錄在了XGboost文章的附錄中。
  • 陳天奇明年將加入CMU出任助理教授
    華盛頓大學博士生、SAMPL Lab和MODE Lab成員陳天奇,今天在推特上宣布,將於明年秋天加入卡內基梅隆大學(CMU),擔任助理教授。陳天奇在AI領域有諸多貢獻,他參與構建了三個廣為使用的機器學習系統,包括:TVM、XGBoost以及Apache MXNet。2012年,陳天奇還曾獲得KDDCup的冠軍。
  • BIM-Civil 3D2020軟體+內附視頻+講義,免費領
    BIM-Civil 3D2020軟體+內附視頻+講義,免費領Autodesk Civil 3D 2020是一款專業實用的土木工程設計軟體,可以幫助用戶提供道路建模、勘測、管道設計、標註等豐富的設計與建模工具,非常的給力實用。它是活躍在土木工程領域的任何人的首選軟體,以使你的工作效率更加高效。
  • 伴讀課堂 經典繪本The Three Bears (附獨家音頻講解)
    寶莉家伴讀課堂微信群已滿100人,如需加入,請添加微信號lw1986911,寶莉爹會拉你入群,一起討論與繪本和親子共讀相關的話題。1、閱讀需要時間的積累和習慣的培養。不要因為孩子不喜歡一本書,就認為孩子不愛讀書。不要因為孩子注意力不夠專注,就不給孩子讀書。
  • 陳天奇將於2020年加入CMU任助理教授
    6月17日消息,據報導,陳天奇他將於2020年秋季加入CMU任助理教授,成為加入CMU的年輕華人學者之一。陳天奇是機器學習領域著名的青年華人學者之一,本科畢業於上海交通大學ACM班,博士畢業於華盛頓大學計算機系,研究方向為大規模機器學習。
  • 小學必考英語單選題(四):反身代詞及10個必考詞組 附視頻講解
    look after oneself 自理;照顧自己lose oneself in 陶醉於…;沉浸於… dress oneself 自己穿衣服introduce oneself 介紹自己 for oneself 為自己
  • 小學英語常考100道選擇(5):exciting和excited區別 附視頻講解
    現在MissAngela就為各位孩子們進行解析。第一題,我們要選的形容詞是要形容「running race」,是一個物體,所以用「exciting」。第二個空,形容詞是要形容「All the students」,是人,所以用「excited」,選B。
  • 震撼來襲 | 人工智慧Paper精讀班,視頻講解+代碼實現(還剩28個名額)
    不僅如此,我們針對每篇論文的帶學節奏和同學們的閱讀節奏,設計了符合我們平時看論文習慣的節奏和模式,一周一篇,每周為一個完整的學習周,每一篇論文都對應一位導師進行精講通過觀看錄播視頻,讓我們對論文有個概貌性的認識,讓我們對論文一周內容有大概的安排在研究論文之前,我們需要對論文有大概的理解
  • 380條講解視頻,6大學習版塊,23位書法高考教學名師陪你一起,為藝術戰
    為適應當前書法高考的學習、應考需要,上海書畫出版社特邀各培訓機構學校教師,共同編撰《書法高考名師名帖技法解析》一書,為考生的學習、創作水平提供幫助。打破書法高考學習壁壘!名師名帖圖文+視頻詳解!通過遴選,在全國範圍內確定了23位具有豐富經驗的培訓機構教師示範講解。23位代表當今書法高考的教學水平的書法老師,通過文字、圖片、視頻三方面的講解,為書法考生提供了全面、專業的教學指導。
  • 幾何形體 | 圓錐結構素描步驟圖講解(附視頻)
    加速版 | 結尾附完整的繪畫視頻 步驟分析 今天主要講解一個幾何石膏體圓錐的結構素描,它的組成是由三角形和橢圓兩個形狀。
  • 網盤網課資源共享:【經典小藍本視頻韓老師講解】高清完整
    低價好課 資源共享:【經典小藍本視頻韓老師講解
  • 資料|陳天奇介紹Xgboost原理的PPT
    from=leiphonecolumn_res0929【 圖片來源:https://xgboost.apachecn.org/所有者:https://xgboost.apachecn.org/ 】內容簡介陳天奇介紹Xgboost原理的PPT,用於學習xgboost原理。XGBoost是一個優化的分布式梯度增強庫,旨在實現高效,靈活和便攜。
  • 天王星 基礎入門知識 By 國家地理,附視頻詳盡解釋
    給娃看:星星 基礎入門知識 Stars By 國家地理,附視頻詳盡解釋月球 基礎入門知識 By 國家地理,附視頻詳盡解釋天王星 基礎入門知識 By 國家地理,附視頻詳盡解釋Uranus is a planet beyond convention.
  • 陳天奇:十年機器學習科研之路(附連結)
    當然沒有如果,當時賭上了兩年半時間的我留下的只是何時能夠發表論文的緊張心情。焦慮的我開始打算換一個方向,因為RBM當時有一個比較經典的文章應用在了推薦系統上,我開始接觸推薦系統和KDDcup。比較幸運的是,這一次我並沒有把RBM作為唯一的一個方法,而是更加廣泛地去看了推薦系統中的矩陣分解類的算法,並且在實驗室搭建了一個比較泛用的矩陣分解系統。
  • 幾何形體 | 四稜錐結構素描步驟圖講解(附視頻)
    加速版 | 結尾附完整的繪畫視頻 步驟分析 今天講解一個幾何石膏體四稜錐的結構素描,它的繪畫和之前的三稜錐結構素描基本一致。建議先觀看上方的加速版視頻對作畫過程有一個大致的了解。