深度學習論文閱讀路線圖

2021-03-06 書圈

熱文導讀 | 點擊標題閱讀

哈佛學霸說:自制力極差的人該如何拯救?

哈佛研究: 長期太忙會變傻

放羊和砍柴的故事——他們的結局是這樣的……

翻譯:王軍福  

原文連結:https://github.com/songrotek/Deep-Learning-Papers-Reading-Roadmap 

如果你是深度學習領域的一名新手,可能會遇到的第一個問題是「應該從哪篇論文開始讀起呢?」

這裡給出了深度學習論文閱讀路線圖!

路線圖按照下面四個準則構建而成:

從提綱到細節

從經典到前沿

從通用領域到特定領域

專注於最先進的技術

你將會發現很多近期發表但是確實值得一讀的論文。

我們將持續不斷的給這條路線圖添加論文。

1.2 深度信念網絡(DBN) (深度學習開篇的裡程碑)

閱讀完上面這些論文後,通過對深度學習模型(包括CNN,RNN,LSTM)的基礎框架,以及深度學習如何應用於圖像和語音識別問題的理解,你將會對深度學習的歷史有一個基本的認識。下面的論文將帶你深入理解深度學習模型,深度學習在不同領域的應用和前沿。我們建議你根據自己的興趣和研究方向選擇下面的論文進行閱讀。

2.4RNN/ Sequence-to-Sequence模型

3.5機器翻譯

Some milestone papers are listed in RNN / Seq-to-Seq topic.

王軍福,北京理工大學,目標識別從業者。愛折騰,善實踐,對新鮮事物永葆一顆好奇的心。作為數據派新晉活躍分子,在Github知識分享與Kaggle數據實踐的道路上為喜歡數據的玩家挖掘有意思的新鮮事。

工作內容:需要一顆細緻的心,將選取好的外文文章翻譯成流暢的中文。如果你是數據科學/統計學/計算機類的留學生,或在海外從事相關工作,或對自己外語水平有信心的朋友歡迎加入翻譯小組。

你能得到:定期的翻譯培訓提高志願者的翻譯水平,提高對於數據科學前沿的認知,海外的朋友可以和國內技術應用發展保持聯繫,THU數據派產學研的背景為志願者帶來好的發展機遇。

其他福利:來自於名企的數據科學工作者,北大清華以及海外等名校學生他們都將成為你在翻譯小組的夥伴。

另一篇

圖解TensorFlow架構與設計

作者:劉光聰 

中興通訊高級系統架構師,專注機器學習算法,分布式系統架構與優化。 

 

  TensorFlow是什麼?  

TensorFlow基於數據流圖,用於大規模分布式數值計算的開源框架。節點表示某種抽象的計算,邊表示節點之間相互聯繫的張量。

計算圖實例

TensorFlow支持各種異構的平臺,支持多CPU/GPU,伺服器,行動裝置,具有良好的跨平臺的特性;TensorFlow架構靈活,能夠支持各種網絡模型,具有良好的通用性;此外,TensorFlow架構具有良好的可擴展性,對OP的擴展支持,Kernel特化方面表現出眾。

TensorFlow最初由Google大腦的研究員和工程師開發出來,用於機器學習和神經網絡方面的研究,於2015.10宣布開源,在眾多深度學習框架中脫穎而出,在Github上獲得了最多的Star量。

本文將闡述TensorFlow的系統架構,幫助讀者加深理解TensorFlow的工作機理。

本文假設讀者已經了解TensorFlow的基本編程模型,包括計算圖, OP, Tensor, Session等基本概念。

  系統概述  

TensorFlow的系統結構以C API為界,將整個系統分為「前端」和「後端」兩個子系統:

前端系統:提供編程模型,負責構造計算圖;

後端系統:提供運行時環境,負責執行計算圖。

TensorFlow系統架構

如上圖所示,重點關注系統中如下4個基本組件,它們是系統分布式運行機制的核心。

Client

Client是前端系統的主要組成部分,它是一個支持多語言的編程環境。它提供基於計算圖的編程模型,方便用戶構造各種複雜的計算圖,實現各種形式的模型設計。

Client通過Session為橋梁,連接TensorFlow後端的「運行時」,並啟動計算圖的執行過程。

Distributed Master

在分布式的運行時環境中,Distributed Master根據Session.run的Fetching參數,從計算圖中反向遍歷,找到所依賴的「最小子圖」。

然後,Distributed Master負責將該「子圖」再次分裂為多個「子圖片段」,以便在不同的進程和設備上運行這些「子圖片段」。

最後,Distributed Master將這些「子圖片段」派發給Work Service;隨後Work Service啟動「子圖片段」的執行過程。

Worker Service

對於每以個任務,TensorFlow都將啟動一個Worker Service。Worker Service將按照計算圖中節點之間的依賴關係,根據當前的可用的硬體環境(GPU/CPU),調用OP的Kernel實現完成OP的運算(一種典型的多態實現技術)。

另外,Worker Service還要負責將OP運算的結果發送到其他的Work Service;或者接受來自其他Worker Service發送給它的OP運算的結果。

Kernel Implements

Kernel是OP在某種硬體設備的特定實現,它負責執行OP的運算。

  組件交互  

組件交互

如上圖所示,假設存在兩個任務:

接下來,我們將進一步抽絲剝繭,逐漸挖掘出TensorFlow計算圖的運行機制。

  客戶端  

Client基於TensorFlow的編程接口,構造計算圖。目前,TensorFlow主流支持Python和C++的編程接口,並對其他程式語言接口的支持日益完善。

此時,TensorFlow並未執行任何計算。直至建立Session會話,並以Session為橋梁,建立Client與後端運行時的通道,將Protobuf格式的GraphDef發送至Distributed Master。

也就是說,當Client對OP結果進行求值時,將觸發Distributed Master的計算圖的執行過程。

如下圖所示,Client構建了一個簡單計算圖。它首先將w與x進行矩陣相乘,再與截距b按位相加,最後更新至s。

構造計算圖

  Distributed Master  

在分布式的運行時環境中,Distributed Master根據Session.run的Fetching參數,從計算圖中反向遍歷,找到所依賴的最小子圖。

然後Distributed Master負責將該子圖再次分裂為多個「子圖片段」,以便在不同的進程和設備上運行這些「子圖片段」。

最後,Distributed Master將這些圖片段派發給Work Service。隨後Work Service啟動「本地子圖」的執行過程。

Distributed Master將會緩存「子圖片段」,以便後續執行過程重複使用這些「子圖片段」,避免重複計算。

執行圖計算

如上圖所示,Distributed Master開始執行計算子圖。在執行之前,Distributed Master會實施一系列優化技術,例如「公共表達式消除」,「常量摺疊」等。隨後,Distributed Master負責任務集的協同,執行優化後的計算子圖。

  子圖片段  

子圖片段

如上圖所示,存在一種合理的「子圖片段」劃分算法。Distributed Master將模型參數相關的OP進行分組,並放置在PS任務上。其他OP則劃分為另外一組,放置在Worker任務上執行。

  SEND/RECV節點  

插入SEND/RECV節點

如上圖所示,如果計算圖的邊被任務節點分割,Distributed Master將負責將該邊進行分裂,在兩個分布式任務之間插入SEND和RECV節點,實現數據的傳遞。

隨後,Distributed Master將「子圖片段」派發給相應的任務中執行,在Worker Service成為「本地子圖」,它負責執行該子圖的上的OP。

  Worker Service  

對於每個任務,都將存在相應的Worker Service,它主要負責如下3個方面的職責:

處理來自Master的請求;

調度OP的Kernel實現,執行本地子圖;

協同任務之間的數據通信。

執行本地子圖

Worker Service派發OP到本地設備,執行Kernel的特定。它將盡最大可能地利用多CPU/GPU的處理能力,並發地執行Kernel實現。

另外,TensorFlow根據設備類型,對於設備間的SEND/RECV節點進行特化實現:

對於任務之間的數據傳遞,TensorFlow支持多協議,主要包括:

  Kernel Implements  

TensorFlow的運行時包含200多個標準的OP,包括數值計算,多維數組操作,控制流,狀態管理等。每一個OP根據設備類型都會存在一個優化了的Kernel實現。在運行時,運行時根據本地設備的類型,為OP選擇特定的Kernel實現,完成該OP的計算。

TensorFlow Core

其中,大多數Kernel基於Eigen::Tensor實現。Eigen::Tensor是一個使用C++模板技術,為多核CPU/GPU生成高效的並發代碼。但是,TensorFlow也可以靈活地直接使用cuDNN實現更高效的Kernel。

此外,TensorFlow實現了矢量化技術,使得在行動裝置,及其滿足高吞吐量,以數據為中心的應用需求,實現更高效的推理。

如果對於複合OP的子計算過程很難表示,或執行效率低下,TensorFlow甚至支持更高效的Kernle實現的註冊,其擴展性表現相當優越。

  技術棧  

最後,按照TensorFlow的軟體層次,通過一張表格羅列TensorFlow的技術棧,以便更清晰地對上述內容做一個簡單回顧。

TensorFlow技術棧

深度學習入門資料:

http://book.paddlepaddle.org/index.html

作者 | 圖文來自網絡、如涉及版權問題,請聯繫我們以便處理。文章內容純屬作者個人觀點,不代表本網觀點。

編輯 | 老貓

讀書吧 | QQ群:481160039

-END-

相關焦點

  • 不要上手就學深度學習!超詳細的人工智慧專家路線圖,GitHub數天獲2.1k星
    就這份 AI 專家路線圖而言,開發者列出了任何學習路徑所必不可少的一些要素,如論文和代碼、版本控制、語義化版本控制和更新日誌。但就具體選擇上,開發者認為在學習 AI 時不應直接過渡到當前熱門的技術——深度學習,而應步步為營,並提供了 3 條可供選擇的學習路徑:數據科學家→機器學習→深度學習…;數據科學家→數據工程師…;大數據工程師→…
  • 如何開啟深度學習論文的閱讀模式
    | 全文共4004字,建議閱讀時8分鐘 | 本文經機器之心(微信公眾號:almosthuman2014)授權轉載,禁止二次轉載選自:Medium作者:Nityesh Agarwal參與:劉曉坤、李亞洲在讀完書或者完成深度學習在線課程之後,如何才能繼續學習機器學習?
  • 如何科學開啟你的深度學習論文閱讀生涯
    大數據文摘出品編譯:睡不著的iris、Zhifu、Hope、CoolBoy當你閱讀了深度學習相關的書籍或者上過精彩的在線課程後,你將如何深入學習?如何才能夠「自力更生」,獨立地去了解相關領域中最新的研究進展?
  • 大盤點:Top100 深度學習論文+7 篇下載量最多的 AI 研究文章!
    從人臉識別到網頁新聞推薦,都有它的身影,而這些也離不開深度學習。深度學習從大量數據中學習樣本數據的內在規律,最終讓機器能夠像人一樣具有分析學習能力,能夠識別文字、圖像和聲音等,並在語音和圖像識別方面取得巨大的成果。
  • ​2018深度學習引用數最高的十大論文
    ,深度學習已經在諸多領域取得了令人印象深刻的突破。魯棒性的開源工具、雲計算以及大量可用的數據是深度學習能夠取得成功的重要基石。下面,我們列出2018年度十大深度學習論文:R., Joel V et al (2015) (Cited: 2,086)這篇論文開發一種被稱為深度「Q-網絡」的新型人工智慧體。利用最近在深度神經網絡訓練方面的進展,我們使用一種端到端強化學習策略,直接從高維的傳感輸入中學習成功的策略。此外,這種智能體已經在經典 Atari 2600 遊戲的一些挑戰性領域中的得到了測試。
  • 深度學習論文集錦(中英文對照):圖像分類、物體識別等
    新智元報導  來源:Github/SnailTyan作者:趙武文【新智元導讀】Github用戶SnailTyan在他構建的「深度學習論文翻譯論文譯介是新智元最受歡迎的內容之一,這非常好理解,如今幾乎每天都會新增幾十乃至幾百篇新的論文,其中不乏佳作,而新智元的任務則是將優秀論文和研究成果介紹給讀者。
  • 126篇殿堂級深度學習論文分類整理從入門到應用|乾貨
    如果你有非常大的決心從事深度學習,又不想在這一行打醬油,那麼研讀大牛論文將是不可避免的一步。而作為新人,你的第一個問題或許是:「論文那麼多,從哪一篇讀起?」本文將試圖解決這個問題——文章標題本來是:「從入門到絕望,無止境的深度學習論文」。請諸位備好道具,開啟頭懸梁錐刺股的學霸姿勢。開個玩笑。但對非科班出身的開發者而言,讀論文的確可以成為一件很痛苦的事。
  • 【深度學習】textCNN論文與原理
    如果CNN不是很了解的話,可以看看我之前的文章:【深度學習】卷積神經網絡-CNN簡單理論介紹[1] 、 【深度學習】卷積神經網絡-圖片分類案例(pytorch實現)[2],當然既然是一種深度學習方法進行文本分類,跑不了使用詞向量相關內容,所以讀者也是需要有一定詞向量(也就是詞語的一種分布式表示而已)的概念。
  • 學生閱讀,有了「路線圖」
    書店一角(資料圖)暑期閱讀「路線圖」數位化時代,深度閱讀被拋棄?2020年的疫情,讓越來越多的學生習慣於數位化閱讀帶來的「模糊把握」「割裂感」。深度閱讀難以成為現實,短內容、快資訊完全佔據閱讀習慣。「不管你接受與否,線上學習不可避免地降臨到眼前。」鄭希冰認為,首先家長可以把自己的閱讀感受真誠自然地分享給孩子。第二,倡導親子共讀。一旦孩子願意與家長共讀一本書,那麼,共讀與討論就有可能成為現實,深度閱讀之旅便有了開啟的希望。
  • 126篇殿堂級深度學習論文分類整理 從入門到應用 | 乾貨
    本文將試圖解決這個問題——文章標題本來是:「從入門到絕望,無止境的深度學習論文」。請諸位備好道具,開啟頭懸梁錐刺股的學霸姿勢。開個玩笑。但對非科班出身的開發者而言,讀論文的確可以成為一件很痛苦的事。但好消息來了——為避免初學者陷入迷途苦海,暱稱為 songrotek 的學霸在 GitHub 發布了他整理的深度學習路線圖,分門別類梳理了新入門者最需要學習的 DL 論文,又按重要程度給每篇論文打上星星。截至目前,這份 DL 論文路線圖已在 GitHub 收穫了近萬顆星星好評,人氣極高。
  • NIPS2018深度學習(18)|亮點: 貝葉斯深度學習;圖卷積(論文及代碼)
    Polytechnique Fédérale de Lausanne,RIKEN Center for AI Projecthttps://papers.nips.cc/paper/7862-slang-fast-structured-covariance-approximations-for-bayesian-deep-learning-with-natural-gradient.pdf在深度學習模型中
  • 一個中國孩子的英語學習路線圖:學得,更要習得
    兒子壯壯出生後,作者積極探索兒童英語啟蒙及後續學習的各種作法。檁子之前讀過她的著作《做孩子最好的英語學習規劃師》,她說:我記錄兒子的學習,一開始是作為媽媽的私人行為,後來由於個人興趣還有大家的鼓勵,越來越想達到一個專業的探討二語習得路線圖及其做法的高度,歡迎各位家長參與探討。關於英語學習,蓋兆泉提醒大家一定要區分學得和習得這兩個概念。
  • 7 papers|賈佳亞等人3D目標檢測新論文;美國20年AI技術路線圖
    機器之心整理參與:一鳴本周值得關注的論文主要有:賈佳亞等推出的利用點雲數據進行 3D 目標檢測新論文、美國 20 年人工智慧技術路線圖、目標檢測算法回顧,以及一些在變分自編碼器、神經架構搜索、目標函數、注意力機制可解釋性方面的研究。
  • 8篇論文深入學習深度估計:深度預測;自我運動學習;觀看《冰雪奇緣...
    深度估計是一種計算機視覺任務,旨在從2D圖像中估計深度。這個任務輸入RGB圖像,輸出深度圖。深度圖包含了從視圖看圖像中的被攝物體距離的信息。深度估計的應用包括:平滑圖像的模糊部分、更好地渲染3D場景、自動駕駛、機器人抓取、機器人輔助手術、電影中的2D到3D的自動轉換以及3D計算機圖形學中的陰影映射等。在這篇指南中,我們將介紹幾篇通過深度學習來解決這些問題的論文。
  • 技術路線圖繪製的實用技巧
    技術路線圖的繪製是研究生科研生涯中不可避免的工作。無論是組會匯報、開題/畢業答辯,還是文章發表、項目申報等都需要利用技術路線圖來展示我們的科研思路。設計良好的技術路線圖能使得他人輕鬆理解你想表達的意思,為答辯的順利通過及文章的發表奠定基礎。因此,技術路線圖的繪製必須引起我們足夠的重視,在此分享我關於技術路線圖繪製的心得,希望與其他小夥伴們共同學習與進步。
  • NIPS 2017 深度學習論文集錦 (2)
    本文是NIPS 2017 深度學習論文集錦第二篇,第一篇是NIPS 2017 深度學習論文集錦 (1)本文是對上文的續
  • 黑馬程式設計師史上最強JavaEE學習路線圖震撼發布!!!
    針對於如何更好地開展中級程式設計師培訓計劃,黑馬程式設計師引入了大批JavaEE名企技術專家加入研究院,組成百人的教研團隊,耗時24個月研發多領域深度項目課程,重磅推出2019全新的JavaEE中級程式設計師課程,其課程內容貫穿網際網路熱門行業,大量行業問題解決方案,與一線企業合作共建課程,保障項目契合企業剛需。
  • 重讀Youtube深度學習推薦系統論文,字字珠璣,驚為神文
    AI 前線導讀:2016 年,Youtube 發布了一篇深度推薦系統論文《Deep Neural Networks for YouTube Recommendations》,按照今天的標準來看,已經沒有什麼新穎的地方。
  • (免費下載)深度學習 Top100:近 5 年被引用次數最高論文
    重要的論文能夠超越其應用領域讓人獲益。新智元在每個領域都選擇了一篇論文重點介紹,這將是你縱覽深度學習研究絕好的開始。【文末有領取連結,可一鍵下載這份經典資料】這裡是100篇被引用次數最多的深度學習論文,從海量的相關論文中脫穎而出。無論其應用領域是什麼,都值得一讀,而在其各自的領域,它們是必讀之作。
  • 【資源】深度學習Top100:近5年被引用次數最高論文(下載)
    這裡是近5年100篇被引用次數最多的深度學習論文,覆蓋了優化/訓練方法、無監督/生成模型、卷積網絡模型和圖像分割/目標檢測等十大子領域。重要的論文能夠超越其應用領域讓人獲益。新智元在每個領域都選擇了一篇論文重點介紹,這將是你縱覽深度學習研究絕好的開始。這裡是100篇被引用次數最多的深度學習論文,從海量的相關論文中脫穎而出。