深度學習論文閱讀路線圖

2021-03-06 書圈

熱文導讀 | 點擊標題閱讀

哈佛學霸說：自制力極差的人該如何拯救？

哈佛研究：長期太忙會變傻

放羊和砍柴的故事——他們的結局是這樣的……

翻譯：王軍福

原文連結：https://github.com/songrotek/Deep-Learning-Papers-Reading-Roadmap

如果你是深度學習領域的一名新手，可能會遇到的第一個問題是「應該從哪篇論文開始讀起呢？」

這裡給出了深度學習論文閱讀路線圖！

路線圖按照下面四個準則構建而成：

從提綱到細節

從經典到前沿

從通用領域到特定領域

專注於最先進的技術

你將會發現很多近期發表但是確實值得一讀的論文。

我們將持續不斷的給這條路線圖添加論文。

1.2 深度信念網絡(DBN) (深度學習開篇的裡程碑)

閱讀完上面這些論文後，通過對深度學習模型（包括CNN，RNN，LSTM）的基礎框架，以及深度學習如何應用於圖像和語音識別問題的理解，你將會對深度學習的歷史有一個基本的認識。下面的論文將帶你深入理解深度學習模型，深度學習在不同領域的應用和前沿。我們建議你根據自己的興趣和研究方向選擇下面的論文進行閱讀。

2.4RNN/ Sequence-to-Sequence模型

3.5機器翻譯

Some milestone papers are listed in RNN / Seq-to-Seq topic.

王軍福，北京理工大學，目標識別從業者。愛折騰，善實踐，對新鮮事物永葆一顆好奇的心。作為數據派新晉活躍分子，在Github知識分享與Kaggle數據實踐的道路上為喜歡數據的玩家挖掘有意思的新鮮事。

工作內容：需要一顆細緻的心，將選取好的外文文章翻譯成流暢的中文。如果你是數據科學/統計學/計算機類的留學生，或在海外從事相關工作，或對自己外語水平有信心的朋友歡迎加入翻譯小組。

你能得到：定期的翻譯培訓提高志願者的翻譯水平，提高對於數據科學前沿的認知，海外的朋友可以和國內技術應用發展保持聯繫，THU數據派產學研的背景為志願者帶來好的發展機遇。

其他福利：來自於名企的數據科學工作者，北大清華以及海外等名校學生他們都將成為你在翻譯小組的夥伴。

另一篇

圖解TensorFlow架構與設計

作者：劉光聰

中興通訊高級系統架構師，專注機器學習算法，分布式系統架構與優化。

TensorFlow是什麼？

TensorFlow基於數據流圖，用於大規模分布式數值計算的開源框架。節點表示某種抽象的計算，邊表示節點之間相互聯繫的張量。

計算圖實例

TensorFlow支持各種異構的平臺，支持多CPU/GPU，伺服器，行動裝置，具有良好的跨平臺的特性；TensorFlow架構靈活，能夠支持各種網絡模型，具有良好的通用性；此外，TensorFlow架構具有良好的可擴展性，對OP的擴展支持，Kernel特化方面表現出眾。

TensorFlow最初由Google大腦的研究員和工程師開發出來，用於機器學習和神經網絡方面的研究，於2015.10宣布開源，在眾多深度學習框架中脫穎而出，在Github上獲得了最多的Star量。

本文將闡述TensorFlow的系統架構，幫助讀者加深理解TensorFlow的工作機理。

本文假設讀者已經了解TensorFlow的基本編程模型，包括計算圖, OP, Tensor, Session等基本概念。

系統概述

TensorFlow的系統結構以C API為界，將整個系統分為「前端」和「後端」兩個子系統：

前端系統：提供編程模型，負責構造計算圖；

後端系統：提供運行時環境，負責執行計算圖。

TensorFlow系統架構

如上圖所示，重點關注系統中如下4個基本組件，它們是系統分布式運行機制的核心。

Client

Client是前端系統的主要組成部分，它是一個支持多語言的編程環境。它提供基於計算圖的編程模型，方便用戶構造各種複雜的計算圖，實現各種形式的模型設計。

Client通過Session為橋梁，連接TensorFlow後端的「運行時」，並啟動計算圖的執行過程。

Distributed Master

在分布式的運行時環境中，Distributed Master根據Session.run的Fetching參數，從計算圖中反向遍歷，找到所依賴的「最小子圖」。

然後，Distributed Master負責將該「子圖」再次分裂為多個「子圖片段」，以便在不同的進程和設備上運行這些「子圖片段」。

最後，Distributed Master將這些「子圖片段」派發給Work Service；隨後Work Service啟動「子圖片段」的執行過程。

Worker Service

對於每以個任務，TensorFlow都將啟動一個Worker Service。Worker Service將按照計算圖中節點之間的依賴關係，根據當前的可用的硬體環境(GPU/CPU)，調用OP的Kernel實現完成OP的運算(一種典型的多態實現技術)。

另外，Worker Service還要負責將OP運算的結果發送到其他的Work Service；或者接受來自其他Worker Service發送給它的OP運算的結果。

Kernel Implements

Kernel是OP在某種硬體設備的特定實現，它負責執行OP的運算。

組件交互

組件交互

如上圖所示，假設存在兩個任務：

接下來，我們將進一步抽絲剝繭，逐漸挖掘出TensorFlow計算圖的運行機制。

客戶端

Client基於TensorFlow的編程接口，構造計算圖。目前，TensorFlow主流支持Python和C++的編程接口，並對其他程式語言接口的支持日益完善。

此時，TensorFlow並未執行任何計算。直至建立Session會話，並以Session為橋梁，建立Client與後端運行時的通道，將Protobuf格式的GraphDef發送至Distributed Master。

也就是說，當Client對OP結果進行求值時，將觸發Distributed Master的計算圖的執行過程。

如下圖所示，Client構建了一個簡單計算圖。它首先將w與x進行矩陣相乘，再與截距b按位相加，最後更新至s。

構造計算圖

Distributed Master

在分布式的運行時環境中，Distributed Master根據Session.run的Fetching參數，從計算圖中反向遍歷，找到所依賴的最小子圖。

然後Distributed Master負責將該子圖再次分裂為多個「子圖片段」，以便在不同的進程和設備上運行這些「子圖片段」。

最後，Distributed Master將這些圖片段派發給Work Service。隨後Work Service啟動「本地子圖」的執行過程。

Distributed Master將會緩存「子圖片段」，以便後續執行過程重複使用這些「子圖片段」，避免重複計算。

執行圖計算

如上圖所示，Distributed Master開始執行計算子圖。在執行之前，Distributed Master會實施一系列優化技術，例如「公共表達式消除」，「常量摺疊」等。隨後，Distributed Master負責任務集的協同，執行優化後的計算子圖。

子圖片段

子圖片段

如上圖所示，存在一種合理的「子圖片段」劃分算法。Distributed Master將模型參數相關的OP進行分組，並放置在PS任務上。其他OP則劃分為另外一組，放置在Worker任務上執行。

SEND/RECV節點

插入SEND/RECV節點

如上圖所示，如果計算圖的邊被任務節點分割，Distributed Master將負責將該邊進行分裂，在兩個分布式任務之間插入SEND和RECV節點，實現數據的傳遞。

隨後，Distributed Master將「子圖片段」派發給相應的任務中執行，在Worker Service成為「本地子圖」，它負責執行該子圖的上的OP。

Worker Service

對於每個任務，都將存在相應的Worker Service，它主要負責如下3個方面的職責：

處理來自Master的請求；

調度OP的Kernel實現，執行本地子圖；

協同任務之間的數據通信。

執行本地子圖

Worker Service派發OP到本地設備，執行Kernel的特定。它將盡最大可能地利用多CPU/GPU的處理能力，並發地執行Kernel實現。

另外，TensorFlow根據設備類型，對於設備間的SEND/RECV節點進行特化實現：

對於任務之間的數據傳遞，TensorFlow支持多協議，主要包括：

Kernel Implements

TensorFlow的運行時包含200多個標準的OP，包括數值計算，多維數組操作，控制流，狀態管理等。每一個OP根據設備類型都會存在一個優化了的Kernel實現。在運行時，運行時根據本地設備的類型，為OP選擇特定的Kernel實現，完成該OP的計算。

TensorFlow Core

其中，大多數Kernel基於Eigen::Tensor實現。Eigen::Tensor是一個使用C++模板技術，為多核CPU/GPU生成高效的並發代碼。但是，TensorFlow也可以靈活地直接使用cuDNN實現更高效的Kernel。

此外，TensorFlow實現了矢量化技術，使得在行動裝置，及其滿足高吞吐量，以數據為中心的應用需求，實現更高效的推理。

如果對於複合OP的子計算過程很難表示，或執行效率低下，TensorFlow甚至支持更高效的Kernle實現的註冊，其擴展性表現相當優越。

技術棧

最後，按照TensorFlow的軟體層次，通過一張表格羅列TensorFlow的技術棧，以便更清晰地對上述內容做一個簡單回顧。

TensorFlow技術棧

深度學習入門資料：

http://book.paddlepaddle.org/index.html

作者 | 圖文來自網絡、如涉及版權問題，請聯繫我們以便處理。文章內容純屬作者個人觀點，不代表本網觀點。

編輯 | 老貓

讀書吧 | QQ群：481160039

-END-

相關焦點

不要上手就學深度學習!超詳細的人工智慧專家路線圖,GitHub數天獲2.1k星

就這份 AI 專家路線圖而言，開發者列出了任何學習路徑所必不可少的一些要素，如論文和代碼、版本控制、語義化版本控制和更新日誌。但就具體選擇上，開發者認為在學習 AI 時不應直接過渡到當前熱門的技術——深度學習，而應步步為營，並提供了 3 條可供選擇的學習路徑：數據科學家→機器學習→深度學習…；數據科學家→數據工程師…；大數據工程師→…
如何開啟深度學習論文的閱讀模式

| 全文共4004字，建議閱讀時8分鐘 | 本文經機器之心（微信公眾號：almosthuman2014）授權轉載，禁止二次轉載選自：Medium作者：Nityesh Agarwal參與：劉曉坤、李亞洲在讀完書或者完成深度學習在線課程之後，如何才能繼續學習機器學習？
如何科學開啟你的深度學習論文閱讀生涯

大數據文摘出品編譯：睡不著的iris、Zhifu、Hope、CoolBoy當你閱讀了深度學習相關的書籍或者上過精彩的在線課程後，你將如何深入學習？如何才能夠「自力更生」，獨立地去了解相關領域中最新的研究進展？
大盤點:Top100 深度學習論文+7 篇下載量最多的 AI 研究文章!

從人臉識別到網頁新聞推薦，都有它的身影，而這些也離不開深度學習。深度學習從大量數據中學習樣本數據的內在規律，最終讓機器能夠像人一樣具有分析學習能力，能夠識別文字、圖像和聲音等，並在語音和圖像識別方面取得巨大的成果。
2018深度學習引用數最高的十大論文

，深度學習已經在諸多領域取得了令人印象深刻的突破。魯棒性的開源工具、雲計算以及大量可用的數據是深度學習能夠取得成功的重要基石。下面，我們列出2018年度十大深度學習論文：R., Joel V et al (2015) (Cited: 2,086)這篇論文開發一種被稱為深度「Q-網絡」的新型人工智慧體。利用最近在深度神經網絡訓練方面的進展，我們使用一種端到端強化學習策略，直接從高維的傳感輸入中學習成功的策略。此外，這種智能體已經在經典 Atari 2600 遊戲的一些挑戰性領域中的得到了測試。
深度學習論文集錦(中英文對照):圖像分類、物體識別等

新智元報導來源：Github/SnailTyan作者：趙武文【新智元導讀】Github用戶SnailTyan在他構建的「深度學習論文翻譯論文譯介是新智元最受歡迎的內容之一，這非常好理解，如今幾乎每天都會新增幾十乃至幾百篇新的論文，其中不乏佳作，而新智元的任務則是將優秀論文和研究成果介紹給讀者。
126篇殿堂級深度學習論文分類整理從入門到應用|乾貨

如果你有非常大的決心從事深度學習，又不想在這一行打醬油，那麼研讀大牛論文將是不可避免的一步。而作為新人，你的第一個問題或許是：「論文那麼多，從哪一篇讀起？」本文將試圖解決這個問題——文章標題本來是：「從入門到絕望，無止境的深度學習論文」。請諸位備好道具，開啟頭懸梁錐刺股的學霸姿勢。開個玩笑。但對非科班出身的開發者而言，讀論文的確可以成為一件很痛苦的事。
【深度學習】textCNN論文與原理

如果CNN不是很了解的話，可以看看我之前的文章：【深度學習】卷積神經網絡-CNN簡單理論介紹[1] 、【深度學習】卷積神經網絡-圖片分類案例(pytorch實現)[2]，當然既然是一種深度學習方法進行文本分類，跑不了使用詞向量相關內容，所以讀者也是需要有一定詞向量(也就是詞語的一種分布式表示而已)的概念。
學生閱讀，有了「路線圖」

書店一角（資料圖）暑期閱讀「路線圖」數位化時代，深度閱讀被拋棄？2020年的疫情，讓越來越多的學生習慣於數位化閱讀帶來的「模糊把握」「割裂感」。深度閱讀難以成為現實，短內容、快資訊完全佔據閱讀習慣。「不管你接受與否，線上學習不可避免地降臨到眼前。」鄭希冰認為，首先家長可以把自己的閱讀感受真誠自然地分享給孩子。第二，倡導親子共讀。一旦孩子願意與家長共讀一本書，那麼，共讀與討論就有可能成為現實，深度閱讀之旅便有了開啟的希望。
126篇殿堂級深度學習論文分類整理從入門到應用 | 乾貨

本文將試圖解決這個問題——文章標題本來是：「從入門到絕望，無止境的深度學習論文」。請諸位備好道具，開啟頭懸梁錐刺股的學霸姿勢。開個玩笑。但對非科班出身的開發者而言，讀論文的確可以成為一件很痛苦的事。但好消息來了——為避免初學者陷入迷途苦海，暱稱為 songrotek 的學霸在 GitHub 發布了他整理的深度學習路線圖，分門別類梳理了新入門者最需要學習的 DL 論文，又按重要程度給每篇論文打上星星。截至目前，這份 DL 論文路線圖已在 GitHub 收穫了近萬顆星星好評，人氣極高。
NIPS2018深度學習(18)|亮點: 貝葉斯深度學習;圖卷積(論文及代碼)

Polytechnique Fédérale de Lausanne，RIKEN Center for AI Projecthttps://papers.nips.cc/paper/7862-slang-fast-structured-covariance-approximations-for-bayesian-deep-learning-with-natural-gradient.pdf在深度學習模型中
一個中國孩子的英語學習路線圖:學得,更要習得

兒子壯壯出生後，作者積極探索兒童英語啟蒙及後續學習的各種作法。檁子之前讀過她的著作《做孩子最好的英語學習規劃師》，她說：我記錄兒子的學習，一開始是作為媽媽的私人行為，後來由於個人興趣還有大家的鼓勵，越來越想達到一個專業的探討二語習得路線圖及其做法的高度，歡迎各位家長參與探討。關於英語學習，蓋兆泉提醒大家一定要區分學得和習得這兩個概念。
7 papers|賈佳亞等人3D目標檢測新論文;美國20年AI技術路線圖

機器之心整理參與：一鳴本周值得關注的論文主要有：賈佳亞等推出的利用點雲數據進行 3D 目標檢測新論文、美國 20 年人工智慧技術路線圖、目標檢測算法回顧，以及一些在變分自編碼器、神經架構搜索、目標函數、注意力機制可解釋性方面的研究。
8篇論文深入學習深度估計:深度預測;自我運動學習;觀看《冰雪奇緣...

深度估計是一種計算機視覺任務，旨在從2D圖像中估計深度。這個任務輸入RGB圖像，輸出深度圖。深度圖包含了從視圖看圖像中的被攝物體距離的信息。深度估計的應用包括：平滑圖像的模糊部分、更好地渲染3D場景、自動駕駛、機器人抓取、機器人輔助手術、電影中的2D到3D的自動轉換以及3D計算機圖形學中的陰影映射等。在這篇指南中，我們將介紹幾篇通過深度學習來解決這些問題的論文。
技術路線圖繪製的實用技巧

技術路線圖的繪製是研究生科研生涯中不可避免的工作。無論是組會匯報、開題/畢業答辯，還是文章發表、項目申報等都需要利用技術路線圖來展示我們的科研思路。設計良好的技術路線圖能使得他人輕鬆理解你想表達的意思，為答辯的順利通過及文章的發表奠定基礎。因此，技術路線圖的繪製必須引起我們足夠的重視，在此分享我關於技術路線圖繪製的心得，希望與其他小夥伴們共同學習與進步。
NIPS 2017 深度學習論文集錦 (2)

本文是NIPS 2017 深度學習論文集錦第二篇，第一篇是NIPS 2017 深度學習論文集錦 (1)本文是對上文的續
黑馬程式設計師史上最強JavaEE學習路線圖震撼發布!!!

針對於如何更好地開展中級程式設計師培訓計劃，黑馬程式設計師引入了大批JavaEE名企技術專家加入研究院，組成百人的教研團隊，耗時24個月研發多領域深度項目課程，重磅推出2019全新的JavaEE中級程式設計師課程，其課程內容貫穿網際網路熱門行業，大量行業問題解決方案，與一線企業合作共建課程，保障項目契合企業剛需。
重讀Youtube深度學習推薦系統論文,字字珠璣,驚為神文

AI 前線導讀：2016 年，Youtube 發布了一篇深度推薦系統論文《Deep Neural Networks for YouTube Recommendations》，按照今天的標準來看，已經沒有什麼新穎的地方。
(免費下載)深度學習 Top100:近 5 年被引用次數最高論文

重要的論文能夠超越其應用領域讓人獲益。新智元在每個領域都選擇了一篇論文重點介紹，這將是你縱覽深度學習研究絕好的開始。【文末有領取連結，可一鍵下載這份經典資料】這裡是100篇被引用次數最多的深度學習論文，從海量的相關論文中脫穎而出。無論其應用領域是什麼，都值得一讀，而在其各自的領域，它們是必讀之作。
【資源】深度學習Top100:近5年被引用次數最高論文(下載)

這裡是近5年100篇被引用次數最多的深度學習論文，覆蓋了優化/訓練方法、無監督/生成模型、卷積網絡模型和圖像分割/目標檢測等十大子領域。重要的論文能夠超越其應用領域讓人獲益。新智元在每個領域都選擇了一篇論文重點介紹，這將是你縱覽深度學習研究絕好的開始。這裡是100篇被引用次數最多的深度學習論文，從海量的相關論文中脫穎而出。

深度學習論文閱讀路線圖

相關焦點

不要上手就學深度學習!超詳細的人工智慧專家路線圖,GitHub數天獲2.1k星

如何開啟深度學習論文的閱讀模式

如何科學開啟你的深度學習論文閱讀生涯

大盤點:Top100 深度學習論文+7 篇下載量最多的 AI 研究文章!

​2018深度學習引用數最高的十大論文

深度學習論文集錦(中英文對照):圖像分類、物體識別等

126篇殿堂級深度學習論文分類整理從入門到應用|乾貨

【深度學習】textCNN論文與原理

學生閱讀，有了「路線圖」

126篇殿堂級深度學習論文分類整理 從入門到應用 | 乾貨

NIPS2018深度學習(18)|亮點: 貝葉斯深度學習;圖卷積(論文及代碼)

一個中國孩子的英語學習路線圖:學得,更要習得

7 papers|賈佳亞等人3D目標檢測新論文;美國20年AI技術路線圖

8篇論文深入學習深度估計:深度預測;自我運動學習;觀看《冰雪奇緣...

技術路線圖繪製的實用技巧

NIPS 2017 深度學習論文集錦 (2)

黑馬程式設計師史上最強JavaEE學習路線圖震撼發布!!!

重讀Youtube深度學習推薦系統論文,字字珠璣,驚為神文

(免費下載)深度學習 Top100:近 5 年被引用次數最高論文

【資源】深度學習Top100:近5年被引用次數最高論文(下載)

2018深度學習引用數最高的十大論文

126篇殿堂級深度學習論文分類整理從入門到應用 | 乾貨