tensorflow極速入門

2021-01-09 雷鋒網

一、前言

目前,深度學習已經廣泛應用於各個領域,比如圖像識別,圖形定位與檢測,語音識別,機器翻譯等等,對於這個神奇的領域,很多童鞋想要一探究竟,這裡拋磚引玉的簡單介紹下最火的深度學習開源框架 tensorflow。本教程不是 cookbook,所以不會將所有的東西都事無巨細的講到,所有的示例都將使用 python。

那麼本篇教程會講到什麼?首先是一些基礎概念,包括計算圖,graph 與 session,基礎數據結構,Variable,placeholder 與 feed_dict 以及使用它們時需要注意的點。最後給出了在 tensorflow 中建立一個機器學習模型步驟,並用一個手寫數字識別的例子進行演示。

1、 tensorflow是什麼?

tensorflow 是 google 開源的機器學習工具,在2015年11月其實現正式開源,開源協議Apache 2.0。

下圖是 query 詞頻時序圖,從中可以看出 tensorflow 的火爆程度。

2、 why tensorflow?

Tensorflow 擁有易用的 python 接口,而且可以部署在一臺或多臺 cpu , gpu 上,兼容多個平臺,包括但不限於 安卓/windows/linux 等等平臺上,而且擁有 tensorboard這種可視化工具,可以使用 checkpoint 進行實驗管理,得益於圖計算,它可以進行自動微分計算,擁有龐大的社區,而且很多優秀的項目已經使用 tensorflow 進行開發了。

3、 易用的tensorflow工具

如果不想去研究 tensorflow 繁雜的API,僅想快速的實現些什麼,可以使用其他高層工具。比如 tf.contrib.learn,tf.contrib.slim,Keras 等,它們都提供了高層封裝。這裡是 tflearn 的樣例集(github連結 https://github.com/tflearn/tflearn/tree/master/examples)。

4、 tensorflow安裝

目前 tensorflow 的安裝已經十分方便,有興趣可以參考官方文檔 (https://www.tensorflow.org/get_started/os_setup)。

二、 tensorflow基礎

實際上編寫tensorflow可以總結為兩步.

(1)組裝一個graph;(2)使用session去執行graph中的operation。

因此我們從 graph 與 session 說起。

1、 graph與session

(1)計算圖

Tensorflow 是基於計算圖的框架,因此理解 graph 與 session 顯得尤為重要。不過在講解 graph 與 session 之前首先介紹下什麼是計算圖。假設我們有這樣一個需要計算的表達式。該表達式包括了兩個加法與一個乘法,為了更好講述引入中間變量c與d。由此該表達式可以表示為:

當需要計算e時就需要計算c與d,而計算c就需要計算a與b,計算d需要計算b。這樣就形成了依賴關係。這種有向無環圖就叫做計算圖,因為對於圖中的每一個節點其微分都很容易得出,因此應用鏈式法則求得一個複雜的表達式的導數就成為可能,所以它會應用在類似tensorflow這種需要應用反向傳播算法的框架中。

(2)概念說明

下面是 graph , session , operation , tensor 四個概念的簡介。

Tensor:類型化的多維數組,圖的邊;

Operation:執行計算的單元,圖的節點;

Graph:一張有邊與點的圖,其表示了需要進行計算的任務;

Session:稱之為會話的上下文,用於執行圖。

Graph僅僅定義了所有 operation 與 tensor 流向,沒有進行任何計算。而session根據 graph 的定義分配資源,計算 operation,得出結果。既然是圖就會有點與邊,在圖計算中 operation 就是點而 tensor 就是邊。Operation 可以是加減乘除等數學運算,也可以是各種各樣的優化算法。每個 operation 都會有零個或多個輸入,零個或多個輸出。 tensor 就是其輸入與輸出,其可以表示一維二維多維向量或者常量。而且除了Variables指向的 tensor 外所有的 tensor 在流入下一個節點後都不再保存。

(3)舉例

下面首先定義一個圖(其實沒有必要,tensorflow會默認定義一個),並做一些計算。

import tensorflow as tfgraph = tf.Graph()with graph.as_default():foo = tf.Variable(3,name='foo')bar = tf.Variable(2,name='bar')result = foo + barinitialize = tf.global_variables_initializer()

這段代碼,首先會載入tensorflow,定義一個graph類,並在這張圖上定義了foo與bar的兩個變量,最後對這個值求和,並初始化所有變量。其中,Variable是定義變量並賦予初值。讓我們看下result(下方代碼)。後面是輸出,可以看到並沒有輸出實際的結果,由此可見在定義圖的時候其實沒有進行任何實際的計算。

print(result) #Tensor("add:0", shape=(), dtype=int32)

下面定義一個session,並進行真正的計算。

with tf.Session(graph=graph) as sess:sess.run(initialize)res = sess.run(result)print(res) # 5

這段代碼中,定義了session,並在session中執行了真正的初始化,並且求得result的值並列印出來。可以看到,在session中產生了真正的計算,得出值為5。

下圖是該graph在tensorboard中的顯示。這張圖整體是一個graph,其中foo,bar,add這些節點都是operation,而foo和bar與add連接邊的就是tensor。當session運行result時,實際就是求得add這個operation流出的tensor值,那麼add的所有上遊節點都會進行計算,如果圖中有非add上遊節點(本例中沒有)那麼該節點將不會進行計算,這也是圖計算的優勢之一。

2、數據結構

Tensorflow的數據結構有著rank,shape,data types的概念,下面來分別講解。

(1)rank

Rank一般是指數據的維度,其與線性代數中的rank不是一個概念。其常用rank舉例如下。

(2)shape

Shape指tensor每個維度數據的個數,可以用python的list/tuple表示。下圖表示了rank,shape的關係。

(3)data type

Data type,是指單個數據的類型。常用DT_FLOAT,也就是32位的浮點數。下圖表示了所有的types。

3、 Variables

(1)介紹

當訓練模型時,需要使用Variables保存與更新參數。Variables會保存在內存當中,所有tensor一旦擁有Variables的指向就不會在session中丟失。其必須明確的初始化而且可以通過Saver保存到磁碟上。Variables可以通過Variables初始化。

weights = tf.Variable(tf.random_normal([784, 200], stddev=0.35),name="weights")biases = tf.Variable(tf.zeros([200]), name="biases")

其中,tf.random_normal是隨機生成一個正態分布的tensor,其shape是第一個參數,stddev是其標準差。tf.zeros是生成一個全零的tensor。之後將這個tensor的值賦值給Variable。

(2)初始化

實際在其初始化過程中做了很多的操作,比如初始化空間,賦初值(等價於tf.assign),並把Variable添加到graph中等操作。注意在計算前需要初始化所有的Variable。一般會在定義graph時定義global_variables_initializer,其會在session運算時初始化所有變量。

直接調用global_variables_initializer會初始化所有的Variable,如果僅想初始化部分Variable可以調用tf.variables_initializer。

Init_ab = tf.variables_initializer([a,b],name=」init_ab」)

Variables可以通過eval顯示其值,也可以通過assign進行賦值。Variables支持很多數學運算,具體可以參照官方文檔 (https://www.tensorflow.org/api_docs/python/math_ops/)。

(3)Variables與constant的區別

值得注意的是Variables與constant的區別。Constant一般是常量,可以被賦值給Variables,constant保存在graph中,如果graph重複載入那麼constant也會重複載入,其非常浪費資源,如非必要儘量不使用其保存大量數據。而Variables在每個session中都是單獨保存的,甚至可以單獨存在一個參數伺服器上。可以通過代碼觀察到constant實際是保存在graph中,具體如下。

const = tf.constant(1.0,name="constant")print(tf.get_default_graph().as_graph_def())

這裡第二行是列印出圖的定義,其輸出如下。

node {name: "constant"op: "Const"attr {key: "dtype"value {type: DT_FLOAT}}attr {key: "value"value {tensor {dtype: DT_FLOATtensor_shape {}float_val: 1.0}}}}versions {producer: 17}

(4)命名

另外一個值得注意的地方是儘量每一個變量都明確的命名,這樣易於管理命令空間,而且在導入模型的時候不會造成不同模型之間的命名衝突,這樣就可以在一張graph中容納很多個模型。

4、 placeholders與feed_dict

當我們定義一張graph時,有時候並不知道需要計算的值,比如模型的輸入數據,其只有在訓練與預測時才會有值。這時就需要placeholder與feed_dict的幫助。

定義一個placeholder,可以使用tf.placeholder(dtype,shape=None,name=None)函數。

foo = tf.placeholder(tf.int32,shape=[1],name='foo')bar = tf.constant(2,name='bar')result = foo + barwith tf.Session() as sess:print(sess.run(result))

在上面的代碼中,會拋出錯誤(InvalidArgumentError),因為計算result需要foo的具體值,而在代碼中並沒有給出。這時候需要將實際值賦給foo。最後一行修改如下。

print(sess.run(result,{foo:[3]}))

其中最後的dict就是一個feed_dict,一般會使用python讀入一些值後傳入,當使用minbatch的情況下,每次輸入的值都不同。

三、mnist識別實例

介紹了一些tensorflow基礎後,我們用一個完整的例子將這些串起來。

首先,需要下載數據集,mnist數據可以在Yann LeCun's website( http://yann.lecun.com/exdb/mnist/ )下載到,也可以通過如下兩行代碼得到。

from tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

該數據集中一共有55000個樣本,其中50000用於訓練,5000用於驗證。每個樣本分為X與y兩部分,其中X如下圖所示,是28*28的圖像,在使用時需要拉伸成784維的向量。

整體的X可以表示為。

y為X真實的類別,其數據可以看做如下圖的形式。因此,問題可以看成一個10分類的問題。

而本次演示所使用的模型為邏輯回歸,其可以表示為

用圖形可以表示為下圖,具體原理這裡不再闡述,更多細節參考 該連結 (http://tech.meituan.com/intro_to_logistic_regression.html)。

那麼 let’s coding。

當使用tensorflow進行graph構建時,大體可以分為五部分:

1、 為 輸入X與 輸出y 定義placeholder;2、定義權重W;3、定義模型結構;4、定義損失函數;5、定義優化算法。

首先導入需要的包,定義X與y的placeholder以及 W,b 的 Variables。其中None表示任意維度,一般是min-batch的 batch size。而 W 定義是 shape 為784,10,rank為2的Variable,b是shape為10,rank為1的Variable。

import tensorflow as tfx = tf.placeholder(tf.float32, [None, 784])y_ = tf.placeholder(tf.float32, [None, 10])W = tf.Variable(tf.zeros([784, 10]))b = tf.Variable(tf.zeros([10]))

之後是定義模型。x與W矩陣乘法後與b求和,經過softmax得到y。

y = tf.nn.softmax(tf.matmul(x, W) + b)

求邏輯回歸的損失函數,這裡使用了cross entropy,其公式可以表示為:

這裡的 cross entropy 取了均值。定義了學習步長為0.5,使用了梯度下降算法(GradientDescentOptimizer)最小化損失函數。不要忘記初始化 Variables。

cross_entropy=tf.reduce_mean(-tf.reduce_sum(y_*tf.log(y),reduction_indices=[1]))train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)init = tf.global_variables_initializer()

最後,我們的 graph 至此定義完畢,下面就可以進行真正的計算,包括初始化變量,輸入數據,並計算損失函數與利用優化算法更新參數。

with tf.Session() as sess:sess.run(init)for i in range(1000):batch_xs, batch_ys = mnist.train.next_batch(100)sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

其中,迭代了1000次,每次輸入了100個樣本。mnist.train.next_batch 就是生成下一個 batch 的數據,這裡知道它在幹什麼就可以。那麼訓練結果如何呢,需要進行評估。這裡使用單純的正確率,正確率是用取最大值索引是否相等的方式,因為正確的 label 最大值為1,而預測的 label 最大值為最大概率。

correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels}))

至此,我們開發了一個簡單的手寫數字識別模型。

總結

總結全文,我們首先介紹了 graph 與 session,並解釋了基礎數據結構,講解了一些Variable需要注意的地方並介紹了 placeholders 與 feed_dict 。最終以一個手寫數字識別的實例將這些點串起來,希望可以給想要入門的你一丟丟的幫助。

雷鋒網按:本文原載於Qunar技術沙龍,原作者已授權雷鋒網發布。作者孟曉龍,2016年加入Qunar,目前在去哪兒網機票事業部擔任算法工程師。熱衷於深度學習技術的探索,對新事物有著強烈的好奇心。雷鋒網

相關焦點

  • TensorFlow極速入門
    最後給出了在 tensorflow 中建立一個機器學習模型步驟,並用一個手寫數字識別的例子進行演示。1、tensorflow是什麼?tensorflow 是 google 開源的機器學習工具,在2015年11月其實現正式開源,開源協議Apache 2.0。
  • 入門TensorFlow2.0
    今天老師帶領我們入門TensorFlow2.0。至於tensorflow2.0是啥嘛,詳細的可以度娘一下。我簡述一下,就是一個end-to-end machine-Learning open source plantform(端對端的開源機器學習的平臺)。學習tensorflow需要引入tensor這個概念,tensor的漢語意思就是張量。
  • Tensorflow 全網最全學習資料匯總之Tensorflow 的入門與安裝【2】
    《TensorFlow極速入門》連結:http://www.leiphone.com/news/201702/vJpJqREn7EyoAd09.html本文介紹了 graph 與 session 等基本組件,解釋了 rank 和 shape 等基礎數據結構概念,講解了一些 variable 需要注意的地方並介紹了 placeholders 與 feed_dict
  • Tensorflow(入門)——Mnist分類問題
    最近開始向深度學習發展,學習深度學習自然要學習Tensorflow,而且它的中文社區非常活躍,課程強烈推薦龍龍老師的課。要學習深度學習,先從分類問題開始入門吧。在Tensorflow社區中,有個入門級的問題,就是Mnist數據集的分類問題。
  • tensorflow安裝教程
    tensorflow是谷歌開源的人工智慧庫,有最完善的生態支持。是進行人工智慧領域開發和科研的必備工具。本文在windows10下,藉助anacondaAnaconda安裝和使用,AkShare入門,安裝tensorflow2.0。
  • TensorFlow 2.0姿態估計快速入門
    這是有關如何在Linux上安裝、設置和測試 OpenPose的Tensorflow 2.0實現的快速入門教程。要進行測試請安裝Anaconda / Miniconda(Miciconda3)。步驟1:創建一個新的虛擬環境conda create — name AIMachine步驟2:激活您的虛擬環境conda activate AIMachine步驟3:安裝Pythonconda install python==3.7.6步驟4:安裝最新版本的Tensorflowconda
  • TensorFlow 攜手 NVIDIA,使用 TensorRT 優化 TensorFlow Serving...
    API at:localhost:8501 …$ curl -o /tmp/resnet/resnet_client.py https://raw.githubusercontent.com/tensorflow/serving/master/tensorflow_serving/example/resnet_client.py$ python
  • tensorflow和python的關係_tensorflow與pytorch的區別
    打開APP tensorflow和python的關係_tensorflow與pytorch的區別 網絡整理 發表於 2020-12-04 14:54:47
  • tensorflow能做什麼_tensorflow2.0和1.0區別
    打開APP tensorflow能做什麼_tensorflow2.0和1.0區別 網絡整理 發表於 2020-12-04 14:45:07
  • Tensorflow2.0極簡教程——極簡安裝
    CPU版本:pip版本不低於19.0的情況下:pip intsall tensorflowGPU版本:使用conda安裝(不要設置清華源):1. 先裝anaconda或者miniconda(參考教程)2.
  • 令人困惑的TensorFlow!
    我把這篇博文當作瓶中信寫給過去的自己:一篇我希望在學習之初能被給予的入門介紹。我希望這篇博文也能幫助到其他人。以往的教程缺少了那些內容?自 TensorFlow 發布的三年以來,其已然成為深度學習生態系統中的一塊基石。然而對於初學者來說,它可能並不直觀,特別是與 PyTorch 或 DyNet 這樣運行即定義的神經網絡庫相比。
  • 如何在AMD的GPU上運行TensorFlow?
    /tensorflow-1.8.0-cp35-cp35m-manylinux1_x86_64.whlpip3 install .如果是「設備映射器 (device mapper)」,這意味著「設備映射器」存儲驅動程序限制了圖像大小限制,此時你可以參考快速入門指南中關於更改存儲驅動程序的解決方案,連結如下: https://github.com/RadeonOpenCompute/ROCm-docker/blob/master/quick-start.md ▌實踐指南 1、圖像識別
  • 人工智慧學習入門之TensorFlow2.2版本安裝(Windows10)
    創建虛擬環境可以在CMD窗口裡面輸入如下命令來創建一個conda虛擬環境:conda create --name tensorflow python=3.7activate tensorflow進入環境就是激活環境的意思,此時可以看到提示符前面有所變化,前面多了一個虛擬環境名稱的內容。如下圖圈畫的內容。
  • 如何開始我的第一個人工智慧模型(tensorflow)
    安裝tensorflow大家都知道tensorflow是google開發的一款開源的深度學習編程框架,是當今最流行的深度學習開發框架,因此對有志於深度學習研究的小夥伴來說,tensorflow是當仁不讓的第一選擇。
  • 步履不停:TensorFlow 2.4新功能一覽!
    參數伺服器訓練教程           https://tensorflow.google.cn/tutorials/distribute/parameter_server_training    ClusterCoordinator           https://tensorflow.google.cn/api_docs/python
  • TensorFlow入門教程(一): 變量,圖與會話的基本用法
    在後面的時間裡我們會推出一系列的TensorFlow與PyTorch的入門教程, 希望大家多多轉發與關注.這些方法執行後, 將產生的 tensor 返回. 在 Python 語言中, 返回的 tensor 是 numpy ndarray對象; 在 C 和 C++ 語言中, 返回的 tensor 是tensorflow::Tensor實例.計算圖TensorFlow 程序通常被組織成一個構建階段和一個執行階段. 在構建階段, op 的執行步驟 被描述成一個圖.
  • 如何用一個Python示例入門TensorFlow?
    如果你使用 Anaconda 安裝 TensorFlow,可以按照以下步驟完成:通過運行命令來創建一個 conda 環境「tensorflow」。conda create -n tensorflow pip python=3.5通過命令激活創建的環境:activate tensorflow調用該命令來在你的環境中安裝 TensorFlow。
  • 如何提升Tensorflow服務性能
    您可能已經從標準的Tensorflow服務容器日誌中注意到:I external/org_tensorflow/tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2
  • TensorFlow發布JavaScript開發者的機器學習框架TensorFlow.js
    發布新的 TensorFlow 官方博客(http://blog.tensorflow.org/)與 TensorFlow YouTube 頻道;2. 面向 JavaScript 開發者的全新機器學習框架 TensorFlow.js;3.
  • TensorFlow 2入門指南,初學者必備!
    字幕組雙語原文:TensorFlowTensorflow v1難以使用和理解,因為它的Pythonic較少,但是隨著Keras發行的v2現在與Tensorflow.keras完全同步,它易於使用,易學且易於理解