【他山之石】愛不釋手的TensorFlow 小技巧及張量詮釋

2022-01-12 人工智慧前沿講習

收錄於話題 #他山之石 178個

「他山之石，可以攻玉」，站在巨人的肩膀才能看得更高，走得更遠。在科研的道路上，更需藉助東風才能更快前行。為此，我們特別搜集整理了一些實用的代碼連結，數據集，軟體，編程技巧等，開闢「他山之石」專欄，助你乘風破浪，一路奮勇向前，敬請關注。

本文分享自華為雲社區《【雲駐共創】愛不釋手的TensorFlow 小技巧及張量詮釋》，原文作者：小強鼓掌

地址：https://bbs.huaweicloud.com/blogs/302552

TensorFlow 是一個端到端開源機器學習平臺。它擁有一個全面而靈活的生態系統，其中包含各種工具、庫和社區資源，可助力研究人員推動先進機器學習技術的發展，並使開發者能夠輕鬆地構建和部署由機器學習提供支持的應用。它可以很好的支持深度學習的各種算法，可以支持多種計算平臺，系統穩定性較高。TensorFlow擁有多層級結構，可部署於各類伺服器、PC終端和網頁並支持GPU高性能數值計算。

TensorFlow是谷歌開源的第二代用於數字計算的軟體庫。TensorFlow 是一個端到端平臺，無論您是專家還是初學者，它都可以讓您輕鬆地構建和部署機器學習模型。它可以很好的支持深度學習的各種算法，但它的應用不局限於深度學習，可以支持多種計算平臺，系統穩定性較高。TensorFlow擁有多層級結構，可部署於各類伺服器、PC終端和網頁並支持GPU和TPU高性能數值計算，被廣泛應用於谷歌內部的產品開發和各領域的科學研究。靈活可擴展：TensorFlow在不同計算機上運行：小到智慧型手機，大到計算機集群都能擴展，可以立刻生成你的訓練模型。GPU：雖然TensorFlow在大型計算機集群的並行處理中，運行性能略低於CNTK，但是在個人機器使用場景中，會根據機器配置自動選擇CPU或GPU，更加友好與智能。多平臺：TensorFlow生成的模型，可以滿足更多使用者的需求。適用於Mac，Linux，Windows系統上開發。滿足開箱即用的模型使用概念。運算能力強：利用了DAG圖創建工作流圖，優化了計算過程。分布式：目前原生支持的分布式深度學習框架不多，只有 TensorFlow、CNTK、DeepLearning4J、MXNet 等。在單 GPU 的條件下，絕大多數深度學習框架都依賴於 cuDNN，因此只要硬體計算能力或者內存分配差異不大，最終訓練速度不會相差太大。但是對於大規模深度學習來說，巨大的數據量使得單機很難在有限的時間完成訓練。而TensorFlow支持分布式訓練。TensorFlow是由Tensor+Flow組成，Tensor即為張量，Flow為流動，名字的含義就是張量在流動。

tensorflow的數據讀入有三種方式：通過feeding的方式；通過管道（pipeline）的方式；直接讀取變量或常量中保存的數據。Datasets屬於上面提出的第二種方式，可以簡化數據輸入過程，而且能夠提高數據的讀入效率。TextLineDataset：從文本文件中讀取行；TFRecordDataset：讀取TFRecord文件；FixedLengthRecordDataset：從二進位文件讀取固定大小的記錄；Iterator：提供一種一次訪問一個數據集元素的方法。對於Datasets的使用，我們可以使用Dataset的子類提供的方法，也可以直接使用基類的方法：tf.data.Dataset.from_tensors()或者tf.data.Dataset.from_tensor_slices()。Feature Columns實際上是一個數據結構，一個用於描述特徵的數據結構。利用Feature Columns可以很方便的對輸入訓練模型前的特徵進行處理。比如鳶尾花的識別，對於輸入數據，每列表示不同的特徵，如花瓣的長度，花萼的長度等等，我們想要對不同的列分別進行處理（或者對所有的列進行處理），使用Feature Columns就可以輕鬆的實現。Feature Columns形成了對輸入數據集的結構性描述。可以方便我們對每列數據進行處理，而且使得代碼的可讀性更強。想必大家對Keras已經比較了解了，使用Keras來構建一個神經網絡，簡直是飛一般地速度，而且完美的兼容tensorflow。simple_model=Sequential()simple_model.add(Dense(3,input_shape=(x.shape[1],),activation='relu',name='layer1'))simple_model.add(Dense(5,activation='relu',name='layer2'))simple_model.add(Dense(1,activation='sigmoid',name='layer3'))構建一個模型就是如上面這麼簡單，而且調用API中定義好的模型更是只需要一句話，極其的方便。相比於tensorflow原版的tf.train.Saver保存模型的方式，SavedModel提供了更好的將模型部署到生成環境的手段，更適用於商業目的。如上圖右下方部分，在使用SavedModel打包模型時，可以產生兩種模型：對應於第一種模型，Tensorflow Model Analysis可以方便我們對模型進行分析，是不是存在參數的問題，抑或是模型哪裡設計的不合適等等；通過分析後，感覺模型不錯，我們就可以通過Tensorflow Serving進行部署。此外，相比於Saver的方式，我們在inference時不需要再重新定義Graph（模型），如果使用Saver的話，在使用該模型時就需要再定義該模型，如果是一個程序猿設計並使用的還好，如果換成另一個猿去用這個模型，他又不知道模型的tensor的情況，那就尷尬了。所以使用SavedModel可以讓我們更輕鬆地去使用模型。使用Eager有什麼好處呢？回想之前我們在調試tensorflow的程序時，不得不使用sess.run()，麻煩的要死，而使用Eager就可以直接的將變量列印出來，大大方便了我們的調試；好處不止這麼多，在進行模型搭建的時候，以前我們需要仔細考慮下Tensor的shape，一旦出錯要定位也很不容易。而使用Eager可以一邊搭建網絡結構，一邊將shape列印出來確認下是否正確。這就使我們在搭建網絡時更加方面快捷了；此外，使用Eager後，自定義Operation和Gradient也會方便很多。下面舉個簡單的小例子。首先使用pip install tf-nightly（或GPU版本pip install tf-nightly-gpu）來安裝Eager。import tensorflow as tfimport tensorflow.contrib.eager as tfetfe.enable_eager_execution() #開啟Eager模式a = tf.constant([5], dtype=tf.int32)for i in range(a): print (i)

張量是TensorFlow的核心數據單位，在本質上是一個任意維的數組。張量可理解為一個 n 維矩陣，所有類型的數據，包括標量、矢量和矩陣等都是特殊類型的張量。3.2 TensorFlow 支持以下三種類型的張量：1. 常量constant：常量是其值不能改變的張量。2. 變量variable：當一個量在會話中的值需要更新時，使用變量來表示。例如，在神經網絡中，權重需要在訓練期間更新，可以通過將權重聲明為變量來實現。變量在使用前需要被顯示初始化。另外需要注意的是，常量存儲在計算圖的定義中，每次加載圖時都會加載相關變量。換句話說，它們是佔用內存的。另一方面，變量又是分開存儲的。它們可以存儲在參數伺服器上。3. 佔位符placeholder：用於將值輸入 TensorFlow 圖中。它們可以和 feed_dict 一起使用來輸入數據。在訓練神經網絡時，它們通常用於提供新的訓練樣本。在會話中運行計算圖時，可以為佔位符賦值。這樣在構建一個計算圖時不需要真正地輸入數據。需要注意的是，佔位符不包含任何數據，因此不需要初始化它們。階：在TensorFlow系統中，張量的維數來被描述為階.但是張量的階和矩陣的階並不是同一個概念.張量的階（有時是關於如順序或度數或者是n維）是張量維數的一個數量描述.比如，下面的張量（使用Python中list定義的）就是2階。t = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]你可以認為一個二階張量就是我們平常所說的矩陣，一階張量可以認為是一個向量.對於一個二階張量你可以用語句t[i, j]來訪問其中的任何元素.而對於三階張量你可以用t[i, j, k]來訪問其中的任何元素。

形狀：TensorFlow文檔中使用了三種記號來方便地描述張量的維度：階，形狀以及維數.下表展示了他們之間的關係：

形狀可以通過Python中的整數列表或元祖（int list或tuples）來表示，也或者用TensorShape class。數據類型：除了維度，Tensors有一個數據類型屬性.你可以為一個張量指定下列數據類型中的任意一個類型：

TensorFlow用張量這種數據結構來表示所有的數據。你可以把一個張量想像成一個n維的數組或列表。一個張量有一個靜態類型和動態類型的維數，張量可以在圖中的節點之間流通。就形成了TensorFlow 。TensorFlow易於理解，它的API保持著高度的一致性，這意味著在嘗試不同模型時，無需從頭學習一套新的東西。TensorFlow API很穩定，維護者始終在努力確保每次改動都向下兼容。TensorFlow與NumPy無縫集成，可使大多數了解Python的數據科學家如魚得水。不同於其他庫，TensorFlow不佔編譯時間。這就使用戶可快速驗證自己的想法，而省去了專門的等待時間。本文整理自華為雲社區內容共創活動之有哪些 TensorFlow 小技巧？什麼是張量 (tensor)？

本文目的在於學術交流，並不代表本公眾號贊同其觀點或對其內容真實性負責，版權歸原作者所有，如有侵權請告知刪除。

更多他山之石專欄文章，請點擊文章底部「閱讀原文」查看

分享、點讚、在看，給個三連擊唄！

【他山之石】愛不釋手的TensorFlow 小技巧及張量詮釋

相關焦點

深度學習 | 實戰:TensorFlow教程

TensorFlow 2.0 部署:TensorFlow Serving

TensorFlow調試程序介紹

Windows系統如何安裝Tensorflow Object Detection API

所有的Tensorflow模型都可以嵌入到行動裝置

深度學習框架(TensorFlow、keras、PyTorch)

TensorFlow 2.0 常用模塊3:tf.data

我的 TensorFlow 2.0 初體驗

Keras的標準化:TensorFlow 2.0中的高級api指南

步履不停:TensorFlow 2.4 新功能一覽!

詳解Tensorflow模型量化(Quantization)原理及其實現方法

【TensorFlow實戰筆記】遷移學習實戰--卷積神經網絡CNN-Inception-v3模型

教程 | TensorFlow 官方解讀:如何在多系統和網絡拓撲中構建高性能模型

TensorFlow 篇 | TensorFlow 數據輸入格式之 TFRecord

一個模型庫學習所有:谷歌開源模塊化深度學習系統Tensor2Tensor

TensorFlow Lite發布重大更新!支持移動GPU、推斷速度提升4-6倍

TensorFlow 2.0 模型:模型類的建立

谷歌開源最大手動注釋視頻數據集和 TensorFlow 模型性能調優工具

TensorFlow 安裝手冊 — 使用 pip 安裝 TensorFlow

TensorFlow Lite 深度解析 | 中文教學視頻

【他山之石】愛不釋手的TensorFlow 小技巧及張量詮釋

相關焦點

深度學習 | 實戰:TensorFlow教程

TensorFlow 2.0 部署:TensorFlow Serving

TensorFlow調試程序介紹

Windows系統如何安裝Tensorflow Object Detection API

所有的Tensorflow模型都可以嵌入到行動裝置

深度學習框架(TensorFlow、keras、PyTorch)

TensorFlow 2.0 常用模塊3:tf.data

我的 TensorFlow 2.0 初體驗

Keras的標準化:TensorFlow 2.0中的高級api指南

步履不停:TensorFlow 2.4 新功能一覽!

詳解Tensorflow模型量化(Quantization)原理及其實現方法

【TensorFlow實戰筆記】 遷移學習實戰--卷積神經網絡CNN-Inception-v3模型

教程 | TensorFlow 官方解讀:如何在多系統和網絡拓撲中構建高性能模型

TensorFlow 篇 | TensorFlow 數據輸入格式之 TFRecord

一個模型庫學習所有:谷歌開源模塊化深度學習系統Tensor2Tensor

TensorFlow Lite發布重大更新!支持移動GPU、推斷速度提升4-6倍

TensorFlow 2.0 模型:模型類的建立

谷歌開源最大手動注釋視頻數據集和 TensorFlow 模型性能調優工具

TensorFlow 安裝手冊 — 使用 pip 安裝 TensorFlow

TensorFlow Lite 深度解析 | 中文教學視頻

【TensorFlow實戰筆記】遷移學習實戰--卷積神經網絡CNN-Inception-v3模型