2.2版本發布!TensorFlow推出開發者技能證書

2021-01-10 AI科技大本營

作者 | 彎月

受 COVID-19 的影響,今年的 TensorFlow 開發者大會於2020年3月12日(北京時間)凌晨以線上直播的方式與全球開發者見面。

Google決定開源TensorFlow是為了讓每個開發人員和研究人員都能方便地使用人工智慧來解決多樣化的現實問題。自開源以來,TensorFlow的下載次數超過了760萬次,提交次數高達8萬次,拉取請求13萬餘次,貢獻者2400多名。

對 TensorFlow 來說,2019年是激動人心的一年。去年,Google先後推出了TensorFlow 2.2 和數個產品更新,在11個不同國家/地區舉辦全球路演,並召開了首屆TensorFlow開發者大會和TensorFlow World。

TensorFlow 2.2 發布

2019年,Google推出了TensorFlow 2.0,這是該平臺發展的一個重要的裡程碑。TensorFlow 2.0的幾大亮點包括:

專注於簡單性和易用性,大大簡化API方便開發人員使用Keras 和 eager execution 輕鬆構建模型提高TensorFlow Lite 和 TensorFlow.js 部署模型的能力隨後,Google根據社區的反饋:性能有待提升;從1.0移植2.0的難度過高,推出了TensorFlow 2.2。該版本強調性能,與生態系統的兼容性,以及核心庫的穩定性。

TensorFlow生態系統

TensorFlow 建立了強大的生態系統,包含各類庫、擴展以及工具,能夠滿足研究人員和開發人員實現端到端機器學習模型的各種需求。

對於研究人員,TensorFlow提供了最尖端的機器學習研究模型,例如T5模型可實現語音到文本的轉換。

產品開發人員可結合使用TensorFlow與Keras等工具構建各種應用產品。TensorFlow Hub提供大量預訓練模型。Google還推出端到端的AI雲平臺,從創意到發布,只需輕輕單擊滑鼠即可完成所有部署。

此外,開發人員可以利用TensorFlow Lite等工具輕鬆將機器學習模型部署到各種設備上。

NLP

隨著圖像識別領域的爆發式增長,近年來NLP領域的進展也是有目共睹,在大量的工具和模型的推動下,NLP的能力已超越了人類。

TensorFlow 2.x為生成文本引入了許多預處理層,這樣數據的預處理就可以直接在TensorFlow中進行,而無需藉助Keras等其他工具了:

TensorFlow 2.x提供了新的訓練循環,允許開發者自定義每一步需要進行的操作,因此能解決以前Keras的fit函數無法解決的問題。

此外,NLP的調參過程一直是個難題,而現在我們可以使用 KerasTuner工具幫我們輕鬆地實現這一過程:

TensorFlow Hub

TensorFlow Hub提供了圖像、文本、視頻以及語音等全方面的預訓練模型。

圖像模型:圖像分類、目標檢測、圖像增強、圖像生成(如風格轉換等)文本模型:問答、文本分類、語法分析等視頻模型:視頻動作識別、視頻生成等語音模型:音高識別等

TensorFlow 性能分析

TensorFlow性能分析提供了一系列工具集合:

Overview Page:性能概覽頁面Input Pipleline Analyzer:輸入管道分析TensorFlow Stats:TensorFlow統計圖表Trace Viewer:追蹤查看4個GPU/TPU專業工具

Colab

Colab可以支持開發人員通過瀏覽器編寫和執行Python代碼。

MLIR:加速TensorFlow編譯

現在機器學習模型已經深入到日常生活的方方面面,處理的任務也越來越複雜。那麼隨之而來的一個難題就是,怎樣才能讓機器學習模型的構建和訓練過程變得更快?我們可以從這幾個方面入手:

用標準化的方式表示基本概念,如運算、類型等創建一個通用的基礎設施,構建可以重用的組件支持自定義和可擴展性這個新的框架名為MLIR,全稱是Multi-Level Intermediate Representation,是面向機器學習的編譯架構,具有模塊化、可擴展、可定製的特點。

對於用戶而言,MLIR意味著可以調試模型更容易,還能獲得更高的性能;而對於硬體供應商而言,MLIR意味著功能集成和優化更容易;對於研究人員而言,MLIR意味著基礎架構的標準化。如今MLIR已經被許多大公司接受,全世界95%的數據中心的硬體也都支持MLIR,還有活躍的開源社區。

下圖是TensorFlow的架構,藍色部分為可以使用MLIR的部分。

簡單來說,MLIR是一個通用的圖表示框架,一組通用的優化和轉換過程,以及一個完整的代碼生成流水線。

TFRT:TensorFlow Runtime

TFRT是一個新的TensorFlow運行時。為什麼要構建一個新的運行時呢?主要的動機是由於現在的模型越來越複雜、越來越大,而研究也需要更有創新性的運算、核和建模等。因此TensorFlow構建了TFRT這個新的運行時來滿足不斷增大的性能需求和對於模塊化、可擴展性的要求。

TFRT是一個統一的、可擴展的運行時,在許多專用硬體上能夠提供最好的性能。

TFRT的幾個設計上的亮點包括:

異步、低消耗的方式分發運算和圖:TFRT構建了一個不依賴鎖的並行圖執行器,因此同步所需的額外開銷很小。而且,eager op棧非常薄,因此每個eager API調用的額外開銷也很小。可擴展性和模塊化:運算、核和設備運行時與宿主運行時解耦合。eager模式和圖執行模式採用統一的構建組件,包括內存分配器、形狀函數和核等。

TFX:TensorFlow Extended

TFX是一個端到端平臺,用於部署生產型機器學習流水線。

2019年的最新發展:

建立機器學習元數據的基礎支持TensorFlow 2.x建立公平的指標2020年的發展計劃:

支持 Native Keras + TensorFlow 2.xTFLite inTFX提高模型訓練的速度Google Cloud AI Platform + TFX = Google Clound AI Pipelines

TensorFlow.js

TensorFlow.js是面向Web的機器學習框架。

2019年,TF.js 1.0正式發布:

新增四個模型:BodyPix、Toxicity、USE、Speech commands平臺:AutoML,SavedModels,以及在Node.js中直接執行SavedModel被許多大型應用程式採用,如Uber、Airbnb、微信、抖音等2020年的新增目標:

新增模型:Facemesh、Handtrack、Mobile BERT平臺增強:Web Assembly後端、React Native支持應用程式:平臺用戶:Glitch/Codepen

TensorFlow Lite

TensorFlow Lite是TensorFlow針對移動和嵌入式設備的輕量級解決方案。

全球40億行動裝置的各種應用都使用了TensorFlow Lite。超過1千應用產品採用了TensorFlow Lite,其中包括Google自己的產品YouTube、Google Cloud、Google Assistant,以及Uber、Hike、Airbnb、Viber等其他公司的產品。

公平

機器學習模型的偏見問題一直是模型訓練中的一個難題。在機器學習模型的構建流程中,從問題定義、數據準備一直到模型訓練、部署,每個階段都不可避免地會引入人類的偏見。例如,如果一個模型根據人們畫出的鞋子簡筆畫來學習怎樣識別鞋子,而絕大部分人畫出的鞋子都是運動鞋,那麼訓練出的模型就很難識別高跟鞋。在實際應用中,類似的偏見可能會導致嚴重的後果。

2017年發布的Toxicity v1模型的目的是識別網絡語言中的有害信息從而幫助淨化網絡內容。但是,由於訓練數據缺乏多樣性,導致模型對於同性戀相關話題會給出很高的有害分數。如果利用這個模型來過濾有害信息,那就會導致同性戀人群在網絡上無法發聲,導致嚴重的歧視問題。

解決公平性的兩個問題是:

如何衡量公平性?應當採用怎樣的訓練數據?Tensorflow提供了Faireness Indicators工具集,讓開發者可以更容易地對模型的公平性進行測量。

根據實驗,一個沒有公平性約束的tf.keras.Sequential模型在Smile Detection on CelebA數集上的訓練結果,會對Not Young的人群給出很高的假陽性率。

在使用了TFCO給模型加入約束後,訓練結果明顯好了很多。

TFQ:TensorFlow Quantum

不久前, TensorFlow Quantum(TFQ),一個可快速建立量子機器學習模型原型的開源庫。TFQ 通過提供與現有 TensorFlow API 兼容的量子計算基本要素以及高性能量子電路模擬器,將量子計算開源框架 Cirq 與 TensorFlow 集成在一起,為傳統的判別和生成量子模型的設計和實現提供了高層的抽象。

TensorFlow社區用戶群

TensorFlow 在全球共有73個用戶群,最初的兩個始自北美,最大的用戶群在韓國有4.6萬名成員,中國的用戶群遍及16個城市。

教育課程與證書

TensorFlow不僅與Coursera等網站合作推出了一系列在線教育課程,還推出了TF開發證書,涉及主題包括:機器學習編程的基本概念、文本分類、計算機視覺以及序列和預測等。

【end】

原力計劃

《原力計劃【第二季】- 學習力挑戰》正式開始!即日起至 3月21日,千萬流量支持原創作者!更有專屬【勳章】等你來挑戰

如何用CNN玩轉AlphaGo版的五子棋?訓練數據也外包?這家公司「承包」了不少注釋訓練數據,原來是這樣做的……微信iOS版內測暗黑模式;涉嫌惡意舉報,社交平臺Soul運營合伙人被批捕;AWS推出基於Linux開源作業系統區塊鏈和大數據一起能否開啟數據完整性的新紀元?Soul App 高管被捕,惡意舉報導致競品被下架以太坊2.0、分片、DAG、鏈下狀態通道……概述區塊鏈可擴展性的解決方案!

相關焦點

  • 步履不停:TensorFlow 2.4新功能一覽!
    TensorFlow 2.4 正式發布!隨著對分布式訓練和混合精度提供更多支持,加入新的 Numpy 前端及用於監控和診斷性能瓶頸的工具,這個版本的亮點在於推出新功能,以及對性能和擴展方面的增強。
  • TensorFlow 2.0 新鮮出爐!新版本,新架構,新特性
    新版本主打簡單易用可擴展,大大簡化API,最後,連logo也改了。TensorFlow 2.0終於來了!今天凌晨,谷歌在加州舉辦TensorFlow開發者峰會(TensorFlow Dev Summit),正式發布2.0版本。
  • TensorFlow2.1正式版上線:最後一次支持Python2,進一步支持TPU
    去年 10 月,谷歌才發布了 TensorFlow 2.0 正式版。時隔三個月後,昨日官方發布了 TensorFlow 2.1,本次版本更新帶了了多項新特性、功能改進和 bug 修復。據悉,TensorFlow 2.1 的 CUDA 版本為 10.1,cuDNN 版本為 7.6。在對作業系統的支持上,Windows 和 Linux 系統的 TensorFlow pip 版本默認支持 GPU。
  • tensorflow初級必學算子
    在之前的文章中介紹過,tensorflow框架的核心是將各式各樣的神經網絡抽象為一個有向無環圖,圖是由tensor以及tensor變換構成;雖然現在有很多高階API可以讓開發者忽略這層抽象,但對於靈活度要求比較高的算法仍然需要開發者自定義網絡圖,所以建議開發者儘量先學習tf1.x
  • 終於來了,TensorFlow 新增官方 Windows 支持
    隨著 TensorFlow r0.12 版的發布,這一開源軟體庫現已支持 Windows7、10 和 Server 2016。同時,這一新版本可以讓用戶在 TensorFlow 訓練中得到 CUDA 8 的 GPU 加速。我們已將新版本在 PyPI 中封裝成型。現在你可以使用命令 C:\> pip install tensorflow 安裝 TensorFlow 了。
  • 深度解讀TensorFlow,了解它的最新發展!
    在前段時間的TensorFlow峰會上,TensorFlow 發布了面向 JavaScript 開發者的全新機器學習框架 TensorFlow.js。  TensorFlow.js 是一個開源的用於開發機器學習項目的 WebGL-accelerated JavaScript 庫。
  • Tensorflow 2.0 即將入場
    考慮到它可能會成為機器學習框架的又一個重要裡程碑,本文會介紹1.x和2.x版本之間的所有(已知)差異,重點關注它們之間的思維模式變化和利弊關係。通過閱讀這篇文章,熟悉Tensorflow的老用戶可以儘早轉變思維,適應新版本的變化。而新手也可以直接以Tensorflow 2.0的方式思考,至少目前沒有必要急著去學習別的框架。
  • 玩轉TensorFlow?你需要知道這30功能
    地址是:tensorflow.org/tfx/?這意味著,如果不想使用低階的模型,那仍然可以用高階 API 的用戶友好性來實現圖形+模型的構建。2.0 版本將會有更多的功能!網址:https://www.tensorflow.org/guide/keras12)Tensor2TensorTensor2Tensor 是一個深度學習模型和數據集的開源軟體庫
  • 資源| TensorFlow版本號升至1.0,正式版即將到來
    現在,TensorFlow 的一歲生日之後兩個月,TensorFlow 社區終於決定將 TensorFlow 的版本號升至 1.x,並也已於昨日發布了 TensorFlow 1.0.0-alpha,其新增了實驗性的 Java API,並且提升了對 Android 的支持。
  • PyTorch 1.6、TensorFlow 2.3、Pandas 1.1 同日發布!都有哪些新...
    作者 | 肖智清7月29日,PyTorch 1.6、TenorFlow 2.3、Pandas 1.1恰巧同時發布。這三個庫都是定期滾動更新,大約每個季度更新一次小版本。在AI內捲化達到「灰飛煙滅」的今日,僅僅會對PyTorch或TensorFlow進行調用已經不具有競爭力。
  • TensorFlow官方發布消息稱將引入一個新的優化工具包
    TensorFlow官方發布消息稱將引入一個新的優化工具包 李倩 發表於 2018-09-21 08:53:44 編者按:幾個月前,Tensorflow發布了一份名為《Quantizing deep convolutional
  • TensorFlow 攜手 NVIDIA,使用 TensorRT 優化 TensorFlow Serving...
    目前,TensorFlow Serving 1.13 已實現對 TF-TRT 的支持,而不久後  TensorFlow 2.0 也將支持 TF-TRT 的實現。 TensorFlow 在官方博客中對這項成果進行了發布,雷鋒網 AI 科技評論編譯如下。
  • TensorFlow 2.1指南:keras模式、渴望模式和圖形模式(附代碼)
    發布了新的硬體體系結構,晶片和優化,以支持不斷增長的AI應用的部署。什麼時候是停下來重新考慮的好時機?那只有你會知道。對我來說,這一刻已經到來了。我一直在使用Keras和Tensorflow的1.x(TF1)在工作和我的個人項目,因為我在這個領域開始。我完全喜歡Keras庫的高級方法和Tensorlfow的低級方法,這些方法可以讓我們在需要更多自定義時在後臺進行更改。
  • TensorFlow 1.9.0-rc0 升級 tf.keras 至 Keras 2.1.6 API
    TensorFlow 1.9.0-rc0 已發布。該版本帶來了不少改進和新特性:Update tf.keras to the Keras 2.1.6 API.
  • TensorFlow 2入門指南,初學者必備!
    英語原文:Getting Started with TensorFlow 2翻譯:雷鋒字幕組(贇瑾和鳴、大表哥)什麼是Tensorflow?TensorFlow是谷歌推出的深度學習框架,於2019年發布了第二版。 它是世界上最著名的深度學習框架之一,被行業專家和研究人員廣泛使用。
  • 谷歌正式發布TensorFlow 1.5,究竟提升了哪些功能?
    昨天,谷歌在 GitHub 上正式發布了 TensorFlow 的最新版本 1.5.0,並開源了其代碼。支持 CUDA 9 和 cuDNN 7 被認為是本次更新的最重要部分。機器之心對這次更新的重大改變以及主要功能和提升進行了編譯介紹,原文請見文中連結。
  • TensorFlow 2.4來了:上線對分布式訓練和混合精度的新功能支持
    選自TensorFlow Blog機器之心編譯編輯:小舟、蛋醬今天,谷歌正式發布了 TensorFlow 2.4,帶來了多項新特性和功能改進。import tensorflow.experimental.numpy as tnp# Use NumPy code in input pipelinesdataset = tf.data.Dataset.from_tensor_slices( tnp.random.randn(1000, 1024)).map(lambda z: z.clip
  • TensorFlow與PyTorch之爭,哪個框架最適合深度學習
    我的建議谷歌的 TensorFlowTensorFlow 是谷歌的開發者創造的一款開源的深度學習框架,於 2015 年發布。官方研究發布於論文《TensorFlow:異構分布式系統上的大規模機器學習》。
  • Tensorflow 全網最全學習資料匯總之Tensorflow 的入門與安裝【2】
    最終以一個手寫數字識別的實例將這些點串起來進行了具體說明。2.《TensorFlow學習筆記1:入門》連結:http://www.jeyzhang.com/tensorflow-learning-notes.html本文與上一篇的行文思路基本一致,首先概括了TensorFlow的特性,然後介紹了graph、session、variable 等基本概念的含義,以具體代碼的形式針對每個概念給出了進一步的解釋
  • 在Windows中安裝Tensorflow和Kears深度學習框架
    建立Tensorflow的Anaconda虛擬環境在一臺計算機中,我們常常需要安裝很多軟體,但是每個軟體所需要的Python的關聯模塊或版本不相同。例如,我們要使用Python開發開發網站系統,安裝的網站框架可能需要Python2.X的版本,但是安裝Tensorflow需要Python3.5的版本,此時就會發生版本不一致的問題。