微軟開源Cognitive Toolkit 2.0完整版:從性能更新到應用案例

2020-12-11 機器之心Pro

選自Microsoft作者:John Roach機器之心編譯

參與:黃小天、蔣思源

近日,微軟在其官方博客上撰文宣布全面開源 Microsoft Cognitive Toolkit 2.0,該版本版本包含了 beta 版本以來的數百個新功能,簡化了深度學習流程,可在更廣泛的人工智慧生態系統之中實現無縫整合;此外它還支持 Keras、Java API、英偉達最新版本的深度學習 SDK 和高級 GPU 架構(比如英偉達 Volta)。機器之心對該文進行了編譯,原文連結請見文末。

美國切薩皮克州保護協會(The Chesapeake Conservancy)正在使用微軟的 Cognitive Toolkit 來定義和訓練一個神經網絡,加速創建用於監督恢復與保護的這個切薩皮克灣土地覆蓋的數據集。

今天,一支微軟的研究者與軟體工程師團隊聲稱,微軟開源了其用來取得人工智慧重大突破的一個工具包。

在開發「Microsoft Cognitive Toolkit」(也被稱作 CNTK)中扮演重要角色的合伙人工程經理(partner engineering manager)Chris Basoglu 說:「該工具包的 2.0 完整版本現已全面發行。」其有五大重要更新:1、支持 Keras;2、極快的 Halide 二進位捲曲;3、支持 Java API;4、新的 NuGet 軟體包集;5、多漏洞修復。(連結:https://github.com/microsoft/cntk)

用於產品級和企業級工作負載的微軟 Cognitive Toolkit 2.0 的完整版本包含了 beta 版本以來的數百個新功能,簡化了深度學習流程,確保該工具包在更廣泛的人工智慧生態系統之中無縫整合。

此外,Cognitive Toolkit 的完整版本還將支持 Keras,一個用戶友好的開源神經網絡庫,它在深度學習應用開發者之間廣受歡迎。Basoglu 解釋道,為 Keras 編寫的代碼現在可以利用 Cognitive Toolkit 的性能與速度而無需改變任何代碼。目前對 Keras 的支持正在公開預覽之中。

通過支持最新版本的英偉達深度學習 SDK 和高級 GPU 架構(比如英偉達 Volta),Cognitive Toolkit 將會繼續加速訓練能力。

自 2016 年 10 月 Cognitive Toolkit 的 beta 版本發行以來,就受到了需要定義和訓練神經網絡的大量公司和組織的歡迎,這些神經網絡能夠以科學家認為的類似於人腦學習的方式學習執行具體任務。

楠蒂柯克河(The Nanticoke River)是 Demlarva 半島上流入的切薩皮克灣的最大支流。楠蒂柯克流域大約佔地 53 萬英畝,包括了超過 5 萬英畝的潮汐溼地。切薩皮克州保護協會正努力藉助人工智慧保護這片溼地。

例如,位於美國馬裡蘭州首府安納波利斯(Annapolis)的切薩皮克州保護協會正和微軟研究者一起合作使用該工具包定義和訓練一個神經網絡,加速創建當下最新的一米解析度的土地覆蓋數據集,可優先處理整個切薩皮克灣(跨越 6 個州和 華盛頓特區的 64000 平方英裡的土地)的恢復和保護倡議。

這些新數據集的信息量是現有的 30 米解析度數據集的 900 倍;但是如果沒有人工智慧,這需要人力數月的數據輸入和圖像處理才能完成。新的神經網絡把工作流程壓縮為單一算法,可在一小部分時間內生成相似的映射。據項目合伙人講,這種人工智慧技術應該擴展開來,幫助全美和全球性的保護組織。

在中國,人工智慧醫療創業公司 Airdoc 正使用微軟的 Azure 雲服務、認知服務和 Cognitive Toolkit 來研發其技術,該技術可以快速準確地探測糖尿病性視網膜病變的發作(糖尿病的一種併發症,可導致失明如果沒有正確對待)。

Cognitive Toolkit 的開發最開始是為了微軟研究者和工程師加速訓練深度神經網絡和其他機器學習模型,開發諸如必應視頻搜索和語音識別系統等應用,其中後者是微軟一個突破性進展,它可以像人一樣識別對話中的字詞。

微軟研究員們意識到,相同的工具可以滿足人工智慧應用日益增長的需求,比如語音理解和圖像識別就從小型初創公司到大型科技公司、政府機構、非營利組織和學術機構等都在使用。

Basoglu 及其團隊調整了該工具以滿足有基本編程技巧和筆記本電腦的愛好者,同時其還允許高技能開發者對搜索工具進行全面定製,從而加速在多個伺服器和最新 GPU 上有大量數據集的深度神經網絡訓練。

除了支持 Keras 外,今天發布的其他新特性還包括添加了用於模型評估的 Java 捆綁包,還有壓縮已訓練的模型以在資源受限的設備上實時運行的新工具,進而將圖像識別等應用加載到這種設備中(如智慧型手機)。

該工具是微軟「人工智慧技術民主化」這一倡議的一部分。除了 Cognitive Toolkit 之外,開發者可以通過微軟 Azure 訪問一套雲計算應用,就如同通過微軟認知服務容易地使用和部署機器學習應用程式接口或 API 那樣。

Basoglu 說:「最初,人們手寫他們的數學函數,用個人代碼創建他們自己的神經網絡,並獨自計算出如何提供數據;但是現在,面對海量的數據,複雜的算法和多 GPU、CPU 和機器之間令人生畏的優化,個人式的自我編寫就變得不合時宜了。他們需要的是新工具。」

擴展閱讀:

查看微軟 Cognitive Toolkit 博客:https://www.microsoft.com/en-us/cognitive-toolkit/blog/查看微軟 Cognitive Toolkit 主頁:https://www.microsoft.com/en-us/cognitive-toolkit/該項目 GitHub 的下載地址:https://github.com/microsoft/cntk

原文連結:https://blogs.microsoft.com/next/2017/06/01/microsoft-releases-open-source-toolkit-to-accelerate-deep-learning/#sm.000001nsijtrqgfleudmujejudoj9

相關焦點

  • 微軟發布Cognitive Toolkit 2.0 beta 支持Python
    網易科技訊10月26日消息 據外媒(venturebeat)報導,微軟於今日發布其開源深度學習工具包2.0 beta版。此前這一軟體被叫做Computational Network Toolkit(CNTK),此次更新中,微軟將之更名為Cognitive Toolkit。新的工具包在C++ 之外新增對 Python語言的支持(Python 3已經支持;Python 2即將支持)。
  • Microsoft Cognitive Toolkit 2.0 候選版本發布!
    Microsoft Cognitive Toolkit 原名 CNTK,是微軟去年開源的深度學習框架。在海量數據上開發深度學習應用,它具備商用級別的穩定型,以及與主流程式語言與算法的兼容。如今,它即將迎來新一代的 2.0 版本。自從去年十月發布 2.0 beta 版,微軟為 Microsoft Cognitive Toolkit 2.0 已陸續添加了超過 100 餘個新特性、升級以及漏洞修補。
  • 微軟開源 Cognitive Toolkit 降低機器學習門檻
    據外媒(Ars Technica)報導,上周微軟宣布實現語音識別新突破:其開發的語音轉錄系統識別誤差僅為5.9% ,已接近人類大腦水平。該轉錄系統基於微軟自家的開源軟體Cognitive Toolkit所開發,微軟於昨日發布了該軟體的 2.0 beta版。此前這一軟體一直被叫做Computational Network Toolkit(CNTK)。這個使用 MIT 許可協議、經由GitHub 託管的項目給開發者提供現成的神經網絡代碼,可以用來打造其各自的機器學習系統。
  • 微軟開源Cognitive Toolkit降低了機器學習門檻
    網易科技訊10月27日消息 據外媒(Ars Technica)報導,上周微軟宣布實現語音識別新突破:其開發的語音轉錄系統識別誤差僅為5.9% ,已接近人類大腦水平。該轉錄系統基於微軟自家的開源軟體Cognitive Toolkit所開發,微軟於昨日發布了該軟體的 2.0 beta版。此前這一軟體一直被叫做Computational Network Toolkit(CNTK)。這個使用 MIT 許可協議、經由GitHub 託管的項目給開發者提供現成的神經網絡代碼,可以用來打造其各自的機器學習系統。
  • 微軟正式推出認知工具包Cognitive Toolkit 2.0
    在不久前36氪聯合主辦的融合了音樂、科技與藝術的mta天漠音樂節上,微軟亞洲研究院的張霖濤提出,人工智慧有三個重要的支柱點,分別是大數據、新算法和大系統。微軟在大系統方面的努力是推出了開源的認知工具包Microsoft Cognitive Toolkit(之前叫做CNTK),現在這個工具包已經正式升版(2.0)並面向開發者開放。
  • MicrosoftCognitiveToolkit2.0候選版本發布!
    Microsoft Cognitive Toolkit 原名 CNTK,是微軟去年開源的深度學習框架。作為語音識別領域聲名卓著的開發工具,Microsoft Cognitive Toolkit 具有相當不錯的可擴展性、速度和精確性。在海量數據上開發深度學習應用,它具備商用級別的穩定型,以及與主流程式語言與算法的兼容。
  • Monaco Editor 0.14.2 發布,微軟開源的代碼編輯器
    Monaco Editor 0.14.2 已發布,這是針對剛剛發布的 0.14 的修復版本。
  • 微軟待辦事項應用To-Do UWP版更新
    IT之家3月13日消息 Windows 10版微軟待辦事項UWP應用To-Do針對Windows 10移動版以及Windows 10 PC版更新,版本號為1.26.10711.0。本次更新主要帶來了功能改進與修復。
  • 阿里宣布開源 Weex,用 Web 方式開發 Native 性能體驗應用
    Weex能夠完美兼顧性能與動態性,讓移動開發者通過簡捷的前端語法寫出Native級別的性能體驗,並支持iOS、安卓、YunOS及Web等多端部署。對於移動開發者來說,Weex主要解決了頻繁發版和多端研發兩大痛點,同時解決了前端語言性能差和顯示效果受限的問題。開發者可通過Weex官網申請內測。(http://alibaba.github.io/weex/)
  • 微軟Surface Go 2推送Win 10固件更新 手寫筆性能得到改善
    今年5月份,微軟Surface Go 2悄然上架,延續了上一代小巧輕薄的特性,WiFi版機身不含鍵盤重量僅544克,LTE增強版為553克,相當便攜。近日,微軟Surface Go 2設備已收到2020年6月的Windows 10固件更新。
  • 微軟開源早期程式語言 GW-BASIC
    微軟通過一篇博客文章宣布開放 GW-BASIC 的原始碼。並表示,自從 MS-DOS 1.25 和 2.0 開源後,社區中要求同樣開源 BASIC 語言的呼聲頗高。因此微軟選擇將 1983 年以來的 8088 彙編語言開源出來,但僅作歷史參考和教育用途,不再接收任何修改源碼的拉取請求。GW-BASIC 是 BASIC 的一個方言版本,誕生於 1983 年 2 月 10 日,作為 MS-DOS 的一個組成部分而問世。
  • 微軟數獨 iOS 版 2.2.0 更新:新增黑暗模式主題
    IT之家8月2日消息 今年 2 月份,微軟悄然推出了 iOS 版微軟數獨(Microsoft Sudoku)遊戲,這意味著粉絲也可以在移動端開啟智力開發。近期,微軟數獨 iOS 版更新了 2.2.07060 版本,帶來了新的主題:黑暗模式。
  • 微軟遊戲直播Beam2.0測試版更新:包含大量改進
    訊 12月21日消息,微軟今年8月收購了遊戲直播服務提供商Beam,在10月份,微軟宣布在即將到來的Win10創造者更新中將會原生支持Beam遊戲直播。目前微軟已經在改進Beam對Xbox One和Win10平臺的支持,進行了諸多改進。
  • 微軟宣布WPF、Windows Forms和WinUI這3個流行框架正式開源
    雷鋒網查詢微軟.NET Blog了解到,2014年11月12日,微軟正式宣布了.NET Core的開源。它取得了巨大的成功。.NET平臺已經收到來自微軟以外的3700多家公司的超過60000個社區的拉取請求。微軟在現場承諾,將在.NET Core上為這些框架做出貢獻。第一波代碼將於今天在GitHub上發布,未來幾個月將出現更多代碼。
  • 慕課網 PHP從基礎語法到原生項目開發【完整版】,好課資源共享:慕課網 PHP從基礎語法到原生項目開發【完整版】
    慕課網 PHP從基礎語法到原生項目開發【完整版】好課資源共享:慕課網 PHP從基礎語法到原生項目開發【完整版】05、慕課網 PHP從基礎語法到原生項目開發
  • 盤點微軟最應該開源的 15 款產品 - OSCHINA - 中文開源技術交流社區
    MSN曾經是風靡一時的聊天軟體,但在收購Skype之後,微軟很快徹底關閉了該服務。但考慮到MSN的即時信息要比Skype聊天穩定得多,微軟可以將前者的客戶端開源,而開源社區或許可以將其變成一個總是顯示你最新信息的工具。
  • 實體店倒閉,開源卻「慷慨」:微軟開源Python庫Lumos用於自動監視...
    近年來,微軟在開源上做出了卓越貢獻。 儘管微軟所有實體店都倒閉了,但這家成立的快50年的大企業還是熱衷於「做慈善」。 最近,微軟的「開源版圖」又增添了一抹新的色彩:Lumos庫也開源了。Lumos是一個Python庫,用於網絡應用程式中的度量回歸的自動檢測與診斷。
  • Chrome 測試弧線形標籤;微軟在 GitHub 開源 Q# 教程項目
    1、谷歌開源機器學習庫 TensorFlow 1.10.0 RC0 發布TensorFlow 1.10.0 RC0 發布了。(詳情:https://github.com/tensorflow/tensorflow/archive/v1.10.0-rc0.zip)2、PyCharm 2018.2 RC 2 發布,修復使用情況統計信息PyCharm 2018.2 RC 2 發布了,此版本只對收集使用情況統計信息做了一個小修正。
  • 開源PaaS Rainbond v5.0.4 發布更新,做最好用的雲應用作業系統
    今天我們給社區帶來了Rainbond v5.0.4 版本更新,提前恭祝大家升級成功,Rainbond是開源的企業應用雲作業系統,支撐企業應用的開發、架構、交付和運維的全流程,通過無侵入架構,無縫銜接各類企業應用
  • Bossie Awards 2016:12個最佳開源應用獲獎得主揭曉
    【51CTO.com快譯】最佳開源應用 開源應用領域向來以不穩定著稱。以SugarCRM為例,曾經屬於企業級開源應用中的領導者,而如今在嚴格意義上卻已經屬於一款SaaS方案了。再來看OpenOffice——昨天它在微軟眼中還是一位強大的競爭對手,但如今LibreOffice的存在已經使其幾乎失去了存在價值。在本次評出的開源應用贏家當中,大家會發現一系列經歷過改造的方案,其中一些甚至可以算是全新項目。