選自Microsoft作者:John Roach機器之心編譯
參與:黃小天、蔣思源
近日,微軟在其官方博客上撰文宣布全面開源 Microsoft Cognitive Toolkit 2.0,該版本版本包含了 beta 版本以來的數百個新功能,簡化了深度學習流程,可在更廣泛的人工智慧生態系統之中實現無縫整合;此外它還支持 Keras、Java API、英偉達最新版本的深度學習 SDK 和高級 GPU 架構(比如英偉達 Volta)。機器之心對該文進行了編譯,原文連結請見文末。
美國切薩皮克州保護協會(The Chesapeake Conservancy)正在使用微軟的 Cognitive Toolkit 來定義和訓練一個神經網絡,加速創建用於監督恢復與保護的這個切薩皮克灣土地覆蓋的數據集。
今天,一支微軟的研究者與軟體工程師團隊聲稱,微軟開源了其用來取得人工智慧重大突破的一個工具包。
在開發「Microsoft Cognitive Toolkit」(也被稱作 CNTK)中扮演重要角色的合伙人工程經理(partner engineering manager)Chris Basoglu 說:「該工具包的 2.0 完整版本現已全面發行。」其有五大重要更新:1、支持 Keras;2、極快的 Halide 二進位捲曲;3、支持 Java API;4、新的 NuGet 軟體包集;5、多漏洞修復。(連結:https://github.com/microsoft/cntk)
用於產品級和企業級工作負載的微軟 Cognitive Toolkit 2.0 的完整版本包含了 beta 版本以來的數百個新功能,簡化了深度學習流程,確保該工具包在更廣泛的人工智慧生態系統之中無縫整合。
此外,Cognitive Toolkit 的完整版本還將支持 Keras,一個用戶友好的開源神經網絡庫,它在深度學習應用開發者之間廣受歡迎。Basoglu 解釋道,為 Keras 編寫的代碼現在可以利用 Cognitive Toolkit 的性能與速度而無需改變任何代碼。目前對 Keras 的支持正在公開預覽之中。
通過支持最新版本的英偉達深度學習 SDK 和高級 GPU 架構(比如英偉達 Volta),Cognitive Toolkit 將會繼續加速訓練能力。
自 2016 年 10 月 Cognitive Toolkit 的 beta 版本發行以來,就受到了需要定義和訓練神經網絡的大量公司和組織的歡迎,這些神經網絡能夠以科學家認為的類似於人腦學習的方式學習執行具體任務。
楠蒂柯克河(The Nanticoke River)是 Demlarva 半島上流入的切薩皮克灣的最大支流。楠蒂柯克流域大約佔地 53 萬英畝,包括了超過 5 萬英畝的潮汐溼地。切薩皮克州保護協會正努力藉助人工智慧保護這片溼地。
例如,位於美國馬裡蘭州首府安納波利斯(Annapolis)的切薩皮克州保護協會正和微軟研究者一起合作使用該工具包定義和訓練一個神經網絡,加速創建當下最新的一米解析度的土地覆蓋數據集,可優先處理整個切薩皮克灣(跨越 6 個州和 華盛頓特區的 64000 平方英裡的土地)的恢復和保護倡議。
這些新數據集的信息量是現有的 30 米解析度數據集的 900 倍;但是如果沒有人工智慧,這需要人力數月的數據輸入和圖像處理才能完成。新的神經網絡把工作流程壓縮為單一算法,可在一小部分時間內生成相似的映射。據項目合伙人講,這種人工智慧技術應該擴展開來,幫助全美和全球性的保護組織。
在中國,人工智慧醫療創業公司 Airdoc 正使用微軟的 Azure 雲服務、認知服務和 Cognitive Toolkit 來研發其技術,該技術可以快速準確地探測糖尿病性視網膜病變的發作(糖尿病的一種併發症,可導致失明如果沒有正確對待)。
Cognitive Toolkit 的開發最開始是為了微軟研究者和工程師加速訓練深度神經網絡和其他機器學習模型,開發諸如必應視頻搜索和語音識別系統等應用,其中後者是微軟一個突破性進展,它可以像人一樣識別對話中的字詞。
微軟研究員們意識到,相同的工具可以滿足人工智慧應用日益增長的需求,比如語音理解和圖像識別就從小型初創公司到大型科技公司、政府機構、非營利組織和學術機構等都在使用。
Basoglu 及其團隊調整了該工具以滿足有基本編程技巧和筆記本電腦的愛好者,同時其還允許高技能開發者對搜索工具進行全面定製,從而加速在多個伺服器和最新 GPU 上有大量數據集的深度神經網絡訓練。
除了支持 Keras 外,今天發布的其他新特性還包括添加了用於模型評估的 Java 捆綁包,還有壓縮已訓練的模型以在資源受限的設備上實時運行的新工具,進而將圖像識別等應用加載到這種設備中(如智慧型手機)。
該工具是微軟「人工智慧技術民主化」這一倡議的一部分。除了 Cognitive Toolkit 之外,開發者可以通過微軟 Azure 訪問一套雲計算應用,就如同通過微軟認知服務容易地使用和部署機器學習應用程式接口或 API 那樣。
Basoglu 說:「最初,人們手寫他們的數學函數,用個人代碼創建他們自己的神經網絡,並獨自計算出如何提供數據;但是現在,面對海量的數據,複雜的算法和多 GPU、CPU 和機器之間令人生畏的優化,個人式的自我編寫就變得不合時宜了。他們需要的是新工具。」
擴展閱讀:
查看微軟 Cognitive Toolkit 博客:https://www.microsoft.com/en-us/cognitive-toolkit/blog/查看微軟 Cognitive Toolkit 主頁:https://www.microsoft.com/en-us/cognitive-toolkit/該項目 GitHub 的下載地址:https://github.com/microsoft/cntk
原文連結:https://blogs.microsoft.com/next/2017/06/01/microsoft-releases-open-source-toolkit-to-accelerate-deep-learning/#sm.000001nsijtrqgfleudmujejudoj9