微軟又開源一個ML框架,這次是核心產品的機器學習引擎infer.NET

2020-12-16 量子位

乾明 整理編譯自 Microsoft Research Blog量子位 報導 | 公眾號 QbitAI

感覺微軟對開源上癮了。

在開源了跨平臺機器學習框架ML.NET之後,微軟又開源了一個非常重要的機器學習框架:infer.NET,而且採用的還是MIT許可證。

這個消息一出,可以說是八方點讚,Twitter上一片好評。

那麼,infer.NET是什麼?有何優點?應用範圍如何?該怎麼去下載使用呢?

下面就來回答這些問題~

關於infer.NET

簡單來說,Infer.NET是一個基於模型的機器學習框架。

根據官方介紹,Infer.NET是一個在圖形模型中運行貝葉斯推理框架,可以用於概率編程,也可以用來解決許多不同類型的機器學習問題,包括分類、推薦或聚類等標準問題,並可以針對特定領域問題提供定製解決方案。

一般情況下,進行機器學習的時候,開發人員為框架提供模型後,都需要將他們的模型映射到預先存在的學習算法上去。

而Infer.NET將這個過程反了過來,可以直接從模型中生成一個定製的機器學習算法,允許你將領域知識融入到模型之中,這樣「反其道而行之」的做法,給這個框架帶來了不少優勢。

在微軟的官方博文中,給出了infer.NET框架的4個優勢,分別是:

1、可解釋性強。

如果你設計了一個模型,並且從模型中生成算法。那麼,你就可以理解為什麼系統會以特定的方式運行,或者做出某些預測。隨著機器學習應用逐漸進入日常生活,理解和解釋它們的行為變得越來越重要。

2、數據適用性強。

基於模型的機器學習框架,對於那些具有某些特徵的數據有很強的適用性,可以更好的使用這些數據來完成機器學習任務。比如實時數據、異構數據、數據不足、未貼標籤的數據、有缺失部分的數據和以已知偏差收集的數據等等。

3、用概率程序來描述模型。

Infer.NET可以將概率化程序編譯成高性能代碼,用於實現被稱為確定性近似貝葉斯推斷的東西。這種方法提供了大量的可拓展性,例如,在一個系統中使用Infer.NET,系統可以自動從數十億個網頁中提取知識,包括大量的數據。

4、支持在線貝葉斯推斷。

Infer.NET的一個關鍵功能是支持在線貝葉斯推斷,即系統在新數據到來時進行學習的能力。這在與用戶進行實時交互的商業和消費品中是必不可少的。

具有這麼多的優勢,在實際的應用場景中,Infer.NET的運用範圍也非常廣泛。

除了廣泛應用於信息檢索、流行病學、生物信息學等各個學術研究領域之外,Infer.NET已經發展成了微軟 Office、 Xbox 和 Azure 等微軟核心產品中的機器學習引擎。

最近還應用到了遊戲評級系統之中,微軟的研究團隊基於TrueSkill,使用Infer.NET框架開發了TrueSkill 2。從《Halo 5》中的應用來看,相比於TrueSkill,玩家匹配的準確率從52%提升到了68%。

使用指南

Infer.NET框架開源之後,將成為ML.NET的一部分。這是一款面向.NET開發者的機器學習框架,微軟在今年的Bulid大會上開源了這一框架。

根據博客文章的介紹,微軟已經採取了大量集成ML.NET。比如在.NET Foundation下設置存儲庫,並將包和命名空間移動到Microsoft.ML.Probabilistic。Infer.NET也將提升ML.NET在統計建模和在線學習方面的能力。

此外,Infer.NET也是跨平臺的。根據官方的Readme文檔,Infer.NET支持 .NET Framework 4.6.1、.NET Core 2.0 和 Mono 5.0。

Windows 用戶需要在 Visual Studio 2017 中使用,而 macOS 和 Linux 開發者可以使用.NET Core 2.0 SDK構建和運行.NET Standard和.NET Core項目。

相關焦點

  • 微軟開源基於模型的機器學習框架 Infer.NET
    6 日,微軟開源了其基於模型的機器學習框架 Infer.NET。項目地址:https://github.com/dotnet/infer
  • 微軟開源ONNX Runtime,想用什麼深度學習框架任你選!
    ONNX機器學習引擎開源,此舉將讓機器學習框架,向著機器學習框架的標準化和性能優化方向邁進了一大步。此前,為了推進AI框架標準化,更好地支持PyTorch和TensorFlow等框架,微軟甚至降低了對自家CNTK框架的宣傳調門,可謂「用心良苦」。當地時間12月4日,微軟在GitHub上宣布ONNX Runtime開源 。
  • 開發者必備:基於Linux生態的十大AI開源框架盤點
    H2O(即水的化學式)是一個開源、快速、可擴展的分布式機器學習框架,同時提供了大量的算法實現。官網:https://spark.apache.org/mllib/5. Apache Mahout:Hadoop廣泛採用的機器學習開源框架
  • 開發者必備:基於 Linux 生態的十大AI開源框架盤
    Deeplearning4j遵循Apache 2.0開源協議,提供了基於AWS雲服務的GPU運算支持,以及微軟伺服器框架的支持。官網: http://deeplearning4j.org/2. Caffe:廣受歡迎的深度學習框架
  • 6月份最熱門的機器學習開源項目Top10
    AI 前線導讀: 燥熱的 6 月天已經結束了,本月機器學習領域又有哪些開源項目值得一看呢?Mybridge AI 從將近 250 個機器學習開源項目中評選出排名 Top10 的項目。這是他們對在此期間新發布或進行重大發布的項目進行比較之後得出的結果,考量了各種因素對項目的專業性進行排序。哪些項目上榜了呢?
  • 技術乾貨:人工智慧和機器學習領域中有趣的開源項目
    GraphLab  GraphLab是一種新的面向機器學習的並行框架。GraphLab提供了一個完整的平臺,讓機構可以使用可擴展的機器學習系統建立大數據以分析產品,該公司客戶包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它們從別的應用程式或者服務中抓取數據,通過推薦系統、欺詐監測系統、情感及社交網絡分析系統等系統模式將大數據理念轉換為生產環境下可以使用的預測應用程式。
  • 十個經典Chatbot框架
    提供了一個AI的框架,可以自己定義模板,參數,多輪對話,很方便的就可以定義一個自己的特定任務的聊天機器人。4.  wit.ai    網址:https://wit.ai    機構/作者:Facebook    流行程度:351,000,000    簡介:是所有框架中最流程的一個,有非常好的二次開放庫,duckling.wit.ai是非常好的時間識別庫。wit.ai並不開源的,但是二次庫很多事開源的,詳見github上面的二次開發庫。
  • 熱門機器學習開源資源最強盤點
    今天我們帶來了由 Mybridge 整理的 2018 年度熱門機器學習開源資源大盤點,值得一提的是,在這份列表中,出現了來自中國騰訊的貢獻的兩個資源。更多優質內容請關注微信公眾號「AI 前線」(ID:ai-front) 在過去的一年裡,我們比較了近 22000 個機器學習開源工具和項目,選出了前 49 個(約佔 0.22%)。
  • 騰訊又雙叒叕開源!這次微信在用的圖計算框架
    乾明 編輯整理 量子位 報導 | 公眾號 QbitAI看樣子,鵝廠搞開源好像「上頭」了。11月14日,騰訊又把微信等眾多核心業務在用的圖計算框架開源了。這也是他們在短短一周內開源的第5個大項目。與其他圖計算框架相比,將算法計算時間從天級縮短到分鐘級,而且性能也全面領先,原本動輒需要數百臺伺服器的計算,現在最少只需要十臺伺服器。Plato團隊負責人於東海說,Plato已經用在了騰訊內部包括微信在內的眾多核心業務中,尤其是為騰訊超大規模社交網絡圖數據的各類計算提供支撐。
  • 微軟發布開源.NET包管理器 —— NuPack
    10月6日,微軟發布一個初始版的NuPack,這是一個開源的包管理器,可用於微軟的.NET軟體開發平臺。
  • 微軟開源可解釋機器學習框架 interpret 實踐
    作者:沂水寒城,CSDN博客專家,個人研究方向:機器學習、深度學習、NLP、CVBlog: http://yishuihancheng.blog.csdn.net
  • 微軟宣布WPF、Windows Forms和WinUI這3個流行框架正式開源
    微軟高管在12月5日的Microsoft Connect();2018年的活動上興奮地宣布新的開源計劃。這表明,微軟3個最流行的Windows框架正在迎來開源。為何開源?Windows開發人員平臺公司副總裁Kevin Gallo表示:「微軟的三個流行的Windows用戶體驗框架已準備好為開發者在GitHub上做出貢獻。開源這些技術的目的,其實是促進產品團隊與社區之間的透明度,有助於Windows開發的民主化,使社區能夠參與並為此做出貢獻。」
  • 機器學習的五大頂級開源工具
    去年是一個信息自由的好年頭,谷歌、微軟、Facebook、亞馬遜甚至百度等行業巨頭都相繼開放了自己的機器學習框架。這些開原始碼不僅可以培養很多這方面的人才,同時也有助於社區的發展。下面,我們為大家推薦了機器學習的五大開源工具(排名不分先後):  OpenAI  有人擔心機器學習的軍備競賽會使世界上的頂尖大學失去AI人才,因為技術的巨大飛躍會打上某個公司的專有標籤。所以,Elon Musk和他的朋友為OpenAI投資了超過10億美元,而這是一個非盈利的AI研究計劃。
  • DMLC深盟分布式深度機器學習開源平臺解析
    【編者按】算法速度、系統性能以及易用性的瓶頸,制約著目前機器學習的普及應用,DMLC分布式深度機器學習開源項目(中文名深盟)的誕生,正是要降低分布式機器學習的門檻。雖然近年來計算能力得到了大幅提高,但它仍然遠遠不及數據的增長和機器學習模型的複雜化。因此,機器學習算法速度和系統性能是目前工業界和學術界共同關心的熱點。高性能和易用性的開源系統能對機器學習應用的其極大的推動作用。但我們發現目前兼具這兩個特點的開源系統並不多,而且分散在各處。因此我們聯合數個已有且被廣泛使用的C++分布式機器學習系統的開發者,希望通過一個統一的組織來推動開源項目。
  • 【乾貨】去年最火的機器學習開源項目集錦(上)
    近日,Mybridge在Medium上公布了統計的2017年度最受歡迎的機器學習開源項目,包含了各類機器學習庫、開源數據集以及相關項目應用。
  • 微軟新推三款機器學習工具 幫助開發者打造強AI應用
    在 美國佛羅裡達州奧蘭多舉行的 微軟 Ignite 大會上,微軟展示了雲計算、人工智慧、混合現實技術驅動的多項微軟產品。而在此之中,頗值得開發者關注的,是微軟為那些想開發 AI 應用的開發者推出了一系列機器學習的工具及學習模型。
  • 盤點微軟最應該開源的 15 款產品 - OSCHINA - 中文開源技術交流社區
    他們先是向Linux內核貢獻代碼,還開放了.NET核心、Visual Studio Code編輯器、甚至是Chakra JavaScript引擎(IE瀏覽器和Edge所用)的原始碼,而在和公司內部的開發者進行了漫長的談判之後,微軟最近又對博客工具Windows Live Writer進行了開源。可實際上,作為一家軟體巨頭,微軟還有不少產品都應該進行開源。
  • 微軟為Azure發布了開源模糊測試框架ProjectOneFuzz
    日前,微軟宣布發布了一款Azure的開源模糊測試框架Project OneFuzz,過去一年,這家科技巨頭一直在內部使用該框架來查找和修補漏洞。Project OneFuzz被微軟描述為一個可擴展的模糊測試框架,旨在解決一些通常與模糊測試相關的挑戰,使開發人員能夠自己進行這種類型的測試,並允許安全工程師專注於其他重要的任務。該公司說,它已經在內部為Windows、Edge和其他產品使用了Project OneFuzz。
  • 10 個頂尖的 Linux 開源人工智慧工具
    官方網站:http://caffe.berkeleyvision.org/H20 是一個開源的,快速的,可擴展和分布式的機器學習框架,還有框架配備的算法。MLlib是一個開源的,易於使用和高性能的機器學習庫,作為Apache Soark的一部分而開發。本質上它易於部署,並且可以在現有的 Hadoop 群集和數據上運行。