ML.NET 0.7 發布,微軟開源的跨平臺機器學習框架

2021-01-18 開源中國

微軟發布了 ML.NET 0.7,此版本側重於為基於推薦的機器學習任務提供更好的支持,主要實現了異常檢測、增強了機器學習 pipeline 的可定製性,並且支持在 x86 應用程式中使用等。

ML.NET 是一個跨平臺的機器學習框架,旨在讓 .NET 開發者更快上手機器學習,它允許 .NET 開發者開發他們自己的模型,並將自定義 ML 注入到應用程式中。

0.7 主要更新內容:

使用 Matrix Factorization 增強對推薦任務的支持

推薦系統可以為目錄、歌曲、電影等中的產品生成推薦列表,通過添加矩陣分解(Matrix Factorization,MF)改進了對在 ML.NET 中創建推薦系統的支持。MF 通常情況下比 ML.NET 0.3 中引入的 Field-Aware Factorization Machines 明顯更快,並且它可以支持連續數字等級(例如 1-5 星)而不是布爾值的等級(「喜歡」或「不喜歡」)。

啟用異常檢測方案

異常檢測用於欺詐檢測(識別可疑信用卡交易)和伺服器監控(識別異常活動)等場景。

ML.NET 0.7 支持檢測兩種類型的異常行為:

改進了 ML.NET pipeline 的可定製性

ML.NET 提供各種數據轉換(例如處理文本、圖像、分類特徵等)。但是,某些用例需要特定於應用程式的轉換,例如計算兩個文本列之間的餘弦相似度。0.7 中添加了對自定義轉換的支持,可以輕鬆地包含自定義業務邏輯。

CustomMappingEstimator 用於編寫自己的方法以處理數據並將它們帶入 ML.NET pipeline:

var estimator = mlContext.Transforms.CustomMapping<MyInput, MyOutput>(MyLambda.MyAction, "MyLambda")    .Append(...)    .Append(...)

以下是此自定義映射將執行操作的定義。在此示例中,將文本標籤(「spam」或「ham」)轉換為布爾標籤(true 或 false):

public class MyInput{    public string Label { get; set; }}public class MyOutput{    public bool Label { get; set; }}public class MyLambda{    [Export("MyLambda")]    public ITransformer MyTransformer => ML.Transforms.CustomMappingTransformer<MyInput, MyOutput>(MyAction, "MyLambda");    [Import]    public MLContext ML { get; set; }    public static void MyAction(MyInput input, MyOutput output)    {        output.Label= input.Label == "spam" ? true : false;    }}

支持 x86

ML.NET 此前僅限於 x64 設備,0.7 將其引入了 x86 32 位設備,不過需要注意,某些基於外部依賴項的組件(例如 TensorFlow)在 x86 中將不可用。

詳情見發布公告。

相關焦點

  • 開發者必備:基於Linux生態的十大AI開源框架盤點
    Deeplearning4j遵循Apache 2.0開源協議,提供了基於AWS雲服務的GPU運算支持,以及微軟伺服器框架的支持。官網:http://deeplearning4j.org/2.官網:https://spark.apache.org/mllib/5. Apache Mahout:Hadoop廣泛採用的機器學習開源框架Apache Mahout同樣也是一個Apache開源項目,與MLlib相對應,Mahout是應用在Hadoop平臺下的機器學習開源框架。
  • 開發者必備:基於 Linux 生態的十大AI開源框架盤
    Deeplearning4j遵循Apache 2.0開源協議,提供了基於AWS雲服務的GPU運算支持,以及微軟伺服器框架的支持。官網: http://deeplearning4j.org/2.」,主要開發者來自伯克利大學的視覺與學習中心(Berkeley Vision and Learning Center,BVLC),基於BSD 2-Clause開源許可協議發布。
  • 陳天奇創業公司首個SaaS產品:快速構建部署ML應用,跨平臺優化
    總而言之:機器學習依然困難。雖然很多科技巨頭都在大力招聘優秀人才,但在機器學習社區中,所有人都會遇到以下兩個難題:痛點 1:機器學習庫和服務依然處在低層等級,不能夠很好地抽象複雜性。儘管有很多開源項目力求加快 ML 模型的應用,但是這些項目無疑都需要使用者對底層算法和計算細節有很好的認識。
  • 6月,機器學習最受歡迎的十大開源項目
    過去的一個月中,我們在將近250個機器學習開源項目中,綜合各種條件進行打分排序,最終評選出十大最新、最棒的機器學習開源項目。這份Top10名單包括NLP構架、圖像壓縮等項目。它們在GitHub上的平均標星數量是760多顆。希望你可以從中找到感興趣的項目。
  • 微軟宣布WPF、Windows Forms和WinUI這3個流行框架正式開源
    微軟高管在12月5日的Microsoft Connect();2018年的活動上興奮地宣布新的開源計劃。這表明,微軟3個最流行的Windows框架正在迎來開源。為何開源?Windows開發人員平臺公司副總裁Kevin Gallo表示:「微軟的三個流行的Windows用戶體驗框架已準備好為開發者在GitHub上做出貢獻。開源這些技術的目的,其實是促進產品團隊與社區之間的透明度,有助於Windows開發的民主化,使社區能夠參與並為此做出貢獻。」
  • 2018 年度 GtiHub 開源項目 TOP 25:數據科學 & 機器學習
    ,致力於為使用機器學習和人工智慧推動人類進步找到新途徑。如果你問怎麼學習的話,我可以給你一個暗示——開源項目!世界領先的科技公司通過在 GitHub 上發布其熱門算法的代碼,對項目進行開源。2018 年,在 Google 和 Facebook 等公司的帶領下,這類開源項目大幅增加。其中最好的那部分開源項目,寫代碼的研究者還提供了預訓練模型,從而讓你我這些人不必再浪費時間從頭開始創建高難度的模型。
  • 通過對比深度學習各大框架的優缺點尋找最優
    開源的深度學習神經網絡正步入成熟,而現在有許多框架具備為個性化方案提供先進的機器學習和人工智慧的能力。那麼如何決定哪個開源框架最適合你呢?本文試圖通過對比深度學習各大框架的優缺點,從而為各位讀者提供一個參考。你最看好哪個深度學習框架呢?
  • 開源多媒體框架FFmpeg 4.1 「al-Khwarizmi」發布
    FFmpeg項目組於今天正式發布了FFmpeg 4.1版本。這也是被多媒體應用和遊戲廣泛使用的開源、跨平臺多媒體框架的首次重大更新。FFmpeg 4.1代號「al-Khwarizmi」,和2018年4月發布的FFmpeg 4.0「Wu」相隔6個月。
  • 谷歌推出TFQ,一個可訓練量子模型的機器學習框架
    TensorFlow Quantum(TFQ),一個可快速建立量子機器學習模型原型的開源庫。TFQ提供了必要的工具,將量子計算和機器學習技術結合起來,以控制並建模自然或人工的量子計算系統。而此次TensorFlow Quantum的發布是繼微軟Azure Quantum的推出,以及霍尼韋爾等公司(雷鋒網報導)取得階段性成功之後的又一進步。
  • 騰訊首個 AI 開源項目 Angel 發布 3.0 版本:邁向全棧機器學習平臺
    2019年8月22日,騰訊首個 AI 開源項目 Angel 正式發布 3.0 版本。
  • Silverlight 4跨平臺兼容性遭質疑 微軟正積極解決
    Silverlight 4跨平臺兼容性遭質疑 微軟正積極解決 微軟在Silverlight中添加了很多WPF功能,這可能會損害Silverlight的兼容性。但是微軟指出,他們正在研究如何使得某些COM組件能夠訪問Mac版的Silverlight,該公司將力保Silverlight的跨平臺兼容性。
  • PyTorch 1.0 預覽版發布:90% 的功能能經受住業界的考驗
    早在今年 5 月份的 Facebook F8 大會上,Facebook 就宣布在未來幾個月中將開源 PyTorch 1.0 框架。時隔五個月的今日,Facebook 終於將這一計劃變成了現實。PyTorch 1.0 三大重要更新雷鋒網獲悉,經過五個月左右的開源,PyTorch 1.0 框架主要迎來了三大更新:第一,添加了一個新的混合前端(hybrid front end),支持從 Eager 模式到圖形模式的跟蹤和腳本模型,以彌合研究和生產部署之間的差距。
  • 迎來PyTorch,告別 Theano,2017 深度學習框架發展大盤點
    ,作為當下最熱門的話題,谷歌、Facebook、微軟等巨頭紛紛圍繞深度學習做了一系列研究,一直在支持開源深度學習框架的建設。,力圖促進開放的開發生態CNTK,Keras,MXNet 均迎來重大更新微軟攜手亞馬遜推出 Gluon 深度學習庫,英特爾推出增強學習框架 Coach針對移動終端,Caffe2 和 TensorFlow Lite 先後開源接下來,雷鋒網 AI 科技評論會盤點上述機器學習框架之間的重大發展和改變
  • TensorFlow和Caffe、MXNet、Keras等其他深度學習框架的對比
    Google 近日發布了 TensorFlow 1.0 候選版,這第一個穩定版將是深度學習框架發展中的裡程碑的一步。自 TensorFlow 於 2015 年底正式開源,距今已有一年多,這期間 TensorFlow 不斷給人以驚喜。在這一年多時間,TensorFlow 已從初入深度學習框架大戰的新星,成為了幾近壟斷的行業事實標準。
  • 盤點微軟最應該開源的 15 款產品 - OSCHINA - 中文開源技術交流社區
    在去年,微軟將飛行模擬器授權給了Dovertail(火車和釣魚模擬器開發商),它的新版本可能會在2016年發布。但如果新版軟體是一個和微軟飛行遊戲類似的輕量級版本,那微軟還不如將其交給愛好者社區進行開發和維護。
  • 微軟GitHub 發布 2020 年度報告:TypeScript 上升至第四
    IT之家1月5日消息 GitHub 發布了 2020 年度報告《The 2020 State of the Octoverse》,統計了從 2019 年 10 月到 2020 年 9 月的運行數據。在活躍用戶的地理分布上,北美用戶最多(34%),不過相較於去年北美用戶減少了 2%;亞洲次之(30.7%),亞洲用戶增長了 1.1%。程式語言方面,JavaScript 依然保持了領先地位;Python 自從 2019 年超越 Java 以來,在 2020 年繼續保持了第 2 名的高位。
  • MiniFramework 2.6.0 發布,PHP 開源框架
    MiniFramework 是一款遵循 Apache2 開源協議發布的,支持 MVC 和 RESTful 的超輕量級 PHP 開發框架,在滿足開發者最基礎的 MVC 分層開發、資料庫和緩存訪問等少量功能基礎上
  • 微軟How-Old.net中文版來了!幕後黑科技揭秘
    【天極網IT新聞頻道】五一的時候,微軟推出了一個顏齡識別機器人網站How-Old.net,通過大數據和機器識別技術,判斷照片中人物的年齡,沒想到立即火爆全球,一時間社交網絡上「攀比」成風。  今天,How-Old.net的官方中文版上線了,更方便國內用戶使用。
  • AI 從業者該如何選擇深度學習開源框架丨雷鋒網公開課
    正如程序語言一樣,深度學習開源框架同樣各有優劣和適用的場景,那麼 AI 從業者該如何有針對性地選擇這些平臺來玩轉深度學習?本期公開課特邀了先後在谷歌、亞馬遜、微軟供職的機器學習科學家彭河森博士為大家講述《MXNet火了,AI從業者該如何選擇深度學習開源框架》。彭河森博士親眼見證並深入參與了這三家巨頭布局深度學習的過程。嘉賓介紹彭河森,埃默裡大學統計學博士。現
  • 亞馬遜開源神經機器翻譯框架Sockeye:基於Apache MXNet的NMT平臺
    作為 MXNet 的支持者,亞馬遜也開源了自己的 NMT 框架 Sockeye。在本文中,亞馬遜宣稱這個基於 MXNet 的工具可以用於構建目前業內表現最佳的神經機器翻譯模型。Sockeye GitHub 連結:https://github.com/awslabs/sockeye 說明文檔:http://sockeye.readthedocs.io/en/latest/你想使用機器學習做翻譯嗎?通過 Sockeye 框架,你可以建模機器學習以及其他序列到序列的任務。