值得推薦的五大開源在線機器學習環境

2021-01-11 騰訊網

【51CTO.com快譯】機器學習是一個研究領域,讓機器無需直接編程就能學習。由於許多學生、教師、開發者和數據科學家使用機器學習來開發各種項目和產品,機器學習開發方興未艾。然而,開發機器學習模型對系統規格有很高的要求,因為有時模型訓練過程可能需要2小時到2天甚至更久。因此,低端系統無力處理機器學習模型的訓練;就算勉強可以訓練模型,也很可能會出現嚴重的系統問題。

然而有許多開源機器學習環境可用,它們對系統規格沒有任何要求,可使用雲基礎架構在最短的時間內訓練模型。以下是幾種高效和常用的在線機器學習環境:

1. Google Colaboratory

這是谷歌提供的一項易於訪問的雲服務,用於開發產品和項目。它支持免費的GPU,基於Jupyter Notebooks環境。它為所有人提供了一個論壇,以便使用廣泛使用的庫(比如PyTorch、TensorFlow和Keras),構建機器學習和深度學習應用。它讓您的系統可以不必處理機器學習活動的全部工作量。它是同類中最成功的平臺之一。

內存—12 GB至26.75 GB

磁碟空間—25 GB

CPU核心—2個

支持的語言—Python

2. IBM Watson

IBM推出了支持開源解決方案的Watson數據平臺和數據科學體驗(DSX)。它終於推出了可自由選擇的多雲平臺,以處理數據科學工作。這是藉助通過Kubernetes實行容器化來實現的。因而,它可以分布在存儲數據的Docker或CloudFoundry容器中。

內存—16GB

磁碟空間—90 GB

CPU核心—4個

支持的語言—Apache Spark、Python、R和Scala

3. Kaggle Kernel

這是面向雲端深度學習和機器學習應用的出色平臺。 Kaggle和Colab有諸多相似之處,都是谷歌的產品。它在瀏覽器中支持Jupyter Notebooks。Jupyter Notebooks的許多鍵盤快捷方式與Kaggle幾乎相同。Kaggle擁有龐大的數據集,還有廣泛的社區致力於宣傳、學習和驗證數據科學技能。GPU和TPU的使用在Kaggle內核中有一些方面的限制。

內存—25GB

磁碟空間—155 GB

CPU核心—1個

支持的語言—Python和R

4. Coclac

它是用於計算、研究、協作和編寫文檔的虛擬在線工作區。這包括使用各種科學語言,提供LaTeX、R/knitr或Markdown中的創作文本功能、基於Web的Linux控制臺、時間旅行功能以及聊天室和課程管理等網絡資源。然而,其大多數功能僅供付費用戶使用。

內存—16GB

磁碟空間—20 GB

CPU核心—3個

支持的語言—Julia、Octave、Python、SageMath和R Statistics等

5. Microsoft Azure

微軟的Azure Notebooks在功能上與Colab相似,但以速度取勝,這方面比Colab好得多。Azure Notebooks是一系列連結筆記本,名為Libraries(庫)。這些庫還能存儲您的數據,假設每個數據文件都小於100MB。Azure Notebooks更適合基本應用。Azure僅提供12個月的免費服務。

內存—可變

磁碟空間—可變

CPU核心—可變

支持的語言—Python、R和F#

原文標題:Top 5 Open-Source Online Machine Learning Environments,作者:Rituraj Saha

【51CTO譯稿,合作站點轉載請註明原文譯者和出處為51CTO.com】

相關焦點

  • 2018 年度 GtiHub 開源項目 TOP 25:數據科學 & 機器學習
    ,致力於為使用機器學習和人工智慧推動人類進步找到新途徑。2018 這一年中,作者在每個月都會發布一份開源項目月度推薦榜單,而本文則是對全年開源項目的盤點和總結。雷鋒網 AI 科技評論編譯如下。前沿關於託管代碼、與團隊成員合作以及充當展示個人寫代碼技能的「在線簡歷」,最好的平臺是哪個?問及任何一位數據科學家,他們都會讓你去 GitHub。
  • 6月,機器學習最受歡迎的十大開源項目
    過去的一個月中,我們在將近250個機器學習開源項目中,綜合各種條件進行打分排序,最終評選出十大最新、最棒的機器學習開源項目。這份Top10名單包括NLP構架、圖像壓縮等項目。它們在GitHub上的平均標星數量是760多顆。希望你可以從中找到感興趣的項目。
  • 騰訊首個 AI 開源項目 Angel 發布 3.0 版本:邁向全棧機器學習平臺
    同年,Angel 加入 Linux 旗下深度學習基金會(現已更名為 LF AI 基金會(LF AI Foundation)),結合基金會成熟的運營,全面升級的 Angel 2.0 與國際開源社區繼續深入互動,致力於讓機器學習技術更易於上手研究及應用落地的目標。下面繼續看看 Angel 3.0 裡程碑版本值得關注的新特性。
  • 開發者必備:基於Linux生態的十大AI開源框架盤點
    Deeplearning4j:為Java用戶量身定製Deeplearning4j(Deep Learning For Java)是Java和Scala環境下的一個開源分布式的深度學習項目H2O:企業級機器學習框架H2O(即水的化學式)是一個開源、快速、可擴展的分布式機器學習框架,同時提供了大量的算法實現。
  • QRBTF - 製作漂亮有趣二維碼的免費開源在線工具
    這是一個手機和電腦通用在線應用,用來生成各種設計感強、好玩有趣的二維碼。介紹無論是線下商家、自媒體運營者、策展人還是紙媒編輯,二維碼都是轉化最重要的入口。今天給大家推薦的工具就可以用來生成非常個性、充滿設計感的二維碼!
  • 開發者必備:基於 Linux 生態的十大AI開源框架盤
    Deeplearning4j:為Java用戶量身定製Deeplearning4j(Deep Learning For Java)是Java和Scala環境下的一個開源分布式的深度學習項目H2O:企業級機器學習框架H2O(即水的化學式)是一個開源、快速、可擴展的分布式機器學習框架,同時提供了大量的算法實現。
  • 五大維度揭秘機器學習技術「附下載...
    並在 1956 年正式提出了「機器學習」這一概念。本期的智能內參,我們推薦清華人工智慧研究院的研究報告《人工智慧之機器學習》,從機器學習的發展史、技術特點、人才概況、行業應用和未來趨勢五大維度剖析機器學習技術。本期內參來源:清華人工智慧研究院原標題:《人工智慧之機器學習 》作者:未註明一、什麼是機器學習?
  • 阿里正式開源通用算法平臺Alink,「雙11」將天貓推薦點擊率提升4%
    除了支持阿里自己的平臺外,還支持 Kafka,HDFS 和 HBase 等一系列開源數據存儲平臺。 阿里雲計算和機器智能部門表示,開發者和數據分析師可以利用開原始碼來構建軟體功能,例如統計分析、機器學習、實時預測、個性化推薦和異常檢測。而 Alink 提供的一系列算法,可以幫助處理機器學習任務,例如 AI 驅動的客戶服務和產品推薦。
  • 機器學習最佳統計書籍推薦
    幾乎每一個機器學習項目中都離不開統計方法。所以需要基礎的統計相關基礎知識和方法對機器學習和AI必不可少。我們說AI不是神話,AI是數學算法,說明紮實數學基礎是做AI的必須,而統計學知識尤其是如此。這意味著重要的是要牢固掌握統計學主要發現的基礎和相關統計方法的工作知識。
  • 選機器學習課程怕踩雷?有人幫你選出了top 5優質課
    選自Medium作者:LearnDataSci機器之心編譯本文作者在多年研究在線學習圖景、在不同平臺註冊大量機器學習課程後,收集了目前最好的 5 門機器學習課程。機器學習根植於統計學,正在逐漸成為最有趣、發展最快的計算機科學領域之一。機器學習可應用到無數行業和應用中,使其更加高效和智能。
  • 推薦一些 GitHub 上值得前端學習的開源實戰項目,進階必看!
    項目作者還搭配了一些教程文章,很值得看!地址:https://github.com/PanJiaChen/vue-element-admin2. blog-vue-typescript此項目是基於 Vue 全家桶 + TypeScript + Element-UI 技術棧的簡潔時尚博客網站。
  • 15 個開源的頂級人工智慧工具
    (點擊上方公眾號,可快速關注)英文:datamation譯文:Linux中國/Chao-zhi連結:linux.cn/article-7830-1.htmlArtificial intelligence,AI是科技研究中最熱門的方向之一。
  • 程式設計師經常看的開源月刊《HelloGitHub》第 57 期
    同時開源引擎底層代碼完全開源,開發者可以閱讀和貢獻代碼,而不是只停留在遊戲邏輯開發層面。總而言之 Godot 是一個極有潛力的遊戲引擎,推薦給想學習遊戲開發的同學CSS 項目5、water.css:一個專門為簡單頁面和示例網頁準備的 CSS 框架Go 項目6、fyne:一款 Go 語言跨平臺 UI 庫。
  • 開源機器人自學指南
    我沒有太好的視頻推薦,不妨也看看 Gilbert Strange 的《微積分重點》?5.理論力學:機器人學就是每天與力打交道。但是一般機器人教材裡都不會仔細推導空間變換、虛功原理、拉格朗日等力學理論,而且這些東西又相對抽象,很多初學者的自學過程就是被截殺在動力學章節的。當然,這部分我也沒有太好的推薦資料,學堂在線上有清華高雲峰老師的《理論力學》公開課,也可以參考一下。
  • 機器學習在領英的規模化應用
    這篇文章將討論領英如何規模化利用技術,幫助更多工程師提升機器學習的效率。近日,領英中國機器學習研發經理李子在IEEE數據挖掘國際會議(ICDM)上分享了領英是如何規模化開展機器學習,介紹領英的核心產品以及如何利用技術幫助更多工程師提升機器學習的效率。
  • 機器人結構工程師薪資_中國機器學習工程師薪資 - CSDN
    這裡簡單介紹下機器學習的三大塊:傳統的機器學習ML、圖像處理CV、自然語言處理NLP再推薦一個入門神器:Kaggle(www.kaggle.com)這是一個世界級的最權威的機器學習比賽,已被谷歌收購。開源的世界,美好的世界❤「開源」,我的愛!代碼屆裡開源的中心思想就是,share and free對於機器學習,網上的社區氛圍特別好,分享的很多很全面,而且MLer都非常樂於助人。
  • 適用於數據項目的7種強大的開源工具 - CIO頻道 - 企業網D1Net...
    功能強大的數據項目開源工具將使企業的業務更加無縫和功能化。 無論是數據科學專業人士還是想要幫助企業成功地完成數據科學項目的IT部門,需要使用一些必不可少的數據科學工具。 以下是值得考慮的一些開源工具: 1.
  • 字節跳動:開源Fedlearner框架,廣告投放增效209%
    作為分布式的機器學習範式,聯邦學習能夠有效解決數據孤島問題,讓參與方在不共享數據的基礎上聯合建模,挖掘數據價值。近兩年,聯邦學習技術發展迅速,阿里、騰訊、百度、京東、螞蟻金服、微眾銀行等一眾網際網路大廠、金融科技公司皆涉足其中。前不久,字節跳動聯邦學習技術團隊也開源了自研的聯邦學習平臺 Fedlearner 。
  • 三張圖讀懂機器學習:基本概念、五大流派與九種常見算法
    機器學習和人工智慧的關係 機器學習是一種重在尋找數據中的模式並使用這些模式來做出預測的研究和算法的門類。機器學習是人工智慧領域的一部分,並且和知識發現與數據挖掘有所交集。更多解讀可參閱《一文讀懂機器學習、數據科學、人工智慧、深度學習和統計學之間的區別》。
  • 【BDTC先睹為快】百度沈國龍:BML百度大規模機器學習雲平臺實踐
    有多年大數據、商業智能、機器學習的研發經驗,在廣告、推薦等業務領域有深厚的知識積累。先後負責百度大規模機器學習算法平臺BML、分布式計算框架ELF、百度深度學習平臺Paddle等的設計研發,在提升機器學習算法分布式計算規模和效率的同時,這個產品組合支持了百度所有重要部門的機器學習需求,先後成功上線上百個智能應用。