開發者必備:基於 Linux 生態的十大AI開源框架盤

2020-12-05 開源中國

本文將從開發者的角度出發,特別是針對開發者中為數眾多的Linux系統和Mac系統用戶,奉上一篇針對泛Linux生態的頂級人工智慧開源工具盤點(當然,有些工具也並非只兼容Linux)。

1. Deeplearning4j:為Java用戶量身定製

Deeplearning4j(Deep Learning For Java)是Java和Scala環境下的一個開源分布式的深度學習項目,由總部位於美國舊金山的商業智能和企業軟體公司Skymind牽頭開發,並得到了騰訊的投資。正如它的命名,Deeplearning4j的運行需要Java虛擬機JVM的支持。

Deeplearning4j團隊在官網表示,他們希望通過一些深度學習算法的開發,將商業帶入智能化數據的時代。也正是為了實現這一理想,惠及更多的用戶,因此選擇了移植性更好的Java環境來實現這些算法。目前,Deeplearning4j的這些算法已經在谷歌、Facebook和微軟等平臺得到了廣泛應用。

值得一提的是,為了便於開發者自由定製,Deeplearning4j已經開放了儘可能多的算法調節接口,並對接口參數做出了詳盡解釋。同時,Deeplearning4j團隊還開發了針對矩陣運算的ND4J和ND4S庫(N-Dimensional Arrays for Java/Scala),同樣需要JVM的支持。

Deeplearning4j遵循Apache 2.0開源協議,提供了基於AWS雲服務的GPU運算支持,以及微軟伺服器框架的支持。

官網: http://deeplearning4j.org/

2. Caffe:廣受歡迎的深度學習框架

Caffe的全稱是 「Convolution Architecture For Feature Extraction」,意為「用於特徵提取的卷積架構」,主要開發者來自伯克利大學的視覺與學習中心(Berkeley Vision and Learning Center,BVLC),基於BSD 2-Clause開源許可協議發布。

Caffe是業內著名的深度學習框架, 根據官網介紹 ,其主要特點是:運算速度快(官方顯示在單片NVIDIA K40 GPU的運算能力下,Caffe每天可以處理超過60M的圖片數據),模塊定製方便(在CPU或GPU之間的轉換隻需要簡單修改一下參數設定),擴展能力強大(目前有超過一千名開發者基於Caffe開發了分支版本 ),以及豐富的社區支持(Caffe已經被授權給各種研究機構、初創公司和工業集團),因此特別適合於神經網絡建模和圖像處理任務。

官網: http://caffe.berkeleyvision.org/

3. H2O:企業級機器學習框架

H2O(即水的化學式)是一個開源、快速、可擴展的分布式機器學習框架,同時提供了大量的算法實現。它支持深度學習、梯度推進(Gradient Boosting)、隨機森林(Random Forest)、廣義線性模型(即邏輯回歸,彈性網絡)等各種機器學習算法。

H2O框架的核心代碼由Java編寫,數據和模型通過分布式的key/value存儲在各個集群節點的內存中,算法使用Map/Reduce框架實現,並使用了Java中的Fork/Join機制來實現多線程。

H2O是一個更關注企業用戶的人工智慧分析工具,它聚焦於為掌握大量數據的企業用戶提供快速精準的預測分析模型,從海量數據中提取有助於商業決策的信息。

根據H2O官方的數據,目前已經有超過7萬名數據科學家和8萬家組織機構成為了H2O平臺的忠實擁躉。

官網: http://www.h2o.ai/

4. MLlib:基於Spark框架的機器學習算法實現庫

MLlib是Apache開源項目Spark針對一些常用的機器學習算法的實現庫,同時也包括了相關的測試程序和數據生成器。

按照官網的描述,MLlib的主要特點是易用(天生兼容Spark框架的API接口和Python、Java、Scala等多種語言)、高性能(依靠Spark的數據管理能力,運行迭代和邏輯回歸算法時比Hadoop框架快100倍)和易於部署(可以直接在現有的Hadoop數據集群上運行)。

MLlib目前支持分類、回歸、推薦、聚類、生存分析等多種機器學習算法。

官網: https://spark.apache.org/mllib/

5. Apache Mahout:Hadoop廣泛採用的機器學習開源框架

Apache Mahout同樣也是一個Apache開源項目,與MLlib相對應,Mahout是應用在Hadoop平臺下的機器學習開源框架。

Mahout有如下三個主要特點:

1) 提供簡單、可擴展的編程環境和框架;

2) 同時為Scala + Apache Spark、H2O以及Apache Flik平臺提供打包好的算法實現;

3) 支持R語言的語法規則進行矩陣計算。

官網: http://mahout.apache.org/

6. OpenNN:專注神經網絡的實現庫

OpenNN的全稱為「Open Neural Networks Library」,即開源神經網絡庫,其核心代碼由C++編寫,從名字就可以看出,其主要面向深度學習領域,助力於用戶構建各種不同的神經網絡模型。

據官方描述,OpenNN可用於實現監督學習場景中任何層次的非線性模型,同時還支持各種具有通用近似屬性的神經網絡設計。

除了模型的多層支持外,OpenNN最主要優勢還在於強大的性能表現。具體來說就是,OpenNN能夠通過C++語言實現的核心代碼高效地調節內容使用,通過OpenMP庫很好地平衡多線程CPU調用,以及通過CUDA工具對GPU進行加速。

官網: http://www.opennn.net/

7. Oryx 2:重新設計了Lambda架構

Oryx 2是Oryx項目的2.0版,前身名為 Myrrix,後來被大數據公司 Cloudera 收購,才改名為 Oryx。

Oryx 2.0關注於大規模機器學習/預測分析基礎框架的實時表現,它基於Apache Spark和Apache Kafka框架開發,並重新設計了Lambda架構,使得層次之間的復用性更強。

2.0版相比之前實現了更多算法,包括ALS協同過濾、隨機森林、以及K-means++等。

官網: http://oryx.io/

8. OpenCyc:全球最龐大、最完備的通用型知識庫與常識推理引擎

OpenCyc是Cycorp公司推出的一個基於Cyc的開源版本,而Cyc是目前全球最龐大、最完備的通用型知識庫與常識推理引擎。

OpenCyc包含數十萬個精心組織的Cyc詞條。Cycorp公司不但免費提供OpenCyc,同時也鼓勵開發者基於OpenCyc開發針對於特定應用領域的分支版本。

目前,OpenCyc已經被成功應用在大數據建模、語言數據整合、智能文本理解、特定領域的專家系統建模和人工智慧遊戲。

官網: http://www.cyc.com/platform/opencyc/

9. Apache SystemML:專注於大數據分析的開源機器學習平臺

SystemML是一個利用機器學習算法進行大數據分析的開源AI平臺,其主要特點是支持R語言和Python的語法,專注於大數據分析領域,以及專門為高階數學計算設計。

按照官網的介紹,Apache SystemML基於Apache Spark框架運行,其最大的特點就是能夠自動、逐行地評估數據,並根據評估結果確定用戶的代碼應該直接運行在驅動器上還是運行在Apache Spark集群上。

除了Apache Spark之外,SystemML還支持Apache Hadoop、Jupyter和Apache Zeppelin等多個平臺。目前,SystemML技術已經成功應用在交通、航空和金融等多個領域。

官網: http://systemml.apache.org/

10. NuPIC:基於層級實時存儲算法的機器智能平臺

NuPIC是一個與眾不同的開源機器智能平臺,它基於一種大腦皮層理論,即「層級實時存儲算法」(Heirarchical Temporary Memory,HTM)。NuPIC聚焦於分析實時數據流,可以通過學習數據之間基於時間的狀態變化,對未知數據進行預測,並揭示其中的非常規特性。

NuPIC關鍵的功能特性包括:

1) 持續的在線學習:NuPIC模型可以持續根據快速變化的數據流進行實時調整;

2) 時間和空間分析:像人腦一樣,NuPIC可以同時模擬時間和空間的變化;

3) 實時的數據流分析:智能化的數據分析不會隨著數據量的增加而改變;

4) 預測和建模:通過通用性的大腦皮層算法,對數據進行預測、建模和學習;

5) 強大的異常檢測能力:實時檢測數據流的擾動,不依靠僵化的閾值設置和過時的算法;

6) 層級實時存儲算法:支持全新的HTM計算架構。

官網: http://numenta.org/

由於2016僅僅是人工智慧走向主流的元年,未來隨著技術的進一步發展和革新,勢必會出現更多、更豐富的開發工具。這裡值得注意的一點是:工具的意義不僅在於解決了日常研發中遇到的各種問題,更在於降低了開發的難度,引導了更多人投入到人工智慧的研發之中。 

稿源:雷鋒網

相關焦點

  • 開發者必備:基於Linux生態的十大AI開源框架盤點
    與此前不同,本文將從開發者的角度出發,特別是針對開發者中為數眾多的Linux系統和Mac系統用戶,奉上一篇針對泛Linux生態的頂級人工智慧開源工具盤點(當然,有些工具也並非只兼容Linux)。1.Deeplearning4j遵循Apache 2.0開源協議,提供了基於AWS雲服務的GPU運算支持,以及微軟伺服器框架的支持。官網:http://deeplearning4j.org/2.
  • Vuetify - 廣受歡迎的 Material Design 風格的開源 UI 框架
    全世界範圍內廣受歡迎的 Vue UI 框架,一個非常精緻的 Material Design UI 套件。Material Design 風格 UI 框架Vuetify 是一個基於 Vue.js 精心打造 UI 組件庫,整套 UI 設計為 Material 風格。
  • 2020年成國內深度學習框架開源元年 曠視科技開源天元加速AI落地與...
    人工智慧時代,開源作為算法創新與迭代的重要驅動力,在深度學習領域發揮著至關重要的作用。全球諮詢機構IDC《中國深度學習平臺市場份額調研》指出,在AI技術使用方面,接受調研的企業和開發者中,86.2%選擇使用開源的深度學習框架。
  • 搜狗開源srpc:自研高性能通用RPC框架
    今年7月底,搜狗公司開源了內部的工業級C++伺服器引擎Workflow,一路收穫業內許多認可和關注。9月15日,作為Workflow最重要的生態項目——srpc,一個基於其打造的輕量級RPC框架,也在GitHub上開源了。GitHub搜索「sogou srpc」即可找到該項目。
  • 華為開源自研AI框架MindSpore!自動微分、並行加持,一次訓練,可多...
    乾明 發自 凹非寺  量子位 報導 | 公眾號 QbitAI  華為的開源AI框架,來了!  剛剛,華為宣布正式開源自研深度學習框架MindSpore,代碼已經上線。  第三種是基於源碼轉換的通用自動微分,也就是MindSpore採用的技術。  這種方法,源以函數式編程框架為基礎,以即時編譯(JIT)的方式在中間表達上做自動微分變換,支持複雜控制流場景、高階函數和閉包。
  • 「開發者的2018」GAN、AutoML、統一框架、語音等十大趨勢
    【新智元導讀】本文從開發者的角度,總結了GAN、AutoML、語音識別、NLP等已經可以用於實際產品的技術,以及值得關注的新趨勢。作者認為,有ONNX這類的統一格式,Caffe Zoo等模型庫,以及AutoML等自動化工具,製作基於AI的應用已經變得非常容易。GAN與造假雖然生成對抗網絡幾年前就出現了,我對它是相當懷疑的。
  • 什麼是開源生態系統最重要的部分
    基於精英管理的文化。一個「實幹家」的哲學。如果你不貢獻,人們就不會聽你的。「語言很便宜,給我看代碼,」著名的開發者Linus Torvalds說。看看是否長久 - 代碼背後有一家公司,他們為什麼要構建它,他們會繼續支持它,更新的頻率是多少?積極的貢獻者機制和社區積極的論壇社區,尋求幫助和支持。有些項目技術很好,但很難獲得幫助。例如,Docker社區非常強大。這是開源的價值。
  • Facebook新框架Ax和BoTorch雙雙開源
    新智元報導 來源:towardsdatascience編輯:大明【新智元導讀】近日,Facebook開源了兩款基於PyTorch的實驗框架Ax和BoTorch。Ax是一個面向自適應實驗的理解、管理、部署和自動化任務的通用平臺,BoTorch則主要面向貝葉斯優化任務。這兩個框架旨在簡化PyTorch應用中的自適應實驗流程。
  • 國產開源這一年,好生熱鬧
    深度學習框架秉持著承上啟下的作用,上承應用,下接晶片,堪稱智能時代的核心支柱,它幫助開發者直接使用成熟的工具,大幅提高開發效率。開源深度學習框架之所以能夠成為各企業布局AI的重要選擇,也就不難理解了。AI發展,深度學習框架開源成為必然開源,是聚集開發者最簡單且有效的方式。企業可以圍繞開源框架構建技術人才團隊,研發新技術,打造業務生態閉環。
  • 華為深度學習框架MindSpore正式開源:自動微分不止計算圖
    今年的華為開發者大會 HDC 2020 上,除了昇騰、鯤鵬等自研晶片硬體平臺之外,最令人期待的就是深度學習框架 MindSpore 的開源了。今天上午,華為 MindSpore 首席科學家陳雷在活動中宣布這款產品正式開源,我們終於可以在開放平臺上一睹它的真面目。
  • 2019年中國KubeCon和開源峰會日程新鮮出爐
    「Linux 基金會在中國舉辦的活動吸引了大批的參與者,因此我們決定增大對開發者和決策者的支持力度,為他們提供新的高質量路徑和活動,涵蓋更為廣泛的開源技術和項目。」Linux 基金會執行董事 Jim Zemlin 說:「我們很興奮在中國舉行這樣大規模的綜合活動,藉此和亞洲從事創新開源工作的開發者們深化彼此的關係!」
  • ImagePy——UI界面支持開放插件的Python開源圖像處理框架
    在 github:https://github.com/Image-Py/imagepy 上,不僅有關於這款圖像處理軟體的詳細介紹,還有一些使用示例,雷鋒網 AI 科技評論接下來將詳細介紹這一開源圖像處理框架。
  • 英特爾:在開源生態系統各個層次展開合作
    10月23日,由Intel、Greatlinux、Turbolinux、Zend、MySQL、Comsenz以及PHPChina.com網站聯合主辦的「2006 LAMP開源實務應用高峰論壇」在北京翠宮飯店隆重召開。英特爾中國開源技術中心高級經理馮曉焰講演,以下是全文。        尊敬的陸主席,各位來賓,下午好!
  • 百度開源2020年度報告:兩大開源平臺、九個捐贈項目
    一、20個技術領域持續開源截止2020年底,在GitHub/Gitee百度官方組織下已經圍繞著安全、監控、知識圖譜、網絡與接入、視覺、量子計算、開發框架等20個技術領域開源了86個項目,其中自然語言處理、開發框架與前端領域的開源項目數佔比超過50%。
  • 35 萬行代碼,曠視重磅開源天元深度學習框架 ,四大特性實現簡單開發
    本次發布為Alpha版本,基於ApacheLicense2.0,向外界共開源約35萬行代碼,包括C++、CUDA和Python代碼,在GitHub上進行發布。  發布會上,曠視研究院高級技術總監田忠博詳細介紹了這款剛剛正式對外開源的深度學習框架。
  • 構建AI生態「朋友圈」之江實驗室發布「天樞」人工智慧開源開放平臺
    「天樞」人工智慧開源開放平臺2日在浙江杭州正式發布。該平臺具備高性能核心計算框架,提供一站式全功能AI開發套件,將提升人工智慧技術的研發效率、擴大算法模型的應用範圍,進一步構建人工智慧生態「朋友圈」。據介紹,該平臺由之江實驗室牽頭,聯合浙江大學、阿里巴巴等多單位共同研發打造。
  • VPF:適用於 Python 的開源視頻處理框架,加速視頻任務、提高 GPU...
    雷鋒網 AI 開發者按:近日,NVIDIA 開源了適用於 Python 的視頻處理框架「VideoProcessingFramework(VPF)」。該框架為開發人員提供了一個簡單但功能強大的 Python 工具,可用於硬體加速的視頻編碼、解碼和處理類等任務。
  • 騰訊優圖開源深度學習推理框架TNN 助力AI開發降本增效
    一方面,它以「授人以漁」的方式為AI構建了一個開放共進的生態環境,幫助行業加速AI應用落地;另一方面,在解決行業實際問題時持續更新和迭代,源源不斷地給AI領域輸送重要的技術養料和創造力,可以說開源是AI落地和繁榮不可或缺的源動力。  6月10日,騰訊優圖實驗室宣布正式開源新一代移動端深度學習推理框架TNN,通過底層技術優化實現在多個不同平臺的輕量部署落地,性能優異、簡單易用。
  • 中國工程院高文院士:為什麼中國要打造自己的 AI 開源開放生態?
    成立一年來,OpenI 啟智社區匯聚了鵬城實驗室、北京智源研究院等頂級新興科研平臺,華為、百度、微眾銀行、商湯、騰訊等 AI 龍頭企業,北京大學、國防科技大學、北京航空航天大學等知名高校,培育並發布了 11 個開源項目,開創了學術與產業融合、標準與開源雙引擎驅動的聯盟 - 基金會治理模式,確立了基礎設施、軟體及數據環境、AI 框架等基礎平臺並全面運行。
  • 國產信息基礎軟硬體行業深度報告:開源、遷移、上雲、生態
    外部開發者 參與開源項目的貢獻,可以作為重要的履歷也可作為發揮個人創意的方式。適度的使用開源資源, 是企業和開發者的雙贏局面。3. 遷移:適應生態現狀的必要舉措,影響實際推進順利程度 遷移成本將成為國產軟硬體信創推廣的重要考量,本質取決於生態建設的進度。