15 個開源的頂級人工智慧工具

2021-02-18 Linux中國

人工智慧artificial intelligence,AI是科技研究中最熱門的方向之一。像 IBM、谷歌、微軟、Facebook 和亞馬遜等公司都在研發上投入大量的資金、或者收購那些在機器學習、神經網絡、自然語言和圖像處理等領域取得了進展的初創公司。考慮到人們對此感興趣的程度,我們將不會驚訝於斯坦福的專家在人工智慧報告[1]中得出的結論:「越來越強大的人工智慧應用,可能會對我們的社會和經濟產生深遠的積極影響,這將出現在從現在到 2030 年的時間段裡。」

在最近的一篇文章[2]中,我們概述了 45 個十分有趣或有前途的人工智慧項目。在本文中,我們將聚焦於開源的人工智慧工具,詳細的了解下最著名的 15 個開源人工智慧項目。

開源人工智慧

以下這些開源人工智慧應用都處於人工智慧研究的最前沿。

1. Caffe

它是由賈揚清[3]在加州大學伯克利分校的讀博時創造的,Caffe[4] 是一個基於表達體系結構和可擴展代碼的深度學習框架。使它聲名鵲起的是它的速度,這讓它受到研究人員和企業用戶的歡迎。根據其網站所言,它可以在一天之內只用一個 NVIDIA K40 GPU 處理 6000 萬多個圖像。它是由伯克利視野和學習中心(BVLC)管理的,並且由 NVIDIA 和亞馬遜等公司資助來支持它的發展。

2. CNTK

它是計算網絡工具包Computational Network Toolkit的縮寫,CNTK[5] 是一個微軟的開源人工智慧工具。不論是在單個 CPU、單個 GPU、多個 GPU 或是擁有多個 GPU 的多臺機器上它都有優異的表現。微軟主要用它做語音識別的研究,但是它在機器翻譯、圖像識別、圖像字幕、文本處理、語言理解和語言建模方面都有著良好的應用。

3. Deeplearning4j

Deeplearning4j[6] 是一個 java 虛擬機(JVM)的開源深度學習庫。它運行在分布式環境並且集成在 Hadoop 和 Apache Spark 中。這使它可以配置深度神經網絡,並且它與 Java、Scala 和 其他 JVM 語言兼容。

這個項目是由一個叫做 Skymind 的商業公司管理的,它為這個項目提供支持、培訓和一個企業的發行版。

4. DMTK

DMTK[7] 是分布式機器學習工具Distributed Machine Learning Toolkit的縮寫,和 CNTK 一樣,是微軟的開源人工智慧工具。作為設計用於大數據的應用程式,它的目標是更快的訓練人工智慧系統。它包括三個主要組件:DMTK 框架、LightLDA 主題模型算法和分布式(多義)字嵌入算法。為了證明它的速度,微軟聲稱在一個八集群的機器上,它能夠「用 100 萬個主題和 1000 萬個單詞的詞彙表(總共 10 萬億參數)訓練一個主題模型,在一個文檔中收集 1000 億個符號,」。這一成績是別的工具無法比擬的。

5. H20

相比起科研,H2O[8] 更注重將 AI 服務於企業用戶,因此 H2O 有著大量的公司客戶,比如第一資本金融公司、思科、Nielsen Catalina、PayPal 和泛美都是它的用戶。它聲稱任何人都可以利用機器學習和預測分析的力量來解決業務難題。它可以用於預測建模、風險和欺詐分析、保險分析、廣告技術、醫療保健和客戶情報。

它有兩種開源版本:標準版 H2O 和 Sparking Water 版,它被集成在 Apache Spark 中。也有付費的企業用戶支持。

6. Mahout

它是 Apache 基金會項目,Mahout[9] 是一個開源機器學習框架。根據它的網站所言,它有著三個主要的特性:一個構建可擴展算法的編程環境、像 Spark 和 H2O 一樣的預製算法工具和一個叫 Samsara 的矢量數學實驗環境。使用 Mahout 的公司有 Adobe、埃森哲諮詢公司、Foursquare、英特爾、領英、Twitter、雅虎和其他許多公司。其網站列了出第三方的專業支持。

7. MLlib

由於其速度,Apache Spark 成為一個最流行的大數據處理工具。MLlib[10] 是 Spark 的可擴展機器學習庫。它集成了 Hadoop 並可以與 NumPy 和 R 進行交互操作。它包括了許多機器學習算法如分類、回歸、決策樹、推薦、集群、主題建模、功能轉換、模型評價、ML 管道架構、ML 持久、生存分析、頻繁項集和序列模式挖掘、分布式線性代數和統計。

8. NuPIC

由 Numenta[11] 公司管理的 NuPIC[12] 是一個基於分層暫時記憶Hierarchical Temporal Memory,HTM理論的開源人工智慧項目。從本質上講,HTM 試圖創建一個計算機系統來模仿人類大腦皮層。他們的目標是創造一個 「在許多認知任務上接近或者超越人類認知能力」 的機器。

除了開源許可,Numenta 還提供 NuPic 的商業許可協議,並且它還提供技術專利的許可證。

9. OpenNN

作為一個為開發者和科研人員設計的具有高級理解力的人工智慧,OpenNN[13] 是一個實現神經網絡算法的 c++ 編程庫。它的關鍵特性包括深度的架構和快速的性能。其網站上可以查到豐富的文檔,包括一個解釋了神經網絡的基本知識的入門教程。OpenNN 的付費支持由一家從事預測分析的西班牙公司 Artelnics[14] 提供。

10. OpenCyc

由 Cycorp 公司開發的 OpenCyc[15] 提供了對 Cyc 知識庫的訪問和常識推理引擎。它擁有超過 239,000 個條目,大約 2,093,000 個三元組和大約 69,000 owl:這是一種類似於連結到外部語義庫的命名空間。它在富領域模型、語義數據集成、文本理解、特殊領域的專家系統和遊戲 AI 中有著良好的應用。該公司還提供另外兩個版本的 Cyc:一個可免費的用於科研但是不開源,和一個提供給企業的但是需要付費。

11. Oryx 2

構建在 Apache Spark 和 Kafka 之上的 Oryx 2[16] 是一個專門針對大規模機器學習的應用程式開發框架。它採用一個獨特的三層 λ 架構。開發者可以使用 Orys 2 創建新的應用程式,另外它還擁有一些預先構建的應用程式可以用於常見的大數據任務比如協同過濾、分類、回歸和聚類。大數據工具供應商 Cloudera 創造了最初的 Oryx 1 項目並且一直積極參與持續發展。

12. PredictionIO

今年的二月,Salesforce 收購了 PredictionIO[17],接著在七月,它將該平臺和商標貢獻給 Apache 基金會,Apache 基金會將其列為孵育計劃。所以當 Salesforce 利用 PredictionIO 技術來提升它的機器學習能力時,成效將會同步出現在開源版本中。它可以幫助用戶創建帶有機器學習功能的預測引擎,這可用於部署能夠實時動態查詢的 Web 服務。

13. SystemML

最初由 IBM 開發, SystemML[18] 現在是一個 Apache 大數據項目。它提供了一個高度可伸縮的平臺,可以實現高等數學運算,並且它的算法用 R 或一種類似 python 的語法寫成。企業已經在使用它來跟蹤汽車維修客戶服務、規劃機場交通和連接社會媒體數據與銀行客戶。它可以在 Spark 或 Hadoop 上運行。

14. TensorFlow

TensorFlow[19] 是一個谷歌的開源人工智慧工具。它提供了一個使用數據流圖進行數值計算的庫。它可以運行在多種不同的有著單或多 CPU 和 GPU 的系統,甚至可以在行動裝置上運行。它擁有深厚的靈活性、真正的可移植性、自動微分功能,並且支持 Python 和 c++。它的網站擁有十分詳細的教程列表來幫助開發者和研究人員沉浸於使用或擴展他的功能。

15. Torch

Torch[20] 將自己描述為:「一個優先使用 GPU 的擁有機器學習算法廣泛支持的科學計算框架」,它的特點是靈活性和速度。此外,它可以很容易的通過軟體包用於機器學習、計算機視覺、信號處理、並行處理、圖像、視頻、音頻和網絡等方面。它依賴一個叫做 LuaJIT 的腳本語言,而 LuaJIT 是基於 Lua 的。

via: http://www.datamation.com/open-source/slideshows/15-top-open-source-artificial-intelligence-tools.html

作者:Cynthia Harvey[21] 譯者:Chao-zhi 校對:校對者ID

本文由 LCTT[22] 原創編譯,Linux中國 榮譽推出

[1]: https://ai100.stanford.edu/sites/default/files/ai_100_report_0906fnlc_single.pdf
[2]: http://www.datamation.com/applications/artificial-intelligence-software-45-ai-projects-to-watch-1.html
[3]: http://daggerfs.com/
[4]: http://caffe.berkeleyvision.org/
[5]: https://www.cntk.ai/
[6]: http://deeplearning4j.org/
[7]: http://www.dmtk.io/
[8]: http://www.h2o.ai/
[9]: http://mahout.apache.org/
[10]: https://spark.apache.org/mllib/
[11]: http://numenta.com/
[12]: http://numenta.org/
[13]: http://www.opennn.net/
[14]: https://www.artelnics.com/
[15]: http://www.cyc.com/platform/opencyc/
[16]: http://oryx.io/
[17]: https://prediction.io/
[18]: http://systemml.apache.org/
[19]: https://www.tensorflow.org/
[20]: http://torch.ch/
[21]: http://www.datamation.com/author/Cynthia-Harvey-6460.html
[22]: https://github.com/LCTT/TranslateProject

推薦文章

將文章分享給朋友是對我們最好的讚賞!

相關焦點

  • 15 款頂級開源人工智慧工具推薦
    考慮到人工智慧如此受關注,史丹福大學的專家最近撰寫的一份智能研究報告得出結論:「現在到2030年人工智慧可能會出現越來越有用的應用,有可能給我們的社會和經濟帶來深遠的積極影響,」也就不足為奇了。我們在本文中專注於開源人工智慧工具,著重介紹15個知名度最大的開源人工智慧項目。
  • 15款開源人工智慧軟體綜合介紹
    來源:雷鋒網開源人工智慧人工智慧是目前最熱門的科研領域之一。鑑於目前人工智慧研究領域的火爆程度,史丹福大學的教授們不久前作出了這樣一份報告:「人工智慧軟體的作用越來越強大,而對人類社會、經濟有強大影響力的人工智慧軟體將於2030年前面世」。國外網站Datamation今日整理了目前熱門的15款開源人工智慧軟體,介紹如下:1.Caffe
  • 7種頂級開源網絡監控工具
    通常你和你的經理對監視工具會有不同的要求,其中最大的要求可能是成本。幸運的是,現在有很多免費的企業級基礎架構監視軟體產品,可提供與付費同類產品相同的功能。通過使用正確的工具,你可以監視技術基礎架構的各個方面,並可針對任何出現的問題獲得警報以及預測未來的趨勢。同時,還有開源網絡監視軟體工具可供你選擇。
  • 2016 年十大頂級開源項目
    我們持續關注每年新出現的、成長、改變和發展的優秀開源項目。挑選 10 個開源項目到我們的年度頂級項目列表中並不太容易,而且,也沒有哪個如此短的列表能夠包含每一個應該包含在內的項目。為了挑選 10 個頂級開源項目,我們回顧了作者們 2016 年涉及到的流行的開源項目,同時也從社區管理員收集了一些意見。經過管理員的一番推薦和投票之後,我們的編輯團隊選定了最終的列表。
  • 50個頂級開源營銷應用程式
    考慮到這一新的現實,我們整理了一份頂級開源營銷應用程式列表。特定於營銷的項目位於列表的頂部,而在更遠的地方,您將發現具有值得注意的營銷功能的Web CMS,CRM和ERP項目。與往常一樣,如果您知道您認為應列入我們列表的其他項目,請隨時在下面的評論部分進行說明。營銷自動化1.
  • 從 YC 投資的 15 個人工智慧項目,我們看到什麼趨勢?
    在過去的十年間,從 YC 走出了很多偉大的企業,2015 年初的調查顯示,YC 孵化的企業市值加起來已經超過了 300 億美元。2016 年 YC 開始砸向人工智慧了,我們盤點了 YC 投資的 15 個人工智慧企業,並試圖從中發現產業的趨勢。有人說,在矽谷有兩種孵化器,一種叫做Y Combinator,一種叫做其他。
  • 10個頂級的CSS UI開源框架
    作為開發者,我們需要了解一些寶貴的CSS UI開源框架資源,它們可以幫助我們更快更好地實現一些現代化的界面,包括一些行動裝置的網頁界面風格設計。本文分享了10個頂級的CSS UI開源框架,有幾個確實不錯,一起來看看。
  • 2020年15個頂級數據分析軟體
    企業採用頂級數據分析軟體開展業務可以獲得巨大的競爭優勢,尤其是當這些數據工具更多地使用增強分析時。數據分析軟體使企業能夠分析大量數據,以獲得巨大的競爭優勢。數據分析軟體能夠挖掘跟蹤從當前銷售到歷史庫存的各種業務活動的數據,並根據數據科學家的建議進行處理。許多相關技術允許分析軟體創建其結果。這些工具主要包括數據倉庫工具、ETL工具,以及現在更常見的雲計算工具。
  • 2016 年度頂級開源創作工具
    幾年前,我在 Red Hat 總結會上做了一個簡單的演講,給與會者展示了 2012 年度開源創作工具。開源軟體在過去幾年裡發展迅速,現在我們來看看 2016 年的相關領域的軟體。核心應用這六款應用是開源的設計軟體中的最強王者。它們做的很棒,擁有完善的功能特徵集、穩定發行版以及活躍的開發者社區,是很成熟的項目。
  • 《星際爭霸》全球頂級高手高調宣戰AI:有生之年,人工智慧絕不是對手
    但是全球頂級的《星際爭霸》選手在面對 DeepMind、Facebook、以及各大科技公司的高級人工智慧選手時,又是否有勇氣說出那句「放馬過來」呢? 這兩名選手都是韓國人,也都願意以公開賽的形式與頂級人工智慧進行戰鬥。但兩人對於 AI 玩《星際爭霸》的水平,卻有著不一樣的見解。
  • 50+ 頂級開源 Kubernetes 工具列表
    本文總結了 50 多種 Kubernetes 集群部署、監控、安全及測試等相關工具,大部分為開源項目,非常適合技術人員入門。Kubespray 是一個開源項目,具有開放的開發模型。對於已經了解 Ansible 的人來說,該工具是一個不錯的選擇,因為不需要使用其他工具進行配置和編排。
  • Hadoop和大數據:60款頂級開源工具
    IBM更是非常看好開源大數據工具,派出了3500名研究人員開發Apache Spark,這個工具是Hadoop生態系統的一部分。這回我們推出了最新的頂級開源大數據工具排行榜。這個領域最近方興未艾,許多新項目紛紛啟動。許多最知名的項目由Apache基金會管理,與Hadoop密切相關。請注意:本文不是要搞什麼排名;相反,項目按類別加以介紹。
  • 7 款頂級開源 BI(商務智能)軟體和報表工具
    本文將介紹 7款頂級開源 BI(商務智能)軟體和報表工具,用於商業數據的分析處理,希望對您有所幫助。BIRTBIRT(Business Intelligence and Reporting Tools) 是由 IBM在 2004年開源的基於 Eclipse 的報表系統,它主要是用在基於Java與J2EE的Web應用程式上。
  • 12 個頂級 Bug 跟蹤工具
    這裡有一些我們挑選的用於 bug 跟蹤的頂級工具如果你的團隊有 25 個以上用戶,也有一些定製計劃。價格取決於用戶個數。它有 2 個付費計劃,每個用戶每月 7 美元起。對於開源項目也有一個免費選項。對於 100 個以上的用戶,你需要使用 Atlassian 的計算器。
  • 排名前15位的數據可視化工具列表
    這是專家更喜歡使用數據可視化工具的地方。這些工具僅顯示有用的數據並消除不相關的數據,從而有效地消除了可視化。在本文中,我們將討論當前可用的頂級數據可視化工具。1. Tableau它是最流行的數據可視化工具之一。它使用戶能夠處理大量用於不同領域的數據集,例如,人工智慧,商業智能,機器學習等。Tableau協助數據導入和元數據管理。
  • Top 7大開源數據可視化分析工具!
    目前,我們可以在市場上找到很多用於網絡分析和數據可視化的開源工具,例如NetworkX,R和Gephi中的iGraph包等。
  • 推薦30個用於微服務的頂級工具
    對於那些一直沒有親歷微服務或初次聽到這個概念的人來說,這篇文章相當於把一份頂級的開源工具清單送到他們的面前。微服務是一種用於開發高度可伸縮軟體系統的架構風格。這種架構可用於開發企業、政府、學校和慈善機構的企業級應用。它與傳統的單體架構完全相反,單體架構只專注於單個應用程式。微服務小而獨立,但在開發和維護方面,它們的架構可能很複雜。
  • 年末頂級開源盛會來了!資深技術大咖與你一起解鎖開源「密碼」
    相關統計數據顯示,全球開源項目數量呈指數級增長,截至 2019 年 GitHub 託管倉庫已有 1.4 億, 2019 年新增倉庫4400 萬個,創建第一個項目的用戶比 2018 年增加44% 。據 SourceClear 調查報告預測, 2026年全球開源項目數量將超過 3 億。
  • 量分享| 21個必須知道的機器學習開源工具!
    以下為譯文:你肯定已經了解流行的開源工具,如R、Python、Jupyter筆記本等。
  • 60款頂級大數據開源工具
    市場份額將從2013的20億美元,到2020年將增長至502億美元,增長幅度超25倍。其中大數據分析的需求是整個Hadoop市場的主要驅動力。大數據領域方興未艾,許多新項目紛紛啟動,其中不少由Apache基金會管理。下面為大家介紹60款大數據開源工具,涵蓋Hadoop、大數據分析平臺、資料庫/數據倉庫、商業智能、數據挖掘、查詢引擎、程式語言、大數據搜索、In-Memory等方向。