15 個開源的頂級人工智慧工具

2021-01-13 Linux愛好者

(點擊上方公眾號,可快速關注)


英文:datamation

譯文:Linux中國/Chao-zhi

連結:linux.cn/article-7830-1.html


Artificial intelligence,AI是科技研究中最熱門的方向之一。像 IBM、谷歌、微軟、Facebook 和亞馬遜等公司都在研發上投入大量的資金、或者收購那些在機器學習、神經網絡、自然語言和圖像處理等領域取得了進展的初創公司。考慮到人們對此感興趣的程度,我們將不會驚訝於斯坦福的專家在人工智慧報告中得出的結論:「越來越強大的人工智慧應用,可能會對我們的社會和經濟產生深遠的積極影響,這將出現在從現在到 2030 年的時間段裡。」


在最近的一篇文章中,我們概述了 45 個十分有趣或有前途的人工智慧項目。在本文中,我們將聚焦於開源的人工智慧工具,詳細的了解下最著名的 15 個開源人工智慧項目。


以下這些開源人工智慧應用都處於人工智慧研究的最前沿。


1. Caffe




它是由賈揚清在加州大學伯克利分校的讀博時創造的,Caffe 是一個基於表達體系結構和可擴展代碼的深度學習框架。使它聲名鵲起的是它的速度,這讓它受到研究人員和企業用戶的歡迎。根據其網站所言,它可以在一天之內只用一個 NVIDIA K40 GPU 處理 6000 萬多個圖像。它是由伯克利視野和學習中心(BVLC)管理的,並且由 NVIDIA 和亞馬遜等公司資助來支持它的發展。


2. CNTK



Computational Network Toolkit 它是計算網絡工具包Computational Network Toolkit的縮寫,CNTK 是一個微軟的開源人工智慧工具。不論是在單個 CPU、單個 GPU、多個 GPU 或是擁有多個 GPU 的多臺機器上它都有優異的表現。微軟主要用它做語音識別的研究,但是它在機器翻譯、圖像識別、圖像字幕、文本處理、語言理解和語言建模方面都有著良好的應用。


3. Deeplearning4j



Deeplearning4j 是一個 java 虛擬機(JVM)的開源深度學習庫。它運行在分布式環境並且集成在 Hadoop 和 Apache Spark 中。這使它可以配置深度神經網絡,並且它與 Java、Scala 和 其他 JVM 語言兼容。


這個項目是由一個叫做 Skymind 的商業公司管理的,它為這個項目提供支持、培訓和一個企業的發行版。


4. DMTK



Distributed Machine Learning Toolkit DMTK 是分布式機器學習工具Distributed Machine Learning Toolkit的縮寫,和 CNTK 一樣,是微軟的開源人工智慧工具。作為設計用於大數據的應用程式,它的目標是更快的訓練人工智慧系統。它包括三個主要組件:DMTK 框架、LightLDA 主題模型算法和分布式(多義)字嵌入算法。為了證明它的速度,微軟聲稱在一個八集群的機器上,它能夠「用 100 萬個主題和 1000 萬個單詞的詞彙表(總共 10 萬億參數)訓練一個主題模型,在一個文檔中收集 1000 億個符號,」。這一成績是別的工具無法比擬的。


5. H20



相比起科研,H2O 更注重將 AI 服務於企業用戶,因此 H2O 有著大量的公司客戶,比如第一資本金融公司、思科、Nielsen Catalina、PayPal 和泛美都是它的用戶。它聲稱任何人都可以利用機器學習和預測分析的力量來解決業務難題。它可以用於預測建模、風險和欺詐分析、保險分析、廣告技術、醫療保健和客戶情報。


它有兩種開源版本:標準版 H2O 和 Sparking Water 版,它被集成在 Apache Spark 中。也有付費的企業用戶支持。


6. Mahout



它是 Apache 基金會項目,Mahout 是一個開源機器學習框架。根據它的網站所言,它有著三個主要的特性:一個構建可擴展算法的編程環境、像 Spark 和 H2O 一樣的預製算法工具和一個叫 Samsara 的矢量數學實驗環境。使用 Mahout 的公司有 Adobe、埃森哲諮詢公司、Foursquare、英特爾、領英、Twitter、雅虎和其他許多公司。其網站列了出第三方的專業支持。


7. MLlib



由於其速度,Apache Spark 成為一個最流行的大數據處理工具。MLlib 是 Spark 的可擴展機器學習庫。它集成了 Hadoop 並可以與 NumPy 和 R 進行交互操作。它包括了許多機器學習算法如分類、回歸、決策樹、推薦、集群、主題建模、功能轉換、模型評價、ML 管道架構、ML 持久、生存分析、頻繁項集和序列模式挖掘、分布式線性代數和統計。


8. NuPIC



Hierarchical Temporal Memory,HTM 由 Numenta 公司管理的 NuPIC 是一個基於分層暫時記憶Hierarchical Temporal Memory,HTM理論的開源人工智慧項目。從本質上講,HTM 試圖創建一個計算機系統來模仿人類大腦皮層。他們的目標是創造一個 「在許多認知任務上接近或者超越人類認知能力」 的機器。


除了開源許可,Numenta 還提供 NuPic 的商業許可協議,並且它還提供技術專利的許可證。


9. OpenNN



作為一個為開發者和科研人員設計的具有高級理解力的人工智慧,OpenNN 是一個實現神經網絡算法的 c++ 編程庫。它的關鍵特性包括深度的架構和快速的性能。其網站上可以查到豐富的文檔,包括一個解釋了神經網絡的基本知識的入門教程。OpenNN 的付費支持由一家從事預測分析的西班牙公司 Artelnics 提供。


10. OpenCyc



由 Cycorp 公司開發的 OpenCyc 提供了對 Cyc 知識庫的訪問和常識推理引擎。它擁有超過 239,000 個條目,大約 2,093,000 個三元組和大約 69,000 owl:這是一種類似於連結到外部語義庫的命名空間。它在富領域模型、語義數據集成、文本理解、特殊領域的專家系統和遊戲 AI 中有著良好的應用。該公司還提供另外兩個版本的 Cyc:一個可免費的用於科研但是不開源,和一個提供給企業的但是需要付費。


11. Oryx 2



構建在 Apache Spark 和 Kafka 之上的 Oryx 2 是一個專門針對大規模機器學習的應用程式開發框架。它採用一個獨特的三層 λ 架構。開發者可以使用 Orys 2 創建新的應用程式,另外它還擁有一些預先構建的應用程式可以用於常見的大數據任務比如協同過濾、分類、回歸和聚類。大數據工具供應商 Cloudera 創造了最初的 Oryx 1 項目並且一直積極參與持續發展。


12. PredictionIO



今年的二月,Salesforce 收購了 PredictionIO,接著在七月,它將該平臺和商標貢獻給 Apache 基金會,Apache 基金會將其列為孵育計劃。所以當 Salesforce 利用 PredictionIO 技術來提升它的機器學習能力時,成效將會同步出現在開源版本中。它可以幫助用戶創建帶有機器學習功能的預測引擎,這可用於部署能夠實時動態查詢的 Web 服務。


13. SystemML



最初由 IBM 開發, SystemML 現在是一個 Apache 大數據項目。它提供了一個高度可伸縮的平臺,可以實現高等數學運算,並且它的算法用 R 或一種類似 python 的語法寫成。企業已經在使用它來跟蹤汽車維修客戶服務、規劃機場交通和連接社會媒體數據與銀行客戶。它可以在 Spark 或 Hadoop 上運行。


14. TensorFlow



TensorFlow 是一個谷歌的開源人工智慧工具。它提供了一個使用數據流圖進行數值計算的庫。它可以運行在多種不同的有著單或多 CPU 和 GPU 的系統,甚至可以在行動裝置上運行。它擁有深厚的靈活性、真正的可移植性、自動微分功能,並且支持 Python 和 c++。它的網站擁有十分詳細的教程列表來幫助開發者和研究人員沉浸於使用或擴展他的功能。


15. Torch




Torch 將自己描述為:「一個優先使用 GPU 的擁有機器學習算法廣泛支持的科學計算框架」,它的特點是靈活性和速度。此外,它可以很容易的通過軟體包用於機器學習、計算機視覺、信號處理、並行處理、圖像、視頻、音頻和網絡等方面。它依賴一個叫做 LuaJIT 的腳本語言,而 LuaJIT 是基於 Lua 的。


關注「Linux愛好者」

看更多精選 Linux 技術文章

↓↓↓

相關焦點

  • ...人工智慧產業發展聯盟舉辦開源大賽,飛槳助力是非觀點準確判斷
    在此背景之下,百度將於2020中國人工智慧產業發展聯盟開發者大會(以下簡稱:2020AIIA開發者大會)的預熱賽事中,聚焦於預測答案段落摘要中所表述的是非觀點極性,舉辦百度人工智慧開源大賽。本次大賽旨在為研究者和開發者提供學術和技術交流的平臺,鼓勵初創企業、企業開發者、高校科研人員及學生進一步提升機器閱讀理解的研究水平,推動語言理解和人工智慧領域技術和應用的發展。
  • 臉書人工智慧科學家賈揚清:科技巨頭為何願將核心框架開源?
    臉書人工智慧科學家賈揚清:科技巨頭為何願將核心框架開源?賈揚清 資料圖作為全球最普遍使用的圖像識別開源軟體Caffe的作者,賈揚清是人工智慧深度學習領域裡的佼佼者。在當天的演講中,賈揚清介紹了自己參與研究的深度學習框架,需要在哪些方面改進。賈揚清說,最為重要的是,要與全球共享成果,開源已有的深度學習框架十分關鍵。
  • 盤點網際網路巨頭奉獻的十大開源安全工具
    不少大型網際網路公司經常會將自己開發的頂級安全工具開源,推動整個網際網路的安全發展。本月早些時候安全牛曾介紹過Google開源的web安全測試工具Firing Range、Nogofail以及Facebook開源的Osquery等。事實上不僅Google、Facebook,包括Netflix甚至Etsy.com這樣的電商網站也都貢獻過精品開源安全工具。
  • Salesforce開源構建Einstein AI模型的工具
    Salesforce今天宣布開源TransmogrifAI,這是一款用於自動化AI計劃的本土軟體,相比Oracle工具來說它解決了任務的不同方面。對Salesforce來說尤其如此,Salesforce通過近幾年打造的Einstein系列機器學習功能處理了來自數千個企業組織的數據。Salesforce必須為每個客戶實施獨立的模型,以滿足將不同企業的記錄分開的要求。這樣做也有很強的技術動機:不同類型的信息需要不同類型的AI才能以最佳方式處理。
  • 高效開源EDA工具鏈已在路上?
    今年是第三屆,主題是 「Agile and Open Hardware for Next-Generation Computing」,一共有11個報告,其中報告4是有關EDA的。報告4:高效開源EDA工具鏈已在路上(OpenROAD)UCSD的Andrew Kahng教授獲得了DARPA項目的資助,開展高效開源EDA工具鏈的研究。
  • Facebook開源物體識別工具Detectron,加速計算機視覺研究
    (FAIR)開源了計算機視覺研究平臺Detectron。近日,Facebook的人工智慧實驗室(FAIR)開源了計算機視覺研究平臺Detectron。Detectron系統實現了最先進的物體檢測算法,包括Mask R-CNN。 它是用Python編寫的,支持Caffe2深度學習框架。
  • 谷歌大數據工具衍生新開源平臺Drill
    首頁 > 外聞 > 關鍵詞 > 衍生最新資訊 > 正文 谷歌大數據工具衍生新開源平臺Drill
  • 這10個開源安全工具你知道幾個?
    【IT168 評論】開源工具可以為IT安全人士實施安全措施和學習培訓奠定堅實的基礎。以下是人們應該知道的10個IT安全工具:  (1)Nessus(可見性)與許多其他開源軟體包一樣,Nagios也提供免費和商業版本。  Nagios Core是開源項目的核心,基於免費的開源版本。可以通過插件監控各個產品,並執行各項任務。目前市場上大約有50個由Nagios開發的官方插件和超過3000個社區開發的插件。  Nagios的用戶界面可以通過桌面、Web或移動平臺的前端進行修改,並且可以通過其中一種可用的配置工具來管理配置。
  • 橫評:五款免費開源的語音識別工具
    為此,我們對比了五款基於 HMM 和 N-gram 模型的語音識別工具:CMU Sphinx,Kaldi,HTK,Julius 和 ISIP。它們都是開源世界的頂級項目,與 Dragon 和 Cortana 等商業語音識別工具不同,這些開源、免費的工具可以為開發者提供更大的自由度以及更低的開發成本,因此在開發圈始終保持著強大的生命力。
  • 12個頂級大數據工具 - 大數據_CIO時代網 - CIO時代—新技術、新...
    在大數據技術作為概念和業務戰略出現的十年中,湧現了執行各種任務和流程的數千種工具。而推出這些工具的提供商都承諾可以為企業節省時間和成本,並發現能夠讓企業獲利的商業洞察力。顯然,大數據分析工具的市場正在不斷增長。  許多大數據分析工具最初像大數據軟體框架Hadoop一樣都是開源項目,但商業實體迅速湧現,為開源產品提供了新工具或商業的支持和開發。
  • 構建AI生態「朋友圈」之江實驗室發布「天樞」人工智慧開源開放平臺
    「天樞」人工智慧開源開放平臺2日在浙江杭州正式發布。該平臺具備高性能核心計算框架,提供一站式全功能AI開發套件,將提升人工智慧技術的研發效率、擴大算法模型的應用範圍,進一步構建人工智慧生態「朋友圈」。據介紹,該平臺由之江實驗室牽頭,聯合浙江大學、阿里巴巴等多單位共同研發打造。
  • 中國工程院高文院士:為什麼中國要打造自己的 AI 開源開放生態?
    OpenI 啟智正是在國家新一代人工智慧發展規劃戰略背景下,新一代人工智慧產業技術創新戰略聯組織產學研用通力協作共建共享的開源軟體開源硬體開放數據超級社區,旨在促進人工智慧領域的開源開放協同創新,構建 OpenI 的技術鏈、創新鏈和生態鏈,推動人工智慧產業健康快速發展及其在社會經濟各領域的廣泛應用。
  • 最流行的十大開源雲監控工具
    監控和測試工具分為實時資料庫、數據採集工具、可視化工具、意見反饋工具、日誌記錄器等等。在過去的幾年裡,開源產品和商業監控應用程式發生了爆炸式增長,下面是其中10個最受歡迎的開源雲監控工具。  Prometheus
  • 7個用於開源網絡情報滲透測試工作的熱門OSINT工具
    這只能通過使用不同的OSINT開源網絡情報工具來實現。工具在搜索信息中起著重要作用,但是如果不知道工具的重要性和用法,它將對用戶沒有幫助。為什麼我們需要這些OSINT開源網絡情報工具?讓我們考慮一種情況或場景,其中我們需要在Web上查找與某個主題相關的信息。為此,您需要首先搜索並進行分析,直到獲得準確的結果,這會花費大量時間。
  • 盤點微軟最應該開源的 15 款產品 - OSCHINA - 中文開源技術交流社區
    他們先是向Linux內核貢獻代碼,還開放了.NET核心、Visual Studio Code編輯器、甚至是Chakra JavaScript引擎(IE瀏覽器和Edge所用)的原始碼,而在和公司內部的開發者進行了漫長的談判之後,微軟最近又對博客工具Windows Live Writer進行了開源。可實際上,作為一家軟體巨頭,微軟還有不少產品都應該進行開源。
  • 開發者必備:基於 Linux 生態的十大AI開源框架盤
    本文將從開發者的角度出發,特別是針對開發者中為數眾多的Linux系統和Mac系統用戶,奉上一篇針對泛Linux生態的頂級人工智慧開源工具盤點(當然,有些工具也並非只兼容Linux)。
  • 60款流行網絡工具的開源替代選擇
    開源網絡工具能派得上用處。無論你是在管理大型企業數據中心中成千上萬的系統,還是僅僅把你家裡的幾臺電腦連接起來,開源網絡工具都能幫助你搭建和維護一個低成本的網絡。本文整理出了讓這項任務變得更容易一點的60款開源網絡工具。
  • 開發者必備:基於Linux生態的十大AI開源框架盤點
    與此前不同,本文將從開發者的角度出發,特別是針對開發者中為數眾多的Linux系統和Mac系統用戶,奉上一篇針對泛Linux生態的頂級人工智慧開源工具盤點(當然,有些工具也並非只兼容Linux)。1.H2O是一個更關注企業用戶的人工智慧分析工具,它聚焦於為掌握大量數據的企業用戶提供快速精準的預測分析模型,從海量數據中提取有助於商業決策的信息。根據H2O官方的數據,目前已經有超過7萬名數據科學家和8萬家組織機構成為了H2O平臺的忠實擁躉。官網:http://www.h2o.ai/4.
  • 15億語料94億參數強化訓練!Facebook開源全球最強聊天機器人Blender
    現在 Facebook 開源了一個新的聊天機器人Blender,它聲稱自己擅長所有領域的聊天,並且更有人情味。Blender 不僅幫助虛擬助手解決了許多聊天機器人的固有缺點,也標誌著人工智慧的新進展: 可複製的智能。
  • 告別邪神作畫:加州大學開源全新圖像處理工具CycleGAN
    Google人工智慧的大作不過你可不要誤以為這就是人工智慧在繪畫領域的最高水平了,事實上大部分的人工智慧在繪畫領域還是走了一條正常的藝術道路的。比如加州大學伯克利分校近日開源的一個新的圖像處理工具CycleGAN的藝術造詣就比Google要高尚不知道多少。話不多說先看圖:你一定會說這個不是和去年流行的手機App麼?錯!