在GitHub上8800個開源機器學習項目中,選出了其中的Top30

2021-01-11 大數據文摘

大數據文摘作品

編譯:葉一、Shan LIU、Aileen

2017年是機器學習應用全面開花的一年,驚為天人的想法和項目層出不窮。我們對比了過去一年中近8800個開源機器學習項目,並挑選了其中較好的30個(Top 0.3%)列舉於此。

這是一份極具競爭性的列表,它精挑細選了發表於2017年1月-12月份的機器學習庫、數據集和應用類的優質項目。我們通過流行度、參與度和時近性來對其質量進行評級。有一項數據可以讓你對表單質量有一個直觀印象:這些項目的GitHub平均stars數是3558。

開源項目對於數據科學家而言是很有意義的。你可以通過閱讀原始碼,在前人的基礎上構建更加強大的項目。你可以盡情嘗試一下這些可能在去年與你失之交臂的機器學習項目。

No.1 - FastText:快速文本表示/分類庫

GitHub stars數: 11786個

來源:Facebook研究

連結:

https://github.com/facebookresearch/fastText

以及[Muse:基於FastText的多語言無監督/監督詞嵌入(GitHub stars數:695個)https://github.com/facebookresearch/MUSE]

No.2- Deep-photo-styletransfer:康奈爾大學 Fujun Luan 論文《Deep Photo Style Transfer》的代碼與數據

GitHub stars數:9747個

連結:

https://github.com/luanfujun/deep-photo-styletransfer

No.3 - face recognition:世界上最簡單的適用於Pyhthon的面部識別api以及命令行

GitHub stars數:8672個

來源:Adam Geitgey

連結:

https://github.com/ageitgey/face_recognition

No.4 - Magenta:機器智能音樂與藝術生成器

GitHub stars數:8113

連結:

https://github.com/tensorflow/magenta

No.5 - Sonnet:基於 TensorFlow 的神經網絡庫

GitHub stars數:5731個

來源:DeepMind 成員 Malcolm Reynolds連結:

https://github.com/deepmind/sonnet

No.6 - deeplearn.js:網頁端硬體加速機器學習庫GitHub stars數:5462個來源:Google Brain 團隊 Nikhil Thorat

連結:

https://github.com/PAIR-code/deeplearnjs

No.7 - Fast Style Transfer:TensorFlow 快速風格轉換

GitHub stars數:4843個

來源:MIT的Logan Engstrom

連結:

https://github.com/lengstrom/fast-style-transfer

No.8 - Pysc2:星際爭霸II 學習環境

GitHub stars數:3683個

來源:DeepMind Timo Ewalds 等人連結:

https://github.com/deepmind/pysc2

No.9 - AirSim:微軟AI和研究院出品的基於虛幻引擎的開源自動駕駛模擬器

GitHub stars數:3681個來源:微軟的Shital Shah

連結:

https://github.com/Microsoft/AirSim

No.10 - Facets:機器學習數據集可視化工具

GitHub stars數:3371個

來源:Google Brain

連結:

https://github.com/PAIR-code/facets

No.11 - Style2Paints:AI漫畫線稿上色工具

GitHub stars數: 3310個

連結:

https://github.com/lllyasviel/style2paints

No.12 - Tensor2Tensor:用於廣義序列-序列模型的工具庫

GitHub stars數目: 3087個

來源:Google Brain 的Ryan Sepassi

連結:

https://github.com/tensorflow/tensor2tensor

No.13- 基於 PyTorch 的圖像對圖像轉換工具 (如horse2zebra, edges2cats,等)

GitHub stars數:2847個

來源:UC Berkeley 朱俊彥博士

連結:

https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix

No.14 - Faiss:用密集向量高效相似性檢索與聚類的工具庫

GitHub stars數:2629個

來源:Facebook

連結:

https://github.com/facebookresearch/faiss

No.15 Fashion-mnist:一個類似於 MNIST 的時尚產品數據集

GitHub stars數:2780個

來源:Zalando Tech 的 Han Xiao

連結:

https://github.com/zalandoresearch/fashion-mnist

No.16 - ParlAI:適用於在各類公開的對話數據集上訓練與評估AI模型的一個框架

GitHub stars數: 2578個

來源:Facebook Research的 Alexander Miller連結:

https://github.com/facebookresearch/ParlAI

No.17 Fairseq:序列到序列工具包

GitHub stars數: 2571個

來源:FAIR

連結:

https://github.com/facebookresearch/fairseq

No.18 Pyro:使用 Python 和 PyTorch 進行深度通用概率編程

GitHub stars數: 2387個

來源:Uber AI Labs

連結:

https://github.com/uber/pyro

No.19 iGAN:基於 GAN 的交互圖像生成器

GitHub stars數: 2369個

連結:

https://github.com/junyanz/iGAN

No.20 Deep-image-prior:使用神經網絡進行圖像恢復,然而無需學習過程

GitHub stars數: 2188個

來源:Skoltech 的 Dmitry Ulyanov博士連結:

https://github.com/DmitryUlyanov/deep-image-prior

No.21 Face_classification:基於 Keras CNN 模型與 OpenCV 的實時面部檢測和表情/性別分類,訓練與 fer2013/imdb 數據集

GitHub stars數: 1967個

連結:

https://github.com/oarriaga/face_classification

No.22 Speech to Text WaveNet:使用 DeepMind 的 WaveNet 和 TensorFlow 構成的端到端句級英語語音識別

GitHub stars數: 1961個

來源: Kakao Brain 的 Namju Kim

連結:

https://github.com/buriburisuri/speech-to-text-wavenet

No.23 StarGAN:用於多領域圖像-圖像轉換的統一生成對抗網絡

GitHub stars數: 1954個

來源:韓國大學的Yunjey Choi

連結:

https://github.com/yunjey/StarGAN

No.24 MI-agents:Unity 機器學習智能體

GitHub stars數: 1658個

來源:深度學習 Unity3D 的Arthur Juliani

連結:

https://github.com/Unity-Technologies/ml-agents

No.25 Deep Video Analytics:分布式可視化搜索和可視化數據分析平臺

GitHub stars數: 1494個

來源:康奈爾大學的Akshay Bhat

No.26 OpenNMT:Torch 上的開源神經機器翻譯

GitHub stars數:1490個連結:

https://github.com/OpenNMT/OpenNMT

No.27 Pix2PixHD:使用條件 GAN 合成和處理 2048×1024 解析度的圖像

GitHub stars數:1283個

來源:英偉達 AI 科學家 Ming-Yu Liu

連結:

https://github.com/NVIDIA/pix2pixHD

No.28 Horovod:分布式 TensorFlow 訓練框架

GitHub stars數:1188 個

來源:Uber 工程團隊

連結:

https://github.com/uber/horovod

No.29 AI-Blocks:強大而直觀的 WYSIWYG 界面,可讓任何人創建機器學習模型

GitHub stars數:899 個

連結:

https://github.com/MrNothing/AI-Blocks

No.30 Voice Conversion with Non-Parallel Data:基於 TensorFlow 的深度神經網絡語音轉換(語音風格轉換)

GitHub stars數:845個

來源:Kakao Brain人工智慧研究團隊的Dabi Ahn

連結:

https://github.com/andabi/deep-voice-conversion

原文連結:

https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7

相關焦點

  • 盤點:2017年GitHub上30個優秀的機器學習項目
    我們比較了過去一年近8,800個開源的機器學習項目,從中選擇了30個表現優秀的,分享給讀者。這是一份非常精彩的名單,它仔細挑選了2017年1月至12月之間發布的最佳開源機器學習庫、數據集和應用程式。我們綜合考慮項目的受歡迎程度,參與度和進展程度來評估項目質量。為了給讀者更直觀的感受,使用GitHub上的關注量(星星數量)來表示項目熱度。
  • 值得mark的11個開源機器學習項目
    在最古老、最值得尊敬的機器學習庫中,Shogun創建於1999年,用C++編寫,但並不限於在C++工作。他們對那些可能最終遷移到Hadoop上的應用程式或從Hadoop上剝離成為獨立應用程式的項目非常有用。Mahout缺點之一:目前幾乎沒有算法支持高性能的Spark框架,反而使用日益過時的MapReduce框架。該項目目前不接受基於MapReduce的算法,那些想要獲得更高性能的開發者轉而用MLlib 替代。
  • 6月份Github上熱門的開源項目
    6月份GitHub上熱門的開源項目排行已經出爐啦,一起來看看上榜詳情吧!這個項目的代碼實現。5. vanillawebprojectshttps://github.com/bradtraversy/vanillawebprojectsStar 6589這是一個使用HTML5,CSS和JavaScript構建的20多 個小型項目的集合,一共包含20個項目,諸如電影訂票頁面,視頻播放器界面、匯率計算器、
  • 2018 年最富含金量的 6 款開源機器學習項目
    此外,我們發現業內產生越來越多應用驅動型的研究工作,數量上甚至超過了理論驅動型研究。不可否認這種變化有其弊端,然而我們要看到它積極的一面,隨著能夠迅速被商業轉化的研究增多,對整個行業產生了不可估量的積極影響,這在機器學習開源領域尤其明顯。最後,一起看看過去一年中 6 個最實用的機器學習項目。
  • 如何上傳項目到GitHub
    本文轉載自【微信公眾號:吾非同】,經微信公眾號授權轉載,如需轉載與原文作者聯繫 圖丨pixabaygithub作為開源的分布式版本管理系統,上面有眾多的優秀開源項目,也有豐富的學習資料,熟練使用github也是程式設計師的一項必備技能。
  • 推薦一些 GitHub 上值得前端學習的開源實戰項目,進階必看!
    最近好多同學問我了解找一些學習的實戰項目;看一個別人寫的優秀的項目,從中可以學到很多;比如代碼的規範,項目的結構;從項目作者每次提交記錄,去學習一些別人的開發思維以及開發整個項目的流程;下面我主要找了一些比較火的一些框架以及 node 項目。
  • 2018年github上最值得學習的十個熱門項目
    項目一 julia(語言)簡介:julia是一種新的、高性能的動態語言, 目前在github上已經超過了10000+star項目二 Muzei-macOS(蘋果桌面)簡介:Muzei-macOS是一款免費的
  • 安全專業人士最愛的 19 個 GitHub 開源項目
    GitHub上有許多開源項目可供安全專業人士選擇,而且每天都有新的項目出現。不妨將這些項目添加到你的工具庫,讓你工作起來更得心應手。
  • GitHub上6個超強開源機器學習庫盤點
    到目前為止,XLNet已經在20項自然語言處理任務上超過了BERT的表現,並且在18項任務上取得了當前最佳效果。下面列出了二者在閱讀理解任務的幾個常見衡量維度上的測試結果。如果想了解更多,以下是文本分類任務的測試結果。毫不誇張地說,XLNet的表現十分出色。2.
  • 從星際2深度學習環境到神經機器翻譯,上手機器學習這些開源項目必...
    對於剛接觸機器學習的開發者來講,想要理解什麼是機器學習,首先要搞懂三個部分:輸入、算法、輸出。例如,無監督學習是自然語言處理中非常流行的方法:keon / awesome-nlpGitHub 地址:https://github.com/keon/awesome-nlp專門用於自然語言處理(NLP)的資源清單列表。
  • GitHub十大熱門Python項目 | 網際網路數據資訊網-199IT | 中文互聯...
    Python作為一種神奇而又通用的程式語言,已經被成千上萬的開發者用來構建各種有趣而有用的項目。在下面的部分,我們將嘗試涵蓋GitHub上一些使用Python構建的最佳項目。這個項目背後的理念是讓人們更容易在數學教材中整合有趣直觀的動畫與圖形和圖表,擺脫學習數學必須枯燥的刻板印象。格蘭特在YouTube上經營著一個名為3Brown1Blue的頻道,他根據需要使用manim庫來創建和控制這些動畫,向受眾傳授高等數學知識。使用manim,你還可以創建動畫視頻,精確控制用於圖表和插圖的動畫。如果你覺得這是個有趣的想法,你應該去他的頻道看看這個庫的操作。
  • 面試資源、公共API、多樣化學習路徑,這10個GitHub庫開發者必看
    本文作者全棧工程師 Simon Holdorf 列舉了十個能夠為所有軟體工程師提供巨大價值的 GitHub 庫。這些庫均具備大量 GitHub 星數,顯示其關聯性、流行性和效用。其中一些庫可以幫助大家學習新知識,還有的可以幫助構建很酷的東西,不論如何所有庫都能夠幫助你成為更好的軟體工程師。1.
  • GeForce 8800 GTS 512MB正式發布-8800 GTS 512MB ——快科技(驅動...
    8800 GTS 512MB基於G92核心,擁有128個統一流處理器,搭配256-bit 512MB GDDR3顯存,帶寬64GB/s,默認核心/顯存/Shader頻率650/1000/1625MHz,紋理填充率每秒416億,集成第二代PureVideo HD高清硬解碼引擎,支持DirectX 10和PCI-E 2.0,不僅超越了8800 GTS 640MB
  • 中國氣象人也在github上擁有一席之地了!
    Python語言的強大和靈活受到了越來越多氣象從業者的青睞,今天我們給大家推薦一下MeteoAI在github上的awesome-atmos[1]項目。這個項目啟發於awesome-python[2],是氣象圈的awesome系列,主要整合了一些常用的氣象領域的工具,大多數為Python相關。
  • NVIDIA最強8800Ultra評測_-泡泡網
    8800Ultra的產品規格:一說是超高頻率的GDDR4顯存版,二說是像Quadro FX 5600那樣的1.5GB GDDR3顯存版,更有甚者認為8800Ultra將會是擁有160個流處理器的版本(不知道是誰如此八卦)!
  • Github 上打星超過 1 萬的可復現頂會論文項目
    實驗結果表明,PCL 的幾個基準測試結果明顯優於強大的 actor-critic 以及 Q-learning algorithms。模型最終在幾個基準生成建模任務中獲得了先進的方差減少結果,可以更快地進行收斂並達到更好的最終對數似然結果。
  • Github中文項目排行榜,你永遠想不到開發者都用它幹了什麼
    最近,一位名為 kon9chunkit (https://github.com/kon9chunkit) 的 GitHub 開發者就總結了中文相關的知名項目,並形成了每周榜單。這個榜單會定期更新每周最受歡迎的中文項目(top200)。更好的是,除了一個總榜單,開發者還將榜單按照程式語言進行了區分,如 Java、Python、C++等,形成了 17 個程式語言分榜。
  • 專業解析|應屆生能申請的美國Top30管理學碩士項目匯總
    下面我們逐個為大家解析一下美國top30學校的管理學相關項目。of Science in Management所在學院:Mendoza college of business學制:11個月項目簡介:由著名的門多薩學院教授的小班課程中,您將學習「商業語言」,獲得堅實的商業基礎
  • GitHub 原始碼洩露,CEO 回應:這是個意外
    他表示,在向官方 GitHub DMCA 提交的可疑文件中,一個身份不明的人利用 GitHub 應用程式中的一個漏洞冒充 GitHub CEO Nat Friedman 上傳了機密原始碼。疑似洩露代碼地址:https://web.archive.org/web/20201104050026if_/https://github.com/github
  • USNewsTop30霸氣回歸—佛羅裡達
    在眾多學生中,國際學生約有2,700人。 2020qs版的美國大學排名中,佛羅裡達大學排在第35名; 2020u.s.news 美國大學排名中,佛羅裡達大學重回top30!地理、氣候環境佛羅裡達州因美麗的海灘、溫暖氣候、陽光普照的天氣而聞名於世界。