我們比較了過去一年近8,800個開源的機器學習項目,從中選擇了30個表現優秀的,分享給讀者。
這是一份非常精彩的名單,它仔細挑選了2017年1月至12月之間發布的最佳開源機器學習庫、數據集和應用程式。
我們綜合考慮項目的受歡迎程度,參與度和進展程度來評估項目質量。為了給讀者更直觀的感受,使用GitHub上的關注量(星星數量)來表示項目熱度。注意,GitHub上項目的平均關注量是3558。
開源項目對於數據科學家來說可能是最實用的。你可以閱讀原始碼,在現有項目上構建一些東西。花點時間看看,過去一年你可能錯過的這些優秀的機器學習項目吧。
No.1 FastText
用於快速文本表示和分類的庫。
GitHub:11786顆星
來自:Facebook研究室
註:Muse是基於FastText的多語言無監督或有監督的字嵌入項目,在GitHub上獲星695顆。
項目地址:
https://github.com/facebookresearch/fastText?utm_source
No.2深度照片風格轉換
項目列出了「深度照片風格轉移」論文的所有代碼和數據。
GitHub:9747顆星
來自:康奈爾大學博士欒福軍
項目地址:
https://github.com/luanfujun/deep-photo-styletransfer?utm_source
No.3 面部識別
這是世界上最簡單的基於Python的面部識別API和命令行。
GitHub:8672顆星
來自:Adam Geitgey
項目地址:
https://github.com/ageitgey/face_recognition?utm_source
No.4 品紅項目
「谷歌大腦」團隊的一個項目,由機器智能生成音樂和藝術作品。
GitHub:8113顆星
項目地址:
https://github.com/tensorflow/magenta?utm_source
No.5 Sonnet
基於TensorFlow的神經網絡庫。
GitHub:5731顆星
來自:DeepMind公司的Malcolm Reynolds
項目地址:
https://github.com/deepmind/sonnet?utm_source
No.6 deeplearn.js
網絡硬體加速的機器智能庫。
GitHub:5462顆星
來自:谷歌大腦的Nikhil Thorat
項目地址:
https://github.com/PAIR-code/deeplearnjs?utm_source
No.7用TensorFlow實現快速風格轉換
GitHub:4843顆星
來自:MIT 的Logan Engstrom
項目地址:
https://github.com/lengstrom/fast-style-transfer?utm_source
No.8 Pysc2
星際爭霸II學習環境的Python組件。
GitHub:3683顆星
來自:DeepMind公司的Timo Ewalds
項目地址:
https://github.com/deepmind/pysc2?utm_source
No.9 AirSim
基於虛幻引擎的開源模擬器,用於微軟AI&Research自動駕駛汽車。
GitHub:3861顆星
來自:微軟的Shital Shah
項目地址:
https://github.com/Microsoft/AirSim?utm_source
No.10 facet
機器學習數據集的可視化。
GitHub:3371顆星
來自:谷歌大腦
項目地址:
https://github.com/PAIR-code/facets?utm_source
No.11 Style2Paints
AI圖像上色。
GitHub:3310顆星
項目地址:
https://github.com/lllyasviel/style2paints?utm_source
No.12 Tensor2Tensor
一個用於序列模型的廣義序列庫。
GitHub:3087顆星
來自:谷歌大腦的Ryan Sepassi
項目地址:
https://github.com/tensorflow/tensor2tensor?utm_source
No.13 使用PyTorch轉換圖像
如馬到斑馬的轉換,貓的自動邊緣生成等。
GitHub:2847顆星
來自:伯克利大學博士朱俊彥
項目地址:
https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix?utm_source
No.14 Faiss
用於高效相似性搜索和密集向量聚類的庫。
GitHub:2629顆
來自:Facebook研究
項目地址:
https://github.com/facebookresearch/faiss?utm_source
No.15 Fashion-mnist
類似MNIST的時尚產品資料庫。
GitHub:2780顆星
來自:Zalando Tech的研究科學家韓曉
項目地址:
https://github.com/zalandoresearch/fashion-mnist?utm_source
No.16 ParlAI
在各種公開可用的對話數據集上訓練和評估AI模型的框架。
GitHub:2578顆星
來自:Facebook研究的Alexander Miller
項目地址:
https://github.com/facebookresearch/ParlAI?utm_source
No.17 Fairseq
Facebook AI研究的序列-序列工具包。
GitHub:2571顆星
項目地址:
https://github.com/facebookresearch/fairseq?utm_source
No.18 Pyro
使用Python和PyTorch的深度通用概率編程。
GitHub:2387顆星
來自:Uber AI實驗室
項目地址:
https://github.com/uber/pyro?utm_source
No.19 iGAN
由GAN支持的交互式圖像生成。
GitHub:2369顆星
項目地址:
https://github.com/junyanz/iGAN?utm_source
No.20深度圖像先驗
神經網絡不需學習,復原圖像。
GitHub:2188顆星
來自:Skoltech公司的Dmitry Ulyanov博士
項目地址:
https://github.com/DmitryUlyanov/deep-image-prior?utm_source
No.21 Face_classification
利用 keras CNN 模型和 openCV 的 fer2013/imdb 數據集進行實時人臉檢測和情感/性別分類。
GitHub:1967顆星
項目地址:
https://github.com/oarriaga/face_classification?utm_source
No.22語音到文本的WaveNet
使用DeepMind的WaveNet和TensorFlow的端到端語句級別的英語語音識別。
GitHub:1961顆星
來自:Kakao Brain的Namju Kim
項目地址:
https://github.com/buriburisuri/speech-to-text-wavenet?utm_source
No.23 StarGAN
多域圖像到圖像轉換的統一生成對抗網絡。
GitHub:1954顆星
來自:韓國大學的Yunjey Choi
項目地址:
https://github.com/yunjey/StarGAN?utm_source
No.24 Ml-agents
Unity的機器學習代理。
GitHub:1658顆星
來自:Unity3D深度學習的Arthur Juliani
項目地址:
https://github.com/Unity-Technologies/ml-agents?utm_source
No.25 Deep Video Analytics
一個分布式可視化搜索和可視化數據分析平臺。
GitHub:1494顆星
來自:康奈爾大學的Akshay Bhat博士
項目地址:
https://github.com/AKSHAYUBHAT/DeepVideoAnalytics/?utm_source
No.26 OpenNMT
使用Torch的開源神經機器翻譯。
GitHub:1490顆星
項目地址:
https://github.com/OpenNMT/OpenNMT?utm_source
No.27 Pix2pixHD
用條件生成式對抗網絡合成和處理2048×1024的圖像。
GitHub:1283顆星
來自:英偉達AI研究科學家劉明宇
項目地址:
https://github.com/NVIDIA/pix2pixHD?utm_source
No.28 Horovod
TensorFlow的分布式訓練框架。
GitHub:1188顆星
來自:Uber Engineering
項目地址:
https://github.com/uber/horovod?utm_source
No.29 AI-Blocks
強大而直觀的WYSIWYG界面,允許任何人創建機器學習模型。
GitHub:899顆星
項目地址:
https://github.com/MrNothing/AI-Blocks?utm_source
No.30深度神經網絡
用於語音轉換(語音方式傳輸)。
GitHub:845顆星
來自:Kakao AI Brain的研究員Dabi Ahn
項目地址:
https://github.com/andabi/deep-voice-conversion?utm_source
來源:Medium作者:Mybridge智能觀 編譯
—完—
親愛的朋友:如文中所說,開源項目對數據科學家、開發工程師等是最實用的,你可以閱讀原始碼,或者在項目基礎上構建一些東西。希望這30個最受歡迎的優秀項目,能對你有所幫助。祝安! 智能觀 一米 2018-1-12 於北京中關村
聲明:編譯文章旨在幫助讀者了解行業新思想、新觀點及新動態,為原作者觀點,不代表智能觀觀點。