盤點:2017年GitHub上30個優秀的機器學習項目

2021-01-11 智能觀

我們比較了過去一年近8,800個開源的機器學習項目,從中選擇了30個表現優秀的,分享給讀者。

這是一份非常精彩的名單,它仔細挑選了2017年1月至12月之間發布的最佳開源機器學習庫、數據集和應用程式。

我們綜合考慮項目的受歡迎程度,參與度和進展程度來評估項目質量。為了給讀者更直觀的感受,使用GitHub上的關注量(星星數量)來表示項目熱度。注意,GitHub上項目的平均關注量是3558。

開源項目對於數據科學家來說可能是最實用的。你可以閱讀原始碼,在現有項目上構建一些東西。花點時間看看,過去一年你可能錯過的這些優秀的機器學習項目吧。

No.1 FastText

用於快速文本表示和分類的庫。

GitHub:11786顆星

來自:Facebook研究室

註:Muse是基於FastText的多語言無監督或有監督的字嵌入項目,在GitHub上獲星695顆。

項目地址:

https://github.com/facebookresearch/fastText?utm_source

No.2深度照片風格轉換

項目列出了「深度照片風格轉移」論文的所有代碼和數據。

GitHub:9747顆星

來自:康奈爾大學博士欒福軍

項目地址:

https://github.com/luanfujun/deep-photo-styletransfer?utm_source

No.3 面部識別

這是世界上最簡單的基於Python的面部識別API和命令行。

GitHub:8672顆星

來自:Adam Geitgey

項目地址:

https://github.com/ageitgey/face_recognition?utm_source

No.4 品紅項目

「谷歌大腦」團隊的一個項目,由機器智能生成音樂和藝術作品。

GitHub:8113顆星

項目地址:

https://github.com/tensorflow/magenta?utm_source

No.5 Sonnet

基於TensorFlow的神經網絡庫。

GitHub:5731顆星

來自:DeepMind公司的Malcolm Reynolds

項目地址:

https://github.com/deepmind/sonnet?utm_source

No.6 deeplearn.js

網絡硬體加速的機器智能庫。

GitHub:5462顆星

來自:谷歌大腦的Nikhil Thorat

項目地址:

https://github.com/PAIR-code/deeplearnjs?utm_source

No.7用TensorFlow實現快速風格轉換

GitHub:4843顆星

來自:MIT 的Logan Engstrom

項目地址:

https://github.com/lengstrom/fast-style-transfer?utm_source

No.8 Pysc2

星際爭霸II學習環境的Python組件。

GitHub:3683顆星

來自:DeepMind公司的Timo Ewalds

項目地址:

https://github.com/deepmind/pysc2?utm_source

No.9 AirSim

基於虛幻引擎的開源模擬器,用於微軟AI&Research自動駕駛汽車。

GitHub:3861顆星

來自:微軟的Shital Shah

項目地址:

https://github.com/Microsoft/AirSim?utm_source

No.10 facet

機器學習數據集的可視化。

GitHub:3371顆星

來自:谷歌大腦

項目地址:

https://github.com/PAIR-code/facets?utm_source

No.11 Style2Paints

AI圖像上色。

GitHub:3310顆星

項目地址:

https://github.com/lllyasviel/style2paints?utm_source

No.12 Tensor2Tensor

一個用於序列模型的廣義序列庫。

GitHub:3087顆星

來自:谷歌大腦的Ryan Sepassi

項目地址:

https://github.com/tensorflow/tensor2tensor?utm_source

No.13 使用PyTorch轉換圖像

如馬到斑馬的轉換,貓的自動邊緣生成等。

GitHub:2847顆星

來自:伯克利大學博士朱俊彥

項目地址:

https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix?utm_source

No.14 Faiss

用於高效相似性搜索和密集向量聚類的庫。

GitHub:2629顆

來自:Facebook研究

項目地址:

https://github.com/facebookresearch/faiss?utm_source

No.15 Fashion-mnist

類似MNIST的時尚產品資料庫。

GitHub:2780顆星

來自:Zalando Tech的研究科學家韓曉

項目地址:

https://github.com/zalandoresearch/fashion-mnist?utm_source

No.16 ParlAI

在各種公開可用的對話數據集上訓練和評估AI模型的框架。

GitHub:2578顆星

來自:Facebook研究的Alexander Miller

項目地址:

https://github.com/facebookresearch/ParlAI?utm_source

No.17 Fairseq

Facebook AI研究的序列-序列工具包。

GitHub:2571顆星

項目地址:

https://github.com/facebookresearch/fairseq?utm_source

No.18 Pyro

使用Python和PyTorch的深度通用概率編程。

GitHub:2387顆星

來自:Uber AI實驗室

項目地址:

https://github.com/uber/pyro?utm_source

No.19 iGAN

由GAN支持的交互式圖像生成。

GitHub:2369顆星

項目地址:

https://github.com/junyanz/iGAN?utm_source

No.20深度圖像先驗

神經網絡不需學習,復原圖像。

GitHub:2188顆星

來自:Skoltech公司的Dmitry Ulyanov博士

項目地址:

https://github.com/DmitryUlyanov/deep-image-prior?utm_source

No.21 Face_classification

利用 keras CNN 模型和 openCV 的 fer2013/imdb 數據集進行實時人臉檢測和情感/性別分類。

GitHub:1967顆星

項目地址:

https://github.com/oarriaga/face_classification?utm_source

No.22語音到文本的WaveNet

使用DeepMind的WaveNet和TensorFlow的端到端語句級別的英語語音識別。

GitHub:1961顆星

來自:Kakao Brain的Namju Kim

項目地址:

https://github.com/buriburisuri/speech-to-text-wavenet?utm_source

No.23 StarGAN

多域圖像到圖像轉換的統一生成對抗網絡。

GitHub:1954顆星

來自:韓國大學的Yunjey Choi

項目地址:

https://github.com/yunjey/StarGAN?utm_source

No.24 Ml-agents

Unity的機器學習代理。

GitHub:1658顆星

來自:Unity3D深度學習的Arthur Juliani

項目地址:

https://github.com/Unity-Technologies/ml-agents?utm_source

No.25 Deep Video Analytics

一個分布式可視化搜索和可視化數據分析平臺。

GitHub:1494顆星

來自:康奈爾大學的Akshay Bhat博士

項目地址:

https://github.com/AKSHAYUBHAT/DeepVideoAnalytics/?utm_source

No.26 OpenNMT

使用Torch的開源神經機器翻譯。

GitHub:1490顆星

項目地址:

https://github.com/OpenNMT/OpenNMT?utm_source

No.27 Pix2pixHD

用條件生成式對抗網絡合成和處理2048×1024的圖像。

GitHub:1283顆星

來自:英偉達AI研究科學家劉明宇

項目地址:

https://github.com/NVIDIA/pix2pixHD?utm_source

No.28 Horovod

TensorFlow的分布式訓練框架。

GitHub:1188顆星

來自:Uber Engineering

項目地址:

https://github.com/uber/horovod?utm_source

No.29 AI-Blocks

強大而直觀的WYSIWYG界面,允許任何人創建機器學習模型。

GitHub:899顆星

項目地址:

https://github.com/MrNothing/AI-Blocks?utm_source

No.30深度神經網絡

用於語音轉換(語音方式傳輸)。

GitHub:845顆星

來自:Kakao AI Brain的研究員Dabi Ahn

項目地址:

https://github.com/andabi/deep-voice-conversion?utm_source

來源:Medium作者:Mybridge智能觀 編譯

—完—

親愛的朋友:如文中所說,開源項目對數據科學家、開發工程師等是最實用的,你可以閱讀原始碼,或者在項目基礎上構建一些東西。希望這30個最受歡迎的優秀項目,能對你有所幫助。祝安! 智能觀 一米 2018-1-12 於北京中關村

聲明:編譯文章旨在幫助讀者了解行業新思想、新觀點及新動態,為原作者觀點,不代表智能觀觀點。

相關焦點

  • 在GitHub上8800個開源機器學習項目中,選出了其中的Top30
    大數據文摘作品編譯:葉一、Shan LIU、Aileen2017年是機器學習應用全面開花的一年,驚為天人的想法和項目層出不窮。我們對比了過去一年中近8800個開源機器學習項目,並挑選了其中較好的30個(Top 0.3%)列舉於此。
  • 2019年最值得學習的機器學習項目(下)
    年最值得學習的機器學習項目(上)中,我們盤點了很多優秀的機器學習項目,其中有 3D 姿態估計,建築機器翻譯,圖像和視頻中的汽車消除等等有意思的內容。接下來,我們將繼續介紹更多優秀的機器學習項目,讓同學們都能找到感興趣的學習內容。在下篇中,我們將以一個內衣檢測項目作為開始,下面讓我們看看有哪些好玩的項目吧~內衣檢測儀——Nick Bourdakos 這完全可以理解。
  • 2018 年度 GtiHub 開源項目 TOP 25:數據科學 & 機器學習
    如果你問怎麼學習的話,我可以給你一個暗示——開源項目!世界領先的科技公司通過在 GitHub 上發布其熱門算法的代碼,對項目進行開源。2018 年,在 Google 和 Facebook 等公司的帶領下,這類開源項目大幅增加。其中最好的那部分開源項目,寫代碼的研究者還提供了預訓練模型,從而讓你我這些人不必再浪費時間從頭開始創建高難度的模型。
  • Github中文項目排行榜,你永遠想不到開發者都用它幹了什麼
    不久前,有 GitHub 用戶吐槽說,GitHub 的每日趨勢榜不按照國家和地區來區分,使得榜單上總會有很多點讚量很大的中文項目,有時候甚至會佔據半壁江山。這位用戶呼籲,GitHub 應該按照開發者所屬國家和地區進行項目排行。從今天(2019 年 10 月 10 日)的榜單來看,確實有一部分項目是中文的。
  • Reddit年度盤點:2019年最佳機器學習項目
    年一些令人難以置信的項目、研究、演示等,下面我們將介紹 17 個在機器學習領域最受歡迎、被討論最多的項目,這些項目由 r/MachineLearning subreddit 策劃。為 NLP 準備的 48 萬個爛番茄上的評論數據集(464⬆️)作者在網上搜尋爛番茄的評論,這在自然語言處理任務中可能非常有用。
  • 2018年github上最值得學習的十個熱門項目
    項目一 julia(語言)簡介:julia是一種新的、高性能的動態語言, 目前在github上已經超過了10000+star項目二 Muzei-macOS(蘋果桌面)簡介:Muzei-macOS是一款免費的
  • 推薦一些 GitHub 上值得前端學習的開源實戰項目,進階必看!
    最近好多同學問我了解找一些學習的實戰項目;看一個別人寫的優秀的項目,從中可以學到很多;比如代碼的規範,項目的結構;從項目作者每次提交記錄,去學習一些別人的開發思維以及開發整個項目的流程;下面我主要找了一些比較火的一些框架以及 node 項目。
  • 如何上傳項目到GitHub
    本文轉載自【微信公眾號:吾非同】,經微信公眾號授權轉載,如需轉載與原文作者聯繫 圖丨pixabaygithub作為開源的分布式版本管理系統,上面有眾多的優秀開源項目,也有豐富的學習資料,熟練使用github也是程式設計師的一項必備技能。
  • 乾貨| 請收下這份2018學習清單:150個最好的機器學習,NLP和Python...
    本文英文出處:Robbie Allen翻譯/雷鋒網字幕組 吳楚校對/ 雷鋒網 田晉陽機器學習的發展可以追溯到1959年,有著豐富的歷史。這個領域也正在以前所未有的速度進化。在今年秋季開始準備博士項目的時候,我已經精選了一些有關機器學習和NLP的優質網絡資源。一般我會找一個有意思的教程或者視頻,再由此找到三四個,甚至更多的教程或者視頻。猛回頭,發現標收藏夾又多了20個資源待我學習(推薦提升效率工具Tab Bundler)。
  • ...請收下這份2018學習清單:150個最好的機器學習,NLP和Python教程
    本文英文出處:Robbie Allen翻譯/雷鋒網字幕組 吳楚校對/ 雷鋒網 田晉陽機器學習的發展可以追溯到1959年,有著豐富的歷史。在今年秋季開始準備博士項目的時候,我已經精選了一些有關機器學習和NLP的優質網絡資源。一般我會找一個有意思的教程或者視頻,再由此找到三四個,甚至更多的教程或者視頻。猛回頭,發現標收藏夾又多了20個資源待我學習(推薦提升效率工具Tab Bundler)。
  • 迎來PyTorch,告別 Theano,2017 深度學習框架發展大盤點
    在機器學習和科學計算工具 Torch 的基礎上,針對 Python 語言發布了全新的機器學習工具包——PyTorch。GitHub 地址:https://github.com/Theano/TheanoFacebook 聯手微軟推出 ONNX 標準,共築開放 AI 生態2017 年 9 月,Facebook 聯手微軟發布了一個全新的開源項目—
  • 乾貨 | 請收下這份2018學習清單:150個最好的機器學習,NLP和Python教程
    1959年,有著豐富的歷史。 在今年秋季開始準備博士項目的時候,我已經精選了一些有關機器學習和NLP的優質網絡資源。一般我會找一個有意思的教程或者視頻,再由此找到三四個,甚至更多的教程或者視頻。猛回頭,發現標收藏夾又多了20個資源待我學習(推薦提升效率工具Tab Bundler)。
  • 6月份Github上熱門的開源項目
    6月份GitHub上熱門的開源項目排行已經出爐啦,一起來看看上榜詳情吧!這個項目的代碼實現。5. vanillawebprojectshttps://github.com/bradtraversy/vanillawebprojectsStar 6589這是一個使用HTML5,CSS和JavaScript構建的20多 個小型項目的集合,一共包含20個項目,諸如電影訂票頁面,視頻播放器界面、匯率計算器、
  • 從星際2深度學習環境到神經機器翻譯,上手機器學習這些開源項目必...
    另外,雷鋒網 AI 研習社在原文的基礎上補充了部分開源項目,為 AI 開發者提供更加詳細的 AI 項目和資源。機器學習是用數據來學習、概括、預測的研究。近幾年,隨著數據的開發、算法的改進以及硬體計算能力的提升,機器學習技術得以快速發展,不斷延伸至新的領域。
  • GitHub標星6000+!Python帶你實踐機器學習聖經PRML
    【新智元導讀】PRML是模式識別和機器學習領域的經典著作,出版於2007年。該書作者 Christpher M. Bishop 是模式識別和機器學習領域的專家,其1995年所著的「Nerual Networks for Pattern Recognition」也是模式識別、人工神經網絡領域的經典著作。
  • 如何在 Github 上發現優秀的開源項目?
    問到點子上了,GitHub 其中一個最重要的作用就是發現全世界最優秀的開源項目,你沒事的時候刷刷微博、知乎,人家沒事的時候刷刷 GitHub ,看看最近有哪些流行的項目,久而久之,這差距就越來越大,那麼如何發現優秀的開源項目呢?這篇文章我就來給大家介紹下。1.
  • 機器之心年度盤點:2018年重大研究與開源項目
    基於這些思考,NYU、AWS 開發了 Deep Graph Library(DGL),一款面向圖神經網絡以及圖機器學習的全新框架。項目地址:https://github.com/jermainewang/dgl目前 DGL 提供了 10 個示例模型,涵蓋了單靜態圖、多圖和巨圖三種類別。
  • Github 上打星超過 1 萬的可復現頂會論文項目
    2017 年模型最終在幾個基準生成建模任務中獲得了先進的方差減少結果,可以更快地進行收斂並達到更好的最終對數似然結果。_2017/html/Lin_Focal_Loss_for_ICCV_2017_paper.html復現代碼:https://github.com/facebookresearch/Detectron簡介:這是迄今為止精度最高的基於 R-CNN 的兩步式檢測器,其分類器可應用於稀疏的候選對象位置集。
  • 值得mark的11個開源機器學習項目
    垃圾郵件過濾、人臉識別、推薦引擎——當你有一個大數據集並且希望利用它們執行預測分析和模式識別,機器學習是必經之路。這門科學,計算機可以在沒有事先規劃的前提下自主學習、分析和操作數據,現在越來越多的開發人員關注機器學習。機器學習技術的興起不僅是因為硬體成本越來越便宜以及性能越來越強大,促使機器學習在單機或大規模集群上輕鬆部署的免費軟體激增也是重要因素。
  • 安全專業人士最愛的 19 個 GitHub 開源項目
    GitHub上有許多開源項目可供安全專業人士選擇,而且每天都有新的項目出現。不妨將這些項目添加到你的工具庫,讓你工作起來更得心應手。