10月機器學習開源項目Top10

2021-02-15 機器學習算法與Python學習

作者 | Mybridge

譯者 | 林春眄

整理 | Jane

出品 | AI科技大本營

過去一個月裡,我們對近 250 個機器學習開源項目進行了排名,並挑選出熱度前 10 的項目。這份清單的平均 github star 數量高達 1345,涵蓋了包括深度學習, Tensorflow, 圖像分割, 漫畫著色, 強化學習,Unity 等主題,希望你能從中找到一個你所感興趣的項目深入探究。

Top 1 :fastai

fastai 庫由 fast.ai 研究團隊貢獻,使用當前最佳的實踐研究簡化了快速準確的神經網絡訓練。你可以在 fastai 官網找到並使用它。fastai 庫是基於 fast.ai 團隊進行的深度學習最佳實踐研究,包括對視覺,文本,表格和協作(協同過濾)模型的支持,方便研究者直接使用。你可以在示例文件夾中找到有關示例,也可以參閱完整的文檔以便了解更詳細的使用說明。





Github 地址:

https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

官網:

https://docs.fast.ai/

Top 2:Deepvariant

Deepvariant 是由 Google 研究團隊貢獻的開源項目,通過運用深度神經網絡來從下一代 DNA 序列數據中預測遺傳變異。它是基於 Python/C++ 的程序,尚且只支持 Python 2.7,並能夠在任何 unix 作業系統上運行。Deepvariant 具有高精度,強魯棒性,快速高效,靈活性強,易於使用等優點。





Github 地址:

https://github.com/google/deepvariant?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 3:Albumentations 

Albumentations 是一個快速的圖像增強庫,它易於使用並封裝了其他一些圖像處理庫的功能。此外,它還具有如下特點:





Github 地址:

https://github.com/albu/albumentations?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 4:MangaCraft

MangaCraft 是當前最佳的半自動化漫畫著色項目。





Github 地址:

https://github.com/lllyasviel/MangaCraft?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

參考視頻:

https://www.bilibili.com/video/av32698923/

Top 5:Holodeck

Holodeck 是用於強化學習和機器人研究的模擬器,它具有高保真性。你可以訪問該項目所提供的用戶使用手冊,以便更加詳細的了解整個過程。





Github 地址:

https://github.com/byu-pccl/holodeck?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

使用手冊

https://holodeck.readthedocs.io/en/latest/

Top 6:Petastorm

Petastorm 是 Uber ATG 研發的一個開源數據訪問庫。它可直接從 Apache Parquet格式的數據集中進行單機或分布式訓練,以及深度學習模型的評估。此外,Petastorm 還支持當前流行的基於 Python 的機器學習(ML)框架,如 Tensorflow,PyTorch 和PySpark,也可以通過純 Python 代碼來使用它。





Github 地址:

https://github.com/uber/petastorm?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 7:Ngx

Ngx 是一個基於神經網絡的視覺生成器和混合器,能夠利用神經網絡進行 VJing 過程。它將 pix2pix (使用 cGAN 的圖像到圖像轉換)作為 ad-hoc 的下一幀預測模型,使用從視頻剪輯中提取的成對連續幀數據進行反覆地訓練,以便模型能夠生成無限持續時間的圖像序列。此外,它還能夠混合(交叉淡化) 兩個 pix2pix 模型,這些模型會產生變化,並轉換為生成的視頻。





Gituhub 地址:

https://github.com/keijiro/Ngx?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 8:AlphaAI

AlphaAI 是一個使用無監督和監督學習進行股票預測的開源項目,通過堆疊神經網絡的實現來預測股票的盈利值。它包含多個訓練組件,使用者可以通過調整替換各種組件組成以便模型獲得最佳的預測結果。





Gituhub 地址:

https://github.com/VivekPa/AlphaAI?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 9:Blueoil

Blueoil 是一個將深度學習應用於小型設備的開源項目。它能夠訓練一個神經網絡,並將訓練好的模型轉化為可執行的二進位庫,以便通過 FPGA 進行加速。






Gituhub 地址:

https://github.com/blue-oil/blueoil?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 10:Tencent-ml-images

Tencent-ml-images 是包含當前最大的多標籤圖像資料庫(ml-images) 的開源項目,共由 11166 個圖像類別,17609752 張訓練圖像和 88739  哥驗證數據的URL 地址組成。此外,通過遷移學習,將ml-images 上預訓練好的ResNet-101 模型遷移到 ImageNet  資料庫上,能夠實現 80.73% 的 Top1 精度。





Gituhub 地址:

https://github.com/Tencent/tencent-ml-images?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

推薦閱讀

網際網路公司時尚穿搭指南

【資源】這本開放書籍幫你掃清通往ML的數學絆腳石

最強NLP預訓練模型!谷歌BERT橫掃11項NLP任務記錄

樸素貝葉斯詳解及中文輿情分析(附代碼實踐)

【代碼集合】深度強化學習Pytorch實現集錦

pandas入門教程

【資源】機器學習算法工程師手冊(PDF下載)

相關焦點

  • 6月份最熱門的機器學習開源項目Top10
    AI 前線導讀: 燥熱的 6 月天已經結束了,本月機器學習領域又有哪些開源項目值得一看呢?Mybridge AI 從將近 250 個機器學習開源項目中評選出排名 Top10 的項目。這是他們對在此期間新發布或進行重大發布的項目進行比較之後得出的結果,考量了各種因素對項目的專業性進行排序。哪些項目上榜了呢?
  • 2018年最值得關注的10個機器學習開源項目
    AI 前線導讀:在這篇文章中,我們將花一點時間看一下 2018 年機器學習世界中發生的一些有趣的事情。我們列出了 Mybridge 排名的一些頂級開源項目、機器學習框架的主要進展,以及 2019 年還有哪些事情值得期待。
  • 機器學習必備:前20名Python人工智慧和機器學習開源項目
    如今,Tensorflow的貢獻者人數增長最快,居首位。圖1:Github上的前20名Python人工智慧和機器學習項目上圖:雪花大小與貢獻者的數量成正比,顏色代表貢獻者數量的變化-紅色越高,藍色越低。雪花形狀適用於深度學習項目,適用於其他項目。
  • 【乾貨】去年最火的機器學習開源項目集錦(上)
    近日,Mybridge在Medium上公布了統計的2017年度最受歡迎的機器學習開源項目,包含了各類機器學習庫、開源數據集以及相關項目應用。
  • 技術乾貨:人工智慧和機器學習領域中有趣的開源項目
    本文簡要介紹了10款 Quora上網友推薦的 人工智慧和機器學習領域方面的開源項目。
  • 五個鮮為人知,但又不可不知的機器學習開源項目
    Hyperopt-sklearnHyperopt-sklearn是基於scikit-learn項目的一個子集,其全稱是:Hyper-parameter optimization for scikit-learn,即針對scikit-learn項目的超級參數優化工具。由於scikit-learn是基於Python的機器學習開源框架,因此Hyperopt-sklearn也基於Python語言。
  • 2018 年度 GtiHub 開源項目 TOP 25:數據科學 & 機器學習
    ,致力於為使用機器學習和人工智慧推動人類進步找到新途徑。2018 這一年中,作者在每個月都會發布一份開源項目月度推薦榜單,而本文則是對全年開源項目的盤點和總結。雷鋒網 AI 科技評論編譯如下。前沿關於託管代碼、與團隊成員合作以及充當展示個人寫代碼技能的「在線簡歷」,最好的平臺是哪個?問及任何一位數據科學家,他們都會讓你去 GitHub。
  • 機器學習的五大頂級開源工具
    去年是一個信息自由的好年頭,谷歌、微軟、Facebook、亞馬遜甚至百度等行業巨頭都相繼開放了自己的機器學習框架。這些開原始碼不僅可以培養很多這方面的人才,同時也有助於社區的發展。在機器學習的開源領域,Google無疑是巨頭,TensorFlow在眾多方面都擊敗了其他競爭者。  機器學習會帶來真正的革命,它的科學進步不屬於任何一家公司,而屬於全球。機器學習的開放也意味著每個人都可以參與到這場革命中。
  • 機器學習年度 20 大開源項目花落誰家?(Python 版)
    如今,開源已經成為創新與技術發展的核心。在本文中,雷鋒網將介紹 2016 Python 前20大機器學習開源項目。去年 KDnuggets 評選了前 20 大機器學習開源項目(Python版),今年的評選結果與去年相比,名單中出現了一些新的面孔,有13個新開源項目入圍了這個名單。
  • 2018年最實用機器學習項目Top 6(附開源連結)
    ,許多好用實用的機器學習項目也紛紛出現,新智元為大家推薦2018年中六大最實用的機器學習項目。過去一年,是人工智慧和機器學習蓬勃發展的一年。許多高影響力的機器學習應用被開發出來,特別是在醫療保健、金融、語音識別、增強現實以及更複雜的3D和視頻應用中。我們已經看到了更多的應用驅動研究,而不是理論研究。雖然這些研究有著一些不足,但當前的確產生了巨大的積極影響,也促成了很多可以迅速商業化的新研發。這一趨勢也在機器學習的大部分開源項目中得到了強烈反映。
  • TensorFlow開源一周年,已成Github最受歡迎機器學習項目(新智元報導盤點)
    這一年來,有超過480人直接為TensorFlow做出貢獻,包括 Google 員工、外部研究人員、獨立程式設計師、學生以及其他大公司的高級開發人員。TensorFlow現在已經成為 GitHub 上最受歡迎的機器學習項目。
  • 21 個必須知道的機器學習開源工具!
    在本文中,我們將介紹21種用於機器學習的開源工具。對於來自非編程和非技術背景的人來說,機器學習看起來很複雜。這是一個廣闊的領域,我可以想像第一步可能會多麼令人生畏。沒有編程經驗的人能否在機器學習中取得成功?事實證明,你可以!這裡有一些工具可以幫助你跨越鴻溝並進入著名的機器學習世界:
  • 開源Featuretools:機器學習開發提速10倍!
    近年來,數據科學在自動化模型選擇和超參數調整方面取得了重大進展,但機器學習管道最重要的部分(特徵工程)卻幾乎被忽略了。Python 開源庫 Featuretools 卻成為打開這一關鍵領域的超級入口。在本文中,我們將通過這個庫來了解自動化特徵工程將如何給機器學習錦上添花。
  • 熱門機器學習開源資源最強盤點
    今天我們帶來了由 Mybridge 整理的 2018 年度熱門機器學習開源資源大盤點,值得一提的是,在這份列表中,出現了來自中國騰訊的貢獻的兩個資源。更多優質內容請關注微信公眾號「AI 前線」(ID:ai-front) 在過去的一年裡,我們比較了近 22000 個機器學習開源工具和項目,選出了前 49 個(約佔 0.22%)。
  • 《周志華機器學習詳細公式推導版》完整PDF首發!1.1w+標星開源項目pumpkin-book
    一年前,Datawhale開源項目南瓜書發布
  • 21個必知的機器學習開源工具,涵蓋5大領域
    你肯定已經知道一些知名的開源工具,如R、Python、Jupyter筆記本等。但除此之外,還有一個世界——一個在雷達下機器學習工具存在的世界。它們雖沒有那些知名的開源工具出色,但卻可以幫助用戶解決許多機器學習的任務。
  • 2018年度最牛逼的30個機器學習項目!
    -2018-b853b8621ac7在過去的一年中,我們比較了8,800多個開源機器學習項目,從中挑選出前30名,這個極具競爭力的排行榜,精選了2018年1月到12月期間發布的最佳開源機器學習庫、數據集和應用程式等。
  • 6月Python熱文Top10,精選自1000篇文章
    本次我們對近 1000 種 Python 文章進行了排名,以下為 Top 10 的文章,分享給大家。本次熱文的主題包括:教程,數據可視化,網絡爬蟲,Django,f-Strings,機器學習,Mapbox,Mapbox, Seam carving,Matplotlib(此前發布過多篇收藏黨喜歡的文章,也是來自Mybridge:①Python 開源項目 Top 10 精選,平均star為1128!
  • 開源!《Python 機器學習》第二版(附電子版 pdf)
    今天給大家推薦一本不錯的 Python 機器學習教程,言簡意賅,通俗易懂!就是這本《Python Machine Learning》(2nd),中文譯為《Python 機器學習》(第二版)。,包括在 Scipy 的機器學習教程。
  • Oracle 開源 Java 機器學習庫 Tribuo
    近日,Oracle 開源了一個用 Java 編寫的機器學習庫,名為 Tribuo。