看看這些鮮為人知的寶藏Python數據科學包吧

2020-12-23 51CTO

看看這些鮮為人知的寶藏Python數據科學包吧

動態數據科學的這三劍客幾乎無人不知無人不曉:Numpy,Pandas和Matplotlib。你可能已經熟悉這些包以及它們的運作方式。

作者:讀芯術來源:讀芯術|2020-07-03 18:05

本文轉載自公眾號「讀芯術」(ID:AI_Discovery)

動態數據科學的這三劍客幾乎無人不知無人不曉:Numpy,Pandas和Matplotlib。你可能已經熟悉這些包以及它們的運作方式。

還有其他很炫酷的包,你肯定也想試一試,例如Plotly,Seaborne,Scikit-Learn,Tensorflow和Pytorch等等。它們都很好,還有數百萬個用於Python機器學習的軟體包,其中有些未受到重視,甚至有些完全不為人知的!

本文就帶大家認識一下這些滄海遺珠。

1.Gleam

Gleam可能很多人沒有聽說過,它是一個很棒的工具,用於創建帶有頁面、面板和按鈕的交互式可視化項目。這些交互式Web可視化也完全與Web集成在一起,這意味著可以將它們放到網站到端點的任何地方。Gleam使用wtforms進行交互,可以使用任何的不同可視化工具來實際顯示數據。

如果想要一個很酷的交互式窗格,基本上可以使用任何圖形庫,那麼Gleam是你的優秀選擇。

2.Table

放著pandas不用,為什麼要去用Table呢?這當然是一個可行的方法。Table包使得該列表輕鬆成為pandas的輕量級替代品,使用Table.py讀取龐大的數據集要比使用Pandas.py容易得多。總體而言,在某些情況下它可能更合適。

  1. import pandas as pd 

3.Mlpy

Mlpy為監督和無監督學習提供了大量比較先進的機器學習方法。與同類產品不同,它旨在為數據科學提供一種多合一的方法。雖然有點過時,但對於快速增長的Python機器學習包來說無疑是一個很好的起步,它的易用性、有趣的算法和包容性是比較大的亮點。

Mlpy試圖創建一種能平衡重現性、模塊化和效率的包。該包在這方面取得了成功,因為儘管許多同類包的更新頻率更高,而且肯定是行業標準,但許多此類想法似乎在編譯中丟失了。因為這些都是由成千上萬的開發人員以C語言編寫的龐大的包,但這可能也是使用它們的缺點所在。

4.Shogun

Shogun是一個用C++編寫的機器學習庫,恰巧擁有Python埠。Shogun的一大優點是,它可用於多種不同的程式語言,並且相對統一。學習Shogun,你可以將所學知識應用於支持的任何其他語言。

Shortgun擁有廣泛的前沿機器學習算法,它也是開源的,並且根據GNU(自由軟體基金會)通用許可發行,這是一個加分項。

5.OpenCV

OpenCV最初是由Intel開發的。儘管是Intel的獨家包,但它是開源的,並根據FreeBSD許可證發布。OpenCV非常優秀的一點是,它著重於實時計算機視覺,與Shogun一樣,OpenCV最初是用C++編寫的,但是具有Python和其他語言的接口。

說實話,這五個包還不夠普及,對它們的評價也很鮮見。這些軟體包確實很酷,但可以肯定,還有數百個甚至數千個其他很酷的模塊可以添加到Pip環境中,這些模塊也很棒卻鮮為人知。

Python有一個完善的生態系統和許多可挖掘的包,這正是它如此強大的原因。不斷學習新模塊,也能讓你保持頭腦活躍。

【編輯推薦】

【責任編輯:

華軒

TEL:(010)68476606】

點讚 0

相關焦點

  • Python和人工智慧有什麼關係?Python 和人工智慧的區別是什麼?
    人工智慧人工智慧是一個大的概念,在人工智慧下有計算機視覺,語音識別,自然語言處理等不同的技術領域,這些技術領域中在Github上又有許多開源的代碼可以直接用來開發,而這些代碼往往需要或者只支持人工智慧是一個大的範疇,包括很多方面的應用,比如機器學習,在機器學習中的回歸算法,它們是通過統計分析所有數據來建立多因式,然後求解式子,而在這個過程中程式語言起到的作用是清洗數據、處理數據、建立關係求解結果的作用,python適用於數據清洗且學習成本低,所以在一定程度上,好一部分人傾向於將python應用於人工智慧應用領域。
  • python獲取ES中的數據
    在介紹如何從ES中獲取數據之前,我們先在ES中添加一條數據,創建索引test。以下操作均在kibana中運行1.查看索引中的數據命令:GET test/_searchES中有了數據之後,我們來通過python獲取ES中的值。這裡用兩種方式分別獲取ES中的值。第一種方式使用python中的Elasticsearch工具包;第二種方式使用requests工具包,即通過請求url的方式才kibana獲取ES中的值。
  • python數據分析:如何用python做路徑分析,附資料庫實例操練
    中介模型(mediated model)常常在行為科學領域用來驗證因果機制(causal mechanism)。    python路徑分析實操  用python做結構方程模型需要用到的庫為semopy,semopy是一個傘形python包,它包含許多結構方程建模(sem)技術。
  • 開課吧:Python是什麼意思?為什麼有那麼多人學Python?
    Python 是由 Guido van Rossum 在八十年代末和九十年代初,在荷蘭國家數學和計算機科學研究所設計出來的。python非常容易上手,而且能幹很多事情,WEB開發,機器學習人工智慧,數據分析,量化投資,爬蟲等,基本可以應用到各行各業,而且大家都在做基於PYTHON的庫,使得PYTHON語言變成一門直接拿來就能用的語言,更像一種工具了,比如機器學習,可能理論很複雜,但是實際在PYTHON中僅僅幾行代碼就能實現,不用花太多時間用在碼代碼上面,python 現在是越來越火
  • 還在為自學數據科學發愁嗎?化學工程畢業生教你如何轉行
    好,那我該如何學習數據科學?  這一系列博客將重點介紹在自學中參加的一些課程以及它們的優缺點。希望能藉此幫助你規劃數據科學領域的自學之旅。  精通SQL並不難。  我使用python和R進行編碼開始於與CodeAcademy,Datacamp,Dataquest,SoloLearn和Udemy等一起寫代碼的網站。這些網站提供按語言或程序包組織的自定進度課程。每種方法都將概念分解為易於消化的部分,並為用戶提供了入門代碼。通常是先引導你完成一個簡單的演示,隨後將有機會通過練習立即練習該概念。一些人隨後提供基於項目的練習。
  • Python畫地圖逃不過的basemap包「完全安裝手冊」
    前段時間看《利用python進行數據分析》這本書,到可視化的部分,看著最後的例子地圖挺酷炫的,跟著敲代碼的過程中,發現有時候不是你不會寫,是壓根都沒機會實現代碼!!!作者是這樣寫的:02basemap包導入好的,讓我們來導入basemap吧,
  • 如何在6個月內學會Python?
    這些都是筆者之前學習C語言和Java失敗的經驗之談。因為不知道將語言應用在何處,不久便放棄了學習的想法,這兩種語言的學習都以失敗告終。因為不曾有任何的應用案例,筆者也沒有學過那些語言的語法。但是,在學習Python時,情況有所不同。筆者想提高數據科學技能並將職業規劃轉向數據分析領域,學習python就是該計劃的一部分。
  • 六個步驟,封裝你最愛的Python代碼包!
    這就是通常在程式語言中使用模塊、包和庫的原因,特別是在Python的開發環境中。它的實現可使Python功能更加強大;只需簡單的pip install 和 import就能獲得BeautifulSoup的html解析功能或pandas的數據幀處理功能。
  • Python2 已終結,入手Python 3,你需要這30個技巧
    不過它的優勢不止這些,它那些如魔法般的內置命令行也讓是我愛使用它的原因。這些命令有:%cd—修改當前工作路徑%edit—打開編輯器,並在關閉時執行你剛剛輸入的代碼%env—顯示當前環境變量%pip install [pkgs]—在不離開 Shell 的情況下安裝包
  • PySpark源碼解析,用Python調用高效Scala接口,搞定大規模數據分析
    然而,在數據科學領域,Python 一直佔據比較重要的地位,仍然有大量的數據工程師在使用各類 Python 數據處理和科學計算的庫,例如 numpy、Pandas、scikit-learn 等。同時,Python 語言的入門門檻也顯著低於 Scala。
  • 介紹一下什麼是python(瘋狂Python)
    後續我會不斷努力的更新關於學英語的一些文章,同時,我也會不斷更新新的知識(譬如:程式語言:python,資料庫:mysql,Linux系統的一些操作等等,與大家一起學習進步)。進入正題,大家都應該聽說過Python這門程式語言吧,它在程式語言中的排名不斷的再提升,之所以這麼受歡迎,是因為它簡單,易學。
  • 【乾貨】4月Python 熱門推薦Top 10
    通過這些練習,大多數學生在不到一個月的時間裡就可以使用Python語言了。 下載地址: https://github.com/joaoventura/full-speed-python 3.此外,它還將涵蓋Pipenv 如何與以前的分配包(Package distribution)方法相適應。 地址: https://realpython.com/pipenv-guide/ 6.
  • Python真的值得學習嗎
    1991年初python公布了第一個公開發行版本。由於它是用C語言實現的,所以從一出生,Python已經具有了:類,函數,以及以模塊為基礎的拓展系統等。 尤其是2017年人工智慧概念的興起,python的關注度也是越來越高。儘管目前它仍然無法和java等程式語言抗衡,但隨著未來人工智慧權重的提高,掌握python也就成為一種必然。它的開發效率比 C, Java 高很多,很多的創業公司當初為了把想法快速變成現實產品從而獲得投資資金,首選 Python作為開發語言。這估計也是當年推動python流行起來的另一個原因吧。
  • 「python學習手冊-筆記」003.數值類型
    這是由於浮點數是有限的比特位數,導致無法精確的表示某些數值.這個問題不僅在python中存在,在其他語言中同樣存在. 不過python有分數和小數,可以很好的規避這些問題. 畢竟python適合科學計算的特性不是白來的.python中的除法python中有三種風格的除法和兩種除法運算符.
  • 那些讓人驚豔的Python庫
    每一門技藝都是入門容易熟悉難,越是了解,越是感覺到自己的欠缺,在python博大精深的世界裡,這些蔚為壯觀的python庫,也只能算是滄海一粟。科學技術和數據分析用來進行科學計算和數據分析的庫。astropy–一個天文 Python庫。bcbio-nextgen–這個工具箱為全自動高通量測序分析提供符合最佳實踐的處理流程。
  • 為什麼Python是數據科學領域最受歡迎的語言
    為什麼大多數數據科學家都喜歡Python?這篇文章會讓你了解到,Python有很多完善的工具包可以協助你完成重要的數據科學任務。 根據Indeed,Glassdoor和Dice等職場網站所提供的信息,與去年同期相比,隨著各行各業越來越依賴於數據進行決策,商業對數據科學家的需求也在繼續擴大。
  • Python 炫技操作:安裝包的八種方法
    使用 pip installpip 是最主流的包管理方案,使用 pip install xxx 就可以從 PYPI 上搜索並安裝 xxx (如果該包存在的話)。由於它是一個第三方工具,因此在使用它之前,需要先安裝$ python3 -m pip install  $ python3 -m userpath append ~/.
  • 常用的十大 python 圖像處理工具
    圖片來自 Pexels 的Luriko Yamaguchi今天,在我們的世界裡充滿了數據,圖像成為構成這些數據的重要組成部分。但無論是用於何種用途,這些圖像都需要進行處理。圖像處理就是分析和處理數字圖像的過程,主要旨在提高其質量或從中提取一些信息,然後可以將其用於某種用途。圖像處理中的常見任務包括顯示圖像,基本操作如裁剪、翻轉、旋轉等,圖像分割,分類和特徵提取,圖像恢復和圖像識別。
  • Python學習120課 pandas簡介kaggle下載數據及pandas讀取外部數據
    【每天幾分鐘,從零入門python編程的世界!】numpy的基本的東西我們學習差不多了,後面具體應用中遇到問題具體分析,然後去深入了解遇到的新的知識點就行。現在我們開始學習pandas,pandas一般用的更多,pandas是基於numpy去寫的。
  • 資源| Python 數據科學手冊
    資源 | Python 數據科學手冊