Pandas GUI:如何輕鬆獲取Pandas數據幀?

2021-01-11 讀芯術

全文共2071字,預計學習時長6分鐘

Pandas庫目前已經成為用Python進行探索性數據分析的絕佳伴侶。它功能豐富,靈活易用,成為了當今許多數據科學家的首選。Pandas庫的社區也很完善,這讓它能夠一直積極發展和改進。

提到Pandas,就不得不提到這兩種工具:

· 可以用簡短的代碼執行基本EDA的工具。這些庫本質上是在hood中運行Pandas的功能,如SweetViz和Pandas profiling庫。

· 基於GUI的Pandas替代品,如Bamboolib。

最近,筆者發現了另一個基於GUI的Pandas替代,叫做PandasGUI。它具有繪製數據幀以及重新構建數據幀的功能,用戶也可以進行任意自定義操作。本文將介紹它的各種功能以及在數據中使用的方法。

PandasGUI,顧名思義,是一個用於分析Pandas數據幀的圖形用戶界面。該項目仍在積極開發中,可能會發生顛覆性的變化。

可以通過以下幾種方式安裝PandasGUI:

# from PyPipip install pandasguior# from Githubpip install git+https://github.com/adamerose/pandasgui.git

接下來,筆者將通過一個示例來介紹PandasGUI庫的各種功能。PandasGUI已經裝配了一些示例數據集,我們使用的是庫中已有的Titanic數據集。

Titanic是機器學習中相當有名的「Hello World」數據集,其任務是創建一個模型,預測哪些乘客會在鐵達尼號沉船事故中倖存。

import pandas as pdfrom pandasgui import showfrom pandasgui.datasets import titanicgui = show(titanic)

可以通過以下方式導入數據集:

titanic = pd.read_csv('https://github.com/adamerose/datasets/blob/master/titanic.csv')gui = show(titanic)

運行上述命令後,PandasGUI中將打開一個單獨的窗口,並顯示上載的數據幀:

PandasGUI中的Titanic數據幀 | 作者原創圖

對DataFrames和Series進行查看與排序

可以查看導入的全部數據幀,然後按升序或降序對其進行快速排序。請注意,PandasGUI也可以處理多類數據幀。

對DataFrames和Series進行查看和排序 | 作者原創圖

用查詢表達式篩選數據幀

探索了數據集之後,就可以根據一些查詢表達式篩選數據集。Pandas最初用Dataframe.query()執行篩選操作。它用字符串形式的表達式來篩選數據,對原始數據幀進行更改,並返回篩選後的數據幀。

就本數據集而言,假設想要篩選出以下乘客:

· 男性

· 屬於Pclass 3

· 在沉船事故中倖存

篩選數據幀 | 作者原創圖

數據編輯和複製粘貼

此工具的另一個強大功能是可以直接編輯任何條目,甚至可以將選中的數據複製粘貼到另一個類似excel或記事本的文檔中。

數據編輯和複製粘貼 | 作者原創圖

統計摘要

PandasGUI還提供整個數據集的精簡統計摘要。

統計摘要 | 作者原創圖

對話繪圖

數據可視化是任何數據分析過程中必不可少的,PandasGUI提供了幾個選項來快速創建一些酷炫的交互式圖表,例如:

PandasGUI可製作的圖表 | 作者原創圖

用pivot和melt函數重造數據幀

有時需要重造數據以獲得更清晰的觀察視角。PandasGUI中的pivot函數與melts函數都能實現此功能。

用pivot來重造數據| 作者原創圖

通過拖放導入CSV文件

PandasGUI的另一個強大之處是,只需將數據幀拖到GUI界面上,就可以簡單地導入數據幀。

通過拖放導入CSV文件 | 作者原創圖

從Jupyter Notebook獲取GUI數據幀

如果已經直接將數據幀導入到PandasGUI界面上,那麼只需幾行代碼就可以在熟悉的juptyer notebook中獲取數據幀。這樣就可以隨時讓notebook自帶數據分析過程。

從Jupyter Notebook訪問GUI數據幀 | 作者原創圖

Pandas GUI正在積極開發中,我們可能會在未來看到更多的功能。它拯救了對於那些不喜歡編碼或者想要藉助低代碼平臺的人,趕緊掌握它吧!

留言點讚關注

我們一起分享AI學習與發展的乾貨

如轉載,請後臺留言,遵守轉載規範

相關焦點

  • Pandas 數據處理|Datetime 時間模塊在 Pandas 中的使用
    ).mean()apple_month.head()下面將根據兩套習題,簡單介紹一下 Pandas 是怎麼使用 DataFrame 數據的1 , to_datetime() 與 resample() 操作1.1,讀取數據url = "https://raw.githubusercontent.com/guipsamora/pandas_exercises
  • 數據處理必看:如何讓你的 pandas 循環加快 71803 倍
    雷鋒網 AI 開發者按,如果你使用 python 和 pandas 進行數據分析,那麼不久你就會第一次使用循環了。然而,即使是對小型數據集,使用標準循環也很費時,你很快就會意識到大型數據幀可能需要很長的時間。當我第一次等了半個多小時來執行代碼時,我找到了接下來想與你共享的替代方案。標準循環數據幀是具有行和列的 pandas 對象。
  • 更高效地利用 Jupyter+pandas 進行數據分析,6 種常用數據格式效率對比!
    進行數據分析時,Jupyter Notebook 是一個非常強力的工具,在數據集不是很大的情況下,我們可以使用 pandas 輕鬆對 txt 或 csv 等純文本格式數據進行讀寫。然本文將對 pandas 支持的多種格式數據在處理數據的不同方面進行比較,包含 I/O速度、內存消耗、磁碟佔用空間等指標,試圖找出如何為我們的數據找到一個合適的格式的辦法!
  • 懂Excel就能輕鬆入門Python數據分析包pandas(十六):合併數據
    此系列文章收錄在公眾號中:數據大宇宙 > 數據處理 >E-pd經常聽別人說 Python 在數據領域有多厲害,結果學了很長時間,連數據處理都麻煩得要死。後來才發現,原來不是 Python 數據處理厲害,而是他有數據分析神器—— pandas前言本系列上一節說了拆分數據的案例,這次自然是說下怎麼合併數據。
  • PANDAS: 新手教程 一
    # 如果你使用的是Anacondaconda install -c conda-forge pandas# 使用pip安裝Pandaspip install pandas# 導入pandasimport pandas as pd在這個練習中,我將使用著名的鐵達尼號數據集。
  • Pandas on Ray:僅需改動一行代碼,即可讓Pandas加速四倍
    簡介Pandas on Ray 是 DataFrame 庫的早期階段,DataFrame 庫封裝了 Pandas,並且透明地分配數據和計算。使用 Pandas on Ray,用戶不需要知道他們的系統或集群有多少個核心,也不需要指定如何分配數據。
  • 懂Excel也能輕鬆入門Python數據分析包pandas(二):高級篩選(上)
    更多 Python 數據處理的乾貨,敬請關注!!!!系列文章:懂Excel就能輕鬆入門Python數據分析包pandas(一):篩選功能前言經常聽別人說 Python 在數據領域有多厲害,結果學了很長時間,連數據處理都麻煩得要死。
  • PANDAS: 新手教程 一 - 人工智慧遇見磐創
    # 如果你使用的是Anacondaconda install -c conda-forge pandas# 使用pip安裝Pandaspip install pandas# 導入pandasimport pandas as pd在這個練習中,我將使用著名的鐵達尼號數據集。
  • 想讓pandas運行更快嗎?那就用Modin吧
    Pandas 是數據科學領域流行的程序庫,能夠提供高性能、易於使用的數據結構和數據分析工具。但是處理規模大小不同的數據使,用戶還得求助於不同的工具,實在有點麻煩。而 Modin 能夠將 pandas 的運行速度提高好幾倍,而無需切換 API 來適應不同的數據規模。「通過更改一行代碼擴展你的 pandas 工作流。」
  • Pandas transform函數
    在本文中,我們將介紹以下最常用的Pandas transform()用途:轉換值組合groupby()過濾數據在組級別處理缺失值請查看我的Github repo以獲取原始碼;https://github.com/BindiChen/machine-learning/blob/master/data-analysis/013-pandas-transform/pandas-transform.ipynb
  • PandaSQL:一個讓你能夠通過SQL語句進行pandas的操作的python包
    在繼續之前,一定要考慮如何在pandas中做這樣的事情。pandas的解決方案那麼在pandas身上該怎麼做呢?pandas肯定可以解決這個問題,儘管我認為它的可讀性不夠。讓我們從生成一些要處理的隨機數據開始。
  • 懂Excel輕鬆入門Python數據分析包pandas(二十七):IF函數代替者
    此系列文章收錄在:數據大宇宙 > 數據處理 > E-pd轉發本文並私信我"python",即可獲得Python資料以及更多系列文章(持續更新的)經常聽別人說 Python 在數據領域有多厲害,結果學了很長時間,連數據處理都麻煩得要死。
  • 懂Excel就能輕鬆入門Python數據分析包pandas(七):分列
    後來才發現,原來不是 Python 數據處理厲害,而是他有數據分析神器—— pandas前言今天從兩個需求來看看數據分列功能,由於 Excel 自帶功能比較弱,在處理稍微複雜的需求時會顯得力不從心,因此,本系列文章將引入 Excel 中一個非常高效的數據處理插件—— Power Query,並且看看 pandas 是怎樣靈活解決。
  • Python數據分析利器,Pandas入門介紹,幫你便捷高效處理複雜數據
    pandas的矩陣運算可以幫我們結構化成表格數據,省去大量自己拼接表格數據的代碼開銷。本章知識點:pandas 安裝和使用pandas 數據結構(Series)pandas 數據結構(DataFrame)pandas 安裝和使用通過 pip install pandas可以直接安裝安裝pandas和相關聯的庫。
  • Python數據處理包,pandas 乾貨知識,關於軸的理解
    更多 Python 數據處理的乾貨,敬請關注!!!!前言axis 表示軸,是處理多維數據時用於表示維度方向的概念,在 pandas 中大部分的方法都有 axis 參數,因為 pandas 需要調用者告訴他,需要處理的是哪個維度的數據。
  • Pandas閃回咒!如何在Python中重寫SQL查詢?
    一些程式設計師只熟悉SQL中的數據操作,卻不熟悉Python中的數據操作,因此在完成項目時,我們不得不頻繁地在SQL和Python之間進行切換,導致了工作效率低下和生產能力下降。本文就教你一種方法,使用Pandas在Python中輕鬆重現SQL結果。
  • 使用pandas和openpyxl處理複雜Excel數據
    關於Excel數據處理,很多同學可能使用過Pyhton的pandas模塊,用它可以輕鬆地讀取和轉換Excel數據。但是實際中Excel表格結構可能比較雜亂,數據會分散不同的工作表中,而且在表格中分布很亂,這種情況下啊直接使用pandas就會非常吃力。本文蟲蟲給大家介紹使用pandas和openpyxl讀取這樣的數據的方法。
  • 懂Excel輕鬆入門Python數據分析包pandas(二十一):透視表
    後來才發現,原來不是 Python 數據處理厲害,而是他有數據分析神器—— pandas前言本系列上一節文章最後我隨手使用了 pandas 中的透視表操作,之後有些小夥伴詢問我相關的問題。正好 pandas 的 pivot_table 也是與 Excel 透視表對應。本文簡單教你入門使用 pandas 完成透視表功能。
  • 數據分析從業者必看,10 個加速 python 數據分析的簡單的小技巧
    其中,有些可能是相當有名的,有些可能是新的,但我相信下次您從事數據分析項目時,它們會非常有用。1.Profiling the pandas dataframeProfiling 是一個幫助我們理解數據的程序,而 Pandas Profiling 正是實現這一點的一個 python 包。
  • 想成為高效數據科學家?不會Pandas怎麼行
    要想成為一名高效的數據科學家,不會 Pandas 怎麼行?Python 是開源的,它很棒,但是也無法避免開源的一些固有問題:很多包都在做(或者在嘗試做)同樣的事情。如果你是 Python 新手,那麼你很難知道某個特定任務的最佳包是哪個,你需要有經驗的人告訴你。有一個用於數據科學的包絕對是必需的,它就是 pandas。