panda是另一個可以提高您的Python數據科學技能的大型庫。就像NumPy一樣,它屬於SciPy開源軟體家族,並且可以在BSD自由軟體許可下使用。
Pandas提供多功能和強大的工具,用於整理數據結構和執行大量數據分析。該庫適用於不完整,非結構化和無序的實際數據,並提供了用於整形,聚合,分析和可視化數據集的工具。
此庫中有三種類型的數據結構:
Series:單維陣列
DataFrame:具有異構類型列的二維
Panel:三維,大小可變數組
例如,讓我們看看Panda Python庫(縮寫為pd)如何用於執行一些描述性統計計算。從導入庫開始:
import pandas as pd
先創建一個系列字典:
d = {'Name':pd.Series(['Alfrick','Michael','Wendy','Paul','Dusan','George','Andreas',
'Irene','Sagar','Simon','James','Rose']),
'Years of Experience':pd.Series([5,9,1,4,3,4,7,9,6,8,3,1]),
'Programming Language':pd.Series(['Python','JavaScript','PHP','C++','Java','Scala','React','Ruby','Angular','PHP','Python','JavaScript'])
}
再創建一個DataFrame。
df = pd.DataFrame(d)
輸出表如下:
Name Programming Language Years of Experience
0 Alfrick Python 5
1 Michael JavaScript 9
2 Wendy PHP 1
3 Paul C++ 4
4 Dusan Java 3
5 George Scala 4
6 Andreas React 7
7 Irene Ruby 9
8 Sagar Angular 6
9 Simon PHP 8
10 James Python 3
11 Rose JavaScript 1
下面是這個示例的全部代碼:
import pandas as pd
#creating a dictionary of series
d = {'Name':pd.Series(['Alfrick','Michael','Wendy','Paul','Dusan','George','Andreas',
'Irene','Sagar','Simon','James','Rose']),
'Years of Experience':pd.Series([5,9,1,4,3,4,7,9,6,8,3,1]),
'Programming Language':pd.Series(['Python','JavaScript','PHP','C++','Java','Scala','React','Ruby','Angular','PHP','Python','JavaScript'])
}
#Create a DataFrame
df = pd.DataFrame(d)
print(df)