有時候數據是以csv形式存儲的,要處理數據我們需要先進行讀取操作。這裡我總結了幾種csv的讀取方法(基於python)。
1.利用numpy讀取
import numpy as npdata = np.loadtxt(open("路徑.csv","rb"),delimiter=",",skiprows=n,usecols=[2,3])delimiter是分隔符,skiprows是跳過前n行,usecols是使用的列數,例子中讀取的是3,4列。
2.利用pandas讀取
import pandas as pddata = pd.read_csv(r'C:\Users\lenovo\Desktop\parttest.csv',sep=',',header='infer',usecols=[5])同樣地,sep相當於上面的delimiter,是分隔符。而這個函數中也包含delimiter,它屬於備用的分隔符(csv用不同的分隔符分隔數據)。header是列名,是每一列的名字,如果header=1,將會以第二行作為列名,讀取第二行以下的數據。usecols同上,是讀取第幾列。
值得注意的是,例如,我們查看某個值,print(data[1]),是會報錯的。我們可以藉由下面程序。
array=data.values[0::,0::] print(array[])3.利用Python I/O讀取文件
import csv
import csv filename='C:\\Users\\lenovo\\Desktop\\parttest.csv'data = []with open(filename) as csvfile: csv_reader = csv.reader(csvfile) for row in csv_reader: data.append(row[5]) print(data)或者使用DictReader,第一行即作為標籤。
import csv filename='C:\\Users\\lenovo\\Desktop\\parttest.csv'data = []with open(filename) as csvfile: csv_reader = csv.reader(csvfile) for row in csv_reader: data.append(row[5]) print(data)