在家無聊,不如跟我一起學Python,從數據獲取、數據清洗,到數據探索、數據可視化,我會的都會分享,不會的我會繼續學習,學無止境,今天分享的是文本數據的導入,一起學習吧!
打開原始的數據如下所示,通過寫代碼讀取數據,當我們處理的數據量很大時,通過寫代碼的方式,簡潔並且高效。
程序代碼都放到代碼框裡了
大家一定要動手多練練
!type D:\python數據分析\數據\shuju1.csv 查看數據情況
df = pd.read_table(open(&39;),sep=&39;) 39;D:/python數據分析/數據/shuju1.csv&39;id&指定行索引df
df = pd.read_csv(open(&39;),index_col=&39;) 數據情況
!type D:\python數據分析\數據\shuju3.txt 數據情況
df = pd.read_table(open(&39;),sep=&39;) 39;D:/python數據分析/數據/shuju3.txt&39;\s+&正則表達式的使用df
數據清洗階段完成後,可以將「乾淨」的數據導出,作為一個新樣本研究,其研究質量會有大幅度的提升。
df.to_csv(&39;) 39;D:/python數據分析/數據/out2.csv&39;?&指定分隔符,存儲文本數據!type D:\python數據分析\數據\out2.csv
df.to_csv(&39;,index=False) 39;D:/python數據分析/數據/out3.csv&處理行和列索引!type D:\python數據分析\數據\out3.csv