之前我們在很多項目案例中都使用了MySQL資料庫。有的同學問:MySQL安裝和配置太麻煩了,老是搞不定,有沒有更簡便的方法?
當然有咯!
Python內置的sqlite3模塊就是一個輕量級的資料庫,不需要獨立的伺服器進程。它的資料庫就是一個.db後綴的文件,可以跨平臺直接訪問,非常便捷。簡直就是輕量級數據的首選資料庫啊!
★今天我們就來用Python實戰操作一下sqlite3,通過本案例可以完全掌握sqlite3的常用操作。
」本文主要內容:
資料庫操作:包括數據的查詢、刪除、導出等操作,最後上一個自動化導出的案例。不過,在開始前需要說明的是,雖然Python內置了sqlite3模塊,但它只是用來連接資料庫的接口。你仍然需要確保電腦上已經有了sqlite3這個資料庫軟體。
如果你是Mac或者Linux系統,那麼恭喜你,你的電腦上默認就裝有sqlite3。Windows的同學得手動安裝一下。
下載地址:https://www.sqlite.org/download.html
選擇 Precompiled Binaries for Windows,下載預編譯的二進位 zip 文件:sqlite-tools-win32-*.zip 和 sqlite-dll-win32-*.zip。
在你的電腦上創建文件夾 C:\sqlite,並在此文件夾下解壓上面兩個壓縮文件,將得到 sqlite3.def、sqlite3.dll 和 sqlite3.exe 文件。
添加 C:\sqlite 到 PATH 環境變量。安裝成功後,在命令提示符下,使用 sqlite3 命令,將會顯示如下結果:
C:\>sqlite3SQLite version 3.7.15.2 2013-01-09 11:53:05Enter ".help" for instructionsEnter SQL statements terminated with a ";"sqlite>1. 讀取數據並插入資料庫本文以TXT文件為例,進行示範操作。TXT文件為單列數據,以換行符分割,文件數量60+,數據總量5萬+。
程序設計思路:自動讀取每個TXT文件,再依次讀取每一行並插入資料庫中。
1.1 原始碼# -*- coding: utf-8 -*-
"""
Created on Fri Jan 17 15:06:42 2020
@author: liulu
"""
import sqlite3
import os
path = os.getcwd()
files = os.listdir(path)
conn = sqlite3.connect(path+'\db.db')
cur = conn.cursor()
cur.execute('create table if not exists numbers (id integer primary key ,number varchar(20) NOT NULL)')
conn.commit()
i = 0
for file in files:
if file.split('.')[-1] == 'txt':
with open(file,'r',encoding = 'UTF-8') as f:
next(f)
for line in f:
i += 1
print("插入第", i, "條數據:")
#print(line)
cur.execute('insert into numbers values(?,?)',(i,line))
conn.commit()
cur.close()
conn.close()
print('數據寫入完成!共寫入',i,' 條數據')
1.2 運行效果代碼運行效果圖1.3 重點代碼解釋1)自動獲取所有TXT文件名稱和路徑
了解我的讀者都知道,我是比較懶的,我不喜歡指定程序的路徑。我寫的程序都是自己找路徑,自己找文件名稱。感興趣的朋友可以去我的公眾號(智能演示)查看這篇文章:獲取任意路徑下文件名稱的2種方法。
2)資料庫的創建與連接
conn = sqlite3.connect(path+'\db.db')
path是程序所在路徑,也是TXT文件的所在路徑。這行代碼的意思是:如果資料庫已經存在,則連接資料庫;如果資料庫不存在,則先創建資料庫,再連接該資料庫。
3)創建表
cur.execute('create table if not exists numbers (id integer primary key ,number varchar(20) NOT NULL)')
在資料庫db.db 中創建表numbers,表中包含兩個欄位:id、number。
注意!一定不要忘了conn.commit()保存一下!不然後面的數據是插不進去的。
4)插入數據
①優化打開方式
with open(file,'r',encoding = 'UTF-8') as f:
建議使用 with 語句來打開TXT文件。這樣做的好處是,當對象會在with語句結束時會自動關閉。效率更高!不易出錯。
②佔位符功能
cur.execute('insert into numbers values(?,?)',(i,line))
(?,?) 起到佔位符功能,(i,line))中的值會按位置替換到SQL語句中。
這樣就實現了數據的自動插入資料庫。需要幾分鐘時間,請耐心等待。
我們查看下db.db文件屬性,可以看到存儲了51216條數據的資料庫文件大小只有1.13MB,可以說是很輕量的。你可以將這個資料庫文件複製到任意一臺電腦上,連接上資料庫即可進行操作,非常方便。
下面就來說一下sqlite3的常用操作。
2. 資料庫操作2.1 連接資料庫import sqlite3
import os
path = os.getcwd()
files = os.listdir(path)
conn = sqlite3.connect(path+'\db.db')
cur = conn.cursor()這樣就連接上了剛才的資料庫。path+'\db.db'是資料庫的路徑及文件名,你可以手動輸入路徑,也可以將.py文件和db.db資料庫文件放在同一目錄下,系統自動計算路徑,這是懶人方法。
2.2 查詢資料庫中有哪些表我們似乎不知道db.db這個資料庫中有什麼,如何才能知道這個資料庫中有哪些表呢?
cur.execute("SELECT name FROM sqlite_master WHERE type='table';")
Tables=cur.fetchall()
print(Tables)
# [('numbers',)]
2.3 刪除資料庫中的某個表如果需要刪除資料庫中的某個表,可以執行以下命令:
cur.execute("drop table tablename;")
2.4 查詢某個表的結構cur.execute("PRAGMA table_info(numbers)")
print(cur.fetchall())
# [(0, 'id', 'integer', 0, None, 1), (1, 'number', 'varchar(20)', 1, None, 0)]
2.5 查詢表中前50條記錄cur.execute("SELECT * from numbers limit 0,50;")
conn.commit
data = cur.fetchall()
print(data)
2.6 查詢表中所有記錄# 5.查詢表中所有記錄
cur.execute("SELECT * from numbers;")
data_all = cur.fetchall()
a = len(data_all)
print('共有 '+ str(a) + ' 條記錄')
#print(data)
2.7 查詢表中不重複記錄cur.execute("SELECT distinct number from numbers;")
data_distinct = cur.fetchall()
b = len(data_distinct)
print('共有 '+ str(b) +' 條不重複記錄')
#print(data_distinct)
2.8 將老表中的不重複記錄插入新表# 創建一個新表
cur.execute('create table if not exists numbers_distinct (id integer primary key ,number varchar(20) NOT NULL)')
conn.commit()
# 插入數據
i = 0
for data in data_distinct:
i += 1
data = data[0]
#print(data)
cur.execute('insert into numbers_distinct values(?,?)',(i,data))
conn.commit()
2.9 將特定結果寫入文本文件(單列)cur.execute("SELECT number from numbers_distinct limit 0,10;")
datas = cur.fetchall()
#print(datas)
with open('datafile1.txt','w') as f1:
for data in datas:
f1.write(data[0])
f1.flush()注意:f1.flush()操作很重要!將緩衝區的數據寫入文件中,否則文本文件為空白,導致寫入失敗。
2.10 將特定結果寫入文本文件(多列)cur.execute("SELECT * from numbers_distinct limit 0,10;")
datas = cur.fetchall()
#print(datas)
with open('datafile2.txt','w') as f2:
for data in datas:
data0 = str(data[0]) # 將int類型轉為str,否則write函數報錯
data = data0 + ' ' + data[1] # 在兩列之間以Tab鍵分隔
f2.write(data)
f2.flush()
2.11 將特定結果寫入CSV文件(多列)寫入CSV文件和寫入文本文件的方法基本相同,只需要將文件後綴改為 '.csv',並將分隔符改為英文狀態下逗號即可。
with open('datafile3.csv','w') as f3:
for data in datas:
data0 = str(data[0]) # 將int類型轉為str,否則write函數報錯
data = data0 + ',' + data[1] # 在兩列之間以逗號鍵分隔
f3.write(data) # data是元組類型
f3.flush() # 重要!將緩衝區的數據寫入文件中
2.12 辦公自動化案例本文以:將number_distingct表中的數據,以每50個為一組,分別存入一個文本文件為例,演示以下Python結合sqlite3資料庫的辦公自動化的驚豔效果。
1)原始碼
"""
原始碼已發布到【智能演示】微信公眾號,後臺回復 sqlite3 可獲取下載連結。
"""
for n in range(int(b/50)+1):
if 50*n+50 < b: # b為數據記錄總數
cur.execute('SELECT number from numbers_distinct limit ?,?',(50*n,50))
datas = cur.fetchall()
#print(datas)
filename = str(50*n) + '-' + str(50*n+50) + '.txt'
print('正在寫入:' + filename)
with open(filename,'w') as f4:
for data in datas:
f4.write(data[0]) # data是元組類型
f4.flush() # 重要!將緩衝區的數據寫入文件中
else:
filename = str(50*n) + '-' + str(b) + '.txt'
print('正在寫入:' + filename)
with open(filename,'w') as f5: # 計算最後一個文本文件名稱
cur.execute('SELECT number from numbers_distinct limit ?,?',(50*n+50,50))
datas = cur.fetchall()
for data in datas:
f5.write(data[0]) # data是元組類型
f5.flush() # 重要!將緩衝區的數據寫入文件中
print('寫入完成!共寫入{}個TXT文件。'.format(n+1))2)運行效果
導出719個TXT文件,幾秒鐘就完成了。
3)重點代碼解釋
這個案例的重點是如何計算出每個TXT文件的名稱。
我們可以計算出numbers_distinct表中共有35926條數據。
我們可以構建這樣一個函數:filename = str(50*n) + '-' + str(50*n+50) + '.txt',用來計算每個導出的TXT文件名稱。
但是最後一個文件的名稱不能通過這個方法來構建,需要作以下簡單的修改:filename = str(50*n) + '-' + str(b) + '.txt'
計算好每個TXT文件名稱後,直接用write函數寫入就可以了。
快來動動手試一下吧!