提及 Python 啊,我想你首先想到的就是「人生苦短,我用 Python」了。現在 Python 的熱度可謂是非常的高,感覺程式設計師要是不學 Python 的話,就有一種 out 了的感覺,雖然現在工業界使用 Python 的人數遠沒有 Java 的人多, 但 Python 是未來的趨勢是非常明顯的,因此呢,學習 Python 自然就是一件很有必要的事情了,今天呢,我就帶你一起聊聊 Python 多線程相關的那些事。
關於多線程啊,我想你肯定不陌生,無論是高級語言的鼻祖 C 語言、還是 C++、Java,都支持多線程、多進程,而且這部分知識無論是在求職面試還是在日常的工作開發中,都會涉及到,不巧的是呢,這部分知識在老師講課過程中是很少涉及的,甚至是直接不講,我記得我當時老師就沒有講,這不是說老師不合格,偷懶了,而是一門語言涉及到的知識太多了,老師只能把一些基礎的東西交給你,帶你入門,剩下的就需要自己去摸索、自學了。
線程與進程既然提到多線程,多進程了,那就有必要先了解下線程和進程的相關概念了。要不然的話後面的內容理解起來也是有點費勁的。
提到進程啊,我想你肯定是不陌生的,我們在電腦上打開一個軟體,就是開啟了一個進程,更具體的來說,Windows 系統你可以通過資源管理器進行查看當前電腦啟動的進程數。
用比較正式的話來說,進程就是處於運行中的程序,並且具有一定獨立的功能。進程是作業系統進行資源分配和調度的一個獨立單位。
然後就是線程,它是進程的組成部分,一個線程可以包含多個線程,多個線程可以共用這個進程的資源,相比於進程,線程更加輕量級。
舉個例子來說明下:我們的生活都是以家單位的,每家每戶每天都有自己的計劃安排、互不影響,這時候,每家就相當於一個進程,但是呢,需要受到國家的管制,比如說,買房限購、戶口問題啊等等需要國家統一出臺政策進行管理,這時候國家就相當於作業系統,而房子、戶口就相當於資源。但是對於每一家來說,又有不同的人,這時候,每個人就相當於一個線程,多個線程之間共用家裡的一些資源,就是家裡的人共用家裡的一些東西。雖然例子不是很恰當,但對於理解線程和進程還是有很大幫助的。
線程的幾種狀態線程狀態一共有五種,包括如下:
它們之間的關係如下圖所示:
實現方式接下來,我們就來看看如何在 Python 裡面實現多線程。總的來說,如果你了解過其他語言實現多線程的方式,比如說 Java的話,那對於理解 Python 實現多線程是非常有幫助的。Python 實現多線程有兩種方式:
使用 threading 模塊的 Thread 類的構造器創建線程
繼承 threading 模塊的 Thread 類創造線程類
看到這,你是不是發現這和 Java 實現多線程的方式很相類,不錯,確實就是這樣,所以再次印證了那句話,只要學好了一門語言,學習其他語言都會起到事半功倍的效果。
使用 threading 模塊的 Thread 類的構造器創建線程我們先用第一種方法來編寫一個多線程程序
#!/usr/bin/python
# -*- coding: utf-8 -*-
import threading
# 定義一個簡單的方法,用於多線程的執行體
def action(number):
for i in range(number):
# 調用 threading 模塊的 current_thread() 函數來獲取當前線程
# 調用當前線程的 getName() 函數來獲取線程名
print("{},{}".format(threading.current_thread().getName(), i))
number = 5
for i in range(5):
print("{},{}".format(threading.current_thread().getName(), i))
if i == 3:
# 創建並啟動第一個線程
t1 = threading.Thread(target=action, args=(number, ))
t1.start()
# 創建並啟動第二個線程
t2 = threading.Thread(target=action, args=(number, ))
t2.start()
看起來是不是很簡單,很我們平常寫的 Python 程序並沒有特別大的不同,但是還是有很一些情況是需要注意的,其中最重要的就是 threading.Thread(),我在這裡重點介紹下。
首先它是一個類,我們可以通過 type(threading.Thread) 來進行查看,它的構造函數如下所示:
__init__(self, group=None, target=None, name=None, args=(), kwargs={}, *, daemon=None)
group 應該為None,這個我們不用管,它是為了日後擴展 ThreadGroup 類實現而保留的一個參數
target 是我們需要重視的一個參數, 我們想讓哪個函數並發執行,這個函數就是 target 的參數值,注意只寫函數名,不需要寫 ()
name 是線程名稱,默認情況下,由"Thread-N"的格式構成一個唯一的名稱,其中 N 是小的十進位數
args 是用於調用目標函數的參數元祖, 注意是元祖, 如果你只想傳一個參數的話,也應該這樣寫 (args1,), 而不是 (args)
kwargs 是用於調用目標函數的關鍵字參數字典。默認是 {}
daemon 用於設置該線程是否為守護模式,如果是 None, 線程默認將繼承當前線程的守護模式屬性。
一般來說,我們需要注意的就是 target 參數、args 參數,其他的參數用到的時候可以再查。
另一點需要我們需要注意的一點就是啟動線程的方法是 start 方法,可能你也知道線程也有 run 方法,這一塊也會在第二種方法中進行介紹,但是啟動線程的方法是 start 方法,要不然就變成了單線程程序。
繼承 threading 模塊的 Thread 類創造線程類接下來我們來看下如何使用第二種方法實現多線程
#! /usr/bin/python
# -*- coding:utf-8 -*-
import threading
from threading import Thread
# 繼承 threading.Thread
class MyThread(Thread):
def __init__(self, number):
super().__init__()
self.number = number
# 重載 run() 方法
def run(self):
for i in range(self.number):
print("{}, {}".format(threading.current_thread().getName(), i))
number = 5
for i in range(5):
print("{}, {}".format(threading.current_thread().getName(), i))
if i == 3:
t1 = MyThread(number=number)
t1.start()
t2 = MyThread(number=number)
t2.start()
第二種方法就是繼承 Threading.Thread 類。然後重載 run() 方法。
其實我看來的話,感覺第二種方法更適合在項目中使用,因為它更加模塊化,比較清晰。
另外還有一個方法需要注意的就是 join() 方法,它的作用就是協調主線程和子線程的,調用 join() 後,當前線程就會阻塞,或者來說,暫停運行,執行子線程,等子線程執行完成後,主線程再接著運行。
生產者、消費者模型提到多線程,最著名的就是生產者、消費者模型了,那應該如何實現呢?
說實話,我當初最開始學習生產者、消費者模型的時候,心裡是有點犯嘀咕的,感覺涉及到線程間的通信,太好解決。但是查閱了一些資料後,發現還是可以理解的。
生產者、消費者二者不屬於競爭關係,更多的是一種捕食關係,生產者生產資源,消費者進行消費,就像聖湖中的牛吃草一樣。
不知道這時候你有沒有想到一種數據結構,那就是隊列,隊列呢是一種操作受限的線性表,它只允許在隊尾入隊,在隊頭
出隊,也就是先進先出 (FIFO) 策略。
生產者、消費者模型,不就是生產者生產元素,放到隊尾,然後消費者從隊頭消費元素嘛。
只不過有時候會出現特殊的情況
隊列空了,消費者還要消費數據
隊列滿了,生產者還要生產數據
這是我們需要重點考慮了,解決了以上兩點,這個模型也就實現了。
接下來我們就來看看 Python 如何實現吧!
#!/usr/bin/python
# -*- coding:utf-8
from threading import Thread, current_thread
import time
import random
from queue import Queue
queue = Queue(5)
class ProducerThread(Thread):
def run(self):
name = current_thread().getName()
nums = range(100)
global queue
while True:
num = random.choice(nums)
queue.put(num)
print("生產者 {} 生產了數據 {}".format(name, num))
t = random.randint(1, 3)
time.sleep(t)
print("生產者 {} 睡眠了 {} 秒".format(name, t))
class ConsumerThread(Thread):
def run(self):
name = current_thread().getName()
global queue
while True:
num = queue.get()
queue.task_done()
print("消費者 {} 消耗了數據 {}".format(name, num))
t = random.randint(1, 5)
time.sleep(t)
print("消費者 {} 睡眠了 {} 秒".format(name, t))
p1 = ProducerThread(name="producer1")
p1.start()
c1 = ConsumerThread(name="consumer1")
c1.start()
c2 = ConsumerThread(name="consumer2")
c2.start()
看了上面的代碼,不知道你有沒有一種錯覺,你不是說要考慮上面的兩種情況,但是你並沒有考慮啊。
確實,我沒有考慮,那是因為 Queue 在設計實現的時候已經替我們考慮好了,我們直接使用就好了。
具體就是 task_done() 函數,它在隊列為空時會自動阻塞當前線程
而隊列在滿的時候再添加元素也會阻塞當前線程,這就實現了上面我們提到的那兩種情況。
接下來呢,我再給你講解一個例子,帶你看看如何使用鎖。
銀行取錢問題從銀行取錢的基本流程大致可以分為以下幾個步驟:
用戶輸入帳戶、密碼,系統判斷當前的帳戶、密碼是否匹配。
用戶輸入取款金額
系統判斷帳戶餘額是否大於取款金額
如果餘額大於取款金額,則取款成功;如果餘額小於取款金額,則取款失敗。
乍一看,這就是日常生活中的取款操作啊,但是把它放到多線程並發的情況下,就可能會出現問題。不信的話,你可以試著寫下多線程的程序,然後再看下我的程序。
#!/usr/bin/python
# -*- coding:utf-8 -*-
import threading
import time
class Account:
def __init__(self, account_no, balance):
self.account_no = account_no
self._balance = balance
# 定義一個鎖
self.lock = threading.RLock()
def get_balance(self):
return self._balance
def draw(self, draw_amount):
# 對 RLock 對象進行加鎖
self.lock.acquire()
try:
if self._balance >= draw_amount:
print(threading.current_thread().getName() + "取錢成功,吐出鈔票:" + str(draw_amount))
time.sleep(0.001)
self._balance -= draw_amount
print("\t餘額為:" + str(self._balance))
else:
print(threading.current_thread().getName() + "取錢失敗,餘額不足!")
finally:
# 釋放鎖
self.lock.release()
# 定義一個函數來模擬取錢操作
def draw(account, draw_count):
account.draw(draw_count)
acct = Account("1234567", 1000)
threading.Thread(name="甲", target=draw, args=(acct, 800)).start()
threading.Thread(name="乙", target=draw, args=(acct, 800)).start()
如果你想嘗試下不加鎖的情況下是否會出現問題,你可以把我的程序進行修改,把加鎖的那部分去掉,然後嘗試運行下。
這裡呢,不是說每次運行都會出現問題,可能你運行了十次也都沒有出現問題,但是呢,這個安全隱患是確確實實存在的,不容忽視。
好了,今天的內容就先分享到這裡了,不知道你對多線程的內容理解了多少,不理解的話也沒關係,多看幾遍,然後很重要的就是自己好好寫一遍實踐一下,這樣對於理解是有很大幫助的。如果遇到問題,也可以在我的公眾號底部找到我的微信聯繫方式,聯繫我。
多線程的內容有很多,今天只是分享了一些比較基礎的內容,後面會再更新,歡迎關注我,一起加油進步。
歡迎關注我的公眾號「與你一起學算法」,如果喜歡,麻煩點一下「在看」~