Python是一款使用方便,易上手的工具,我們平常在工作中經常會用到,而且同時也是一款功能強大的程式語言,被廣泛應用於數據分析、web開發、人工智慧等行業。但是無論行業,哪個領域,想要熟練使用Python,就必須掌握Python的基礎知識。
以下文章來源於:微信公眾號Python貓
作者: 豌豆花下貓
從接觸 Python 時起,我就覺得 Python 的元組解包(unpacking)挺有意思,非常簡潔好用。
最顯而易見的例子就是多重賦值,即在一條語句中同時給多個變量賦值:
>>> x, y = 1, 2
>>> print(x, y) # 結果:1 2
在此例中,賦值操作符「=」號的右側的兩個數字會被存入到一個元組中,即變成 (1,2),然後再被解包,依次賦值給「=」號左側的兩個變量。
如果我們直接寫x = 1,2 ,然後列印出 x,或者在「=」號右側寫成一個元組,就能證實到這一點:
>>> x = 1, 2
>>> print(x) # 結果:(1, 2)
>>> x, y = (1, 2)
>>> print(x, y) # 結果:1 2
一些博客或公眾號文章在介紹到這個特性時,通常會順著舉一個例子,即基於兩個變量,直接交換它們的值:
>>> x, y = 1, 2
>>> x, y = y, x
>>> print(x, y) # 結果:2 1
一般而言,交換兩個變量的操作需要引入第三個變量。道理很簡單,如果要交換兩個杯子中所裝的水,自然會需要第三個容器作為中轉。
然而,Python 的寫法並不需要藉助中間變量,它的形式就跟前面的解包賦值一樣。正因為這個形式相似,很多人就誤Python 的變量交換操作也是基於解包操作。
但是,事實是否如此呢?
我搜索了一番,發現有人試圖回答過這個問題,但是他們的回答基本不夠全面。(當然,有不少是錯誤的答案,還有更多人只是知其然,卻從未想過要知其所以然)
先把本文的答案放出來吧:Python 的交換變量操作不完全基於解包操作,有時候是,有時候不是!
有沒有覺得這個答案很神奇呢?是不是聞所未聞?!
到底怎麼回事呢?先來看看標題中最簡單的兩個變量的情況,我們上dis 大殺器看看編譯的字節碼:
上圖開了兩個窗口,可以方便比較「a,b=b,a」與「a,b=1,2」的不同:
「a,b=b,a」操作:兩個 LOAD_FAST 是從局部作用域中讀取變量的引用,並存入棧中,接著是最關鍵的 ROT_TWO 操作,它會交換兩個變量的引用值,然後兩個 STORE_FAST 是將棧中的變量寫入局部作用域中。「a,b=1,2」操作:第一步 LOAD_CONST 把「=」號右側的兩個數字作為元組放到棧中,第二步 UNPACK_SEQUENCE 是序列解包,接著把解包結果寫入局部作用域的變量上。很明顯,形式相似的兩種寫法實際上完成的操作並不相同。在交換變量的操作中,並沒有裝包和解包的步驟!
ROT_TWO 指令是 CPython 解釋器實現的對於棧頂兩個元素的快捷操作,改變它們指向的引用對象。
還有兩個類似的指令是 ROT_THREE 和 ROT_FOUR,分別是快捷交換三和四個變量(摘自:ceval.c 文件,最新的 3.9 分支):
預定義的棧頂操作如下:
查看官方文檔中對於這幾個指令的解釋,其中 ROT_FOUR 是 3.8 版本新加的:
ROT_TWOSwaps the two top-most stack items.ROT_THREELifts second and third stack item one position up, moves top down to position three.ROT_FOURLifts second, third and forth stack items one position up, moves top down to position four.New in version 3.8.
CPython 應該是以為這幾種變量的交換操作很常見,因此才提供了專門的優化指令。就像 [-5,256] 這些小整數被預先放到了整數池裡一樣。
對於更多變量的交換操作,實際上則會用到前面說的解包操作:
截圖中的 BUILD_TUPLE 指令會將給定數量的棧頂元素創建成元組,然後被 UNPACK_SEQUENCE 指令解包,再依次賦值。
值得一提的是,此處之所以比前面的「a,b=1,2」多出一個 build 操作,是因為每個變量的 LOAD_FAST 需要先單獨入棧,無法直接被組合成 LOAD_CONST 入棧。也就是說,「=」號右側有變量時,不會出現前文中的 LOAD_CONST 一個元組的情況。
最後還有一個值得一提的細節,那幾個指令是跟棧中元素的數量有關,而不是跟賦值語句中實際交換的變量數有關。看一個例子就明白了:
分析至此,你應該明白前文中的結論是怎麼回事了吧?
我們稍微總結一下:
Python 能在一條語句中實現多重賦值,這是利用了序列解包的特性Python 能在一條語句中實現變量交換,不需引入中間變量,在變量數少於 4 個時(3.8 版本起是少於 5 個),CPython 是利用了 ROT_* 指令來交換棧中的元素,當變量數超出時,則是利用了序列解包的特性。序列是 Python 的一大特性,但是在本文的例子中,CPython 解釋器在小小的操作中還提供了幾個優化的指令,這絕對會超出大多數人的認知