對於淺拷貝(shallow copy)和深度拷貝(deep copy),本節並不打算一上來拋出它們的概念,而是先從它們的操作方法說起,通過代碼來理解兩者的不同。
Python淺拷貝常見的淺拷貝的方法,是使用數據類型本身的構造器,比如下面兩個例子:
list1 = [1, 2, 3]list2 = list(list1)print(list2)print("list1==list2 ?",list1==list2)print("list1 is list2 ?",list1 is list2)set1= set([1, 2, 3])set2 = set(set1)print(set2)print("set1==set2 ?",set1==set2)print("set1 is set2 ?",set1 is set2)運行結果為:
[1, 2, 3]
list1==list2 ? True
list1 is list2 ? False
{1, 2, 3}
set1==set2 ? True
set1 is set2 ? False在上面程序中,list2 就是 list1 的淺拷貝,同理 set2 是 set1 的淺拷貝。
當然,對於可變的序列,還可以通過切片操作符「:」來完成淺拷貝,例如:list1 = [1, 2, 3]list2 = list1[:]print(list2)print("list1 == list2 ?",list1 == list2)print("list1 is list2 ?",list1 is list2)運行結果為:
[1, 2, 3]
list1 == list2 ? True
list1 is list2 ? False
除此之外,Python 還提供了對應的函數 copy.copy() 函數,適用於任何數據類型。其用法如下:import copylist1 = [1, 2, 3]list2 = copy.copy(list1)print(list2)print("list1 == list2 ?",list1 == list2)print("list1 is list2 ?",list1 is list2)運行結果為:
[1, 2, 3]
list1 == list2 ? True
list1 is list2 ? False
不過需要注意的是,對於元組,使用 tuple() 或者切片操作符 ':' 不會創建一份淺拷貝,相反它會返回一個指向相同元組的引用:tuple1 = (1, 2, 3)tuple2 = tuple(tuple1)print(tuple2)print("tuple1 == tuple2 ?",tuple1 == tuple2)print("tuple1 is tuple2 ?",tuple1 is tuple2)運行結果為:
(1, 2, 3)
tuple1 == tuple2 ? True
tuple1 is tuple2 ? True此程序中,元組 (1, 2, 3) 只被創建一次,t1 和 t2 同時指向這個元組。
看到這裡,也許你可能對淺拷貝有了初步的認識。淺拷貝,指的是重新分配一塊內存,創建一個新的對象,但裡面的元素是原對象中各個子對象的引用。
對數據採用淺拷貝的方式時,如果原對象中的元素不可變,那倒無所謂;但如果元素可變,淺拷貝通常會出現一些問題,例如:list1 = [[1, 2], (30, 40)]list2 = list(list1)list1.append(100)print("list1:",list1)print("list2:",list2)list1[0].append(3)print("list1:",list1)print("list2:",list2)list1[1] += (50, 60)print("list1:",list1)print("list2:",list2)運行結果為:
list1: [[1, 2], (30, 40), 100]
list2: [[1, 2], (30, 40)]
list1: [[1, 2, 3], (30, 40), 100]
list2: [[1, 2, 3], (30, 40)]
list1: [[1, 2, 3], (30, 40, 50, 60), 100]
list2: [[1, 2, 3], (30, 40)]此程序中,首先初始化了 list1 列表,包含一個列表和一個元組;然後對 list1 執行淺拷貝,賦予 list2。因為淺拷貝裡的元素是對原對象元素的引用,因此 list2 中的元素和 list1 指向同一個列表和元組對象。
接著往下看,list1.append(100) 表示對 list1 的列表新增元素 100。這個操作不會對 list2 產生任何影響,因為 list2 和 list1 作為整體是兩個不同的對象,並不共享內存地址。操作過後 list2 不變,list1 會發生改變。
再來看,list1[0].append(3) 表示對 list1 中的第一個列表新增元素 3。因為 list2 是 list1 的淺拷貝,list2 中的第一個元素和 list1 中的第一個元素,共同指向同一個列表,因此 list2 中的第一個列表也會相對應的新增元素 3。
最後是 list1[1] += (50, 60),因為元組是不可變的,這裡表示對 list1 中的第二個元組拼接,然後重新創建了一個新元組作為 list1 中的第二個元素,而 list2 中沒有引用新元組,因此 list2 並不受影響。
通過這個例子,你可以很清楚地看到使用淺拷貝可能帶來的副作用。如果想避免這種副作用,完整地拷貝一個對象,就需要使用深拷貝。所謂深拷貝,是指重新分配一塊內存,創建一個新的對象,並且將原對象中的元素,以遞歸的方式,通過創建新的子對象拷貝到新對象中。因此,新對象和原對象沒有任何關聯。
Python 中以 copy.deepcopy() 來實現對象的深度拷貝。比如上述例子寫成下面的形式,就是深度拷貝:import copylist1 = [[1, 2], (30, 40)]list2 = copy.deepcopy(list1)list1.append(100)print("list1:",list1)print("list2:",list2)list1[0].append(3)print("list1:",list1)print("list2:",list2)list1[1] += (50, 60)print("list1:",list1)print("list2:",list2)運行結果為:
list1: [[1, 2], (30, 40), 100]
list2: [[1, 2], (30, 40)]
list1: [[1, 2, 3], (30, 40), 100]
list2: [[1, 2], (30, 40)]
list1: [[1, 2, 3], (30, 40, 50, 60), 100]
list2: [[1, 2], (30, 40)]可以看到,無論 list1 如何變化,list2 都不變。因為此時的 list1 和 list2 完全獨立,沒有任何聯繫。
不過,深度拷貝也不是完美的,往往也會帶來一系列問題。如果被拷貝對象中存在指向自身的引用,那麼程序很容易陷入無限循環,例如:import copylist1 = [1]list1.append(list1)print(list1)list2 = copy.deepcopy(list1)print(list2)運行結果為:
[1, [...]]
[1, [...]]此例子中,列表 x 中有指向自身的引用,因此 x 是一個無限嵌套的列表。但是當深度拷貝 x 到 y 後,程序並沒有出現棧溢出的現象。這是為什麼呢?
其實,這是因為深度拷貝函數 deepcopy 中會維護一個字典,記錄已經拷貝的對象與其 ID。拷貝過程中,如果字典裡已經存儲了將要拷貝的對象,則會從字典直接返回。通過查看 deepcopy 函數實現的源碼就會明白:def deepcopy(x, memo=None, _nil=[]): """Deep copy operation on arbitrary Python objects. See the module's __doc__ string for more info. """ if memo is None: memo = {} d = id(x) y = memo.get(d, _nil) if y is not _nil: return y ...