Python初學者:“==”and“is”的區別是什么?
本文轉載自公眾號“讀芯術”(ID:AI_Discovery)。
幾天前,我在Reddit上瀏覽“learn python”板塊的相關內容時,看到一位Reddit用戶再次提問了這個問題:“==” and “is”的區別是什么?雖然網上對此問題已經有太多的答案和解釋,但是很多初學者還是不知道,還是會犯錯。
“==”和“is”都是Python中的運算符。初學者可能會把“a == b”理解為“a等于b”,而把“a is b” 理解為 “a is b”。也許這就是Python初學者混淆“==”和“is”的原因。
在深入討論之前,我想先舉幾個“==” 和 “is”的用例:
- >>> a = 5
- >>> b = 5
- >>> a == bTrue>>> a is b
- True
簡單吧?a== b 和 a is b 都能返回 True。下一個例子:
- >>> a = 1000
- >>> b = 1000
- >>> a == bTrue>>> a is b
- False
這是為什么?第二個例子與第一個唯一的不同就在于a和b的值從5變成了1000,但是“==” 和 “is”輸出的結果卻完全不同。再看下一例:
- >>> a = []
- >>> b = []>>> a == bTrue>>> a is b
- False
如果這還不夠震驚,再看最后一個例子:
- >>> a = 1000
- >>> b = 1000
- >>> a == bTrue>>> a is b
- False>>> a = b>>> a == bTrue>>> a is b
- True
“==”的正式運算是相等,而“is”的運算是標識。用“==”是比較兩個對象的值。“a == b”應解釋為“a的值是否等于b的值”。在上述所有示例中,a的值始終等于b的值(即使對于空列的示例也是如此),因此“a == b”始終為真。
在解釋標識的概念之前,我需要先介紹一下id函數。對象的標識可以通過id函數來獲得。一個對象的標識始終是唯一且恒定的,你可以將其視為該對象的地址。如果兩個對象的標識相同,則它們的值也一定相同。
- >>> id(a)
- 2047616
運算符“is”用于比較兩個對象的標識是否相同,“a is b”就表示“a的標識與b的標識相同”。
圖源:unsplash
現在你知道了“==”和“is”的真正含義,我們就可以開始深入討論上述示例。
首先是第一例和第二例的結果差異。因為Python存儲了一個介于-5到256之間的整數數組列表,每一個整數都有固定的對應標識。當你在此范圍內分配整數變量時,Python就會將此變量作為數組列里的整數為其分配標識。
因此,在第一例中,由于a和b的標識都是從數組列表中獲得的,所以他們的標識當然相同,因此a is b為真。
- >>> a = 5
- >>> id(a)
- 1450375152
- >>> b = 5
- >>> id(b)
- 1450375152
但一旦變量的值不在這個區間范圍內,由于Python內部沒有對應該值的對象,因此Python將為此變量創建新的標識,并為這個變量賦值。
如前所述,每個創建的標識都是唯一的,因此即使兩個變量的值相同,他們的標識也永遠不會等同。這就是為什么第二例中的a is b返回False。
- >>> a = 1000
- >>> id(a)
- 12728608
- >>> b = 1000
- >>> id(b)
- 13620208
另外,假設你打開的是兩個控制臺,如果該值仍在區間內,也能得到相同標識。但是,如果該值不在區間內,結果當然就不同了。
一旦理解了第一例和第二例的區別,就很容易理解第三例的結果了。由于Python不存儲“空列表”對象,所以Python創建了一個新對象并賦值“空列表”。無論這兩個列表是空還是元素相同,結果都是一樣的。
- >>> a = [1,10,100,1000]
- >>> b = [1,10,100,1000]
- >>> a == bTrue>>> a is bFalse>>> id(a)
- 12578024
- >>> id(b)
- 12578056
來看最后一例。第二例與最后一例的唯一區別在于多了一行代碼a = b。然而,這行代碼卻改變了變量a的命運。下面的結果將闡述原因:
- >>> a = 1000
- >>> b = 2000
- >>> id(a)
- 2047616
- >>> id(b)
- 5034992
- >>> a = b>>> id(a)
- 5034992
- >>> id(b)
- 5034992
- >>> a2000>>> b2000
可以看到,在a= b之后,a的標識變成了b的標識。a = b把b的標識賦予了a。因此a和b就擁有了相同的標識,a的值現在就等于b的值,即2000。
最后一例傳達出一個重要信息,即你可能在不經意間更改了對象的值,尤其是當對象為列表時。
- >>> a = [1,2,3]
- >>> id(a)
- 5237992
- >>> b = a
- >>> id(b)
- 5237992
- >>> a.append(4)
- >>> a
- [1, 2, 3, 4]
- >>> b
- [1, 2, 3, 4]
從上例可以看出,a和b擁有相同的標識,他們的值就一定相同。因此在為a附加了一個新元素后,b的值也會受到影響。為了避免這種情況,如果要把一個對象的值復制到另一對象,又不引用同一標識,一個方法是在copy模塊中使用deepcopy。對于列表,你還可以通過b= a[:]來實現。
- >>> import copy
- >>> a = [1,2,3]
- >>> b= copy.deepcopy(a)
- >>> id(a)
- 39785256
- >>> id(b)
- 5237992
使用[:]把元素復制到新變量:
- >>> a = [1,2,3]
- >>> id(a)
- 39785256
- >>> b = a[:]
- >>> id(b)
- 23850216
- >>> a.append(4)
- >>> a
- [1, 2, 3, 4]
- >>> b
- [1, 2, 3]
希望這篇文章能幫你徹底解決這個問題,不要再被相同的難題困住啦。