在 Python 中有一個重要的概念,即 萬物皆對象 —— 數字、字符串、元組、列表、字典等所有內置數據類型, 函數 、方法 、 類 、模塊,在 Python 中所有的一切都是對象。
對象的概念
對象的概念在直觀上表現為:Python 中的一切都可以賦值給變量或者作為參數傳遞給函數。從機制上來看,Python 使用對象模型來存儲數據,構造任何類型的值都是一個對象。
所有 Python 的對象都有三個特性:
- 身份:每個對象都有一個唯一的身份標識自己,任何對象的身份都可以使用內建函數 id() 來得到,可以簡單的認為這個值是該對象的內存地址。
>>> a = 1
>>> id(a)
>>> 26188904 # 身份由這樣一串類似的數字表示
- 類型:對象的類型決定了對象可以保存什么類型的值,有哪些屬性和方法,可以進行哪些操作,遵循怎樣的規則。可以使用內建函數 type() 來查看對象的類型。
>>> type(a)
<type 'int'>
>>> type(type)
<type 'type'> #萬物皆對象,type 也是一種特殊的對象 type
- 值:對象所表示的數據
>>> a
1
身份 類型 值 在所有對象創建時被賦值。如果對象支持更新操作,則它的值是可變的,否則為只讀(數字、字符串、元組等均不可變)。只要對象還存在,這三個特性就一直存在。
對象的屬性:大部分 Python 對象有屬性、值或方法,使用句點(.)標記法來訪問屬性。最常見的屬性是函數和方法,一些 Python 對象也有數據屬性,如:類、模塊、文件等
對象的創建和引用
>>> a = 1
簡單來看,上邊的代碼執行了以下操作:
創建了一個對象來代表數字 3
如果變量 a 不存在,創建一個新的變量 a
將變量 a 和數字 3 進行連接,即 a 成為對象 3 的一個引用,從內部來看,變量是到對象的內存空間的一個指針,尤其注意:變量總是連接到對象,而不會連接到其他變量。
從概念上可以這樣理解,對象是分配的一個內存空間,用來表示對象所代表的值;變量是一個系統創建的表中的元素,擁有指向對象的引用;引用是從變量到對象的指針。
從技術上來說,每一個對象有兩個標準的頭部信息,一個類型標識符來標識類型,還有一個引用的計數器,用于決定是否需要對對象進行回收。這里還涉及到對象的一種優化方法,Python 緩存了某些不變的對象對其進行復用,而不是每次創建新的對象。
>>> a = 1
>>> b = 1
>>> id(a)
26188904
>>> id(b)
26188904 # a 和 b 都指向了同一對象
共享引用
在 Python 中變量都是指向某一對象的引用,當多個變量都引用了相同的對象,成為共享引用。
>>> a = 1
>>> b = a
>>> a = 2
>>> b
1 # 由于變量僅是對對象的一個引用,因此改變 a 并不會導致 b 的變化
但對于像列表這種可變對象來說則不同
>>> a = [1, 2, 3]
>>> b = a
>>> a[0] = 0
>>> a
[0, 2, 3] # 這里并沒有改變 a 的引用,而是改變了被引用對象的某個元素
>>> b
[0, 2, 3] # 由于被引用對象發生了變化,因此 b 對應的值也發生了改變
由于列表的這種可變性,在代碼執行某些操作時可能出現一些意外,因此需要對其進行拷貝來保持原來的列表
>>> a = [1, 2, 3]
>>> b = a[:]
>>> id(a)
140200275166560
>>> id(b)
140200275238712 # 由于 b 引用的是 a 引用對象的一個拷貝,兩個變量指向的內存空間不同
>>> a[0] = 0
>>> b
[1, 2, 3] # 改變 a 中的元素并不會引起 b 的變化
對于字典和集合等沒有分片概念的類型來說,可以使用 copy 模塊中的 copy() 方法進行拷貝
>>> import copy
>>> b = copy.copy(a)
相等
==
操作符用于測試兩個被引用的對象的值是否相等
is
用于比較兩個被引用的對象是否是同一個對象
>>> a = [1, 2, 3]
>>> b = a
>>> a is b
True # a 和 b 指向相同的對象
>>> a = [1, 2, 3]
>>> b = [1, 2, 3]
>>> a is b
False # a 和 b 指向不同的對象
當操作對象為一個較小的數字或較短的字符串時,又有不同:
>>> a = 7
>>> b = 7
>>> a is b
True # a 和 b 指向相同的對象
這是由于 Python 的緩存機制造成的,小的數字和字符串被緩存并復用,所以 a 和 b 指向同一個對象
對象的回收機制
上邊提到對象包含一個引用的計數器,計數器記錄了當前指向該對象引用的數目,一旦對象的計數器為 0 ,即不存在對該對象的引用,則這個對象的內存空間會被回收。這就是 Python 中對象的回收機制,一個最明顯的好處即在編寫代碼過程中不需要考慮釋放內存空間。
可以通過 sys 模塊中的 getrefcount() 函數查詢一個對象計數器的值
>>> import sys
>>> sys.getrefcount(1)
718