探秘Python對象體系
Python之父Guido Rossum用自己的一個圣誕假期打造了Python語言,在Python的世界里,對象有著奇妙的“含義”。
一.C視角中的Python對象
讓我們一起追溯到源頭,Python由C語言實現,且向外提供了C的APIhttp://docs.python.org/c-api/index.html 。
我們思考問題的時候,可能對于對象這種東西很容易理解,而計算機能理解的只有0,1序列這樣的字節序列,從根本上講,我們所說的計算機語言中的對象只是在內存中的一塊內存空間里的0,1序列而已,這些連續或者非連續的內存空間在更高層次上可以看作是一個整體.在Python中,我們所提到的一般的對象都是C中的結構體在堆Heap上申請的一塊內存空間。
為了能夠用C語言實現Python的面向對象的機制,需要定義一些結構體,能夠操作那些對象的內存空間。
1.PyObject&PyVarObject
所有的Python對象都有一些共同的東西,我們將其高度抽象成一個結構體PyObject
- typedef struct _object{
- PyObject_HEAD
- } PyObject;
- //其實PyObject_HEAD這個宏在發行版本中的為
- int ob_refcnt;
- struct _typeobject *ob_type;
ob_refcnt,就是對象引用計數,它的存在是為了實現了Python的基于引用技術的垃圾回收機制。還有一個是指向一個類型對象結構體的指針,用以代表該對象的類型.
在C語言的實現的時候,還有一個結構體擴展于PyObject,那便是PyVarObject,其內容為PyObject_VAR_HEAD這個宏,它比PyObject多了一個ob_size,用來表示變長對象的長度,詳情見http://docs.python.org/c-api/structures.html 。
還有一點請大家不要搞混,這里的PyObject和PyVarObject和Python世界中的真實對象沒有對應關系,這兩個只是Python對象全體在C語言表示中的一種抽象.也就是說在C語言中,只要是一個Python對象結構體的數據,那么其內存的開始部分都會有上面結構體的幾個變量,所以一個PyObject的指針便可以指向所有的C語言中的表示Python對象的結構體,這樣在C語言的實現中,我們便可以通過這個統一的指針操作所有的內置的Python對象結構體了。
2.PyTypeObject
剛剛還有一個東西沒有講,那便是_typeobject(PyTypeObject)這個結構體,它是Python中所有類型對象的抽象,這樣我們在C語言的層次里對于所有的類型對象結構體都可以通過PyTypeObject的指針來調用。
- typedef struct _typeobject {
- //注意開始部分為PyObject_VAR_HEAD
- PyObject_VAR_HEAD
- char *tp_name; /* For printing, in format
- "<module>.<name>" */
- int tp_basicsize, tp_itemsize; /* For allocation */
- /* Methods to implement standard operations */
- destructor tp_dealloc;
- printfunc tp_print;
- ……
- /* More standard operations (here for
- binary compatibility) */
- hashfunc tp_hash;
- ternaryfunc tp_call;
- ……
- } PyTypeObject;
3.Python內置對象和C結構體的對應
現在Python面向對象機制的對象和類型的抽象都已經說過了,接下來我們來看下在python中真實存在的對象在C語言實現的時候是怎么樣的呢?
首先需要談的是那些Python的內置對象,這些都是C語言定義了的,當Python環境初始化后,這些對象便創建好了。
- PyAPI_DATA(PyTypeObject) PyType_Type; /* built-in 'type' */
- PyAPI_DATA(PyTypeObject) PyBaseObject_Type; /* built-in 'object' */
object對象在Python中是一個比較基礎的對象,它在C語言中對應的結構體是PyBaseObject_Type,從C語言中的這個命名我們可以大概知道這個類是一個類型對象。
還有就是Python中的<type 'type'>在C語言中對應著PyType_Type
- PyTypeObject PyType_Type = {
- PyObject_HEAD_INIT(&PyType_Type)
- 0, /* ob_size */
- "type", /* tp_name */
- sizeof(PyHeapTypeObject), /* tp_basicsize */
- sizeof(PyMemberDef), /* tp_itemsize */
- ……
- };
我們再看看比較具體的整數。
一個整數instance在C語言中的表示的結構體是PyIntObject
- typedef struct {
- PyObject_HEAD
- long ob_ival;
- } PyIntObject;
也就是說通過這樣的結構體我們就可以在C語言的的運行時中指向Python的整數對象.
那么相應的我們Python的整數類型對象為
- yTypeObject PyInt_Type = {
- PyObject_HEAD_INIT(&PyType_Type)
- 0,
- "int",
- sizeof(PyIntObject),
- ……
- };
4.自定義對象
當我們創建一個Python對象的時候,最終都是通過Python的底層來做的,當我們通過Python語言定義了自己的一個class A之后,Python首先根據你寫的代碼創建了一個A這樣的class對象(類對象),然后當你需要創建A的實例的時候,其實在Python的底層都是通過A這個Class對象進行創建的。
二.Python視角中的對象體系
在單純的Python的世界中,一切都是對象.這些對象可以分為三類,
metaclasses,classes,instance
其中classes又可以分為內置的type和用戶自定義的class
下面我們通過一張圖片來作詳細的說明
其中C的定義的方式如下(python 中繼承于某類直接寫在類名后面的括號中):
- class C(object):
- ......
其中實線表示 is-kind-of 的關系 ,虛線表示is-instance-of的關系。
查看當前classes對象(instances對象沒有__bases__屬性)的基類的時候,可以用過classes_name.__bases__進行查看,其值為一個Tuple元組(Python支持多繼承).
查看當前對象的類型的方法是object_name.__class__
我們可以通過一些測試來證實上面的圖:
這里,type為所有類的類。
【編輯推薦】