闡述PyString Object對象源代碼
Python也被稱為是一門非常透徹的語言,在當初設計者當初設計它的時候,大體的指導思想,就是對于一個特定的問題,只要有一種最好的方法來解決就OK了,下面對Python PyStringObject對象說明。
與定長對象不同,對于變長對象而言,對象維護的數據的長度在對象定義時是不知道的。對于PyIntObject來說,其維護的數據的長度在對象定義時就已經確定了。是一個long變量的長度;而可變對象維護的數據的長度只能在對象創建時才能確定,考慮一下,我們只能在創建一個字符串或一個列表時才知道它們所維護的數據的長度,在此之前,對這個信息,我們一無所知。
在變長對象中,實際上還可分為可變對象(mutable)和不可變對象(immutable),可變對象是在對象創建之后,其維護的數據的長度還能變化的對象。比如一個list被創建后,可以向其中添加元素或刪除元素。
這些操作都會改變其維護的數據的長度;而不可變對象所維護的數據在對象創建之后就不能再改變了,比如Python中的string和tuple,它們都不支持添加或刪除的操作。本章我們將研究Python變長對象中的不可變對象——字符串對象。
在Python中,PyStringObject是對字符串對象的抽象和表示。PyStringObject對象是一個擁有可變長度內存的對象,這一點非常容易理解,因為對于表示”Hi”和”Python”的兩個不同的PyStringObject對象,其內部需要的保存字符串內容的內存空間顯然是不一樣的。
但同時,PyStringObject對象又是一個不變對象(Immutable)。當創建了一個PyStringObject對象之后,該對象內部維護的字符串就不能再被改變了。這一點特性使得PyStringObject對象能作為PyDictObject的鍵值,但同時也使得一些字符串操作的效率大大降低,比如多個字符串的連接操作。
PyStringObject對象的聲明如下:
- [stringobject.h]
- typedef struct {
- PyObject_VAR_HEAD
- long ob_shash;
- int ob_sstate;
- char ob_sval[1];} PyStringObject;
在PyStringObject的定義中我們看到,在PyStringObject對象的頭部實際上是一個PyObject_VAR_HEAD,其中有一個ob_size變量保存著對象中維護的可變長度內存的長度。雖然在PyStringObject的定義中,ob_sval是一個字符的字符數組。
但是ob_sval實際上是作為一個字符指針指向了一段內存,這段內存保存著這個字符串對象所維護的實際字符串,顯然,這段內存不會只是一個字節。而這段內存的實際長度(字節),正是由ob_size來維護,這個機制是Python中所有擁有可變長度內存的對象的實現機制。比如對于PyStringObject對象”Python”,ob_size的值就是6。
同C中的字符串一樣,PyStringObject內部維護的字符串在末尾必須以’\0’結尾,但是由于字符串的實際長度是由ob_size維護的,所以PyStringObject表示的字符串對象中間是可能出現字符’\0’的,這一點與C語言中不同,因為在C中。只要遇到了字符’\0’,就認為一個字符串結束了。所以,實際上,ob_sval指向的是一段長度為ob_size+1個字節的內存,而且必須滿足ob_sval[ob_size] = ‘\0’。
【編輯推薦】