Python語言自帶的數據結構有哪些?
Python作為一種腳本語言,其要求強制縮進,使其易讀、美觀,它的數據類型可以實現自動轉換,而不需要像C、Java那樣給變量定義數據類型,使其編寫非常方便簡單,所以廣受大家的歡迎。
現如今,Python已經廣泛的應用于數據分析、數據挖掘、機器學習等眾多科學計算領域。所以既然涉及到科學計算,深入了解Python原生提供的數據結構是很有必要的,這樣才能在數據的海洋中游刃有余、得心應手。本文便以此展開,做一個歸納整理,方便收藏。
Python
一、序列結構
首先介紹的數據結構是序列結構,所謂序列,也就是元素順序是很重要的,不同元素順序的序列是不同的序列。Python中含有六種內建的序列結構,分別是list、tuple、string、unicode、buffer、xrange。
1.1、list(列表)
list,列表是一種序列,可以看做是一種數組,但不同的于其它語言的是,Python列表中的元素可以是任何數據類型,諸如,數字、字符串等等。
下面為創建list結構的幾種方式:
- //1.通過中括號括起已知的元素創建list
- mylist = ['orange', 'apple', 1,2,3.14];
- //2.通過中括號創建空list,然后用append()追加動態元素
- mylist = [];
- mylist.append('orange');
- //3.通過list()方法創建空list
- mylist = list();
選取list元素的方法:
- //通過中括號加下對應下標選取,下標從0開始,-1為倒數第一個元素,以此類推
- mylist[0];
- mylist[-1];
切片是Python中序列結構獨有的一種操作,意思是從序列中選取一個子序列,凡是序列均可切片,list是序列,所以list可以切片。切片方法:
- //通過[begin:end]方式完成切片
- mylist = [1,2,3,4,5];
- mylist[0:2]; //生成的序列為[1,2,3]
list常用方法:
- list.append(x),在列表的末尾添加一個元素。
- list.insert(i, x),在給定的位置插入一個元素,第一個參數是要插入的元素的索引。
- list.remove(x),移除列表中第一個值為 x 的元素,如果沒有這樣的元素,則拋出異常。
- list.clear(),刪除列表中所有的元素。
- list.index(x),返回列表中第一個值為 x 的元素的從零開始的索引,如果沒有這樣的元素,則拋出異常。
- list.count(x),返回元素 x 在列表中出現的次數。
- list.reverse(),反轉列表中的元素。
機器學習
1.2、tuple(元組)
tuple,元組和列表一樣,都以看做是一種數組,元素可以是任何數據類型,甚至可以嵌套。唯一的區別是,元組內的元素一旦創建,是不可修改的,也不可追加。并且元組使用小括號創建,同樣元組可切片,切片方法同list。
- //1.通過小括號括起已知的元素創建tuple
- mytuple = (1, 3, 'hello!')
- //2.不可以用append()往tuple追加,因為tuple一旦創建,不可變更
獲取tuple中的元素:
- //和列表一樣,通過中括號加下對應下標選取,下標從0開始,-1為倒數第一個元素,以此類推
- mytuple[0];
- mytuple[-1];
1.3、string,unicode,buffer,xrange
這四個也是序列,做科學計算由于不太常用,不做太多介紹。
string可以看成是少量單個字符構成的list,如:
- mystring = 'orange';
- mylist = ['o','r','a','n','g','e'];
由于string也是序列,所以也可以切片,切片就當做單個字符構成的list切片即可,很多原理類似,不做過多介紹。
unicode和string類似,不過可以支持原生unicode編碼的序列,如\\u4f60\\u597d。
buffer可以看成大量字符構成的list。
xrange可以看成純數字構成的list。

科學計算
二、散列結構
所謂散列結構,區別于上述序列結構,散列結構中,元素順序是不重要的,順序不同的散列,還是同一個散列。散列結構有set、dict。
2.1、set(集合)
set,集合,集合是由不重復元素組成的無序的集,重點是不重復,和數學中的集合類似。無序是散列結構的特點,集合是一種散列結構,所以集合也有無序的特點。
創建set的方法:
- //和list很類似,可對應參考
- //1.通過大括號括起已知的元素創建set
- myset = {'red','blue',2.71};
- //2.通過set()方法創建空set,注意不能用{}創建空set,這樣創建的是空dict
- //3.然后用add()添加動態元素,注意不是append
- myset = set();
- myset.add('yellow');
Python的set集合可以支持并集,交集,差集,對稱差等數學運算:
- //創建集合a
- a = set('abracadabra');
- //創建集合b
- b = set('alacazam');
- ------------------
- print(a)
- //結果:{'a', 'r', 'b', 'c', 'd'}
- ------------------
- print(a - b); //差集
- //結果:{'r', 'd', 'b'}
- ------------------
- print(a | b); //并集
- //結果:{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
- ------------------
- print(a & b); //交集
- //結果:{'a', 'c'}
- ------------------
- print(a ^ b); //對稱差
- //結果:{'r', 'd', 'b', 'm', 'z', 'l'}
set常用方法:
- set.remove(x),移除集合中值為 x 的元素,如果沒有這樣的元素,則拋出異常。
- set.isdisjoint(set2),判斷兩個集合是否包含相同的元素,如果沒有返回 True,否則返回 False。
- set.issubset(set2),判斷集合set是否包含于set2
- set.issuperset(set2),判斷集合set是否包含set2,issubset與issuperset是一對互逆操作。
2.2、dict(字典)
dict,字典,字典由鍵值對組成,具有唯一性,可變性。字典是可變對象但字典的鍵的唯一的,是不可變對象。理解字典的最好方式,就是將它看做是一個 鍵 : 值對的集合。
創建dict的方法:
- //1.通過大括號括起鍵值對創建dict
- mydict = {'name':'tom','age':'24'};
- //2.通過dict()方法創建dict
- mydict = dict(name = 'tom',age = 24);
- //3.通過大括號創建空dict,然后通過中括號添加鍵值對
- mydict = {};
- mydict['tel'] = '1300000000';
獲取dict中的元素:
- //需要已經知道鍵的名稱,否則無法獲取,除非遍歷
- mydict.get('tel');
dict常用方法:
- dict.copy(),拷貝出一個新的字典。
- dict.setdefault({'sex':'man'}),有則查,無則增。
- dict.update({'sex':'male'}),有則改,無則增。
- dict.pop('tel'),指定刪除,參數必須要有需要刪除的鍵。
- dict.clear(),清空字典。
- dict.keys(),查詢字典中所有的鍵。
- dict.values(),查詢字典中所有的值。
- dict.items(),查詢字典中所有的鍵值對。
以上即為Python自帶的數據結構,共分為序列結構和散列結構兩大類,序列結構有list、tuple、string、unicode、buffer、xrange,散列結構有set、dict。