Python迭代和迭代器詳解
我們將要來學習python的重要概念迭代和迭代器,通過簡單實用的例子如列表迭代器和xrange。
可迭代
一個對象,物理或者虛擬存儲的序列。list,tuple,strins,dicttionary,set以及生成器對象都是可迭代的,整型數是不可迭代的。如果你不確定哪個可迭代哪個不可以,你需要用python內建的iter()來幫忙。
- >>> iter([1,2,3])
- <listiterator object at 0x026C8970>
- >>> iter({1:2, 2:4})
- <dictionary-keyiterator object at 0x026CC1B0>
- >>> iter(1234)
- Traceback (most recent call last):
- File "<pyshell#145>", line 1, in <module>
- iter(1234)
- TypeError: 'int' object is not iterable
iter()為list返回了listiterator對象,為dictionary返回了dictionary-keyiterator對象。類似對其他可迭代類型也會返回迭代器對象。
iter()用在自定義的類型會怎樣呢?我們先自己定義一個String類:
- class String(object):
- def __init__(self, val):
- self.val = val
- def __str__(self):
- return self.val
- st = String('sample string')
那么,st是可迭代的嗎?
- >>> iter(st)
- TypeError: 'String' object is not iterable
你可能會有幾個問題要問:
-
怎么讓自定義的類型可迭代?
-
iter()究竟做了些什么?
讓我們補充String類來找找答案
- class String(object):
- def __init__(self, val):
- self.val = val
- def __str__(self):
- return self.val
- def __iter__(self):
- print "This is __iter__ method of String class"
- return iter(self.val) #self.val is python string so iter() will return it's iterator
- >>> st = String('Sample String')
- >>> iter(st)
- This is __iter__ method of String class
- <iterator object at 0x026C8150>
在String類中需要一個’__iter__’方法把String類型變成可迭代的,這就是說’iter’內部調用了’iterable.__iter__()’
別急,不是只有增加’__iter()’方法這一種途徑
- class String(object):
- def __init__(self, val):
- self.val = val
- def __str__(self):
- return self.val
- def __getitem__(self, index):
- return self.val[index]
- >>> st = String('Sample String')
- >>> iter(st)
- <iterator object at 0x0273AC10>
‘itr’也會調用’iterable.__getitem__()’,所以我們用’__getitem__’方法讓String類型可迭代。
如果在String類中同時使用’__iter__()’和’__getitem__()’,就只有’__iter__’會起作用。
自動迭代
for循環會自動迭代
- for x in iterable:
- print x
我們可以不用for循環來實現嗎?
- def iterate_while(iterable):
- index = 0
- while(i< len(iterable)):
- print iterable[i]
- i +=1
這樣做對list和string是管用的,但對dictionary不會奏效,所以這絕對不是python式的迭代,也肯定不能模擬for循環的功能。我們先看迭代器,等下回再過頭來。
迭代器
關于迭代器先說幾條………..
-
1. 迭代器對象在迭代過程中會會產生可迭代的值,`next()`或者`__next()__`是迭代器用來產生下一個值的方法。
-
2. 它會在迭代結束后發出StopIteration異常。
-
3. `iter()`函數返回迭代器對象
-
4. 如果`iter()`函數被用在迭代器對象,它會返回對象本身
我們試一試模仿for循環
- def simulate_for_loop(iterable):
- it = iter(iterable)
- while(True):
- try:
- print next(it)
- except StopIteration:
- break
- >>> simulate_for_loop([23,12,34,56])
- 23
- 12
- 34
- 56
前面我們看過了iterable類,我們知道iter會返回迭代器對象。
現在我們試著理解迭代器類的設計。
- class Iterator:
- def __init__(self, iterable)
- self.iterable = iterable
- .
- .
- def __iter__(self): #iter should return self if called on iterator
- return self
- def next(self): #Use __next__() in python 3.x
- if condition: #it should raise StopIteration exception if no next element is left to return
- raise StopIteration
我們學了夠多的迭代和迭代器,在python程序中不會用到比這更深的了。
但是為了學習的目的我們就到這兒。。。。
列表迭代器
你可能會在面試中寫這個,所以打起精神來注意了
- class list_iter(object):
- def __init__(self, list_data):
- self.list_data = list_data
- self.index = 0
- def __iter__(self):
- return self
- def next(self): #Use __next__ in python 3.x
- if self.index < len(self.list_data):
- val = self.list_data[self.index]
- self.index += 1
- return val
- else:
- raise StopIteration()
我們來用`list_iter`自己定義一個列表迭代器
- class List(object):
- def __init__(self, val):
- self.val = val
- def __iter__(self):
- return list_iter(self.val)
- >>> ls = List([1,2,34])
- >>> it = iter(ls)
- >>> next(it)
- 1
- >>> next(it)
- 2
- >>> next(it)
- 34
- >>> next(it)
- Traceback (most recent call last):
- File "<pyshell#254>", line 1, in <module>
- next(it)
- File "<pyshell#228>", line 13, in next
- raise StopIteration()
- StopIteration
- xrange
從一個問題開始——xrange是迭代還是迭代器?
我們來看看
- >>> x = xrange(10)
- >>> type(x)
- <type 'xrange'>
幾個關鍵點:
-
1. `iter(xrange(num))`應該被支持
-
2. 如果`iter(xrange(num))`返回同樣的對象(xrange類型)那xrange就是迭代器
-
3. 如果`iter(xrange(num))`返回一個迭代器對象那xrange就是迭代
- >>> iter(xrange(10))
- <rangeiterator object at 0x0264EFE0>
它返回了rangeiterator,所以我們完全可以叫它迭代器。
讓我們用最少的xrange函數實現自己的xrange
- xrange_iterator
- class xrange_iter(object):
- def __init__(self, num):
- self.num = num
- self.start = 0
- def __iter__(self):
- return self
- def next(self):
- if self.start < self.num:
- val = self.start
- self.start += 1
- return val
- else:
- raise StopIteration()
- my xrange
- class my_xrange(object):
- def __init__(self, num):
- self.num = num
- def __iter__(self):
- return xrange_iter(self.num)
- >>> for x in my_xrange(10):
- print x,
- 0 1 2 3 4 5 6 7 8 9
我喜歡在這里總結這篇文章,歡迎發表評論和疑問。
譯文鏈接:http://www.codeceo.com/article/python-iterable-and-iterator.html
英文原文:Python: Iterable and Iterator