迭代是訪問集合元素的一種方式。迭代器是一個可以記住遍歷的位置的對象。迭代器對象從集合的第一個元素開始訪問,直到所有的元素被訪問完結束。迭代器只能往前不會后退。
可迭代對象
以直接作用于 for 循環的數據類型有以下幾種:
一類是集合數據類型,如 list 、 tuple 、 dict 、 set 、 str 等;
一類是 generator ,包括生成器和帶 yield 的generator function。
這些可以直接作用于 for 循環的對象統稱為可迭代對象: Iterable 。
判斷是否可以迭代
可以使用 isinstance() 判斷一個對象是否是Iterable 對象:
而生成器不但可以作用于 for 循環,還可以被 next() 函數不斷調用并返回下一個值,直到最后拋出 StopIteration 錯誤表示無法繼續返回下一個值了。
迭代器
迭代器是訪問集合元素的一種方式。迭代器對象從集合的第一個元素開始訪問,知道所有的元素被訪問完結束。迭代器只能往前不會后退,不過這也沒什么,因為人們很少在迭代途中往后退。
使用迭代器的優點
對于原生支持隨機訪問的數據結構(如tuple、list),迭代器和經典for循環的索引訪問相比并無優勢,反而丟失了索引值(可以使用內建函數enumerate()找回這個索引值)。但對于無法隨機訪問的數據結構(比如set)而言,迭代器是唯一的訪問元素的方式。
另外,迭代器的一大優點是不要求事先準備好整個迭代過程中所有的元素。迭代器僅僅在迭代到某個元素時才計算該元素,而在這之前或之后,元素可以不存在或者被銷毀。這個特點使得它特別適合用于遍歷一些巨大的或是無限的集合,比如幾個G的文件,或是斐波那契數列等等。
迭代器更大的功勞是提供了一個統一的訪問集合的接口,只要定義了iter()方法對象,就可以使用迭代器訪問。
迭代器有兩個基本的方法
next方法:返回迭代器的下一個元素
iter方法:返回迭代器對象本身
下面用生成斐波那契數列為例子,說明為何用迭代器
def fab(max):
n, a, b = 0, 0, 1
while n < max:
print b
a, b = b, a + b
n = n + 1
直接在函數fab(max)中用print打印會導致函數的可復用性變差,因為fab返回None。其他函數無法獲得fab函數返回的數列。
def fab(max):
L = []
n, a, b = 0, 0, 1
while n < max:
L.append(b)
a, b = b, a + b
n = n + 1
return L
代碼滿足了可復用性的需求,但是占用了內存空間,最好不要。
對比
for i in range(1000): pass
for i in xrange(1000): pass
前一個返回1000個元素的列表,而后一個在每次迭代中返回一個元素,因此可以使用迭代器來解決復用可占空間的問題
class Fab(object):
def __init__(self, max):
self.max = max
self.n, self.a, self.b = 0, 0, 1
def __iter__(self):
return self
def next(self):
if self.n < self.max:
r = self.b
self.a, self.b = self.b, self.a + self.b
self.n = self.n + 1
return r
raise StopIteration()
執行
>>> for key in Fabs(5):
print key
1
1
2
3
5
Fabs 類通過 next() 不斷返回數列的下一個數,內存占用始終為常數
使用迭代器
使用內建的工廠函數iter(iterable)可以獲取迭代器對象:
>>> lst = range(5)
>>> it = iter(lst)
>>> it
<listiterator object at 0x01A63110>
使用next()方法可以訪問下一個元素:
>>> it.next()
0
>>> it.next()
1
>>> it.next()
2
python處理迭代器越界是拋出StopIteration異常
>>> it.next()
3
>>> it.next
<method-wrapper 'next' of listiterator object at 0x01A63110>
>>> it.next()
4
>>> it.next()
Traceback (most recent call last):
File "<pyshell#27>", line 1, in <module>
it.next()
StopIteration
了解了StopIteration,可以使用迭代器進行遍歷了
lst = range(5)
it = iter(lst)
try:
while True:
val = it.next()
print val
except StopIteration:
pass
結果
>>>
0
1
2
3
4
事實上,因為迭代器如此普遍,python專門為for關鍵字做了迭代器的語法糖。在for循環中,Python將自動調用工廠函數iter()獲得迭代器,自動調用next()獲取元素,還完成了檢查StopIteration異常的工作。如下
>>> a = (1, 2, 3, 4)
>>> for key in a:
print key
1
2
3
4
首先python對關鍵字in后的對象調用iter函數迭代器,然后調用迭代器的next方法獲得元素,直到拋出StopIteration異常。
定義迭代器
下面一個例子——斐波那契數列
class Fabs(object):
def __init__(self,max):
self.max = max
self.n, self.a, self.b = 0, 0, 1 #特別指出:第0項是0,第1項是第一個1.整個數列從1開始
def __iter__(self):
return self
def next(self):
if self.n < self.max:
r = self.b
self.a, self.b = self.b, self.a + self.b
self.n = self.n + 1
return r
raise StopIteration()
print Fabs(5)
for key in Fabs(5):
print key
結果
<__main__.Fabs object at 0x01A63090>
1
1
2
3
5
iter()函數
生成器都是 Iterator 對象,但 list 、 dict 、 str 雖然是 Iterable ,卻不是 Iterator 。
把 list 、 dict 、 str 等 Iterable 變成 Iterator 可以使用 iter() 函數:
>>>isinstance(iter([]), Iterator)
True
>>>isinstance(iter('abc'), Iterator)
True
總結
? 凡是可作用于 for 循環的對象都是 Iterable 類型;
? 凡是可作用于 next() 函數的對象都是 Iterator 類型
? 集合數據類型如 list 、 dict 、 str 等是 Iterable 但不是 Iterator ,不過可以通過 iter() 函數獲得一個 Iterator 對象。
? 目的是在使用集合的時候,減少占用的內容。