iterables(迭代器)
先看這段代碼:
>>> mylist1 = [1, 2, 3]
>>> for i in mylist1:
... print(i)
1
2
3
>>> mylist2 = [x for x in range(3)]
>>> for i in mylist2:
... print i
0
1
2
>>> s = ""
>>> for i in mylist2:
... s += str(i)
'012'
這段代碼的意思是list(列表)在python中是可以迭代的, 如果你需要一個(gè)接一個(gè)的訪問一個(gè)數(shù)據(jù)集合, 大多數(shù)的時(shí)候使用一個(gè) for x in y 這種方式, 那么這里的 y 就是一個(gè)可以迭代訪問的數(shù)據(jù)集合, 很明顯list , tuple , string , file 這些都是迭代器
iterables 是保存在內(nèi)存中的, 你可以隨便訪問他們, 比如上面的 mylist1, mylist2
generators(生成器)
再看這一段:
>>> mygenerator = (x*x for x in range(3))
>>> for i in mygenerator:
... print(i)
0
1
4
>>> mygenerator
<generator object <genexpr> at 0x10d35eaa0>
>>> s = ""
>>> for i in mygenerator:
... s += str(i)
...
''
這段代碼中 mygenerator 就是一個(gè)迭代器, 跟上文的 mylist2 生成方式有點(diǎn)點(diǎn)區(qū)別, [] 改成了 (), 從使用上來(lái)說(shuō), generators 和 iterables 都是類似 for in 的這種方式
但是: generators 不是保存在內(nèi)存中的, 而是惰性加載的, 也就是你用到它的時(shí)候, 它才臨時(shí)去計(jì)算, 只能使用一次 for in , 比如上面的 mygenerator , 計(jì)算 00 并返回之后就不在保留了, 繼續(xù)計(jì)算 11
適用場(chǎng)景: 當(dāng)需要迭代訪問一組量非常大的數(shù)據(jù)集的時(shí)候, generator 是非常有用的, 因?yàn)樗?jì)算完了前面的數(shù)據(jù)然后就計(jì)算后面, 并不在內(nèi)存里保留所有的數(shù)據(jù), 這樣就不至于內(nèi)存爆掉
yield
理解了 generator 之后, 再來(lái)看 yield 就非常好理解了, 可以把 yield 當(dāng)成 return 看待
>>> def createGenerator():
... mylist = (x*x for x range(3))
... for i in mylist:
... yield i
...
>>> mygenerator = createGenerator() # 創(chuàng)建一個(gè)生成器
>>> print(mygenerator) # 生成器就是一個(gè)object
<generator object createGenerator at 0xb7555c34>
>>> for i in mygenerator:
... print(i)
0
1
4
>>> mygenerator = createGenerator()
>>> s = ""
>>> for i in mygenerator:
... s += str(i)
...
>>> s
'014'
上面的代碼中當(dāng)調(diào)用 createGenerator() 的時(shí)候, 其實(shí)方法內(nèi)的代碼并沒有運(yùn)行, 而在 for in 循環(huán)訪問的時(shí)候, 才開始從頭計(jì)算, 當(dāng)運(yùn)行到 yield 的時(shí)候返回第一個(gè)值, 然后就停下來(lái), 當(dāng)再次請(qǐng)求數(shù)據(jù)的時(shí)候繼續(xù)運(yùn)算直到再次碰到 yield ... 直到?jīng)]有值可以返回