python基礎：迭代器、生成器（yield）詳細解讀

1. 迭代器

? ? ? 迭代器是訪問集合元素的一種方式。迭代器對象從集合的第一個元素開始訪問，知道所有的元素被訪問完結束。迭代器只能往前不會后退，不過這也沒什么，因為人們很少在迭代途中往后退。

1.1 使用迭代器的優點

? ? ? 對于原生支持隨機訪問的數據結構（如tuple、list），迭代器和經典for循環的索引訪問相比并無優勢，反而丟失了索引值（可以使用內建函數enumerate()找回這個索引值）。但對于無法隨機訪問的數據結構（比如set）而言，迭代器是唯一的訪問元素的方式。

? ? ? 另外，迭代器的一大優點是不要求事先準備好整個迭代過程中所有的元素。迭代器僅僅在迭代到某個元素時才計算該元素，而在這之前或之后，元素可以不存在或者被銷毀。這個特點使得它特別適合用于遍歷一些巨大的或是無限的集合，比如幾個G的文件，或是斐波那契數列等等。

? ? ? 迭代器更大的功勞是提供了一個統一的訪問集合的接口，只要定義了__iter__()方法對象，就可以使用迭代器訪問。

迭代器有兩個基本的方法

next方法：返回迭代器的下一個元素
__iter__方法：返回迭代器對象本身

下面用生成斐波那契數列為例子，說明為何用迭代器

代碼1

 def fab(max): n, a, b = 0, 0, 1 while n < max: print b a, b = b, a + b n = n + 1

直接在函數fab(max)中用print打印會導致函數的可復用性變差，因為fab返回None。其他函數無法獲得fab函數返回的數列。

代碼2

 def fab(max): L = []n, a, b = 0, 0, 1 while n < max: L.append(b) a, b = b, a + b n = n + 1return L

代碼2滿足了可復用性的需求，但是占用了內存空間，最好不要。

代碼3

對比

 for i in range(1000): pass

 for i in xrange(1000): pass

前一個返回1000個元素的列表，而后一個在每次迭代中返回一個元素，因此可以使用迭代器來解決復用可占空間的問題

 class Fab(object): def __init__(self, max): self.max = max self.n, self.a, self.b = 0, 0, 1 def __iter__(self): return self def next(self): if self.n < self.max: r = self.b self.a, self.b = self.b, self.a + self.b self.n = self.n + 1 return r raise StopIteration()

執行

 >>> for key in Fabs(5):
????print?key
?????
1
1
2
3
5

Fabs 類通過 next() 不斷返回數列的下一個數，內存占用始終為常數　　

1.2 使用迭代器

使用內建的工廠函數iter(iterable)可以獲取迭代器對象：

 >>> lst = range(5)
>>> it = iter(lst)
>>> it
<listiterator object at?0x01A63110>

使用next()方法可以訪問下一個元素：

 >>> it.next()
0
>>> it.next()
1
>>> it.next()
2

python處理迭代器越界是拋出StopIteration異常

 >>> it.next()
3
>>> it.next
<method-wrapper?'next'?of listiterator object at?0x01A63110>
>>> it.next()
4
>>> it.next()
Traceback (most recent call last):
??File?"<pyshell#27>", line?1, in <module>
????it.next()
StopIteration

了解了StopIteration，可以使用迭代器進行遍歷了

lst = range(5)
it = iter(lst)
try:while True:val = it.next()print val
except StopIteration:pass

結果

 >>>
0
1
2
3
4

事實上，因為迭代器如此普遍，python專門為for關鍵字做了迭代器的語法糖。在for循環中，Python將自動調用工廠函數iter()獲得迭代器，自動調用next()獲取元素，還完成了檢查StopIteration異常的工作。如下

>>> a = (1, 2, 3, 4)
>>> for key in a:print key1
2
3
4

首先python對關鍵字in后的對象調用iter函數迭代器，然后調用迭代器的next方法獲得元素，直到拋出StopIteration異常。

1.3 定義迭代器

下面一個例子——斐波那契數列

# -*- coding: cp936 -*-
class Fabs(object):def __init__(self,max):self.max = maxself.n, self.a, self.b = 0, 0, 1  #特別指出：第0項是0，第1項是第一個1.整個數列從1開始def __iter__(self):return selfdef next(self):if self.n < self.max:r = self.bself.a, self.b = self.b, self.a + self.bself.n = self.n + 1return rraise StopIteration()print Fabs(5)
for key in Fabs(5):print key

結果

 <__main__.Fabs object at?0x01A63090>
1
1
2
3
5

2. 生成器

? ? ? 帶有 yield 的函數在 Python 中被稱之為 generator（生成器），幾個例子說明下（還是用生成斐波那契數列說明）

可以看出代碼3遠沒有代碼1簡潔，生成器（yield）既可以保持代碼1的簡潔性，又可以保持代碼3的效果

代碼4　

def fab(max):n, a, b = 0, 0, 1while n < max:yield ba, b = b, a + bn = n + 1

執行

 >>> for n in fab(5):
????print?n
?????
1
1
2
3
5

? ? ? 簡單地講，yield 的作用就是把一個函數變成一個 generator，帶有 yield 的函數不再是一個普通函數，Python 解釋器會將其視為一個 generator，調用 fab(5) 不會執行 fab 函數，而是返回一個?iterable 對象！在 for 循環執行時，每次循環都會執行 fab 函數內部的代碼，執行到?yield b 時，fab 函數就返回一個迭代值，下次迭代時，代碼從 yield b 的下一條語句繼續執行，而函數的本地變量看起來和上次中斷執行前是完全一樣的，于是函數繼續執行，直到再次遇到 yield。看起來就好像一個函數在正常執行的過程中被 yield 中斷了數次，每次中斷都會通過 yield 返回當前的迭代值。

也可以手動調用 fab(5) 的 next() 方法（因為 fab(5) 是一個 generator 對象，該對象具有 next() 方法），這樣我們就可以更清楚地看到 fab 的執行流程：

 >>> f = fab(3)
>>> f.next()
1
>>> f.next()
1
>>> f.next()
2
>>> f.next()
Traceback (most recent call last):
??File?"<pyshell#62>", line?1, in <module>
????f.next()
StopIteration

return作用

在一個生成器中，如果沒有return，則默認執行到函數完畢；如果遇到return,如果在執行過程中 return，則直接拋出 StopIteration 終止迭代。例如

 >>> s = fab(5)
>>> s.next()
1
>>> s.next()
Traceback (most recent call last):
??File?"<pyshell#66>", line?1, in <module>
????s.next()
StopIteration

代碼5??文件讀取

 def read_file(fpath): BLOCK_SIZE = 1024 with open(fpath, 'rb') as f: while True: block = f.read(BLOCK_SIZE) if block: yield block else: return

如果直接對文件對象調用 read() 方法，會導致不可預測的內存占用。好的方法是利用固定長度的緩沖區來不斷讀取文件內容。通過 yield，我們不再需要編寫讀文件的迭代類，就可以輕松實現文件讀取。

?3.列表生成式→生成器

只要把一個列表生成式的[]改成()，就創建了一個generator：

1 #列表生成式
2 li=[x*x for x in range(10) if x%2==0]  #占用內存
3 
4 
5 #生成器
6 g=(x*x for x in range(10) if x%2==0)
7 #用for來循環訪問，不用考慮異常溢出問題
8 for i in g:
9     print(i)

View Code

4.迭代器讀取文件

使用迭代器一個顯而易見的好處就是：每次只從對象中讀取一條數據，不會造成內存的過大開銷。

比如要逐行讀取一個文件的內容，利用readlines()方法，我們可以這么寫：

1 2	`for line in open("test.txt").readlines(): print line`

這樣雖然可以工作，但不是最好的方法。因為他實際上是把文件一次加載到內存中，然后逐行打印。當文件很大時，這個方法的內存開銷就很大了。

利用file的迭代器，我們可以這樣寫：

1 2	`for line in open("test.txt"): #use file iterators print line`

這是最簡單也是運行速度最快的寫法，他并沒顯式的讀取文件，而是利用迭代器每次讀取下一行。

轉載于:https://www.cnblogs.com/yizhenfeng168/p/6916729.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/372077.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/372077.shtml
英文地址，請注明出處：http://en.pswp.cn/news/372077.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！