參考鏈接: Python中的生成器Generator
Python的生成器?
什么是生成器?
創建python迭代器的過程雖然強大,但是很多時候使用不方便。生成器是一個簡單的方式來完成迭代。簡單來說,Python的生成器是一個返回可以迭代對象的函數。?
怎樣創建生成器?
在一個一般函數中使用yield關鍵字,可以實現一個最簡單的生成器,此時這個函數變成一個生成器函數。yield與return返回相同的值,區別在于return返回后,函數狀態終止,而yield會保存當前函數的執行狀態,在返回后,函數又回到之前保存的狀態繼續執行。?
生成器函數與一般函數的不同?
一下是幾點不同:?
生成器函數包含一個或者多個yield當調用生成器函數時,函數將返回一個對象,但是不會立刻向下執行像__iter__()和__next__()方法等是自動實現的,所以我們可以通過next()方法對對象進行迭代一旦函數被yield,函數會暫停,控制權返回調用者局部變量和它們的狀態會被保存,直到下一次調用函數終止的時候,StopIteraion會被自動拋出? 舉例:?
?# 簡單的生成器函數
def my_gen():
? ? ?n=1
? ? ?print("first")
? ? ?# yield區域
? ? ?yield n
?
? ? ?n+=1
? ? ?print("second")
? ? ?yield n
?
? ? ?n+=1
? ? ?print("third")
? ? ?yield n
?
?a=my_gen()
?print("next method:")
?# 每次調用a的時候,函數都從之前保存的狀態執行
?print(next(a))
?print(next(a))
?print(next(a))
?
?print("for loop:")
?# 與調用next等價的
?b=my_gen()
?for elem in my_gen():
? ? ?print(elem)
?
使用循環的生成器?
# 逆序yield出對象的元素
def rev_str(my_str):
? ? length=len(my_str)
? ? for i in range(length-1,-1,-1):
? ? ? ? yield my_str[i]
?
for char in rev_str("hello"):
? ? print(char)?
生成器的表達式?
Python中,有一個列表生成方法,比如?
# 產生1,2,3,4,5的一個列表
[x for x in range(5)]?
如果換成[]換成(),那么會成為生成器的表達式。?
(x for x in range(5))?
具體使用方式:?
a=(x for x in range(10))
b=[x for x in range(10)]
# 這是錯誤的,因為生成器不能直接給出長度
# print("length a:",len(a))
?
# 輸出列表的長度
print("length b:",len(b))
?
b=iter(b)
# 二者輸出等價,不過b是在運行時開辟內存,而a是直接開辟內存
print(next(a))
print(next(b))??
為什么使用生成器?
更容易使用,代碼量較小內存使用更加高效。比如列表是在建立的時候就分配所有的內存空間,而生成器僅僅是需要的時候才使用,更像一個記錄代表了一個無限的流。如果我們要讀取并使用的內容遠遠超過內存,但是需要對所有的流中的內容進行處理,那么生成器是一個很好的選擇,比如可以讓生成器返回當前的處理狀態,由于它可以保存狀態,那么下一次直接處理即可。流水線生成器。假設我們有一個快餐記錄,這個記錄的地4行記錄了過去五年每小時售出的食品數量,并且我們要把所有的數量加在一起,求解過去5年的售出的總數。假設所有的數據都是字符串,并且不可用的數字被標記成N/A。那么可以使用下面的方式處理:?
with open('sells.log') as file:
? ? pizza_col = (line[3] for line in file)
? ? per_hour = (int(x) for x in pizza_col if x != 'N/A')? # 使用生成器進行自動迭代
? ? print("Total pizzas sold = ",sum(per_hour))