“備忘”的定義
“memoization”(備忘)這個詞是由Donald Michie在1968年提出的,它基于拉丁語單詞“memorandum”(備忘錄),意思是“被記住”。雖然它和單詞“memorization”在某種程度上有些相似,但它并不是該單詞的錯誤拼寫。實際上,Memoisation是一種用于通過計算來加速程序的技術,它通過記住輸入量的計算結果,例如函數調用結果,來實現其加速目的。如果遇到相同的輸入或者具有相同參數的函數調用,那么之前存儲的結果就可以被再次使用,從而避免一些不必要的計算。在很多情況下,可以使用一個簡單的數組來存儲結果,但也可以使用許多其他的數據結構,例如關聯數組,它在Perl語言中叫做哈希,在Python語言中稱為字典。
備忘功能可以由程序員顯式地編程實現,但是一些編程語言如Python,都提供了自動備忘函數的機制。
利用函數裝飾器實現備忘功能
在前面關于遞歸函數的那章中,我們分別使用迭代和遞歸實現了斐波納契數列的求解。我們已經證明,如果直接利用斐波納契數列的數學定義,在一個遞歸函數中實現數列的求解,正如下面的函數一樣,那么它將具有指數級的時間復雜度:
def fib(n):
if n == 0:
return 0
elif n == 1:
return 1
else:
return fib(n-1) + fib(n-2)
此外,我們還提出了一種提高遞歸實現的時間復雜度的方法,即通過添加一個字典來記住之前函數的計算結果。這是一個顯式地使用備忘技術的例子,只是當時我們并沒有這么稱呼它。這種方法的缺點是,原始遞歸實現的明晰性和優雅性丟失了。
造成以上缺點的原因是,我們改變了遞歸函數fib的代碼。不過下面的代碼不會改變我們的fib函數,所以它的明晰性和易讀性并沒有丟失。為了實現該目的,我們使用自定義的函數memoize()。函數memoize()以函數作為參數,并使用一個字典“memo”來存儲函數的結果。雖然變量“memo”和函數“f”僅僅具有局部備忘功能,但是它們通過函數“helper”被一個閉包捕獲,而memoize()將函數“helper”作為引用返回。所以,對memoize(fib)的調用將會返回一個helper()的引用,而在helper()中實現了fib()函數的功能以及一個用于保存還未存儲的結果到字典“memo”中的包裝器,并防止重新計算“memo”中已有的結果。
def memoize(f):
memo = {}
def helper(x):
if x not in memo:
memo[x] = f(x)
return memo[x]
return helper
def fib(n):
if n == 0:
return 0
elif n == 1:
return 1
else:
return fib(n-1) + fib(n-2)
fib = memoize(fib)
print(fib(40))
現在讓我們了解下所謂的裝飾器,首先看一下上面代碼中將備忘功能指派到fib函數的這一行:
fib = memoize(fib)
一種說法是,函數memoize()裝飾了函數fib。
將Memoize封裝成類
我們還可以將結果的緩存封裝到一個類中,如下面的例子所示:
class Memoize:
def __init__(self, fn):
self.fn = fn
self.memo = {}
def __call__(self, *args):
if args not in self.memo:
self.memo[args] = self.fn(*args)
return self.memo[args]
因為我們使用了字典,所以不能使用可變參數,即參數必須是不可變的。
Python中的裝飾器
Python中的裝飾器是一個可調用的Python對象,用于修改一個函數、方法或者類的定義。原始的對象,也就是即將被改變的那個對象,作為參數傳遞給一個裝飾器,而裝飾器則返回一個修改過的對象,例如一個修改過的函數,它會被綁定到定義中使用的名字上。Python中的裝飾器與Java中的注解有一個相似的語法,即Python中的裝飾器語法可以看作是純粹的語法糖,使用“@”作為關鍵字。
示例:使用裝飾器實現備忘功能
其實,前面我們已經使用了裝飾器,只是沒有這么稱呼它而已。實際上,本章開頭例子中的memoize函數就是一個裝飾器,我們使用它來記住fib函數的結果,只是我們沒有使用Python中裝飾器特殊的語法而已,即艾特字符“@”。
相比于寫成下面的形式
fib = memoize(fib)
我們可以這樣寫
@memoize
但這一行必須直接寫在被裝飾的函數之前,在我們的例子fib()中,如下所示:
def memoize(f):
memo = {}
def helper(x):
if x not in memo:
memo[x] = f(x)
return memo[x]
return helper
@memoize
def fib(n):
if n == 0:
return 0
elif n == 1:
return 1
else:
return fib(n-1) + fib(n-2)
#fib = memoize(fib)
print(fib(40))
利用裝飾器檢查參數
在講解遞歸函數的那章中我們介紹了階乘函數,在那里我們希望保持函數盡可能簡單,而不想掩蓋基本理念,所以代碼中沒有包含任何參數檢查代碼。然而,如果別人以負數或者浮點數作為參數來調用我們的函數,那么函數將會陷入一個死循環。
下面的程序使用一個裝飾器函數來確保傳給函數“factorial”的參數是一個正整數:
def argument_test_natural_number(f):
def helper(x):
if type(x) == int and x > 0:
return f(x)
else:
raise Exception("Argument is not an integer")
return helper
@argument_test_natural_number
def factorial(n):
if n == 1:
return 1
else:
return n * factorial(n-1)
for i in range(1,10):
print(i, factorial(i))
print(factorial(-1))
練習
1、我們的練習是一個古老的謎題。1612年,法國耶穌會士Claude-Gaspar Bachet提出了該謎題,即使用一個天平稱出從1磅到40磅的所有整數重量的東西(例如,糖或者面粉),求最少的砝碼數量。
第一個方法可能是使用1、2、4、8、16和32磅重量的這些砝碼。如果我們將砝碼放在天平的一端,而將物品放在另一端,那么這種方法用到的砝碼數量將是最小的。然而,我們也可以將砝碼同時放在天平的兩端,此時我們僅僅需要重量為1、3、9、27的砝碼。
編寫一個Python函數weigh(),該函數計算需要的砝碼以及它們在天平盤中的分布,以此來稱量1磅到40磅中任何一個整數重量的物品。
解決方法
1、我們需要前面章節“Linear Combinations”中的函數linear_combination()。
def factors_set():
factors_set = ( (i,j,k,l) for i in [-1,0,1]
for j in [-1,0,1]
for k in [-1,0,1]
for l in [-1,0,1])
for factor in factors_set:
yield factor
def memoize(f):
results = {}
def helper(n):
if n not in results:
results[n] = f(n)
return results[n]
return helper
@memoize
def linear_combination(n):
""" returns the tuple (i,j,k,l) satisfying
n = i*1 + j*3 + k*9 + l*27 """
weighs = (1,3,9,27)
for factors in factors_set():
sum = 0
for i in range(len(factors)):
sum += factors[i] * weighs[i]
if sum == n:
return factors
2、利用上面的代碼,就能很容易寫出我們的函數weigh()。
def weigh(pounds):
weights = (1,3,9,27)
scalars = linear_combination(pounds)
left = ""
right = ""
for i in range(len(scalars)):
if scalars[i] == -1:
left += str(weights[i]) + " "
elif scalars[i] == 1:
right += str(weights[i]) + " "
return (left,right)
for i in [2,3,4,7,8,9,20,40]:
pans = weigh(i)
print("Left pan: " + str(i) + " plus " + pans[0])
print("Right pan: " + pans[1] + "n")