字典(dictionary)是Python中一種常用的數據類型。不同于其他由數字索引的序列,字典是用"鍵"(key)來索引的。通常表示為dict(key: val, ...)
,有以下特征:
- 鍵可以是任何不可變(immutable)數據類型,如數字,字符串和僅包含不可變數據類型的元組
- 每個鍵必須是唯一的
- 字典中每一項的順序是任意的
1. KeyError異常
在Python中如果訪問字典里不存在的鍵,會出現KeyError
異常。有些時候,字典中每個鍵都存在默認值是很方便的,例如下面的例子:
>>> bag = ['apple', 'orange', 'cherry', 'apple',
... 'apple', 'cherry', 'blueberry'}]
>>> count = {}
>>> for fruit in bag:
... count[fruit] += 1
...
Traceback (most recent call last):File "<stdin>", line 2, in <module>
KeyError: 'apple'
上例統計列表bag中單詞出現次數,并記錄在字典count中。單詞沒出現一次,count中對應的鍵值會增加一。但是在實習運行代碼時,每當單詞第一次被統計就會出現'KeyError'異常,這是因為它并不在字典count中,Python中dict
對象并不存在默認值。
2. 使用判斷語句檢查
因此,在單詞第一次被統計時,需要在count中給每個鍵設定一個默認值1,這可以用一個判斷語句來實現:
>>> for fruit in bag:
... if fruit not in count: #如果不存在,添加
... count[fruit] = 1
... else:
... count[fruit] += 1
...
>>> count
{'apple': 3, 'blueberry': 1, 'orange': 1, 'cherry': 2}
3. 使用dict.setdefault()方法
dict.setdefault(key[,default])
方法接受兩個參數,第一個是鍵的名稱,第二個參數是默認值。在調用時如果鍵存在字典中,會返回它的值;如果不存在,則會自動把它添加進字典中并返回默認值,default的默認值為None
。此外,default的值還可以是列表,元組,集合和字典等。
>>> d = {'a': 1, 'b': 2}
>>> d.setdefault('a') #鍵存在并返回他的值
1
>>> d.setdefault('c', 3) #添加鍵-值
3
>>> d.setdefault('d') #只添加鍵,默認值為None
>>> d
{'a': 1, 'b': 2, 'c': 3, 'd': None}
接下來用它來實現上一個例子:
>>> count = {}
>>> for fruit in bag:
... count.setdefault(fruit, 0)
... count[fruit] += 1
...
>>> count
{'apple': 3, 'orange': 1, 'cherry': 2, 'blueberry': 1}
或者更簡潔一些:
>>> for fruit in bag:
... count[fruit] = count.setdefault(fruit, 0) + 1
4. 使用collections.defaultdict類
class collections.defaultdict([default_factory[, ...]])
defaultdict
是Python內建dict類的一個子類,第一個參數為default_factory屬性提供初始值,默認為None
。它覆蓋一個方法并添加一個可寫實例變量。它的其他功能與dict
相同,但會為一個不存在的鍵提供默認值,從而避免KeyError
異常。之前例子的實現如下:
>>> from collections import defaultdict
>>> count = defaultdict(int)
>>> for fruit in bag:
... count[fruit] += 1
...
>>> count
defaultdict(<class 'int'>, {'apple': 3, 'orange': 1, 'cherry': 2, 'blueberry': 1})
4.1. 類型名稱作為初始化函數參數
首先它可以接受類型名稱來作為初始化函數的參數,比如之前的例子中以int
類名稱作為參數。除了標準dict
操作,它還支持__missing__(key)
方法,通過參考官方文檔,它的機制如下:
如果default_factory為None
,會拋出以key為參數的KeyError異常。
>>> d = defaultdict() #default_factory為None
>>> d['eric']
Traceback (most recent call last):File "<stdin>", line 1, in <module>
KeyError: 'eric'
如果default_factory不為None
, 此處原文為:
"It is called without arguments to provide a default value for the given key, this value is inserted in the dictionary for the key, and returned."。
大概翻譯了下:它會在不接收任何參數的情況下被調用,來為給定的鍵提供默認值,這個值會被添加進字典并被返回。
>>> d = defaultdict(list) #default_factory是列表名稱
>>> d['eric'] #訪問一個不存在的鍵
[] #添加并返回默認值(一個空列表)
>>> d
defaultdict(<class 'list'>, {'eric': []})
因為defaultdict
是dict
的一個子類,事實上訪問一個不存在的鍵時,dict
類中的__getitem__
方法會調用子類中__missing__()
方法(但它不能直接被dict的實例調用),并且返回或拋出__missing__()
方法所返回的值和拋出的異常。因此,如果調用default_factory引發一個異常,該異常傳播不變(propagated unchanged)。
請注意除__getitem__()
之外的任何操作都不會調用__missing __()
。 這意味著像正常的字典一樣,get()
將返回None作為默認值,而不是使用default_factory。
另外,還可以給字典中的鍵映射多個值,具體方法是把多個值儲存在另一個容器里(如列表,元組,字典等)。是否使用列表或集合的選擇取決于預期用途:使用列表來保存每一項的插入順序;如果要消除重復的項(不關心順序),可以使用元組。
>>> from collections import defaultdict
>>> d = defaultdict(list)
>>> for i in [1,2,3]:
... d['eric'].append(i)
...
>>> d
defaultdict(<class 'list'>, {'eric': [1, 2, 3]})>>> d['amy'] = {}
>>> d['amy']['a'] = 1
>>> d
defaultdict(<class 'list'>, {'eric': [1, 2, 3], 'amy': {'a': 1}})
可以看出,給定默認值的類型之后并不意味著字典中所有值都必須是此類型,也可以是其他類型。還能使用相應的方法來對行操作,如列表的append
和pop
等方法。
4.2. 可調用函數作為初始化函數參數
除了接受類型名稱作為初始化函數的參數之外,還可以使用任何不帶參數的可調用函數,并以該函數返回值作為默認值。例如,定義函數zero()
讓默認值為0:
>>> from collections import defaultdict
>>> def zero():
... return 0
...
>>> d = defaultdict(zero)
>>> d['eric']
0
>>> d
defaultdict(<function zero at 0x100662e18>, {'eric': 0})
或者使用lambda
函數:
>>> d = defaultdict(lambda: 0)
>>> d['amy']
0
>>> d
defaultdict(<function <lambda> at 0x1019d3d90>, {'amy': 0})
需要注意的是, defaultdict
接受的參數必須是可調用的。若直接傳遞數字0,就會出現TyptError
的異常。
>>> d = defaultdict(0)
Traceback (most recent call last):File "<stdin>", line 1, in <module>
TypeError: first argument must be callable or None
聲明:
文章僅供學習及參考,禁止轉載。
參考:
- Python3.6: defaultdict
- Python中defaultdict方法的使用