Python中collections.defaultdict()使用

1、以一個例子開始:統計一個列表里各單詞重復次數

words = ['hello', 'world', 'nice', 'world']
counter = dict()
for kw in words:
    counter[kw] += 1

這樣寫肯定會報錯的,因為各詞的個數都沒有初始值,引發KeyError
2、改進一下:加入if判斷

words = ['hello', 'world', 'nice', 'world']
counter = dict()
for kw in words:
    if kw in words:
        counter[kw] += 1
    else:
        counter[kw] = 0

3、再改進:使用setdefault()方法設置默認值

words = ['hello', 'world', 'nice', 'world']
counter = dict()
for kw in words:
    counter.setdefault(kw, 0)
    counter[kw] += 1

setdefault(),需提供兩個參數,第一個參數是鍵值,第二個參數是默認值,每次調用都有一個返回值,如果字典中不存在該鍵則返回默認值,如果存在該鍵則返回該值,利用返回值可再次修改代碼。

words = ['hello', 'world', 'nice', 'world']
counter = dict()
for kw in words:
    counter[kw] = counter.setdefault(kw, 0) + 1

4、接著改進
一種特殊類型的字典本身就保存了默認值defaultdict(),defaultdict類的初始化函數接受一個類型作為參數,當所訪問的鍵不存在的時候,可以實例化一個值作為默認值。

from collections import defaultdict
dd = defaultdict(list)
defaultdict(<type 'list'>, {})
#給它賦值,同時也是讀取
dd['h'h]
defaultdict(<type 'list'>, {'hh': []})
dd['hh'].append('haha')
defaultdict(<type 'list'>, {'hh': ['haha']})

該類除了接受類型名稱作為初始化函數的參數之外,還可以使用任何不帶參數的可調用函數,到時該函數的返回結果作為默認值,這樣使得默認值的取值更加靈活。

>>> from collections import defaultdict
>>> def zero():
...     return 0
...
>>> dd = defaultdict(zero)
>>> dd
defaultdict(<function zero at 0xb7ed2684>, {})
>>> dd['foo']
0
>>> dd
defaultdict(<function zero at 0xb7ed2684>, {'foo': 0})

最終代碼:

from collections import defaultdict
words = ['hello', 'world', 'nice', 'world']
#使用lambda來定義簡單的函數
counter = defaultdict(lambda: 0) 
for kw in words:
    counter[kw] += 1
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容