字典是Python中非常常用的数据结构,它可以非常快速地进行键值对的查找,但是当我们在向字典中添加元素时,会遇到键不存在的情况。这就导致了一些问题,需要我们不断地检测键是否存在,才能安心地进行操作。Python标准库中的默认字典就是为了解决这个问题而出现的。
一、默认字典的概述
默认字典是Python标准库collections中的一种数据类型,它继承自字典,与普通字典主要的区别在于:当我们访问一个不存在的键时,默认字典会给该键设置一个默认值,并返回该默认值。
from collections import defaultdict
dd = defaultdict(list)
print(dd['key1']) # 输出 []
dd['key1'].append('value1')
print(dd['key1']) # 输出 ['value1']
在上面的例子中,我们创建了一个默认字典dd,它的默认值是一个空列表。因为字典中没有key1这个键,当我们调用print(dd['key1'])时,会返回一个空列表[],然后我们以普通字典的方式向该键添加了一个值'value1',再次调用print(dd['key1'])时,它将返回['value1']。
二、默认工厂函数
在创建默认字典对象时,我们需要指定一个默认工厂函数,它会在访问一个不存在的键时被调用,并返回一个默认值。默认字典提供了4个内置的工厂函数,它们分别是:int、float、list和dict。
1、int:返回整数0。
dic = defaultdict(int)
print(dic['a']) # 输出 0
2、float:返回浮点数0.0。
dic = defaultdict(float)
print(dic['a']) # 输出 0.0
3、list:返回空列表[]。
dic = defaultdict(list)
print(dic['a']) # 输出 []
4、dict:返回空字典{}。
dic = defaultdict(dict)
print(dic['a']) # 输出 {}
三、自定义工厂函数
除了内置的工厂函数,我们还可以通过自定义工厂函数来指定默认值。自定义工厂函数需要返回一个默认值,可以是任何数据类型。我们可以通过在创建默认字典时,传入一个函数来作为工厂函数。
def default_value():
return 'default value'
dic = defaultdict(default_value)
print(dic['a']) # 输出 default value
当我们向默认字典中访问一个键时,如果该键不存在,则默认工厂函数会被调用,并返回其返回值。在这个例子中,我们定义了一个自定义工厂函数default_value,它返回一个字符串"default value"。然后我们创建了一个字典dic,使用default_value作为该字典的默认工厂函数。因为字典中不存在键'a',所以当我们调用print(dic['a'])时,会返回"default value"。
四、小结
默认字典是一个很实用的Python标准库数据类型,它可以大大简化字典操作中的代码,避免了我们不断地检测键是否存在的问题。同时,Python的默认字典还提供了多种内置的工厂函数,可以方便地创建不同类型的默认字典对象。如果我们需要更多自定义的值作为默认值,可以通过自定义工厂函数来实现。使用默认字典可以使我们的代码更加简洁和高效。