一、什么是defaultdict
Defaultdict是使用字典时的一种常见补充,它继承了dict的所有方法,同时可以提供一个默认值,当字典中没有某个键的时候可以自动根据默认值创建一个新值。
使用defaultdict
使用defaultdict需要两个步骤,首先需要导入collections模块,然后定义默认值。下面是一个例子:
from collections import defaultdict #定义初始默认值为int类型0 d = defaultdict(int) print(d['one']) #0 #定义初始默认值为list类型[] d = defaultdict(list) print(d['one']) #[] #定义初始默认值为lambda表达式 d = defaultdict(lambda : 'None') print(d['one']) #'None'
defaultdict的应用场景
Defaultdict可以简化一些逻辑复杂的代码,尤其是在处理字典的时候。例如,如果要通过统计一个字符串中每个字符的出现次数,那么使用Defaultdict可以轻松实现:
s = 'hello world' d = defaultdict(int) for c in s: d[c] += 1 print(d) #输出结果为: #defaultdict(, {'h': 1, 'e': 1, 'l': 3, 'o': 2, ' ': 1, 'w': 1, 'r': 1, 'd': 1})
二、什么是set
Set是Python提供的用于存储不重复元素的数据结构,它的内部实现是一个哈希表,因此访问元素的时间复杂度为O(1),在需要快速判断某个元素是否出现在一个集合中时,set非常实用。
使用set
使用set只需要定义一个set对象,通过add()方法可以向set中添加元素。例如:
s = set() s.add(1) s.add(2) s.add(3) print(s) #{1, 2, 3}
set的应用场景
Set可以应用于很多场合,例如快速去重、判断一个元素是否出现在一个序列中、实现关系测试等等。例如下面的代码可以快速将一个列表去重:
lst = [1, 2, 3, 1, 2, 3, 4, 5] s = set(lst) lst = list(s) print(lst) #[1, 2, 3, 4, 5]
三、defaultdict和set的结合使用
在某些情况下,我们需要维护一些元素的聚类情况,例如将相同字母构成的单词视为一个组,那么可以使用defaultdict来维护一个字母到组号的映射,使用set来维护每个组中包含的单词。
from collections import defaultdict words = ['dog', 'god', 'cat', 'act', 'tac'] d = defaultdict(set) for word in words: key = tuple(sorted(word)) d[key].add(word) for key in d: print(list(d[key])) #输出结果为: #['dog', 'god'] #['cat', 'act', 'tac']
结语
本文主要介绍了Python中defaultdict和set的使用方法,希望读者们能够在实际编程中更好地应用这两个数据结构,提高代码的效率和可读性。