您的位置:

Python中的defaultdict和set用法详解

一、什么是defaultdict

Defaultdict是使用字典时的一种常见补充,它继承了dict的所有方法,同时可以提供一个默认值,当字典中没有某个键的时候可以自动根据默认值创建一个新值。

使用defaultdict

使用defaultdict需要两个步骤,首先需要导入collections模块,然后定义默认值。下面是一个例子:

from collections import defaultdict

#定义初始默认值为int类型0
d = defaultdict(int)
print(d['one']) #0

#定义初始默认值为list类型[]
d = defaultdict(list)
print(d['one']) #[]

#定义初始默认值为lambda表达式
d = defaultdict(lambda : 'None')
print(d['one'])  #'None'

defaultdict的应用场景

Defaultdict可以简化一些逻辑复杂的代码,尤其是在处理字典的时候。例如,如果要通过统计一个字符串中每个字符的出现次数,那么使用Defaultdict可以轻松实现:

s = 'hello world'
d = defaultdict(int)
for c in s:
    d[c] += 1
print(d)
#输出结果为:
#defaultdict(, {'h': 1, 'e': 1, 'l': 3, 'o': 2, ' ': 1, 'w': 1, 'r': 1, 'd': 1})

  

二、什么是set

Set是Python提供的用于存储不重复元素的数据结构,它的内部实现是一个哈希表,因此访问元素的时间复杂度为O(1),在需要快速判断某个元素是否出现在一个集合中时,set非常实用。

使用set

使用set只需要定义一个set对象,通过add()方法可以向set中添加元素。例如:

s = set()
s.add(1)
s.add(2)
s.add(3)
print(s)  #{1, 2, 3}

set的应用场景

Set可以应用于很多场合,例如快速去重、判断一个元素是否出现在一个序列中、实现关系测试等等。例如下面的代码可以快速将一个列表去重:

lst = [1, 2, 3, 1, 2, 3, 4, 5]
s = set(lst)
lst = list(s)
print(lst) #[1, 2, 3, 4, 5]

三、defaultdict和set的结合使用

在某些情况下,我们需要维护一些元素的聚类情况,例如将相同字母构成的单词视为一个组,那么可以使用defaultdict来维护一个字母到组号的映射,使用set来维护每个组中包含的单词。

from collections import defaultdict

words = ['dog', 'god', 'cat', 'act', 'tac']
d = defaultdict(set)

for word in words:
    key = tuple(sorted(word))
    d[key].add(word)

for key in d:
    print(list(d[key]))
#输出结果为:
#['dog', 'god']
#['cat', 'act', 'tac']

结语

本文主要介绍了Python中defaultdict和set的使用方法,希望读者们能够在实际编程中更好地应用这两个数据结构,提高代码的效率和可读性。