Python Collection的完全指南

发布时间:2023-05-19

Python Collections是Python标准库中的一个模块,它提供了许多内置容器类型的替代选择。这个模块的目的是为了解决Python内置容器类型的不足,并提供了一些额外的容器类型。

一、Python Collections概述

Python Collections是Python标准库中的一个模块,它提供了几个特殊的容器类型,这些容器类型没有内置数据类型的限制,因此提供了更好的性能。Python collections模块是一个可扩展的容器类型集合,具有五种内置容器类型:Counter、defaultdict、namedtuple、OrderedDict和deque。该模块还提供了一个抽象基类,即Container。本指南将涵盖每个类、其方法和示例。

二、Python Collections中的常用类

Counter类

Counter类是一个有序字典,它跟踪可哈希对象的出现次数。当我们需要为一组数据计数时,它非常有用,比如统计每个单词出现的频率。

from collections import Counter
words = ['dog', 'cat', 'dog', 'fish', 'cat', 'dog']
count = Counter(words)
print(count)
# Counter({'dog': 3, 'cat': 2, 'fish': 1})

在上面的示例中,我们使用列表中的单词创建一个Counter对象。结果会告诉我们每个单词出现的次数。

defaultdict类

defaultdict类是dictionary的一个子类,它覆盖了一个方法并添加了一个可调用对象,因此它能够在添加缺失的项时自动创建值。

from collections import defaultdict
animals = defaultdict(lambda: 'Not in the dictionary')
animals['dog'] = 'An animal'
print(animals['dog'])
print(animals['lion'])
# Not in the dictionary

在上面的示例中,我们定义了一个defaultdict,它将返回一个自定义的字符串,当给定的键不存在时。当我们添加'dog'到字典里面时,将返回'An animal',查询key为'lion'时将返回我们自定义的字符串'Not in the dictionary'。

namedtuple类

namedtuple是一个工厂函数,它返回一个元组的子类,并为每个字段提供了一个名称。元组的子类是普通元组的变体,支持对元组字段的引用,可以通过名称和索引来访问元素。

from collections import namedtuple
person = namedtuple('Person', ['name', 'age', 'gender'])
p1 = person('Bob', 30, 'Male')
print(p1.name)
# Bob

在上面的示例中,我们定义了一个名为person的namedtuple,它有三个字段:'name'、'age'和'gender'。然后我们创建一个名为p1的新对象,用于存储具有name、age和gender属性的人员的信息。

OrderedDict类

OrderedDict类是Python的字典类的子类,它存储了键添加的顺序。这种类型是有序的,因为它保留了键的添加顺序,这在写代码时非常有用,避免了键的顺序进行了随机的更改。

from collections import OrderedDict
fruits = OrderedDict([('apple', 20), ('orange', 10), ('banana', 5)])
print(fruits)
# OrderedDict([('apple', 20), ('orange', 10), ('banana', 5)])

在上面的示例中,我们创建了一个OrderedDict对象,它包含了三个键值对。字典的输出与我们添加键值对的顺序相应。

deque类

deque类是一种具有高效插入和删除元素的数据结构。他支持从开头和结尾同时删除和添加元素。如果你的程序中需要处理队列类型的数据,deque能够使这些操作更加高效。

from collections import deque
dq = deque(range(5))
# dq: deque([0, 1, 2, 3, 4])
dq.append(5)
# dq: deque([0, 1, 2, 3, 4, 5])
dq.appendleft(-1)
# dq: deque([-1, 0, 1, 2, 3, 4, 5])

在上面的示例中,我们创建了一个deque,初始化为[0,1,2,3,4]。我们可以从队列的右侧添加新元素,也可以从左侧添加。这是在队列的左侧添加元素的方法。

三、相关链接