一、Pathlib 概述
Pathlib 是 Python 中处理文件和目录路径的模块。它在 Python3.4 版本中被引入,旨在简化路径操作,并提供一种更加直观的操作方式。路径可以描述成单独的抽象对象,相互之间可以执行操作,而无需担心路径的特定字符串表示形式,从而避免了使用字符串预处理方法的情况。
Python 中大多数文件路径库都是基于字符串,例如 os.path、os.chdir()、os.makedirs() 等,虽然它们是功能强大的工具,但是对于长字符串参数和重复性编码有一定的局限性。Pathlib 在这个层面上进行了大幅升级。
二、Pathlib 复制文件
在 Pathlib 中,Path 对象代表文件路径或目录路径。由于 Path 对象被看作是轻量级的、直观的对象,所以如果您需要复制文件,Pathlib 库肯定是您的不二之选。
下面是一个示例,基本演示了如何使用 Path 副本。
from pathlib import Path if __name__ == '__main__': source_file = Path('source_file.txt') destination_file = Path('destination_file.txt') with source_file.open(mode='r') as source, destination_file.open(mode='w') as destination: destination.write(source.read())
上述代码旨在读取名为source_file.txt 的文件,并将其内容写入新文件destination_file.txt。可以使用 Path.open() 方法以指定的模式打开并操作文件。
三、Pathlib glob 与 rglob
glob 和 rglob 是 Pathlib 最重要的方法之一。注意,Path.glob() 和 Path.rglob() 方法分别迭代在当前目录和递归在其所有 descendent(后代)。
下面是一个示例,演示如何使用 rglob() 方法遍历目录树。
from pathlib import Path dir_path = Path('.') for file in dir_path.rglob('*.py'): print(file.name)
上述代码演示了遍历当前工作目录下所有 .py 文件的方法。glob 和 rglob 方法是递归目录结构的绝佳组合。
我们还可以使用许多其他的文件筛选器,如 *.txt , **/*.js 等等。除此之外,可以使用 .joinpath() 将多个路径链接在一起,以创建要搜索的完整路径。
四、Pathlib 过滤器
Pathlib 同时支持多种方式的文件过滤器,这使得它具有十分强大的灵活性。使用 Pathlib 通过名称、通配符、正则表达式、后缀名和目录过滤文件。
下面是一个示例,演示如何使用多个过滤器:
from pathlib import Path path = Path('.') for f in path.glob('*'): if not f.is_file() or str(f).endswith('.jpg'): continue print(f.name)
上述代码演示了如何遍历当前工作目录下的所有非 jpg 文件的名称。is_file() 方法和 endswith() 方法被广泛用于检查文件是否为目标类型。
五、Pathlib 内容检查
Pathlib 模块中的方法还提供了信任的内容检查方法,可以避免破坏文件系统。Pathlib 包也可以通过不同种类的路径操作查找和检索文件。
下面是一个示例,演示如何使用 Path.read_text() 从 disk 中读取文件并使用 Path.write_text() 写入文件:
from pathlib import Path path = Path('sample.txt') contents = path.read_text() path.write_text(contents)
上述代码将文件的内容读取到字符串中并写入一个新文件中。
结束语
在本文中,我们对 Python 3 的 Pathlib 进行了全面介绍,包括复制文件、路径迭代、文件过滤器和内容检索。Pathlib 可以非常方便的替代 Python 2 中的 os.path,在 Python 应用程序中处理文件和目录路径时,这使得开发程序变得更加便捷。