您的位置:

Python Pathlib 模块:简化文件路径和目录操作的利器

一、Pathlib 概述

Pathlib 是 Python 中处理文件和目录路径的模块。它在 Python3.4 版本中被引入,旨在简化路径操作,并提供一种更加直观的操作方式。路径可以描述成单独的抽象对象,相互之间可以执行操作,而无需担心路径的特定字符串表示形式,从而避免了使用字符串预处理方法的情况。

Python 中大多数文件路径库都是基于字符串,例如 os.path、os.chdir()、os.makedirs() 等,虽然它们是功能强大的工具,但是对于长字符串参数和重复性编码有一定的局限性。Pathlib 在这个层面上进行了大幅升级。

二、Pathlib 复制文件

在 Pathlib 中,Path 对象代表文件路径或目录路径。由于 Path 对象被看作是轻量级的、直观的对象,所以如果您需要复制文件,Pathlib 库肯定是您的不二之选。

下面是一个示例,基本演示了如何使用 Path 副本。

from pathlib import Path

if __name__ == '__main__':
    source_file = Path('source_file.txt')
    destination_file = Path('destination_file.txt')
    with source_file.open(mode='r') as source, destination_file.open(mode='w') as destination:
        destination.write(source.read())

上述代码旨在读取名为source_file.txt 的文件,并将其内容写入新文件destination_file.txt。可以使用 Path.open() 方法以指定的模式打开并操作文件。

三、Pathlib glob 与 rglob

glob 和 rglob 是 Pathlib 最重要的方法之一。注意,Path.glob() 和 Path.rglob() 方法分别迭代在当前目录和递归在其所有 descendent(后代)。

下面是一个示例,演示如何使用 rglob() 方法遍历目录树。

from pathlib import Path

dir_path = Path('.')
for file in dir_path.rglob('*.py'):
    print(file.name)

上述代码演示了遍历当前工作目录下所有 .py 文件的方法。glob 和 rglob 方法是递归目录结构的绝佳组合。

我们还可以使用许多其他的文件筛选器,如 *.txt , **/*.js 等等。除此之外,可以使用 .joinpath() 将多个路径链接在一起,以创建要搜索的完整路径。

四、Pathlib 过滤器

Pathlib 同时支持多种方式的文件过滤器,这使得它具有十分强大的灵活性。使用 Pathlib 通过名称、通配符、正则表达式、后缀名和目录过滤文件。

下面是一个示例,演示如何使用多个过滤器:

from pathlib import Path

path = Path('.')
for f in path.glob('*'):
    if not f.is_file() or str(f).endswith('.jpg'):
        continue
    print(f.name)

上述代码演示了如何遍历当前工作目录下的所有非 jpg 文件的名称。is_file() 方法和 endswith() 方法被广泛用于检查文件是否为目标类型。

五、Pathlib 内容检查

Pathlib 模块中的方法还提供了信任的内容检查方法,可以避免破坏文件系统。Pathlib 包也可以通过不同种类的路径操作查找和检索文件。

下面是一个示例,演示如何使用 Path.read_text() 从 disk 中读取文件并使用 Path.write_text() 写入文件:

from pathlib import Path

path = Path('sample.txt')
contents = path.read_text()
path.write_text(contents)

上述代码将文件的内容读取到字符串中并写入一个新文件中。

结束语

在本文中,我们对 Python 3 的 Pathlib 进行了全面介绍,包括复制文件、路径迭代、文件过滤器和内容检索。Pathlib 可以非常方便的替代 Python 2 中的 os.path,在 Python 应用程序中处理文件和目录路径时,这使得开发程序变得更加便捷。