glob模块是用来获取文件路径的一个常用模块。它可以根据用户指定的路径来搜索文件,然后返回符合规则的文件路径列表。
一、glob库函数的基本用法
glob库需调用glob.glob()函数并传入特定的路径规则。路径规则可以包含通配符,例如使用*来匹配任意个字符,使用?来匹配单个字符。以下是一个示例:
import glob # 获取当前目录下所有的文本文件 files = glob.glob("*.txt") print(files)
二、使用通配符进行模糊匹配
glob库函数中通配符匹配使用比较频繁,可以通过通配符匹配获取符合规则的文件路径列表。
import glob # 获取当前目录下所有以.txt结尾的文件 files = glob.glob("*.txt") print(files) # 获取当前目录下以f开头,以.txt结尾的文件 files = glob.glob("f*.txt") print(files) # 获取当前目录下以任意字母开头,以.ppt或.pptx结尾的文件 files = glob.glob("[a-zA-Z]*.ppt*") print(files) # 获取当前目录下以数字为文件名的txt文件 files = glob.glob("[0-9]*.txt") print(files) # 获取当前目录下任意一级子目录下的txt文件 files = glob.glob("*/*.txt") print(files)
三、使用递归匹配子目录中的文件
除了对当前目录下进行文件搜索,glob库函数还可以在子目录中递归搜索文件。可以通过传入特定的路径规则实现递归匹配。
import glob # 获取当前目录及其子目录下所有的txt文件 files = glob.glob("**/*.txt", recursive=True) print(files) # 获取当前目录及其子目录下所有的py文件 files = glob.glob("**/*.py", recursive=True) print(files)
以上代码中的**表示匹配任意层级的子目录。
四、使用glob函数结合其他库的实际应用
1. 读取文件夹下的图片文件
import glob from PIL import Image # 读取当前目录下所有的jpg和png文件,并显示图片 image_files = glob.glob("*.jpg") + glob.glob("*.png") for file in image_files: img = Image.open(file) img.show()
2. 统计某文件夹中所有文本文件的行数
import glob # 统计当前目录下所有的txt文件的行数总和 files = glob.glob("*.txt") total_lines = 0 for file in files: with open(file, "r") as f: lines = f.readlines() total_lines += len(lines) print("Total lines:", total_lines)
3. 批量处理文件
import glob import shutil # 将所有的txt文件移动到一个新的文件夹 files = glob.glob("*.txt") for file in files: shutil.move(file, "new_folder")