您的位置:

Python提取文件名为中心的方法

引言

在我们的日常工作中,我们需要从文件名中提取出有用的信息,如文件名中包含的日期,版本号等等。而在Python中提取文件名中的有用信息并不困难。本文将为您介绍在Python中提取文件名为中心的方法。

正文

一、正则表达式提取文件名

正则表达式是一种通用的字符串匹配工具,它可以用于提取字符串中的有用信息。下面的代码使用正则表达式提取文件名中的版本号。

import re

filename = 'example-v1.2.3.txt'
match = re.match(r'example-v(\d+\.\d+\.\d+)\.txt', filename)
if match:
    version = match.group(1)
    print(version)  # 输出 '1.2.3'

在以上代码中,使用re.match函数匹配文件名,正则表达式 'example-v(\d+\.\d+\.\d+)\.txt' 匹配了包含版本号的文件名。括号中的\d+\.\d+\.\d+表示一个由数字和点号组成的字符串,这个字符串就是版本号。

二、os.path模块提取文件名

Python内置的os.path模块提供了一些用于处理文件路径的函数,其中os.path.splitext函数可以将文件名拆分成文件名和扩展名。下面的代码演示了如何使用os.path模块提取文件名

import os

filename = 'example.txt'
basename = os.path.basename(filename)
name, ext = os.path.splitext(basename)
print(name)  # 输出 'example'
print(ext)  # 输出 '.txt'

在以上代码中,使用os.path.basename函数从文件名中获取基本文件名 'example.txt'。接着,使用os.path.splitext函数将基本文件名拆分成文件名 'example' 和扩展名 '.txt'。

三、字符串切片提取文件名

在一些情况下,我们可以直接使用字符串切片来获取文件名的有用信息。下面的代码演示了如何使用字符串切片提取文件名中的日期。

filename = 'example-20210615.txt'
date = filename[len('example-'):len('example-')+8]
print(date)  # 输出 '20210615'

在以上代码中,获取文件名 'example-20210615.txt' 的日期,可以使用字符串切片 filename[len('example-'):len('example-')+8],其中 [len('example-'):len('example-')+8] 表示获取从第8个字符开始,共计8个字符的子串。

四、使用pathlib库提取文件名

在Python 3.4及以后版本,Python 提供了一个新的标准库 —— pathlib,里面封装了一些现代化的路径操作相关的方法。下面的代码演示了如何使用pathlib库提取文件名。

from pathlib import Path

filename = 'example.txt'
p = Path(filename)
print(p.stem)  # 输出 'example'
print(p.suffix)  # 输出 '.txt'

在以上代码中,使用 Path(filename) 创建了一个Path对象,然后我们可以使用该对象的 .stem 和 .suffix 方法分别获取基本文件名和扩展名。

小结

本文介绍了Python中提取文件名为中心的几种方法,包括正则表达式、os.path模块、字符串切片和pathlib库等。这些方法各有优劣,我们可以根据具体情况选择使用哪一种方法。希望本文能对你在文件名处理上提供帮助。