您的位置:

Python re.sub实现字符串替换

一、re.sub函数原理

re.sub()函数是Python的正则表达式模块re里的一个函数,用于进行字符串替换。其参数包括三个:pattern(要查找的正则表达式)、repl(要替换成的字符串)和string(被查找的原始字符串)。

其替换原理为:按照pattern的正则规则依次匹配string的字符,如果匹配到则用repl替换原有字符,最后返回替换后的字符串。

import re
string = 'Python is a popular programming language'
pattern = 'Python'
repl = 'Java'
print(re.sub(pattern, repl, string))
# 输出结果:Java is a popular programming language 

二、支持正则表达式替换

re.sub()支持使用正则表达式进行字符串替换。正则表达式可以匹配更加灵活的字符规则,从而实现功能更加强大的替换操作。

例如,下面的例子中,使用正则表达式将字符串中的数字替换为"#"。

import re
string = 'There are 3 apples and 2 bananas'
pattern = '[0-9]'
repl = '#'
print(re.sub(pattern, repl, string))
# 输出结果:There are # apples and # bananas

三、支持字典替换

re.sub()还支持使用字典进行字符串替换。对于字典中的每个键值对,如果在被替换的字符串中找到该键,则使用相应的值替换。

例如,下面的例子中,将字符串中的"apple"替换成"orange",将"banana"替换成"peach"。

import re
string = 'I like apple and banana'
replace_dict = {
    'apple': 'orange',
    'banana': 'peach'
}
pattern = '|'.join(replace_dict.keys())
repl = lambda match: replace_dict[match.group(0)]
print(re.sub(pattern, repl, string))
# 输出结果:I like orange and peach 

四、支持函数替换

re.sub()还支持使用函数进行字符串替换。函数将被用于处理正则表达式匹配到的内容,并返回处理后的字符串。在函数中,使用group()可以访问正则表达式中匹配到的内容。

例如,下面的例子将字符串中的单词首字母大写。

import re
string = 'python is a popular programming language'
def capitalize(match):
    return match.group(0).capitalize()
pattern = '\b\w'
print(re.sub(pattern, capitalize, string))
# 输出结果:Python Is A Popular Programming Language

五、结语

通过Python re.sub函数,我们可以简单方便地实现各种字符串替换操作。无论是简单的字符替换还是复杂的正则表达式替换,都能得到灵活而高效的处理。