一、正则表达式基础
正则表达式是用来描述字符串模式的一种工具,其使用规则比较复杂,但是能够对字符串进行强大的模式匹配功能。在PHP中,使用preg_match()函数可以进行正则表达式的匹配,该函数的语法如下:
preg_match($pattern, $string, $matches, $flags, $offset);
其中,$pattern表示正则表达式的模式,$string表示要匹配的字符串,$matches表示存放匹配结果的数组,$flags表示匹配标志,$offset表示从字符串的哪个位置开始匹配。
例如,使用正则表达式判断一个字符串是否为手机号:
$pattern = '/^1[3|4|5|7|8][0-9]{9}$/'; $string = '13900001111'; if(preg_match($pattern, $string)) { echo '是手机号'; } else { echo '不是手机号'; }
二、用正则表达式替换字符串
在PHP中,使用preg_replace()函数进行正则表达式的替换操作。该函数的语法如下:
preg_replace($pattern, $replacement, $string, $limit, &$count);
其中,$pattern、$string和$limit参数的含义同preg_match()函数,而$replacement表示要替换成的内容,$count表示替换的次数。
例如,我们可以使用正则表达式将字符串中的所有空格替换为逗号:
$pattern = '/\s+/'; $replacement = ','; $string = 'hello world'; $new_string = preg_replace($pattern, $replacement, $string); echo $new_string; // 输出:hello,world
三、使用正则表达式进行字符串提取
正则表达式除了可以对字符串进行替换,还可以对字符串进行提取。在PHP中,可以使用preg_match_all()函数进行正则表达式的提取操作。该函数的语法如下:
preg_match_all($pattern, $string, $matches, $flags, $offset);
其中,$pattern、$flags、$offset参数的含义同preg_match()函数,$string表示要提取的字符串,$matches表示匹配到的结果数组。
例如,我们可以使用正则表达式提取HTML中所有的链接:
$pattern = '/([\s\S]*?)<\/a>/'; $string = ' 百度一下,你就知道'; preg_match_all($pattern, $string, $matches); print_r($matches); // 输出:Array ( [0] => Array ( [0] => 百度一下,你就知道 ) [1] => Array ( [0] => https://www.baidu.com ) [2] => Array ( [0] => 百度一下,你就知道 ) )
四、使用正则表达式进行多重匹配
在PHP中,除了使用preg_match_all()函数之外,还可以使用preg_replace_callback()函数进行多重匹配。该函数的语法如下:
preg_replace_callback($pattern, $callback, $subject, $limit, &$count);
其中,$pattern和$limit参数的含义同preg_replace()函数,$subject表示要进行匹配的字符串,$callback表示用来替换匹配到的结果的回调函数。
例如,我们可以使用正则表达式匹配字符串中的所有单词,并将其替换成对应的数字:
$words = array('hello', 'world', 'php'); $string = 'hello world, this is php'; $reg = '/\b(' . implode('|', $words) . ')\b/'; $callback = function($matches) use ($words) { return array_search($matches[1], $words) + 1; }; $new_string = preg_replace_callback($reg, $callback, $string); echo $new_string; // 输出:1 2, this is 3
五、正则表达式的特殊字符
在正则表达式中,有些字符具有特殊含义,需要注意。下面列举一些常见的特殊字符:
.
匹配任意字符,除了换行符^
匹配输入字符串的开始位置$
匹配输入字符串的结束位置*
匹配前面的子表达式零次或多次+
匹配前面的子表达式一次或多次?
匹配前面的子表达式零次或一次{n}
匹配前面的子表达式恰好n次{n,}
匹配前面的子表达式至少n次{n,m}
匹配前面的子表达式至少n次,至多m次|
分隔两个规则,匹配其中一个[]
匹配方括号中的任意一个字符[^]
匹配除了方括号中的任意一个字符以外的字符\
转义字符,用来匹配特殊字符本身