您的位置:

php常用正则表达式收集,php正则匹配html标签内容

本文目录一览:

史上最全的PHP正则表达式

一、校验数字的表达式 

1 数字:

^[0-9]*$

2 n位的数字:

^\d{n}$

3 至少n位的数字:

^\d{n,}$

4 m-n位的数字:

^\d{m,n}$

5 零和非零开头的数字:

^(0|[1-9][0-9]*)$

6 非零开头的最多带两位小数的数字:

^([1-9][0-9]*)+(.[0-9]{1,2})?$

7 带1-2位小数的正数或负数:

^(\-)?\d+(\.\d{1,2})?$

8 正数、负数、和小数:

^(\-|\+)?\d+(\.\d+)?$

9 有两位小数的正实数:

^[0-9]+(.[0-9]{2})?$

10 有1~3位小数的正实数:

^[0-9]+(.[0-9]{1,3})?$

11 非零的正整数:

^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$

12 非零的负整数:

^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$

13 非负整数:

^\d+$ 或 ^[1-9]\d*|0$

14 非正整数:

^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$

15 非负浮点数:

^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$

16 非正浮点数:

^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$

17 正浮点数:

^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$

18 负浮点数:

^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$

19 浮点数:

^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

二、校验字符的表达式

1 汉字:

^[\u4e00-\u9fa5]{0,}$

2 英文和数字:

^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$

3 长度为3-20的所有字符:

^.{3,20}$

4 由26个英文字母组成的字符串:

^[A-Za-z]+$

5 由26个大写英文字母组成的字符串:

^[A-Z]+$

6 由26个小写英文字母组成的字符串:

^[a-z]+$

7 由数字和26个英文字母组成的字符串:

^[A-Za-z0-9]+$

8 由数字、26个英文字母或者下划线组成的字符串:

^\w+$ 或 ^\w{3,20}$

9 中文、英文、数字包括下划线:

^[\u4E00-\u9FA5A-Za-z0-9_]+$

10 中文、英文、数字但不包括下划线等符号:

^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$

11 可以输入含有^%',;=?$\"等字符:

[^%',;=?$\x22]+

12 禁止输入含有~的字符:

[^~\x22]+

三、特殊需求表达式

1、 Email地址:

^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$

2 、域名:

[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?

3 、InternetURL:

[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%=]*)?$

4 、手机号码:

^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$

5 、电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):

^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$ 

6 国内电话号码(0511-4405222、021-87888822):

\d{3}-\d{8}|\d{4}-\d{7}

7 、身份证号:

15或18位身份证:

^\d{15}|\d{18}$

15位身份证:

^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$

18位身份证:

^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{4}$

8、 短身份证号码(数字、字母x结尾):

^([0-9]){7,18}(x|X)?$

^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$

9 、帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):

^[a-zA-Z][a-zA-Z0-9_]{4,15}$

10 、密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):

^[a-zA-Z]\w{5,17}$

11 、强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):

^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$ 

12、 日期格式:

^\d{4}-\d{1,2}-\d{1,2}

13、 一年的12个月(01~09和1~12):

^(0?[1-9]|1[0-2])$

14 、一个月的31天(01~09和1~31):

^((0?[1-9])|((1|2)[0-9])|30|31)$ 

15 、钱的输入格式:

16 、1.有四种钱的表示形式我们可以接受:"10000.00" 和 "10,000.00", 和没有 "分" 的 "10000" 和 "10,000":

^[1-9][0-9]*$ 

17、 2.这表示任意一个不以0开头的数字,但是,这也意味着一个字符"0"不通过,所以我们采用下面的形式:

^(0|[1-9][0-9]*)$ 

18 、3.一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号:

^(0|-?[1-9][0-9]*)$ 

19 、4.这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧.下面我们要加的是说明可能的小数部分:

^[0-9]+(.[0-9]+)?$ 

20 、5.必须说明的是,小数点后面至少应该有1位数,所以"10."是不通过的,但是 "10" 和 "10.2" 是通过的:

^[0-9]+(.[0-9]{2})?$ 

21、 6.这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样:

^[0-9]+(.[0-9]{1,2})?$ 

22、 7.这样就允许用户只写一位小数.下面我们该考虑数字中的逗号了,我们可以这样:

^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$ 

23 、8.1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须:

^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$ 

24 、备注:这就是最终结果了,别忘了"+"可以用"*"替代如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里

25 、xml文件:

^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$

26 、中文字符的正则表达式:

[\u4e00-\u9fa5]

27 、双字节字符:

[^\x00-\xff]

(包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))

28 、空白行的正则表达式:\n\s*\r (可以用来删除空白行)

29 、HTML标记的正则表达式:

(\S*?)[^]*.*?|.*? / (网上流传的版本太糟糕,上面这个也仅仅能部分,对于复杂的嵌套标记依旧无能为力)

30 、首尾空白字符的正则表达式:^\s*|\s*$或(^\s*)|(\s*$) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)

31 、腾讯QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000开始)

32 、中国邮政编码:[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)

33、 IP地址:\d+\.\d+\.\d+\.\d+ (提取IP地址时有用)

超常用的PHP正则表达式收集整理

以下就是对超常用的PHP正则表达式进行的收集整理,为了方便大家更快更好的掌握php正则表达式。

一、表单验证匹配

验证账号,字母开头,允许

5-16

字节,允许字母数字下划线:^[a-zA-Z][a-zA-Z0-9_]{4,15}$

验证账号,不能为空,不能有空格,只能是英文字母:^\S+[a-z

A-Z]$

验证账号,不能有空格,不能非数字:^\d+$

验证用户密码,以字母开头,长度在

6-18

之间:^[a-zA-Z]\w{5,17}$

验证是否含有

^%',;=?$\

等字符:[^%',;=?$\x22]+

匹配Email地址:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配腾讯QQ号:[1-9][0-9]{4,}

匹配日期,只能是

2004-10-22

格式:^\d{4}\-\d{1,2}-\d{1,2}$

匹配国内电话号码:^\d{3}-\d{8}|\d{4}-\d{7,8}$------------评注:匹配形式如010-12345678

或0571-12345678

0831-1234567

匹配中国邮政编码:^[1-9]\d{5}(?!\d)$

匹配身份证:\d{14}(\d{4}|(\d{3}[xX])|\d{1})------------评注:中国的身份证为15

位或18

不能为空且二十字节以上:^[\s|\S]{20,}$

二、字符匹配

匹配由

26

个英文字母组成的字符串:^[A-Za-z]+$

匹配由

26

个大写英文字母组成的字符串:^[A-Z]+$

匹配由

26

个小写英文字母组成的字符串:^[a-z]+$

匹配由数字和

26

个英文字母组成的字符串:^[A-Za-z0-9]+$

匹配由数字、26个英文字母或者下划线组成的字符串:^\w+$

匹配空行:\n[\s|

]*\r

匹配任何内容:[\s\S]*

匹配中文字符:[\x80-\xff]+

或者

[\xa1-\xff]+

只能输入汉字:^[\x80-\xff],{0,}$

匹配双字节字符(包括汉字在内):[^\x00-\xff]

三、匹配数字

只能输入数字:^[0-9]*$

只能输入n位的数字:^\d{n}$

只能输入至少n位数字:^\d{n,}$

只能输入m-n位的数字:^\d{m,n}$

匹配正整数:^[1-9]\d*$

匹配负整数:^-[1-9]\d*$

匹配整数:^-?[1-9]\d*$

匹配非负整数(正整数

+

0):^[1-9]\d*|0$

匹配非正整数(负整数

+

0):^-[1-9]\d*|0$

匹配正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$

匹配负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$

匹配浮点数:^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

匹配非负浮点数(正浮点数

+

0):^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$

匹配非正浮点数(负浮点数

+

0):^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$

四、其他

匹配HTML标记的正则表达式(无法匹配嵌套标签):(\S*?)[^]*.*?/\1|.*?

/

匹配网址

URL

:[a-zA-z]+://[^\s]*

匹配

IP

地址:((25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(25[0-5]|2[0-4]\d|[01]?\d\d?)

匹配完整域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+\.?

提示

上述正则表达式通常都加了

^

$

来限定字符的起始和结束,如果需要匹配的内容包括在字符串当中,可能需要考虑去掉

^

$

限定符。

以上正则表达式仅供参考,使用时请检验后再使用,希望通过这些超常用的PHP正则表达式

PHP常用正则表达式汇总

1.

^d+$"//非负整数(正整数

+

0)

2.

"^[0-9]*[1-9][0-9]*$"//正整数

3.

"^((-d+)|(0+))$"//非正整数(负整数

+

0)

4.

"^-[0-9]*[1-9][0-9]*$"//负整数

5.

"^-?d+$"//整数

6.

"^d+(.d+)?$"//非负浮点数(正浮点数

+

0)

7.

"^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$"//正浮点数

8.

"^((-d+(.d+)?)|(0+(.0+)?))$"//非正浮点数(负浮点数

+

0)

9.

"^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$"//负浮点数

10.

"^(-?d+)(.d+)?$"//浮点数

11.

"^[A-Za-z]+$"//由26个英文字母组成的字符串

12.

"^[A-Z]+$"//由26个英文字母的大写组成的字符串

13.

"^[a-z]+$"//由26个英文字母的小写组成的字符串

14.

"^[A-Za-z0-9]+$"//由数字和26个英文字母组成的字符串

15.

"^w+$"//由数字、26个英文字母或者下划线组成的字符串

16.

"^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$"//email地址

17.

"^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$"//url

18.

/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/

//

年-月-日

19.

/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/

//

月/日/年

20.

"^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$"

//Emil

21.

/^((+?[0-9]{2,4}-[0-9]{3,4}-)|([0-9]{3,4}-))?([0-9]{7,8})(-[0-9]+)?$/

//电话号码

22.

"^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$"

//IP地址

23.

匹配中文字符的正则表达式:

[u4e00-u9fa5]

24.

匹配双字节字符(包括汉字在内):[^x00-xff]

25.

匹配空行的正则表达式:n[s|

]*r

26.

匹配HTML标记的正则表达式:/(.*).*/1|(.*)

//

27.

匹配首尾空格的正则表达式:(^s*)|(s*$)

28.

匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

29.

匹配网址URL的正则表达式:^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$

30.

匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$

31.

匹配国内电话号码:(d{3}-|d{4}-)?(d{8}|d{7})?

32.

匹配腾讯QQ号:^[1-9]*[1-9][0-9]*$

33.

元字符及其在正则表达式上下文中的行为:

34.

将下一个字符标记为一个特殊字符、或一个原义字符、或一个后向引用、或一个八进制转义符。

35.

^

匹配输入字符串的开始位置。如果设置了

RegExp

对象的Multiline

属性,^

也匹配

’n’

’r’

之后的位置。

36.

$

匹配输入字符串的结束位置。如果设置了

RegExp

对象的Multiline

属性,$

也匹配

’n’

’r’

之前的位置。

37.

*

匹配前面的子表达式零次或多次。

38.

+

匹配前面的子表达式一次或多次。+

等价于

{1,}。

39.

?

匹配前面的子表达式零次或一次。?

等价于

{0,1}。

40.

{n,}

n

是一个非负整数,至少匹配n

次。

41.

{n,m}

m

n

均为非负整数,其中n

=

m。最少匹配

n

次且最多匹配

m

次。在逗号和两个数之间不能有空格。