本文目录一览:
- 1、软件测试中,python判断字符串,str函数isdigit、isdecimal、isnumeri
- 2、如何理解python3的unicode,以及全角半角转换
- 3、Python实现全角半角转换的方法
- 4、python空格转化为全角空格
- 5、Python的标点和符号是半角英文还是全角英文?
- 6、如何让Python输入逗号 不区分全半角
软件测试中,python判断字符串,str函数isdigit、isdecimal、isnumeri
num = "4" # 全角数字num.isdigit() # Truenum.isdecimal() # Truenum.isnumeric() # Truenum = b"4" # bytenum.isdigit() # Truenum.isdecimal() # AttributeError: bytes object has no attribute isdecimalnum.isnumeric() # AttributeError: bytes object has no attribute isdecimalnum = "IV" # 罗马数字num.isdigit() # Truenum.isdecimal() # Falsenum.isnumeric() # True#num = "四" # 汉字num.isdigit() # Falsenum.isdecimal() # Falsenum.isnumeric() # True# isdigit() 支持 全角数字,byte数字(单字节) 罗马数字 不支持汉字# isdecimal() 支持全角数字 , 不支持 罗马数字 汉字 , 报错 byte数字(单字节)# isnumeric() 支持 全角数字 罗马数字 汉字 报错 byte数字(单字节)通常使用最多的是isdecimal ,如果想了解更多可以来传智播客软件测试学科学习
如何理解python3的unicode,以及全角半角转换
1. unicode是一个编码的standard,表明了字符与数字之间的映射,是可变长的。
2. 映射后的数据如何编码为字节?这个就是具体的编码规则:目前最主流的是UTF-8,同样,它也是变字长的。
python3中的str都是unicode的:“The default encoding for Python source code is UTF-8”
python3中的encode:按照encode()括号中的参数对字符串进行编码,就是生成bytes。
所以:
In:'中文'.encode('utf-8')
Out:b'\xe4\xb8\xad\xe6\x96\x87'
这里的b就是Byte,\x表示这个x是被转义的,意思就是0x。又如:
In: 'abc'.encode('utf-8')
Out: b'abc'
上面的b'a'其实表示的是数字97,b'a'的意思就是字符串'a'的binary数字:
[In]:'abc'.encode('utf-8')[0]
[Out]: 97
同时可以把b'\x'进行解码,即:
In:b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
Out:'中文'
除了encode('utf-8')外,用ord可以获得单个utf-8字符对应的数字:
In [60]: ord('a')
Out[60]: 97
In [61]: ord('a') #这个是全角的a
Out[61]: 65345
除了decode('utf-8')外,用chr可以获得数字对应的utf-8字符:
In [62]: chr(97)
Out[62]: 'a'
除了unicode还有别的编码标准吗?有啊,比如我国的GBK,别名也叫cp936。
全角和半角之分,是指同样一个意义的字符,显示的大小不同.具体来说,全角和半角的编码是两个结果:
In [70]: "mn".encode('utf-8')
Out[70]: b'\xef\xbd\x8d\xef\xbd\x8e
[In]:"mn".encode('utf-8')
[Out]:b'mn'
它们有什么对应关系呢?(引自这里)
转换说明
全角半角转换说明
有规律(不含空格):
全角字符unicode编码从65281~65374 (十六进制 0xFF01 ~ 0xFF5E)
半角字符unicode编码从33~126 (十六进制 0x21~ 0x7E)
特例:
空格比较特殊,全角为 12288(0x3000),半角为 32(0x20)
除空格外,全角/半角按unicode编码排序在顺序上是对应的(半角 + 0x7e= 全角),所以可以直接通过用+-法来处理非空格数据,对空格单独处理。
代码在此基础上改动一下(将unichr改为chr即可,适应python3),即:
def strQ2B(ustring):
"""全角转半角"""
rstring = ""
for uchar in ustring:
inside_code=ord(uchar)
if inside_code == 12288: #全角空格直接转换
inside_code = 32
elif (inside_code = 65281 and inside_code = 65374): #全角字符(除空格)根据关系转化
inside_code -= 65248
rstring += chr(inside_code)
return rstring
In [69]: strQ2B('你好python')
Out[69]: '你好python'
Python实现全角半角转换的方法
Python实现全角半角转换的方法
本文实例讲解了Python实现全角半角转换的方法,相信对于大家的Python学习能够起到一定的参考借鉴价值。如下所示:
一、全角半角转换概述:
全角字符unicode编码从65281~65374 (十六进制 0xFF01 ~ 0xFF5E)
半角字符unicode编码从33~126 (十六进制 0x21~ 0x7E)
空格比较特殊,全角为 12288(0x3000),半角为 32 (0x20)
而且除空格外,全角/半角按unicode编码排序在顺序上是对应的
所以可以直接通过用+-法来处理非空格数据,对空格单独处理
二、全角转半角:
实现代码如下:
def strQ2B(ustring):
"""把字符串全角转半角"""
rstring = ""
for uchar in ustring:
inside_code=ord(uchar)
if inside_code==0x3000:
inside_code=0x0020
else:
inside_code-=0xfee0
if inside_code0x0020 or inside_code0x7e: #转完之后不是半角字符返回原来的字符
rstring += uchar
rstring += unichr(inside_code)
return rstring
三、半角转全角:
实现代码如下:
def strB2Q(ustring):
"""把字符串半角转全角"""
rstring = ""
for uchar in ustring:
inside_code=ord(uchar)
if inside_code0x0020 or inside_code0x7e: #不是半角字符就返回原来的字符
rstring += uchar
if inside_code==0x0020: #除了空格其他的全角半角的公式为:半角=全角-0xfee0
inside_code=0x3000
else:
inside_code+=0xfee0
rstring += unichr(inside_code)
return rstring
四、测试代码:
a = strB2Q("abc12345")
print a
b = strQ2B(a)
print b
输出:
abc12345
abc12345
感兴趣的朋友可以调试运行一下,相信会有一定的收获。
python空格转化为全角空格
输入12288即可转化。
在自然语言处理过程中,全角、半角的的不一致会导致信息抽取不一致,因此需要统一。空格比较特殊,全角为12288(0x3000),半角为32(0x20)。
Python的标点和符号是半角英文还是全角英文?
你好,答案如下所示。
python的所有标点和符号都是半角英文
希望你能够详细查看。
如果你有不会的,你可以提问
我有时间就会帮你解答。
希望你好好学习。
每一天都过得充实。
如何让Python输入逗号 不区分全半角
1、首先中文是不区分全角和半角的。
2、其次在python中输入逗号时,可以切换为中文输入法进行输入。
3、最后可以在输入中不区分全半角,而且还能输入正确。