本文目录一览:
python中line.split()的用法及实际使用示例
Python中split()函数,通常用于将字符串切片并转换为列表。
split():语法:
拆分字符串。通过制定分隔符将字符串进行切片,并返回分割后的字符串列表[list]
参数:str:分隔符,默认为空格,但不能为空("")
num: 表示分割次数。如果指定num,则分割成n+1个子字符串,并可将每个字符串赋给新的变量
line.strip().split(’,’)
strip()表示删除掉数据中的换行符,split(‘,’)则是数据中遇到‘,’ 就隔开。
Python数据分析笔记#7.3.1 字符串对象方法
「目录」
数据清洗和准备
Data Cleaning and Prepration
-------- 字符串对象方法
字符串对象方法
Python能够成为流行的数据处理语言的部分原因是其易于处理字符串和文本。大部分文本运算都直接做成了字符串对象的内置方法。
split方法可以 通过指定分隔符对字符串进行切片 。
例如,以逗号分割的字符串可以用split拆分成数段:
strip可以 去除字符串头尾指定的字符 ,默认是空白符或换行符。
strip常常与split一起使用:
利用 加法可以将字符串连接起来 :
但这种方式并不实用,毕竟字符串多了就很麻烦。一种更快 更符合Python风格的方式是是使用join方法 ,我们向join方法中传入一个列表或元组:
检测子串的最佳方法是利用Python的in关键字,还可以使用index和find。
index和find会 查找指定值的首次出现的位置 。
find和index的区别是:若找不到字符串,index将会引发一个 异常 ,find则会返回 -1 :
count可以 返回指定字串的出现次数
replace用于将 指定模式替换为另一个模式 (replace will substitute occurrences of one pattern for another)
再记录几个Python内置的字符串方法吧。
startswith和endswith: 若字符串以某个前缀(后缀)开头,则返回True :
lower和uppe: 分别将字母字符转换为小写或大写 。
ljust和rjust: 用空格(或其他字符)填充字符串的空白侧以返回符合最低宽度的字符串 。
这章终于还剩两节就结束了。
-END-
Python切片语法图像记忆法
无论是字符串、列表还是元组,都被称作【序列】,只要是序列就可以切片。而搞清楚序列的序号的定位方法,是一个基本功。
在Python里,序号有两种表达方式,一个是 正向角标序号 ,一个是 反向倒数序号 。
我定义的这两个名字,会更利于中文语言环境的同学的理解和学习。
一图胜万言:
有一个字符串序列”abcdef”,它的每一个字符的角标关系就是上图所示。其实这个方法也叫【插空法】。想象序列中每一项之间都有一个空隙,我们就是把0,1,2,3,4,5……这个数数序列插到空隙中。对于每一项来说,它的左下角的角标就是自己的定位,大家都是对号入座的。
建立一个有效的模型,通过这样一个明确的方法,至少我个人在平时列表序号时可以一步到位,不会数错。
在做切片时,有时还会用到倒序号,其实很好办,比如字母d就是倒数第3个,很符合中文的语言习惯,python的序号就是-3.
那么他是什么原理呢?你可以试着把上面的图写在一个纸条上,把它首尾相接,这个时候,f的右下角标和a的左下角标重合,都是0,像不像一个数轴?在数轴上,0的右侧起,是1,2,3,4,……,0的左侧起,自然就是-1,-2,-3,……了,很自然是不是?
再换一个角度,从负数开始插空,是不是还是左下角角标规则?神奇吧?~
这就是python的神奇之处,他很符合我们的数学逻辑,而且是一个统一、自洽的严谨逻辑。
记住一句话: 。总共分成三类, 0个冒号 、 1个冒号 和 2个冒号 。
当序号是0时,冒号语法允许不写0。最后两个公式里,其实是[0:-4]和[-4:0]。可以发现,只有位置是0时,可以左右颠倒,因为0既可以表示第1位的序号数(在冒号左侧时),也可以表示最后一位(在冒号右侧时,因为左闭右开),正因为如此特殊,0才可以省略不写。
这其实又呼应了上一章节的反向倒数序号,f的右下侧角标其实是0,再次验证这种抽象模型的合理性。再好好看看这个模型,记住它。
如果你观察得很仔细,前面的蓝色注释里括号内的部分,正是每次省略冒号的默认值。
第二个冒号后的数字是步长,它决定了前面所得到的子串 是从第一个开始第n个作为下一个。
默认是1,就意味着,0:4首先取到前4个字符abcd,然后每+1个序号,取一个,直到都取完,那默认就是abcd,没有变化。
如果是题目中的步长为2,那么就是取得到的abcd的第0位,第0+2位,第0+2+2位(此位不存在,不再往后累加2),那么得到的是ac,你懂了。
Python的字符串切片及常用方法
获取Python字符串中的某字符可以使用索引:
截取字符串中的一段字符串可以使用切片,切片在方括号中使用冒号:来分隔需要截取的首尾字符串的索引,方式是包括开头,不包括结尾
当尾索引没有给出时,默认截取到字符串的末尾
当头索引没有给出的时候默认从字符串开头开始截取
当尾索引和头索引都没有给出的时候,默认返回整个字符串,不过这只是一个浅拷贝
当尾索引大于总的字符串长度时,默认只截取到字符串末尾,很明显使用这种方法来截取一段到字符串末尾的子字符串是非常不明智的,应该是不给出尾索引才是最佳实践
当头索引为负数时,则是指从字符串的尾部开始计数,最末尾的字符记为-1,以此类推,因此此时应该注意尾索引的值,尾索引同样可以为负数,如果尾索引的值指明的字符串位置小于或等于头索引,此时返回的就是空字符串
切片是Python中截取字符串最强大的功能。
以下列举部分Python字符串常用的方法: