一、基础方法:使用条件语句
其中最基础的方法是使用条件语句进行删除,即使用DataFrame的loc方法进行切片操作,如下:
import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 32, 18, 47], 'gender': ['F', 'M', 'M', 'M'], 'score': [70, 82, 65, 90]} df = pd.DataFrame(data) # 删除年龄小于20岁的行 df = df.loc[df['age'] >= 20]
以上代码即删除了年龄小于20岁的行,返回结果如下:
name age gender score 0 Alice 25 F 70 1 Bob 32 M 82 3 David 47 M 90
这种方法简单易懂,但是如果要删除多个条件的行比较麻烦,需要使用多次loc操作。
二、使用query方法
query方法是pandas提供的比较方便的筛选方法,可以一次性完成多重筛选,如下所示:
import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 32, 18, 47], 'gender': ['F', 'M', 'M', 'M'], 'score': [70, 82, 65, 90]} df = pd.DataFrame(data) # 删除年龄小于20岁或分数小于70分的行 df = df.query('age >= 20 and score >= 70')
以上代码即删除了年龄小于20岁且分数小于70分的行,返回结果如下:
name age gender score 0 Alice 25 F 70 1 Bob 32 M 82 3 David 47 M 90
需要注意的是,query方法中的查询条件需要用单引号或双引号进行引用。
三、使用isin方法
isin方法是用来筛选某一列中是否包含指定值的方法,可以用来快速删除指定值的行,如下所示:
import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 32, 18, 47], 'gender': ['F', 'M', 'M', 'M'], 'score': [70, 82, 65, 90]} df = pd.DataFrame(data) # 删除性别为M的行 df = df[~df['gender'].isin(['M'])]
以上代码即删除了性别为M的行,返回结果如下:
name age gender score 0 Alice 25 F 70
需要注意的是,在使用isin方法时,需要使用波浪线(~)将结果取反,才能删除指定值的行。
四、使用drop方法
drop方法是pandas提供的删除行或列的方法,需要传递删除行或列的索引或名称,例如:
import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 32, 18, 47], 'gender': ['F', 'M', 'M', 'M'], 'score': [70, 82, 65, 90]} df = pd.DataFrame(data) # 删除索引为1和2的行 df = df.drop([1, 2])
以上代码即删除了索引为1和2的行,返回结果如下:
name age gender score 0 Alice 25 F 70 3 David 47 M 90
需要注意的是,在使用drop方法时,需要使用inplace参数将结果保存到原DataFrame中。
五、使用布尔索引
布尔索引是一种用来筛选数据的方法,基于条件语句(如等于、大于等),返回一个布尔值的Series或DataFrame,可以用来删除指定值的行,如下所示:
import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 32, 18, 47], 'gender': ['F', 'M', 'M', 'M'], 'score': [70, 82, 65, 90]} df = pd.DataFrame(data) # 删除性别为M的行 df = df[df['gender'] != 'M']
以上代码即删除了性别为M的行,返回结果如下:
name age gender score 0 Alice 25 F 70
需要注意的是,在布尔索引中,可以使用&(and)和|(or)运算符,进行多条件的筛选。
总结
本文介绍了pandas中多种删除指定值的行的方法,包括使用条件语句、query方法、isin方法、drop方法和布尔索引,每种方法都有其适用范围和注意事项,需要根据数据情况和需求进行选择。需要注意的是,在使用删除方法时,尤其是删除操作不可逆,需要谨慎处理,以免误删数据。