您的位置:

掌握pandas删除指定值的行:详解多种方法

一、基础方法:使用条件语句

其中最基础的方法是使用条件语句进行删除,即使用DataFrame的loc方法进行切片操作,如下:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'M', 'M'],
        'score': [70, 82, 65, 90]}
df = pd.DataFrame(data)

# 删除年龄小于20岁的行
df = df.loc[df['age'] >= 20]

以上代码即删除了年龄小于20岁的行,返回结果如下:

      name  age gender  score
0    Alice   25      F     70
1      Bob   32      M     82
3    David   47      M     90

这种方法简单易懂,但是如果要删除多个条件的行比较麻烦,需要使用多次loc操作。

二、使用query方法

query方法是pandas提供的比较方便的筛选方法,可以一次性完成多重筛选,如下所示:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'M', 'M'],
        'score': [70, 82, 65, 90]}
df = pd.DataFrame(data)

# 删除年龄小于20岁或分数小于70分的行
df = df.query('age >= 20 and score >= 70')

以上代码即删除了年龄小于20岁且分数小于70分的行,返回结果如下:

    name  age gender  score
0  Alice   25      F     70
1    Bob   32      M     82
3  David   47      M     90

需要注意的是,query方法中的查询条件需要用单引号或双引号进行引用。

三、使用isin方法

isin方法是用来筛选某一列中是否包含指定值的方法,可以用来快速删除指定值的行,如下所示:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'M', 'M'],
        'score': [70, 82, 65, 90]}
df = pd.DataFrame(data)

# 删除性别为M的行
df = df[~df['gender'].isin(['M'])]

以上代码即删除了性别为M的行,返回结果如下:

      name  age gender  score
0    Alice   25      F     70

需要注意的是,在使用isin方法时,需要使用波浪线(~)将结果取反,才能删除指定值的行。

四、使用drop方法

drop方法是pandas提供的删除行或列的方法,需要传递删除行或列的索引或名称,例如:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'M', 'M'],
        'score': [70, 82, 65, 90]}
df = pd.DataFrame(data)

# 删除索引为1和2的行
df = df.drop([1, 2])

以上代码即删除了索引为1和2的行,返回结果如下:

    name  age gender  score
0  Alice   25      F     70
3  David   47      M     90

需要注意的是,在使用drop方法时,需要使用inplace参数将结果保存到原DataFrame中。

五、使用布尔索引

布尔索引是一种用来筛选数据的方法,基于条件语句(如等于、大于等),返回一个布尔值的Series或DataFrame,可以用来删除指定值的行,如下所示:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'M', 'M'],
        'score': [70, 82, 65, 90]}
df = pd.DataFrame(data)

# 删除性别为M的行
df = df[df['gender'] != 'M']

以上代码即删除了性别为M的行,返回结果如下:

    name  age gender  score
0  Alice   25      F     70

需要注意的是,在布尔索引中,可以使用&(and)和|(or)运算符,进行多条件的筛选。

总结

本文介绍了pandas中多种删除指定值的行的方法,包括使用条件语句、query方法、isin方法、drop方法和布尔索引,每种方法都有其适用范围和注意事项,需要根据数据情况和需求进行选择。需要注意的是,在使用删除方法时,尤其是删除操作不可逆,需要谨慎处理,以免误删数据。