您的位置:

Pandas更改列名的多个方面详解

一、pandas设置列名

pandas中DataFrame数据结构默认使用0, 1, 2等数字作为列名,不便于直观了解数据内容,因此需要设置列名。可以在创建DataFrame时使用columns参数指定列名,也可以通过columns属性设置列名。

import pandas as pd

# 使用columns参数指定列名
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data, columns=['A', 'B'])
print(df)

# 使用columns属性设置列名
df.columns = ['X', 'Y']
print(df)

二、pandas指定列名

pandas提供了rename()函数用于修改列名。可以通过字典、函数、列表等方式指定要修改的列名。

import pandas as pd

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 通过字典指定要修改的列名
df = df.rename(columns={'A': 'X', 'B': 'Y'})
print(df)

# 通过函数指定要修改的列名
df = df.rename(columns=str.lower)
print(df)

# 通过列表指定要修改的列名
df.columns = ['a', 'b']
df = df.rename(columns={'a': 'X', 'b': 'Y'})
print(df)

三、如何修改列名pandas

如果要修改单个列名,可以直接使用列名做为Series的索引,然后赋值新的列名即可;如果要修改多个列名,则需要使用rename()函数。

import pandas as pd

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 修改单个列名
df = df.rename(columns={'A': 'X'})
print(df)

# 修改多个列名
df.columns = ['X', 'Y']
print(df)

四、pandas筛选数据

修改列名后,需要重新对数据进行筛选。可以使用loc或者iloc函数进行筛选,也可以使用列名对应的Series对象筛选。

import pandas as pd

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 使用loc或iloc筛选数据
df_new = df.loc[:, ['A']]
print(df_new)

# 使用列名对应的Series对象筛选数据
df_new = df['A']
print(df_new)

五、pandas列名

pandas的列名支持中文等非英文字符。可以在创建DataFrame时使用unicode_literals模块中的字符串定义中文列名,也可以在设置列名时使用中文。但注意,为了便于使用,建议使用英文作为列名。

import pandas as pd
from future.utils import native_strings

# 使用unicode_literals模块中的字符串定义中文列名
data = {native_strings('中文'): [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
print(df)

# 在设置列名时使用中文
df.columns = ['中文', 'B']
print(df)

六、pandas修改某一列的值

在DataFrame中,可以使用列名对应的Series对象修改某一列的值。可以使用loc或者iloc函数筛选出要修改的数据行,然后对该行数据对应的Series对象赋新值即可。

import pandas as pd

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 修改某一列的值
df.loc[:, ['A']] = [4, 5, 6]
print(df)

七、pandas改变指定列名

修改指定列名可以使用rename()函数,通过字典将旧列名映射到新列名即可。

import pandas as pd

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 改变指定列名
df = df.rename(columns={'A': 'X'})
print(df)

八、pandas改变列的顺序

改变列的顺序可以使用reindex()函数,输入要调整的列名列表即可。

import pandas as pd

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 改变列的顺序
df = df.reindex(columns=['B', 'A'])
print(df)

九、pandas根据一列修改另一列

根据一列的信息,可以修改另一列的值。可以使用apply()函数,传入一个函数,该函数以一列的值为输入,返回修改后的值。

import pandas as pd

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 根据一列修改另一列
df['C'] = df['B'].apply(lambda x: x+2)
print(df)