您的位置:

如何将dataframe转换成array

1、引言

数据处理中,往往会用到pandas库中的dataframe类型,但是如果需要将dataframe转换成array类型,则需要使用numpy库进行实现。本文就将带领大家深入了解如何将dataframe转换成array,方便读者在进行数据处理时能够更加得心应手。

2、转换方法

2.1 将dataframe所有列名作为array的第一行

使用array()函数进行转换,会将dataframe中每一行数据作为array的一行,此时array的列名会显示成一个类似字段名的字串,而字段名与数据被'\r'字符隔开的。下面是实现代码:


import numpy as np
import pandas as pd

df = pd.DataFrame({'name':['Tom','Jack','Mark'], 'age':[23,23,23]})

array = np.array(df)
print(array)
输出结果:
[['Tom' 23]
 ['Jack' 23]
 ['Mark' 23]]
我们可以看到,array的第一行显示的是dataframe的列名。

2.2 将dataframe去掉列名,只留数据

在有些情况下,我们并不需要array显示dataframe的列名,只需要dataframe中的数据,那么我们可以使用values进行数据提取。下面是实现代码:


import numpy as np
import pandas as pd

df = pd.DataFrame({'name':['Tom','Jack','Mark'], 'age':[23,23,23]})

array = np.array(df.values)
print(array)
输出结果:
[['Tom' 23]
 ['Jack' 23]
 ['Mark' 23]]
我们可以看到,array的第一行没有了dataframe的列名,只留下了数据。此时,我们可以对数据进行一些计算和处理。

2.3 将dataframe中的某一列转换成array

在有些情况下,我们需要将dataframe中的某一列转换成array进行处理,那么我们可以先提取这一列的数据,再使用array进行转换。下面是实现代码:


import numpy as np
import pandas as pd

df = pd.DataFrame({'name':['Tom','Jack','Mark'], 'age':[23,23,23]})

array = np.array(df['age'])
print(array)
输出结果:
[23 23 23]
我们可以看到,array中只有dataframe中的某一列数据,这样方便我们进行一些针对性的处理。

3、结论

本文通过三种实现方式,详细介绍了如何将dataframe转换成array,并且给出了对应的实现代码。在数据处理中,如果需要进行一些高级的数据分析和处理,那么使用array会显得更加得心应手。希望读者能够根据自己的需求,灵活运用本文提供的实现方法。