您的位置:

如何使用 Python 导入 Excel 文件数据

前言

随着信息技术的快速发展,我们越来越需要从大量的 Excel 文件中提取数据,为了让我们更加高效地处理 Excel 数据,Python 提供了操作 Excel 表格的库。下面就介绍一下如何使用 Python 导入 Excel 文件数据。

准备环境

在使用 Python 操作 Excel 表格的库之前,需要先在计算机上安装以下两个库。

1. pandas

pandas 是 Python 中一个用于数据处理的库,它可以处理 Excel、CSV 等各种类型的表格数据。

pip install pandas

2. openpyxl

openpyxl 是 Python 中一个用于读写 Excel 文件的库。

pip install openpyxl

使用 pandas 读取 Excel 文件数据

1. 读取 Excel 文件

使用 pandas 库中的 read_excel 方法可以直接读取 Excel 文件里的数据。

import pandas as pd

# 读取 Excel 文件
data = pd.read_excel('excel文件名')

2. 指定 sheet 表格

Excel 文件中可能包含多个 sheet 表,通过指定 sheetname 参数可以选择读取特定的 sheet。

import pandas as pd

# 读取 Excel 文件中 sheet1
data = pd.read_excel('excel文件名', sheet_name='sheet1')

3. 指定读取范围

通过指定 nrows 和 usecols 参数可以选择读取特定的行或列。

import pandas as pd

# 读取 Excel 文件中 sheet1 的前10行和第1、3列
data = pd.read_excel('excel文件名', sheet_name='sheet1', nrows=10, usecols=[0, 2])

4. Excel 文件中日期数据的读取

Excel 中的日期格式与 Python 中的日期格式有所不同,需要使用 pandas 库中的 to_datetime 方法进行转换。

import pandas as pd

# 读取Excel文件,指定‘日期’列数据为日期格式
data = pd.read_excel('excel文件名', parse_dates=['日期'])

使用 openpyxl 读取 Excel 文件数据

1. 打开 Excel 文件

使用 openpyxl 库中的 load_workbook 方法可以打开 Excel 文件。

import openpyxl

# 打开 Excel 文件
wb = openpyxl.load_workbook('excel文件名')

2. 取得 sheet

使用 wb 对象的 get_sheet_by_name 方法可以取得 Excel 文件的一个 sheet。

import openpyxl

# 打开 Excel 文件
wb = openpyxl.load_workbook('excel文件名')

# 获取 sheet1
ws = wb.get_sheet_by_name('sheet1')

3. 取得单元格数据

使用 ws 对象的 cell 方法可以取得单元格对象,使用 value 属性可以取得单元格的值。

import openpyxl

# 打开 Excel 文件
wb = openpyxl.load_workbook('excel文件名')

# 获取 sheet1
ws = wb.get_sheet_by_name('sheet1')

# 获取A1单元格的值
value = ws.cell(row=1, column=1).value

4. 取得行数据

使用 ws 对象的 rows 属性可以取得 sheet 的所有行,使用 for 循环可以遍历所有行。

import openpyxl

# 打开 Excel 文件
wb = openpyxl.load_workbook('excel文件名')

# 获取 sheet1
ws = wb.get_sheet_by_name('sheet1')

# 读取 sheet1 所有行
for row in ws.rows:
    # do something

总结

以上就是如何使用 Python 导入 Excel 文件数据的方法,通过使用 pandas 和 openpyxl 库可以很简单地操作 Excel 表格。在使用 pandas 读取 Excel 表格时,可以使用 read_excel 方法轻松读取 Excel 表格数据;在使用 openpyxl 读取 Excel 表格时,可以使用 load_workbook 方法打开 Excel 文件,使用 cell 方法读取单元格数据,使用 rows 属性读取行数据。有了这些方法,我们可以很方便地将 Excel 表格数据导入到 Python 的数据分析工具中,对数据进行处理和分析。