前言
随着信息技术的快速发展,我们越来越需要从大量的 Excel 文件中提取数据,为了让我们更加高效地处理 Excel 数据,Python 提供了操作 Excel 表格的库。下面就介绍一下如何使用 Python 导入 Excel 文件数据。
准备环境
在使用 Python 操作 Excel 表格的库之前,需要先在计算机上安装以下两个库。
1. pandas
pandas 是 Python 中一个用于数据处理的库,它可以处理 Excel、CSV 等各种类型的表格数据。
pip install pandas
2. openpyxl
openpyxl 是 Python 中一个用于读写 Excel 文件的库。
pip install openpyxl
使用 pandas 读取 Excel 文件数据
1. 读取 Excel 文件
使用 pandas 库中的 read_excel 方法可以直接读取 Excel 文件里的数据。
import pandas as pd
# 读取 Excel 文件
data = pd.read_excel('excel文件名')
2. 指定 sheet 表格
Excel 文件中可能包含多个 sheet 表,通过指定 sheetname 参数可以选择读取特定的 sheet。
import pandas as pd
# 读取 Excel 文件中 sheet1
data = pd.read_excel('excel文件名', sheet_name='sheet1')
3. 指定读取范围
通过指定 nrows 和 usecols 参数可以选择读取特定的行或列。
import pandas as pd
# 读取 Excel 文件中 sheet1 的前10行和第1、3列
data = pd.read_excel('excel文件名', sheet_name='sheet1', nrows=10, usecols=[0, 2])
4. Excel 文件中日期数据的读取
Excel 中的日期格式与 Python 中的日期格式有所不同,需要使用 pandas 库中的 to_datetime 方法进行转换。
import pandas as pd
# 读取Excel文件,指定‘日期’列数据为日期格式
data = pd.read_excel('excel文件名', parse_dates=['日期'])
使用 openpyxl 读取 Excel 文件数据
1. 打开 Excel 文件
使用 openpyxl 库中的 load_workbook 方法可以打开 Excel 文件。
import openpyxl
# 打开 Excel 文件
wb = openpyxl.load_workbook('excel文件名')
2. 取得 sheet
使用 wb 对象的 get_sheet_by_name 方法可以取得 Excel 文件的一个 sheet。
import openpyxl
# 打开 Excel 文件
wb = openpyxl.load_workbook('excel文件名')
# 获取 sheet1
ws = wb.get_sheet_by_name('sheet1')
3. 取得单元格数据
使用 ws 对象的 cell 方法可以取得单元格对象,使用 value 属性可以取得单元格的值。
import openpyxl
# 打开 Excel 文件
wb = openpyxl.load_workbook('excel文件名')
# 获取 sheet1
ws = wb.get_sheet_by_name('sheet1')
# 获取A1单元格的值
value = ws.cell(row=1, column=1).value
4. 取得行数据
使用 ws 对象的 rows 属性可以取得 sheet 的所有行,使用 for 循环可以遍历所有行。
import openpyxl
# 打开 Excel 文件
wb = openpyxl.load_workbook('excel文件名')
# 获取 sheet1
ws = wb.get_sheet_by_name('sheet1')
# 读取 sheet1 所有行
for row in ws.rows:
# do something
总结
以上就是如何使用 Python 导入 Excel 文件数据的方法,通过使用 pandas 和 openpyxl 库可以很简单地操作 Excel 表格。在使用 pandas 读取 Excel 表格时,可以使用 read_excel 方法轻松读取 Excel 表格数据;在使用 openpyxl 读取 Excel 表格时,可以使用 load_workbook 方法打开 Excel 文件,使用 cell 方法读取单元格数据,使用 rows 属性读取行数据。有了这些方法,我们可以很方便地将 Excel 表格数据导入到 Python 的数据分析工具中,对数据进行处理和分析。