Excel是一种常用的电子表格程序,可应用于各种应用场景,例如数据收集、数据整理、数据统计等。当我们需要将Excel中的数据导入到其他系统中时,我们通常需要将Excel数据进行一些转换和处理。在这个过程中,Python可以成为一个有用的工具。本文将介绍如何使用 Python 处理 Excel 数据,并通过示例代码演示一些常用的技巧,包括一键转换、批处理、筛选、排序等。
import csv import json import openpyxl # 将 Excel 文件转换成 CSV 格式 def excel_to_csv(excel_file, csv_file): wb = openpyxl.load_workbook(excel_file) ws = wb.active with open(csv_file, 'w', newline='') as f: writer = csv.writer(f) for row in ws.rows: writer.writerow([cell.value for cell in row]) # 将 Excel 文件转换成 JSON 格式 def excel_to_json(excel_file, json_file): wb = openpyxl.load_workbook(excel_file) ws = wb.active rows = [] for row in ws.rows: rows.append([cell.value for cell in row]) with open(json_file, 'w') as f: json.dump(rows, f)
当需要对 Excel 文件夹中的多个文件进行批处理时,我们可以使用os模块遍历文件夹并批处理每个文件。
import openpyxl import os # 批量修改文件格式 def batch_process(folder_path, old_ext, new_ext): for filename in os.listdir(folder_path): if filename.endswith(old_ext): excel_file = os.path.join(folder_path, filename) new_name = os.path.splitext(filename)[0] + '.' + new_ext new_file = os.path.join(folder_path, new_name) wb = openpyxl.load_workbook(excel_file) wb.save(new_file)
import pandas as pd import openpyxl # 按条件筛选 Excel 中的数据 def filter_excel(excel_file, condition): df = pd.read_excel(excel_file) df_filtered = df[eval(condition)] wb = openpyxl.Workbook() ws = wb.active for r in dataframe_to_rows(df_filtered, index=False, header=True): ws.append(r) wb.save(excel_file)
当需要按照某个关键字对 Excel 中的数据进行排序或者按照某个字段分组时,pandas库也可以起到很大的作用。
import pandas as pd import openpyxl # 按照某个关键字对 Excel 中的数据进行排序 def sort_excel(excel_file, column, ascending): df = pd.read_excel(excel_file) df_sorted = df.sort_values(by=column, ascending=ascending) wb = openpyxl.Workbook() ws = wb.active for r in dataframe_to_rows(df_sorted,index=False, header=True): ws.append(r) wb.save(excel_file) # 按照某个字段分组 Excel 中的数据 def group_by_excel(excel_file, column): df = pd.read_excel(excel_file) df_grouped = df.groupby(column) wb = openpyxl.Workbook() ws = wb.active for key, group in df_grouped: ws.append([key]) for r in dataframe_to_rows(group, index=False, header=True): ws.append(r) wb.save(excel_file)