本文目录一览:
- 1、如何用python读取excel文件?
- 2、python 操作excel 读 写 xlsx
- 3、使用python读取excel中的数据,并重新写入到新的excel中
- 4、怎样用python,读取excel中的一列数据
- 5、Python的excel读取和写入
- 6、python对excel操作
如何用python读取excel文件?
1.首先说明我是使用的python3.5,我的office版本是2010,首先打开dos命令窗,安装必须的两个库,命令是:
pip3 install xlrd
Pip3 install xlwt
2.准备好excel,例如我的一个工作文件,我放在D盘/百度经验/11.xlsx,只有一个页签A,内容是一些销售数据
3.打开pycharm,新建一个excel.py的文件,首先导入支持库
import xlrdimport xlwt
4.针对刚入门的新手,先介绍三个知识,第一个:获取excel的sheet名称,第二:获取excel行数与列数,第三:获取第几行第几列的具体值,这是最常用的三个知识点
5.贴出代码,具体分析:
(1)要操作excel,首先得打开excel,使用open_workbook(‘路径’)
(2)要获取行与列,使用nrows(行),ncols(列)
(3)获取具体的值,使用cell(row,col).value
workbook=xlrd.open_workbook(r'E:11.xlsx')print (workbook.sheet_names()) sheet2=workbook.sheet_by_name('A') nrows=sheet2.nrows ncols=sheet2.ncols print(nrows,ncols) cell_A=sheet2.cell(1,1).value print(cell_A)
6.要在excel里写入值,就要使用write属性,重点说明写入是用到xlwt这个支援库,思路是先新建excel,然后新建页签B,然后将一组数据写入到B,最后保存为excel.xls,这里建议保存为2003的格式,大部分电脑都能打开,特别注意保存的excel的路径是在python工作文件的目录下面,贴出代码:
stus = [['年', '月'], ['2018', '10'], ['2017', '9'], ['2016', '8']]Excel = xlwt.Workbook() # 新建excelsheet = Excel.add_sheet('B') #新建页签Brow = 0for stu in stus: col = 0 for s in stu: sheet.write(row, col, s) #开始写入 col = col + 1 row = row + 1Excel.save('Excel.xls') #保存
关于如何用python读取excel文件,环球青藤小编就和大家分享到这里了,学习是永无止境的,学习一项技能更是受益终身,所以,只要肯努力学,什么时候开始都不晚。如果您还想继续了解关于python编程的学习方法及素材等内容,可以点击本站其他文章学习。
python 操作excel 读 写 xlsx
原文非常清晰,全程无bug,调试通过,留作记录以防丢失
一、xlrd和xlwt
使用之前需要先安装,windows上如果直接在cmd中运行python则需要先执行pip3 install xlrd和pip3 install xlwt,如果使用pycharm则需要在项目的解释器中安装这两个模块,File-Settings-Project:layout-Project Interpreter,点击右侧界面的+号,然后搜索xlrd和xlwt,然后点击Install Package进行安装。
对于excel来说,整个excel文件称为工作簿,工作簿中的每个页称为工作表,工作表又由单元格组成。
对于xlrd和xlwt,行数和列数从0开始,单元格的行和列也从0开始,例如sheet.row_values(2)表示第三行的内容,sheet.cell(1,2).value表示第二行第三列单元格的内容。
1.xlrd模块读取excel文件
使用xlrd模块之前需要先导入import xlrd,xlrd模块既可读取xls文件也可读取xlsx文件。
获取工作簿对象 :book = xlrd.open_workbook('excel文件名称')
获取所有工作表名称 :names = book.sheet_names(),结果为列表
根据索引获取工作表对象 :sheet = book.sheet_by_index(i)
根据名称获取工作表对象 :sheet = book.sheet_by_name('工作表名称')
获取工作表行数 :rows = sheet.nrows
获取工作表列数 :cols = sheet.ncols
获取工作表某一行的内容 :row = sheet.row_values(i) ,结果为列表 【sheet.row(i),列表】
获取工作表某一列的内容 :col = sheet.col_values(i) 结果为列表 【sheet.col(i),列表】
获取工作表某一单元格的内容 :cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value、sheet.row(m)[n].value,sheet.col(n)[m].value,结果为字符串或数值 【sheet.cell(0,0),xlrd.sheet.Cell对象】
示例:假设在py执行文件同层目录下有一fruit.xls文件,有三个sheet页Sheet1、Sheet2、Sheet3,其中Sheet1内容如下:
import xlrd
book = xlrd.open_workbook('fruit.xls')print('sheet页名称:',book.sheet_names())
sheet = book.sheet_by_index(0)
rows = sheet.nrows
cols = sheet.ncolsprint('该工作表有%d行,%d列.'%(rows,cols))print('第三行内容为:',sheet.row_values(2))print('第二列内容为%s,数据类型为%s.'%(sheet.col_values(1),type(sheet.col_values(1))))print('第二列内容为%s,数据类型为%s.'%(sheet.col(1),type(sheet.col(1))))print('第二行第二列的单元格内容为:',sheet.cell_value(1,1))print('第三行第二列的单元格内容为:',sheet.cell(2,1).value)print('第五行第三列的单元格内容为:',sheet.row(4)[2].value)print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheet.col(2)[4].value,type(sheet.col(2)[4].value)))print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheet.col(2)[4],type(sheet.col(2)[4])))# 执行结果# sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']# 该工作表有5行,3列.# 第三行内容为: ['梨', 3.5, 130.0]# 第二列内容为['单价/元', 8.0, 3.5, 4.5, 3.8],数据类型为class 'list'.# 第二列内容为[text:'单价/元', number:8.0, number:3.5, number:4.5, number:3.8],数据类型为class 'list'.# 第二行第二列的单元格内容为: 8.0# 第三行第二列的单元格内容为: 3.5# 第五行第三列的单元格内容为: 300.0# 第五行第三列的单元格内容为300.0,数据类型为class 'float'# 第五行第三列的单元格内容为number:300.0,数据类型为class 'xlrd.sheet.Cell'
可以看出通过sheet.row(i)、sheet.col(i)也可获取行或列的内容,并且结果也是一个列表,但是列表中的每一项类似字典的键值对,形式为数据类型:值。
而sheet.cell(0,0)获取单元格内容,结果是一个键值对,并且是一个xlrd.sheet.Cell对象。
2.xlwt写入excel文件
使用xlwt模块之前需要先导入import xlwt,xlwt模块只能写xls文件,不能写xlsx文件(写xlsx程序不会报错,但最后文件无法直接打开,会报错)。
创建工作簿 :book = xlwt.Workbook(),如果写入中文为乱码,可添加参数encoding = 'utf-8'
创建工作表 :sheet = book.add_sheet('Sheet1')
向单元格写入内容 :sheet.write(m,n,'内容1')、sheet.write(x,y,'内容2')
保存工作簿 :book.save('excel文件名称'),默认保存在py文件相同路径下,如果该路径下有相同文件,会被新创建的文件覆盖,即xlwt不能修改文件。
import xlwt
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')
sheet.write(0,0,'hello')
sheet.write(1,0,'你好')
book.save('hello.xls')
逐个单元格写入excel比较麻烦,可以按行或者列写入。
import xlwt
proj = ['名称','单价/元','库存/kg']
fruit = ['苹果','梨','香蕉','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,100,300]
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')foriin range(0,len(proj)):
sheet.write(0,i,proj[i]) #按行插入行标题foriin range(0,len(fruit)):
sheet.write(i+1,0,fruit[i])#插入第一列水果名称foriin range(0,len(price)):
sheet.write(i+1,1,price[i])#插入第二列单价foriin range(0,len(storage)):
sheet.write(i+1,2,storage[i])#插入第三列库存book.save('fruit2.xls')
二、openpyxl模块
openpyxl模块可实现对excel文件的读、写和修改,只能处理xlsx文件,不能处理xls文件,使用之前同样需要先安装该模块,再导入 import openpyxl。
对于openpyxl,行数和列数都从1开始,单元格的行和列也从1开始。例如sheet.cell(1,2).value表示第一行第二列单元格的内容
1.openpyxl读取excel文件
获取工作簿对象:book = openpyxl.load_workbook('excel文件名称')
获取所有工作表名称:names = book.sheetnames
获取工作表对象:sheet1 = book.worksheets[n]、sheet2 = book['工作表名称']、sheet3 = book[book.sheetnames[n]]
获取工作表名称:title = sheet1.title
获取工作表行数:rows = sheet1.max_row
获取工作表列数:cols = sheet1.max_column
获取某一单元格内容:cell = sheet.cell(1,2).value、sheet['单元格'].value例如sheet['B1'].value
假设有一fruit2.xlsx,除后缀名其他与上述fruit.xls完全一样
import openpyxl
book = openpyxl.load_workbook('fruit2.xlsx')print('所有sheet页名称:',book.sheetnames)
sheet = book.worksheets[0]
sheet2 = book['Sheet1']
sheet3 = book[book.sheetnames[0]]print('工作表名称:',sheet3.title)
rows = sheet.max_row
cols = sheet.max_columnprint('该工作表有%d行,%d列.'%(rows,cols))# 执行结果# 所有sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']# 工作表名称: Sheet1# 该工作表有5行,3列.
2.行和列生成器
对于xlrd模块来说,可直接通过sheet.row[i]和sheet.col[i]获取行和列的内容,但是对于openpyxl模块来说,无法直接获取某一行或列的内容,openpyxl模块的sheet.rows和sheet.columns表示行和列的生成器,即generator object,需要通过循环或转换成列表、元组的形式得到行或列的值。
print(sheet.rows,sheet.columns)forcolin sheet.columns:
print(col)forrowin sheet.rows:
foriin row:
print(i.value,end='')
print()# 执行结果# generator object Worksheet._cells_by_row at 0x00000230E011A2A0 generator object Worksheet._cells_by_col at 0x00000230E102FC00# (Cell 'Sheet1'.A1, Cell 'Sheet1'.A2, Cell 'Sheet1'.A3, Cell 'Sheet1'.A4, Cell 'Sheet1'.A5)# (Cell 'Sheet1'.B1, Cell 'Sheet1'.B2, Cell 'Sheet1'.B3, Cell 'Sheet1'.B4, Cell 'Sheet1'.B5)# (Cell 'Sheet1'.C1, Cell 'Sheet1'.C2, Cell 'Sheet1'.C3, Cell 'Sheet1'.C4, Cell 'Sheet1'.C5)# 名称 单价/元 库存/kg# 苹果 8 150# 梨 3.5 130# 香蕉 4.5 100# 橘子 3.8 300
如果要获取某一行或者列的内容,可将行、列生成器对象转换成列表或者元组,再循环列表或者元组得到内容。
前面说过openpyxl模块的行和列都从1开始,但是由于将生成器转化成了列表list(sheet.rows),而列表的索引从0开始,因此list(sheet.rows)[1]还是表示第二行的内容,不是第一行的内容。
foriinlist(sheet.rows)[1]:
print(i.value,end='')print()foriin list(sheet.columns)[0]:
print(i.value,end='')# 执行结果# 苹果 8 150# 名称 苹果 梨 香蕉 橘子
获取单元格的内容
print(sheet.cell(1,2).value)#第一行第二列单元格的内容print(sheet['a2'].value)#使用excel单元格的表示法,字母不区分大小写
3.openpyxl写excel文件
创建工作簿 :book = openpyxl.Workbook(),如果写入中文为乱码,可添加参数encoding = 'utf-8'
创建工作表: sheet = book.create_sheet('工作表名称',0),0表示创建的工作表在工作薄最前面
向单元格写入内容 :sheet.cell(m,n,'内容1')、sheet.cell(x,y,'内容2')
保存工作簿 :book.save('excel文件名称'),默认保存在py文件相同路径下,如果该路径下有相同文件,会被新创建的文件覆盖。
book = openpyxl.Workbook()
sheet = book.create_sheet('Sheet1',0)
proj = ['名称','单价/元','库存/kg']
fruit = ['苹果','香蕉','梨','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,300,100]foriin range(len(proj)):
sheet.cell(1,i+1,proj[i])foriin range(len(fruit)):
sheet.cell(i+2,1,fruit[i])foriin range(len(price)):
sheet.cell(i+2,2,price[i])foriin range(len(storage)):
sheet.cell(i+2,3,storage[i])
book.save('fruit2.xlsx')
4.openpyxl修改excel文件
sheet.insert_rows(m)和sheet.insert_cols(n)分别表示在第m行、第n列前面插入行、列
sheet.delete_rows(m)和sheet.delete_cols(n)分别表示删除第m行、第n列
rows = sheet.max_row
sheet.insert_rows(rows+2)
cherry = ['樱桃',17,80] forjin cherry:
sheet.cell(rows+1,cherry.index(j)+1,j)
book.save('fruit2.xlsx')
修改单元格内容:sheet.cell(m,n) = '内容1'或者sheet['B3'] = '内容2'
sheet.cell(3,2,4)
sheet['B3'] = 5book.save('fruit2.xlsx')
在最后追加行:sheet.append(可迭代对象)
straberry = ['草莓',20,50]
sheet.append(straberry)
book.save('fruit2.xlsx')
三、xlsxwriter 模块
只能操作xlsx,只能写。在excel中插入图片
import matplotlib.pyplot as plt
2 import pandas as pd
3 import random
4 import xlsxwriter
5
6 ts = pd.Series(random.randrange(10))
7 fig = plt.figure()
8 ax = fig.add_subplot(1,1,1)
9 ts.plot(ax=ax)
10 fig.savefig('foo.png')
11
12 workbook = xlsxwriter.Workbook('pngxls.xlsx') # 创建excel文件
13 worksheet1 = workbook.add_worksheet('png') # 括号内为工作表表名
14 # 第一个参数是插入的起始单元格,第二个参数是图片你文件的绝对路径
15 worksheet1.write('A1','hello')
16 worksheet1.insert_image('B2','foo.png')
18 workbook.close()
xlrd、xlwt和openpyxl处理excel文件,在写入文件的时候不如pandas简单,pandas处理excel文件见另外一篇博客
使用python读取excel中的数据,并重新写入到新的excel中
使用Python3运行
起初是读取excel中的数据,进行相关的计算将结果追加在后面,没有找到合适的办法,就只能采用这种读取数据,进行相关操作,重新写入的方法
(1)使用xlrd打开xls文件,读取数据
(2)将需要的数据放进list中,进行相应的计算得出结果
(3)使用xlutils的copy将xlrd对象转化为xlwt对象
(4)使用转化的xlwt对象的write方法,将结果写入
(5)使用xlwt的save进行保存
主要用它读取Excel数据
主要用它来将数据写入到excel中
主要用xlutils的copy方法将xlrd对象转化为xlwt对象,好来进行写入
删除了一些东西大致如下
怎样用python,读取excel中的一列数据
用python读取excel中的一列数据步骤如下:
1、首先打开dos命令窗,安装必须的两个库,命令是:pip3 install xlrd;Pip3 install xlwt。
2、准备好excel。
3、打开pycharm,新建一个excel.py的文件,首先导入支持库import xlrdimport xlwt。
4、要操作excel,首先得打开excel,使用open_workbook(‘路径’),要获取行与列,使用nrows(行),ncols(列),获取具体的值,使用cell(row,col).value。
5、要在excel里写入值,就要使用write属性,重点说明写入是用到xlwt这个支援库,思路是先新建excel,然后新建页签B,然后将一组数据写入到B,最后保存为excel.xls。
Python的excel读取和写入
现在常用的处理excel的方法大多是numpy,但是之前已经习惯了用xlrd的工具,所以也记录一下祖传的excel读取/创建/写入:
1.读取excel:
2.创建一个excel:
3.写入excel:
python对excel操作
Python对于Excel的操作是多种多样的,掌握了相关用法就可以随心所欲的操作数据了!
操作xls文件
xlrd(读操作):
import xlrd
1、引入xlrd模块
workbook=xlrd.open_workbook("36.xls")
2、打开[36.xls]文件,获取excel文件的workbook(工作簿)对象
names=workbook.sheet_names()
3、获取所有sheet的名字
worksheet=workbook.sheet_by_index(0)
4、通过sheet索引获得sheet对象
worksheet为excel表第一个sheet表的实例化对象
worksheet=workbook.sheet_by_name("各省市")
5、通过sheet名获得sheet对象
worksheet为excel表sheet名为【各省市】的实例化对象
nrows=worksheet.nrows
6、获取该表的总行数
ncols=worksheet.ncols
7、获取该表的总列数
row_data=worksheet.row_values(n)
8、获取该表第n行的内容
col_data=worksheet.col_values(n)
9、获取该表第n列的内容
cell_value=worksheet.cell_value(i,j)
10、获取该表第i行第j列的单元格内容
xlwt(写操作):
import xlwt
1、引入xlwt模块
book=xlwt.Workbook(encoding="utf-8")
2、创建一个Workbook对象,相当于创建了一个Excel文件
sheet = book.add_sheet('test')
3、创建一个sheet对象,一个sheet对象对应Excel文件中的一张表格。
sheet.write(i, j, '各省市')
4、向sheet表的第i行第j列,写入'各省市'
book.save('Data\\36.xls')
5、保存为Data目录下【36.xls】文件
操作xlsx文件
openpyxl(读操作):
import openpyxl
1、引入openpyxl模块
workbook=openpyxl.load_workbook("36.xlsx")
2、打开[36.xlsx]文件,获取excel文件的workbook(工作簿)对象
names=workbook.sheetnames
worksheet=workbook.worksheets[0]
worksheet=workbook["各省市"]
ws = workbook.active
6、获取当前活跃的worksheet,默认就是第一个worksheet
nrows=worksheet.max_row
7、获取该表的总行数
ncols=worksheet.max_column
8、获取该表的总列数
content_A1= worksheet['A1'].value
9、获取该表A1单元格的内容
content_A1=worksheet.cell(row=1,column=1).value
10、获取该表第1列第1列的内容
openpyxl(写操作):
workbook=openpyxl.Workbook()worksheet = workbook.active
3、获取当前活跃的worksheet,默认就是第一个worksheet
worksheet.title="test"
4、worksheet的名称设置为"test"
worksheet = workbook.create_sheet()
5、创建一个新的sheet表,默认插在工作簿末尾
worksheet.cell(i,j,'空')
6、第i行第j列的值改成'空'
worksheet["B2"]="空"
7、将B2的值改成'空'
worksheet.insert_cols(1)
8、在第一列之前插入一列
worksheet.append(["新增","台湾省"])
9、添加行
workbook.save("Data\\36.xlsx")
10、保存为Data目录下【36.xlsx】文件
pandas处理excel文件
pandas操作:
import pandas as pd
1、引入pandas模块
data = pd.read_excel('36.xls')
2、读取[36.xls]或者[36.xlsx]文件
data = pd.read_csv('36.csv')
3、读取[36.csv]文件
data=data.dropna(subset=['店铺'])
4、过滤掉data店铺列有缺失的数据
data.sort_values("客户网名", inplace=True)
5、将data数据按照客户网名列进行从小到大排序
data = pd.read_csv(36.csv, skiprows = [0,1,2],sep = None, skipfooter = 4)
6、读取[36.csv]文件,前三行和后四行的数据略过
data = data.fillna('空')
7、将data中的空白处填充成'空'
data.drop_duplicates('订单','first',inplace=True)
8、data中的数据,按照【订单】列做去重处理,保留第一条数据
data=pd.DataFrame(data,columns=['订单','仓库'])
9、只保留data中【订单】【仓库】列的数据
data = data[(data[u'展现量'] 0)]
10、只保留【展现量】列中大于0的数据
data= data[data["订单"].str.contains('000')]
11、只保留【订单】列中包含'000'的数据
data= data[data["仓库"]=='正品仓']
12、只保留【仓库】列是'正品仓'的数据
xs= data[data["店铺"]=='南极人']['销售额']
13、获取店铺是南极人的销售额数据
data['订单'] = data['订单'].str[3:7]
14、【订单】列的值只保留4-8个字节的值
data["邮资"] = np.where((data['店铺'].str.contains('T|t')) -(data['仓库'] == '代发仓'), 8, data['邮资'])
15、满足店铺列包含 T 或 t 并且仓库不等于'代发仓'的话,将邮资的值改成8,否则值不变
data = np.array(data).tolist()
16、将data从DataFrame转换成列表
data=pd.DataFrame(data)
17、将列表转换成DataFrame格式
zhan = data[u'展现'].sum().round(2)
18、将data中所有展现列数据求和,并取两位小数
sum=data.groupby(['店铺'])['刷单'].sum()
19、将data中按照店铺对刷单进行求和
counts=data['店铺'].value_counts()
20、将data按照店铺进行计算
avg=data.groupby(['店铺'])['刷单'].mean()
21、将data按照店铺对刷单进行求平均数
count = pd.concat([counts,sum], axis=1, ignore_index=True, sort=True)
22、将counts和sum两个DataFrame进行了组合
count=count.rename(index=str, columns={0: "订单", 1: "成本"})
23、将新生成的DataFrame列名进行修改
data = pd.merge(sum, counts, how='left', left_on='店铺', right_on='店铺')
24、将列表转换成DataFrame格式
from openpyxl import Workbook
wb=Workbook()
ws1=wb.active
data.to_excel('36.xlsx')
wb.close()
25、data完整的写入到关闭过程,执行此操作的时候【36.xlsx】不能是打开状态
excel格式操作
样式处理:
1、打开【36.xlsx】
sheet=workbook.worksheets[0]
2、将第一个sheet对象赋值给sheet
sheet.column_dimensions['A'].width = 20.0
3、将A列的宽度设置为20
sheet.row_dismensions[1].height = 20.0
4、将第一行的行高设置为20
sheet.merge_cells('A1:A2')
5、将sheet表A1和A2单元格合并
sheet.unmerge_cells('A1:A2')
6、将sheet表A1和A2单元格取消合并
sheet.insert_rows(2,2)
7、将sheet表从第2行插入2行
sheet.insert_cols(3,2)
8、将sheet表从第3列插入2列
sheet.delete_rows(2)
9、删除第2行
sheet.delete_cols(3, 2)
10、将sheet表从第3列开始删除2列
from openpyxl.styles import Font, Border, PatternFill, colors, Alignment
11、分别引入字体、边框、图案填充、颜色、对齐方式
sheet.cell(i,j).font = Font(name='Times New Roman', size=14, bold=True, color=colors.WHITE)
12、设置sheet表第 i 行第 j 列的字体
sheet.cell(i,j).alignment = Alignment(horizontal='center', vertical='center')
13、设置sheet表第 i 行第 j 列的字体对齐方式
left, right, top, bottom = [Side(style='thin', color='000000')] * 4sheet.cell(i,j).border = Border(left=left, right=right, top=top, bottom=bottom)
14、引入边框样式并调用
fill = PatternFill("solid", fgColor="1874CD")sheet.cell(1,j).fill = fill
15、引入填充样式,并调用
import xlrd
from openpyxl import Workbook
from openpyxl import load_workbook
workbook=load_workbook(filename='C:/Users/EDZ/Desktop/工作/2021.08.03/大兄弟.xlsx')
sheet=workbook.active
sheet.insert_cols(idx=1)
sheet.merge_cells(A1:A3)
sheet['A1']=['上海','山东','浙江']