本文目录一览：

python对excel操作
python中dataframe怎么修改columns的参数
Python基础命令都有什么？

python对excel操作

Python对于Excel的操作是多种多样的，掌握了相关用法就可以随心所欲的操作数据了！

操作xls文件

xlrd（读操作）：

import xlrd

引入xlrd模块

workbook = xlrd.open_workbook("36.xls")

打开[36.xls]文件，获取excel文件的workbook（工作簿）对象

names = workbook.sheet_names()

获取所有sheet的名字

worksheet = workbook.sheet_by_index(0)

通过sheet索引获得sheet对象 worksheet为excel表第一个sheet表的实例化对象

worksheet = workbook.sheet_by_name("各省市")

通过sheet名获得sheet对象 worksheet为excel表sheet名为【各省市】的实例化对象

nrows = worksheet.nrows

获取该表的总行数

ncols = worksheet.ncols

获取该表的总列数

row_data = worksheet.row_values(n)

获取该表第n行的内容

col_data = worksheet.col_values(n)

获取该表第n列的内容

cell_value = worksheet.cell_value(i, j)

获取该表第i行第j列的单元格内容

xlwt（写操作）：

import xlwt

引入xlwt模块

book = xlwt.Workbook(encoding="utf-8")

创建一个Workbook对象，相当于创建了一个Excel文件

sheet = book.add_sheet('test')

创建一个sheet对象，一个sheet对象对应Excel文件中的一张表格。

sheet.write(i, j, '各省市')

向sheet表的第i行第j列，写入'各省市'

book.save('Data\\36.xls')

操作xlsx文件

openpyxl（读操作）：

import openpyxl

引入openpyxl模块

workbook = openpyxl.load_workbook("36.xlsx")

打开[36.xlsx]文件，获取excel文件的workbook（工作簿）对象

names = workbook.sheetnames

worksheet = workbook.worksheets[0]

worksheet = workbook["各省市"]

ws = workbook.active

获取当前活跃的worksheet,默认就是第一个worksheet

nrows = worksheet.max_row

获取该表的总行数

ncols = worksheet.max_column

获取该表的总列数

content_A1 = worksheet['A1'].value

获取该表A1单元格的内容

content_A1 = worksheet.cell(row=1, column=1).value

获取该表第1列第1列的内容

openpyxl（写操作）：

workbook = openpyxl.Workbook()
worksheet = workbook.active

获取当前活跃的worksheet,默认就是第一个worksheet

worksheet.title = "test"

worksheet的名称设置为"test"

worksheet = workbook.create_sheet()

创建一个新的sheet表，默认插在工作簿末尾

worksheet.cell(i, j, '空')

第i行第j列的值改成'空'

worksheet["B2"] = "空"

将B2的值改成'空'

worksheet.insert_cols(1)

在第一列之前插入一列

worksheet.append(["新增", "台湾省"])

添加行

workbook.save("Data\\36.xlsx")

保存为Data目录下【36.xlsx】文件

pandas处理excel文件

pandas操作：

import pandas as pd

引入pandas模块

data = pd.read_excel('36.xls')

读取[36.xls]或者[36.xlsx]文件

data = pd.read_csv('36.csv')

读取[36.csv]文件

data = data.dropna(subset=['店铺'])

过滤掉data店铺列有缺失的数据

data.sort_values("客户网名", inplace=True)

将data数据按照客户网名列进行从小到大排序

data = pd.read_csv(36.csv, skiprows=[0, 1, 2], sep=None, skipfooter=4)

读取[36.csv]文件，前三行和后四行的数据略过

data = data.fillna('空')

将data中的空白处填充成'空'

data.drop_duplicates('订单', 'first', inplace=True)

data中的数据，按照【订单】列做去重处理，保留第一条数据

data = pd.DataFrame(data, columns=['订单', '仓库'])

只保留data中【订单】【仓库】列的数据

data = data[(data[u'展现量'] > 0)]

只保留【展现量】列中大于0的数据

data = data[data["订单"].str.contains('000')]

只保留【订单】列中包含'000'的数据

data = data[data["仓库"] == '正品仓']

只保留【仓库】列是'正品仓'的数据

xs = data[data["店铺"] == '南极人']['销售额']

获取店铺是南极人的销售额数据

data['订单'] = data['订单'].str[3:7]

【订单】列的值只保留4-8个字节的值

data["邮资"] = np.where((data['店铺'].str.contains('T|t')) & (data['仓库'] != '代发仓'), 8, data['邮资'])

满足店铺列包含 T 或 t 并且仓库不等于'代发仓'的话，将邮资的值改成8，否则值不变

data = np.array(data).tolist()

将data从DataFrame转换成列表

data = pd.DataFrame(data)

将列表转换成DataFrame格式

zhan = data[u'展现'].sum().round(2)

将data中所有展现列数据求和，并取两位小数

sum = data.groupby(['店铺'])['刷单'].sum()

将data中按照店铺对刷单进行求和

counts = data['店铺'].value_counts()

将data按照店铺进行计算

avg = data.groupby(['店铺'])['刷单'].mean()

将data按照店铺对刷单进行求平均数

count = pd.concat([counts, sum], axis=1, ignore_index=True, sort=True)

将counts和sum两个DataFrame进行了组合

count = count.rename(index=str, columns={0: "订单", 1: "成本"})

将新生成的DataFrame列名进行修改

data = pd.merge(sum, counts, how='left', left_on='店铺', right_on='店铺')

将列表转换成DataFrame格式

from openpyxl import Workbook
wb = Workbook()
ws1 = wb.active
data.to_excel('36.xlsx')
wb.close()

data完整的写入到关闭过程，执行此操作的时候【36.xlsx】不能是打开状态

excel格式操作

样式处理：

打开【36.xlsx】

sheet = workbook.worksheets[0]

将第一个sheet对象赋值给sheet

sheet.column_dimensions['A'].width = 20.0

将A列的宽度设置为20

sheet.row_dimensions[1].height = 20.0

将第一行的行高设置为20

sheet.merge_cells('A1:A2')

将sheet表A1和A2单元格合并

sheet.unmerge_cells('A1:A2')

将sheet表A1和A2单元格取消合并

sheet.insert_rows(2, 2)

将sheet表从第2行插入2行

sheet.insert_cols(3, 2)

将sheet表从第3列插入2列

sheet.delete_rows(2)

删除第2行

sheet.delete_cols(3, 2)

将sheet表从第3列开始删除2列

from openpyxl.styles import Font, Border, PatternFill, colors, Alignment

分别引入字体、边框、图案填充、颜色、对齐方式

sheet.cell(i, j).font = Font(name='Times New Roman', size=14, bold=True, color=colors.WHITE)

设置sheet表第 i 行第 j 列的字体

sheet.cell(i, j).alignment = Alignment(horizontal='center', vertical='center')

设置sheet表第 i 行第 j 列的字体对齐方式

left, right, top, bottom = [Side(style='thin', color='000000')] * 4
sheet.cell(i, j).border = Border(left=left, right=right, top=top, bottom=bottom)

引入边框样式并调用

fill = PatternFill("solid", fgColor="1874CD")
sheet.cell(1, j).fill = fill

引入填充样式，并调用

import xlrd
from openpyxl import Workbook
from openpyxl import load_workbook
workbook = load_workbook(filename='C:/Users/EDZ/Desktop/工作/2021.08.03/大兄弟.xlsx')
sheet = workbook.active
sheet.insert_cols(idx=1)
sheet.merge_cells('A1:A3')
sheet['A1'] = ['上海', '山东', '浙江']

python中dataframe怎么修改columns的参数

pandas是python环境下最有名的数据统计包，而DataFrame翻译为数据框，是一种数据组织方式，这么说你可能无法从感性上认识它，举个例子，你大概用过Excel，而它也是一种数据组织和呈现的方式，简单说就是表格，而在在pandas中用DataFrame组织数据，如果你不print DataFrame，你看不到这些数据，下面我们来看看DataFrame是如何使用的。首先是引入pandas和numpy，这是经常配合使用的两个包，pandas依赖于numpy，引入以后我们可以直接使用np/pd来表示这个两个模块先创建一个时间索引，所谓的索引（index)就是每一行数据的id，可以标识每一行的唯一值为了快速入门，我们看一下如何创建一个6X4的数据：randn函数用于创建随机数，参数表示行数和列数，dates是上一步创建的索引列我们还可以使用字典来创建数据框，例如创建一个列名为A的数据框，索引是自动创建的整数这又是一个字典创建DataFrame的例子假如字典内的数据长度不同，以最长的数据为准，比如B列有4行：可以使用dtypes来查看各行的数据格式接着看一下如何查看数据框中的数据，看一下所有的数据使用head查看前几行数据（默认是前5行），不过你可以指定前几行查看前三行数据使用tail查看后5行数据查看数据框的索引查看列名用columns 查看数据值，用values 查看描述性统计，用describe 使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据使用T来转置数据，也就是行列转换对数据进行排序，用到了sort，参数可以指定根据哪一列数据进行排序。

Python基础命令都有什么？

（1）打开csv文件

import pandas as pd
df = pd.read_csv(r'data/data.csv')

（2）dataframe index 重新排序

data = df.sort_index(axis=0, ascending=False)

（3）dataframe 按照某一列进行升序或者降序排列

data = df.sort(['date'], ascending=True)  # 升序，False降序

（4）dataframe 的index重新从0开始

data = data.reset_index(drop=True)

（5）画横坐标是日期的图

import matplotlib.pyplot as plt
x = data['date']  # 日期是字符串形式
y = data['close price']
plt.plot_date(x, y)

（6）求标准差

import numpy as np
np.std

（7）下取整

import math
math.floor

上取整：math.ceil （8）希尔伯特变换

from scipy import fftpack
hx = fftpack.hilbert(price)

（9）值排序

data.order()

（10）差分

data.diff(1)  # 一阶差分

dataframe 删除元素

data.drop(元素位置)

（11）嵌套的array处理方法

import itertools
a = [[1, 2, 3], [4, 5, 6], [7], [8, 9]]
out = list(itertools.chain.from_iterable(a))

（12）dataframe修改列名

data.columns = ['num', 'price']

（13）excel表导入以后有空行解决办法

import numpy as np
data = data.drop(data.loc[np.isnan(data.name.values)].index)

（15）diff用法一.是dataframe或者series格式，直接就用data.diff() 二.是list格式，先转换成转换成list格式data=data.tolist() 然后dif=np.diff(data) （16）dataframe中的日期type不是date格式，不能直接相加减，所以先转换成list格式

t = data.time.tolist()
date_time = datetime.datetime.strptime(str(t), '%Y-%m-%d %H:%M:%S')
date_time = datetime.date(date_time.year, date_time.month, date_time.day)
past = date_time - datetime.timedelta(days=n*365)

（17）符号化

np.sign

（18）字典的使用

label = {'11': 'TP', '1-1': 'FN', '-11': 'FP', '-1-1': 'TN'}
for i in range(len(data1)):
    state = str(int(data1[i])) + str(int(data2[i]))
    result.append(label[state])

（19）用plt画图的时候中文不显示的解决办法

from matplotlib.font_manager import FontProperties
font_set = FontProperties(fname=r"c:\windows\fonts\simsun.ttc", size=15)
plt.title(u'中文', fontproperties=font_set)

（20）获取当前程序运行的时间

from time import time
time1 = time()
time2 = time()
print(time2 - time1)

以上是我找到的资料，对于我这个学习Python到半吊子的人来说也是要收藏起来的。

修改列名的python,如何修改列名