详解pd.cut函数

一、pd.cut用法

pd.cut()是一个用于将连续变量转换成离散变量的函数，通俗地说就是将一组数据按照一定的规则自动分成几段，然后用这几段来表示原来的数据。

二、pd.cut函数

pd.cut()函数的基本语法如下：

bins = [bin1, bin2, bin3, ....]
pd.cut(data, bins)

其中data为待分割的数据，bins为分割的规则。bins可以为数字，也可以为序列，如果为数字表示将整个数列分成几段，序列则表示每段指定具体的切分节点。

三、pd.cut函数判断区间

pd.cut()函数判断区间时默认是左开右闭，即分段区间为(left,right]。

四、pd.cut参数

在pd.cut()函数中，还有一些参数可以控制分段的方式，包括：

labels: 分段后每一段的标签。
include_lowest: 是否在最低区间间隔内，加入low_edge（最小值-0.1）。
right: 是否将值视为右限，默认为True。
precision: 仅对小数有效，设定小数的精度。

五、pd.cut左闭右开

控制pd.cut()函数的左闭右开用参数right，在pd.cut()函数中right默认为True，即右侧的区间与前一个区间相邻。

六、pd.cut函数股票

对于股票分组机制，我们通常需要在大量的指标中选择一些比较重要的数据，并按照一定的规则来使每只股票分别处于自己所在的分组，pd.cut()函数有很好的实用效果。

七、pd.cut设置bin

pd.cut()中的bin参数决定了将整个数列分割成几个等分点，bin参数可以是一个整数n，表示将整个数列等分成n等份。也可以是一个列表，表示用这些桶序列来分割数据。

例如，下列代码将序列s分割成5个等分点，生成6个分组：

import pandas as pd
import numpy as np

s = pd.Series(np.random.randn(100))
s = pd.Series(pd.cut(s, 5))
print(s.value_counts())

输出为：

(-2.082, -1.336]     22
(-1.336, -0.596]     35
(-0.596, 0.142]      26
(0.142, 0.881]       10
(0.881, 1.621]        7
dtype: int64

八、pd.cut后按顺序排列

pd.cut()默认会根据边缘数值进行排序。如果要根据切片顺序将结果排序（而不是按峰值），请将参数ordered设置为False。

九、pd.cut什么意思

pd.cut()函数将连续变量离散化成无序的 categorical 变量，是数据处理中的一个非常实用的函数。

十、pd.cut函数给股票分组

了解了pd.cut()函数的基本用法和相关参数，我们可以尝试将其应用到股票分组中，分组取权值的思路大概如下：

按照市值大小将所有股票分为若干组。
每组中按照一定的篇幅分层打分。
最后得到每个股票的大小分数。

实现起来，我们根据市值（net_asset_value）进行排序，将股票分为若干组，从而可以实现个股的分类。

示例代码如下：

import pandas as pd
import numpy as np

# 准备数据
data = pd.read_csv('example.csv')
data = data.sort_values('net_asset_value') # 按市值排序
data = data.reset_index(drop=True)

# 切分并保存分组
data['groups'] = pd.cut(data.index, bins=10, labels=range(10))

# 打分
data['points'] = np.exp(-(data.groups.astype(int) - 4) ** 2)

# 按得分排序并输出
data = data.sort_values('points', ascending=False)
print(data.head())

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

详解pd.cut函数

一、pd.cut用法

二、pd.cut函数

三、pd.cut函数判断区间

四、pd.cut参数

五、pd.cut左闭右开

六、pd.cut函数股票

七、pd.cut设置bin

八、pd.cut后按顺序排列

九、pd.cut什么意思

十、pd.cut函数给股票分组

详解pd.cut函数

详解pd.cut函数：从多个方面分析

java方法整理笔记（java总结）

python基础学习整理笔记,Python课堂笔记

印象笔记记录java学习（Java成长笔记）

java客户端学习笔记（java开发笔记）

发篇java复习笔记（java课程笔记）

java学习笔记（java初学笔记）

java包笔记,Java语言包

我的python笔记06（Python）

java笔记,大学java笔记

python学习之笔记（python的笔记）

java笔记,尚硅谷java笔记

数据库的笔记mysql,数据库管理系统笔记

为知笔记私有化部署

java基础知识学习笔记一,Java基础笔记

重学java笔记,java笔记总结

python笔记二（2python）

最新python学习笔记3,python基础笔记

python基础笔记整理（python基础教程总结）

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

详解pd.cut函数

一、pd.cut用法

二、pd.cut函数

三、pd.cut函数判断区间

四、pd.cut参数

五、pd.cut左闭右开

六、pd.cut函数股票

七、pd.cut设置bin

八、pd.cut后按顺序排列

九、pd.cut什么意思

十、pd.cut函数给股票分组

详解pd.cut函数

详解pd.cut函数：从多个方面分析

java方法整理笔记（java总结）

python基础学习整理笔记,Python课堂笔记

印象笔记记录java学习（Java成长笔记）

java客户端学习笔记（java开发笔记）

发篇java复习笔记（java课程笔记）

java学习笔记（java初学笔记）

java包笔记,Java语言包

我的python笔记06（Python）

java笔记,大学java笔记

python学习之笔记（python的笔记）

java笔记,尚硅谷java笔记

数据库的笔记mysql,数据库管理系统笔记

为知笔记私有化部署

java基础知识学习笔记一,Java基础笔记

重学java笔记,java笔记总结

python笔记二（2python）

最新python学习笔记3,python基础笔记

python基础笔记整理（python基础教程总结）

人机检测，请谅解