您的位置:

分位数回归的详细阐述

一、分位数回归概念

分位数回归是一种经济学中广泛使用的回归方法,它是利用在各个分位数处的条件中位数函数建立的回归模型。不同于普通最小二乘回归只关注模型在均值附近的拟合情况,分位数回归可以对中位数附近的数据和任意其他分位数情况下的数据进行分析。

在分位数回归中,我们可以定义一个分位数q,利用最小化平均损失函数来确定各个分位数处的斜率系数,得到在该分位数下的条件中位数函数。

二、中位数回归和分位数回归的区别

中位数回归的目的是拟合出数据的中位数,而分位数回归可以拟合出在各个分位数的值。在中位数回归中,我们利用最小化绝对误差来寻找中位数;而在分位数回归中,我们利用最小化平均损失函数来确定各个分位数处的斜率系数。

另外,中位数回归有时可能被简单误解为只适用于二分类问题,而分位数回归可以适用于多分类问题。

三、分位数回归的意义

分位数回归可以在斜率系数固定的情况下,比较不同分位数下的条件中位数差异,从而探究不同分位数下的变量对反应变量的影响程度。在经济学中,我们可以用分位数回归方法来探究收入分配问题、贫富差距等社会现象。

四、分位数回归的方法

分位数回归有多种方法,其中最为常用的是基于最小绝对误差的条件中位数估计和基于最小平方的条件平均估计。

在基于最小绝对误差的条件中位数估计中,我们利用L1范数来定义损失函数,得到了一个叫做LAD(Least Absolute Deviations)模型的分位数回归模型。而基于最小平方误差的条件平均估计,则是通过L2范数来定义损失函数,从而得到了一个叫做OLS(Ordinary Least Squares)的回归模型。

import statsmodels.formula.api as smf

# 以0.1为分位数做分位数回归
mod = smf.quantreg('y ~ x', df)
res = mod.fit(q=.1)
res.summary()

五、分位数回归stata

在stata中可以使用qreg命令进行分位数回归。该命令有一个可选参数q,它可以指定用于进行分位数回归的分位数值。例如,我们可以利用下面的stata代码进行0.1分位数回归。

qreg y x, q(0.1)

六、分位数回归通俗理解

假设有一个学生常数学不及格,您作为他的班主任,要想办法找到一个对他有帮助的补习方法。于是您发现,他数学不及格的原因是因为他对于难度较高的题目较难掌握。因此,您决定采用分位数回归的方法,分析难度系数对其成绩的影响程度,从而找到一个最佳的补习方法。

七、分位数回归通俗讲解

分位数回归是一种比普通的最小二乘回归更贴近实际的回归方法。在普通的最小二乘回归中,我们只关注数据在均值附近的拟合情况,而对于任意其他分位数情况下的数据进行分析较为困难。

而在分位数回归中,我们可以确定一个分位数q,从而对中位数附近的数据和其他分位数情况下的数据进行分析。这种方法可以更好地针对分布不均的数据进行建模和预测。

八、分位数回归中什么不可导

分位数回归的代价函数并不是一个可导函数,因此我们在进行最小化平均损失函数的时候,不能使用梯度下降算法等基于导数的算法。而是需要采用类似线性规划的方法进行求解。

九、分位数回归r语言

在r语言中,我们可以使用quantreg包进行分位数回归的拟合和结果输出。下面是一个基于最小绝对误差的条件中位数估计的r语言代码示例。

library(quantreg)

# 以0.1为分位数做分位数回归
mod <- rq(y ~ x, data=df, tau=0.1)
summary(mod)

十、分位数回归模型公式

分位数回归模型公式如下:

$$ median(y|x) = \alpha_0 + \alpha_1 x_1 + \alpha_2 x_2 + \cdots + \alpha_n x_n $$

其中,median(y|x)表示在变量x的某个分位数下y的中位数。

我们可以通过确定不同分位数q,来得到一系列对应于每个分位数的回归系数$\alpha_0, \alpha_1, \alpha_2, \cdots, \alpha_n$。