您的位置:

ACF和PACF在时间序列中的应用

一、ACF和PACF概念

自相关函数(ACF,Autocorrelation Function)是一种时间序列分析方法,在统计学中常常用于寻找时间序列中的循环波动。自相关函数ACF的含义是同一时间序列在不同时间点上的取值之间的相关程度。

部分自相关函数(PACF,Partial Autocorrelation Function) 其实是求解递归的偏相关系数。此概念源于刚才提到的AR(p)模型中的“p”。这里说的“偏”就是指消除其它所有项对第k阶自相关系数的影响。[1]

import pandas as pd
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
from statsmodels.tsa.stattools import acf, pacf

# 创建时间序列
date_rng = pd.date_range(start='1/1/2020', end='1/08/2020', freq='H')
ts = pd.DataFrame(date_rng, columns=['date'])
ts['data'] = pd.to_datetime(ts['date'],errors='coerce')
ts['count'] = ts['date'].dt.hour

# 绘制ACF和PACF图
plot_acf(ts['count'])
plot_pacf(ts['count'])

二、ACF和PACF的用法

在时间序列预测建模中,使用ACF和PACF可以帮助我们选择正确的模型。当ACF和PACF曲线截尾后,我们可以得到一个最佳的ARMA模型。

如果ACF曲线具有截尾性,而PACF曲线具有截尾性,那么就应该采用ARMA模型。具体的含义是,该时间序列可以用ARMA模型中的p阶自回归和q阶移动平均项来拟合。[2]

from statsmodels.tsa.arima_model import ARIMA

# 建立ARIMA模型
model = ARIMA(ts['count'], order=(2, 1, 2))
model_fit = model.fit(disp=0)
print(model_fit.summary())

三、ACF和PACF的局限性

ACF和PACF方法并不能适用于所有类型的时间序列。例如,时间序列中存在趋势和季节性的情况下,将出现“带”现象,因此可能需要使用更高阶的模型。此外,如果时间序列具有噪声,则其自相关或偏自相关包含大量噪声,没有明显的截尾。

在这种情况下,可以考虑使用其他预测建模方法,例如ETS模型、SARIMA模型等等。

四、总结

ACF和PACF是时间序列预测建模中非常重要的工具,可以帮助我们选择正确的ARMA模型。使用这两种方法需要注意时间序列的类型和数据质量,避免“带”现象和噪声的影响。

完整代码参见:

import pandas as pd
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
from statsmodels.tsa.stattools import acf, pacf
from statsmodels.tsa.arima_model import ARIMA

# 创建时间序列
date_rng = pd.date_range(start='1/1/2020', end='1/08/2020', freq='H')
ts = pd.DataFrame(date_rng, columns=['date'])
ts['data'] = pd.to_datetime(ts['date'],errors='coerce')
ts['count'] = ts['date'].dt.hour

# 绘制ACF和PACF图
plot_acf(ts['count'])
plot_pacf(ts['count'])

# 建立ARIMA模型
model = ARIMA(ts['count'], order=(2, 1, 2))
model_fit = model.fit(disp=0)
print(model_fit.summary())

参考文献

[1] 腾讯课堂. 决策树. ACF与PACF相关知识. https://ke.qq.com/course/55475?tuin=305ebb5c

[2] 橘子有时. 【Python时间序列】二、ARIMA模型初步. https://www.cnblogs.com/juzihong/p/9349847.html