您的位置:

时间序列分析

一、时间序列的概念

时间序列是指按时间先后顺序排列的一系列数据点。它可以表示任何可度量的现象或行为。

以股票价格为例,我们可以将每天的收盘价放在时间轴上,得到一段时间序列。这个序列可以用来预测未来的股价变化。

通过对时间序列的分析,我们可以了解到某个现象或行为的趋势、周期、季节性等特征,从而做出合理的预测和决策。

二、时间序列分析的方法

1. 基本统计分析

基本统计分析是对时间序列进行最简单的分析,包括均值、中位数、标准差、最大值、最小值等统计指标。通过这些指标的分析,我们可以了解时间序列的分布情况和数据趋势。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 读取数据
data = pd.read_csv('data.csv')

# 计算均值
mean = data.mean()

# 计算标准差
std = data.std()

# 绘制时间序列图
plt.plot(data)
plt.show()

2. 分解法

分解法是将时间序列分解为趋势、周期和随机扰动三个部分。通过对这三个部分的分析可以了解时间序列的各种特征。

from statsmodels.tsa.seasonal import seasonal_decompose

# 进行分解
result = seasonal_decompose(data, model='multiplicative')

# 画出分解图
result.plot()
plt.show()

3. 平稳性检验

平稳性是指时间序列在统计意义下的某些性质不随时间而发生变化。平稳序列的分析相对简单,因此平稳性检验是时间序列分析中非常重要的一部分。

from statsmodels.tsa.stattools import adfuller

# 进行平稳性检验
result = adfuller(data)

# 输出检验结果
print('ADF statistic:', result[0])
print('p-value:', result[1])

4. 模型拟合

模型拟合是指根据已有的时间序列数据,拟合一个数学模型,并用这个模型预测未来的值。

from statsmodels.tsa.arima_model import ARIMA

# 拟合ARIMA模型
model = ARIMA(data, order=(1, 1, 1))
result = model.fit()

# 输出模型参数
print(result.params)

三、时间序列的应用

1. 股票价格预测

利用历史的股票价格数据,可以分析出其趋势、周期和季节性等特征,然后建立一个时间序列模型,根据模型预测未来的股价变化。

import yfinance as yf

# 读取数据
data = yf.download('AAPL', start='2020-01-01', end='2021-01-01')

# 拟合ARIMA模型
model = ARIMA(data['Close'], order=(1, 1, 1))
result = model.fit()

# 预测未来股价
forecast = result.predict(start='2021-01-02', end='2021-02-01')

# 输出预测结果
print(forecast)

2. 风力发电功率预测

利用历史的风力发电功率数据,可以分析出其季节性和年度变化等特征,然后建立一个时间序列模型,根据模型预测未来的发电功率。

import pandas as pd
from statsmodels.tsa.arima_model import ARIMA

# 读取数据
data = pd.read_csv('wind_power.csv')

# 拟合ARIMA模型
model = ARIMA(data['Power'], order=(1, 1, 1))
result = model.fit()

# 预测未来发电功率
forecast = result.predict(start='2022-01-01', end='2022-12-31')

# 输出预测结果
print(forecast)

3. 交通流量预测

利用历史的交通流量数据,可以分析出其周期性和季节性等特征,然后建立一个时间序列模型,根据模型预测未来的交通流量。

import pandas as pd
from statsmodels.tsa.arima_model import ARIMA

# 读取数据
data = pd.read_csv('traffic_flow.csv')

# 拟合ARIMA模型
model = ARIMA(data['Flow'], order=(1, 1, 1))
result = model.fit()

# 预测未来交通流量
forecast = result.predict(start='2022-01-01', end='2022-12-31')

# 输出预测结果
print(forecast)