时间序列分析

2024-05-17

1. 时间序列分析


时间序列分析

2. (三)时间序列分析的基本方法

1.模型的选择和建模基本步骤
(1)建模基本步骤
1)用观测、调查、取样,取得时间序列动态数据。
2)作相关图,研究变化的趋势和周期,并能发现跳点和拐点。拐点则是指时间序列从上升趋势突然变为下降趋势的点,如果存在拐点,则在建模时必须用不同的模型去分段拟合该时间序列。
3)辨识合适的随机模型,进行曲线拟合。
(2)模型的选择
当利用过去观测值的加权平均来预测未来的观测值时,赋予离得越近的观测值以更多的权,而“老”观测值的权数按指数速度递减,称为指数平滑(exponential smoothing),它能用于纯粹时间序列的情况。
对于短的或简单的时间序列,可用趋势模型和季节模型加上误差来进行拟合。对于平稳时间序列,可用自回归(AR)模型、移动平均(MA)模型或其组合的自回归移动平均(ARMA)模型等来拟合。
一个纯粹的AR模型意味着变量的一个观测值由其以前的p个观测值的线性组合加上随机误差项而成,就像自己对自己回归一样,所以称为自回归模型。
MA模型意味着变量的一个观测值由目前的和先前的n个随机误差的线性的组合。
当观测值多于50个时一般采用ARMA模型。
对于非平稳时间序列,则要先将序列进行差分(Difference,即每一观测值减去其前一观测值或周期值)运算,化为平稳时间序列后再用适当模型去拟合。这种经差分法整合后的ARMA模型称为整合自回归移动平均模型(Autoregressive Integrated Moving Average),简称ARIMA模型(张文彤,2002;薛薇,2005;G.E.P.Box et al.,1994)。
ARIMA模型要求时间序列满足平稳性和可逆性的条件,即序列均值不随着时间增加或减少,序列的方差不随时间变化。但由于我们所关注的地层元素含量变化为有趋势和周期成分的时间序列,都不是平稳的,这就需要对其进行差分来消除这些使序列不平稳的成分。所以我们选择更强有力的ARIMA模型。
2.平稳性和周期性研究
有些数学模型要检验周期性变化是否为平稳性过程,即其统计特性不随时间而变化,我们可根据序列图、自相关函数图、偏自相关函数图和谱密度图等对序列的平稳性和周期性进行识别。当序列图上表现有明显分段特征时可采用分段计算法,若分段求得的每段频谱图基本一致或相似,则认为过程是平稳的,否则是非平稳的。
自相关函数ACF(Autocorrelations function)是描述序列当前观测值与序列前面的观测值之间简单和常规的相关系数;而偏自相关函数PACF(Partial autocorrelations function)是在控制序列其他的影响后,测度序列当前值与某一先前值之间的相关程度。
平稳过程的自相关系数和偏自相关系数只是时间间隔的函数,与时间起点无关,都会以某种方式衰减趋近于0。
当ACF维持许多期的正相关,且ACF的值通常是很缓慢地递减到0,则序列为非平稳型。
序列的自相关-偏自相关函数具有对称性,即反映了周期性变化特征。
3.谱分析
确定性周期函数X(t)(设周期为T)在一定条件下通过傅里叶(Fourier)级数展开可表示成一些不同频率的正弦和余弦函数之和(陈磊等,2001),这里假设为有限项,即:

洞庭湖区第四纪环境地球化学

其中,频率fk=k/T,k=1,2,…,N。
上式表明:如果抛开相位的差别,这类函数的周期变化完全取决于各余弦函数分量的频率和振幅。换句话说,我们可以用下面的函数来表示X(t)的波动特征:

洞庭湖区第四纪环境地球化学

函数p(f)和函数X(t)表达了同样的周期波动,两者实际上是等价的,只不过是从频域和时域两个不同角度来描述而已。称p(f)为X(t)的功率谱密度函数,简称谱密度。它不仅反映了X(t)中各固有分量的周期情况,还同时显示出这些周期分量在整体X(t)中各自的重要性。具体说,在X(t)中各周期分量的对应频率处,谱密度函数图应出现较明显的凸起,分量的振幅越大,峰值越高,对X(t)的整体影响也越大。
事实上,无论问题本身是否具有周期性或不确定性(如连续型随机过程或时间序列)都可以采用类似的方法在频域上加以描述,只是表示的形式和意义比上面要复杂得多。时间序列的谱分析方法就是要通过估计时间序列的谱密度函数,找出序列中的各主要周期分量,通过对各分量的分析达到对时间序列主要周期波动特征的把握。
根据谱分析理论,对一个平稳时间序列{Xt},如果其自协方差函数R(k)满足  |R(k)|<+∞,则其谱密度函数h(f)必存在且与R(k)有傅氏变换关系,即平稳序列 {Xt} 的标准化谱密度p(f)是自相关函数r(k)的傅氏变换。由于p(f)是一个无量纲的相对值,在许多情况下更便于分析和比较。
如何从实际问题所给定的时间序列 {Xt,t=1,2,…,n} 中估计出其谱密度或标准谱密度函数是谱分析要解决的主要问题。本书采用图基-汉宁(Tukey-Hanning)窗谱估计法。

3. 时间序列分析法的定义

根据历史统计资料,总结出电力负荷发展水平与时间先后顺序关系的需电量预测方法。有简单平均法、加权平均法和移动平均法等。

时间序列分析法的定义

4. 时间序列分析

时间序列 概念 :同一现象在不同时间上的相继观察值排列而成的数列
  
 形式上由现象所属的时间和现象在不同时间上的观察值两部分组成
  
 排列的时间可以是年、季度、月...
  
 
  
  
 时间序列的 分类 :
  
 1.绝对数序列:
  
 一系列绝对数按时间顺序排列而成;最基本的表现形式;反映在不同时间上所达到的绝对水平(时期序列,一段时期内总量的排序、时点序列,某一瞬间时点上总量的排序)
  
 2.相对数序列:一系列相对数按时间顺序排列而成
  
 3.平均数序列:一系列平均数按时间顺序排列而成
  
 
  
  
 时间序列的 编制原则 :
  
 时间长短一致
  
 总体范围一致
  
 指标内容一致
  
 计算方法和口径一致
  
 
  
  
  一、时间序列的对比分析 
  
    
  
  水平分析: 
  
 1.发展水平:现象在不同时间上的观察值;说明现象在某一时间上所达到的水平;
  
 2.平均发展水平:现象在不同时间上取值的平均数,又称序时平均;说明现象在一段时间内所达到的一般水平;(不同序列的类型选择不同的计算方法-时期、连续时点(逐日排序)、不等距时点(加权)、等距时点(不等距的特例));
  
 #相对数:两个绝对数相除
  
 #相对数的序时平均数:分子的平均数与分母的平均数相除
  
 3.增长量:报告期水平与基期水平之差,说明现象在观察期内增长的绝对数量
  
 分为逐期增长量(报告期水平与前一期水平之差)与累计增长量(报告期水平和某一固定时期水平之差)--各逐期增长量之和等于最末期的累计增长量
  
 4.平均增长量:各逐期增长量的平均数,等于逐期增长量之和/逐期增长量个数(也就是观察值个数-1)
  
 
  
  
  速度分析: 
  
 1.发展速度:报告期水平与基期水平之比,说明现象在观察期内相对的发展变化程度,
  
 分为环比发展速度(报告期水平和前一期水平之比)与定期发展速度(报告期与某一固定时期水平之比)--各环比发展速度之积等于最末期定期发展速度;
  
 2.增长速度(增长率):增长量与基期水平之比,说明现象的相对增长程度,
  
 等于发展速度-1;分为环比增长速度和定基增长速度;
  
 3.平均发展速度:观察期内各环比发展速度的平均数,说明现象在整个观察期内平均发展变化的程度(几何法算平均数)
  
 4.平均增长速度:等于平均发展速度-1
  
 
  
  
  二、时间序列的趋势分析 
  
 可以采用移动平均、最小二乘法等...
  
 
  
  
  三、季节变动分析 
  
 季节变动:现象在一年内随着季节更换形成的有规律变动;各年变化强度大体相同,且没年重现;
  
 扩展:对一年内由于社会、政治、经济、自然因素影响,形成的以一定时期为周期的有规则的重复变动;
  
 测定目的:确定现象过去的季节变化规律,消除时间序列中的季节因素;
  
 分析原理:将季节变动规律归纳为一种典型的季节模型;季节模型由季节指数所组成;季节指数的平均数等于100%;根据季节指数与其平均数的偏差程度测定季节变动的程度;
  
 
  
  
 季节指数:1.反映季节变动的相对数;2.以全年或季资料的平均数为基础计算的;3.平均数等于100%;4.指数越远离其平均数季节变动程度越大;5.同期平均法和趋势剔除法
  
 
  
  
 同期平均法:
  
 根据原时间序列通过简单平均计算季节指数
  
 假定时间序列没有明显的长期趋势和循环波动
  
 步骤:1.计算同期平均数;2.计算全部数据总季的平均数;3.计算季节指数S=同期平均数/总季平均数
  
 
  
  
 趋势剔除法:
  
 先将时间序列中长期趋势予以消除,在计算季节指数
  
 步骤:1.计算移动平均趋势值Y;2.从序列中剔除趋势值Y/T;3.按上述方法计算季节指数
  
 四项移动平均后再进行二项移动平均(四项做年的去掉季节,二项更为稳定)
  
 
  
  
 季节变动的调整:将季节变动剔除,方法是江源时间序列除以相应的季节指数
  
 
  
  
  四、循环波动分析 
  
 循环波动:近乎规律性的从低到高再从高至低的周而复始的变动;不同于趋势变动,他不是朝着单一方向的持续运动,而是涨落相间的交替波动;不同于季节波动,其变化无固定规律,变动周期多在一年以上,且周期长短不一
  
 目的是探索现象活动的规律性
  
 
  
  
 测定方法:采取剩余法
  
 计算步骤:1.先消除趋势值,求得无长期趋势数据资料;2.再消去季节变动(原始数据/季节指数),求得循环及不规则波动相对数;3.将结果移动平均,以消除不规则波动,即得循环波动值

5. 时间序列分析概述

 时间序列具有如下特点:
   分类:
       五个步骤:特征分析、模型识别、模型参数估计、模型检验、模型应用。
   ​    在进行时间序列建模的过程中,首先要对时间序列的特征有所了解,一般的,从时间序列的 随机性、平稳性和季节性 三个方面进行考虑,其中平稳性尤为重要,对于一个非平稳时间序列,通常需进行平稳化处理后在进行建模,也可以根据特性之间建模。
        单位根检验 是指判断时间序列中是否存在单位根,即对时间序列的平稳性进行检验。可以证明若存在单位根,则序列是不平稳的,常用的单位根检验方法包括:ADF(Augmented Dickey Fuller)检验、PP(Phillips Person)检验、NP(Nelson Plosser)检验等。
   ​       时间序列的模型识别主要包括:确定模型类别和模型阶数两个方面。
   ​           在确定时间序列模型的类别方面,平稳序列样本自相关函数和偏相关函数的拖尾性和截尾性是判断模型类别的基本方法。
       在确定时间序列模型的阶数方面,主要有以下几种定阶方式。
       对时间序列模型的检验分为两大类:模型的显著性检验及模型参数的显著性检验
       时间序列模型的显著性检验主要检验模型的有效性。模型的显著性检验的主要任务是看模型是否充分有效地提取了全部信息,即一个好的模型应该确保残差序列为白噪声,这样确保了再无可利用信息。如果残差是非白噪声,则意味着残差中留有相关信息。
       模型参数的显著性检验,是要检验模型中的每一个参数是否显著异于零,目的是使模型更为精简和准确。如果模型中包含了不显著的参数性,则可以说明一方面参数冗余,另一方面会影响其他参数的估计精度。因此要提出模型中那些不显著的参数。
       利用模型进行预测分析。
    参考:《时间序列模型及预测》    王立柱著;科学出版社 

时间序列分析概述

6. 时间序列分析

时间序列顾名思义即是通常在连续时间上采集的序列数据。例如股票指数数据、营收数据和天气数据等。时间序列分析是利用已知数据使用合适的模型拟合时间序列同时估算相应模型的参数。时间序列分析的模型与方法体现了我们对于时间序列自然属性的理解。同时这些模型方法也能够用于对时间序列进行预测和模拟。
  
 与信号分析类似,时间序列分析的方法也有时间域和频率域的方法;有单变量和多变量方法;有线性方法和非线性方法;连续序列和离散序列。
  
 一般时间序列可以依据变化特征分解为四个部分,即趋势(trend)、季节性(seasonal)、周期性(cyclical)和不规则(irregular)部分。
  
 构建时间序列预测模型的一种重要是方法使用随机过程理论。这与地质统计的分析方法是相同的,只是分析对象不同:时间序列为时间点上的数据而地质统计为空间点上的数据。这里认为时间序列上的数据点为随机变量,整个时间序列为一个随机函数。描述不同时间点上的数据之间的关系,同样要使用自协方差、自相关函数。同时二者同样实在稳态假设之下进行分析,应用中也需要对于数据进行去除趋势等处理使之满足稳态条件。时间序列分析中的自回归模型(AR)相当于地质统计中的简单克里金。

7. 时间序列分析

 在R中生成时间序列的前提是我们将分析对象转成时间序列函数对象,包括观测值、起始时间、种植时间、及周期(月、季度、年)的结构。这些都能通过ts( )函数实现。
   R语言中,对时间序列数据进行分析处理时,使用差分函数要注意:差分函数diff()不带参数名的参数指滞后阶数,也就是与滞后第几阶的数据进行差分。如果要指定差分的阶数,则一定要使用带名称的参数:diff=2。
   例如: sample表示样本数据。
   1、diff(sample,2)表示是对滞后2阶的数据进行差分,一阶差分,等同于: diff(sample,lag=2)
   2、diff(sample,diff=2)才是表示二阶差分
   意:在函数中尽量避免使用没有命名的参数。在《时间序列分析及应用-R语言(第2版)》中,P315,描述到: 我们得到的教训就是,除非完全了解相关参数的位置,否则使用未命名参数是非常危险的。
   截尾是指时间序列的自相关函数(ACF)或偏自相关函数(PACF)在某阶后均为0的性质(比如AR的PACF);
   拖尾是ACF或PACF并不在某阶后均为0的性质(比如AR的ACF)。
    拖尾 :始终有非零取值,不会在k大于某个常数后就恒等于零(或在0附近随机波动)
    截尾 :在大于某个常数k后快速趋于0为k阶截尾
    AR模型:自相关系数拖尾,偏自相关系数截尾; 
    MA模型:自相关系数截尾,偏自相关函数拖尾; 
    ARMA模型:自相关函数和偏自相关函数均拖尾。 
   根据输出结果, 自相关函数图拖尾,偏自相关函数图截尾 ,且n从2或3开始控制在置信区间之内,因而可判定为AR(2)模型或者AR(3)模型。

时间序列分析

8. 时间序列的分析方法

(一)指标分析法
通过时间序列的分析指标来揭示现象的发展变化状况和发展变化程度。
(二)构成因素分析法
通过对影响时间序列的构成因素进行分解分析,揭示现象随时间变化而演变的规律。