当前位置:文档之家› 对于非平稳时间序列yt,假定经过d次差分之后可表达为一个自回归

对于非平稳时间序列yt,假定经过d次差分之后可表达为一个自回归

对于非平稳时间序列yt,假定经过d次差分之后可表达为一个自回归
对于非平稳时间序列yt,假定经过d次差分之后可表达为一个自回归

时间序列模型

时间序列分析方法由Box-Jenkins (1976) 年提出。它适用于各种领域的时间序列分析。

时间序列模型不同于经济计量模型的两个特点是:

⑴这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。

⑵明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列,再考虑建模问题。

时间序列模型的应用:

(1)研究时间序列本身的变化规律(建立何种结构模型,有无确定性趋势,有无单位根,有无季节性成分,估计参数)。

(2)在回归模型中的应用(预测回归模型中解释变量的值)。

(3)时间序列模型是非经典计量经济学的基础之一(不懂时间序列模型学不好非经典计量经济学)。

分节如下:

1.随机过程、时间序列定义

2.时间序列模型的分类

3.自相关函数与偏自相关函数

4.建模步骤(识别、参数估计、诊断检验、案例分析)

5.回归与时间序列组合模型

6.季节时间序列模型(案例分析)

2.1随机过程、时间序列

为什么在研究时间序列之前先要介绍随机过程?就是要把时间序列的研究提高到理论高度来认识。时间序列不是无源之水。它是由相应随机过程产生的。只有从随机过程的高度认识了它的一般规律。对时间序列的研究才会有指导意义。对时间序列的认识才会更深刻。

自然界中事物变化的过程可以分成两类。一类是确定型过程,一类是非确定型过程。

确定型过程即可以用关于时间t的函数描述的过程。例如,真空中的自由落体运动过程,电容器通过电阻的放电过程,行星的运动过程等。

非确定型过程即不能用一个(或几个)关于时间t的确定性函数描述的过程。换句话说,对同一事物的变化过程独立、重复地进行多次观测而得到的结果是不相同的。例如,对河流水位的测量。其中每一时刻的水位值都是一个随机变量。如果以一年的水位纪录作为实验结果,便得到一个水位关于时间的函数x t。这个水位函数是预先不可确知的。只有通过测量才能得到。而在每年中同一时刻的水位纪录是不相同的。

随机过程:由随机变量组成的一个有序序列称为随机过程,记为{x (s, t) , s∈S , t∈T }。其中S表示样本空间,T表示序数集。对于每一个t, t∈T, x(·, t ) 是样本空间S中的一个随机变量。对于每一个s, s∈S , x (s, ·) 是随机过程在序数集T中的一次实现。

t t

随机过程一般分为两类。一类是离散型的,一类是连续型的。如果一个随机过程{x t}对任意的t∈T 都是一个连续型随机变量,则称此随机过程为连续型随机过程。如果一个随机过程{x t}对任意的t∈T 都是一个离散型随机变量,则称此随机过程为离散型随机过程。本书只考虑离散型随机过程。

连续型严(强)平稳过程

随机过程平稳的

离散型宽平稳过程

非平稳的

严(强)平稳过程:一个随机过程中若随机变量的任意子集的联合分布函数与时间无关,即无论对T的任何时间子集(t1, t 2, …,t n)以及任何实数k, (t i + k) ∈T, i= 1, 2, …,n都有

F( x(t1), x(t2), …, x(t n) )= F(x(t1 + k), x(t2 + k), … , x(t n+ k) )

成立,其中F(·) 表示n个随机变量的联合分布函数,则称其为严平稳过程或强平稳过程。

严平稳意味着随机过程所有存在的矩都不随时间的变化而变化。严平稳的条件是非常严格的,而且对于一个随机过程,上述联合分布函数不便于分析和使用。因此希望给出不象强平稳那样严格的条件。若放松条件,则可以只要求分布的主要参数相同。如只要求从一阶到某阶的矩函数相同。这就引出了宽平稳概念。

如果一个随机过程m阶矩以下的矩的取值全部与时间无关,则称该过程为m阶平稳过程。比如

E[ x(t i) ] = E[ x(t i + k)] =μ< ∞,

Var[x(t i)] = Var[x(t i + k)] =σ2 < ∞,

Cov[x(t i), x(t j)] = Cov[x (t i + k), x (t j+ k)] =σi j2 < ∞,

其中μ, σ 2 和σij2为常数,不随t, (t∈T ); k, ( (t r + k) ∈T, r = i, j ) 变化而变化,则称该随机过程{x t} 为二阶平稳过程(协方差平稳过程)。该过程属于宽平稳过程。

如果严平稳过程的二阶矩为有限常数值,则其一定是宽平稳过程。反之,一个宽平稳过程不一定是严平稳过程。但对于正态随机过程而言,严平稳与宽平稳是一致的。这是因为正态随机过程的联合分布函数完全由均值、方差和协方差所惟一确定。本书简称二阶平稳过程为平稳过程。

时间序列:随机过程的一次实现称为时间序列,也用{x t}或x t表示。

与随机过程相对应,时间序列分类如下,

连续型* (心电图,水位纪录仪,温度纪录仪)

时间序列从相同的时间间隔点上取自连续变化的序列(人口序列)

离散型

一定时间间隔内的累集值(年粮食产量,进出口额序列)

时间序列中的元素称为观测值。{x t}既表示随机过程,也表示时间序列。x t既表示随机过程的元素随即变量,也表示时间序列的元素观测值。在不致引起混淆的情况下,为方便,x t也直接表示随机过程和时间序列。

随机过程与时间序列的关系如下所示:

随机过程: {x1, x2, …, x T-1, x T,}

第1次观测:{x11, x21, …, x T-11, x T1}

第2次观测:{x12, x22, …, x T-12, x T2}

:::::

第n次观测:{x1n, x2n, …, x T-1n, x T n}

某河流一年的水位值,{x1, x2, …, x T-1, x T,},可以看作一个随机过程。每一年的水位纪录则是一个时间序列,{x11, x21, …, x T-11, x T1}。而在每年中同一时刻(如t = 2时)的水位纪录是不相同的。{ x21, x22, …,x2n,} 构成了x2取值的样本空间。

例如,要记录某市日电力消耗量,则每日的电力消耗量就是一个随机变量,于是得到一个日电力消耗量关于天数t的函数。而这些以年为单位的函数族构成了一个随机过程{x t}, t = 1, 2, … 365。因为时间以天为单位,是离散的,所以这个随机过程是离散型随机过程。而一年的日电力消耗量的实际观测值序列就是一个时间序列。

自然科学领域中的许多时间序列常常是平稳的。如工业生产中对液面、压力、温度的控制过程,某地的气温变化过程,某地100年的水文资料,单位时间内路口通过的车辆数过程等。但经济领域中多数宏观经济时间序列却都是非平稳的。如一个国家的年GDP序列,年投资序列,年进出口序列等。

为便于计算,先给出差分定义。

差分:时间序列变量的本期值与其滞后值相减的运算叫差分。差分分为一阶差分和高阶差分。

首先给出差分符号。对于时间序列x t,一阶差分可表示为

x t-x t -1 = ? x t = (1- L) x t= x t- L x t(2.1)

其中?称为一阶差分算子。L称为滞后算子,其定义是L n x t= x t- n。

差分算子和滞后算子可以直接参与运算。

二次一阶差分表示为,

?2x t= ? x t - ? x t -1= (x t - x t -1)–(x t-1 - x t -2) = x t - 2 x t -1+ x t –2,

?2x t= (1- L) 2 x t= (1 – 2L + L 2 ) x t = x t –2 x t-1+x t–2(2.2)

k阶差分可表示为

x t-x t -k = ?k x t = (1- L k ) x t= x t–L k x t

k阶差分常用于季节性数据的差分,如4阶差分、12阶差分。

滞后算子有如下性质。

(1)常数与滞后算子相乘等于常数。Lc = c

(2)滞后算子适用于分配律。(L i + L j) x t= L i x t+ L j x t= x t -i+ x t –j

(3)滞后算子适用于结合律。L i L j x t= L i+j x t= x t -i–j

(4)滞后算子的零次方等于1。L0x t= x t

(5)滞后算子的负整数次方意味着超前。L-i x t= x t+i

下面介绍两种基本的随机过程

(1)白噪声(white noise)过程(file:5gener1,u)

白噪声过程:对于随机过程{ x t, t∈T }, 如果E(x t) = 0, Var (x t) = σ 2 <∞ , t∈T; Cov (x t, x t + k) = 0, (t + k )∈ T , k≠ 0 , 则称{x t}为白噪声过程。

-3

-2

-1

1

23

20406080100120140160180200white noise -4-20

2

420406080140160DJ PY

图2.1a 由白噪声过程产生的时间序列(nrnd ) 图2.1b 日元对美元汇率的收益率序列

图2.1c 白噪声过程的总体谱 2.1d AR(2)过程的总体谱(φ1 = 0.99, φ2 = -0.5)

白噪声是平稳的随机过程,因其均值为零,方差不变,随机变量之间非相关。显然上述白噪声是二阶宽平稳随机过程。如果{x t } 同时还服从正态分布,则它就是一个强平稳的随机过程。

白噪声源于物理学与电学,原指音频和电信号在一定频带中的一种强度不变的干扰声。

(2) 随机游走(random walk )过程(file :5gener1,x1)

对于下面的表达式

x t = x t -1 + u t ( 2.3)

如果u t 为白噪声过程,则称x t 为随机游走过程。

-25

-20

-15

-10

-5

5

20406080100120140160180200random walk 120014001600

18002000

220050100150200250300

图2.1e . 由随机游走过程产生时间序列 图2.1f . 深圳股票综合指数

“随机游走”一词首次出现于1905年自然(Nature )杂志第72卷Pearson K.和Rayleigh L.的一篇通信中。该信件的题目是“随机游走问题”。文中讨论寻找一个被放在野地中央的醉汉的最佳策略是从投放点开始搜索。

随机游走过程的均值为零,方差为无限大。

x t = x t -1 + u t = u t + u t -1 + x t -2 = u t + u t -1 + u t -2 + …

E(x t ) = E(u t + u t -1 + u t -2 + …) = 0,

Var(x t ) = Var(u t + u t -1 + u t -2 + …) = ∑∞-t u 2σ

→ ∞

所以随机游走过程是非平稳的随机过程。

2.2时间序列模型的分类

(1)自回归过程

如果一个剔出均值和确定性成分的线性过程可表达为

x t = φ 1x t -1 + φ 2 x t -2 + … + φ p x t -p + u t , (2.4) 其中φi , i = 1, … p 是自回归参数,u t 是白噪声过程,则称x t 为p 阶自回归过程,用AR(p )表示。x t 是由它的p 个滞后变量的加权和以及u t 相加而成。

若用滞后算子表示

(1- φ 1L - φ 2 L 2 - …- φ p L p ) x t = Φ (L ) x t = u t (2.5) 其中Φ (L ) = 1- φ 1L - φ 2 L 2 - …- φ p L p 称为特征多项式或自回归算子。

与自回归模型常联系在一起的是平稳性问题。对于自回归过程AR(p ),如果其特征方程 Φ (z ) = 1- φ 1 z - φ 2 z 2 - …- φ p z p = (1 – G 1 z ) (1 – G 2 z ) ... (1 – G p z ) = 0 (2.6) 的所有根的绝对值都大于1,则AR(p )是一个平稳的随机过程。

AR(1)过程分析。 -4

-2

2

420406080100120140160180200AR(1)

图2.2 AR(1)过程(file :5gener1,x2)

x t = φ 1 x t -1 + u t (2.7) 保持其平稳性的条件是特征方程

(1 - φ 1 L ) = 0

根的绝对值必须大于1,满足

|1/φ1|> 1

也就是

| φ1| < 1

解释如下:一阶自回归过程,x t = φ 1 x t -1 + u t ,可写为

(1- φ1L ) x t = u t

x t = (1- φ1 L )-1 u t

在 | φ1| < 1条件下,有

x t = (1+ φ1L + (φ1 L ) 2 + (φ1 L ) 3 +…) u t

若保证AR(1)具有平稳性,

∑∞=0i 1i i L φ必须收敛,即φ1必须满足|φ1|< 1。这是容易理解的,如果|φ1|≥1,∑∞

=0i 1i i L φ发散,于是x t 变成一个非平稳随机过程。

由(2.7)式有

x t = u t + φ1 u t -1 + φ12 x t -2 = u t + φ1 u t -1 + φ12 u t -2 +… (短记忆过程)

因为u t 是一个白噪声过程,所以对于平稳的AR(1)过程

E(x t ) = 0

Var (x t ) = σu 2 + φ12 σu 2 + φ14σu 2 +… = 22111

u σφ-

上式也说明若保证x t 平稳,必须保证 | φ1| < 1。

例1:有AR(1) 模型

x t = 0.6 x t -1 + u t 则,(1 - 0.6 L ) x t = u t

x t = L

6.011- u t = (1 + 0.6 L + 0.36 L 2 + 0.216 L 3 + … ) u t = u t + 0.6 u t -1 + 0.36 u t -2 + 0.216 u t -3 + …

上式变换为一个无限阶的移动平均过程。

AR(2)过程分析。

x t = φ 1 x t -1 +φ 2 x t -2 + u t (0)

具有平稳性的条件。

对于AR(2) 过程,特征方程式是

1 - φ 1 L - φ

2 L 2 = 0

上式的两个根是

L 1, L 2 = 2

221124φφφφ-+± 设λ = 1 / L ,则相应的特征方程是。

λ2 - φ 1 λ - φ 2 = 0

其两个根是

λ1, λ2 = 242

211φφφ+ (1)

根λ1, λ2分别与L 1, L 2互为倒数关系。那么AR(2) 模型具有平稳性的条件是 | L 1| > 1, | L 2| > 1(在单位圆外)或

| λ1| < 1, | λ2| < 1 (2)

对于AR(2)模型,求特征方程的根要比AR(1)模型困难得多。下面利用特征方程的根与模型

参数φ 2,φ 1的关系求保证AR(2)过程平稳的φ 2,φ 1的取值条件(或值域)。由 (1) 式得

λ1 + λ2 = 242

211φφφ+++242

211φφφ+-= φ 1 (3)

λ1 λ2 = 4

21φ-44221φφ+ = - φ 2 (4) 利用 (3),(4) 式得

φ 2 + φ 1 = - λ1 λ2 + (λ1 +λ2) = 1 – (1- λ1) (1- λ2 )

φ 2 - φ 1 = - λ1 λ2 - (λ1 +λ2) = 1 – (1+ λ1) (1+ λ2 )

无论 λ1, λ2为实数或共轭复数,由 |λ1| < 1, |λ2| < 1都有 (1± λ1) (1± λ2 ) > 0,从而得

φ 2 + φ 1 < 1 (5)

φ 2 - φ 1 < 1 (6)

由 (2) 和 (4) 式得

-1 < φ 2 < 1 (7)

(5),(6)和 (7) 式是保证AR(2) 过程平稳,回归参数φ 2, φ 1所应具有的条件。若(5)、(6)和 (7) 式成立,则特征方程1- φ 1 L - φ 2 L = 0的根必在单位圆之外。条件 (5),(6)和 (7)给出的区域称为平稳域。是一个三角形区域。见下图阴影部分。

图1 平稳AR(2) 过程φ1, φ2取值域(阴影部分)

回归参数φ 2,φ 1的取值变化分三种情形讨论。(1)当φ 12 + 4φ 2 = 0 时,有 L 1 = L 2为相等实数根。φ2, φ 1取值在图中的抛物线上,称为临界阻尼状态。(2) 当 φ 12 + 4φ 2 > 0 时,L 1, L 2 为不等实数根。φ2, φ1的值位于过阻尼区(自相关函数呈指数衰减)。(3)当 φ 12 + 4φ 2 < 0 时,根为共轭复根。φ 2, φ 1的值位于欠阻尼区(自相关函数呈正弦震荡衰减)。

例2 有AR(2) 模型x t = 0.7 x t -1 - 0.1 x t -2 + u t ,试判别x t 的平稳性。

解:有3种方法。

解法1:(检查φ1, φ2约束条件)

1?φ+2?φ= 0.6,-1?φ+2?φ= -0.8,2

?φ= - 0.1,满足条件(5)(6)(7),所以x t 是平稳的。 解法2:(因式分解求根)

由原式得 (1 - 0.7 L + 0.1 L 2 ) x t = u t 。 特征方程为,

(1 - 0.7 L + 0.1 L 2 ) = 0

(1 - 0.2 L ) (1- 0.5 L ) = 0

特征方程的两个根是,L 1 = 5,L 2 = 2。因为两个根都在单位圆之外,所以x t 是平稳的。

解法3:(观察(φ1, φ2)点是否落在三角区)

从图1看,因为(φ1, φ2)= (0.7, -0.1),落在了AR(2) 过程的平稳域,落在了过阻尼区,所以x t 为平稳过程。

例3:有AR(2) 模型x t = 0.6 x t -1 - 0.1 x t -2 + u t ,试判别x t 的平稳性。

解:

解法1:(检查φ1, φ2约束条件)

1?φ+2?φ= 0.5,-1?φ+2?φ= -0.7,2

?φ= - 0.1,满足条件(5)(6)(7),所以x t 是平稳的。 解法2:(因式分解求根)

由原式得,(1 - 0.6 L + 0.1 L 2 ) x t = u t ,特征方程为,

(1 - 0.6 L + 0.1 L 2 ) = 0

因为特征方程中各项都是实数,所以其虚根必然是共轭的。

[1- (0.3 - 0.1i ) L ] [1- (0.3 + 0.1i ) L ] = 0

特征方程的两个根是, L 1 = i

1.03.01- = )1.03.0)(1.03.0()1.03.0(i i i +-+ = 3 + i , L 2 = i

1.03.01+ = 3 - i , 因为两个根都在单位圆之外,所以x t 是平稳的随机过程。

解法3:(观察(φ1, φ2)点是否落在三角区)

从图1看,因为(φ1, φ2)= (0.6, -0.1),落在了AR(2) 过程的平稳域,落在了欠阻尼区,所以x t 为平稳过程。

例4:有AR(2) 模型x t = 0.7 x t -1 + 0.6 x t -2 + u t ,试判别x t 的平稳性。

解:

解法1:(检查φ1, φ2约束条件)

1?φ+2?φ= 1.3,-1?φ+2?φ= -0.1,2

?φ= 0.6,条件(5)不满足,所以x t 是非平稳的。 解法2:(因式分解求根)

由原式得,(1 - 0.7 L - 0.6 L 2 ) x t = u t ,特征方程为,

(1 - 0.7 z - 0.6 z 2 ) = 0

(1 + 0.5 z ) (1- 1.2 z ) = 0

特征方程的两个根是,z 1 = -2,z 2 = 0.83。因为一个根0.83在单位圆内,所以x t 是一个非平稳的随机过程。

解法3:(观察(φ1, φ2)点是否落在三角区)

从图1看,因为(φ1, φ2)= (0.7, 0.6),落在了AR(2) 过程的非平稳域,所以x t 为非平稳过程。

对于一般的自回归过程AR (p ),特征多项式

Φ (L ) = 1 - φ1 L - φ2 L 2 - … - φp L p = (1 – G 1 L ) (1 – G 2 L ) ... (1 – G p L )

则x t 可表达为

x t = Φ -1 (L ) u t = (L G k -111+L G k -122+… +) -1L

G k p p u t (2.8) 其中k 1, k 2, …, k p 是待定系数。x t 具有平稳性的条件是Φ -1 (L ) 必须收敛,即应有| G i | < 1, i = 1, 2, …, p 。而G 1-1,G 2-1,...,G p -1 是特征方程 Φ(L ) = 0(见 (2.6) 式)的根,所以保证AR(p )具有平稳性的条件是特征方程的全部根必须在单位圆(半径为1)之外,即 |1/G i | >1。由上式可看出一个平稳的AR(p )过程可以转换成一个无限阶的移动平均过程(p 个无穷级数之和)。

保证AR(p ) 过程平稳的一个必要但不充分的条件是p 个自回归系数之和要小于1,即 ∑=p i i 1φ

<1

重新分析随机游走过程。因为 φ1 = 1,所以随机游走过程是一个非平稳的随机过程。

(2) 移动平均过程

如果一个剔出均值和确定性成分的线性随机过程可用下式表达

x t = u t + θ 1 u t –1 +θ 2 u t -2 + … + θ q u t – q

= (1 + θ 1L + θ 2 L 2 + … +θ q L q ) u t = Θ(L ) u t (2.9)

其中θ 1, θ 2, …, θ q 是回归参数,u t 为白噪声过程,则上式称为q 阶移动平均过程,记为MA(q ) 。之所以称“移动平均”,是因为x t 是由q +1个u t 和u t 滞后项的加权和构造而成。“移动”指t 的变化,“平均”指加权和。

由定义知任何一个q 阶移动平均过程都是由q + 1个白噪声变量的加权和组成,所以任何一个移动平均过程都是平稳的。

与移动平均过程相联系的一个重要概念是可逆性。移动平均过程具有可逆性的条件是特征方程。

Θ(z ) = (1 + θ 1 z + θ 2 z 2 + … + θ q z q )= 0 (2.10) 的全部根的绝对值必须大于1。

由 (2.9) 有Θ (L )-1x t = u t 。由于Θ (L ) 可表示为

Θ (L ) = (1 – H 1 L ) ( 1 – H 2 L ) … (1 – H q L )

所以有

Θ (L )-1 =(L H m 111-+L H m 221-+…+HqL

m q -1), (2.11) m i 为待定参数。可见保证MA(q )过程可以转换成一个无限阶自回归过程,即MA(q )具有可

逆性的条件Θ(L )-1收敛。对于 | L | ≤ 1,必须有|H j |<1 或| H j -1| > 1,j = 1,2,…,q 成立。

而H j -1是特征方程Θ (L ) = (1 – H 1 L ) ( 1 – H 2 L ) … (1 – H q L ) = 0的根,所以MA(q )过程具有可逆性的条件是特征方程Θ (L ) = 0的根必须在单位圆之外。(因为x t =Θ (L ) u t 是平稳的,如果变换成Θ (L )-1 x t = u t 后,变得不平稳,显然失去可逆性。)

注意,对于无限阶的移动平均过程

x t =

∑∞=0i (θ i u t -i ) = u t (1+θ1 L + θ2 L 2 +… ) (2.12)

其方差为 Var(x t ) = ∑∞=0i (

θ i 2 Var (u t – i )) = σu 2 ∑∞=0i 2i θ (2.13)

很明显虽然有限阶移动平均过程都是平稳的,但对于无限阶移动平均过程还须另加约束条件才能保证其平稳性。这条件就是{x t }的方差必须为有限值,即

∑∞=0i 2i θ

< ∞

MA(q ) 过程中最常见的是一阶移动平均过程,

x t = (1+ θ 1 L ) u t (2.14) 其具有可逆性的条件是(1 + θ 1L ) = 0的根(绝对值)应大于1,即 |1/θ 1| >1, 或|θ 1|< 1。当|θ1|< 1时,MA(1)过程(2.14)应变换为

u t = (1+ θ 1L ) –1 x t = (1 - θ 1L + θ 12L 2 - θ 13L 3 + …) x t (2.15) 这是一个无限阶的以几何衰减特征为权数的自回归过程。

MA(1)过程分析。

-4-3

-2

-1

1

2

3

20406080100120140160180200MA (1)

图2.3 MA(1)过程(file :5gener1,x5)

E(x t ) = E(u t ) + E(θ 1 u t - 1) = 0

Var(x t ) = Var(u t ) + Var(θ 1 u t – 1) = (1+θ 12 ) σu 2

自回归与移动平均过程的关系

① 一个平稳的AR(p )过程

(1 - φ1L - φ2L 2 -… - φp L p ) x t = u t

可以转换为一个无限阶的移动平均过程,

x t = (1 - φ1L - φ2L 2 -… - φp L p )-1 u t = Φ (L )-1 u t

② 一个可逆的MA(q )过程

x t = (1 + θ 1L + θ 2 L 2 + … +θ q L q ) u t = Θ (L ) u t

可转换成一个无限阶的自回归过程,

(1 + θ 1L + θ 2 L 2 + … +θ q L q )-1 x t = Θ (L ) -1 x t = u t

③对于AR(p )过程只需考虑平稳性问题,条件是Φ (L ) = 0的根(绝对值)必须大于1。不必考虑可逆性问题。

④对于MA(q )过程,只需考虑可逆性问题,条件是Θ (L ) = 0的根(绝对值)必须大于1,不必考虑平稳性问题。

(3)自回归移动平均过程

由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为ARMA(p , q ), 其中p , q 分别表示自回归和移动平均部分的最大阶数。ARMA(p , q ) 的一般表达式是

x t = φ 1x t -1 + φ 2x t -2 +…+φ p x t -p + u t +θ 1u t -1 + θ 2 u t -2 + ...+ θ q u t-q (2.16) 即

(1 - φ 1L - φ 2 L 2 -… - φ p L p ) x t = (1 + θ 1 L + θ 2 L 2+ … +θ q L q ) u t

Φ (L ) x t = Θ (L ) u t (2.17) 其中 Φ (L ) 和 Θ (L ) 分别表示L 的p , q 阶特征多项式。

ARMA(p , q ) 过程的平稳性只依赖于其自回归部分,即Φ (L ) = 0的全部根取值在单位圆之外(绝对值大于1)。其可逆性则只依赖于移动平均部分,即Θ (L ) = 0的根取值应在单位圆之外。 -4

-202

420406080100120140160180200ARMA -30-20

-10

010

20406080100120140160180200ARIMA

图2.4 ARMA(1,1) 过程(file :5gener1,x7) 图2.5 ARIMA(1,1,1) 过程

实际中最常用的是ARMA(1, 1)过程。

x t - φ 1x t -1 = u t +θ 1 u t - 1 (2.18) 或

(1 - φ 1 L )x t =(1 + θ 1 L )u t

很明显只有当 – 1 < φ1 < 1和 –1 < θ 1 < 1 时,上述模型才是平稳的,可逆的。

(4)单整自回归移动平均过程

以上介绍了三种平稳的随机过程。对于ARMA 过程(包括AR 过程),如果特征方程 Φ(L ) = 0 的全部根取值在单位圆之外,则该过程是平稳的;如果若干个或全部根取值在单位圆之内,则该过程是强非平稳的。例如,

x t = 1.3 x t-1 + u t

(特征方程的根 = 1/ 1.3 = 0.77)上式两侧同减 x t -1得

?x t = 0.3 x t-1 + u t

仍然非平稳。除此之外还有第三种情形,即特征方程的若干根取值恰好在单位圆上。这种根称为单位根,这种过程也是非平稳的。下面介绍这种重要的非平稳随机过程。

假设一个随机过程含有d 个单位根,其经过d 次差分之后可以变换为一个平稳的自回归移动平均过程。则该随机过程称为单整自回归移动平均过程。

伯克斯—詹金斯积数十年理论与实践的研究指出,时间序列的非平稳性是多种多样的,然而幸运的是经济时间序列常常具有这种特殊的线性齐次非平稳特性(即参数是线性的,x t 及其滞后项都是一次幂的)。对于一个非季节性经济时间序列常常可以用含有一个或多个单位根的随机过程模型描述。

考虑如下模型

Φ (L )?d y t = Θ (L ) u t (2.19) 其中Φ(L ) 是一个平稳的自回归算子。即Φ (z ) = 0 的根都大于1。Θ (L )表示可逆的移动平均算子。若取

x t = ?d y t (2.20) 则(2.19)可表示为

Φ (L ) x t = Θ (L ) u t (2.21) 说明y t 经过d 次差分之后,可用一个平稳的、可逆的ARMA 过程x t 表示。

随机过程y t 经过d 次差分之后可变换为一个以Φ (L )为p 阶自回归算子,Θ (L )为q 阶移动平均算子的平稳、可逆的随机过程,则称y t 为(p , d , q )阶单整(单积)自回归移动平均过程,记为ARIMA (p , d , q )。这种取名的目的是与以后各章中的称谓相一致。ARIMA 过程也称为综合自回归移动平均过程。其中Φ (L ) ?d 称为广义自回归算子。

(2.19) 是随机过程的一般表达式。当p ≠ 0, d = 0, q ≠ 0 时,(2.19)变成ARMA (p , q )过程,d = 0, p = 0, q ≠ 0时,ARIMA 过程变成AM(q )过程;而当 p = d = q = 0时,ARIMA 过程变成白噪声过程。

做?d y t = x t 的逆运算

y t = S d x t (2.22) 其中S 是无限累加(积分)算子。当d = 1 时,S x t 定义如下

S x t =

∑-∞=t i i x = (1 + L + L 2 + …)x t = (1 – L )-1 x t = ?-1 x t = y t . (2.23)

S = (1 – L )-1 = ?-1 (2.24) 单整(单积)与差分互为逆运算。

例5:以y t = y t -1 + x t , y 0 = 0为例,{x t }中元素的逐步叠加,得到的是{ y t }序列。而y t 的差分运算得到的是{x t }序列。

y 1 = x 1

y 2 = x 2 + x 1

y 3 = x 3 +x 2 + x 1

y t -1 = x t -1 + … + x 3 +x 2 + x 1

y t = x t + x t -1 +… + x 3 +x 2 + x 1

可见S 是?的逆运算。(2.23)表明随机过程x t 经过逐步叠加之后可以得到y t 。每次叠加类

似于连续函数的一次积分,这就是为什么称AR1MA 过程为单整自回归移动平均过程。“单整”在这里就是积分的意思。

现在容易理解,随机游走过程(2.3)就是由白噪声过程累加一次而得到的。

给出若干具体的非平稳随机过程如下:

1. ARIMA (0, 1, 1)过程

?y t = u t +θ 1 u t –1 = (1 + θ 1L )u t

其中p = 0,d = 1,q = 1,Φ (L ) = 1,Θ (L ) = 1+θ 1 L 。

2. ARIMA(1, 1, 0)过程

?y t - φ1?y t – 1 = u t

其中p = 1,d = 1,q = 0,Φ (L ) = 1 - φ1 L ,Θ (L ) = 1。

3.ARIMA(1,1,1)过程

?y t - φ1?y t -1 = u t + θ 1 u t -1

(1 - φ1 L )?y t – 1= (1 + θ 1L ) u t

其中 p = 1, d = 1, q = 1,Φ (L ) = 1 - φ1 L ,Θ (L ) = 1+ θ 1 L 。

对于非季节经济时间序列p , d , q 的取值很少有大于2的情景。这些参数的常见取值是0、1和2。

(5)Wold 分解定理:任何协方差平稳过程x t ,都可以被表示为

x t - μ - d t = u t + ψ1 u t -1+ ψ2 u t -2 + … + = ∑∞=-0j j t j u ψ

其中μ 表示x t 的期望。d t 表示x t 的线性确定性成分,如周期性成分、时间t 的多项式和指数形式等,可以直接用x t 的滞后值预测。ψ0 = 1,

∑∞

=02j j ψ< ∞。u t 为白噪声过程。u t 表示用x t 的滞后项预测x t 时的误差。

u t = x t - E(x t | x t -1, x t -2 , …) ∑∞

=-0j j t j u ψ称为x t 的线性非确定性成分。当d t = 0时,称x t 为纯线性非确定性过程。 Wold 分解定理由Wold 在1938年提出。Wold 分解定理只要求过程2阶平稳即可。从原理上讲,要得到过程的Wold 分解,就必须知道无限个ψj 参数,这对于一个有限样本来说是不可能的。实际中可以对ψj 做另一种假定,即可以把ψ (L )看作是2个有限特征多项式的比,

ψ(L ) =∑∞=0j j

j L ψ=)()(L L ΦΘ=p p q q L L L L L L φφφθθθ++++++++...1...1221221 注意,无论原序列中含有何种确定性成分,在前面介绍的模型种类和后面介绍的自相关函数、偏自相关函数中都假设在原序列中已经剔除了所有确定性成分,是一个纯的随机过程(过程中不含有任何确定性成分)。如果一个序列如上式,

x t = μ + d t + u t + ψ1 u t -1+ ψ2 u t -2 + … +

则所有研究都是在(x t - μ - d t )的基础上进行。例如前面给出的各类模型中都不含有均值项、时间趋势项就是这个道理。

下面以漂移项非零的平稳过程为例,介绍漂移项与均值的关系。设有漂移项的平稳

ARMA(2,1)过程如下,

x t = 0.05 + 0.2 x t-1 + 0.4x t-2 + u t + 0.3 u t-1(2.27)

漂移项等于0.05。则x t的期望是

E(x t)-0.2 E(x t-1)-0.4 E(x t-2) = (1- 0.2 -0.4)E(x t) = Φ(1)E(x t) =0.05

μ = E(x t) =0.05 /Φ(1) = 0.05 /(1- 0.2 -0.4) =0.05 /0.4 = 0.125 (2.28)

其中0.05是漂移项,0.4 = (1- 0.2 -0.4) =Φ(1) 是自回归特征多项式当L=1时的值。这就是漂移项与均值的关系。(2.27)式可以表示为

(x t -0.125)= 0.2 (x t-1 -0.125)+ 0.4 (x t-2 -0.125) + u t + 0.3 u t-1(2.29)

这是因为上式化简后得

x t = 0.125 (1- 0.2 -0.4) + 0.2 x t-1 + 0.4x t-2 + u t + 0.3 u t-1

= 0.05 + 0.2 x t-1 + 0.4x t-2 + u t + 0.3 u t-1(2.30)

与(2.27)式相同,所以有关系式Φ(1)μ = (1- 0.2 -0.4) 0.125 = 0.05 = α。

比较(2.27)和(2.29)式,可见结论,任何漂移项非零的平稳过程都可以通过对序列先退均值,然后建立ARMA模型研究。所以前面给出的四类模型不失一般性。

下图是y和y+8两个序列的时序图。序列y+8当然可以通过先减均值,然后对y建立模型。因为序列y和y+8的结构相同,只不过均值相异而已。

用一般表达式叙述这个问题。设有漂移项非零的平稳ARMA(p,q)过程如下,Φ(L) x t = α+Θ(L) u t(2.31)

则过程x t的期望是

E(x t) = α /Φ(1) = α /(1- φ1- φ2 -… - φp) = μ(2.32)

这就是漂移项与均值的关系。(2.31)式可以表示为

Φ(L) (x t - μ) = Θ(L) u t(2.33)

这是因为上式可以写为

Φ(L) x t = Φ(1)μ +Θ(L) u t = α+Θ(L) u t (2.30)

其中根据(2.32)式,有Φ(1)μ =α。

(2.31)与(2.33)式等价,所以任何漂移项非零的平稳过程都可以通过对序列先退均值(或确定性成分),然后建立ARMA模型研究。前面给出的四类模型不失一般性。

如何判别其是自回归过程还是移动平均过程?如何判别其过程的阶数呢?如何通过一个时间序列研究其过程的平稳性呢?

-4

-20

2420406080100120140160180200AR(1) -4-3

-2

-1

1

2

3

20406080100120140160180200MA (1)

统计学第四版贾俊平人大_回归与时间序列stata

回归分析与时间序列 一、一元线性回归 11.1 (1)编辑数据集,命名为linehuigui1.dat 输入命令scatter cost product,xlabel(#10, grid) ylabel(#10, grid),得到如下散点图,可以看到,产量和生产费用是正线性相关的关系。 (2)输入命令reg cost product,得到如下图: 可得线性函数(product为自变量,cost为因变量):y=0.4206832x+124.15,即β0=124.15,β1=0.4206832 (3)对相关系数的显著性进行检验,可输入命令pwcorr cost product, sig star(.05) print(.05),得到下图:

可见,在α=0.05的显著性水平下,P=0.0000<α=0.05,故拒绝原假设,即产量和生产费用之间存在显著的正相关性。 11.2 (1)编辑数据集,命名为linehuigui2.dat 输入命令scatter fenshu time,xlabel(#4, grid) ylabel(#4, grid),得到如下散点图,可以看到,分数和复习时间是正线性相关的关系。 2)输入命令cor fenshu time计算相关系数,得下图: 可见,r=0.8621,可见分数和复习时间之间存在高度的正相关性。 11.3 (1)(2)对于线性回归方程y=10-0.5x,其中β0=10,表示回归直线的截距为10;β1=-0.5,表示x变化一单位引起y的变化为-0.5。 (3)x=6时,E(y)=10-0.5*6=7。 11.4 (1) ,判定系数 测度了回归直线对观测数据的拟合程度,即在分数的变差中,有90%可以由分数与复习时间之间的线性关系解释,或者说,在分数取值的变动中,

时间序列分析_最经典的

【时间简“识”】 说明:本文摘自于经管之家(原人大经济论坛) 作者:胖胖小龟宝。原版请到经管之家(原人大经济论坛) 查看。 1.带你看看时间序列的简史 现在前面的话—— 时间序列作为一门统计学,经济学相结合的学科,在我们论坛,特别是五区计量经济学中是热门讨论话题。本月楼主推出新的系列专题——时间简“识”,旨在对时间序列方面进行知识扫盲(扫盲,仅仅扫盲而已……),同时也想借此吸引一些专业人士能够协助讨论和帮助大家解疑答惑。 在统计学的必修课里,时间序列估计是遭吐槽的重点科目了,其理论性强,虽然应用领域十分广泛,但往往在实际操作中会遇到很多“令人发指”的问题。所以本帖就从基础开始,为大家絮叨絮叨那些关于“时间”的故事!

Long long ago,有多long?估计大概7000年前吧,古埃及人把尼罗河涨落的情况逐天记录下来,这一记录也就被我们称作所谓的时间序列。记录这个河流涨落有什么意义?当时的人们并不是随手一记,而是对这个时间序列进行了长期的观察。结果,他们发现尼罗河的涨落非常有规律。掌握了尼罗河泛滥的规律,这帮助了古埃及对农耕和居所有了规划,使农业迅速发展,从而创建了埃及灿烂的史前文明。 好~~从上面那个故事我们看到了 1、时间序列的定义——按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。 2、时间序列分析的定义——对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。 既然有了序列,那怎么拿来分析呢? 时间序列分析方法分为描述性时序分析和统计时序分析。 1、描述性时序分析——通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析 ?描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。

非线性时间序列

近代时间序列分析选讲: 一. 非线性时间序列 二. GARCH模型 三. 多元时间序列 四. 协整模型

非线性时间序列 第一章.非线性时间序列浅释 1.从线性到非线性自回归模型 2.线性时间序列定义的多样性第二章. 非线性时间序列模型 1. 概述 2. 非线性自回归模型 3.带条件异方差的自回归模型 4.两种可逆性 5.时间序列与伪随机数 第三章.马尔可夫链与AR模型 1. 马尔可夫链 2. AR模型所确定的马尔可夫链 3. 若干例子 第四章. 统计建模方法 1. 概论 2. 线性性检验 3.AR模型参数估计 4.AR模型阶数估计 第五章. 实例和展望 1. 实例 2.展望

第一章.非线性时间序列浅释 1. 从线性到非线性自回归模型 时间序列{x t}是一串随机变量序列, 它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明. 考查一阶线性自回归模型---LAR(1): x t=αx t-1+e t, t=1,2,…(1.1) 其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到 x t=αx t-1+e t = e t + αx t-1 = e t + α{ e t-1 + αx t-2} = e t + αe t-1 + α2 x t-2 =… = e t + αe t-1 + α2e t-2

+…+ αn-1e t-n+1 +αn x t-n. (1.2) 如果当n→∞时, αn x t-n→0, (1.3) {e t+αe t-1+α2e t-2+…+αn-1e t-n+1} →∑j=0∞αj e t-j . (1.4) 虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为 x t=∑j=0∞αj e t-j . (1.5) 通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p阶线性自回归模型LAR(p):

平稳时间序列预测法

第七章 平稳时间序列预测法 基本内容 一、概述 1、 时间序列{}t y 取自某一个随机过程,如果此随机过程的随机特征不随时间变化,则我们称 过程是平稳的;假如该随机过程的随机特征随时间变化,则称过程是非平稳的。 2、 宽平稳时间序列的定义:设时间序列{}t y ,对于任意的t ,k 和m ,满足: ()()m t t y E y E += ()()k m t m t k t t y y y y ++++=,cov ,cov 则称{}t y 宽平稳。 3、Box-Jenkins 方法是一种理论较为完善的统计预测方法。他们的工作为实际工作者提供了对时间序列进行分析、预测,以及对ARMA 模型识别、估计和诊断的系统方法。使ARMA 模型的建立有了一套完整、正规、结构化的建模方法,并且具有统计上的完善性和牢固的理论基础。 4、ARMA 模型三种基本形式:自回归模型(AR :Auto-regressive ),移动平均模型(MA : Moving-Average )和混合模型(ARMA :Auto-regressive Moving-Average )。 (1) 自回归模型AR(p):如果时间序列{}t y 满足t p t p t t y y y εφφ+++=-- (11) 其中{}t ε是独立同分布的随机变量序列,且满足: ()0=t E ε,()02>=εσεt Var 则称时间序列{}t y 服从p 阶自回归模型。或者记为()k t t y y B -=φ。 平稳条件:滞后算子多项式()p p B B B φφφ++-=...11的根均在单位圆外,即 ()0=B φ的根大于1。 (2) 移动平均模型MA(q):如果时间序列{}t y 满足q t q t t t y -----=εθεθε...11 则称时间序列{}t y 服从q 阶移动平均模型。或者记为()t t B y εθ=。 平稳条件:任何条件下都平稳。 (3) ARMA(p,q)模型:如果时间序列{}t y 满足 q t q t t p t p t t y y y -------+++=εθεθεφφ (1111) 则称时间序列{}t y 服从(p,q)阶自回归移动平均模型。或者记为()()t t B y B εθφ=。

运用stata进行时间序列分析

运用stata进行时间序列分析 1 时间序列模型结构模型虽然有助于人们理解变量之间的影响关系,但模型的预测精度比较低。在一些大规模的联立方程中,情况更是如此。而早期的单变量时间序列模型有较少的参数却可以得到非常精确的预测,因此随着Box and Jenkins(1984)等奠基性的研究,时间序列方法得到迅速发展。从单变量时间序列到多元时间序列模型,从平稳过程到非平稳过程,时间序列分析方法被广泛应用于经济、气象和过程控制等领域。本章将介绍如下时间序列分析方法,ARIMA模型、ARCH族模型、 VAR模型、VEC模型、单位根检验及协整检验等。 一、基本命令 1.1时间序列数据的处理 1)声明时间序列:tsset 命令 use gnp96.dta, clear list in 1/20 gen Lgnp = L.gnp tsset date list in 1/20 gen Lgnp = L.gnp 2)检查是否有断点:tsreport, report use gnp96.dta, clear tsset date tsreport, report drop in 10/10 list in 1/12 tsreport, report tsreport, report list /*列出存在断点的样本信息*/ 3)填充缺漏值:tsfill tsfill tsreport, report list list in 1/12 4)追加样本:tsappend use gnp96.dta, clear tsset date list in -10/-1 sum tsappend , add(5) /*追加5个观察值*/ list in -10/-1 sum 2 5)应用:样本外预测: predict reg gnp96 L.gnp96 predict gnp_hat list in -10/-1 6)清除时间标识: tsset, clear tsset, clear 1.2变量的生成与处理 1)滞后项、超前项和差分项 help tsvarlist use gnp96.dta, clear tsset date gen Lgnp = L.gnp96 /*一阶滞后*/ gen L2gnp = L2.gnp96 gen Fgnp = F.gnp96 /*一阶超前*/ gen F2gnp = F2.gnp96 gen Dgnp = D.gnp96 /*一阶差分*/ gen D2gnp = D2.gnp96 list in 1/10 list in -10/-1 2)产生增长率变量: 对数差分 gen lngnp = ln(gnp96) gen growth = D.lngnp gen growth2 = (gnp96-L.gnp96)/L.gnp96 gen diff = growth - growth2 /*表明对数差分和变量的增长率差别很小*/ list date gnp96 lngnp growth* diff in 1/10 1.3日期的处理日期的格式 help tsfmt 基本时点:整数数值,如 -3, -2, -1, 0, 1, 2, 3 .... 1960年1月1日,取值为 0; 3 显示格式: 定义含义默认格式%td 日%tdDlCY %tw 周%twCY!ww %tm 月 %tmCY!mn %tq 季度 %tqCY!qq %th 半年 %thCY!hh %ty 年 %tyCY 1)使用tsset 命令指定显示格式 use B6_tsset.dta, clear tsset t, daily list use B6_tsset.dta, clear tsset t, weekly list 2)指定起始时点 cap drop month generate month = m(1990-1) + _n - 1 format month %tm list t month in 1/20 cap drop year gen year = y(1952) + _n - 1 format year %ty list t year in 1/20 3)自己设定不同的显示格式日期的显示格式 %d (%td) 定义如下: %[-][t]d<描述特定的显示格式> 具体项目释义: “<描述特定的显示格式>”中可包含如下字母或字符 c y m l n d j h q w _ . , : - / ' !c C Y M L N D J W 定义如下: c an d C 世纪值(个位数不附加/附加0)

非线性时间序列模型的波动性建模(中)

非线性时间序列模型的波动性建模 Song-Yon Kim and Mun-Chol Kim 朝鲜平壤金日成综合大学数学学院 本文出自于2011年5日朝鲜平壤举行的第一届PUST国际会议 本版修订于2013年11月3日 摘要:在本文中的非线性时间序列模型被用来描述金融时间序列数据的波动。描述两种由波动的非线性时间序列组合成TAR(阈值自回归模型)与AARCH(非对称自回归条件异方差 模型)的误差项和参数估计的研究。 关键词:非线性时间序列模型;波动;ARCH(自回归条件异方差模型);AARCH;TAR;QMLE(拟极大似然估计) 一介绍 在金融市场中,资产价格的波动是一个极其重要的变量,其建模在投资,货币政策,金融风险管理等方面中有重要意义 在投资持有期的资产价格波动的一个很好的预测是评价投资风险的一个很好的起点。资产价格波动是金融衍生证券定价的最重要的变量。对于定价我们需要知道的波动性范围是从现在相关资产,直至期权到期。事实上,市场惯例是根据波动单位列出价格期权。如今,波动性的定义和测量可能在衍生工具合约明确规定。在这些新的合同,波动成为潜在的“资产”。波动率模型已成为一个在金融时间序列模型分析的主要对象并且使许多科学家沉浸其中。

其中σ称为波动,在上面的公式中所示,σ准确估计成为期权定价和估计的一个非常重要的问题。此外,如对关联时间t 的波动σt 的估计等问题开始提出。 1982,罗伯特恩格尔提出了一个新的模型来用一个更准确的方法[ 7 ]对波动作出估计。他重视ARCH 模型中的误差项,这是大多线性时间序列模型如AR 、ARMA 、ARIMA 等所忽略的。同时他提出一种新的非线性模型,通过相加取代简单的白噪声,误差项的条件异方差性偏差的变化自动回归。误差项的条件异方差性偏差的 自动回归 1986年,Bollerslev 将Engle 的 ARCH (q)模型修改变为GARCH (p, q) model [8]. ???? ???++==∑∑==--q i p i i t i i t i t t t t t h h d i i z h z 112021..:,βεααε 在他的论文中,他提出了GARCH (1,1)过程中的存在,静止状态和MLE (最大似然估计)。 此后,大量ARCH 模型相继被开发出来,例如ARCH-M ,IGARCH 和LogGARCH 等。 在整个研究中,波动性已被证明是更受“坏消息”,而不是“好消息”的影响,也就是说,是不对称的,这导致对非对称模型的研究。 1991年,Nelson 提出了指数GARCH 模型(EGARCH )描述了不对称冲击。[ 6 ] () ()()x E x x x g g h t t t -+=-+-+=λωεγγ11h 10 但在许多研究论文,有效的参数估计和固定的条件是没有明确解释的,而且这种困难难以克服[ 9 ]。 但在1993,Glosten 开始使用阈值自回归条件异方差(TARCH )模型和其后提出的许多非对称模型[ 2 ],试图对不对称的波动进行建模。 特别是在2003年,Wai Mi Bei 开发了非对称ARCH (q )模型[ 10 ]。 ()∑∑==---+++=q i p j j t j i t i i t i t h 1120H γεβεαα 直到现在,持续的研究正在努力拟出更好的波动模型以显示各种ARCH 模型的影响。 在本文中,利用非线性时间序列模型的波动性建模是基于对前人研究成果分析的观察而得出。

非线性时间序列.doc

-------------精选文档 ----------------- 近代时间序列分析选讲: 一. 非线性时间序列 二. GARCH 模型 三. 多元时间序列 四. 协整模型

-------------精选文档 ----------------- 非线性时间序列 第一章 .非线性时间序列浅释 1.从线性到非线性自回归模型 2.线性时间序列定义的多样性第二章 . 非线性时间序列模型 1.概述 2.非线性自回归模型 3.带条件异方差的自回归模型 4.两种可逆性 5.时间序列与伪随机数 第三章 . 马尔可夫链与 AR 模型 1.马尔可夫链 2.AR 模型所确定的马尔可夫链

-------------精选文档 ----------------- 3.若干例子 第四章 . 统计建模方法 1.概论 2.线性性检验 3.AR 模型参数估计 4.AR 模型阶数估计 第五章 . 实例和展望 1.实例 2.展望 第一章 .非线性时间序列浅释 1.从线性到非线性自回归模型 时间序列 {x t } 是一串随机变量序列 , 它有广泛的实际背景 , 特别是在经济与金融

-------------精选文档 ----------------- 领域中尤其显著. 关于它们的从线性与非线 性概念 , 可从以下的例子入手作一浅释的说 明. 考查一阶线性自回归模型---LAR(1): x t = x t-1 +e t ,t=1,2, (1.1) 其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且e t与 {x t-1 ,x t-1 ,} 独立 . 反复使用 (1.1) 式的递推关系 , 就可得到 x t =x t-1 +e t =e =e =e t t t +x t-1 +{ e t-1 +x t-2 } +e t-1 + 2 x t-2

时间序列模型stata 基本命令汇总..

时间序列模型 结构模型虽然有助于人们理解变量之间的影响关系,但模型的预测精度比较低。在一些大规模的联立方程中,情况更是如此。而早期的单变量时间序列模型有较少的参数却可以得到非常精确的预测,因此随着Box and Jenkins(1984)等奠基性的研究,时间序列方法得到迅速发展。从单变量时间序列到多元时间序列模型,从平稳过程到非平稳过程,时间序列分析方法被广泛应用于经济、气象和过程控制等领域。本章将介绍如下时间序列分析方法,ARIMA模型、ARCH族模型、VAR模型、VEC模型、单位根检验及协整检验等。 一、基本命令 1.1时间序列数据的处理 1)声明时间序列:tsset 命令 use gnp96.dta, clear list in 1/20 gen Lgnp = L.gnp tsset date list in 1/20 gen Lgnp = L.gnp 2)检查是否有断点:tsreport, report use gnp96.dta, clear tsset date tsreport, report drop in 10/10 list in 1/12 tsreport, report tsreport, report list /*列出存在断点的样本信息*/ 3)填充缺漏值:tsfill tsfill tsreport, report list list in 1/12 4)追加样本:tsappend use gnp96.dta, clear tsset date list in -10/-1 sum tsappend , add(5) /*追加5个观察值*/ list in -10/-1 sum

(整理)Excel时间序列预测操作.

时间序列分析预测EXCEL操作 一、长期趋势(T)的测定预测方法 线性趋势→:: 用回归法 非线性趋势中的“指数曲线”:用指数函数LOGEST、增长函数GROWTH(针对指数曲线) 多阶曲线(多项式):用回归法 (一)回归模型法-------长期趋势(线性或非线性)模型法: 具体操作过程:在EXCEL中点击“工具”→“数据分析”→“回归”→分别在“Y值输入区域”和“X值输入区域”输人数据和列序号的单元格区域一选择需要的输出项目,如“线性拟合图”。回归分析工具的输出解释: 计算结果共分为三个模块: 1)回归统计表: Multiple R(复相关系数R):R2的平方根,又称为相关系数,它用来衡量变量xy之间相关程度的大小。R Square(复测定系数R2 ):用来说明用自变量解释因变量变差的程度,以测量同因变量y的拟合效果。Adjusted R Square (调整复测定系数R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型。 标准误差:又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有

关的其他统计量,此值越小,说明拟合程度越好。 2)方差分析表:方差分析表的主要作用是通过F检验来判断回归模型的回归效果。 3)回归参数:回归参数表是表中最后一个部分: ?Intercept:截距a ?第二、三行:a (截距) 和b (斜率)的各项指标。 ?第二列:回归系数a (截距)和b (斜率)的值。 ?第三列:回归系数的标准误差 ?第四列:根据原假设Ho:a=b=0计算的样本统计量t的值。 第五列:各个回归系数的p值(双侧) 第六列:a和b 95%的置信区间的上下限。 (二)使用指数函数LOGEST和增长函数GROWTH进行非线性预测 在Excel中,有一个专用于指数曲线回归分析的LOGEST函数,其线性化的全部计算过程都是自动完成的。如果因变量随自变量的增加而相应增加,且增加的幅度逐渐加大;或者因变量随自变量的增加而相应减少,且减少的幅度逐渐缩小,就可以断定其为指数曲线类型。 具体操作过程: 1.使用LOGEST函数计算回归统计量 ①打开“第3章时间数列分析与预测.xls”工作簿,选择“增长曲线”工作表如下图所示。 ②选择E2:F6区域,单击工具栏中的“粘贴函数”快捷键,弹出“粘贴函数”对话框,在“函数分类”中选择 “统计”,在“函数名”中选择“LOGEST”函数,则打开LOGEST对话框,如下图11.20所示。

平稳时间序列预测法

7 平稳时间序列预测法 7.1 概述 7.2 时间序列的自相关分析 7.3 单位根检验和协整检验 7.4 ARMA模型的建模 回总目录 7.1 概述 时间序列取自某一个随机过程,则称: 一、平稳时间序列 过程是平稳的――随机过程的随机特征不随时间变化而变化过程是非平稳的――随机过程的随机特征随时间变化而变化回总目录 回本章目录 宽平稳时间序列的定义: 设时间序列 ,对于任意的t,k和m,满足: 则称宽平稳。 回总目录

回本章目录 Box-Jenkins方法是一种理论较为完善的统计预测方法。 他们的工作为实际工作者提供了对时间序列进行分析、预测,以及对ARMA模型识别、估计和诊断的系统方 法。使ARMA模型的建立有了一套完整、正规、结构 化的建模方法,并且具有统计上的完善性和牢固的理 论基础。 ARMA模型是描述平稳随机序列的最常用的一种模型; 回总目录 回本章目录 ARMA模型三种基本形式: 自回归模型(AR:Auto-regressive); 移动平均模型(MA:Moving-Average); 混合模型(ARMA:Auto-regressive Moving-Average)。回总目录 回本章目录 如果时间序列满足 其中是独立同分布的随机变量序列,且满足:

则称时间序列服从p阶自回归模型。 二、自回归模型 回总目录 回本章目录 自回归模型的平稳条件: 滞后算子多项式 的根均在单位圆外,即 的根大于1。 回总目录 回本章目录 如果时间序列满足 则称时间序列服从q阶移动平均模型。或者记为。 平稳条件:任何条件下都平稳。

三、移动平均模型MA(q) 回总目录 回本章目录 四、ARMA(p,q)模型 如果时间序列 满足: 则称时间序列服从(p,q)阶自回归移动平均模型。 或者记为: 回总目录 回本章目录 q=0,模型即为AR(p); p=0,模型即为MA(q)。 ARMA(p,q)模型特殊情况: 回总目录 回本章目录 例题分析 设 ,其中A与B 为两个独立的零均值随机变量,方差为1;

非线性时间序列

第六章 时间序列的平滑 引论 上一章我们引进非参数函数估计的基本概念,现在将它应用到时间序列别的重要平滑问题上. 对估计慢变化时间趋势,平滑技术是有用的图示工具,它产生了时域平滑(§). 对将来事件和与之相联系的现在与过去变量之间的关系的非参数统计推断导致了§的状态域平滑. § 引入的样条方法是对§引入的局部多项式方法的有用替代. 这此方法能够容易地推广到时间序列的条件方差(波动性)的估计,甚至整个条件分布的估计,参阅§. 时域平滑 6.2.1 趋势和季节分量 分析时间序列的第一步是画数据图. 这种方法使得人们可以从视觉上检查一个时间序列是否像一个平稳随机过程. 如果观察到趋势或季节分量,在分析时间序列之前通常要将它们分离开来. 假定时间序列{}t Y 能够分解成 t t t t Y f s X =++, () 其中t f 表示慢变函数,称为“趋势分量”,t s 是周期函数,称为“季节分量”,t X 是随机分量,它被假定是零均值的平稳序列. 在使用这种分解之前,可以先用方差稳定变换或Box-Cox 变换. 这类幂变换有如下以参数λ为指标的形式 ,0,()log(),0, u g x u λλλ?≠=?=? () 或具有在0λ=点处连续的变换形式 ()(1)/g u u λλ=-. 这类变换由Box 和Cox (1964)给出. 注意,由在幂变换中数据必须是非负的,因此,在使用幂变换之前,可能必须先实施平移变换. 我们的目的是估计和提取确定性分量t f 和t s . 我们希望残差分量t X 是平稳的, 且能够用线性和非线性技术做进一步的分析. 通过推广Box 和Jenkins (1970)而发展的一个替代方法是对时间序列{}t Y 重复应用差分算子,直到被差分的序列表现为平稳为止. 这时,被差分的序列可以进一步平衡时间序列技术来处理. 作为说明Box 和Jenkins 方法的一个例子,我们先取S&P500指数的对数变换,然后计算一阶差分. 图给出了这个预处理序列. 所得序列基本上是该指数中变化的每日价格的百分比. 除了几个异常值(即1987年10月19日%的市场崩盘,金融市场称之为“黑色星期一”)外,这个序列显示出平稳性. 这个变换与金融工程中常用资产定价的几何布朗运动模型的离散化有关. 图 1972年1月3日至1999年12月31日(上图)和1999年1月4日至 1999年12月31日(下图)S&P500指数对数变换的差分

什么是时间序列预测法

什么是时间序列预测法? 一种历史资料延伸预测,也称历史引伸预测法。是以所能反映的社会经济现象的发展过程和规律性,进行引伸外推,预测其发展趋势的方法。 时间序列,也叫时间数列、历史复数或。它是将某种的数值,按时间先后顺序排到所形成的数列。时间序列预测法就是通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,进行类推或延伸,借以预测下一段时间或以后若干年内可能达到的水平。其内容包括:收集与整理某种社会现象的历史资料;对这些资料进行检查鉴别,排成数列;分析时间数列,从中寻找该社会现象随时间变化而变化的规律,得出一定的模式;以此模式去预测该社会现象将来的情况。 时间序列预测法的步骤 第一步收集历史资料,加以整理,编成时间序列,并根据时间序列绘成。时间序列分析通常是把各种可能发生作用的因素进行分类,传统的分类方法是按各种因素的特点或影响效果分为四大类:(1)长期趋势;(2)季节变动;(3);(4)不规则变动。 第二步分析时间序列。时间序列中的每一时期的数值都是由许许多多不同的因素同时发生作用后的综合结果。 第三步求时间序列的长期趋势(T)季节变动(s)和不规则变动(I)的值,并选定近似的数学模式来代表它们。对于数学模式中的诸未知参数,使用合适的技术方法求出其值。 第四步利用时间序列资料求出长期趋势、季节变动和不规则变动的数学模型后,就可以利用它来预测未来的值T和季节变动值s,在可能的情况下预测不规则变动值I。然后用以下模式计算出未来的时间序列的预测值Y: 加法模式T+S+I=Y 乘法模式T×S×I=Y 如果不规则变动的预测值难以求得,就只求和季节变动的预测值,以两者相乘之积或相加之和为时间序列的预测值。如果经济现象本身没有季节变动或不需预测分季分月的资料,则长期趋势的预测值就是时间序列的预测值,即T=Y。但要注意这个预测值只反映现象未来的发展趋势,即使很准确的在按时间顺序的观察方面所起的作用,本质上也只是一个的作用,实际值将围绕着它上下波动。 []

Stata时间序列笔记

文档结尾是FAQ和var建模的15点注意事项 【梳理概念】 向量自回归(VAR, Vector Auto regression)常用于预测相互联系的时间序列系统以及分析随机扰动对变量系统的动态影响。 VAR模型: VAR方法通过把系统中每一个内生变量,作为系统中所有内生变量的滞后值的函数来构造模型,从而回避了结构化模型的要求。 VAR模型对于相互联系的时间序列变量系统是有效的预测模型,同时,向疑自回归模型也被频繁地用于分析不同类型的随机误差项对系统变量的动态影响。如果变量之间不仅存在滞后影响,而不存在同期影响关系,则适合建立VAR模型,因为VAR模型实际上是把当期关系隐含到了随机扰动项之中。 协整: Engle和Granger (1987a)指岀两个或多个非平稳时间序列的线性组合可能是平稳的。假如这样一种平稳的或的线性组合存在,这些非平稳(有单位根)时间序列之间被认为是具有协整关系的。这种平稳的线性组合被称为协整方程且可被解释为变量之间的长期均衡关系。 * 第六讲时间序列分析 *一一目录—— ? d?简介 *6」时间序列数据的处理 d ■平稳时间序列模型 * 6.2 ARIMA 模型 * 6.3 VAR 模型 非平稳时间序列模型一近些年得到重视,发展很快 * 6.4非平稳时间序列简介 * 6.5单位根检验——检验非平稳 * 6.6协整分析一一非平稳序列的分析 黑-自回归条件异方差模型 * 6.7 GARCH模型一一金融序列不同时点上序列的差界 反映动态关系的时间数据顺序不可颠倒 cd d:\stata 10\ado\personal\Net_Course\B6_TimcS *时间序列数据的处理help time *声明时间序列:tsset命令 use gnp96.dta, clear list in 1/20

时间序列分析基于R——习题答案

第一章习题答案 略 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 ()0t E x =,2 1 () 1.9610.7 t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115 φ= 3.3 ()0t E x =,10.15 () 1.98(10.15)(10.80.15)(10.80.15) t Var x += =--+++ 10.8 0.7010.15 ρ= =+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-= 1110.70φρ==,2220.15φφ==-,330φ= 3.4 10c -<<, 1121,1,2 k k k c c k ρρρρ--?=? -??=+≥? 3.5 证明: 该序列的特征方程为:32 - -c 0c λλλ+=,解该特征方程得三个特征根: 11λ=,2λ=3λ=

非线性动力学——时间序列分析读书报告

非线性动力学时间序列分析读书报告 Email:dragon_hm@https://www.doczj.com/doc/b217387648.html,

1.时间序列分析简介 用随机过程理论和数理统计学方法研究随机数据序列所遵从的统计规律,以用于解决实际问题。由于在大多数问题中,随机数据是依时间先后排成序列的,称为时间序列。它包括一般统计分析(如自相关分析、谱分析等),统计模型的建立与推断,以及关于随机序列的最优预测、控制和滤波等内容。 经典的统计分析都假定数据序列具有独立性,而时间序列分析则着重研究数据序列的相互依赖关系。后者实际上是对离散指标的随机过程的统计分析,所以又可看作是随机过程统计的一个组成部分。例如,用 x(t)表示某地区第 t月的降雨量,*x(t),t=1,2,…+是一时间序列。对t=1,2,…,T记录到逐月的降雨量数据x(1),x(2),…,x(T)称为长度为T的样本序列。依此,即可使用时间序列分析方法,对未来各月的雨量x(T+i) i=1,2,…进行预报。 时间序列分析不仅可以从数量上揭示某一现象的发展变化规律或从动态的角度刻画某一现象与其他现象之间的内在数量关系及其变化规律性,达到认识客观世界之目的,而且运用时间序列模型还可以预测和控制现象的未来行为。时间序列分析在第二次世界大战前就已应用于经济预测。二次大战中和战后,在军事科学、空间科学和工业自动化等部门的应用更加广泛。 2.时间序列概述 时间序列包含一系列数据,这些数据是随时间或者其他变量的增加而得到的,并随着时间的改变,变量值的序列组成了一个时间序列。例如,股票每天的收盘价格就是一个时间序列,每年客运流量是一个时间序列,某种商品的销售数量也是一个时间序列,时间序列存在于日常生活之中。 2.1 时间序列的定义 时间序列是指按照时间顺序获得的一系列观测值。从数学意义上讲,如果对某一过程中的某一变量或一组变量 X(t)进行观察测量,在一系列时刻t1,t2,…,t n (t 为自变量,且t1

非平稳时间序列

第七章非平稳时间序列 时间序列数据被广泛地运用于计量经济研究。经典时间序列分析和回归分析有许多假定前提,如序列的平稳性、正态性等,,如果直接将经济变量的时间序列数据用于建模分析,实际上隐含了这些假定。在这些假定成立的条件下,进行的t检验、F检验与2 等检验才具有较高的可靠度。但是,越来越多的经验证据表明,经济分析中所涉及的大多数时间序列是非平稳的。那末,如果直接将非平稳时间序列当作平稳时间序列来进行分析,会造成什么不良后果?如何判断一个时间序列是否为平稳序列?当我们在计量经济分析中涉及到非平稳时间序列时,应作如何处理呢?这就是本章要讨论的基本内容。 第一节伪回归问题 经典计量经济学建模过程中,通常假定经济时间序列是平稳的,而且主要以某种经济理论或对某种经济行为的认识来确立计量经济模型的理论关系形式,借此形式进行数据收集、参数估计以及模型检验,这是20世纪70年代以前计量经济学的主导方法。然而,这种方法所构建的计量经济模型在20世纪70年代出现石油危机后引起的经济动荡面前却失灵了。这里的失灵不是指这些模型没能预见石油危机的出现,而是指这些模型无法预计石油危机的振荡对许多基本经济变量的动态影响。因此引起了计量经济学界对经典计量经济学方法论的反思,并将研究的注意力转向宏观经济变量非平稳性对建模的影响。人们发现,由于经济分析中所涉及的经济变量数据基本上是时间序列数据,而大多数经济时间序列是非平稳的,如果直接将非平稳时间序列当作平稳时间序列进行回归分析,则可能会带来不良后果,如伪回归问题。 所谓“伪回归”,是指变量间本来不存在有意义的关系,但回归结果却得出存在有意义关系的错误结论。经济学家早就发现经济变量之间可能会存在伪回归现象,但在什么条件下会产生伪回归现象,长期以来无统一认识。直到20世纪70年代,Grange、Newbold研究发现,造成“伪回归”的根本原因在于时间序列变量的非平稳性。他们用Monte Carlo模拟方法研究表明,如果用传统回归分

第八章、非平稳时间序列分析

第八章、非平稳时间序列分析 很多时间序列表现出非平稳的特性:随机变量的数学期望和方差随时间的变化而变化。宏观经济数据形成的时间序列中有很多是非平稳时间序列。非平稳时间序列与平稳时间序列具有截然不同的特征,研究的方法也很不一样。因此,在对时间序列建立模型时,必须首先进行平稳性检验,对于平稳时间序列,可采用第七章的方法进行分析,对于非平稳时间序列,可以将采用差分方法得到平稳时间序列,然后采用平稳时间序列方法对差分数据进行研究,对于多个非平稳时间序列则可以采用协整方法对其关系进行研究。 8.1 随机游动和单位根 8.1.1随机游动和单位根 如果时间序列t y 满足模型 t t t y y ε+=-1 (8.1) 其中t ε为独立同分布的白噪声序列, ,2,1,)(2==t Var t σε,则称t y 为标准随机游动 (standard random walk )。随机游动表明,时间序列在t 处的值等于1-t 时的值加上一个新息。如果将t y 看作一个质点在直线上的位置,当前位置为1-t y ,则下一个时刻质点将向那个方向运动、运动多少(t ε)是完全随机的,既与当前所处的位置无关(t ε与1-t y 不相关),也与以前的运动历史无关(t ε与 ,,32--t t y y 不相关),由质点的运动历史和当前位置不能得出下一步运动方向的任何信息。这便是 “随机游动”的由来。 随机游动时间序列是典型的非平稳时间序列。将(8.1)进行递归,可以得出 010 211y y y y t s s t t t t t t t +==++=+=∑-=----εεεε (8.2) 。如果初始值0y 已知,则可以计算出t y 的方差为2)(σt y Var t =。由此看出随机游动在不同 时点的方差与时间t 成正比,不是常数,因此随机游动是非平稳时间序列。下图给出了随12机游动时间序列图: 图8.1 随机游动时间序列图 将随机游动(8.1)用滞后算子表示为 t t y L ε=-)1( (8.3) ,滞后多项式为L L -=Φ1)(。显然1=L 是滞后多项式的根,因此随机游动是一个单位根过程(unit root process )。随机游动是最简单的单位根过程。 随机游动的概念可以进行推广。如果时间序列t y 满足 t t t y c y ε++=-1 (8.4)

第七章 非平稳时间序列模型

引言:前面我们讨论的是平稳时间序列的建模和预测方法,即所讨论的时间序列都是宽平稳的。一个宽平稳的时间序列的均值和方差都是常数,并且它的协方差有时间上的不变性。 但是许多经济领域产生的时间序列都是非平稳的。对协方差过程,非平稳时间序列会出现各种情形,如它们具有非常数的均值μt ,或非常数的二阶矩,如非常方差σt 2,或同时具有这两种情形的非平稳序列。 第七章非平稳时间序列模型

第七章非平稳时间序列模型 第一节非平稳时间序列模型的种类 第二节非平稳性的检验 第三节求和自回归滑动平均模型(ARIMA)

第一节非平稳时间序列模型的种类 一、均值非平稳过程 二、方差和自协方差非平稳过程

一、均值非平稳过程 均值非平稳过程指随机过程的均值随均值函数的变化而变化。 我们可以引进两种非常有用的均值非平稳过程:确定趋势模型和随机趋势模型。

(一)确定趋势模型 当非平稳过程均值函数可由一个特定的时间趋势表示时,一个标准的回归模型曲线可用来描述这种现象。 . ,::,,1010模型来描述前面介绍的可以用程是一个零均值的平稳过其中趋势模型表示如下则原序列可用确定的有服从线性趋势若均值例如ARMA y y t x t t t t t t ++=+=ααααμμ

t t t y t t x t t +++=++=22102210: ,ααααααμ原序列可用下式表示对二次均值函数此外,均值函数还可能是指数函数、 正弦—余弦波函数等,这些模型都可 以通过标准的回归分析处理。 处理方法是先拟合出μt 的具体形式, 然后对残差序列y t ={x t -μt }按平稳 过程进行分析和建模。

与时间序列相关的STATE命令及其统计量的解析

与时间序列相关的STATE命令及其统计量的解析与时间序列相关的STATA 命令及其统计量的解析残差U 序列相关: ①DW 统计量——针对一阶自相关的(高阶无效) STATA 命令: 1.先回归 2.直接输入dwstat 统计量如何看:查表②Q 统计量——针对高阶自相关correlogram-Q-statistics STATA 命令: 1.先回归reg 2.取出残差predict u,residual(不要忘记逗号) 3. wntestq u Q 统计量如何看:p 值越小(越接近0)Q 值越大——表示存在自相关具体自相关的阶数可以看自相关系数图和偏相关系数图:STATA 命令: 自相关系数图: ac u( 残差) 或者窗口操作在Graphics ——Time-series graphs ——correlogram(ac) 偏相关系数图: pac u 或者窗口操作在Graphics——Time-series graphs—— (pac) 自相关与偏相关系数以及Q 统计量同时表示出来的方法: corrgram u 或者是窗口操作在 Statistics——Time-series——Graphs—— Autocorrelations&Partial autocorrelations ③LM 统计量——针对高阶自相关 STATA 命令: 1.先回归reg 2.直接输入命令 estate bgodfrey,lags(n) 或者窗口操作在 Statistics——Postestimation(倒数第二个)——Reports and Statistics(倒数第二个) ——在里面选择 Breush-Godfrey LM(当然你在里面还可以找到方差膨胀因子还有DW 统计量等常规统计量) LM 统计量如何看:P 值越小(越接近 0)表示越显著(显著拒绝原假设),存在序列相关具体是几阶序列相关,你可以把滞后期写为几,当然默认是 1,(通常的方法是先看图,上面说的自相关和偏相关图以及Q 值,然后再利用LM 肯定)。 平稳时间序列存在自相关的问题的解决方案残差出现序列相关的补救措施: 一阶自相关最近简单的方法是用AR(1)模型补救,就是在加一个残差的滞后项即可。 高阶的自相关用AR(n)模型补救。 AR 模型的识别与最高阶数的确定: 可以通过自相关系数来获得一些有关 AR(p) 模型的信息,如低阶 AR(p) 模型系数符号的信息。但是,对于自回归过程AR(p),自相关系数并不能帮助我们确定 AR(p) 模型的阶数 p。所以,可以考虑使用偏自相关系数 k,k,以便更加全面的描述自相关过程AR(p)的统计特征。 且对于一个AR(p) 模型, k,k 的最高阶数为p,也即AR(p) 模型的偏自相关系数是 p 阶截尾的。因此,可以通过识别AR(p)模型的偏

相关主题
文本预览
相关文档 最新文档