第1章 高阶统计量的定义与性质
1.1 准备知识
1. 随机变量的特征函数
若随机变量x 的分布函数为)(x F ,则称
??∞
∞
-∞
∞
-===Φdx x f e x dF e
e
E x j x
j x
j )()(][)(ωωωω
为x 的特征函数。其中)(x f 为概率密度函数。
离散情况:}{,
][)(k k k k
x j x j x x p p p e e E k ====Φ∑ωωω
特征函数)(ωΦ是概率密度)(x f 的付里叶变换。 例:设x ~),(2σa N ,则特征函数为
dx e e
x j a x ?
∞
∞
---=Φωσσ
πω2
22/)(21)(
令σ2/)(a x z -=,则
dz e a
j z j z
?
∞
∞
-++-=
Φωσωπ
ω22
1
)(
根据公式:A
B A
C Cx
Bx Ax
e
A
dx e 2
2
2--
∞
∞
--±-=
?π
,则
2
22
1
)(σωωω-=Φa j e
若0=a ,则222
1
)(σωω-=Φe
。
2. 多维随机变量的特征函数
设随机变量n x x x ,,,21 联合概率分布函数为),,,(21n x x x F ,则联合特征函数为
)
,,,(][),,,(21)()(2122112211n x x x j x x x j n x x x dF e e E n n n n ??
∞
∞
-+++∞
∞
-+++==Φωωωωωωωωω
令T n x x x ],,,[21 =x ,T n ],,,[21ωωω =ω,则
?=ΦdX f e T
j )()(x ωx ω 矩阵形式 或 n n x j
n dx dx x x f e
k
n
k k ,,),,(),,,(11211
??
∞
∞-∞
∞
-∑=Φ=ωωωω 标量形式
其中,),,,()(21n x x x f f =x 为联合概率密度函数。
例:设n 维高斯随机变量为
T n x x x ],,,[21 =x ,T n a a a ],,,[21 =a
????
?
?????=nn n n n c c c c c c
2
1
11211c )])([(],cov[k k i i k i ik a x a x E x x c --==
x 的概率密度为
?
??
???---=
)()(21exp )2(1)(2
/12/a x c a x c
x T n P π x 的特征函数为
?
??
???-=Φc ωωωa ωT T j 21exp )( 矩阵形式
其中,T n ],,,[21ωωω =ω,
?
?????-=Φ∑∑∑
===n i n
j j i ij n
i i i n C a j 111
2121exp ),,,(ωωωωωω 标量形式 3. 随机变量的第二特征函数
定义:特征函数的对数为第二特征函数为 )(ln )(ωωΦ=ψ
(1) 单变量高斯随机过程的第二特征函数 222
2
1
ln )(2
2σωωωσωω-==ψ-a j e a j
(2) 多变量情形
j n i i n
ji ij i n
i i n C a j ωωωωωω∑∑∑===-=ψ111
2121),,,(
1.2 高阶矩与高阶累积量定义
1. 单个随机变量情形 (1) 高阶矩定义
随机变量x 的k 阶矩定义为
?∞
∞
-==dx x p x x E m k k
k )(][ (1.1)
显然10=m ,][1x E m ==η。随机变量x 的k 阶中心矩定义为
?∞
∞
--=-=dx x p x x E k k
k )()(])[(ηημ (1.2)
由式(1.2)可见,10=μ,01=μ,22σμ=。
若),,2,1(n k m k =存在,则x 的特征函数)(ωΦ可按泰勒级数展开,即
)()(!
1)(1n k n
k k
O j k m ωωω++=Φ∑
= (1.3) 并且k m 与)(ωΦ的k 阶导数之间的关系为
n k j d d j m k k k
k k
k ≤Φ-=Φ-==),0()()
()(0
ωωω (1.4)
(2) 高阶累积量定义
x 的第二特征函数)(ωψ按泰勒级数展开,有
)()(!
)(ln )(1n k n
k k
O j k c ωωωω+=Φ=ψ∑
= (1.5) 并且k c 与)(ωψ的k 阶导数之间的关系为
n k j d d j d d j
c k
k k
k k k k k
k ≤ψ-=??????ψ=??????Φ===),0()()(1)(ln 10
0ωωωωωω (1.6)
k c 称为随机变量x 的k 阶累积量,实际上由1)0(=Φ及)(ωΦ的连续性,存在
0 δ,使δω 时,0)(≠Φω,故第二特征函数)(ln )(ωωΦ=ψ对δω 有意义且单值(只考虑对数函数的主值),)(ln ωΦ的前n 阶导数在0=ω处存在,故k c 也存在。
(3) 二者关系
下面推导k c 与k m 之间的关系。形式地在式(2.3)与式(2.5)中令∞→n ,并利用
??
????=+=Φ∑∑∞=∞
=k k k k
k k j k c j k m )(!exp )(!1)(11ωωω
+??
????++??????++=∑∑∑∞=∞=∞
=n
k k k k k k k k k j k c n j k c j k c )(!!1)(!!21)(!11211ωωω
(1.7)
比较上式中各),2,1()( =k j k ω同幂项系数,得k 阶累积量与k 阶矩的关系如下:
η===][11x E m c
22222122]])[[(])[(][μ=-=-=-=x E x E x E x E m m c
333233
12133]])[[(])[(2)][(][3][23μ=-=+-=+-=x E x E x E x E x E x E m m m m c
4441221312
244]])[[(61243μ=-≠-+--=x E x E m m m m m m m c
若0][==ηx E ,则 011==m c ][222x E m c ==
][333x E m c == 2242
2
44])[(3][3x E x E m m c -=-= 由上可见,当随机变量x 的均值为零时,其前三阶累积量与前三阶矩相同,
而四阶累积量与相应的高阶矩不相同。
2. 多个随机变量情形 (1) 高阶矩
给定n 维随机变量),,,(21n x x x ,其联合特征函数为
)]([exp ),,,(221121n n n x x x j E ωωωωωω+++=Φ (1.8)
其第二联合特征函数为
),,,(ln ),,,(2121n n ωωωωωω Φ=ψ (1.9)
可见,联合特征函数),,,(21n ωωω Φ就是随机变量),,,(21n x x x 的联合概率密度函数),,,(21n x x x p 的n 维付里叶变换。
对式(1.8)与(1.9)分别按泰勒级数展开,则阶数n k k k r +++= 21的联合矩可用联合特征函数),,,(21n ωωω Φ定义为
21212
1
212
12121),,,()(][====???
??????Φ?-==n n n n
k n k k n r r
k n
k k k k k j x x x E m ωωωωωωωωω (1.10) (2) 高阶累积量
同样地,阶数n k k k r +++= 21的联合累积量可用第二联合特征函数
),,,(21n ωωω ψ定义为
21210
212121
2
121
2
121)
,,,(ln )()
,,,()(========???Φ?-=???ψ?-=n n n n n
k n
k k n r r
k n
k k n r
k k k j j c ωω
ωωω
ωωωωωωωωωωωωω (1.11)
(3) 二者关系
联合累积量n k k k c 21可用联合矩n k k k m 21的多项式来表示,但其一般表达式相当复杂,这里不加详述,仅给出二阶、三阶和四阶联合累积量与其对应阶次的联合矩之间的关系。
设321,,x x x 和4x 均为零均值随机变量,则
][),(212111x x E x x cum c == (1.12a)
][),,(321321111x x x E x x x cum c == (1.12b)
),,,(43211111x x x x cum c =
][][][][][][][3241423143214321x x E x x E x x E x x E x x E x x E x x x x E ---= (1.12c) 对于非零均值随机变量,则式(1.12)中用][i i x E x -代替i x 即可。与单个变量情形类似,前三阶联合累积量与前三阶联合矩相同,而四阶及高于四阶的联合累积量则与相应阶次的联合矩不同。注意,式(1.12)中采用)(?cum 表示联合累积量的方法在以后将时常用到。 3. 平稳随机过程的高阶累积量
设)}({n x 为零均值k 阶平稳随机过程,则该过程的k 阶累积量
),,,(121,-k x k m m m c 定义为随机变量)}(,),(),({11-++k m n x m n x n x 的k 阶联合累积量,即
))(,),(),((),,,(11121,--++=k k x k m n x m n x n x cum m m m c (1.13) 而该过程的k 阶矩),,,(121,-k x k m m m m 则定义为随机变量
)}(,),(),({11-++k m n x m n x n x 的k 阶联合矩,即
))(,),(),((),,,(11121,--++=k k x k m n x m n x n x mom m m m m (1.14)
这里,)(?mom
表示联合矩。 由于)}({n x 是k 阶平稳的,故)}({n x 的k 阶累积量和k 阶矩仅仅是时延
121,,,-k m m m 的函数,而与时刻n 无关,其二阶、三阶和四阶累积量分别为
)]()([)(,2m n x n x E m c x += (1.15a) )]()()([),(2121,3m n x m n x n x E m m c x ++= (1.15b)
)()()]()()()([),,,(32,21,2321321,4m m c m c m n x m n x m n x n x E m m m c x x x --+++=
)()()()(21,23,213,22,2m m c m c m m c m c x x x x ----
(1.15c)
可以看出,)}({n x 的二阶累积量正好就是其自相关函数,三阶累积量也正好等于其三阶矩,而)}({n x 的四阶累积量则与其四阶矩不一样,为了得到四阶累积量,必须同时知道四阶矩和自相关函数。
1.3 高阶累积量的性质
高阶累积量具有下列重要特性:
(1) 设),,2,1(k i i =λ为常数,),,2,1(k i x i =为随机变量,则 ),,(),,(1111k k
i i k k x x cum x x cum ∏==λλλ
(2) 累积量关于变量对称,即
),,,(),,(211k i i i k x x x cum x x cum =
其中),,(1k i i 为),,1(k 中的任意一种排列。 (3) 累积量关于变量具有可加性,即
),,,(),,,(),,,(1010100k k k z z y cum z z x cum z z y x cum +=+
(4) 如果α为常数,则
),,,(),,,(2121k k z z z cum z z z cum =+α
(5) 如果随机变量),,2,1(k i x i =与随机变量),,2,1(k i y i =相互独立,则 ),,(),,(),,(1111k k k k y y cum x x cum y x y x cum +=++
(6) 如果随机变量),,2,1(k i x i =中某个子集与补集相互独立,则
0),,(1=k x x cum
1.4 高斯过程的高阶累积量
1. 单个高斯随机变量情形
设随机变量x 服从高斯分布),0(2σN ,即x 的概率密度函数为
2221)(σσ
πx e x p -
=
故有 2
2
2)(ωσω-
=Φe
x 的第二特征函数为
2
)(ln )(2
2ωσωω-
=Φ=ψ
(1.16)
利用累积量k c 与)(ωψ的关系式(1.6),并比较(1.6)与(1.16)两式,可以得到随机变量x 的各阶累积量为
01=c , 22σ=c , 2,0 k c k =
由此,我们有下列结论:
(1) 高斯随机变量x 的一阶累积量1c 和二阶累积量2c 恰好就是x 的均值和方差。
(2) 高斯随机变量x 的高阶累积量)2( k c k 等于零。 (3) 由于高斯随机变量x 的各阶矩为
?
?
?
?
?-???==为奇数
,为偶数
k k k x E m k k k 0,)1(31][σ
可见,高阶累积量与高阶矩不一样。由于高斯随机变量x 的高阶矩并不比其二阶矩多提供信息,它仍取决于二阶矩的统计知识2σ,所以人们宁愿选择高阶累积量这一统计量,直接把多余的信息用零来处理。 2. 高斯随机过程情形
先讨论n 维高斯随机矢量T n x x x ],,,[21 =x ,设其均值矢量为
T n a a a ],,,[21 =a ,协方差矩阵为
?
????
????
???=nn n n n n c c c c c c c c c 2
1
22221
11211c
其中
n k i a x a x E c k k i i ik ,2,1,)]
)([(=--=
n 维高斯随机变量x 的联合概率密度函数为
?
?????---=
-)()(21exp )2(1)(12/12/a x c a x c
x T n p π x 的联合特征函数为
?
??
???-=Φc ωωωa ωT T j 21exp )(
其中,T n ],,,[21ωωω =ω
x 的第二联合特征函数为
∑∑∑===-=-=Φ=ψn
i n i j i n
j ij i i T T
c a j j 1
112121)(ln )(ωωωc ωωωa ωω
由于阶数n k k k r +++= 21的联合累积量n k k k c 21可由第二特征函数定义为 0
21212
121)
()(====???ψ?-=n n n
k n
k k r r
k k k j c ωωωωωωω
于是,n 维高斯随机变量),,,(21n x x x 的各阶累积量为:
(1)1=r ,即n k k k ,,,21 中某个值取1(设1=i k ),而其余值为零,于是 ][)()
(0
01021
i i i x E a j c n ==?ψ?-=====ωω
ωωω
(2)2=r ,这有两种情况:
1)),,2,1(n i k i =中某两个值取1(设j i k k j i ≠==,1),其余值为零,这
时
j i a x a x E c j c j j i i ij j
i n ≠--==??ψ?-=====)]
)([()()
(0
20
11021ωωωωωω
上式利用了关系式ji ij c c =。
2)),,2,1(n i k i =中某个值取2(设2=i k ),其余值为零,这时
])[()
()
(20
222
2021
i i ii i a x E c j c n -==?ψ?-=====ωω
ωωω
(3)3≥r ,由于)(ωψ是关于自变量),,2,1(n i i =ω的二次多项式,因而)(ωψ关于自变量的三阶或三阶以上(偏)导数等于零,因而x 的三阶或三阶以上联合累积量等于零,即
3,
02121≥+++=n k k k k k k c n
由上一节关于随机过程的累积量的定义可知,对于高斯随机过程)}({n x ,其阶次大于2的k 阶累积量),,,(121,-k x k m m m c 也为零,即
3,
0),,,(121,≥=-k m m m c k x k
(1.17)
由于高斯过程的高阶累积量(当阶次大于2时)等于零,而对于非高斯过程,至少存在着某个大于2的阶次k ,其k 阶累积量不等于零。因此,利用高阶累积量可以自动地抑制高斯背景噪声(有色或白色)的影响,建立高斯噪声下的非高斯信号模型,提取高斯噪声中的非高斯信号(包括谐波信号)。正因为这样,高阶累积量这一统计量已日益受到人们的重视并已成为信号处理中一种非常有用的工具。因此,文中在今后的算法研究中均代用高阶累积量而不采用高阶矩。
1.5 双谱及其性质
1. 高阶谱的定义
设)}({n x 为零均值平稳随机过程,则其k 阶累积量),,,(121,-k x k m m m c 的
)1(-k 维付里叶变换定义为)}({n x 的k 阶谱(kth-order spectrum),即
∑∑∑∞
-∞=-=-∞-∞=--??
?
???-=1111121,121,exp ),,,(),,,(k m k i i i k x k m k x k m j m m m c S ωωωω
(1.18)
通常,),,,(121,-k x k S ωωω 为复数,其存在的充分必要条件是
),,,(121,-k x k m m m c 绝对可和,即
∑∑∞
-∞
=-∞-∞
=-∞11),,,(121,k m k x
k m m m m c
高阶谱又称作多谱(Polyspectrum),通常k 阶谱对应于)1(-k 谱。例如三阶谱对应双谱(Bispectrum),四阶谱对应于三谱(Trispectrum),今后我们大多数
采用多谱这一概念。
取4,3,2=k 时,式(1.18)分别简化为功率谱、双谱和三谱公式,即
2=k ,为功率谱
]exp[)()(1,2,2m j m c
S m x
x ωω-=
∑∞
-∞
=
(1.19) 3=k ,为双谱 []∑∑∞
-∞
=∞-∞=+-=21)(exp ),(),(221121,321,3m x
m x m m j m m c
S ωωωω
(1.20)
4=k ,为三谱
[]∑∑
∑∞-∞=∞
-∞
=∞-∞=++-=
231)(exp ),,(),,(332211321,4321,4m x m m x m m m j m m m c S ωωωωωω
(1.21)
容易看出,式(1.19)就是维纳-辛钦定理。可见,功率谱也是高阶谱的一种特殊形式。
2. 双谱的性质
在高阶谱中,双谱处理方法最简单,且含有功率谱中所没有的相位信息,是高阶谱研究中的“热点”。因此下面着重研究双谱及其性质。
设)}({n x 为零均值、三阶实平稳随机过程,其自相关函数和功率谱分别为 )]()([)()(,2m n x n x E m c m r x x +== (1.22) ]exp[)()()(,2m j m r S S m x
x ωωω-==∑∞
-∞
=
而其三阶累积量和双谱分别为
)]()()([),(2121,3m n x m n x n x E m m c x ++= (1.23)
)]
(exp[),(),(),(221121,321,32121m m j m m c
S B m x
m x ωωωωωω+-==∑∑∞
-∞
=∞-∞=
(1.24)
由式(1.23)可知,三阶累积量),(21,3m m c x 具有如下对称性:
),(),(),(),(112,3212,312,321,3m m m c m m m c m m c m m c x x x x --=--== ),(),(121,3221,3m m m c m m m c x x --=--= (1.25)
由式(1.24)双谱的定义及式(1.25)三阶累积量的对称性可知:
(1) ),(21ωωB 通常是复数,即包含幅度和相位。 )],(exp[),(),(212121ωωφωωωωB j B B =
(2) ),(21ωωB 是以π2为周期的双周期函数,即
)2,2(),(2121πωπωωω++=B B
(3) ),(21ωωB 具有如下对称性
),(),(),(),(21*12*1221ωωωωωωωω--=--==B B B B ),(),(211221ωωωωωω--=--=B B
),(),(212121ωωωωωω--=--=B B (1.26) 此外,双谱在实际应用中还具有如下重要特性:
(1) 高斯过程:如果)}({n x 为零均值、高斯平稳随机过程,则对于所有
21,m m ,都有0),(21,3=m m c x ,因此0),(21=ωωB 。
(2)非高斯白噪声过程:如果)}({n w 是具有0)]([=n w E ,
)()]()([m Q m n w n w E δ=+,
),()]()()([2121m m m n w m n w n w E βδ=++的非高斯白噪声过程,则其功率谱和双谱分别为一直线与一平面,即Q S =)(ω,βωω=),(21B 。
(3) 非高斯白噪声通过线性系统:设线性系统的传递函数为)(z H ,系统的
输入为零均值非高斯白噪声{})(n w ,且0)]([=n w E ,2
2)]([w n w E σ=,
w n w E 33)]([γ=,则系统输出)}({n y 的功率谱与双谱分别为
2
2
)()(ωσωH S w =
(1.27)
)()()(),(21*21321ωωωωγωω+=H H H B w (1.28)
设
)](exp[)()(ω?ωωj H H =
(1.29)
)](exp[),(),(212121ωω?ωωωω+=B j B B
(1.30)
则
)()()(),(2121321ωωωωγωω+??=H H H B w
(2.31)
)()()(),(212121ωω?ω?ω?ωω?+-+=B
(2.32)
由上可见,双谱的幅度谱和功率谱均由)(ωH 决定,因而双谱的幅度谱与功率谱的信息一样多。但功率谱不含相位信息,而双谱则包含相位信息,这就使双谱在信号处理领域得到越来越多的应用,因为有些场合如对图像处理来说,相位信息比幅度信息还重要。
(4) 非最小相位系统的辨识 双谱含有相位信息,因此在非最小相位系统辨识中变得十分有用,现用一个简单的例子加以说明。设输入为非高斯平稳白
噪声过程)}({n w ,它有0)]([=n w E ,2
2)]([w n w E σ=,w n w E 33)]([γ=。线性系统
为下列三种情形的二阶FIR 系统。
1) 最小相位系统 10,10),1)(1()(111 b a bz az z H ----=
系统输出为
)2()1()()()(1-+-+-=n abw n w b a n w n y
2) 最大相位系统
)1)(1()(2bz az z H --= 系统输出为
)2()1()()()(2++++-=n abw n w b a n w n y
3) 混合相位系统
)1)(1()(13---=bz az z H 系统输出为
)1()()1()1()(3--+++-=n bw n w ab n aw n y 输出)}({1n y ,)}({2n y 及)}({3n y 具有相同的自相关序列,即
)]()([)]()([)]()([)(332211m n y n y E m n y n y E m n y n y E m r +=+=+=
2
222])(1[)0(w b a b a r σ+++= 2)]1)(([)1(w ab b a r σ++-= 2)2(w ab r σ=
3,0)(≥=m m r
这就意味着它们具有相同的功率谱,因此利用功率谱无法将三个系统区分
开来。然而利用双谱则可以区分,因为)}({1n y ,)}({2n y 及)}({3n y 具有不同的三阶累积量,见表1.1。这表明三阶累积量可以用来辨识非最小相位系统,这在地震信号反褶积及数据通信中有重要的应用。
表1.1 具有相同自相关的三个系统的输出的三阶累积量
(5) 混合高斯和非高斯系统的辨识 设一过程的功率谱为)(ωS ,双谱为
),(21ωωB 。若与)(ωS 相匹配的线性系统的传递函数为)(z H ,即
2
)()(ωωH S = (1.33) 而与),(21ωωB 相匹配的线性系统的传递函数为)(z T ,即
)()()(),(21*2121ωωωωωω+=T T T B (1.34)
当由式(1.33)求得的)(ωH 与由式(1.34)求得的)(ωT 不同时,可用来辨识高斯与非高斯分量组合的系统。下面就来研究这个问题。
考虑如图1-1所示的过程n z ,它由两个过程组成:一为高斯白噪声)(n ε通
过AR 滤波器的输出)(n x ,另一为非高斯白噪声)(n w 通过AR 滤波器的输出)(n y 。设)(n ε与)(n w 相互独立,
)(n ε )(n x
)(n z
)(n w )(n y
图1-1 混合高斯和非高斯系统
因此)(n x 与)(n y 相互独立。为方便起见,设12
2==w σσε,13=w γ。于是)(n z 的
双谱是)(n x 和)(n y 各自双谱的和,因为)(n x 是高斯过程,其双谱为零,故)(n z 的双谱就是)(n y 的双谱。)(n y 的双谱可由式(1.34)确定,其中 )
(1
)(ωωA T = 而
∑=-+=p
k k k j a A 1
)exp(1)(ωω
)(n z 的功率谱为)(n x 与)(n y 各自功率谱的和,它由式(1.33)确定,其中
2
2
222
)
()()()()(ωωωωωB A B A H ?+=
而
∑=-+=q
k k k j b B 1
)exp(1)(ωω
这个例子表明,描述过程双谱的模型不同于描述过程功率谱的模型。双谱
的这一特征使双谱在辨识高斯与非高斯分量组合系统时起着关键作用,这也是我们利用双谱及多谱(或高阶累积量)进行随机信号建模以及有色噪声中谐波恢复的理论依据。
双谱还具有其它一些性质,如可用来检测二次相位耦合,辨识系统的非线性等,这里就不再详述。
1.6 系统中的高阶累积量
对于单输入单输出线性时不变系统,输入与输出的高阶累积量及多谱之间的关系如下。
定理1 设线性时不变系统的单位脉冲响应为)(n h ,传递函数为
∑∞
=-===0)()()(n n j e z e n h z H H j ωωω,系统是稳定的,即单位脉冲响应绝对可和
∑∞
=∞0
)(n n h ,输入过程)(n x 的k 阶累积量),,,(121,-k x
k m m m c
存在且满足平稳和
绝对可和的条件,则
(1) 输出过程
∑∞
=-=0)()()(i i n x i h n y
的k 阶累积量),,,(121,-k y k m m m c 存在,且为
),,,(),,,(),,,(121,121,121,---*=k x k k h k k y k m m m c m m m c m m m c (1.35)
其中
)()()(),,,(110121,-∞
=-++=∑k n k h k m n h m n h n h m m m c
(1.36)
(2) )(n y 的多谱为
),,,()()()(),,,(121,1111121,-------=k x k k k k y k S H H H S ωωωωωωωωωω (1.37)
特殊地,若)(n x 为独立地服从同一分布的(i.i.d.)非高斯白噪声,即
),,,(),,,(121,121,--=k x k k x k m m m m m m c δγ,则
)()()(),,,(110
,121,-∞
=-++=∑k n x k k y k m n h m n h n h m m m c γ
(1.38)
))()()(),,,(1111,121,------=k k x k k y k H H H S ωωωωγωωω (1.39)
公式(1.38)和(1.39)是我们文中进行非最小相位随机信号建模的基础。
顺序统计量的分布及其应用探究 学生姓名:杨道圣 指导教师:刘宇民 摘要 顺序统计量在近代统计推断中起着很重要的作用,在水文,地震,气象和建筑等领域都有重要作用。经过总结得出了关于顺序统计量的离散型最大顺序统计量分布,最小顺序统计量分布,连续性第i 个顺序统计量ξ(i)的密度函数,连续性随机变量任意两个顺序统计量ξ(i )<ξ(j)的密度函数: 1.离散型随机变量子样最小值的分布律为 )(])1()!(!![)(11 ) 1(I r pi r p l n l n x X P n l l n r l l r ∈--==∑∑=-= 2.离散型随机变量子样最大值的分布律为 )(])1()!1()!1(![)(111 1 1 ) (I r pi r p j n j n x X P n j j r l j n r n ∈-+--==∑∑=--=+- 3.设母体ξ有密度函数f(x)>0,a ≤x ≤b(这里可以设a=-∞,b=+∞),并且ξ1,ξ2,…,ξn 取自这一母体的一个子样,则第i 个顺序统计量ξ(i)的密度函数 4.设母体ξ有密度函数f(x)>0,a ≤x ≤b(这里可以设a=-∞,b=+∞),并且ξ1,ξ2,…,ξn 取自这一母体的一个子样,则任意两个个顺序统计量ξ(i )<ξ(j)的密度函数为 关键词 最小顺序统计量,最大顺序统计量,第i 个顺序统计量ξ(i)的密度函数,任意两个个顺序统计量ξ(i )<ξ(j)的密度函数 引言 顺序统计量在近代统计推断中起着重要的作用,这是由于顺序统计量有一些性质不依赖于母体的分布,并且计算量很小,使用起来较方便,因此在质量管理、可靠性等方面得到广泛的应用。顺序统计量在近代统计推断中起着很重要的作用,在水文,地震,气象和建筑等领域都有重要作用。
《统计学》课程教学大纲 课程编号:×××××××× 课程类别:学科基础课 授课对象:经济管理类各专业、社会学专业、档案学专业、新闻学专业等 开课学期:第3、4、5、6学期 学分:4学分 主讲教师:……等 指定教材:贾俊平、何晓群、金勇进编著,《统计学》(第六版),中国人民大学出版社,2015年教学目的: 《统计学》是为我校非统计专业本科生开设的一门基础必修课,总课时约54学时。设置本课程的目的在于培养学生有关统计知识方面的基本技能,培养学生应用统计方法分析和解决问题的实际能力。教学应达到的总体目标是: 使学生能系统地掌握各种统计方法,并理解各种统计方法中所包含的统计思想。 使学生掌握各种统计方法的不同特点、应用条件及适用场合。 培养学生运用统计方法分析和解决实际问题的能力。 第1章导论 课时:1周,共3课时 教学内容 第一节统计及其应用领域 一、什么是统计学 统计学的概念。描述统计。推断统计。 二、统计的应用领域 统计在共生管理中的应用。统计在其他领域的应用。统计的误用与正确使用。 三、历史上著名的统计学家 一些主要的统计学家。 第二节统计数据的类型 一、分类数据、顺序数据、数值型数据 分类数据。顺序数据。数值型数据。 二、观测数据和实验数据 观测数据。实验数据。 三、截面数据和时间序列数据 截面数据。时间序列数据。 第三节统计中的几个基本概念 一、总体和样本 总体。有限总体和无限总体。样本。样本容量。 二、参数和统计量 参数。统计量。 三、变量 变量。变量的类型。 第2章数据的收集 课时:1周,共3课时
第一节数据来源 一、数据的间接来源 二手数据。 二、数据的直接来源 统计调查方式。数据的收集方法。 第二节调查设计 一、调查方案的结构 调查目的。调查对象和调查单位。调查项目和调查表。 二、调查问卷设计 问卷的结构。提问项目设计。回答项目的设计。问题顺序的设计。第三节数据质量 一、数据的误差 抽样误差。非抽样误差。 二、数据的质量要求 第3章数据的图表展示 课时:1周,共3课时 教学内容 第一节数据的预处理 一、数据审核 原始数据的审核。二手数据的审核。 二、数据筛选 数据筛选的意义。用Excel进行数据筛选。 三、数据排序 数据排序的作用。用Excel进行数据排序。 第二节分类和顺序数据的整理与显示 一、分类数据的整理与显示 频数与频数分布。用Excel制作频数分布表。分类数据的图示方法。 二、顺序数据的整理与显示 累积频数与累积频率。顺序数据的图示方法。 第三节数值型数据的整理与显示 一、数据分组 分组方法。 二、数值型数据的图示 直方图。茎叶图和箱线图。线图。雷达图。 第四节统计表 一、统计表的构成 二、统计表的设计 第4章数据的概括性度量 课时:1周,共3课时 教学内容 第一节集中趋势的度量
§5.3次序统计量及其分布 次序统计量在近代统计推断中起着重要的作用,这是由于次序统计量有一些性质不依赖于母体的分布并且计算量很小,使用起来较方便。因此在质量管理、可靠性等方面得到广泛的应用,现在我们在本节中扼要地介绍有关次序统计量的内容。gjzsj 设1ξ,2ξ,…,n ξ是取自分布函数为F (x )的母体ξ的一个子样,x 1,x 2,… ,x n 表示这子样的一组观测值。这些观测值,由小到大的排列用x )1(,x )2(,… ,x )(n 表示,即x )1(≤x )2(≤… ≤x )(n ,若其中有两个分量x 1与x 2相等,它们先后次序的安排是可以任意的。 定义5.3 第i 个次序统计量ξ)(i 是上述子样1ξ,2ξ,…,n ξ这样的一个的一个函数,不论子样1ξ,2ξ,…,n ξ取得怎样一组观测值x 1,x 2,… ,x n ,它总是取其中的x )(i 为观测值。 显然,对于容量为n 的子样可以得到n 个次序统计量ξ)1(≤ξ)2(≤… ≤ξ)(n ,其中ξ)1(称做最小次序统计量,ξ)(n 称做最大次序统计量。 如果1ξ,2ξ,…,n ξ是来自同一母体的n 个相互独立随机变量,那么次序统计量1ξ,2ξ,…,n ξ是否也相互独立呢?这可以从下述例子中看出(例略)。 定理5.5 设母体ξ有密度函数f (x)>0,a ≤x ≤b ,并且1ξ,2ξ,…,n ξ为取自这母体的一个子样,则第i 个次序统计量的密度函数为 g i (y)=?? ???≤≤-----其他,0),()](1][)([)!()!1(!1b y a y f y F y F i n i n i n i (5.24) 例5.3 设母体ξ有密度函数 ? ??<<=其他,010,2)(x x x f 并且ξ)1(<ξ)2(<ξ)3(<ξ)4(为从ξ取出的容量为4的子样的次序统计量。求ξ)3(的密度函数)(3x g 和分布函数)(3x G ,并且计算概率)2 1()3(>ξP 。
几个关于次序统计量的典型例题 摘要:次序统计量作为一类重要的统计量在很多领域中都有关泛的应用。本文 在前人研究的基础上总结了有关次序统计量若干重要的例题,主要包括:特殊形 式的多个次序统计量联合密度函数的求法;均匀分布样本极差的密度函数的求法;有关次序统计量独立性的证明。希望对读者学习研究次序统计量起到微薄的帮助。 关键词:次序统计量雅可比行列式次序统计量独立性 一、引言 次序统计量是一类很重要的统计量,被广泛地应用在统计推断、可靠性理论、应用概率等很多领域。其优点在于次序统计量有一些性质不依赖母体分布,且计 算量较小,这样可以根据相关的理论快速得到目标统计量的分布情况。现有的理 论研究已经非常充分,如,文章[3]中,作者描述了均均分布及指数分布的相关统 计量性质;文章[4]中,作者就几个常见分布次序统计量的随机比较进行了详细地 说明。文章[5]中,作者详细描述了均匀分布的次序统计量的性质;本文旨在前人 的基础上对次序统计量几个常见但没有被系统总结的例题做一详细说明。 二、次序统计量的基本知识 定义1:设x1,x2…,xn是取自总体x的样本,x(i)称为该样本的第i个次序统计量,它的取值是将样本观测值由小到大排列后得到的第i个观测值。(x(1),x(2)…,x(n))称为该样本的次序统计量。其中,x(1)是该样本的最小次序统计量,x(n)是 该样本的最大次序统计量。R=x(n)-x(1)称为样本极差。 引理1:设总体x的密度函数为f(x),分布函数为F(x),x1,x2…,xn为样本, 则第k个次序统计量x(k)的密度函数为: f(x(k))=[F(x)]k-1[1-F(k)]n-kf(x) 引理2:(x(1),x(2)…,x(n))是总体样本的次序统计量,f(x(k))是第k个次 序统计量(x(k))的密度函数,则次序统计量xk的联合密度函数为:f(x(1),x(2)…,x(n))=n!f(x(k)) 引理3:设总体x的密度函数为f(x),分布函数为F(x),x1,x2, (x) 为样本,则次序统计量(x(i),x(j))(i