第五章 特征值的估计及对称矩阵的极性 本章主要讨论数值代数中的三个特殊理论, 即
特征值的估计 广义特征值问题
实对称矩阵(一般是Hermite 矩阵)特征值的 极小极大原理,其次也涉及到一些特征值 和奇异值的扰动问题,最后简要地介绍矩阵 直积的一些性质及其在线性矩阵方程求解 方面的应用。这几方面的内容,在矩阵的 理论研究与实际应用当中都有着相当重要 的作用。
5.1特征值的估计 一、特征值的界
首先给出直接估计矩阵特征值模的上界的 一些方法
定理5.1 设A=(a rs )∈R n×n ,令
M=||2
1
max
,1sr rs n s r a a -≤≤
λ若表示A 任一特征值,则λ的虚部Im(λ)
满足不等式
2
)
1(|)Im(|-≤n n M
λ |Im(λ)|≤||A -A T ||2 / 2 |Im(λ)|≤||A -A T ||1
?/2.
证明:设x+i ?y 为对应于λ的A 的特征向量, 则 A(x+i ?y)=(α+β?i)(x+i ?y)
其中λ=α+β?i.显然x,y 为实向量,且x,y 为 线性无关的 向量。 经整理A(x,y)=(x,y)B, 其中B=???
?
??-αββα
。 从而(x,y)T A(x,y)=(x,y)T (x,y)B
展开有
???? ??Ay y Ax y Ay x Ax x T T T T =α?????
??y y y x y x x x T T T T + β????
?
?
?--x y y
y x x y
x T T T T (求等式两边矩阵的对角元之和,可得 α(x T x +y T y )=x T Ax +y T Ay (1)
等式两边矩阵的左上角单元减去右下角单元 可得:
β(x T x +y T y )=x T (A -A T )y 1).
记B=A -A T ,则 |x T By|≤||x||2 ?||B||2?||y||2
从而 |β|≤||x||2 ?||B||2?||y||2 /((||x ||2)2 +(||y ||2)2) 利用ab /(a 2+b 2)≤1/2 可得 |β|≤||B||2 /2. 2).
由于|x T By|≤||Bx||1 ?||y||∞≤||B||1?||x||1 ?||y||∞ 从而 |β|≤||B||1 ?||x||1 ?||y||∞ /((||x ||2)2 +(||y ||2)2) 易证明 ||x||1 ?||y||∞ /((||x ||2)2 +(||y ||2)2)
/2.
(显然,不妨假设(||x ||2)2 +(||y ||2)2=1,
设||y ||∞=t =cos(α), 则y 必为t ? e j 的形式(为什么?), 从而极值转化为求解如下最大值问题:
max ||x||1, 满足约束(||x ||2)2=1-t 2 这样有均值不等式||x||1
x ||2
=
-t 2)1/2,
从而我们需要求解t (1-t 2)1/2的最大值,设t =cos(α) 可得t (1-t 2)1/2的最大值为1/2. 从而得证。) 因此 |β|≤||B||1
3). 由于b ii =0, i =1,2,…,n , b ij = -b ji , 因此
|x T By|2=|
1
1()n ij
i j j i i j i
b
x y x y -=>??-∑∑|2
≤(2M )2
2
1||n i j j i i j i x y x y =>??- ???
∑∑
(利用(a 1+a 2+…+a n )2≤ n ((a 1)2+(a 2)2+…+(a n )2) ≤(2M )2 (n (n -1)/2) 21||n i j j i i j i x y x y =>??- ???
∑∑
≤(2M )2 (n(n -1)/2)?
2
222
1
1
1(2)2n n
i j i j i j j i i j x
y x x y y x y ==-+∑∑
=M 2 (n (n -1))?2?[ (x T x)?(y T y )- (x T y)2]
利用[ (x T x)?(y T y )- (x T y)2]≤(x T x)?(y T y )可得 |β|≤M (2n (n -1))1/2 (x T x)1/2?(y T y )1/2 /(x T x +y T y ) ≤M (2n (n -1))1/2 / 2 =M (n (n -1)/2)1/2 4). |x T By|=|
1
1()n ij
i j j i i j i
b
x y x y -=>??-∑∑|
≤1/2
21||n
ij i j i b =>?? ???
∑∑1/2
21||n i j j i i j i x y x y =>??- ???
∑∑
而 1/2
21||n i j j i i j i x y x y =>??- ?
??∑∑≤(x T x)1/2?(y T y )1/2
由此可以有|β|≤(1/2)1/2
21||n
ij
i j i
b =>?? ???
∑∑ 思考题:对于(1)式,利用定理推导的类似 技术,求出关于|α|的界。
推论 实对称矩阵的特征值都是实数。 事实上,当A 这实对称矩阵时,M =0. 由定理5.1可得Im(λ)=0,即λ为实数。
引理1 设B ∈C n×n ,列向量y ∈C n 满足||y||2=1,
则|y H By|∞≤m B ||||.
定理5.2 设A ∈C n×n ,则A 的任一特征值λ满足
|λ|≤||A||∞m
∞+≤
m H A A ||||21
|)Re(|λ (5.1.3) ∞-≤m H A A ||||21
|)Im(|λ (5.1.4)
推论: Hermite 矩阵的特征值都是实数;
反Hermite 矩阵的特征值为零或纯虚数。 事实上,当A 为Hermite 矩阵时,由式(5.1.4) 知Im(λ)=0,即λ为实数;
当A 为反Hermite 矩阵时,由式(5.1.3)知
Re(λ)=0,即为λ为零或纯虚数。
定义.5.1设,)(n
n rs C
a A ?∈=
记∑≠==n
r
s s rs a A 1r ||)(R ),R (r 简写为.,,1n r =
如果00|a r r 0|r R >,
则称矩阵A 按行(弱)对角占优。
定义5.2 设A ∈C n×n 。如果A T 按行严格对角 占优,则称A 按列严格对角占优; 如果A T 按行(弱)对角占优, 则称A 按列(弱)对角占优。
对直接估计矩阵特征之乘积的模的界, 再给出以下两个方法。 定理5.3 设A=(a rs )∈C n×n , 令M r =|a rr |+
∑∑+=+=-=n
r s n
r s rs rr r rs
a a m a
1
1
|||||,|
如果A 按行严格对角占优,则
∏∏∏===≤=≤n r n r n
r r r r M A A m 1
1
1
|)(||det |0λ (5.1.5)
且当a rs =0(s>r)时,式(5.1.5)中等号成立。
证明:由于A 按对角占优, 所以det(A)≠0. 考虑方程组
21222211120,n n n n nn a a a A A a a a ξξ??????
? ?
?+== ? ? ? ? ? ???????
因为A 按行对角占优, 因此A 1也按行对角占优。
从而A 1可逆。上述线性方程组有唯一解
x (1)=(ξ2, …,ξn )T .
可以证明 |ξ k |=max {|ξ2|, …,|ξn |} <1,
事实上,若|ξ k |=0 则显然成立。若|ξ k |≠0, 我们有 a k 1+
2
n
ks s
s a
ξ=∑=0 (2 ≤ k ≤ n )
则有 121
n
s
kk k sk
s k
k
s k a a a ξξξ=≠-=
+∑ (2 ≤ k ≤ n ) 如果|ξ k | ≥ 1, 则可得
12||||||n
kk k sk s s k
a a a =≠≤+∑ (2 ≤ k ≤ n )
这和A 对角占优矛盾。
因此|ξ k |=max {|ξ2|, …,|ξn |} <1成立。
利用分块矩阵的性质和x (1)的定义,我们有
det(A)=det (1)
11
0n -???? ? ?????
A x
I = det 1112
11
n b a a A ?? ???
其中 b 11=a 11+
12
n
s s
s a
ξ=∑, |ξs |<1 (s =2,…,n )
从而m 1 ≤ |b 11|≤ M 1, 其余类推可得 0<
1
n
r
r m
=∏|det |A ≤1
n
r r M =≤∏
定理5.4 (H adamard’s inequality ) 设A=(a rs )∈C n×n ,则有
12
2
1
1
1
|()||det |[(||)]n n n
r
rs
r r s A A a
λ====≤∑∏∏(5.1.7)
且式(5.1.7)中等号成立的充分条件是某 a s 0=0或者(a r ,a s )=0 (r ≠ s ), 这里a 1,…,a n 表示A 的n 个列向量。
证明:若a 1,…,a n 线性相关,则式(5.17)显然成立。 不妨设a 1,…,a n 线性无关,则对它们进行Gram-schmidt 正交化过程得到: a 1=b 1 a 2=b 2+λ21b 1 …
a n =
b n +λn 1b 1 +λn 2b 2+…+λn , n -1b n -1 其中b 1 ,b 2,…b n 为正交向量。 从而||a i ||2≥||b i ||2 记B=( b 1 ,b 2,…b n ).
则A=BL, 其中L 为单位下三角矩阵。 |det(A)|2=|det(B)|2=det(B T B)=|| b 1||2?||b 2||2…||b n ||2. ≤|| a 1||2?||a 2||2…||a n ||2.
推广的定理5.4 (H adamard’s inequality )
设A=(a rs )∈C n×n ,则有
2
12
12
2
1
1
1
1
|||()||det |[(||max
)]||n
kl rl n
n
n
l r
rs
n
k
s r r kl
l a a A A a
a
λ======≤-∑∑∏∏∑
证明:由于|det(A)|2=det (A H A )
=det 111(,)H a a A αα
??
???
= det 11111(,)0H H a a A A ααα-??
- ??
?
利用对于任给的β ≠0有1211||/H H H
A A αααβββ-≥
从而有|det(A)|2≤[(a 1,a 1)-|αH β|2/βH A 1β]det(A 1) 我们可以取β =e k ,这样我们就有
|det(A)|2≤[(a 1,a 1)-max k>1|(a 1,a k )|2/(a k ,a k )]det(A 1) (*) 类似推导可以得到命题的证明。 不等式的几何意义在于:
[(a 1,a 1)-max k>1|(a 1,a k )|2/(a k ,a k )]
=||a 1||2[1- (max k>1|(a 1,a k )|/(||a k ||?||a 1||) )2] = ||a 1||2sin 2(∠a 1a k )
如下图所示的多面体的体积应该等于底面积乘以高,
也就是底面积乘以向量h 的长度。根据正弦函数的定义,
h 的长度等于a 1和底面的投影OP 夹角的正弦乘以a 1的长度。 由于正弦函数为在[0,π/2]内为单调增加的,因此高h 的长度 小于a 1的长度乘以a 1和底面的任何一条边a k 的夹角的正弦, 即为角 ∠a 1OP ≤∠a 1O a k 成立。从而我们的估计为a 1q 的长度, 也就是|a 1p |≤ |a 1q |
a 1 h
p
O q a k
定理5.5 (S chur’s inequality )
设A=(a rs )∈C n×n 的特征值为λ1,…,λn ,则有
∑∑===≤
n
r n
s r F rs
r
A a
1
1
,222
||||||||λ
(5.1.9)
证明:根据定理1.43,存在酉矩阵U 使得
A=UTU H
其中T 为上三角矩阵。因此T 的对角元素为 A 的特征值,且有
22
1
1
||n
n
r
kk r k t λ===∑∑2,1
||n
rs
r s t
=≤
∑=tr(T H T) =tr(A H A).
由于酉相似的矩阵有相同的迹。
定义5.3 设A=(a ij )∈C n×n ,称由不等式
|z-a ii |≤R i (5.1.10)
在复平面上确定的区域为矩阵A 的第i 个
Gerschgorin 圆(盖尔圆)G i 的半径(i =1,…,n ).
定理5.6 (Gerschgorin theorem1) 矩阵A=(a ij )∈C n×n 的一切特征值都 在它的n 个盖尔圆的并集之内。 定理5.7 (Gerschgorin theorem2)
由矩阵A 的所有盖尔圆组成的连通部分中 有且仅有A 的k 个特征值(盖尔圆相重时 重复计数,特征值相同时也重复计数). 推论: 若将式(5.1.10)中的R i 改作
∑≠==n
i
j j j
i
ij i a r 1|
|αα (5.1.13) 则定理5.6与定理5.7的结论仍然成立。 其中 αi 为任意的正实数。
利用推论,有时能够得到更精确的 特征值的包含区域。
例5. 严格对角占优矩阵非奇异。
定理5.8 设不可约矩阵*A=(a ij )n×n 有一个 特征值λ在其n 个盖尔圆|z-a ii |≤R i (I=1,…,n) 并集的边界上,则所有 n 个圆周 |z-a ii |=R i (I=1,…,n) (5.1.16) 都通过点λ。
谱与范数的关系:ρ(A)≤||A||
利用定理5.8,加强式(5.1.15) 的结果如下定理 所述。
定理5.9如果A=(a ij )n×n 不可约,且存在i 0使得
∑=∞ j j i A a 1 0||||||则有 ρ(A)<||A||∞ 定理5.10 (Ky Fan)设A=(a ij )∈C n×n ,B=(b ij )∈R n×n , 如果b ij ≥|a ij |(i ,j=1,…,n)则对A 的任一特征值λ, 必有i 使 ii ii b B a -≤-)(||ρλ (5.1.17) 引理2 设σ和τ是两个非负实数,0≤α≤1, 则有 τασ1-α≤ ατ+(1-α)σ 定理5.11 (Ostrowski theorem1) 设A=(a ij )∈C n×n ,0≤α≤1,λ是A 的任一特征值。 则存在i 使得 ααλ-≤-1)]([)]([||T i i ii A R A R a (5.1.19) 推论1. 在定理5.11的条件下,存在i 使得 |λ-a ii |≤αR i (A)+(1-α)R i (A T ) (5.1.24) 关于定理5.11,还有以下的推论 推论2如果A 奇异,取0≤α≤1,则存在i 使得 (1) |a ii |≤[R i (A)]α[R i (A T )]1-α; (2) |a ii |≤αR i (A)+(1-α)R i (A T ). 推论3 对于0≤α≤1,恒成立 (1) ρ(A) ≤max{|a ii |+[R i (A)]α[R i (A T )]1-α}; (2) ρ(A) ≤max{|a ii |+αR i (A)+(1-α)R i (A T )}. 推论4记∑-= n j ij i a A 1 |,|)(ρ取0≤α≤1,则有 })]([)]({[max )(1ααρρρ-≤T i i i A A A (5.1.25) 推论5 (Farnell A B) 2 1)]()([max )(T i i i A A A ρρρ≤ 推论6 (BrauerA ) )}(max ),(max {min )(T i i i i A A A ρρρ≤ 推论7 (Parker W V ) )}()({max 21 )(T i i i A A A ρρρ+≤ 推论8 (Browne E T) )](max )([max 2 1)(T i i i i A A A ρρρ+≤ 定理5.12 (Ostrowski theorem 2) 设A=(a ij )∈C n×n (n ≥2),则对A 的任一特征值λ, 存在i ,j (i ≠j ),使λ属于 Ωij (A)={z|z ∈C,|z-a ii | |z-a jj |≤R i (A)R j (A)} 推论 设A=(a ij )∈C n×n (n ≥2),如果对于 所有的i ≠j,恒有|a ii | |a jj |>R i (A)R j (A),则detA ≠0. 5.2 广义特征值问题 在振动理论中,常常会碰到形式如下的 特征值问题,求数λ使方程 Ax=λBx (5.2.1) 有非零解x ,这里A 为n 阶对称矩阵, B 为n 阶实对称正定矩阵x 为n 维列向量。 当B=I 时,式(5.2.1)就成为普通的特征值问题, 因此式(5.2.1)可以看作是对普通特征值问题的推广。 定义5.5 称形如式(5.2.1)的特征值问题为 矩阵A 相对于矩阵B 的广义特征值问题, 简称为广义特征值问题;称满足式(5.2.1)要求的 数λ为矩阵A 相对于矩阵B 的特征值; 而与λ相对应的非零解x 称之为属于λ的特征向量. (x i ,Bx j )=δij 定义5.6 满足式(5.2.5) 向量系x 1,…,x n 称为 按B 标准正交化向量系;式(5.2.5)的第一式 称作B 正交(共轭)条件, 按B 标准正交化向量x 1,…,x n 具有以下的性质。 性质1 x i ≠0(i =1,…,n) 性质2 x 1,…,x n 线性无关。 5.3对称矩阵特征值的极性 在许多实际问题中,所产生的矩阵往往都具有 对称性。如用等距的差分格式求解调和方程的 第一类边值问题时所出现的矩阵,以及用有限 元法求解某些结构问题时所产生的刚度矩阵, 一般都是对称的,特别是,实对称矩阵在理论 研究与实际应用当中占有比较重要的地位。 因此,本节将着重讨论实对称矩阵的一些性质。 一、实对称矩阵的Rayleigh 商的极性 先引入如下定义 定义5.7 设A 是n 阶实对称矩阵,x ∈R n 。称 0,)(≠=x x x Ax x x R T T (5.3.1) 为矩阵A 的Rayleigh 商。 Rayleigh 商(5.3.1)具有以下的特殊性。 性质1 R(x)是x 的连续函数。 在0点不连续。 性质2 R(x)是x 的零次齐次函数。 事实上,对任意的实数λ≠0,有 ) ()() ()()(x x x A x x R T T λλλλλ= )()(0x R x R x x Ax x T T λ=== 性质3 x ∈L(x 0)(x 0≠0)时,R(x)是一常数。 性质4 R(x)的最大值和最小值存在,且能够在 单位球面S={x|x ∈R n ,||x||2=1}上达到。 补充性质:(Toeplitz 定理)设A 为任意复数矩阵, 定义 S={ z: z=x H Ax, ||x||=1}, 则S 为复平面上的闭凸集。 定理5.16 设A 为实对称矩阵,则 n x x x R x R λλ==≠≠)(max , )(min 0 10 (5.3.3) 推论1 在||x||2=1上,p 1和p n 分别是R(x)的一个 极小点和极大点,即有 R(p 1)=λ1, R(p n )=λn (5.3.5) 推论2 如果λ1=…=λk (1≤k ≤n ),则在||x||2=1上, R (x )的所有极小点为β1p 1+…+βk p k 其中βi ∈R(i =1,…,k),且满足β21+…+β2k =1 推论3. 设A 为实对称矩阵,λ1≤λ2≤…≤λn ,则对于 任意的1≤ r ≤ n 有1min ()T r T r tr λλ==++X X I X AX 其中I r 表示r 阶单位矩阵。 定理5.17 设x ∈L (p r ,p r+1,…,p s ),1≤r ≤s ≤n, 则有 s x r x x R x R λλ==≠≠)(max , )(min 0 (5.3.7) 定理5.18 (Courant-Fischer )设实对称矩阵A 的 特征值按λ1≤λ2≤…≤λn 的次序排列, 则A 的第k 个特征值 2min max{|, ||||1k T k k λ=∈=V x x Ax x V x } 其中V k 是R n 的任意一个k 维子空间,1≤k ≤n. 证明:设A 的特征值λ1≤λ2≤…≤λn 对应的特征向量 为p 1,p 2,…,p n . 构造R n 的子空间W k =L (p k ,p k+1,…,p n ).显然 dim(W k )=n -k +1. 由于对任意的k 维子空间V k , 我们有 V k +W k ?R n 所以n ≥dim(V k +W k ) = dim(W k )+dim(V k )- dim(V k ?W k ) = n -k +1+k - dim(V k ?W k ) 从而 dim(V k ?W k ) ≥ 1。 因此对于任意的k 维子空间V k ,存在 x ∈V k ?W k , 即存在c k ,c k +1,…,c n 使得 x =c k p k +c k +1p k +1+…+c n p n 且||x ||2=1. 从而 x T Ax = 2n i i i k c λ=∑≥λk . 由于V k 的任意性,我们有 2min max{|, ||||1}k T k k λ∈=≥v x x Ax x V x 为了证明相反不等式,令 V k = L (p 1,p 2,…,p k ), 取x ∈ V k , 即存在c 1,c 2,…,c k 使得 x =c 1p 1+c 2p k +1+…+c k p k 且 ||x ||2=1. 从而x T Ax =21 k i i i c λ=∑≤ λk . 所以 2min max{|, ||||1k T k k λ=∈=v x x Ax x V x } 定理5.19 设实对称矩阵A 和A +Q 的特征值分别为 λ1≤λ2≤…≤λn 和μ1≤μ2≤…≤μn ,则有 |λi -μi |≤||Q ||2 (i =1,…,n) (5.3.11) 证明:由于 ||Q ||+μi =2min max{(||||)|,||||1i T i Q Q ++?∈=v x x A I x x V x } ≥2min max{|,||||1i T i ∈=v x x Ax x V x }(因为Q +||Q ||?I 为半正定) =λi 同理可证得反向不等式。 定理5.20 (Hoffman-Wielandt)设实对称矩阵A ,A+Q 和Q 的特征值分别是λ1≤λ2≤…≤λn 和μ1≤μ2≤…≤μn ,和γ1≤γ2≤…,≤γ n 并定义向量u=(λ1,…,λn )T ,v=(μ1,…,μn )T ,w=(γ1,…,γ n )T , 则 ||u-v||2≤||w||2. 定理5.21 (Lidskii-Wielandt)在定理5.20的条件下, u 落在形为v+P w 向量集的凸包(即包含该向量的 最小凸集)中,其中P 取遍所有可能的排列矩阵。 定义5.8 设A ,B 为n 阶实对称矩阵,且B 正定, x ∈R n .称 R(x)=T T x Ax x Bx , x ≠ 0 为矩阵A 相对于矩阵B 的广义Rayleigh 商。 定理5.22 非零向量x 0是R(x)的驻点的充要条件 是x 0为Ax=λBx 的属于特征值λ的特征向量. 推论: 若x ~是 Ax=λBx 的特征向量,则R(x ~)是 与之对应的特征值。 定理5.23 设V k 为R n 的任意一个k 维子空间, 则广义特征问题Ax=λBx 的第k 个特征值和 第n -k +1个特征值具有下列的极小极大性质 )](max [min 0x R k k V x V k ∈≠=λ (5.3.14) )](min [max 01x R k k V x V k n ∈≠+-=λ (5.3.15) 证明:式(5.3.14)和式(5.3.15)等价的,仅需 将A 替换为-A .则可以立即得出结论。 我们仅需证明式(5.3.14)。 设Ax =λBx 的广义特征值λ1≤λ2≤…≤λn 对应的按 B 标准正交的特征向量系为p 1,p 2,…,p n . 构造R n 的子空间W k =L (p k ,p k+1,…,p n ).显然 dim(W k )=n -k +1. 由于对任意的k 维子空间V k , 我们有 V k +W k ?R n 所以n ≥dim(V k +W k ) = dim(W k )+dim(V k )- dim(V k ?W k ) = n -k +1+k - dim(V k ?W k ) 从而 dim(V k ?W k ) ≥ 1。 因此对于任意的k 维子空间V k ,存在 x ∈V k ?W k , 即存在c k ,c k +1,…,c n 使得 x =c k p k +c k +1p k +1+…+c n p n 且x ≠0.. 从而 Ax =λk c k Bp k +λk +1c k +1Bp k +1+…+λn c n Bp n 从而 x T Ax = 2n k k i k c λ=∑,x T Bx = 2n k i k c =∑, 因此R(x)=T T x Ax x Bx ≥ λk . 由于V k 的任意性,我们有 0min[max ()]k k k V x V R x λ≠∈≥ 为了证明相反不等式,令 V k = L (p 1,p 2,…,p k ), 取x ∈ V k , 即存在c 1,c 2,…,c k 使得 x =c 1p 1+c 2p k +1+…+c k p k 且 x ≠0. 从而 R(x)=T T x Ax x Bx 22 1122 1......k k k c c c c λλ++=++ ≤ λk 所以 )](max [min 0x R k k V x V k ∈≠=λ 推论2 设V n -k +1是R n 的任意一个n -k +1维子空间, 则定理5.23或推论1的结论可写成如下形式 1 10max[min ()]n k n k k x V V R x λ-+-+≠∈= (5.3.18) )](max [min 1 101x R k n k n V x V k n +-+-∈≠+-=λ (5.3.19) 对称正定矩阵的补充性质: 设A,B 为对称(半)正定矩阵,矩阵C 为A 和B 的点积,即 c ij =a ij ?b ij , 则C 为对称(半)正定矩阵。 定理5.24 设A ∈R r m×n 的奇异值排列为 0=σ1=…σn-r <σn-r+1≤…≤σn (5.3.21) 则A 的第k 个奇异值和第n-k+1个 奇异值具有下列的极性质 ???? ?? =∈≠220||||||||max min x Ax k k V x V k σ (5.3.22) 2102||||max min ||||k k n k x V V Ax x σ-+≠∈? ? = ??? (5.3.23) 其中V k 是R n 的任一k 维子空间。 定理5.25 设A ∈R r m×n 的奇异值排列同式(5.3.21), (A+Q)∈ m n r R ?' 的奇异排列为 0=τ1=…τn-r <τn-r+1≤…≤τn (5.3.25) 则有 |σi -τi |≤||Q||2 (i =1,…,n) (5.3.26) 定理5.26 设A ∈R r m×n 和(A+Q)∈m n r R ?' 的奇异值 排列分别同式(5.3.21)和(5.3.25), Q ∈m n r R ?'的 排列值为 0=δ1=…n r δ'- <1n r δ'-+≤…≤δn (5.3.29) 定义向量 u=(σ1,…,σn )T ,v=(τ1,…,τn )T ,w=(δ1,…,δn )T 则有 ||u-v||2≤||w||2 5.4 矩阵直积的定义和基本性质. 定义5.9 设A=(a ij )∈C m×n ,B=(b ij )∈C p×q ,则称 如下的分块矩阵 nq mp mn m m n n C B a B a B a B a B a B a B a B a B a B A ?∈? ??? ? ? ??????=? 2122221 11211 (5.4.1) 为A 与B 的直积(Kronecker 积)。 矩阵直积的基本性质: 1).k (A ?B)=(k ?A)?B= A ?(k ?B) 2).若A,B 为同价矩阵,则 (A+B)?C=A ?C+B ?C C ? (A+B) = C ?A+ C ?B 3). (A ?B)?C=A ?(B ?C) 4). (A ?B)(C ?D)=(AC) ?(BD) 证 (B A ?)(D C ?)=()ij a B ()ij c D =1112112n m m mn a a a B B B a a a B B B ?? ? ? ??? 111211 2p n n np c c c D D D c c c D D D ?? ? ? ??? =1112111 1 121 1 1n n n k k k k k kp k k k n n n mk k mk k mk kp k k k a c a c a c B D B D B D a c a c a c B D B D B D ======?? ? ? ? ? ??? ∑∑∑∑∑∑ =11121111121 11n n n k k k k k kp k k k n n n mk k mk k mk kp k k k a c a c a c BD BD BD a c a c a c BD BD BD ======?????? ?? ? ? ? ??????? ? ? ? ?????? ? ? ? ????? ???? ∑∑∑∑∑∑ =BD AC ?. 推论 (1)()()1212l l A A A B B B ? ? ???? =1122l l A B A B A B ?? ?. (2)()()()1122l l A B A B A B ? ??=()()12 12l l A A A B B B ?. 上面两个式子只要等号右边有意义,则左边也有意义,而且两边相等. 5). (A ?B) -1= (A -1?B -1) 6). 若A,B 为三角矩阵,则A ?B 也是三角矩阵。 7). (A ?B) H = (A H ?B H ) 8). 设A m ?m 和B n ?n 都是酉(正交)矩阵, 则A ?B 也是。 9). rank(A ?B)=rank(A)?rank(B) 证 设rank )(A =r 1,rank )(B =r 2. 对矩阵A ,必存在可逆矩阵M 、N ,使得1N A MA =, 其中A 1=??? ? ??0001 E r . 对矩阵B ,必存在可逆矩阵P 、Q ,使得1Q B PB =, 其中B 1=??? ? ??0002 E r . 则由性质4知: A B ?= 1)(MA N ?1)(PB Q =()M P ?11()B A ?()N Q ?. 由性质5知:M P ?、Q N ?仍为可逆矩阵. ∵矩阵乘以可逆矩阵后,其秩不变. ∴rank(B A ?)=rank (A 1?B 1)=r 1r 2= rank )(A rank )(B . 10). tr (A ?B)=tr(A) ?tr(B) 定义1 设A =() a ij n m ?,记()12,,,(1,2, ,)i i mi T i i n a a a a ==, 令vec()A =???? ?? ? ??a a a n 21,则vec()A 称为矩阵A 的列拉直(列展开). 定义2 设A =() a ij n m ?,记()),,2,1(,,,,21m i a a a a in i i T i == 令)(vec _____A ???? ? ? ? ??=a a a m 21,则称)(vec _____ A 为矩阵的行拉直(行展开). 定理 设C C C q p p n n m B X A ???∈∈∈,,,则 (1)vec()AXB =()T B A ?vec()X . 特别地,vec(xy T )= y ?x , 其中,x 和y 分别为m 和n 维列向量. (2)_____ _____ vec()()vec()T AXB A B X =?. 证(1)记()12,, ,p x x x X =,(1,2, ,)n i i p x C ∈=; ()12,,,q b b b B =,(1,2,,)p j j q b C ∈= ,则 vec()AXB =1212vec(,, ,)q q AXb AXb AXb AXb AXb AXb ?? ? ?= ? ?? ?. 而121212(,,,)p i i i pi i i pi AXb b b b b b b AX AX AX A A A =+++=vec()X , ∴ 112111222212vec()vec() ()vec() p p q q pq T A A A A A A AX B X A A A X b b b b b b b b b A B ?? ? ? = ? ? ??? =? (2)设A =() a ij n m ?, ()1122 12,, ,,,vec T T T n T n n X X x x x x x x x X x x ???? ? ? ? ?=== ? ? ? ? ? ???? , 则)(XB A AXB ==1111211212 12 T j n T i i ij in T j m m mj mn T n x B a a a a x B a a a a x B a a a a x B ???? ? ? ? ? ? ? ? ? ? ? ? ? ??? ??? =()()11111111()T j T j T j n n T T j j j j j n n T T ij j ij j j n n T T mj j mj j j B a x a x B B a x a x B B a x a x B ======??????∑∑ ? ??? ? ? ? ? ? ???=∑∑ ? ??? ? ? ? ? ? ??? ? ? ∑∑??????, 即11__________11vec()(vec()n T j j j n T T ij j j n T mj j j a x B AXB X a x B A B a x B ===??∑ ? ? ? ?==∑? ? ? ? ? ?∑?? ). 11). 对于A m ?m 和B n ?n 有:A ?B 相似于B ?A 证明:对于X m ?n 由于X T = 11 n m T ji i j i j x ==∑∑e e =11 n m T T i j i j i j ==∑∑e e Xe e 因此vec(X T )= 11()()()n m T T j i i j i j vec ==?∑∑e e e e X 记P mn = 11 ()()n m T T j i i j i j ==?∑∑e e e e =11 ()()n m T j i i j i j ==??∑∑e e e e 显然,(P mn )T = 11 ()()m n T i j j i j i ==??∑∑e e e e =P nm 则有vec(X T )=P mn vec(X ), 因此vec(X )=P nm vec(X T )=(P mn )T P mn vec(X ) 这样有(P mn )T P mn =I 其中,e i 为n 维的单位向量,而e j 为m 维的单位向量。 性质:如果A 为m ?1的向量和B 为n ?1的向量时,那么 A ?B T =A B T 性质:tr(A T B )= vec(A )T vec(B ) 从而对于矩阵X n ?m 有 vec(BXA T )= (A ?B )vec(X ) 另一方面vec(BXA T )=P mn vec(AX T B T ) =P mn (B ?A )vec(X T ) = P mn (B ?A )P nm vec(X ) 从而(A ?B )vec(X )=P mn (B ?A )(P mn )T vec(X ) 由于X 为任意的n ?m 矩阵,因此有 (A ?B )= P mn (B ?A )P nm = P mn (B ?A ) (P mn )-1 对于矩阵直积,也可以引入方幂的概念。 定义:设A ∈C m ×n ,令 A [1]=A 和A [k +1]=A [k ] ?A ,k =1,2,… 性质:(AB )[k ]=A [k ]B [k ] 证明可以由直积的性质4 :(A ?B )(C ?D )=(AC ) ?(BD ) 简单得到。 对二元函数f (x ,y )= ,0 l i j ij i j c x y =∑及矩阵A ∈C m×n , B ∈ C p×q , 定义f (A ,B )= ,0 n i j ij i j c =?∑A B . 定理5.27 设A m ×m 的特征值为λ1,λ2,…,λm , B n ×n 的特征值为μ1,μ2,…,μn ,则f (A ,B ) 的 全体特征值为f (λi ,μj )(i =1,2,…,m ;j =1,2,…,n ) 推论1设A m×m 的特征值为λ1,λ2,…,λm , B n×n 的特征值为μ1,μ2,…,μn ,则B A ?的 全体特征值为λi μj ,(i=1,2,…,m;j=1,2,…,n). 推论2 设A ∈C m×m ,B=C n×n ,则有 det(B A ?)=(detA)n (detB)m 推论3 设A ∈C m×m ,B=C n×n ,则有 tr(B A ?)=(trA)(trB) 定理5.28 方程 1 l i i i ==∑A XB F 有解的充要条件是 ?? ? ???∈∑=l i T i i B A R F vec 1)(.这里,R(A)表示矩阵A 的 列空间, 12()(,,...,)T T T T n vec =X x x x ,x i 表示X 的第i 行。 定理5.29 设A m×m 的特征值为λ1,λ2,…,λm , B n×n 的特征值为μ1,μ2,…,μn ,则方程 AX +XB =F 有惟一解的充要条件是λi +μj ≠0(I=1,2,…,n). 推论1设A m×m 的特征值为λ1,λ2,…,λm ,B n×n 的特 征值为μ1,μ2,…,μn ,则齐次方程AX+XB=O 有非零解的充要条件是存在i 0与j 0,使00j i μλ+=0。 推论2 设A 是m 阶矩阵,则齐次方程 AX-XA=O 一定有非零解。 定理5.30 设A m×m 的特征值为λ1,λ2,…,λm , B n×n 的特征值为μ1,μ2,…,μn ,则 方程 ∑==l k k k F XB A 有惟一解的充要条件是 1+(λi μj )+…+(λi μj )l ≠0 (i =1,2,…,m;j=1,2,…,n). (1) 齐次方程 ∑==l k k k O XB A 非零解的充要条件是 存在i 0与j 0,使1+(00j i μλ)+…+(00j i μλ)l =0 引理3 设A ∈C m×m ,B=C n×n ,F ∈C m×n 如果A 与B 的特征值的实部都小于零, 则积分 ? +∞ dt Fe e Bt At 存在。 定理5.31 设A ∈C m×m ,B=C n×n ,F ∈C m×n 且A 与B 的 特征值之和不等于零,那么,如果积分 ? +∞ dt Fe e Bt At 存在,则方程 AX +XB =F 的惟一解 中科院矩阵分析与应用大作业 实现LU分解 QR分解 Householder reduction、Givens reduction Matlab 代码: function [] =juzhendazuoye A=input('请输入一个矩阵A='); x=input('请输入序号 1 LU分解 2 Gram-Schmidt分解 3 Householder reduction 4 Givens reduction:' ); if(x==1) %%*************LU分解*****************%% disp('PA=LU') m=size(A,1); % m等于矩阵A的行数 n=size(A,2); % n等于矩阵A的列数 if(m==n) % 判断矩阵A是不是方阵 % 如果矩阵A不是方阵那么就输出“error” U=A; % 把矩阵A赋值给矩阵U L=zeros(n); % 先将L设为单位阵 P=eye(n); % 首先将交换矩阵P设为单位矩阵 for j=1:n-1 for i=j+1:n if (U(j,j)~=0) %判断主元元素是否不为0 L(i,j)=U(i,j)/U(j,j); U(i,:)=U(i,:)-U(j,:)*U(i,j)/U(j,j); % U(j,j)为主元元素 else a=j+1; % 令a等于j+1 while((U(a,j)==0)&&(a 第五章 矩阵分析 本章将介绍矩阵微积分的一些内容.包括向量与矩阵序列的收敛性、矩阵的三种导数和矩阵微分与积分的概念,简要介绍向量与矩阵范数的有关知识. §5.1 向量与矩阵的范数 从计算数学的角度看,在研究计算方法的收敛性和稳定性问题时,范数起到了十分重要的作用. 一、向量的范数 定义1 设V 是数域F 上n 维(数组)向量全体的集合,x 是定义在V 上的一个实值函数,如果该函数关系还满足如下条件: 1)非负性 对V 中任何向量x ,恒有0x ≥,并且仅当0=x 时,才有 x =0; 2)齐次性 对V 中任意向量x 及F 中任意常数k ,有;x k kx = 3)三角不等式 对任意V y x ∈,,有 y x y x +≤+, 则称此函数x (有时为强调函数关系而表示为?) 为V 上的一种向量范数. 例1 对n C 中向量()T n x x x x ,,,21 =,定义 2 22212 n x x x x +++= 则2x 为n C 上的一种向量范数[i x 表示复数i x 的模]. 证 首先,2n x C 是上的实值函数,并且满足 1)非负性 当0x ≠时,0x >;当0x =时,0x =; 2)齐次性 对任意k C ∈及n x C ∈,有 22||||||kx k x = =; 3)三角不等式 对任意复向量1212(,, ,),(,, ,)T T n n x x x x y y y y ==,有 222 221122||||||||()n n x y x y x y x y +=++++ ++ 2221122()()()n n x y x y x y ≤++++ ++ 2 21 1 1 ||2||||||n n n i i i i i i i x x y y ====++∑∑∑(由Cauchy-ВуНЯКОВСКИЙ 不等式) 222222 2 22||||2||||||||||||(||||||||),x x y y x y ≤++=+ 因此 222||||||||||||x y x y +≤+ 所以 2||||x 确为n C 上的一种向量范数 例2 对n C [或n R ]上向量12(,,,)T n x x x x =定义 112||||||||||n x x x x =+++, 1max i i n x x ∞ ≤≤=, 则1||||x 及x ∞都是n C [或n R ]上的向量范数,分别称为1-范数和∞-范数. 证 仅对后者进行证明. 1)非负性 当0x ≠时,max 0i i x x ∞ =>,又显然有00∞=; 2)齐次性 对任意向量()T n x x x x ,,,21 =及复数k , 1.简述模式的概念及其直观特性,模式识别的分类,有哪几种方法。(6’) 答(1):什么是模式?广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。 模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。 模式的直观特性:可观察性;可区分性;相似性。 答(2):模式识别的分类: 假说的两种获得方法(模式识别进行学习的两种方法): ●监督学习、概念驱动或归纳假说; ●非监督学习、数据驱动或演绎假说。 模式分类的主要方法: ●数据聚类:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据 集。是一种非监督学习的方法,解决方案是数据驱动的。 ●统计分类:基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。 特征向量分布的获得是基于一个类别已知的训练样本集。是一种监督分类的方法, 分类器是概念驱动的。 ●结构模式识别:该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目 的。(句法模式识别) ●神经网络:由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以 在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整神经元相互间联 系的权重系数来(weight)实现。神经网络可以实现监督和非监督学习条件下的分 类。 2.什么是神经网络?有什么主要特点?选择神经网络模式应该考虑什么因素? (8’) 答(1):所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处 理系统(计算机)。由于我们建立的信息处理系统实际上是模仿生理神经网络,因此称它为人工神经网络。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。 人工神经网络的两种操作过程:训练学习、正常操作(回忆操作)。 答(2):人工神经网络的特点: ●固有的并行结构和并行处理; ●知识的分布存储; ●有较强的容错性; ●有一定的自适应性; 人工神经网络的局限性: ●人工神经网络不适于高精度的计算; ●人工神经网络不适于做类似顺序计数的工作; ●人工神经网络的学习和训练往往是一个艰难的过程; ●人工神经网络必须克服时间域顺序处理方面的困难; ●硬件限制; ●正确的训练数据的收集。 答(3):选取人工神经网络模型,要基于应用的要求和人工神经网络模型的能力间的 匹配,主要考虑因素包括: 矩阵分析及其应用 3.1矩阵序列 定义3.1设矩阵序列{A (k )},其中A(k)=( a (k ) ) C m n ,当k a j" a u 时,称矩阵序列{A (k)}收敛,并称矩阵 A=( a ij )为矩 阵序列{A (k)}的极限,或称{A (k)}收敛于A,记为 lim A (k) A 或 A (k) A k 不收敛的矩阵序列称为发散的。 由定义,矩阵序列 A (k )发散的充要条件为存在 j 使 得数列a (k)发散。 类似地,我们可以定义矩阵收敛的 Cauchy 定义 定义3.1'矩阵序列{A (k)}收敛的充要条件为 对任给>0存在N(),当k, l N()时有 ||A (k) A (l)|| < 其中||.|为任意的广义矩阵范数。 sin 』) n n sin(k) 如果直接按定义我们因为求不出 A (n)的极限从而 从而只要I 充分大,则当m, n > l 时就有 sin(k) k 2 这样A (l)收敛。 定理3.1 A (k) A 的充要条件为 ||A (k) A|| 0 证明:利用广义矩阵范数的等价性定理,仅对 范数可以证 明。 即c 1 IL A (k) A|| ||A (k) AII C 2 ||A (k) AII 性质 0 若 A (k) A ,则 ||A (k) II IIAII 成立。 性质 1. 设 A (k) A m n , B (k) B m n , 则 A (k)+ B (k) A+ B , ,C 性质 2. 设 A (k) A m n , B (k ) B n l ,贝U A (k) B (k) A B 证明:由于矩阵范数地等价性,我们可以只讨论相容的 矩阵范数。 ||A (k )B (k) A B|| || A (k) B (k) A B (k)||+||AB (k) A B|| || A (k) A|| ||B (k)||+||A||||B (k) B|| 例 1 A (n) k m 1 k(k 1) 相反,由于 第五章 特征值的估计及对称矩阵的极性 本章主要讨论数值代数中的三个特殊理论, 即 特征值的估计 广义特征值问题 实对称矩阵(一般是Hermite 矩阵)特征值的 极小极大原理,其次也涉及到一些特征值 和奇异值的扰动问题,最后简要地介绍矩阵 直积的一些性质及其在线性矩阵方程求解 方面的应用。这几方面的内容,在矩阵的 理论研究与实际应用当中都有着相当重要 的作用。 5.1特征值的估计 一、特征值的界 首先给出直接估计矩阵特征值模的上界的 一些方法 定理5.1 设A=(a rs )∈R n×n ,令 M=||2 1 max ,1sr rs n s r a a -≤≤ λ若表示A 任一特征值,则λ的虚部Im(λ) 满足不等式 2 ) 1(|)Im(|-≤n n M λ |Im(λ)|≤||A -A T ||2 / 2 |Im(λ)|≤||A -A T ||1 ?/2. 证明:设x+i ?y 为对应于λ的A 的特征向量, 则 A(x+i ?y)=(α+β?i)(x+i ?y) 其中λ=α+β?i.显然x,y 为实向量,且x,y 为 线性无关的 向量。 经整理A(x,y)=(x,y)B, 其中B=??? ? ??-αββα 。 从而(x,y)T A(x,y)=(x,y)T (x,y)B 展开有 ???? ??Ay y Ax y Ay x Ax x T T T T =α????? ??y y y x y x x x T T T T + β???? ? ? ?--x y y y x x y x T T T T (求等式两边矩阵的对角元之和,可得 α(x T x +y T y )=x T Ax +y T Ay (1) 等式两边矩阵的左上角单元减去右下角单元 可得: β(x T x +y T y )=x T (A -A T )y 1). 记B=A -A T ,则 |x T By|≤||x||2 ?||B||2?||y||2 从而 |β|≤||x||2 ?||B||2?||y||2 /((||x ||2)2 +(||y ||2)2) 利用ab /(a 2+b 2)≤1/2 可得 |β|≤||B||2 /2. 2). 由于|x T By|≤||Bx||1 ?||y||∞≤||B||1?||x||1 ?||y||∞ 从而 |β|≤||B||1 ?||x||1 ?||y||∞ /((||x ||2)2 +(||y ||2)2) 易证明 ||x||1 ?||y||∞ /((||x ||2)2 +(||y ||2)2) /2. (显然,不妨假设(||x ||2)2 +(||y ||2)2=1, 设||y ||∞=t =cos(α), 则y 必为t ? e j 的形式(为什么?), 从而极值转化为求解如下最大值问题: max ||x||1, 满足约束(||x ||2)2=1-t 2 这样有均值不等式||x||1 x ||2 = -t 2)1/2, 从而我们需要求解t (1-t 2)1/2的最大值,设t =cos(α) 可得t (1-t 2)1/2的最大值为1/2. 从而得证。) 因此 |β|≤||B||1 3). 由于b ii =0, i =1,2,…,n , b ij = -b ji , 因此 |x T By|2=| 1 1()n ij i j j i i j i b x y x y -=>??-∑∑|2 ≤(2M )2 2 1||n i j j i i j i x y x y =>??- ??? ∑∑ (利用(a 1+a 2+…+a n )2≤ n ((a 1)2+(a 2)2+…+(a n )2) ≤(2M )2 (n (n -1)/2) 21||n i j j i i j i x y x y =>??- ??? ∑∑ 一、中国科学院数学与系统科学研究院简介 中国科学院数学与系统科学研究院由中科院数学研究所、应用数学研究所、系统科学研究所及计算数学与科学工程计算研究所四个研究所整合而成,此外还拥有科学与工程计算国家重点实验室、中科院管理决策与信息系统重点实验室、中科院系统控制重点实验室、中科院数学机械化重点实验室、华罗庚数学重点实验室、随机复杂结构与数据科学重点实验室,以及中科院晨兴数学中心和中科院预测科学研究中心等。2010年11月成立国家数学与交叉科学中心,旨在从国家层面搭建一个数学与其它学科交叉合作的高水平研究平台。数学与系统科学研究院拥有完整的学科布局,研究领域涵盖了数学与系统科学的主要研究方向。共有16个硕士点和13个博士点(二级学科),分布在经济学、数学、系统科学、统计学、计算机科学与技术、管理科学与工程六个一级学科中,可以在此范围内招收和培养硕士与博士研究生。在2006年全国学科评估中,我院数学学科的整体评估得分为本学科的最高分数。数学与系统科学研究院硕士招生类别为硕士研究生、硕博连读生和专业学位硕士研究生。2019年共计划招收122名。 二、中国科学院大学概率论与数理统计专业招生情况、考试科目 三、中国科学院大学概率论与数理统计专业分数线2018年硕士研究生招生复试分数线 2017年硕士研究生招生复试分数线 四、中国科学院大学概率论与数理统计专业考研参考书目 616数学分析 现行(公开发行)综合性大学(师范大学)数学系用数学分析教程。 801高等代数 [1] 北京大学编《高等代数》,高等教育出版社,1978年3月第1版,2003年7月第3版,2003年9月第2次印刷. [2] 复旦大学蒋尔雄等编《线性代数》,人民教育出版社,1988. [3] 张禾瑞,郝鈵新,《高等代数》,高等教育出版社, 1997. 五、中国科学院大学概率论与数理统计专业复试原则 在中国科学院数学与系统科学研究院招生工作小组领导下,按研究所成立招收硕士研究生复试小组,设组长1人、秘书1人。 复试总成绩按百分制计算,其中专业知识成绩占60%,英语听力及口语测试成绩占20%,综合素质成绩占20%。 在面试环节,每位考生有5分钟自述,考查内容主要包括专业知识、外语(口语)水平和综合素质等。 1、专业知识面试重点考查考生对专业基础知识掌握的深度和广度,对知识灵活运用的程度以及考生的实验技能和实际动手能力等,了解考生从事科研工作的潜力和创新能力。 2、外语面试主要考查考生的听、说能力及语言运用能力。 3、思想品德的面试包括考生的政治态度、思想品德、工作学习态度、团队合作精神、科研道德、遵纪守法以及心理素质等内容。 4、体检主要了解考生的身体健康状况,也包括体能、体质和心理素质等。 5、研究生部通过“政审表”向考生所在单位的人事、政工或考生管理部门了解考生的思想品德情况和现实表现。“政审表”将根据中国科学院大学时间部署与调档函一并寄发,需由考生本人档案所在单位的人事(政工)部门加盖公章,随档案一并寄回。政审合格方可寄发录取通知书。 六、中国科学院大学概率论与数理统计专业录取原则 复试小组对本学科参加复试的考生根据初试成绩和复试成绩的综合评定,得出拟录取考生名单,经数学与系统科学研究院招生工作领导小组审核通过。 最终录取成绩:将考生初试成绩和复试成绩按一定比例加权平均后,得出录取成绩。加权平均采用下列公式: 录取成绩=(初试成绩÷5)×40%+复试成绩×60%。复试成绩不合格者不予录取;政审不合格、体检不合格者不予录取。 拟录取名单确定后将在网站上公示10个工作日 七、中国科学院大学概率论与数理统计考研复习建议 1、零基础复习阶段(6月前) 中科院矩阵分析与应用大作业 实现LU分解QR分解Householder reduction、Givens reduction Matlab 代码: function [] =j uzhendazuoye A=input ('请输入?个矩阵A='); 2 Gram-Schmidt 分解 3 Householder reduction 4 x=input (*请输入序号1 LU分解 Givens reduction: 1); if (>:==!) 壮mmm分解mm%% disp('PA=LU1) m=size(A,1); %nt等于矩阵A的行数 n=size(A,2); %n等于矩阵A的列数 if (m==n) % 刊斯NA是不足方阵 % 如果矩阵A不是方阵那么就输出"error" U=A; %把矩阵至賦值给矩阵u L=zeros(n); %先将L设为单位阵 P=eye(n); %首先将交换矩阵P设为单位矩阵 for j =1:n-1 for i=j +1:n if (U(j, j)-=0) %判断主元元素是否不为0 L(i z j)=U(i z j) /U(j z j); U(i f :)=U(i, :)-U(j, j)/U(j z j); % U(j, j)为主元元素 else a=j+l;% 令 a 等于j + 1 while ( (U (a, j ) ==0) && (a 第4章 矩阵分解与表示 (I)高斯消去法 假设矩阵A 的顺序主子式i D ≠0 (i=1,…,n-1), 则我们可以进行以下的顺序消元过程 1.消元过程 n k k i b m b b n k k j i a m a a k k ik k i k i k kj ik k ij k ij ,,2,1,,,2,1,,) () () 1()()()1( ++=-=++=-=++ 等价于用初等矩阵T k k k e l I L -=分别 左乘)(k A 和)(k b ,即 )()1(k k k A L A =+ (1) 其中,T k n k k k k k m m m l ),,,,0,,0(,,2,1 ++=, n k i a a m k kk k ik ik ,,1,/)()( +== 我们称ik m 为消元因子,)(k kk a 为主元素; 消元过程的一个重要性质是:消元过程不改 变矩阵的顺序主子矩阵的行列式(顺序主子式)的值。 例 ???? ??????---=012131121A ,顺序主子式为,1,5,-10 ???? ??????--?????→?++250050121)1*(2)3(),1()2(,顺序主子式为,1,5,-10 ???? ??????--??→?-200050121)2()3(,顺序主子式为,1,5,-10 引理:约化的主元素)(i ii a ≠0的充要条件是 矩阵A 的顺序主子式i D ≠0 (i=1,…,k); 推论:若矩阵A 的顺序主子式i D ≠0 (i=1,…,k),则 1)1(11D a =,k i D D a i i i ii ,,2,1,/1)( ==-; 由此有若A 对称正定或严格对角占优,而 它们的顺序主子矩阵也是对称正定或严格 对角占优,从而顺序主子式不为0,顺序高斯 消去过程可进行; 2.回代过程: ()() ()()()1/()/, 1,2,,1n n n n nn n k k k k k kj kk j k x b a x b a a k n n =+?=??=-???=--?∑ 第五章特征值的估计及对称矩阵的极性本章主要讨论数值代数中的三个特殊理论,即 特征值的估计 广义特征值问题 实对称矩阵(一般是Hermite矩阵)特征值的极小极大原理,其次也涉及到一些特征值和奇异值的扰动问题,最后简要地介绍矩阵直积的一些性质及其在线性矩阵方程求解方面的应用。这几方面的内容,在矩阵的理论研究与实际应用当中都有着相当重要的作用。 5.1特征值的估计 一、特征值的界 首先给出直接估计矩阵特征值模的上界的 一些方法 定理 5.1 设A=(a rs) R n X1,令 1 , , M= ma彷总a sr| 若表示A任一特征值,则的虚部Im() 满足不等式 |Im( )| M n(n21) |Im( )| ||A A T||2 / 2 |Im( )| ||A A T||1n /2. 证明:设x+i y为对应于的A的特征向量, 则A(x+i y)=( + i)(x+i y) 其中=+ i.显然x,y为实向量,且x,y为线性无关的向量。 经整理A(x,y)=(x,y)B, 其中B= 从而(x,y) T A(x,y)=(x,y) T(x,y)B 展开有 i 1 j i T T X y X X T T y y y X (求等式两边矩阵的对角元之和,可得 (x T x+y T y)=x T Ax+y T Ay (1) 等式两边矩阵的左上角单元减去右下角单元 可得: (x T x+y T y)=x T (A A T )y 1) . 记 B=A A T ,则 |x T By| ||x||2||B||2||y||2 从而 1 1 1凶|2 ||B||2||y||2 /((||x||2)2 +(||y|2)2) 利用 ab/(a 2+b 2) 1/2 可得 | | ||B||2 /2. 2) . 由于 |x T By| ||B X ||I ||y|| ||B||i ||X ||I ||y|| 从而 | | ||B||i ||x||i ||y|| /((||X |2)2 +(||y||2)2) 易证明 ||x||i ||y|| /((||X ||2)2 +(||y||2) 2) n /2. (显然,不妨假设(||X ||2)2 +(||y||2)2=1, 设HyH =t=cos (),则y 必为t e 的形式(为什么?) 从 而极值转化为求解如下最大值问题: max ||X ||1,满足约束(||X ||2)2=1 t 2 这样有均值不等式 ||x|h i n ||X ||2= 、、n (1 t 2)1/2, 从而我们需要求解t(1 t 2)1/2的最大值,设t=cos() 可得 t(1 t 2)1/2的最大值为1/2.从而得证。) 因此 11 ||B||1 . n /2. 3) . 由于 b ii =0, i =1,2,…,n, b ij = b ji , n 1 因此 x T By|2=| b ij (X y j X j y i )|2 i 1 j i 2 n (2M)2 |xy j X j Y i | i 1 j i (利用(a 1+a 2+…+a n )2 n((a 1)2+(a 2)2+ …+(a n )2) n (2M)2(n(n 1)/2) | X y j X j yj 2 X T A X y T Ax X T Ay y T Ay T T X X X y T T X y y y 二、经验类 [quote]1:考中科院科大完全攻略! 普物类 力学科大出版社杨维宏很好的教材 电磁学高教社赵凯划经典教材(科大出版社的也不错) 热学高教社褚圣麟经典教材(科大出版社的也不错)已经出版了对照的习题解答 上述3门是普物a b的考试范围,弄清楚课后习题足够了! 电动力学郭硕鸿高教社已经出版了对照的习题解答 理论力学高教社已经出版了对照的习题解答 光学赵凯华北大出版社 量子类 量子力学卷1曾谨言科学出版社,最好同时购买习题集的上下册非常好搞清楚就足够了! 周世勋高教社《量子力学》入门型已经出版了对照的习题解答! 考科大、中科院的用这些足够了。还有哪些?大家提出我补充。现在资料更新很快,很多抖出了专门的习题集建议大家看最新的,00年以前的老掉牙的东西没什么用处了。 引用 2、各位朋友大家好:也谈中国科大物理辅导班笔记,物理教材! 我是科大研究生想告诉大家,不要太指望辅导班笔记。 看到不少人受到误导心痛不已,其实复习就是很简单的事情,很多教材的选择也就是基础常见的就足够了, 高教版的基本都是非常经典的还要习题集的选择电磁学力学等太多了,不过建议大家看一些比较新的资料。 老掉牙的就算了n年了,编这些书的老师估计早就退休了! 下面几个常见问题: 中国科大物理辅导班笔记,物理教材!(我觉得这个帖子很好) 1 辅导班何时开办? 每年的11月中旬,到12月20左右出来! 1 考科大用什么教材? 其实这个问题很简单了,当然最好是科大教材了,如果是科大习题集最好了,现在科大教材变化很快毫无疑问最好的教材就是最新的。多少年来变化很大的,但是科大教材不是好教材,力学其实复旦的比较好,科大yangweihong的觉得很一般,不过习题不错。电磁学毫无疑问是高教社的zhaokaihua的好啊,科大张玉民的也是很一般的教材。原子物理也是推荐高教社chushe nglin的很经典的教材。但是教材归教材,习题集最好还是选择科大这个道理很简单了 1 为什么考科大物理? 2科大物理国内一流国际闻名科大全公费住宿免费补助待遇每月500以上设备先进值得你去努力 2 外校能否报名? 不能,就是科大校内的学生也要凭借学生证,不是科大物理系的就很难接受。 3 辅导班笔记含金量多高? 辅导班笔记其实就是串讲班不叫辅导班,所以就是科大物理各门的大复习。知识点几乎面面据到! 4 市场上的辅导班笔记可信么? 这个我觉得还是大家自己判断为好。你相信外部人有么?自己决定! 5 给你辅导班笔记怎么判断真假? 首先要考虑对方可能会有么?如果可能有,对比一下是不是往年的笔记可信度多大?科大官方部不提供这个咨询服务。 6 如果没有辅导班笔记怎么复习? 扎扎实实的复习力学电磁学原子物理量子力学建议使用科大版本教材,道理很简单了。其实很多其他教材也不错,科大的很多教材很差不想想你想像的那么好! 引用 3、关于中科大中科院量子力学和普通物理考研试题的若干说明 热烈欢迎2008年考中科大中科院的同学们!!! 2008年考研的要提前准备才充分!!! 中国科学院的一些招生单位(包括物理所和高能所在内),在06年研究生入学考试抛弃了以前科大的命题,改由中科院研究生院命题。实际上就是由以前中科大的老师出题,变为中科院的研究机构的那些导师出题。(据了解,一些导师接到出题任务都很烦,因为科研压力大啊,出题就让自己带的研究生随便在习题集上 【最新整理,下载后即可编辑】 第五章 矩阵分析 本章将介绍矩阵微积分的一些内容.包括向量与矩阵序列的收敛性、矩阵的三种导数和矩阵微分与积分的概念,简要介绍向量与矩阵范数的有关知识. §5.1 向量与矩阵的范数 从计算数学的角度看,在研究计算方法的收敛性和稳定性问题时,范数起到了十分重要的作用. 一、向量的范数 定义1 设V 是数域F 上n 维(数组)向量全体的集合,x 是定义在V 上的一个实值函数,如果该函数关系还满足如下条件: 1)非负性 对V 中任何向量x ,恒有0x ≥,并且仅当0=x 时,才有x =0; 2)齐次性 对V 中任意向量x 及F 中任意常数k ,有 ;x k kx = 3)三角不等式 对任意V y x ∈,,有 y x y x +≤+, 则称此函数x (有时为强调函数关系而表示为?) 为V 上的一种向量范数. 例1 对n C 中向量()T n x x x x ,,,21 =,定义 2 22212 n x x x x +++= 则2x 为n C 上的一种向量范数[i x 表示复数i x 的模]. 证 首先,2n x C 是上的实值函数,并且满足 1)非负性 当0x ≠时,0x >;当0x =时,0x =; 2)齐次性 对任意k C ∈及n x C ∈,有 22||||||kx k x = =; 3)三角不等式 对任意复向量 1212(,, ,),(,, ,)T T n n x x x x y y y y ==,有 222 221122||||||||()n n x y x y x y x y +=++++ ++ 2221122()()()n n x y x y x y ≤++++ ++ 2 2 1 1 1 ||2||||||n n n i i i i i i i x x y y ====++∑∑∑(由Cauchy-ВуНЯКОВСКИЙ不 等式) 22 2222 2 22||||2||||||||||||(||||||||), x x y y x y ≤++=+ 因此 222||||||||||||x y x y +≤+ 所以 2||||x 确为n C 上的一种向量范数 例2 对n C [或n R ]上向量12(,,,)T n x x x x =定义 112||||||||||n x x x x =+++, 1max i i n x x ∞ ≤≤=, 则1||||x 及x ∞都是n C [或n R ]上的向量范数,分别称为1-范数和∞-范数. 矩阵分析及其应用 3.1 矩阵序列 定义3.1 设矩阵序列{A (k)},其中A (k)=() (k ij a )∈C m ?n ,当k →∞, )(k ij a →a ij 时,称矩阵序列{A (k)}收敛,并称矩阵A=(a ij )为矩 阵序列{A (k)}的极限,或称{A (k)}收敛于A, 记为 A A k k =∞ →)(lim 或 A (k)→ A 不收敛的矩阵序列称为发散的。 由定义,矩阵序列A (k) 发散的充要条件为存在ij 使 得数列) (k ij a 发散。 类似地,我们可以定义矩阵收敛的Cauchy 定义 定义3.1' 矩阵序列{A (k)}收敛的充要条件为 对任给ε>0 存在N(ε), 当 k , l ≥ N(ε) 时有 ||A (k)-A (l )|| < ε 其中||.||为任意的广义矩阵范数。 例1 ???? ? ? ??- =∑=-n k n n k k e n n 12) ()sin()1sin(11A 如果直接按定义我们因为求不出A (n )的极限从而 很难应用定义3.1证明收敛。 相反,由于∑∑∑+=+=+=-≤≤n m k n m k n m k k k k k k 112 1 2 ) 1(1 1 ) sin( < 1/m 从而只要l 充分大,则当m, n > l 时就有 ε≤∑ +=n m k k k 1 2 ) sin( 这样A (l ) 收敛。 定理3.1 A (k)→ A 的充要条件为 ||A (k) -A||→0 证明:利用广义矩阵范数的等价性定理,仅对∞范数可以证明。 即 c 1 ||A (k) -A||∞ ≤ ||A (k) -A||≤ c 2 ||A (k) -A||∞ 性质0 若A (k)→ A , 则 ||A (k)|| → ||A|| 成立。 《矩阵分析》作业布置 第三章 章末习题:3-1,3-30,3-25,3-12,3-13,3-14,3-27,3-20,3-19,3-28(1)(2) 3-26,3-22,3-9,3-3(1),3-16,3-23 注:题3-261λ2 应改为1 λ 2 补充题: #3*1 试证:向量长度的齐次性,即,,.n k k k C C ααα=?∈∈ #3*2 试证:在任意酉空间V 中成立广义商高定理: 2 2 2 ,&(,)0V αβαβαβ αβ∈=?+=+ #3*3令()()()1231,1,1,1,3,3,1,1,2,0,6,8T T T ααα==--=-。求12,3{,}Span ααα的一个标准正交基。 #3*4 试证下列矩阵是酉矩阵:(i )0000 1?????? ? ?? ? (ii )0i 000i i 00?? ? ? ?-??, #3*5 用归纳法证明下列结论:(i ) 对任意正整数n 成立1+3+5+……+(2n-1)=2 n .(ii)对任意正整数k 成立: 2 22 11k 1&(,)0,k i j k V i j αααααααα∈=?≠?+=+……………… #3*6 试证:A=001 0001i i i ?? ? - ? ?+?? ,(i =为正规矩阵。试问:A 是否为H 矩阵,反H 矩阵,或酉矩阵?为什么? #3*7 试证:对正定矩阵A 存在正定矩阵S 使得k S A =,其中k 为任意正整数。 第四章 章末习题:4-1(1)(2);4-2 (其中矩阵A 代之以101001?? ? ? ??? ) 补充题: #4*1 ***,,,,,m n m m n n A B C A UBV U U V U ∈=∈∈若则称 B 与A 酉等价。 试证:B 与A 酉等价当且仅当B 与A 有相同奇异值集。 #4*2 设***A ,,m n m m n n r C U U V U ∈∈∈使得* 1r 0,(,00U AV diag b Λ?? =Λ= ??? ……,b), 矩阵分析及其应用 3.1矩阵序列 定义3.1设矩阵序列{应)},其中A?)=(#))£Cms,当k—oo, 佝时,称矩阵序列{A00}收敛,并称矩阵A=(佝)为矩阵序列{A00}的极限,或称{A00}收敛于A,记为lim A a)= A或A,k)-> A ks 不收敛的矩阵序列称为发散的。 由定义,矩阵序列A(k)发散的充要条件为存在ij使 得数列站发散。 类似地,我们可以定义矩阵收敛的Cauchy定义 定义31矩阵序列{A00}收敛的充要条件为 对任给£>0存在N(E),当k,l> N(E)时有 IIA(k)-A(/)ll < £ 其中11.11为任意的广义矩阵范数。 例 1 A(n) e~n sin(-) n y,sin(R) k=l K 7 如果直接按定义我们因为求不出A㈤的极限从 而很难应用定义3.1证明收敛。 相反,由于t^< t^< v 1/m 从而只要/充分大,则当m, n > /时就有 n z sin(A) 这样A")收 定理3.1 A(k)->A的充要条件为 HA'10-AII T O 证明:利用广义矩阵范数的等价性定理,仅对co范数可以证明。 即ci IIA(k) -AIL < IIA(k) -All< c2 IIA(k) -AIL 性质 1.设A(k,—> A mxn, B,k,—> B mxn>则 a- A(k)+P ? B(k) -> a- A+P B, V a,PeC 性质2.设A(k)—> A mxn, B,k)—> B nx/,则 A(k)由如一A B 证明:由于矩阵范数地等价性,我们E以只讨论相容的 矩阵范数。 IIA(k).B(k)-A-BII < II A(k) -B(k) -A-B(k)ll+IIAB(k)- A-BII 第 2 章范数理论及其应用 2.1向量范数及I p范数 定义:如果V 是数域K 上的线性空间,且对于 V的任一向量x,对应一个实数值ixil,它满足以下三个条件: 1)非负性:||x|| 0,且||x||=0 x=0; 2)齐次性:iikxii=iki iixii,k K; 3)三角不等式:||x+y|| ||x||+||y||. 则称||x|为V上向量x的范数,简称为向量范数。 可以看出范数||||为将V映射为非负数的函数。注意:2)中|k|当K为实数时为绝对值, 当K 为复数域时为复数的模。 虽然向量范数是定义在一般的线性空间上的,但是由于前面的讨论,我们知道任何n 维线性空间在一个基下都代数同构于常用的n维复(或实)列向量空间, 因此下面我们仅仅讨论n 维复(或实)列向量空间就足够了下面讨论如下:1?设||||为线性空间V n的范数,任取它的一个 基X i,X2,…,X n,则对于任意向量X,它可以表示为 x= 1X1+ 2X2+ …+ n X n 其中,(1, 2,…,n)T为X的坐标。 由此定义C n(或R n)中的范数如下: || ||C = () = || 1X1+ 2X2+ …+ n X n|| 则容易验证|| ||C确实为C n中的范数. 2?反之,若|| |C为C n中的范数,定义V n的范数如下:||X||= (X)=|| ||c 其中X= 1X1+ 2X2+ …+ n X n。 则容易验证(X)确实为V n的范数。 这个例子充分说明了一般线性空间的范数和n维 复(或实)列向量空间的范数之间的关系。这也是为我们只讨论n 维复(或实)列向量空间的范数的理由. 范数首先是一个函数,它将线性空间的任意向量映射为非负实数。 范数与函数 性质 1. 范数是凸函数, 即|| (1 )X+ y|| (1 )||X||+ ||y|| 其中0 clc,clear,close all; A=input('请输入需要进行LU分解的方阵:'); [m n]=size(A); %判断矩阵是否为方阵 if m~=n error('矩阵非方阵,请重新输入!'); end %判断矩阵是否奇异 if det(A)==0 error('矩阵奇异,请重新输入!'); end %判断矩阵顺序主子式是否全不为0 n=size(A,1); flagMat=zeros(n,1); for i=1:n if det(A(1:i,1:i))==0 flagMat(i)=1; end end %以顺序主子式是否含0来决定采用的LU分解方式if any(flagMat)==0 disp('顺序主子式均不为0,采用A=LU'); [L U]=LUFull(A) else disp('顺序主子式存在0,采用PA=LU'); [L U P]=LUPart(A) end %对矩阵A进行LU分解(完全主元法) %L,U矩阵为输出变量;A矩阵为输入变量 U=zeros(size(A));%对U尽可能初始化 U(1,:)=A(1,:); L=eye(size(A));%对L尽可能初始化 L(2:end,1)=A(2:end,1)/A(1,1); n=size(A,1); for i=2:n%Dolittle公式 for j=i:n U(i,j)=A(i,j)-L(i,1:i-1)*U(1:i-1,j); end for k=i:n L(k,i)=(A(k,i)-L(k,1:i-1)*U(1:i-1,i))/U(i,i); end end %对矩阵A进行LU分解(部分主元法) %L,U,P矩阵为输出变量,A矩阵为输入变量 %对输入矩阵A重构 n=size(A,1); B=zeros(n,1); for i=1:n B(i,1)=B(i,1)+i; end A=[A B]; %目标矩阵 tempMat=zeros(size(A)); for j=1:n%第j列 [~,row]=max(abs(A(j:end,j)));%找出第j列最大元素,返回所在行A([row+j-1j],:)=A([j row+j-1],:);%交换最大元素行与第j行 tempMat(j,:)=A(j,:);%将第j行元素复制到tempMat第j行for i=j:n%第i行 if i+1<=n tempMat(i+1,j)=A(i+1,j)/A(j,j); end end %生成新的A(高斯消去) for k=j:n%第k行 if k+1<=n ratio=-A(k+1,j)/A(j,j); A(k+1,j+1:n)=ratio*A(j,j+1:n)+A(k+1,j+1:n); end end end %提取U矩阵 U=triu(tempMat(:,1:n),0);%upper triangle %提取L矩阵 L=tril(tempMat(:,1:n),0);%lower triangle for i=2:n for j=1:(i-1) L(i,j)=L(i,j)./L(j,j); end end中科院矩阵分析与应用大作业
第五章矩阵分析(改)
中科院-模式识别考题总结(详细答案)
中科院矩阵分析chapt3
中科院矩阵分析_第五章
2020-2021年中国科学院大学(中科院)概率论与数理统计考研招生情况、分数线、参考书目及备考经验
中科院矩阵分析与应用大作业
中科院矩阵分析chapt4
中科院矩阵分析_第五章
中科院-科大真题最完整版+考试攻略
第五章矩阵分析(改)(完整资料).doc
中科院矩阵分析课件
矩阵分析
中科院矩阵分析课件.doc
中科院矩阵分析_第二章
LU分解(中科院矩阵分析大作业)