数理统计习题解答
第五章
1.设随机变量X 和Y 相互独立都服从)4,0(2
N ,而1216,,
,X X X 和1216,,,Y Y Y 分别来自
正态总体X 和Y 的样本。则统计量 16
11621
i
i i
i X
v Y
===
∑∑__t____分布,参数为__16____。
解:由于∑==16
1161i i X X ~)1,0(N ,而4i X ~),(10N ,∑∑===1612216
1161)4
(i i i i Y Y ~)16(2χ,根据t 分布的定义,
)16(~16
16116116
1
216
1
16
12
16
1t v Y
X
Yi X i i
i i
i i i ==
∑∑∑∑====
2、设4321,,,x x x x 是来自正态总体)2,0(2
N 的简单随机样本。
221234(2)(34)x a x x b x x =-+-,则当____=a ,____=b 时,统计量x 服从2χ分布。
其自由度为_____。
解:统计量量x 服从2
χ分布。只有当)2(21x x a -3434b x x -()
都服从标准正态分布时,x 才服从)
2(2
χ
,因为)2,0(~2N x i ,则有0=i Ex ,2
2=i Dx ,12[(2)]0E a x x -=,
D [)4()(2121Dx Dx a x x a +=-] = 20a = 1,而从 20
1
=a 。
同理:3434[(34)][916]1001D b x x b Dx Dx b -=+==,所以100
1=
b , 所以 )2(~)43(100
1)2(2012243221χx x x x x -+-=
3、设12,,
,n x x x 是来自正态总体),(2σμN 的简单随机样本。其中2,σμ未知,则下面不
是统计量的是(D )
A 、 i x
B 、∑=-n i i x n x 11
C 、∑=--n i i x x n 1)(11
D 、2
1
)(1∑=-n
i i x n μ 4、设12,,
,n x x x 是x 的样本。x 的期望为Ex ,且∑==n
i i x n x 1
1,则有:(B )
A 、 Ex x =
B 、Ex x E =
C 、Ex n
x 1
=
D 、Ex x ≈ 5、设总体)1,0(~N x ,从总体取一个容量为6的样本)(621,x x x 。设
26542321)()(x x x x x x Y +++++=。试决定常数C ,使得随机变量CY 服从2χ分布。
解:因为)3,0(~321N x x x ++,所以,
)1,0(~3
3
21N x x x ++,
从而 22123(
~(1)3χ,同理 2
2456~(1)3
χ(), 由2
χ分布的性质可知:)2(~)3
(
)3
(
3
1
226
5423
21χx x x x x x Y +++++=,所以3
1=
C 。 6、设总体x 任意,期望为μ,方差为2
σ,若至少以95%的概率保证σμ1.0||<-x 。问:
总体样本容量应该多大?
解:因为n 很大时,x 近似服从),(2
μ
σμN ,由题设有 {}{}
||0.10.10.10.10.10.10.1/(0.1)(0.1)2(0.1)10.95
P x P x x P n n n P n n n n n n μσμσμσμσμμμσμσσσσ-<=-<<+????---+-??=≤≤????
?????=-≤≤??=Φ-Φ-=Φ-≥
由(0.1)0.975n Φ≥,反查正态分布表得96.11.0≥n ,385≥n ,故样本容量至少取385才能满足要求。
7、利用切比雪夫不等式求钱币需抛多少次才能使子样均值x 落在0.4到0.6之间的概率至少为0.9?如何才能更精确的计算使概率接近0.9,而抛得次数是多少? 解:设需抛钱币次数n 次,又设第i 次抛钱币时???=次出现反面
第次出现正面
第i i x i 01 n i 2,1=
则i x 独立同分布,分布为{}211=
=i x P ,{}210==i x P ,21=i Ex ,4
1
=i Dx , ∑==n i i x n x 11是样本均值,则21=x E ,n x D 4
1
=。由切比雪夫不等式
{}{}{}
1.0|)(|1.05.01.06.04.0<-=<-<-=< 9.04100 1)1.0()(1)1.0()(12 2=-=-=- ≥n x D x D 所以2504 .0100 == n ,即抛250次钱币可保证{} 9.06.04.0≥< {} 0.50.40.6111444(0.2)(0.2)2)10.9 x P x P n n n n n n ????-<<=≤≤????=Φ-Φ-=Φ-≥ 由)0.95n Φ≥,反查正态分布表得645.12.0≥n ,即68≥n ,只需抛68次即可。 8、设总体为指数分布,分布密度为???≤>=-0 ,00,);(x x e x f x λλλ,求)(x E ,)(x D ,)(2 S E ? 解:λ1)(=i x E , 21 )(λ =i x D , =x ∑=n i i x n 11,11111 ()n i i E x Ex n n n λλ===??=∑, () 2221 2 1111 λ λn n n Dx n x D n i i =??= =∑=, () 221 2 112 2 )1(11111)1(11))(11(λλλ-=?-=-=--=--=∑∑∑===n n n n Dx n x E n x xi n E s E n i i n i i n i 第六章 1. 设总体X 在区间[]θ,0上服从均匀分布,则未知参数θ的矩估计量为_____。 解:X 的概率密度为[]?????∈=其他 ,0,0,1 )(θθx x f 从而21211 20 θθθθθ =?=? =? dx x Ex ,即:Ex 2=θ,故θ的矩阵估计量为?2x θ =。 2. 设总体),(~2 σ μξN ,μ未知,2σ已知,为使总体均值μ的置信度为 α-1的置信区间的长度不大于L ,则样本容量n 至少应为________。 解:由题可知,μ的置信度为α-1的置信区间为),(2 12 1n u n u σ ξσ ξαα- - +-。其长 度不大于L ,即为 L n u ≤- σ α 2 12,2 2 21)(4L u n σα - ≥ ∴, 故填:2122 4()u n L ασ-???? ≥?????? ,[]x 为取整函数。 3. 设总体),(~2 σμN X ,其中2 σ已知,则总体均值μ的置信区间长度L 与置信度α -1的关系是( A )。 (A )当α-1缩小时,L 缩短。 (B)当α-1缩小时,L 增大。 (C )当α-1缩小时,L 不变。 (D)以上说法都不对。 解:由题设,2 σ已知,μ的置信度为α-1的置信区间为) ,(2 12 1n u n u σ ξσ ξαα- - +-则其区间长度为n u L σ α 2 12- = ,其中2 1α -u 为标准正态分布的上侧2 1α - 的分位数,当α -1缩小时,即α增大,2 1α- u 减小,而n σ 不变。故区间长度L 缩短,选(A )。 4. 设总体),(~2 σμN X ,其中2 σ未知,若样本容量n 的置信度α-1均不变,则对于不 同的样本观测值,总体均值μ的置信区间的长度为(D ) (A) 变长 (B )变短 (C )不变 (D ) 不能确定 解:因为),(~2 σμN X ,则 )1(~--n t n s X μ ,故μ的置信度为α-1的置信区间是),(2 )1(12 )1(1n s t X n s t X n n -- -- +-αα,长度为n s t n 2 )1(12-- α。由于样本容量n 和置信度 α-1不变。故区间长度仅与s 有关,对于不同的样本观察值。S 如何变化不确定,因而 其长度不能确定。故选(D )。 5. 设随机变量X 的概率密度为σ α | |21)(x e x f -=,+∞<<∞-x ,0>σ。12,,,n x x x 是容量为n 的子样,试求σ的极大似然估计。 解:似然函数为11 || || 11()(2)2n i i i x n x n i L e e σσσσα =---=∑==?∏,对似然函数取对数,并求导数,令其等于0,可得 0||1 1 2 =+ - ∑=n i i x n σσ 即 ∑=∧ =n i i x n 1||1σ,故σ得极大似然估计为∑=∧=n i i x n 1 ||1σ 。 6、设12,, ,n x x x 是来自参数为λ的泊松分布的简单随机样本,试求2λ的无偏估计量。 解:因x 参数为λ的泊松分布,故 λ=)(x E ,λ=)(x D , 2 2 2 2 )()()(λλλ+=+=+=x E Ex Dx x E 即2 2 )()(λ=-x E x E ,2 2 )(λ=-x x E ,用样本矩x A x n A n i i ==∑=11 2 2,1,代替相应的总 体矩)(2 x E ,)(x E ,使得到2 λ的无偏估计量,x x n A A n i i -=-=∑=∧1 2 122 1λ, 因此,2 λ的无偏估计量x x n n i i -=∑=∧1 2 2 1λ。 7、 解:似然函数为 ()()()()()()()()()()() () ? ?? ? ??=======?-=??∈?==??--=??-==0278.02778.06944.0321 0278.036 1?,3,2778.036 10?,2,6944.03625?,16 5?0 5 ,,;106 5?0,,;115,,;12,,,,,;232123213215321321的分布列为估计值: 由此可得到三个概率的所以,因为对,解得令X p p p x x x L x x x L x x x L x p x p x p x x x L L θ θθ θθ θθθθθθθθθθθθθθθθ 8、解:似然函数为 ()()()()小时的极大似然估计量值为 的极大似然估计量为 解似然方程得得似然方程: 求导对3181100800291618 11?1?01. 1ln ;,,,ln , 1exp 1 1 ;,,,11121211121=++++=??? ??===?? ? ??==?? ? ??+-?? ? ??--=??? ?????? ??-==∑∑∑∑∑∏=====- = n i i L n i i L n i i n i i n n i i n x n i n x n x x x n x n x n x x x L x e x x x L i θθθθθθθθθθθθθθθ 9、解:设每次取样结果用i X 表示,令 ()()(). 1,01,,1~011=-==?? ?=-i x x i i i i i x p p x X P X p B X i i X i i 的分布列为即则次取得正品 第次取得废品第 似然函数为 ()() () ()()()()% 450 2 1?1?011.1ln 1ln ;,,,ln ,11;,,,11211 1211 1 ==??? ??==?? ? ??===-----+=∑-∑ =-=∑∑∏==- =-==n i i L n i i L n x n x n i x x n x n x p p x n x p p x n p x n p p x n p x n p x x x L p p p p p x x x L i n i i n i i i 的极大似然估计量值为废品率的极大似然估计量为解此似然方程得得似然方程:求导对θ 10、解:()dx x xf Ex ?∞ ∞-=λ;= λ 1 ,令 X X n n i i ==∑=1 11 λ, 解得X 1?=λ λ的矩估计为。 11、解:似然函数为 ?? ???≥? ?? ???--=∑=-其它0,,,,)(1exp ),(211μ μθθμθn n i i n x x x x L , ?? ? ???-+-=)(1ln ),ln μθθμθi x n L (, μθμθθθ-=?=??????---=??x x n L ,0)(11ln 2, 0ln ==??θ μn L (无解),但由)1(),(x L =?μμθ, 故) 1() 1(?,?X X X =-=μθ 为极大似然估计。 第七章 假设检验 1、某种产品以往的废品率为5%,采取某种技术革新措施后,对产品的样本进行检验,这种产品的废品率是否有所降低,取显著水平%5=α,则此,设题的原假设0H :______ 备择假设1H :______.犯第一类错误的概率为_______。 解:由题意可知原假设0H :P=5%。备择假设1H :P<5%。犯第一类错误是指0H 为真的情况下,把0H 拒绝。这种错误也称拒真错误。其犯第一类错误的概率为%5=α。 2、设总体),(~2σμN x ,方差2 σ未知,对假设0H :0μμ=,1H :0μμ≠,进行假设 检验,通常采取的统计量是________,服从_______分布,自由度是________。 解:通常采取的统计量是n s x t 0μ-= 这里∑==n i i x n x 11 22 )(11x x n S i --=。服从t 分布,自由度是n-1。 3、设总体),(~2σμN x ,μ和2 σ均未知。统计假设取为0H :0μμ= 1H :0μμ≠ 若用t 检验法进行假设检验,则在显著水平α之下,拒绝域是(B ) A 、)1(||2 1-<- n t t α B 、)1(||2 1-≥- n t t α C 、)1(||1-≥-n t t α D 、)1(||1--<-n t t α 4、在假设检验中,原假设0H ,备择选择1H ,则称( B )为犯第二类错误 A 、0H 为真,接受0H B 、0H 不真,接受0H C 、0H 为真,拒绝0H D 、0H 不真,拒绝0H 5、一自动车床工零件的长度服从正态分布),(2 σμN ,车床正常时加工零件长度均值为10.5,经过一段时间生产后,要检验这车床是否正常工作正常,为此抽取该车床加工的31个零件,测得数据如下: 零件长度 10.1 10.3 10.6 11.2 11.5 11.8 12.0 频 数 1 3 7 10 6 3 1 若加工零件长度方差不变,问此车床工作是否正常? 解:检验假设5.10:00==μμH ,5.10:01=≠μμH 。这是一个正态总体方差未知,对μ的假设检验问题,当0H 为真时,)1(~0 --= n t n S X t μ。 按αα =-≥- )}1(|{|2 1n t t P ,查t 分布表,确定临界值)1(2 1-- n t α,故0H 的拒绝域为 )1(||2 1-≥- n t t α 。 令n=31,计算出08.11=X ,516.0=S , 所以26.631 516 .0| 51.1008.11|||||0=-=-= n S X t μ。 查t 分布表可知:0423.2)30()1(975.02 1==-- t n t α 。 因0423.2)30(26.6||975.0=>=t t 。故拒绝0H ,即可认为该车床工作不正常。 6. 按规定,设100g 的罐头番茄汁中Vc 的含量不该少于21mg ,现从某厂生产的一批罐头 中抽取17个,得Vc 的含量(单位:mg )为:16,22,21,20,23,21,19,15,13,23,17,20,29,18,22,16,25。已知Vc 的含量服从正态分布,试以0.025的检验 水平检验该批罐头Vc 的含量是否合格。 解:由题意可知,原假设21:0≥μH 。21:1<μH 。 由样本观测值算得:20340*17 1==X ,217122 87.3)(11=--=∑=i i X X n S , 065.187 .3| 2120|||0-=-=-= n S X t μ。 25.00=α,16117=-=n ,查t 分布表1199.2)16(975.0=t (本题是单侧检验), 而1199.2065.1<-=t ,按原假设0H ,可认为该罐头Vc 含量是合格的。 7. 用包装机包装洗衣粉,在正常的情况下,每袋标准重量为1000g ,标准差不能超过15g , 假设洗衣粉袋重服从正态分布。某天检验包装机工作情况,从包装好的袋中随机抽取10袋,测得其重(单位:g )为1020,1030,968,994,1014,998,976,982,950,1048。问按标准差来衡量这天机器工作是否正常? 解:22 015:≤σ H ,22115:>σH ,选取统计量:)1(~)1(22 2 2 --= n X n X σ。 对于0.05α=。查临界值分布表9190.16)9(2 05.0=X 。 经计算:998)104895010301020(10 1 =++++= X , 210 1 22 23.30)(101=-=∑=i i X X S 。 进而2 X 的统计值为)9(919.16554.3615 23.30*92 95.02 22 X X =>==。 故拒绝原假设2 2015:≤σH ,即认为这天包装机工作不正常,应调整。 第八章 方差分析与回归分析 下表数据是退火温度)(0 c x 对黄铜延性y 反应的试验结果。Y 是以延比度计算的。且设对于给定的x ,y 为正太变量。其方差与x 无关。 )(0c x 300 400 500 600 700 800 Y (%) 40 50 55 60 67 70 求y 对于x 的线性回归方程。 解:设x b ?a ?y ?+=,则: 175000)(6126 16 1 2=-=∑∑==i i i i xx x x S 。 620)(6126 16 1 2=-=∑∑==i i i i yy y y S 10300188100198400))((616 1 6 16 1=-=-=∑∑∑===i i i i i i i xy y x y x S 。 05886.0?==xx xy S S b 。 6278.24?)1()(1?1 1=-=∑∑==b x n y n a n i i n i i 。 即:y=24.6287+0.05886x