当前位置:文档之家› 数理统计例题选讲

数理统计例题选讲

数理统计例题选讲
数理统计例题选讲

例题选讲:

[注:蓝色字体为填空、R软件中输入及显示的内容;绿色字体为解释和说明的内容。]

一、填空题

若要将d:\work设为当前工作目录,在R中可以使用命令setwd("d:/work"),也可以在R命令窗口中通过“文件”菜单中的“改变工作目录”选择该工作目录来完成。

二、填空题

在统计软件R中已经预先储存了不少有名的数据。读取其中名为“Orange”的数据的命令为data(Orange)或者直接键入命令Orange即可;再将此数据“Orange”保存为Excel的逗号分割格式的数据的命令为:

write.csv(Orange,file="d:/work/Orange.csv",row. names=F,quote=F)

类似地,将此数据“Orange”保存为简单的文本文件的命令为:

write.table(Orange,file="d:/work/Orange.txt",row.n ames=F,quote=F)

反之,将刚才保存在d:\work工作目录下的逗号分割文件" Orange.csv"和文本文件" Orange.txt"再读

入R中的命令分别为:

read.csv(file="Orange.csv",header=TRUE)

read.table(file="Orange.txt",header=TRUE)

三、计算及作图题

读入R中自带数据“Nile”(尼罗河从1871年至1970年的流量数据),计算下表中的各数值并将它们填入表中相应位置:

并给出画散点图、直方图、茎叶图和箱线图的命令。

散点图:plot(Nile,main="数据Nile散点图")

直方图: hist(Nile,main="数据Nile直方图")

茎叶图:stem(Nile)

箱线图: boxplot(Nile,main="数据Nile箱线图")

The decimal point is 2 digit(s) to the right of the |

4 | 6

5 |

6 | 5899

7 | 000123444455667778

8 | 000011222233344555556667779 ―――――茎叶图

9 | 0011222244466678899

10 | 0122234455

11 | 00012244566678

12 | 112356

13 | 7

四、计算及作图题

求服从二项分布B(30,0.1)的随机变量X在k=0,1,. . .,10处的概率值,保留三位小数,填写下表,

并给出画线柱图的R程序命令。

>c= dbinom(k,n,p);c=round(c,3)

>c

[1] 0.042 0.141 0.228 0.236 0.177 0.102 0.047 0.018 0.006 0.002 0.000

>plot(k, c, type='h', col='blue', lwd=12, main='二

项分布B(k,30,0.1)')

五、(假设检验题) 已知A、B两班各50名学生身高数据集“HAB”,其中包含有两列数据,分别为A 班50名学生的身高"heightA"和B班50名学生的身高"heightB"。画出身高数据集“HAB”的箱线图,并进行比较说明;又假设这两列身高数据均来自正态总体且方差相同,试用命令t.test( )检验它们的均值是否相等?

>boxplot(read.table(file="HAB.txt",header=TRUE),

col=c('blue', 'lightblue'),main="A、B班学生身高")

由箱线图看出,A班学生平均身高(170~175cm)明显大于B班(约165cm),而且1/4和3/4分位数A班也大于B班的;但A班数据分布范围比B班的要小

> t.test(ht[,1],ht[,2]) ―――双样本检验Welch Two Sample t-test

data: ht[, 1] and ht[, 2]

t = 3.4097, df = 97.386, p-value = 0.0009476

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

2.073038 7.846962

sample estimates:

mean of x mean of y

170.56 165.60 ―――它们的均值不相等

六、(计算题) 设银行年利率为9.25%。将10000元钱存入银行,问至少多长时间会连本带利翻一番?

> money=10000; years=0

> while (money<20000)

+ {years=years+1;money=money*(1+9.25/100) } > years

[1] 8 ――――――至少8年时间

> money

[1] 20294.18 ―――――――检验余额

七、(计算题)

产生42个正态分布N(3,2)随机数,由它们生成一个7×6矩阵,并计算矩阵的第3行和第5行构成的两个向量的相关系数。

> c=rnorm(42,3,sqrt(2))

> B=matrix(c,nrow=7,ncol=6)

> B ――――――――――――输出B

[,1] [,2] [,3] [,4] [,5] [,6] [1,] 4.690282 1.206017 4.7461446 2.319993 2.616572 4.8192753

[2,] 1.392273 2.082440 0.7324624 1.378121 3.384489 3.6875426

[3,] 1.555189 3.434511 3.7814838 2.001559 1.468951 3.6406123

[4,] 1.750077 2.091504 0.5902185 2.798920 3.582612 4.8157370

[5,] 3.849575 2.643638 2.5182632 2.657518 2.441795 2.1490091

[6,] 4.857121 1.923758 2.4462785 1.646566 5.771279 -0.4936599

[7,] 1.413094 1.274034 2.5671197 2.264120 1.770194 3.2891725

> cor(B[3,],B[5,]) ―――――计算相关系数[1] -0.5393955

八、在R的内置数据集“stackloss”中,记录了又氧化氨气来制造硝酸的数据。数据集有21行和4列:Air.Flow(空气流量)、Water.Temp(水温)、Acid.Conc(硝酸浓度)及stack.loss(氨气损失百分比)。试建立因变量stack.loss关于另外三个自变量的多元线性回归模型,并对所建立的模型进行讨论和改进。

> stackloss

Air.Flow Water.Temp Acid.Conc. stack.loss

1 80 27 89 42

:

: (省略此部分数据)

:

21 70 20 91 15

>

> X1=stackloss[,1]

> X2=stackloss[,2]

> X3=stackloss[,3]

> Y1=stackloss[,4]

> lm.sol<-lm(Y1~X1+X2+X3)

> summary(lm.sol)

Call:

lm(formula = Y1 ~ X1 + X2 + X3)

Residuals:

Min 1Q Median 3Q Max

-7.2377 -1.7117 -0.4551 2.3614 5.6978

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -39.9197 11.8960 -3.356 0.00375 **

X1 0.7156 0.1349 5.307 5.8e-05 ***

X2 1.2953 0.3680 3.520 0.00263 **

X3 -0.1521 0.1563 -0.973 0.34405 ――“不显著”---

Signif. codes: 0 …***? 0.001 …**? 0.01 …*? 0.05 ….? 0.1 … ? 1

Residual standard error: 3.243 on 17 degrees of freedom

Multiple R-squared: 0.9136, Adjusted R-squared: 0.8983

F-statistic: 59.9 on 3 and 17 DF, p-value: 3.016e-09 ―――――P值很小由以上结果,虽然可觉系数、P值等较合理,但自变量X3不适合于该线性规划模型,

它与因变量Y有其它关系,要另建一模型。

改进:只建立自变量X1、X2与因变量Y间的线性回归模型:> X1=stackloss[,1]

> X2=stackloss[,2]

> Y1=stackloss[,4]

> lm.sol<-lm(Y1~X1+X2)

> summary(lm.sol)

Call:

lm(formula = Y1 ~ X1 + X2)

Residuals:

Min 1Q Median 3Q Max

-7.5290 -1.7505 0.1894 2.1156 5.6588

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -50.3588 5.1383 -9.801 1.22e-08 ***

―――――“极为显著”

X1 0.6712 0.1267 5.298 4.90e-05 ***

―――――“极为显著”

X2 1.2954 0.3675 3.525 0.00242 **

―――――“高度显著”

---

Signif. codes: 0 …***? 0.001 …**? 0.01 …*? 0.05 ….? 0.1 … ? 1

Residual standard error: 3.239 on 18 degrees of freedom

Multiple R-squared: 0.9088, Adjusted R-squared: 0.8986

――――可决系数较接近1 F-statistic: 89.64 on 2 and 18 DF, p-value: 4.382e-10

――――――P值很小相关系数的平方(Multiple R-squared)为0.9088,说明线性回归方程拟合度较高,而且由可决系数、p 值等来看,改进是合理的。

回归方程为:

Y

= -50.3588 + 0.6712X1 + 1.2954X2

1

典型相关分析及其应用实例

摘要 典型相关分析是多元统计分析的一个重要研究课题.它是研究两组变量之间相关的一种统计分析方法,能够有效地揭示两组变量之间的相互线性依赖关系.它借助主成分分析降维的思想,用少数几对综合变量来反映两组变量间的线性相关性质.目前它已经在众多领域的相关分析和预测分析中得到广泛应用. 本文首先描述了典型相关分析的统计思想,定义了总体典型相关变量及典型相关系数,并简要概述了它们的求解思路,然后深入对样本典型相关分析的几种算法做了比较全面的论述.根据典型相关分析的推理,归纳总结了它的一些重要性质并给出了证明,接着推导了典型相关系数的显著性检验.最后通过理论与实例分析两个层面论证了典型相关分析的应用于实际生活中的可行性与优越性. 【关键词】典型相关分析,样本典型相关,性质,实际应用

ABSTRACT The Canonical Correlation Analysis is an important studying topic of the Multivariate Statistical Analysis. It is the statistical analysis method which studies the correlation between two sets of variables. It can work to reveal the mutual line dependence relation availably between two sets of variables. With the help of the thought about the Principal Components, we can use a few comprehensive variables to reflect the linear relationship between two sets of variables. Nowadays It has already been used widely in the correlation analysis and forecasted analysis. This text describes the statistical thought of the Canonical Correlation Analysis firstly, and then defines the total canonical correlation variables and canonical correlation coefficient, and sum up their solution method briefly. After it I go deep into discuss some algorithm of the sample canonical correlation analysis thoroughly. According to the reasoning of the Canonical Correlation Analysis, sum up some of its important properties and give the identification, following it, I infer the significance testing about the canonical correlation coefficient. According to the analysis from the theories and the application, we can achieve the possibility and the superiority from canonical correlation analysis in the real life. 【Key words】Canonical Correlation Analysis,Sample canonical correlation,Character,Practical applications

库仑定律知识点及经典例题

库仑定律知识点及经典例题 1.电荷、电荷守恒 ⑴自然界中只存在两种电荷:正电荷、负电荷.使物体带电的方法有摩擦起电、接触起电、感应起电. ⑵静电感应:当一个带电体靠近导体时,由于电荷间的相互吸引或排斥,使导体靠近带电体的一端带异号电荷,远离带电体的一端带同号电荷. ⑶电荷守恒:电荷即不会创生,也不会消失,它只能从一个物体转移到另一个物体,或从物体的一部分转移到另一部分;在转移过程中,电荷总量保持不变.(一个与外界没有电荷交换的系统,电荷的代数和保持不变) ⑷元电荷:指一个电子或质子所带的电荷量,用e表示.e=1.6×10-19C 2.库仑定律 ⑴真空中两个点电荷之间相互作用的电场力,跟它们电荷量的乘积成正比,跟它们的距离的二次方成反比,作用力的方向在它们的连线上.即:2 2 1r q kq F = 其中k 为静电力常量, k =9.0×10 9 N m 2/c 2 ⑵成立条件 ①真空中(空气中也近似成立),②点电荷,即带电体的形状和大小对相互作用力的影响可 以忽略不计.(对带电均匀的球, r 为球心间的距离). 3.电场强度 ⑴电场:带电体的周围存在着的一种特殊物质,它的基本性质是对放入其中的电荷有力的作用,这种力叫电场力.电荷间的相互作用就是通过电场发生作用的.电场还具有能的性质. ⑵电场强度E :反映电场强弱和方向的物理量,是矢量. ①定义:放入电场中某点的试探电荷所受的电场力F 跟它的电荷量q的比值,叫该点的电场强度.即:F E q = 单位:V/m,N/C ②场强的方向:规定正电荷在电场中某点的受力方向为该点的场强方向. (说明:电场中某点的场强与放入场中的试探电荷无关,而是由该点的位置和场源电何来决定.) ⑶点电荷的电场强度:E =2 Q k r ,其中Q 为场源电荷,E 为场中距Q 为r 的某点处的场强大小.对于求均匀带电的球体或球壳外某点的场强时,r 为该点到球心的距离. ⑷电场强度的叠加:当存在多个场源电荷时,电场中某点的场强为各个点电荷单独在该点产生的电场强度的矢量和. ⑸电场线:为形象描述电场而引入的假想曲线. ①电场线从正电荷或无限远出发,终止于无限远或负电荷. ②电场线不相交,也不相切,更不能认为电场就是电荷在电场中的运动轨迹. ③同一幅图中,场强大的地方电场线较密,场强小的地方电场线较疏.

概率与数理统计典型例题

《概率与数理统计》 第一章 随机事件与概率 典型例题 一、利用概率的性质、事件间的关系和运算律进行求解 1.设,,A B C 为三个事件,且()0.9,()0.97P A B P A B C ==U U U ,则()________.P AB C -= 2.设,A B 为两个任意事件,证明:1|()()()|.4 P AB P A P B -≤ 二、古典概型与几何概型的概率计算 1.袋中有a 个红球,b 个白球,现从袋中每次任取一球,取后不放回,试求第k 次 取到红球的概率.(a a b +) 2.从数字1,2,,9L 中可重复地任取n 次,试求所取的n 个数的乘积能被10整除的 概率.(58419n n n n +--) 3.50只铆钉随机地取来用在10个部件上,其中有3个铆钉强度太弱,每个部件用3只铆钉,若将3只强度太弱的铆钉都装在一个部件上,则这个部件强度就太 弱,从而成为不合格品,试求10个部件都是合格品的概率.(19591960 ) 4.掷n 颗骰子,求出现最大的点数为5的概率. 5.(配对问题)某人写了n 封信给不同的n 个人,并在n 个信封上写好了各人的地址,现在每个信封里随意地塞进一封信,试求至少有一封信放对了信封的概率. (01(1)! n k k k =-∑)

6.在线段AD上任取两点,B C,在,B C处折断而得三条线段,求“这三条线段能构成三角形”的概率.(0.25) 7.从(0,1)中任取两个数,试求这两个数之和小于1,且其积小于 3 16 的概率. (13 ln3 416 +) 三、事件独立性 1.设事件A与B独立,且两个事件仅发生一个的概率都是 3 16 ,试求() P A. 2.甲、乙两人轮流投篮,甲先投,且甲每轮只投一次,而乙每轮可投两次,先投 中者为胜.已知甲、乙每次投篮的命中率分别为p和1 3 .(1)求甲取胜的概率; (2)p求何值时,甲、乙两人的胜负概率相同?( 95 ; 5414 p p p = + ) 四、条件概率与积事件概率的计算 1.已知10件产品中有2件次品,现从中取产品两次,每次取一件,去后不放回,求下列事件的概率:(1)两次均取到正品;(2)在第一次取到正品的条件下第二次取到正品;(3)第二次取到正品;(4)两次中恰有一次取到正品;(5)两次中 至少有一次取到正品.(28741644 ;;;; 45954545 ) 2.某人忘记了电话号码的最后一个数字,因而他随意地拨号,假设拨过了的数字不再重复,试求下列事件的概率:(1)拨号不超过3次而接通电话;(2)第3次拨号才接通电话.(0.3;0.1) 五、全概率公式和贝叶斯公式概型 1.假设有两箱同种零件:第一箱内装50件,其中10件为一等品;第二箱内装30件,其中18件为一等品,现从两箱中随意挑选出一箱,然后从该箱中先后随机取出两个零件(取出的零件均不放回),试求:(1)先取出的零件是一等品的概率;(2)在先取出的零件是一等品的条件下,第二次取出的零件仍然是一等品 的概率.(2690 ; 51421 ) 2.有100个零件,其中90个一等品,10个二等品,随机地取2个,安装在一台设备上,若2个零件中有i个(0,1,2 i=)二等品,则该设备的使用寿命服从参

硕士生《数理统计》例题及答案

《数理统计》例题 1.设总体X 的概率密度函数为: 2 2 1)(ββ x e x f -= )0(>β 试用矩法和极大似然法估计其中的未知参数β。 解:(1)矩法 由于EX 为0, πβββββ βββββββ2 00 2 2 2 22 2 1][) ()2 (2) ()2(21 2)(2 2 2 2 2 2 2 2 2 2 = +-=- =- - ===???? ?∞ +-∞+- ∞ +- - ∞ +- ∞ ++∞ ∞ -dx e xe e d x x d xe dx e x dx x f x EX x x x x x πβ2 222 1= -=X E EX DX 令2S DX =得:S π β2 ?= (2)极大似然法 ∑= ==- =- ∏ n i i i x n n i x e e L 1 2 22 2 1 11 1 β ββ β ∑=- -=n i i x n L 1 22 1 ln ln ββ 2 31 ln 2n i i d L n x d βββ==-+∑ 令0ln =β d L d 得∑==n i i x n 1 2 2?β

2. 设总体X 的概率密度函数为: ?? ???<≥--=αα βαββαφx x x x ,0),/)(exp(1 ),;( 其中β>0,现从总体X 中抽取一组样本,其观测值为(2.21,2.23,2.25,2.16,2.14,2.25,2.22,2.12,2.05,2.13)。试分别用矩法和极大似然法估计其未知参数βα和。 解:(1)矩法 经统计得:063.0,176.2==S X β αβαβ φα β α α β ααβ α β α α β α α +=-=+-=-===∞ +-- ∞ +-- ∞ +-- -- ∞ +-- ∞ +∞ +∞-?? ? ?x x x x x e dx e xe e xd dx e x dx x x EX ][) (1 )( ) (222][) (1 222 22 2βαβαβαβ β α α αβ α β α α β α α ++=+=+-=-==--∞ +∞ +-- --∞ +-- ∞ +?? ?EX dx e x e x e d x dx e x EX x x x x 222)(β=-=EX EX DX 令???==2S DX X EX 即???==+2 2S X ββα 故063.0?,116.2?===-=S S X βα (2)极大似然法 ) (1 1 1),;(αβ β α β β βα---- == =∏X n n X n i e e x L i )(ln ln αβ β-- -=X n n L )(ln ,0ln 2αβ βββα-+-=??>=??X n n L n L 因为lnL 是L 的增函数,又12,,,n X X X α≥L 所以05.2?)1(==X α

库仑定律专项练习题及答案

库仑定律专项练习题及答案

相同 D.若F 1>F 2,则两小球原来所带电的电性一 定相反 3.大小相同的两个金属小球A 、B 带有等量 电荷,相隔一定距离时,两球间的库仑引力大小为F ,现在用另一个跟它们大小相同的不带电金属小球,先后与A 、B 两个小球接触后再移开,这时A 、B 两球间的库仑力大小 A.一定是F /8 B.一定是F /4 C.可能是3F /8 D.可能是 3F /4 4.半径为r 的两个带电金属小球,球心相距 3r ,每个小球带电量都是+q ,设这两个小球间的静电力大小为F ,则下列式子中正确的是 A.229r kq F = B.229r kq F < C.229r kq F > D.2 225r kq F = 5. 如图所示,两根细丝线悬挂两个质量相同的

小球A、B.当A、B不带电时,静止后上、下两根丝线上的拉力大小分别为T A、T B.使A、B带等量同种电荷时,静止后上、下两根丝线上的拉力大小分别为T A/、T B/.下列结论正确的是 A.T A/=T A,T B/ >T B B.T A/=T A,T B/ T B D.T A/ >T A,T B/ x1/4 D.x2

7.三个相同的金属小球1、2、3分别置于绝缘支架上,各球之间的距离远大于小球的直径.球1的带电量为q,球2的带电量为nq,球3不带电且离球1和球2很远,此时球1、2之间作用力的大小为F.现使球3先与球2接触,再与球1接触,然后将球3移至远处,此时1、2之间作用力的大小仍为F.由此可知() A. n=1 B. n=4 C. n=6 D. n=10 真空中大小相同的两个金属小球A、B带有等量电荷,相隔一定距离,(距离远大于小球的直径)两球之间的库仑斥力大小为F,现在用另

数理统计复习题第五章

第五章 大数定律与中心极限定理 一、 典型题解 例1设随机变量X 的数学期望()(){}2,3E X u D X X u σσ==-≥方差,求P 的大小区间。 解 令3εσ=,则有切比雪夫不等式有: ()() ()22 221 ,339D X P X E X P X E X σεσεσ????-≥≤ -≥≤=????有 例2在n 次独立试验中,设事件A 在第i 次试验中发生的概率为()1,2,....i p i n = 试证明:A 发生的频率稳定于概率的平均值。 证 设X 表示n 次试验中A 发生的次数,引入新的随机变量0i A X A ?=??1,发生? ,不发生 ()12,...i n =, ,则X 服从()01-分布,故 ()()(),1i i i i i i i E X p D X p p p q ==-=, 又因为 () ()2 2 4140i i i i i i i i p q p q p q p q -=+-=-≥, 所以 ()()1 1,2, (4) i i i D X p q i n =≤ = 由切比雪夫大数定理,对,o ε?>有()11lim 1n i i n i p X E X n ε→∞ =?? -<=???????? ∑ 即 11lim 1n i n i X p p n n ε→∞ =?? -<=???? ∑ 例 3 对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学 生无家长,1名家长、2名家长来参加会议的概率分别为。若学校共有400名学生,设各学生参加会议的家长数相互独立,且服从同一分布。(1)求参加会议的家长数X 超过450的概率;(2)求有1名家长来参加会议的学生数不多于340的概率。 解(1)以()400,,2,1 =k X k 记第k 个学生来参加会议的家长数,则k X 的分布律为 k X 0 1 2 k P 0.05 0.8 0.15

数理统计习题数理统计练习题

数理统计 一、填空题 1.设n X X X ,,21为母体X 的一个子样,如果),,(21n X X X g , 则称),,(21n X X X g 为统计量。 2.设母体 ),,(~2 N X 已知,则在求均值 的区间估计时,使用的随机变量为 3.设母体X 服从方差为1的正态分布,根据来自母体的容量为100的子样,测得子样均值为5,则X 的数学期望的置信水平为95%的置信区间为 。 4.假设检验的统计思想是 。 小概率事件在一次试验中不会发生 5.某产品以往废品率不高于5%,今抽取一个子样检验这批产品废品率是否高于5%, 此问题的原假设为 。 6.某地区的年降雨量),(~2 N X ,现对其年降雨量连续进行5次观察,得数据为: (单位:mm) 587 672 701 640 650 ,则2 的矩估计值为 。 7.设两个相互独立的子样2121,,,X X X 与51,,Y Y 分别取自正态母体)2,1(2 N 与 )1,2(N , 22 21,S S 分别是两个子样的方差,令2 2222121)(,S b a aS ,已知)4(~),20(~22 2221 ,则__________, b a 。 8.假设随机变量)(~n t X ,则 2 1 X 服从分布 。 9.假设随机变量),10(~t X 已知05.0)(2 X P ,则____ 。 10.设子样1621,,,X X X 来自标准正态分布母体)1,0(N , X 为子样均值,而 01.0)( X P , 则____ 11.假设子样1621,,,X X X 来自正态母体),(2 N ,令 16 11 10 1 43 i i i i X X Y ,则Y 的 分布

库仑定律复习题

; 库仑定律复习 ◎必做部分 1.关于库仑定律的理解,下面说法正确的是( ) A .对任何带电荷之间的静电力计算,都可以使用库仑定律公式 B .只要是点电荷之间的静电力计算,就可以使用库仑定律公式 C .两个点电荷之间的静电力,无论是在真空中还是在介质中,一定是大小相等、方向相反的 D .摩擦过的橡胶棒吸引碎纸屑,说明碎纸屑一定带正电 答案: BC , 2.下面关于点电荷的说法正确的是( ) A .只有体积很小的带电体才能看成是点电荷 B .体积很大的带电体一定不能看成是点电荷 C .当两个带电体的大小远小于它们间的距离时,可将这两个带电体看成是点电荷 D .一切带电体都可以看成是点电荷 解析: 本题考查对点电荷的理解.带电体能否看做点电荷,和带电体的体积无关,主 要看带电体的体积对所研究的问题是否可以忽略,如果能够忽略.则带电体可以看成是点电荷,否则就不能. 答案: C 3.关于库仑定律的公式F =k Q 1Q 2 r 2 ,下列说法正确的是( ) @ A .当真空中的两个点电荷间的距离r →∞时,它们之间的静电力F →0 B .当真空中的两个电荷间的距离r →0时,它们之间的静电力F →∞ C .当两个点电荷之间的距离r →∞时,库仑定律的公式就不适用了 D .当两个电荷之间的距离r →0时,电荷不能看成是点电荷,库仑定律的公式就不适用 了 解析: r →∞时,电荷可以看做点电荷,库仑定律的公式适用,由公式可知,它们之间的静电力F →0;r →0时,电荷不能看成点电荷,库仑定律的公式就不适用了. 答案: AD 4.(2012·广东实验中学联考)如图所示,两个带电球,大球的电荷量大于小球的电荷量,可以肯定( ) A .两球都带正电 | B .两球都带负电

数理统计复习题第八章

第七章 假设检验 三、典型题解 例1:某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.当机器正常时, 其均值为0.5千克, 标准差为0.015千克.某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克): 0.498 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 解: 根据样本值判断5.05.0≠=μμ还是.提出两个对立假设 0100:5.0:μμμμ≠==H H 和 选择统计量:)1,0(~/0 N n X Z σμ-= 取定0.05a =,则/20.025 1.96,z z a ==又已知 9, 0.015, n s ==由样本计算得0.511x =, 2.2 1.96=>,于是拒绝假设 0H , 认为包装机工作不正常. 例2:某工厂生产的固体燃料推进器的燃烧率服从正态分布),(2 σμN , s cm s cm /2,/40==σμ,现用新方法生产了一批推进器,从中随机取25n =只,测得燃 烧率的样本均值为s cm x /25.41=.设在新方法下总体均方差仍为s cm /2,问这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?(取显著性水平05.0=α) 解:根据题意需要检验假设 00 :40H m m ?(即假设新方法没有提高了燃烧率), 10 :H m m >(即假设新方法提高了燃烧率), 这是右边检验问题,拒绝域为 0.05 1.645x z z = ?,由 3.125 1.645 x z = =>可得z 值落到拒绝域中故在显著性水平0.05 a =下拒绝0 H . 即认为这批推进器的燃烧率较以往有显著提高. 例3:某切割机在正常工作时, 切割每段金属棒的平均长度为10.5cm, 标准差是0.15cm, 今

典型相关分析SPSS例析

典型相关分析 典型相关分析(Canonical correlation )又称规则相关分析,用以分析两组变量间关系的一种方法;两个变量组均包含多个变量,所以简单相关和多元回归的解惑都是规则相关的特例。典型相关将各组变量作为整体对待,描述的是两个变量组之间整体的相关,而不是两个变量组个别变量之间的相关。 典型相关与主成分相关有类似,不过主成分考虑的是一组变量,而典型相关考虑的是两组变量间的关系,有学者将规则相关视为双管的主成分分析;因为它主要在寻找一组变量的成分使之与另一组的成分具有最大的线性关系。 典型相关模型的基本假设:两组变量间是线性关系,每对典型变量之间是线性关系,每个典型变量与本组变量之间也是线性关系;典型相关还要求各组内变量间不能有高度的复共线性。典型相关两组变量地位相等,如有隐含的因果关系,可令一组为自变量,另一组为因变量。 典型相关会找出一组变量的线性组合**=i i j j X a x Y b y =∑∑与 ,称 为典型变量;以使两个典型变量之间所能获得相关系数达到最大,这一相关系数称为典型相关系数。i a 和j b 称为典型系数。如果对变量进 行标准化后再进行上述操作,得到的是标准化的典型系数。 典型变量的性质 每个典型变量智慧与对应的另一组典型变量相关,而不与其他典型变量相关;原来所有变量的总方差通过典型变量而成为几个相互独立的维度。一个典型相关系数只是两个典型变量之间的相关,不能代

表两个变量组的相关;各对典型变量构成的多维典型相关,共同代表两组变量间的整体相关。 典型负荷系数和交叉负荷系数 典型负荷系数也称结构相关系数,指的是一个典型变量与本组所有变量的简单相关系数,交叉负荷系数指的是一个典型变量与另一组变量组各个变量的简单相关系数。典型系数隐含着偏相关的意思,而典型负荷系数代表的是典型变量与变量间的简单相关,两者有很大区别。 重叠指数 如果一组变量的部分方差可以又另一个变量的方差来解释和预测,就可以说这部分方差与另一个变量的方差之间相重叠,或可由另一变量所解释。将重叠应用到典型相关时,只要简单地将典型相关系数平方(2 CR),就得到这对典型变量方差的共同比例,代表一个典型变量的方差可有另一个典型变量解释的比例,如果将此比例再乘以典型变量所能解释的本组变量总方差的比例,得到的就是一组变量的方差所能够被另一组变量的典型变量所能解释的比例,即为重叠系数。 例1:CRM(Customer Relationship Management)即客户关系管理案例,有三组变量,分别是公司规模变量两个(资本额,销售额),六个CRM实施程度变量(WEB网站,电子邮件,客服中心,DM 快讯广告Direct mail缩写,无线上网,简讯服务),三个CRM绩效维度(行销绩效,销售绩效,服务绩效)。试对三组变量做典型相关分析。

医药数理统计习题及答案汇编

学习好资料 第一套试卷及参考答案 一、选择题 ( 40 分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制 ( B ) A 条图B 百分 条图或圆图C 线图D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式E负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检 验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A. 个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6、男性吸烟率是女性的10 倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D )率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t 检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n i和住,在进行成组设计资料的t 检 验时,自由度是( D ) (A) n i+ n2 (B) n i+ n2 - C) n1+ n2 +1 D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小E垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料, 既作直线回归分析, 又作直线相关分析。 令对相关系数检验的t值为t r,对回归系数检验的t值为t b, 二者之间具有什么关系?( C) A t r >t b B t r

数理统计期末练习题

数理统计期末练习题 1. 在总体)4,6.7(N 中抽取容量为n 的样本,如果要求样本均值落在)6.9,6.5(内的概率不小于0.95,则n 至少为多少 2.设n x x ,,1 是来自)25,(μN 的样本,问n 多大时才能使得95.0)1|(|≥<-μx P 成立 3. 由正态总体)4,100(N 抽取两个独立样本,样本均值分别为y x ,,样本容量分别15,20,试求 )2.0|(|>-y x P . 5.设161,,x x 是来自),(2 δμN 的样本,经计算32.5,92 ==s x ,试求)6.0|(|<-μx P . 6.设n x x ,,1 是来自)1,(μN 的样本,试确定最小的常数c,使得对任意的0≥μ,有α≤

++-+P k x x x x x x 11.设n x x ,,1 是来自 ),(2 1σ μN 的样本,m y y ,,1 是来自),(22σμN 的样本,c,d 是任意两个 不为0的常数,证明),2(~)()(2 221-+-+-=+m n t s y d x c t m d n c ωμμ其中2 2222,2)1()1(y x y x s s m n s m s n s 与-+-+-=ω分别是两个样本方差. 12.设121,,,+n n x x x x 是来自),(2 σμN 的样本,11,n n i i x x n ==∑_ 2 21 1(),1n n i n i s x x n ==--∑试求常数 c 使得1n n c n x x t c s +-=服从t 分布,并指出分布的自由度 。 13.设从两个方差相等的正态总体中分别抽取容量为15,20的样本,其样本方差分别为,,2 22 1s s 试求 ).2(22 2 1>S S p 14. 某厂生产的灯泡使用寿命)250,2250(~2 N X ,现进行质量检查,方法如下:随机抽取若干个灯泡,如果这些灯泡的平均寿命超过2200h,就认为该厂生产的灯泡质量合格,若要使检查能通过的概率不低于0.997,问至少应检查多少只灯泡?

数理统计典型例题分析

典型例题分析 例1.分别从方差为20和35的正态总抽取容量为8和10的两个样本,求第一个样本方差是第二个样本方差两倍的概率的范围。 解 以21 S 和22 S 分别表示两个(修正)样本方差。由22 22 12σσy x S S F =知统计量 22 2 1222175.13520S S S S F == 服从F 分布,自由度为(7,9)。 1) 事件{}2 2 212S S =的概率 {}{}05.32035235 20222221222122 2 1 ===??? ????==??????===F P S S P S S P S S P 因为F 是连续型随机变量,而任何连续型随机变量取任一给定值的概率都等于0。 2) 现在我们求事件{}二样本方差两倍第一样本方差不小于第=A 的概率: {} {}5.322 221≥=≥=F P S S P p 。 由附表可见,自由度9,721==f f 的F 分布水平α上侧分位数),(21f f F α有如下数值: )9,7(20.45.329.3)9,7(025.005.0F F =<<=。 由此可见,事件A 的概率p 介于0.025与0.05之间;05.0025.0<

解 由随机变量2χ分布知,随机变量σ/12S n )(-服从2χ分布,自由度 1-=n v ,于是,有 {}{}95.0)1(5.1)1(5.1)1(2,05.0222 2=≤≥-≤=? ?????-≤-=v v v P n P n S n P χχχσ 其中2v χ表示自由度1-=n v 的2χ分布随机变量,2 ,05.0v χ是自由度为1-=n v 的水 平05.0=α的2χ分布上侧分位数(见附表)。我们欲求满足 2,05.015.1v n χ≥-)( 的最小1+=v n 值,由附表可见 2 26,05.0885.3839)127(5.1χ=>=-, 22505.0652.375.401265.1,)(χ=<=-。 于是,所求27=n 。 例3.假设随机变量X 在区间[]1,+θθ上有均匀分布,其中θ未知: )(1n X X ,, 是来自X 的简单随机样本,X 是样本的均值,{} n X X X ,,min 1)1( =是最小观察值。证明 21?1-=X θ 和 11?12+-=n X ) (θ 都是θ的无偏估计量。 解 由X 在[]1,+θθ上均匀分布,知2/)12(+==θEX EX i 。 1) 由 θθθθ=-+=-+=-=∑∑==2 121212221211?111n i n i i n EX n E , 可见1?θ是θ的无偏估计量。 2) 为证明2?θ是θ的无偏估计。我们先求统计量)1(X 的概率分布。

SPSS典型相关分析及结果解释

SPSS典型相关分析及结果解释 SPSS 11.0 - 23.0 典型相关分析 1方法简介 如果要研究一个变量和一组变量间的相关,则可以使用多元线性回归,方程的复相关系数就是我们要的东西,同时偏相关系数还可以描述固定其他因素时某个自变量和应变量间的关系。但如果要研究两组变量的相关关系时,这些统计方法就无能为力了。比如要研究居民生活环境与健康状况的关系,生活环境和健康状况都有一大堆变量,如何来做?难道说做出两两相关系数?显然并不现实,我们需要寻找到更加综合,更具有代表性的指标,典型相关(Canonical Correlation)分析就可以解决这个问题。 典型相关分析方法由Hotelling提出,他的基本思想和主成分分析非常相似,也是降维。即根据变量间的相关关系,寻找一个或少数几个综合变量(实际观察变量的线性组合)对来替代原变量,从而将二组变量的关系集中到少数几对综合变量的关系上,提取时要求第一对综合变量间的相关性最大,第二对次之,依此类推。这些综合变量被称为典型变量,或典则变量,第1对典型变量间的相关系数则被称为第1典型相关系数。一般来说,只需要提取1~2对典型变量即可较为充分的概括样本信息。 可以证明,当两个变量组均只有一个变量时,典型相关系数即为简单相关系数;当一组变量只有一个变量时,典型相关系数即为复相关系数。故可以认为典型相关系 1

数是简单相关系数、复相关系数的推广,或者说简单相关系数、复相关系数是典型相关系数的特例。 2引例及语法说明 在SPSS中可以有两种方法来拟合典型相关分析,第一种是采用Manova过程来拟合,第二种是采用专门提供的宏程序来拟合,第二种方法在使用上非常简单,而输出的结果又非常详细,因此这里只对它进行介绍。该程序名为Canonical correlation.sps,就放在SPSS的安装路径之中,调用方式如下: INCLUDE 'SPSS所在路径\Canonical correlation.sps'. CANCORR SET1=第一组变量的列表 /SET2=第二组变量的列表. 在程序中首先应当使用include命令读入典型相关分析的宏程序,然后使用cancorr名称调用,注意最后的“.”表示整个语句结束,不能遗漏。 这里的分析实例来自曹素华教授所著《实用医学多因素统计分析方法》第176页:为了研究兄长的头型与弟弟的头型间的关系,研究者随机抽查了25个家庭的两兄弟的头长和头宽,数据见文件canonical lianxiti.sav,希望求得两组变量的典型变量及典型相关系数。显然,代表兄长头形的变量为第一组变量,代表弟弟头形的变量为第二组变量,这里希望求得的是两组变量间的相关性,在语法窗口中键入的程序如下: INCLUDE 'D:\SpssWin\Canonical correlation.sps'. 请使用时改为各自相应的安装目录 CANCORR SET1=long1 width1 列出第一组变量 2

高二物理库仑定律测试题及答案

1.关于点电荷的说法,正确的是() A.只有体积很小的带电体才能看作点电荷 B.体积很大的带电体一定不能看成点电荷 C.当两个带电体的大小及形状对它们之间的相互作用力的影响可忽略时,这两个带电体可看作点电荷 D.一切带电体都可以看成是点电荷 2、真空中有两个点电荷,它们之间的静电力为F,如果保持它们所带的电量不变,将它们之间的距离增大到原来的3倍,它们之间作用力的大小等于() A.F B.3F C.F/3 D.F/9 3. A、B两点电荷间的距离恒定,当其他电荷移到A、B附近时,A、B间相互作用的库仑力将( ) A.可能变大 B.可能变小 C.一定不变 D.无法确定 4. 有A、B、C三个塑料小球,A和B、B和C、C和A之间都是相互吸引的,如果A带正电,则( ) A.B和C两球均带负电 B.B球带负电,C球带正电 C.B和C两球中必有一个带负电,而另一个不带电 D.B和C两球都不带电 5. 关于库仑定律的公式 22 1 r Q Q k F ,下列说法中正确的是( ) A.当真空中两个电荷间距离r→∞时,它们间的静电力F→0 B.当真空中两个电荷间距离r→0时,它们间的静电力F→∞ C.当两个电荷间的距离r→∞时,库仑定律的公式就不适用了 D.当两个电荷间的距离r→0时,电荷不能看成是点电荷,库仑定律的公式就不适用了 6.要使真空中的两个点电荷间的库仑力增大到原来的4倍,下列方法中可行的是( ) A.每个点电荷的带电荷量都增大到原来的2倍,电荷间的距离不变 B.保持点电荷的带电荷量不变,使两个点电荷间的距离增大到原来的2倍 C.使一个点电荷的带电荷量加倍,另一个点电荷电荷量保持不变,同时将两点电 荷间的距离减小为原来的 2 1 D.保持点电荷的带电荷量不变,将两点电荷间的距离减小为原来的 2 1 7、关于点电荷的说法中正确的是() A、真正的点电荷是不存在 B、点电荷是一种理想化的物理模型 C、小的带电体就是点电荷 D、形状和大小对所研究的问题的影响可以忽略不计的带电体 8.如图1-2-6所示,质量分别是m 1和m2带电量分别为q1 和q2的小球,用长度不等的轻丝线悬挂起来,两丝线与竖 直方向的夹角分别是α和β(α>β),两小球恰在同一水 平线上,那么() A.两球一定带异种电荷 图1-2-6

库仑定律练习题及答案解析

【 第2节库仑定律练习题 1.下列关于点电荷的说法,正确的是( ) A .点电荷一定是电量很小的电荷 B .点电荷是一种理想化模型,实际不存在 C .只有体积很小的带电体,才能作为点电荷 D .体积很大的带电体一定不能看成点电荷 2.关于库仑定律的公式F =k Q 1Q 2 r 2 ,下列说法中正确的是( ) A .当真空中的两个点电荷间的距离r →∞时,它们之间的静电力F →0 B .当真空中的两个点电荷间的距离r →0时,它们之间的静电力F →∞ · C .当两个点电荷之间的距离r →∞时,库仑定律的公式就不适用了 D .当两个点电荷之间的距离r →0时,电荷不能看成是点电荷,库仑定律的公式就不适用 3.真空中两个点电荷Q 1、Q 2,距离为R ,当Q 1增大到原来的3倍,Q 2增大到原来的3倍,距离R 增大到原来的3倍时,电荷间的库仑力变为原来的( ) A .1倍 B .3倍 C .6倍 D .9倍 k b 1 . c o m 4.如图所示,两个质量均为 m 的完全相同的金属球壳 a 和b ,其壳层的厚度和质量分布均匀,将它们固定于绝缘支座上,两球心间的距离 l 为球半径的3倍.若使它们带上等量异种电荷,使其电荷量的绝对值均为Q ,那么关于a 、b 两球之间的库仑力F 库的表达式正确的是( ) A .F 库=k Q 2l 2 B .F 库>k Q 2 l 2新 C .F 库 C .大球受到的静电力大于小球受到的静电力 D .两球受到的静电力大小相等 7.两个带正电的小球,放在光滑的水平绝缘板上,它们相距一定距离.若同时释放两球,

(完整word版)医药数理统计习题和答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1(D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关 分析。令对相关系数检验的t值为t r ,对回归系数检验的t值为t b , 二者之间具有什么关系?(C)

1库仑定律专项练习题及答案

习题24 库仑定律 1.如图所示,两个带电小球A 、B 分别用细丝线悬吊在同一点O ,静止后两小球在同一水平线上,丝线与竖直方向的夹角分别为α、β (α>β),关于两小球的质量m 1 、m 2和带电量q 1 、q 2,下列说法中正确的是 A.一定有m 1q 2 C.可能有m 1=m 2, q 1=q 2 D.可能有m 1>m 2, q 1=q 2 2.两个大小相同的小球带有不等量的电荷,它们相隔某一距离时,相互作用的库仑力大小为F 1.现将两小球接触后又放回到原位置,它们之间相互作用的库仑力大小为F 2.下列说法中正确的是 A.若F 1F 2,则两小球原来所带电的电性一定相反 3.大小相同的两个金属小球A 、B 带有等量电荷,相隔一定距离时,两球间的库仑引力大小为F ,现在用另一个跟它们大小相同的不带电金属小球,先后与A 、B 两个小球接触后再移开,这时 A 、 B 两球间的库仑力大小 A.一定是F /8 B.一定是F /4 C.可能是3F /8 D.可能是3F /4 4.半径为r 的两个带电金属小球,球心相距3r ,每个小球带电量都是+q ,设这两个小球间的静电力大小为F ,则下列式子中正确的是 A.229r kq F = B.229r kq F < C.229r kq F > D.2225r kq F = 5.如图所示,两根细丝线悬挂两个质量相同的小球A 、B .当A 、B 不带电时,静止后上、下两根丝线上的拉力大小分别为T A 、T B .使A 、B 带等量同种电荷时,静止后上、下两根丝线上的拉力大小分别为T A /、T B /.下列结论正确的是 A.T A /=T A ,T B / >T B B.T A /=T A ,T B / T B D.T A / >T A ,T B / x 1/4 D.x 2

相关主题
文本预览
相关文档 最新文档