当前位置:文档之家› 第9章概率论与数理统计的MATLAB实现讲稿

第9章概率论与数理统计的MATLAB实现讲稿

第9章概率论与数理统计的MATLAB实现讲稿
第9章概率论与数理统计的MATLAB实现讲稿

第9章 概率论与数理统计的MATLAB 实现

MA TLAB 总包提供了一些进行数据统计分析的函数,但不完整。利用MA TLAB 统计工具箱,可以进行基本概率和数理统计分析,以及进行比较复杂的多元统计分析。本章主要针对大学本科的概率统计课程介绍工具箱的部分功能。

9.1 随机变量及其分布

利用统计工具箱提供的函数,可以比较方便地计算随机变量的分布律(概率密度函数)和分布函数。 9.1.1 离散型随机变量及其分布律

如果随机变量全部可能取到的不相同的值是有限个或可列个无限多个,则称为离散型随机变量。

MA TLAB 提供的计算常见离散型随机变量分布律的函数及调用格式: 函数调用格式(对应的分布) 分布律

y=binopdf(x,n,p)(二项分布) )()1(),|(),,1,0(x I p p x n p n x f n x n x --?

??

? ??= y=geopdf(x,p)(几何分布) x p p p x f )1()|(-= ),1,0( =x

y=hygepdf(x,M,K,n)(超几何分布) ???

? ?????

? ??--???? ??=n M x n K M x K n K M x f ),,|(

y=poisspdf(x,lambda)(泊松分布) λ

λλ-=e x x f x !

)|(),1,0( =x y=unidpdf(x,n)(离散均匀分布) N

N x f 1)|(= 9.1.2 连续型随机变量及其概率密度

对于随机变量X 的分布函数)(x F ,如果存在非负函数)(x f ,使对于任意实数x 有

?

-=x dt t f x F )()(

则称X 为连续型随机变量,其中函数)(x f 称为X 的概率密度函数。 MA TLAB 提供的计算常见连续型随机变量分布概率密度函数的函数及调用格式:

函数调用格式(对应的分布) 概率密度函数

y=betapdf(x,a,b)(β分布) )10()1()

,(1

),|(11<<-=

--x x x b a B b a x f b a

y=chi2pdf(x,v)(卡方分布) )

2

(2)|(2

2

12v e

x

v x f v x v Γ=

--)0(≥x

y=exppdf(x,mu)(指数分布) μ

μ

μx

e

x f -

=

1

)|()0(≥x

y=fpdf(x,v1,v2)(F 分布) 2

2112221

2121212111

1)2()2()2(

),|(v v v v v x v x v

v v v v v v v x f +-?

??? ?

?+???? ??ΓΓ+Γ= y=gampdf(x,a,b)(伽马分布) b x

a a e x a

b b a x f --Γ=1)

(1

),|()0(≥x

y=normpdf(x,mu,sigma)(正态分布) 2

22)(21

),|(σμπ

σσμ--

=

x e

x f

y=lognpdf(x,mu,sigma)(对数正态分布) 2

2

2)(ln 21

),|(σμπ

σσμ--

=x e

x x f

y=raylpdf(x,b)(瑞利分布) 2

2

22

)|(b x e b x b x f -=

y=tpdf(x,v)(学生氏t 分布) 2

121)2

()21()|(+-???? ?

?+Γ+Γ=v v x v v v v x f π

y=unifpdf(x,a,b)(连续均匀分布) )(1

),|(],[x I a

b b a x f b a -=

y=weibpdf(x,a,b)(威布尔分布) )(),|(),0(1x I e

abx b a x f b

ax b ∞--= 比如,用normpdf 函数计算正态概率密度函数值。该函数的调用格式为:

Y=normpdf(X,MU,SIGMA)

计算数据X 中各值处参数为MU 和SIGMA 的正态概率密度函数的值。参数SIGMA 必须为正。正态概率密度函数的计算公式为:

2

22)(21

),|(σμπ

σσμ--

=

=x e

x f y

9.1.3 分布函数

对于离散型随机变量X ,设x 为任意实数,X 的分布函数为:

{}x X P x F ≤=)(

对于连续型随机变量X ,假设其概率密度函数为)(x f ,则其分布函数为:

?

-=x dt t f x F )()(

MA TLAB 提供了专门的函数求解各种随机变量的分布函数,具体如下:

函数调用格式 对应的分布 p=betacdf(x,a,b) β分布 p=binocdf(x,n,p) 二项分布 p=chi2cdf(x,v) 卡方分布 p=expcdf(x,mu) 指数分布 p=fcdf(x,v1,v2) F 分布 p=gamcdf(x,a,b) 伽马分布 p=geocdf(x,p) 几何分布 p=hygecdf(x,M,K,n) 超几何分布 p=normcdf(x,mu,sigma) 正态分布 p=logncdf(x,mu,sigma) 对数正态分布 p=poisscdf(x,lambda) 泊松分布 p=raylcdf(x,b) 瑞利分布 p=tcdf(x,v) 学生氏t 分布 p=unidcdf(x,n) 离散均匀分布 p=unifcdf(x,a,b) 连续均匀分布 p=weibcdf(x,a,b) 威布尔分布

例如,用normcdf 函数计算正态分布的分布函数。该函数的调用格式为:

P=normcdf(X,MU,SIGMA)

计算参数为MU 和SIGMA 的正态分布函数在数据X 中每个值处的值。参数SIGMA 必须为正。正态分布的分布函数为:

?∞

---

=

=x

t dt e

x F p 2

22)(21

),|(σμπ

σ

σμ

结果p 为取自参数为μ和σ的正态分布总体的单个观测量落在区间),(x -∞中的概率。

例9-1 某仪器需安装一个电子元件,需要电子元件的使用寿命不低于1000小时即可。现有甲乙两厂的电子元件可供选择,甲厂生产的电子元件的寿命服从正态分布)50,1100(2N ,乙厂生产的电子元件的寿命服从正态分布

)80,1150(2N 。问应选哪个工厂的产品呢?

解:设)50,1100(~2N X ,)80,1150(~2N Y 。则有:

{}≈≥1000

X P 0.9772 (命令为1-normcdf(1000,1100,50)) {}≈≥1000

Y P 0.9696(命令为1-normcdf(1000,1150,80)) 因此,应选甲厂生产的产品。 9.1.4逆累加分布函数

逆累加分布函数是累加分布函数的逆函数。利用逆累加分布函数,可以求

得满足给定概率时随机变量对应的置信区间。 常见分布的逆累加分布函数及其调用格式:

函数调用格式 对应的分布 p=betainv(P ,a,b) β分布

p=binoinv(P ,n,p) 二项分布 p=chi2inv(P ,v) 卡方分布 p=expinv(P ,mu) 指数分布 p=finv(P ,v1,v2) F 分布 p=gaminv(P ,a,b) 伽马分布 p=geoinv(P ,p) 几何分布 p=hygeinv(P ,M,K,n) 超几何分布 p=norminv(P ,mu,sigma) 正态分布 p=logninv(P ,mu,sigma) 对数正态分布 p=poissinv(P ,lambda) 泊松分布 p=raylinv(P ,b) 瑞利分布 p=tcdfinv(P ,v) 学生氏t 分布

p=unidinv(P ,n) 离散均匀分布 p=unifinv(P ,a,b) 连续均匀分布 p=weibinv(P ,a,b) 威布尔分布

例9-2 有同类设备300台,各台工作状态相互独立。已知每台设备发生故障的概率为0.01,若一台设备发生故障需要1人去处理,问至少需要多少工人,才能保证设备发生故障而不能及时维修的概率小于0.01?

解:设X 表示同一时刻发生故障的设备台数,则有)01.0,300(~B X 。再设配备N 位维修人员,则有: {}01.0<>N X P

{}99.0>≤N X P

键入命令:

p=binoinv(0.99,300,0.01) 运行结果: p =8

键入命令:

binocdf(8,300,0.01) binocdf(7,300,0.01) 运行结果: ans =0.9964 ans =0.9885

因此,至少需要8个工人,才能保证设备发生故障而不能及时维修的概率小于0.01。

9.2 多维随机变量及其分布

9.2.1二维随机变量

用mvnpdf 和mvncdf 函数可以计算二维正态分布随机变量在指定位置处的概率和累积分布函数值。

例9-3 计算服从二维正态分布的随机变量在指定范围内的概率密度值并绘图。

程序:

%二维正态分布的随机变量在指定范围内的概率密度函数图形 mu=[0 0];

sigma=[0.25 0.3;0.3 1];%协方差阵 x=-3:0.1:3;y=-3:0.15:3;

[x1,y1]=meshgrid(x,y);%将平面区域网格化取值

f=mvnpdf([x1(:) y1(:)],mu,sigma);%计算二维正态分布概率密度函数值

F=reshape(f,numel(y),numel(x));%矩阵重塑

surf(x,y,F);

caxis([min(F(:))-0.5*range(F(:)),max(F(:))]);%range(x)表示最大值与最小值的差,即极差。

axis([-4 4 -4 4 0 0.5]);

xlabel('x');

ylabel('y');

zlabel('Probability Density');

运行结果见图9-1。

图9-1二维正态分布的随机变量的概率密度函数

例9-4计算服从二维正态分布的随机变量在指定范围内的累积分布函数值并绘图。

程序:

%二维正态分布的随机变量在指定范围内的累积分布函数图形

mu=[0 0];

sigma=[0.25 0.3;0.3 1];%协方差阵

x=-3:0.1:3;y=-3:0.2:3;

[x1,y1]=meshgrid(x,y);%将平面区域网格化取值

f=mvncdf([x1(:) y1(:)],mu,sigma);%计算累积分布函数值

F=reshape(f,numel(y),numel(x));%矩阵重塑

surf(x,y,F);

caxis([min(F(:))-0.5*range(F(:)),max(F(:))]);%range(x)表示最大值与最小值的差,即极差。

axis([-3 3 -3 3 0 0.5]);

xlabel('x');

ylabel('y');

zlabel('Probability Density');

9.2.2边缘分布

对于连续型随机变量),(Y X ,关于X 和Y 的边缘概率密度)(x f X 和

)(y f Y 分别为:

?∞

+∞-=dy y x f x f X ),()( ?

+∞

-=

dx y x f y f Y ),()(

例9-5 设),(Y X 具有概率密度???≤≤=其他。,

0;

1,),(22y x y Cx y x f

⑴确定常数C ;

⑵求边缘概率密度)(x f X 和)(y f Y 。

解:⑴由

1),(11

1

222

==????

-x

R ydy Cx dx d y x f σ可得25.5=C ;

计算程序为: syms x y C fxy=C*x*x*y;

g=int(int(fxy,y,x*x,1),x,-1,1); C=double(solve(g-1)) ⑵程序: syms x y

fxy=5.25*x*x*y; fx=int(fxy,y,x*x,1)

fy=int(fxy,x,-sqrt(y),sqrt(y)) 运行结果:

fx =21/8*x^2*(1-x^4) fy =7/2*y^(5/2) 因此,

??

???≤≤--=其他。,0;11),1(821)(42x x x x f X ,?????≤≤=其他。,0;

10,27)(5.2y y y f Y

9.3 随机变量的数字特征

在解决实际问题过程中,往往并不需要全面了解随机变量的分布情况,而

只需要知道它们的某些特征,这些特征通常称为随机变量的数字特征。常见的有数学期望、方差、相关系数和矩等。 9.3.1 数学期望

⒈ 离散型随机变量的数学期望 设离散型随机变量X 的分布律为:

{}k k p x X P ==, ,2,1=k

如果

∑k

k k

p x

绝对收敛,则称∑k

k k p x 的和为随机变量X 的数学期望。

例9-6 设X 表示一张彩票的奖金额,X 的分布列如下:

试求)(X E 。

求解程序:

x=[500000 50000 5000 500 50 10 0]';

p=[0.000001 0.000009 0.00009 0.0009 0.009 0.09 0.9]'; Ex=x'*p 运行结果: Ex=3.2000

例9-7 设{}p p k X P k 1)1(--==, ,2,1=k ,10<

Ex=symsum(k*p*(1-p)^(k-1),k,1,inf) 运行结果: Ex=1/p

⒉ 连续型随机变量的数学期望

设连续型随机变量X 的概率密度为)(x f ,若积分?

R

dx x xf )(绝对收敛,

则称该积分的值为随机变量X 的数学期望。

例9-8 设X 的概率密度为????

?????

<<-≤≤=其他。0;30001500,1500

3000;15000,

1500)(2

2x x

x x x f ,求

)(X E 。

求解程序: syms x

f1=x/1500^2;

f2=(3000-x)/1500^2;

Ex=int(x*f1,0,1500)+int(x*f2,1500,3000) 运行结果: Ex =1500

⒊ 二维随机变量及其函数的数学期望 计算公式:

=j i ij j i p y x g Y X g E ,),()),((

??=

2

),(),()),((R d y x f y x g Y X g E σ

例9-9 设二维随机变量),(Y X 的概率密度为

?

?

?<<<<+=其他。,0;

10,10,),(y x y x y x f 求)(XY E 。

求解程序: syms x y f=x+y;

Ex=int(int(x*y*f,y,0,1),0,1) 运行结果: Ex =1/3 9.3.2 方差

设X 是一个随机变量,若{}

2)]([X E X E -存在,则称{}

2)]([X E X E -为X 的方差,记为)(X Var 。即

{}

2)]([)(X E X E X Var -=

9.3.3 常见分布的数学期望和方差

MA TLAB 提供了常见分布的均值和方差的计算函数,其调用格式如下:

函数调用格式 对应的分布 [M,V]=betastat(a,b) β分布

[M,V]=binostat (n,p) 二项分布

[M,V]=chi2stat(v) 卡方分布 [M,V]=expstat(mu) 指数分布 [M,V]=fstat(v1,v2) F 分布 [M,V]=gamstat(a,b) 伽马分布 [M,V]=geostat(p) 几何分布 [M,V]=hygestat(M,K,n) 超几何分布 [M,V]=normstat(mu,sigma) 正态分布 [M,V]=lognstat(mu,sigma) 对数正态分布 [M,V]=poisstat(lambda) 泊松分布 [M,V]=raylstat(b) 瑞利分布 [M,V]=tstat(v) 学生氏t 分布 [M,V]=unidstat(n) 离散均匀分布 [M,V]=unifstat(a,b) 连续均匀分布 [M,V]=weibstat(a,b) 威布尔分布

9.3.4 协方差及相关系数

随机变量X 与Y 的协方差:{})]()][([),(Y E Y X E X E Y X Cov --=。 随机变量X 与Y 的相关系数:)

()(),(Y D X D Y X Cov XY =

ρ。

设n i y x i i ,,2,1),,( =是容量为n 的二维样本,则样本的相关系数为:

∑∑∑----=

i

i

i

i

i

i i

y y

x x

y y x x

r 2

2

)

()

()

)((

相关系数常常用来衡量两套变量之间的线性相关性,相关系数的绝对值越接近1,表示相关性越强,反之越弱。

用cov 函数计算样本协方差矩阵。其语法格式为: ●C=cov(X)

●C=cov(X,Y)=cov([X,Y]) 其中X ,Y 为长度相等的列向量。

对于单一矢量而言,cov(X)返回一个包含协方差的标量。对于列为变量观测值的矩阵而言,cov(X)为协方差矩阵。

cov 函数的算法为:

[n,p]=size(X);

Y=X-ones(n,1)*mean(X); C=Y'*Y ./(n-1)

用函数计算样本数据的相关系数矩阵。

●R=corrcoef(X):返回源于矩阵的相关系数矩阵。

例9-10

程序:

%协方差的计算

x=[1050 1100 1120 1250 1280]';

a=cov(x)

[n,p]=size(x);

y=x-ones(n,1)*mean(x);

b=y'*y/(n-1)

运行结果:

a =9950

b =9950

例9-11

程序:

%协方差阵的计算

x=[1050 1038;1100 1089;1120 1118;1250 1256;1280 1300];

a=cov(x)

[n,p]=size(x);

y=x-ones(n,1)*mean(x);

b=y'*y/(n-1)

运行结果:

a =

1.0e+004 *

0.9950 1.1200

1.1200 1.2626

b =

1.0e+004 *

0.9950 1.1200

1.1200 1.2626

9.3.5 矩和协方差矩阵

MA TLAB中可以利用moment函数计算样本的中心矩。该函数的调用格式为:

●m=moment(X,order):返回X的order阶中心矩。对于矢量,moment(X,order)函数返回X数据的指定阶次中心矩。对于矩阵,moment(X,order)返回X数据的每一列的指定阶次中心矩。

注意:一阶中心矩为0,二阶中心矩为用除数n(而非n-1)得到的方差,其中n为矢量X的长度或是矩阵X的行数。

如果n维随机变量两两之间的协方差都存在,则它们构成的矩阵称为这n

个随机变量的协方差矩阵。在MA TLAB 中,协方差矩阵仍然用cov 函数计算。

9.4 样本描述

采集到大量的样本数据以后,常常需要用一些统计量来描述数据的集中程度和离散程度,并通过这些指标来对数据的总体特征进行归纳。

描述样本数据集中趋势的统计量有算术平均、中位数、众数、几何均值、调和均值和截尾均值等。描述样本数据离散趋势的统计量包括极差、平均差、平均绝对差、方差和标准差等。 9.4.1 集中趋势

⒈ 几何均值

样本数据n x x x ,,,21 的几何均值:m n

n

i i x 1

1???

?

??

=∏=。 用geomean 函数计算几何均值。

●m=geomean(X):计算样本的几何均值。对于矢量,geomean(X)为数据X 中元素的几何均值。对于矩阵,geomean(X)为一行矢量,包含每列数据的几何均值。

⒉ 调和均值

样本数据n x x x ,,,21 的调和平均值∑==

n

i i

x n m 11。

用harmmean 函数计算样本数据的调和平均值。

●m=harmmean(X):计算样本的调和平均值。对于矢量,harmmean(X)函数为X 中元素的调和平均值。对于矩阵,harmmean(X)函数为包含每列元素调和平均值的行向量。

⒊ 算术平均值

样本数据n x x x ,,,21 的算术平均值∑==n

i i x n x 1

1。

用mean 函数计算矢量和矩阵中元素的均值。语法格式为: ●m=mean(X):对于矢量,mean(X)为X 中元素的均值。对于矩阵,mean(X)为包含X 中每列元素均值的行矢量。

⒋ 中值

用median 函数计算矢量和矩阵中元素的中值。该函数的调用格式为:

●m=median(X):计算样本数据的中值。中值是样本数据中心趋势的稳健估计,因为异常值的影响较小。对于矢量,median(X)为X中元素的中值。对于矩阵,median(X)为包含X中每列元素中值的行矢量。计算中值需要首先进行排序,因此计算大型矩阵的中值矢量时比较费时。

⒌截尾均值

对样本数据进行排序以后,去掉两端的部分极值,然后对剩下的数据求算术平均值,得到截尾均值。用函数trimmean计算截尾均值

●m=trimmean(X,percent):剔除测量值中最大和最小0.5*percent%的数据以后,计算样本X的均值。截尾均值为样本位置参数的稳健性估计。若数据中异常值,截尾均值为数据中心的一个更有代表性的估计。若所有数据取自同一分布的总体,则使用样本均值比使用截尾均值更有效。

例9-12

程序:

%计算截尾均值

x=[1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19];

xbar=mean(x)

xtrim=trimmean(x,10)

y=[0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 1000];

ybar=mean(y)

ytrim=trimmean(y,10)

ztrim=[];

for k=10:15

z=[0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 1000 2000];

zbar=mean(z);

ztrim(k-9)=trimmean(z,k);

end

zbar

ztrim

运行结果:

xbar =10

xtrim =10

ybar =56.6667

ytrim =10

zbar =138.6957

ztrim =

54.0909 54.0909 54.0909 54.0909 10.0000 10.0000

9.4.2 离中趋势

描述离散趋势的统计量包括均值绝对差、极值、方差和标准差等。

⒈ 均值绝对差

用mad 函数计算数据样本的均值或中值绝对差(MAD )。

●y=mad(X):计算X 中数据的均值绝对差。如果X 为矢量,则y 用mean(abs(X-mean(X)))计算;如果X 为矩阵,则y 为包含X 中每列数据均值绝对差的行矢量。

●y=mad(X,0):与y=mad(X)相同,使用均值。 ●y=mad(X,1):y=median(abs(X-median(X)))。 例9-13 程序:

%计算均值绝对差 x=[5 20 60;55 520 660]; [m,n]=size(x); for j=1:n

y(j)=mean(abs(x(:,j)-ones(m,1)*mean(x(:,j)))); end y=y

z=mad(x) 运行结果: y =

25 250 300 z =

25 250 300 ⒉ 极差

极差指的是样本中最小值与最大值之间的差值。

●y=range(X):返回极差。对矢量而言,range(X)为X 中元素的极差。对矩阵而言,range(X)为包含X 中列元素极差的行矢量。

⒊ 方差

●y=var(X):计算X 中数据的方差。对矢量而言,var(X)为X 中元素的方差;对矩阵而言,var(X)是包含X 中每一列元素方差的行矢量。通过除以n-1(n

是样本大小)来达到标称化。对于正态分布数据,这使var(X)成为2

σ的最小方差无偏估计量。

●y=var(X,1):除以n(n 是样本大小),是样本数据的二阶矩。

●y=var(X,w):使用权重矢量w 计算方差。w 中元素的个数必须等于矩阵X 的行数。对于矢量X ,w 和X 必须在长度上匹配。w 的每一个元素必须为正。

注意:令SS 为X 矢量中元素与其均值之间的离差平方和,则var(X)=

SS/(n-1)为2σ的最小方差无偏估计量,var(X,1)=SS/n 为2

σ的最大似然估计量。

例9-14 程序:

%说明方差的算法 x=[-2 1;-1 5;1 3;2 7]; w=[1;2;3;4]; v11=var(x) v12=var(x,0) v2=var(x,1) v31=var(x,w)

[m,n]=size(x);xbar=zeros(1,n); for j=1:n

xbar(j)=(x(:,j))'*w./sum(w); end

v32=zeros(1,n); for j=1:n

v32(j)=((x(:,j)-xbar(j)).^2)'*w./sum(w); end v32

运行结果: v11 =

3.3333 6.6667 v12 =

3.3333 6.6667 v2 =

2.5000 5.0000 v31 =

2.0100 4.3600 v32 =

2.0100 4.3600 ⒋ 标准差

样本数据n x x x ,,,21 的标准差()

∑=--=n i i x x n s 1

211,∑==n

i i x n x 11。 ●y=std(X):计算X 中数据样本的标准差。对于矢量X ,std(X)为X 中元素的标准差;对于矩阵,std(X)为包含X 中每一列标准差的行矢量。 9.4.3 抽样分布

统计量的分布称为抽样分布。正态总体的几个常用统计量的分布包括2

χ分布、t 分布和F 分布。下面给出用MA TLAB 进行这三大分布有关的计算表。

分布有关的计算表

表9-1用MA TLAB进行2

表9-2用MA TLAB进行t分布有关的计算表

表9-3用MA TLAB进行F分布有关的计算表

9.5 参数估计

参数估计的内容包括点估计和区间估计。MA TLAB统计工具箱提供了进行最大似然估计的函数,可以计算待估参数及其置信区间。利用专门的参数估计函数,可以估计服从不同分布的函数的参数。

9.5.1 点估计

点估计是用单个数值作为参数的估计,常用的方法有矩法和最大似然法。

⒈矩法

某些情况下,待估参数往往是总体原点矩或原点矩的函数,此时可以用取自该总体的样本的原点矩或样本原点矩的函数值作为待估参数的估计,这种方法称为矩法。例如,样本均值总是总体均值的矩估计量,样本方差总是总体方差的矩估计量,样本标准差总是总体标准差的矩估计量。

用计算矩的函数moment(X,order)进行估计。

例9-15对某型号的20辆汽车记录其5L汽油的行驶里程(公里),观测数据如下:

29.827.628.327.930.128.729.928.027.928.7

28.427.229.528.528.030.029.129.829.626.9

试估计总体的均值和方差。

求解程序:

%矩法估计

x1=[29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7];

x2=[28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9];

x=[x1 x2]';

muhat=mean(x)

sigma2hat=moment(x,2)%样本二阶中心矩

var(x,1)

运行结果:

muhat = 28.6950

sigma2hat =0.9185

ans=0.9185

⒉最大似然法

最大似然法是在待估参数的可能取值范围内进行挑选,使似然函数值(即样本取固定观察值邻域内的概率)最大的那个参数值即为最大似然估计量。由于最大似然估计法得到的估计量通常不仅仅满足无偏性、有效性等基本条件,还能保证其为充分统计量,所以,在点估计和区间估计中,一般推荐使用最大似然法。

用函数mle进行最大似然估计。该函数的常见调用格式为:

phat=mle('dist',data)

使用data矢量中的样本数据,返回dist 指定的分布的最大似然估计(MLE)。

例9-16对某型号的20辆汽车记录其5L汽油的行驶里程(公里),观测数据如下:

29.827.628.327.930.128.729.928.027.928.7

28.427.229.528.528.030.029.129.829.626.9

设行驶里程服从正态分布,试用最大似然估计法估计总体的均值和方差。

求解程序:

%最大似然估计

x1=[29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7];

x2=[28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9];

x=[x1 x2]';

p=mle('norm',x);

muhatmle=p(1)

sigma2hatmle=p(2)^2

运行结果:

muhatmle =28.6950

sigma2hatmle =0.9185

9.5.2 区间估计

求参数的区间估计,首先要求出该参数的点估计,然后构造一个含有该参数的随机变量,并根据一定的置信水平求该估计值的范围。

用mle函数进行最大似然估计时,还有如下几种调用格式:

●[phat,pci]=mle('dist',data):返回最大似然估计和95%置信区间。

●[phat,pci]=mle('dist',data,alpha):返回指定分布的最大似然估计值和100(1- alpha)%置信区间。

●[phat,pci]= mle('dist',data,alpha,p1):该形式仅用于二项分布,其中p1为实验次数。

例9-17对某型号的20辆汽车记录其5L汽油的行驶里程(公里),观测数据如下:

29.827.628.327.930.128.729.928.027.928.7

28.427.229.528.528.030.029.129.829.626.9

设行驶里程服从正态分布,求平均行驶里程的95%置信区间。

求解程序:

%总体均值的区间估计

x1=[29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7];

x2=[28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9];

x=[x1 x2]';

[p,ci]=mle('norm',x,0.05)

运行结果:

p =

28.6950 0.9584

ci =

28.2348 0.7478

29.1552 1.4361

即平均行驶里程的95%置信区间为(28.2348,291552)。

9.5.3 常见分布的参数估计

通过指定分布类型,使用mle函数可以求得服从多种分布的总体的参数估计量。但MA TLAB统计工具箱还提供了具体函数的参数估计函数,如表9-4所示。

例如,用normfit函数对正态分布总体进行参数估计。

●[muhat,sigmahat,muci,sigmaci]=normfit(x):对于给定的正态分布的数据x,

返回参数μ的估计值muhat、σ的估计值sigmahat、μ的95%置信区间muci 和σ的95%置信区间sigmaci。

●[muhat,sigmahat,muci,sigmaci]=normfit(x, alpha):进行参数估计并计算100(1- alpha)%置信区间。

表9-4常见分布的参数估计函数及其调用格式

例9-18用normfit函数求解例9-17。

解:由)1(~/--=

n t n

S X T μ可得μ的)%1(100α-置信区间:

n s n t

X /)1(2

1-±-

α

由)1(~)1(22

2

2

--=

n S n χσχ可得2σ的)%1(100α-置信区间: ????

??????-----)1()1(,)1()1(222

2212n s n n s n ααχχ 下面的程序是为了比较mle 函数和normfit 函数的功能。

程序:

%用normfit 函数求区间估计

x1=[29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7]; x2=[28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9]; x=[x1 x2]'; a=0.05;

[muhat,sigmahat,muci,sigmaci]=normfit(x,a); [p,ci]=mle('norm',x,a); n=numel(x); format long muhat p1=p(1) sigmahat

sigmahat1=var(x).^0.5 p2=p(2) muci ci

sigmaci

muci1=[muhat-tinv(1-a/2,n-1)*sigmahat/sqrt(n),

muhat+tinv(1-a/2,n-1)*sigmahat/sqrt(n)]

sigmaci1=[((n-1).*sigmahat.^2/chi2inv(1-a/2,n-1)).^0.5,

((n-1).*sigmahat.^2/chi2inv(a/2,n-1)).^0.5]

运行结果:

muhat=28.69500000000000 p1=28.69500000000000

sigmahat=0.98326791337544 sigmahat1=0.98326791337544

概率论与数理统计习题集及答案

* 《概率论与数理统计》作业集及答案 第1章 概率论的基本概念 §1 .1 随机试验及随机事件 1. (1) 一枚硬币连丢3次,观察正面H ﹑反面T 出现的情形. 样本空间是:S= ; (2) 一枚硬币连丢3次,观察出现正面的次数. 样本空间是:S= ; 2.(1) 丢一颗骰子. A :出现奇数点,则A= ;B :数点大于2,则B= . (2) 一枚硬币连丢2次, A :第一次出现正面,则A= ; B :两次出现同一面,则= ; C :至少有一次出现正面,则C= . ? §1 .2 随机事件的运算 1. 设A 、B 、C 为三事件,用A 、B 、C 的运算关系表示下列各事件: (1)A 、B 、C 都不发生表示为: .(2)A 与B 都发生,而C 不发生表示为: . (3)A 与B 都不发生,而C 发生表示为: .(4)A 、B 、C 中最多二个发生表示为: . (5)A 、B 、C 中至少二个发生表示为: .(6)A 、B 、C 中不多于一个发生表示为: . 2. 设}42:{},31:{},50:{≤<=≤<=≤≤=x B x x A x x S :则 (1)=?B A ,(2)=AB ,(3)=B A , (4)B A ?= ,(5)B A = 。 \ §1 .3 概率的定义和性质 1. 已知6.0)(,5.0)(,8.0)(===?B P A P B A P ,则 (1) =)(AB P , (2)()(B A P )= , (3))(B A P ?= . 2. 已知,3.0)(,7.0)(==AB P A P 则)(B A P = . §1 .4 古典概型 1. 某班有30个同学,其中8个女同学, 随机地选10个,求:(1)正好有2个女同学的概率, (2)最多有2个女同学的概率,(3) 至少有2个女同学的概率. 2. 将3个不同的球随机地投入到4个盒子中,求有三个盒子各一球的概率. — §1 .5 条件概率与乘法公式 1.丢甲、乙两颗均匀的骰子,已知点数之和为7, 则其中一颗为1的概率是 。 2. 已知,2/1)|(,3/1)|(,4/1)(===B A P A B P A P 则=?)(B A P 。 §1 .6 全概率公式 1. 有10个签,其中2个“中”,第一人随机地抽一个签,不放回,第二人再随机地抽一个 签,说明两人抽“中‘的概率相同。

matlab与多元统计分析

Matlab 与多元统计分析 胡云峰 安庆师范学院 第三章习题 3.1对某地区的6名2周岁男婴的身高、胸围、上半臂进行测量。得样本数据如表3.1所示。 假设男婴的测量数据X (a )(a=1,…,6)来自正态总体N 3(μ,∑) 的随机样本。根据以往的资料,该地区城市2周岁男婴的这三项的均值向量μ0=(90,58,16)’,试检验该地区农村男婴与城市男婴是否有相同的均值向量。 表3.1 某地区农村2周岁男婴的体格测量数据 1.预备知识 ∑未知时均值向量的检验: H 0:μ=μ0 H 1:μ≠μ0 H 0成立时 122)(0,)(1)(1,) ()'((1)))()'()(,1)(1)1(,) (1)P P X N n S W n n X n S X n X S X T p n n p T F P n p n p μμμμμ---∑--∑??∴----=-----+∴-- 当 2 (,)(1) n p T F p n p p n α-≥--或者22T T α≥拒绝0H 当 2 (,)(1) n p T F p n p p n α-<--或者22T T α<接受0H 这里2 (1) (, )p n T F p n p n p αα-= -- 2.根据预备知识用matlab 实现本例题 算样本协方差和均值 程序x=[78 60.6 16.5;76 58.1 12.5;92 63.2 14.5;81 59.0 14.0;81 60.8 15.5;84 59.5 14.0]; [n,p]=size(x); i=1:1:n; xjunzhi=(1/n)*sum(x(i,:));

数字图像平滑滤波在MATLAB上的实现

第 5 章图像平滑滤波在MATLAB上的实现 本课程设计在MATLAB上实现的程序和结果 I=imread('b.bmp'); v=0.5*ones(size(I)); I1=imnoise(I,'localvar',v); I2=imnoise(I,'salt & pepper',0.02); I3=imnoise(I,'speckle',0.02); figure; subplot(221); hold on; title('原图像'); imshow(I); hold off; subplot(222); hold on; title('受高斯噪声污染的图像'); imshow(I1); hold off; subplot(223); hold on; title('受椒盐噪声污染的图像'); imshow(I2); hold off; subplot(224); hold on; title('受乘性噪声污染的图像'); imshow(I3); hold off;

原图像受高斯噪声污染的图像 受椒盐噪声污染的图像受乘性噪声污染的图像 h=ones(3,3)/9; J1=imfilter(I1,h); J2=imfilter(I2,h); J3=imfilter(I3,h); figure; subplot(221); hold on; title('原图像'); imshow(I); hold off; subplot(222); hold on; title('对有高斯噪声的3*3邻域平均后的图像'); imshow(J1); hold off; subplot(223); hold on; title('对有椒盐噪声的3*3邻域平均后的图像'); imshow(J2); hold off; subplot(224); hold on; title('对有乘性噪声的3*3邻域平均后的图像'); imshow(J3);

计算方法_全主元消去法_matlab程序

%求四阶线性方程组的MA TLAB程序 clear Ab=[0.001 2 1 5 1; 3 - 4 0.1 -2 2; 2 -1 2 0.01 3; 1.1 6 2.3 9 4];%增广矩阵 num=[1 2 3 4];%未知量x的对应序号 for i=1:3 A=abs(Ab(i:4,i:4));%系数矩阵取绝对值 [r,c]=find(A==max(A(:))); r=r+i-1;%最大值对应行号 c=c+i-1;%最大值对应列号 q=Ab(r,:),Ab(r,:)=Ab(i,:),Ab(i,:)=q;%行变换 w=Ab(:,c),Ab(:,c)=Ab(:,i),Ab(:,i)=w;%列变换 n=num(i),num(i)=num(c),num(c)=n;%列变换引起未知量x次序变化for j=i:3 Ab(j+1,:)=-Ab(j+1,i)*Ab(i,:)/Ab(i,i)+Ab(j+1,:);%消去过程 end end %最后得到系数矩阵为上三角矩阵 %回代算法求解上三角形方程组 x(4)=Ab(4,5)/Ab(4,4); x(3)=(Ab(3,5)-Ab(3,4)*x(4))/Ab(3,3); x(2)=(Ab(2,5)-Ab(2,3)*x(3)-Ab(2,4)*x(4))/Ab(2,2); x(1)=(Ab(1,5)-Ab(1,2)*x(2)-Ab(1,3)*x(3)-Ab(1,4)*x(4))/Ab(1,1); for s=1:4 fprintf('未知量x%g =%g\n',num(s),x(s)) end %验证如下 %A=[0.001 2 1 5 1; 3 -4 0.1 -2 2;2 -1 2 0.01 3; 1.1 6 2.3 9 4]; %b=[1 2 3 4]'; %x=A\b; %x1= 1.0308 %x2= 0.3144 %x3= 0.6267 %x4= -0.0513

概率论与数理统计练习题

概率论与数理统计练习题 一、填空题 1、设A 、B 为随机事件,且P (A)=,P (B)=,P (B A)=,则P (A+B)=__ __。 2、θθθ是常数21? ,?的两个 无偏 估计量,若)? ()?(21θθD D <,则称1?θ比2?θ有效。 3、设A 、B 为随机事件,且P (A )=, P (B )=, P (A ∪B )=,则P (B A )=。 4. 设随机变量X 服从[0,2]上的均匀分布,Y =2X +1,则D (Y )= 4/3 。 5. 设随机变量X 的概率密度是: ?? ?<<=其他 103)(2 x x x f ,且{}784 .0=≥αX P ,则α= 。 6. 已知随机向量(X ,Y )的联合密度函数 ?????≤≤≤≤=其他 , 010,20, 2 3 ),(2y x xy y x f ,则 E (Y )= 3/4 。 7. 若随机变量X ~N (1,4),Y ~N (2,9),且X 与Y 相互独立。设Z =X -Y +3,则Z ~ N (2, 13) 。 * 8. 设A ,B 为随机事件,且P (A)=,P (A -B)=,则=?)(B A P 。 9. 设随机变量X ~ N (1, 4),已知Φ=,Φ=,则{}=<2X P 。 10. 随机变量X 的概率密度函数1 22 1 )(-+-= x x e x f π ,则E (X )= 1 。 11. 已知随机向量(X ,Y )的联合密度函数 ?? ?≤≤≤≤=其他 , 010,20, ),(y x xy y x f ,则 E (X )= 4/3 。 12. 设A ,B 为随机事件,且P (A)=, P (AB)= P (B A ), 则P (B )= 。 13. 设随机变量),(~2σμN X ,其密度函数6 4 4261)(+-- = x x e x f π ,则μ= 2 。 14. 设随机变量X 的数学期望EX 和方差DX >0都存在,令DX EX X Y /)(-=,则D Y= 1 。 15. 随机变量X 与Y 相互独立,且D (X )=4,D (Y )=2,则D (3X -2Y )= 44。 16. 三个人独立地向某一目标进行射击,已知各人能击中的概率分别为3 1 ,41,51,则目标能被击中 的概率是3/5 。 17. 设随机变量X ~N (2,2σ),且P {2 < X <4}=,则P {X < 0}= 。 ! 18. 设随机变量X 的概率分布为5.0)3(,3.0)2(,2.0)1(======X P X P X P ,则X 的期望

MATLAB实现频域平滑滤波以及图像去噪代码

用MATLAB实现频域平滑滤波以及图像去噪代码 悬赏分:50 - 解决时间:2008-11-8 14:21 是数字图象处理的实验,麻烦高人给个写好的代码,希望能在重要语句后面附上一定的说明,只要能在MATLAB上运行成功,必然给分。具体的实验指导书上的要求如下: 频域平滑滤波实验步骤 1. 打开Matlab 编程环境;

2. 利用’imread’函数读入图像数据; 3. 利用’imshow’显示所读入的图像数据; 4. 将图像数据由’uint8’格式转换为’double’格式,并将各点数据乘以 (-1)x+y 以便FFT 变换后的结果中低频数据处于图像中央; 5. 用’fft2’函数对图像数据进行二维FFT 变换,得到频率域图像数据; 6. 计算频率域图像的幅值并进行对数变换,利用’imshow’显示频率域图 像; 7. 在频率图像上去除滤波半径以外的数据(置0); 8. 计算频率域图像的幅值并进行对数变换,利用’imshow’显示处理过的 频域图像数据; 9. 用’ifft2’函数对图像数据进行二维FFT 逆变换,并用’real’函数取其实部,得到处理过的空间域图像数据; 10. 将图像数据各点数据乘以(-1)x+y; 11. 利用’imshow’显示处理结果图像数据; 12. 利用’imwrite’函数保存图像处理结果数据。 图像去噪实验步骤: 1. 打开Matlab 编程环境; 2. 利用’imread’函数读入包含噪声的原始图像数据; 3. 利用’imshow’显示所读入的图像数据; 4. 以3X3 大小为处理掩模,编写代码实现中值滤波算法,并对原始噪声 图像进行滤波处理; 5. 利用’imshow’显示处理结果图像数据; 6. 利用’imwrite’函数保存图像处理结果数据。 即使不是按这些步骤来的也没关系,只要是那个功能,能实现就OK,谢谢大家 %%%%%%%%spatial frequency (SF) filtering by low pass filter%%%%%%%% % the SF filter is unselective to orientation (doughnut-shaped in the SF % domain). [FileName,PathName,FilterIndex] = uigetfile ; filename = fullfile(PathName, FileName) ; [X map] = imread(filename, fmt); % read image L = double(X); % transform to double %%%%%%%%%%%%% need to add (-1)x+y to L % calculate the number of points for FFT (power of 2) fftsize = 2 .^ ceil(log2(size(L))); % 2d fft Y = fft2(X, fftsize(1), fftsize (2));

《概率论与数理统计》在线作业

第一阶段在线作业 第1题 您的答案:B 题目分数:0.5 此题得分:0.5 批注:对立不是独立。两个集合互补。第2题 您的答案:D 题目分数:0.5 此题得分:0.5 批注:A发生,必然导致和事件发生。第3题

您的答案:B 题目分数:0.5 此题得分:0.5 批注:分布函数的取值最大为1,最小为0. 第4题 您的答案:A 题目分数:0.5 此题得分:0.5 批注:密度函数在【-1,1】区间积分。第5题

您的答案:A 题目分数:0.5 此题得分:0.5 批注:A答案,包括了BC两种情况。 第6题 您的答案:A 题目分数:0.5 此题得分:0.5 批注:古典概型,等可能概型,16种总共的投法。第7题

您的答案:C 题目分数:0.5 此题得分:0.5 批注:几何概型,前两次没有命中,且第三次命中,三次相互独立,概率相乘。 第8题 您的答案:D 题目分数:0.5 此题得分:0.5 批注:利用随机变量单调性函数的概率密度求解公式公式。中间有反函数求导数,加绝对值。第9题

您的答案:C 题目分数:0.5 此题得分:0.5 批注:利用概率密度的性质,概率密度在相应范围上的积分值为1.验证四个区间。 第10题 您的答案:B 题目分数:0.5 此题得分:0.5 批注:利用分布函数的性质,包括分布函数的值域[0,1]当自变量趋向无穷时,分布函数取值应该是1.排除答案。 第11题

您的答案:C 题目分数:0.5 此题得分:0.5 批注:利用上分位点的定义。 第12题 您的答案:B 题目分数:0.5 此题得分:0.5 批注:利用和事件的公式,还有概率小于等于1.P(AB)小于等于P(C)。第13题

MATLAB 判别分析

判别分析在生产、科学研究和日常生活中,经常会遇到对某一研究对象属于哪种情况作出判断。例如要根据这两天天气情况判断明天是否会下雨;医生要根据病人的体温、白血球数目及其它症状判断此病人是否会患某种疾病等等。从概率论的角度看,可把判别问题归结为如下模型。设共有n 个总体: n ξξξ,,,21L 其中i ξ是m 维随机变量,其分布函数为 ),,(1m i x x F L ,n i ,,2,1L = 而),,(1m x x L 是表征总体特性的m 个随机变量的取值。在判别分析中称这m 个变量为判别因子。现有一个新的样本点T m x x x ),,(1L =,要判断此样本点属于哪一个总体。 Matlab 的统计工具箱提供了判别函数classify 。 函数的调用格式为: [CLASS,ERR] = CLASSIFY(SAMPLE,TRAINING ,GROUP, TYPE) 其中SAMPLE 为未知待分类的样本矩阵,TRAINING 为已知分类的样本矩阵,它们有相同的列数m ,设待分类的样本点的个数,即SAMPLE 的行数为s ,已知样本点的个数,即TRAINING 的行数为t ,则GROUP 为t 维列向量,若TRAINING 的第i 行属于总体i ξ,则 GROUP 对应位置的元素可以记为i ,TYPE 为分类方法,缺省值为'linear',即线性分类,TYPE 还可取值'quadratic','mahalanobis'(mahalanobis 距离)。返回值CLASS 为s 维列向量,给出了SAMPLE 中样本的分类,ERR 给出了分类误判率的估计值。例已知8个乳房肿瘤病灶组织的样本,其中前3个为良性肿瘤,后5个为恶性肿瘤。数据为细胞核显微图像的10个量化特征:细胞核直径,质地,周长,面积,光滑度。根据已知样本对未知的三个样本进行分类。已知样本的数据为:13.54,14.36,87.46,566.3,0.09779 13.08,15.71,85.63,520,0.1075 9.504,12.44,60.34,273.9,0.1024 17.99,10.38,122.8,1001,0.1184 20.57,17.77,132.9,1326,0.08474 19.69,21.25,130,1203,0.1096 11.42,20.38,77.58,386.1,0.1425 20.29,14.34,135.1,1297,0.1003 -1-

图像平滑方法综述与MATLAB实现之欧阳家百创编

江苏科技大学 数字图像处理本科生课程论文 论文题目:图像平滑方法综述与MATLAB实现完成时间:11月20日 所在专业:信息与计算科学

图像平滑方法综述与MATLAB实现 摘要:在图像的生成、传输或变换的过程中,由于多种因素的影响,总要造成图像质量的下降,这就需要进行图像增强。随着图像处理领域的迅速发展,图像平滑作为图像增强的重要环节,也逐渐受到人们的关注。图像平滑的目的为了消除噪声。图像平滑可以在空间域进行,也可以在频率域进行。空间域常用的方法有领域平均法、中值滤波和多图像平均法;在频率域,因为噪声频谱多在高频段,因此可以采用各种形式的低通滤波方法进行平滑处理。 关键词:图像平滑;消除噪声;领域平均法;中值滤波;低通滤波法……… 1 研究背景 总所周知,实际获得的图像在形成、传输接收和处理的过程中,不可避免地存在着外部干扰和内部干扰,如光电转换过程中敏感元件灵敏度的不均匀性、数字化过程中的量化噪声、传输过程中的误差以及人为因素等,均会使图像质量变差,需要进行图像的平滑处理。 图像平滑是一种实用的熟悉图像处理技术,一个较好的平滑处理方法应该既能消除图像噪声,又不使图像边缘轮廓和线条变模糊,这就是研究数字图形平滑处理要追求的目标。 2.主要理论概况 2.1 邻域平均法 邻域平均法就是对含噪声的原始图像的每一个像素点取一个邻域,计算中所有像素灰度级的平均值,作为邻域平均处理后的图像的像素值。即 式中, ),为邻域中像素的点数。

是预先设定的阈值,当某些点的灰度值与其邻域点灰度平均值之差不超过阈值式中, 时,仍保留这些点的灰度值。当某些点的灰度值与其邻点灰度的均值差别较大时,这些点必然是噪声,这时再取其邻域平均值作为这些点的灰度点。这样平滑后的图像比单纯的进行邻域平均后的图像要清晰一些,平滑效果仍然很好。 2.2 中值滤波 中值滤波是一种非线性处理技术,由于它在实际运算过程中并不需要知道图像的统计特性,所以比较方便。中值滤波最初是应用在一维信号处理技术中,后来被二维的图像处理技术所引用。在一定条件下,中值滤波可以克服线性滤波器所带来的图像细节模糊,而且对滤波除脉干扰及图像扫描噪声非常有效。但是对一些细节多,特别是点、线、尖顶较多的图像则不宜采用中值滤波的方法。中值滤波的目的是保护图像边缘的同时去除噪声。 2.2.1 中值滤波的主要原理 中值滤波实际上就是用一个含有奇数个像素的滑动窗口,将窗口正中点的灰度值用窗口内各点的中值代替。例如若窗口长度为5,窗口中像素的灰度值分别为80、90、200、110、120,则中值为110,于是原来窗口正中的200就由110代替。 设有一个一维序列,用窗口长度为m(m为奇数)的窗口对该序列进行中值 滤波,就是从序列中相继抽出m 个数其中为窗口中心值,,再将这m个点的值按其数值大小排列,取其序号为正中间的那个值作为滤波器的输出。用数学公式可表示为 对二维序列进行中值滤波时,滤波窗口也是二维的,只不过这种二维窗口可以有各种不同的形状,如线状、方形,圆形、十字形和圆环形等。二维数据的中值滤波可以表示为 A为窗口

概率论与数理统计习题解答

第一章随机事件及其概率 1. 写出下列随机试验的样本空间: (1)同时掷两颗骰子,记录两颗骰子的点数之和; (2)在单位圆内任意一点,记录它的坐标; (3)10件产品中有三件是次品,每次从其中取一件,取后不放回,直到三件次品都取出为止,记录抽取的次数; (4)测量一汽车通过给定点的速度. 解所求的样本空间如下 (1)S= {2,3,4,5,6,7,8,9,10,11,12} (2)S= {(x, y)| x2+y2<1} (3)S= {3,4,5,6,7,8,9,10} (4)S= {v |v>0} 2. 设A、B、C为三个事件,用A、B、C的运算关系表示下列事件: (1)A发生,B和C不发生; (2)A与B都发生,而C不发生; (3)A、B、C都发生;

(4)A、B、C都不发生; (5)A、B、C不都发生; (6)A、B、C至少有一个发生; (7)A、B、C不多于一个发生; (8)A、B、C至少有两个发生. 解所求的事件表示如下 3.在某小学的学生中任选一名,若事件A表示被选学生是男生,事件B表示该生是三年级学生,事件C表示该学生是运动员,则 (1)事件AB表示什么? (2)在什么条件下ABC=C成立? ?是正确的? (3)在什么条件下关系式C B (4)在什么条件下A B =成立? 解所求的事件表示如下 (1)事件AB表示该生是三年级男生,但不是运动员. (2)当全校运动员都是三年级男生时,ABC=C成立. ?是正确的. (3)当全校运动员都是三年级学生时,关系式C B

(4)当全校女生都在三年级,并且三年级学生都是女生时,A B =成立. 4.设P (A )=,P (A -B )=,试求()P AB 解 由于 A ?B = A – AB , P (A )= 所以 P (A ?B ) = P (A ?AB ) = P (A )??P (AB ) = , 所以 P (AB )=, 故 ()P AB = 1? = . 5. 对事件A 、B 和C ,已知P(A) = P(B)=P(C)=1 4 ,P(AB) = P(CB) = 0, P(AC)= 1 8 求A 、B 、C 中至少有一个发生的概率. 解 由于,()0,?=ABC AB P AB 故P(ABC) = 0 则P(A+B+C) = P(A)+P(B)+P(C) –P(AB) –P(BC) –P(AC)+P(ABC) 6. 设盒中有α只红球和b 只白球,现从中随机地取出两只球,试求下列事件的概率: A ={两球颜色相同}, B ={两球颜色不同}. 解 由题意,基本事件总数为2a b A +,有利于A 的事件数为2 2a b A A +,有利于B 的事件数为111111 2a b b a a b A A A A A A +=, 则 2 2 11 2 22()()a b a b a b a b A A A A P A P B A A +++==

matlab的判别分析

广西某锰矿床已知两种不同锰矿石各项评价指标如下表所列。现新发现湖润锰矿床,初步 Matlab执行代码: g1=[41.19 11.86 0.182 36.22;34.99 9.84 0.178 27.82;35.62 10.56 0.261

21.02]; g2=[23.21 5.46 0.11 21.17;25.05 6.84 0.134 27.3;19.23 6.61 0.137 26.61]; fprintf('做距离判别分析:\n') fprintf('在两个总体的协方差矩阵相等的假设下进行判别分析:\n') fprintf('两个样本的协方差矩阵s1,s2分别为\n') s1=cov(g1) s2=cov(g2) fprintf('因为两个总体的协方差矩阵相等,所以协方差的联合估计s为:\n') [m1,n2]=size(g1);[m2,n2]=size(g2); s=((m1-1)*s1+(m2-1)*s2)/(m1+m2-2) fprintf('两个总体的马氏平方距离为:\n') sn=inv(s); u1=mean(g1);u2=mean(g2); ucz=(u1-u2)'; dmj=(u1-u2)*sn*ucz fprintf('该值反映了两个总体的分离程度,线性函数的判别函数为:\n') syms x1;syms x2;syms x3;syms x4; x=[x1;x2;x3;x4]; u1z=u1';u2z=u2'; a1=(sn*u1z)';b1=(u1*sn*u1z)/2; a2=(sn*u2z)';b2=(u2*sn*u2z)/2; w1=vpa((a1*x-b1),4)

图像边缘检测各种算子MATLAB实现以及实际应用

《图像处理中的数学方法》实验报告 学生姓名:赵芳舟 教师姓名:曾理 学院:数学与统计学院 专业:信息与计算科学 学号: 联系方式: 梯度和拉普拉斯算子在图像边缘检测中的应用

一、数学方法 边缘检测最通用的方法是检测灰度值的不连续性,这种不连续性用一阶和二阶导数来检测。 1.(1)一阶导数:一阶导数即为梯度,对于平面上的图像来说,我们只需用到二维函数 的梯度,即:,该向量的幅值: ,为简化计算,省略上式平方根,得到近似值;或通过取绝对值来近似,得到:。 (2)二阶导数:二阶导数通常用拉普拉斯算子来计算,由二阶微分构成: 2.边缘检测的基本思想: (1)寻找灰度的一阶导数的幅度大于某个指定阈值的位置; (2)寻找灰度的二阶导数有零交叉的位置。 3.几种方法简介 (1)Sobel边缘检测器:以差分来代替一阶导数。Sobel边缘检测器使用一个3×3邻域的行和列之间的离散差来计算梯度,其中,每行或每列的中心像素用2来 加权,以提供平滑效果。 -1-21 000 121 -101 -202 -101

(2)Prewitt边缘检测器:使用下图所示模板来数字化地近似一阶导数。与Sobel检测器相比,计算上简单一些,但产生的结果中噪声可能会稍微大一些。 -1-1-1 000 111 -101 -101 -101 (3)Roberts边缘检测器:使用下图所示模板来数字化地将一阶导数近似为相邻像素之间的差,它与前述检测器相比功能有限(非对称,且不能检测多种45°倍数的边缘)。 -10 01 0-1 10 (4)Laplace边缘检测器:二维函数的拉普拉斯是一个二阶的微分定义: 010 1-41 010

概率论与数理统计习题答案

习题五 1.一颗骰子连续掷4次,点数总和记为X .估计P {10

【解】令1,,0,i i X ?? ?若第个产品是合格品其他情形. 而至少要生产n 件,则i =1,2,…,n ,且 X 1,X 2,…,X n 独立同分布,p =P {X i =1}=. 现要求n ,使得 1 {0.760.84}0.9.n i i X P n =≤ ≤≥∑ 即 0.80.9n i X n P -≤≤≥∑ 由中心极限定理得 0.9,Φ-Φ≥ 整理得0.95,Φ≥?? 查表 1.64,10≥ n ≥, 故取n =269. 3. 某车间有同型号机床200部,每部机床开动的概率为,假定各机床开动与否互不影响,开动时每部机床消耗电能15个单位.问至少供应多少单位电能 才可以95%的概率保证不致因供电不足而影响生产. 【解】要确定最低的供应的电能量,应先确定此车间同时开动的机床数目最大值m ,而m 要满足200部机床中同时开动的机床数目不超过m 的概率为95%,

图像平滑的matlab实现论文

图像平滑的Matlab实现 20101602310035 黄汉杰 摘要 随着图像处理领域的迅速发展,图像平滑作为图像处理中的重要环节,也逐渐受到人们的关注。图像平滑的目的主要是消除噪声。图像平滑方法按空间域和频率域的分类及各种方法的特点,图像平滑是对图像作低通滤波,可在空间域或频率域实现。空间域图像平滑方法主要用均值滤波、中值滤波等;频率域图像平滑常用的低通滤波器有理想低通滤波器、布特沃斯低通滤波器、低通指数滤波器、低通梯形滤波器等。 关键词:图像平滑;噪声;空间域低通滤波;频域低通滤波 引言: (1)在图像的获取和传输过程中原始图像会受到各种噪声的干扰,使图像质量下降。为了抑制噪声、改善图像质量,要对图像进行平滑处理。抑制或消除这些噪声而改善图像质量的过程称为图像的平滑。图像平滑的目的是为了消除噪声。噪声消除的方法又可以分为空间域或频率域,亦可以分为全局处理或局部处理,亦可以按线性平滑、非线性平滑和自适应平滑来区别。图像的平滑是一种实用的数字图像处理技术,一个较好的平滑处理方法应该既能消除图像噪声,又不使图像边缘轮廓和线条变模糊,这就是研究数字图像平滑处理要追求的目标。一般情况下,减少噪声的方法可以在空间域或频率域进行处理,主要有邻域平均法、中值滤波法、低通滤波法等,邻域平均法即通过提高信噪比,取得较好的平滑效果;空间域低通滤波采用低通滤波的方法去除噪声;以及频域低通滤波法通过除去其高频分量就能去掉噪声,从而使图像得到平滑。 (2)本设计将对图像平滑处理的两大方面即空间域和频率域,以及两种处理

方向里的几种处理方法进行介绍,并对一些常用的简单平滑算法进行分析。 (3)图像平滑主要是为了消除被污染图像中的噪声,这是遥感图像处理研究的最基本内容之一,被广泛应用于图像显示、传输、分析、动画制作、媒体合成等多个方面。该技术是出于人类视觉系统的生理接受特点而设计的一种改善图像质量的方法。处理对象是在图像生成、传输、处理、显示等过程中受到多种因素扰动形成的加噪图像。在图像处理体系中,图像平滑是图像复原技术针对“一幅图像中唯一存在的退化是噪声”时的特例。 1.论文目的 1.1 通过几种图像平滑的方法,实现被噪声污染过的图像的平滑处理,其中包括空间域和频率域; 1.2 在加深对数字图像处理课本知识理解的基础上,学会运用已学的知识对图像 平滑的处理方法的结果进行分析。 2.理论及方案 (1)图像噪声来源及类型 一幅图像在获取和传输等过程中,会受到各种各样噪声的干扰,其主要来源有三:一为在光电、电磁转换过程中引入的人为噪声;二为大气层电(磁)暴、闪电、电压、浪涌等引起的强脉冲性冲激噪声的干扰;三为自然起伏性噪声,由物理量的不连续性或粒子性所引起,这类噪声又可分成热噪声、散粒噪声等。一般在图像处理技术中常见的噪声有:加性噪声、乘性噪声、量化噪声、“盐和胡椒”噪声等。下面介绍两种主要的噪声。 2.1.1、高斯噪声(Gaussian noise) 这种噪声主要来源于电子电路噪声和低照明度或高温带来的传感器噪声,也

(整理)matlab16常用计算方法.

常用计算方法 1.超越方程的求解 一超越方程为 x (2ln x – 3) -100 = 0 求超越方程的解。 [算法]方法一:用迭代算法。将方程改为 01002ln()3 x x =- 其中x 0是一个初始值,由此计算终值x 。取最大误差为e = 10-4,当| x - x 0| > e 时,就用x 的值换成x 0的值,重新进行计算;否则| x - x 0| < e 为止。 [程序]P1_1abs.m 如下。 %超越方程的迭代算法 clear %清除变量 x0=30; %初始值 xx=[]; %空向量 while 1 %无限循环 x=100/(2*log(x0)-3); %迭代运算 xx=[xx,x]; %连接结果 if length(xx)>1000,break ,end %如果项数太多则退出循环(暗示发散) if abs(x0-x)<1e-4,break ,end %当精度足够高时退出循环 x0=x; %替换初值 end %结束循环 figure %创建图形窗口 plot(xx,'.-','LineWidth',2,'MarkerSize',12)%画迭代线'.-'表示每个点用.来表示,再用线连接 grid on %加网格 fs=16; %字体大小 title('超越方程的迭代折线','fontsize',fs)%标题 xlabel('\itn','fontsize',fs) %x 标签 ylabel('\itx','fontsize',fs) %y 标签 text(length(xx),xx(end),num2str(xx(end)),'fontsize',fs)%显示结果 [图示]用下标作为自变量画迭代的折线。如P0_20_1图所示,当最大误差为10-4时,需要迭代19次才能达到精度,超越方程的解为27.539。 [算法]方法二:用求零函数和求解函数。将方程改为函数 100()2ln()3f x x x =-- MATLAB 求零函数为fzero ,fzero 函数的格式之一是 x = fzero(f,x0) 其中,f 表示求解的函数文件,x0是估计值。fzero 函数的格式之二是 x = fzero(f,[x1,x2])

概率论与数理统计复习题--带答案

概率论与数理统计复习题--带答案

;第一章 一、填空题 1.若事件A?B且P(A)=0.5, P(B) =0.2 , 则P(A -B)=(0.3 )。 2.甲、乙各自同时向一敌机炮击,已知甲击中敌 机的概率为0.7,乙击中敌机的概率为0.8.求 敌机被击中的概率为(0.94 )。 3.设A、B、C为三个事件,则事件A,B,C中 不少于二个发生可表示为(AB AC BC ++)。 4.三台机器相互独立运转,设第一,第二,第三 台机器不发生故障的概率依次为0.9,0.8,0.7,则这三台机器中至少有一台发生故障的概率 为(0.496 )。 5.某人进行射击,每次命中的概率为0.6 独立 射击4次,则击中二次的概率为 ( 0.3456 )。 6.设A、B、C为三个事件,则事件A,B与C都 不发生可表示为(ABC)。 7.设A、B、C为三个事件,则事件A,B,C中 不多于一个发生可表示为(AB AC BC I I); 8.若事件A与事件B相互独立,且P(A)=0.5, P(B) =0.2 , 则P(A|B)=(0.5 );

9.甲、乙各自同时向一敌机炮击,已知甲击中敌机 的概率为0.6,乙击中敌机的概率为0.5.求敌机被击中的概率为(0.8 ); 10.若事件A与事件B互不相容,且P(A)=0.5, P(B) =0.2 , 则P(B A-)=(0.5 ) 11.三台机器相互独立运转,设第一,第二,第三 台机器不发生故障的概率依次为0.8,0.8,0.7,则这三台机器中最多有一台发生故障的概率为(0.864 )。 12.若事件A?B且P(A)=0.5, P(B) =0.2 , 则 P(B A)=(0.3 ); 13.若事件A与事件B互不相容,且P(A)=0.5, P(B) =0.2 , 则P(B A)=(0.5 ) 14.A、B为两互斥事件,则A B= U(S )15.A、B、C表示三个事件,则A、B、C恰 有一个发生可表示为 (ABC ABC ABC ++) 16.若()0.4 P AB A B= U P AB=0.1则(|) P B=,() P A=,()0.2 ( 0.2 ) 17.A、B为两互斥事件,则AB=(S ) 18.保险箱的号码锁定若由四位数字组成,则一次 )。 就能打开保险箱的概率为(1 10000

数模-化验结果判别及matlab程序

地贫患者的基因筛查问题 摘要 地中海贫血(简称“地贫”)是全球广为流行、危害极为严重的遗传性溶血性疾病,全世界至少有亿人携带地中海贫血的致病基因。医学上通过大人群的基因筛查来预防地贫患儿的出生。 本文应用统计学原理,对病人以及健康人的110个基因进行分析,采用Fisher判别模型建立判别标准和多元统计模型spss 软件进行筛选。 问题一,利用费希尔模型判别待测者是否患有地贫,以编号1~20地贫患者的样本,编号21~40健康人员的样本,分别作为模版建立模型,用mathlab软件求解得到待测组的患病者编号41~60个是待筛查人员的样本。 问题二,为确定“地贫”样本与“健康”样本在基因链上的区别。以及癌症样本中是否有子类。我们用1~20数据为标准化并确立相关系数矩阵,求出相关矩阵的特征值和特征向量,然后通过前m 个 主成分的累计贡献率满足 % 85 ) 1 /( ) 1 (≥ ∑ = ∑ =k i k k i k λ λ 来确定贡献率矩阵,从而得出各种基因的权 值,又利用初始特征值需大于 1,再运用逐步剔除法得出关键基因关键字:地贫患者的基因 Fisher判别筛查相关系数矩阵

1 问题重述 化验指标能够协助医生诊断。人们到医院就诊时,诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为健康人的结果。表是就诊人员的化验结果。 1.根据表中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方 法,并检验你提出方法的正确性。 2.按照1提出的方法,判断表中的30名就诊人员的化验结果进行判别,判定他(她) 们是肾炎病人还是健康人。 3.能否根据表的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以 便减少化验的指标。 4.根据3的结果,重复2的工作。 5.对2和4的结果作进一步的分析。 2 问题分析 问题解决的关键是如何正确判断正常人与患者之间的差异,利用所给数据,可以选择用医学统计方法[1]中的判别分析法[2]进行分析。从题目给出的表中可以得出以下信息:1)表中分别给出正常人与患者各30组数据,每组数据各包含7种元素(Zn、Cu、Fe、Ca、Mg、K、Na)在人体中的含量。通过对这些数据进行分析,可以从中找出数据差异,根据判别法确定判别标准。利用所得判别标准,与就诊人员的化验结果比较可以判

图像平滑的MATLAB实现

图像平滑的MATLAB实现 摘要:图像平滑技术用于平滑图像的噪声,本文对均值滤波、中值滤波、维纳滤波等三种平滑滤波器 进行理论学习,并通过MATLAB对滤波效果进行仿真。 关键词:图像平滑均值滤波中值滤波维纳滤波 实际获得的图像一般都因受到某种干扰而含有噪声。引起噪声的原因有敏感元器件的内部噪声、照相底片上感光材料的颗粒、传输通道的干扰及量化噪声等。噪声产生的原因决定了噪声的分布特性及它和图像信号的关系。根据噪声服从的分布,可以分为高斯噪声、泊松噪声和颗粒噪声等。平滑技术用于平滑图像的噪声,平滑噪声可以在空间域中进行,基本方法是求像素灰度的平均值或中值。为了既平滑噪声又保护图像信号,也有一些改进的技术,比如在频域中运用低通滤波器。 MATLAB图像处理工具箱提供了模拟噪声生成的函数imnoise和去除噪声的方法。函数imnoise可以对图像添加一些典型的噪声。由于噪声的随机性,它们对某一像点的影响使其灰度和邻点的灰度显著不同,因此可以利用这种不同来消除噪声。去除噪声的方法有线性滤波、中值滤波、自适应滤波。本文就针对上述三种平滑滤波进行MATLAB仿真。 1 图像平滑的MATLAB实现 1.1 均值滤波[1] 1.1.1理论基础 邻域平均法是空间域平滑噪声技术,其均值滤波器对于扫描得到的图像中的颗粒噪声非常适用,理论依据如下: 对于给定的图像f(i,j)中的每个像点(m,n),取其邻域S。设S含有M个像素,取其平均值作为处理后所得图像像点(m,n)处的灰度。用一像素邻域内各像素灰度平均值来代替该像素原来的灰度,即是邻域平均技术。 邻域S的形状和大小根据图像特点确定。一般取的形状是正方形、矩形及十字形等,S的形状和大小可以在全图处理过程中保持不变,也可根据图像的局部统计特性而变化,点(m,n)一般位于S的中心。如S为3×3邻域,点(m,n)位于S中心,则:

matlab用于计算方法的源程序

1、Newdon迭代法求解非线性方程 function [x k t]=NewdonToEquation(f,df,x0,eps) %牛顿迭代法解线性方程 %[x k t]=NewdonToEquation(f,df,x0,eps) %x:近似解 %k:迭代次数 %t:运算时间 %f:原函数,定义为内联函数 ?:函数的倒数,定义为内联函数 %x0:初始值 %eps:误差限 % %应用举例: %f=inline('x^3+4*x^2-10'); ?=inline('3*x^2+8*x'); %x=NewdonToEquation(f,df,1,0.5e-6) %[x k]=NewdonToEquation(f,df,1,0.5e-6) %[x k t]=NewdonToEquation(f,df,1,0.5e-6) %函数的最后一个参数也可以不写。默认情况下,eps=0.5e-6 %[x k t]=NewdonToEquation(f,df,1) if nargin==3 eps="0".5e-6; end tic; k=0; while 1 x="x0-f"(x0)./df(x0); k="k"+1; if abs(x-x0) < eps || k >30 break; end x0=x; end t=toc; if k >= 30 disp('迭代次数太多。'); x="0"; t="0"; end

2、Newdon迭代法求解非线性方程组 function y="NewdonF"(x) %牛顿迭代法解非线性方程组的测试函数 %定义是必须定义为列向量 y(1,1)=x(1).^2-10*x(1)+x(2).^2+8; y(2,1)=x(1).*x(2).^2+x(1)-10*x(2)+8; return; function y="NewdonDF"(x) %牛顿迭代法解非线性方程组的测试函数的导数 y(1,1)=2*x(1)-10; y(1,2)=2*x(2); y(2,1)=x(2).^+1; y(2,2)=2*x(1).*x(2)-10; return; 以上两个函数仅供下面程序的测试 function [x k t]=NewdonToEquations(f,df,x0,eps) %牛顿迭代法解非线性方程组 %[x k t]=NewdonToEquations(f,df,x0,eps) %x:近似解 %k:迭代次数 %t:运算时间 %f:方程组(事先定义) ?:方程组的导数(事先定义) %x0:初始值 %eps:误差限 % %说明:由于虚参f和df的类型都是函数,使用前需要事先在当前目录下采用函数M文件定义% 另外在使用此函数求解非线性方程组时,需要在函数名前加符号“@”,如下所示 % %应用举例: %x0=[0,0];eps=0.5e-6; %x=NewdonToEquations(@NewdonF,@NewdonDF,x0,eps) %[x k]=NewdonToEquations(@NewdonF,@NewdonDF,x0,eps) %[x k t]=NewdonToEquations(@NewdonF,@NewdonDF,x0,eps) %函数的最后一个参数也可以不写。默认情况下,eps=0.5e-6 %[x k t]=NewdonToEquations(@NewdonF,@NewdonDF,x0,eps)

相关主题
文本预览
相关文档 最新文档