当前位置:文档之家› DPS 课堂笔记

DPS 课堂笔记

DPS 课堂笔记
DPS 课堂笔记

3研究对象的稳定性分析

农作物新品种登记推广前的品种区域比较试验

包括AMMI模型

4 效应曲线分析(定量分析),温度与昆虫发育速度,施肥与产量的关系

用的最多的是完全随机设计,随机区组设计

完全随机:先将各个处理编上号码

先编号再随机分组

随机区组设计

在电子表格里面输入各个处理的名称,再进行区组设计

完全随机设计随机区组设计

实验室,实验条件完全相同(如培养皿),用完全随机设计

田间实验,局部控制用随机区组设计

先划分区组

两种设计结果的统计分析。

数据格式;一行一个处理,一列一次重复

对数正态分布:对数转换

Poisson分布:平方根

要不要转换,怎样转换?

计算出来的p值最小

方差分析是基于正态分布假设,数据在接近正太分布情况下统计效率最高,p值最小

多重比较了、:看期刊习惯

分析结果,先看p值

不同处理之间,指标的高低存在极显著的差异F(2,57)=5.54,P=0.0063 自由度一般只有n-1个是可变的

方差分析结果表明不同处理之间差异

多重比较,只有在方差分析的p<0、05时才接着进行。

多重比较:有相同的字母,差异不显著

所以进行多重比较前,一定要先报告F和P值

区组之间差异不用管

随机区组设计统计分析、

结果解读:区组间差异不用管他

和完全随机设计相同,分析处理之间的差异

统计差异显著性

数据时完整的(平衡数据),实际科研

所有的实验设计方法的分析都可以用GLM解决

统计方差分析:平方和分解

GLM方法,回归分析,最小二乘法

回归方程:实验结果的观察值作为因变量Y

实验设计的各个处理因子作为自变量X处理因子各个水平进行0-1化

虚拟变量处理

回归分析第一步:0-1化处理

处理高剂量低剂量对照

处理1 1 0 0

处理2 0 1 0

处理3 0 0 1

解方程,求回归系数

根据回归系数计算各个处理的平方和根据平方和进行方差分析

实验设计与回归方程关系:线性模型完全随机设计

Y=μ(均值效应)+αi区组效应+e误差项i为处理,j为区组

u为在回归方程里为常数项

α各个处理水平0-1化求的

GLM分析数据格式

右边是观察值作为y

左边是各个实验处理的组合,自变量x 平方和分解方式:一般是III型

变量编码:效应编码

参照两种都可以

多重比较:

5个处理,互相比较,要比较10次4 3 2 1、

假设里面有5对是有差异的

Tukey:保证不会吧没有差异的判为有差异,这里的判为只有4对……有差异。不会超过实际上5对有差异

LSD法:保证不会吧有差异的判为没有差异。这里可判为6对……有差异。不会少于实际上的5对。

Duncan及其他方法:适当调整,达到某种平衡,但是不能保证是精确地判断

自定义比较:单一自由度比较

A因素里面,第1,2两个水平是基肥10,15N,第3,4水平是追肥10,15N 比较及

不同地点间有差异

I型分解:先分解出地区间差异平方和,然后在分解出各个地区内,田块间的平方和;主要用于系统分组、嵌套设计

A/B 地区间差异是否大于

变异系数Bennett检验

G-一统计量,似然比卡方,进行卡方检验

G=7.61 0.00

卡方统计量的计算

(观察值-理论值)2

皮尔逊卡方值=…………………………,求和

理论值

理论值,根据模型的假设计算,卡方值越小,p值越大,观察值和模型的理论值相符(没有差异)

常规卡方统计量,皮尔逊卡方,似然比卡方。似然比卡方性能更好些,似然比卡方计算需要取对数。P2O2,似然比卡方具有可加性。

列联表卡方检验,卡方值,检验行列指标之间的相关性。有时该卡方……

解释专业含义(异质性)生物统计一分类数据一联表卡方检验

不同性质列联表的统计检验

行列指标都无顺序

Logistic回归数据格式

回归分析及其应用

回归分析:用数学模型描述专业上的理论模型

Y=ax+b

Y=ax2+b

x(温度)y(天数)

15 20

20 15

25 12

30 10

有效积温

Y=K/(x-x0)非线性方程线性转换后求解

回归分析参数估计,最小二乘法

最小二乘法:因变量观察值和理论值的差值的平方和最小

身高和年龄关系:Logistic S型曲线

Y=K/(1+exp(ax+b))非线性方程

模型诊断任何数据都可建立y=ax+b得到系数a、b的估计值。得到系数估计值后,要进行统计检验,计算p值

总的平方和=各个y值,减去平均值,平方后求和。表示y的总的变异大小

回归平方和=各个y的拟合值,减去平均值,平方后求和,表示y的拟合值变异大小

残差平方和=各个残差,平方后求和。

关系:总的平方和=回归平方和+残差平方和

P值含义:回归方程不成立的概率的大小

P<0.05,p<0.01回归方程极可能成立,回归方程可用

回归方程可用不代表很好的描述的变化。

决定系数:理论方程模型能解释因变量y优化的比例大小

回归分析方法:最小二乘法

回归方程建立后;一看p值(方程能否用p<0,05),二看决定系数(方程在专业上是否有意义),要求决定系数大于0.5

方差分析、回归分析

定性比较、定量描述

回归方程(没有惰性物质)

Y=0.64090+0.09677x1 标准误差=0.0420

回归方程()加入惰性物质后)

Y=1.70553+0.09326x1 标准误差=0.0179

多因素实验设计及其统计分析

多因素实验设计:

正交设计:日本田口设计

第一步:用了近30种化学试剂,参考其他昆虫饲料配方,采用正交设计,进行试验,选出主要成分

第二部: 选出约20种继续进行正交试验,确定一般配方的主要成分:满足飞虱的营养要求

第三步:选出重要的4-5种,采用复合中心设计,优化配方:提高成虫羽化率。

正交设计:一般有固定表格

四因素三水平,完全实验:35

正交试验:至少是32水平数的平方

正交:两因素之间的相关为零

但是相关为零却不一定是正交(多因素试验里面)

SPSS里面正交设计表,有时不是正交表更接近均匀设计表:正交表,均匀分散,整齐可比

正交设计,一般用现成的表格进行

根据正交实验设计表调整我们得试验因素,及其水平数

多因素多水平实验:均匀设计(超立方体设计)

复合中心设计5个水平,3-5个因子的优化实验设计(建立最优的教学模型)

二次正交旋转设计;二次通用组合设计

因子筛选:正交

模型优化:因子少时用中心复合设计(尽量用该设计进行优化,有很多更好的统计性质);

因子多时用均匀设计

生物学实验,方差分析,统计检验,正交表各列排满后,是饱和设计,此时,无法分解出实验误差,进行方差分析

方差分析F值=处理均方/误差均方

要进行统计检验:因子列不排满;或者重复一次

分析:比一比看一看:主要看调整极差,比大小

统计检验:没重复时,要留有空白列

分析过程中,处理因子列的均方很小时,也可作为空白(误差来源)

有重复正交试验:试验类型

适当划分区组,可提高试验精度

实验室条件下:可适当划分时间(上午,下午,今天,明天)区组

非线性回归分析

模型的选取专业背景更重要

Y=49.18-2.8x+0.45ax2

Y=103.65/(x-9.6535)

模型的诊断和解释

方差分析p值一般都很小,决定系数较大。这里是初步判断

主要看各个回归系数,统计检验及专业含义

Y=103.65/(x-9.6535)

统计检验p<0.05时,可对参数进行专业上的解释

参数估计的95%置信区间。参数是否有应用价值。

95%置信区间

有效积温82.26 125.05

起点温度7.71 11.60

作业?

偏最小二乘法

回归分析:样本数大于变量数

样本数少,可用逐步回归选取重要因子建立回归方程

这样:方程不稳定,有的因子没有选进来,给模型应用

配方因子:几个变量取值加起来为100%

PLS:

不用筛选因子

可同时对多个因变量进行建模分析

PLS在均匀设计里面应用很多,均匀设计实验结果统计分析

复合中心设计统计分析:

标准方法:二次多项式回归法

非标准方法:筛选重要因子

模型检验

回归检验,F值大,P<0.05;

失拟检验:F值小,P最好>0.05;)

效应曲线:单变量效应,两变量互作效应(曲面,等高线)目标变量

最有时的X值取值区域,或变化趋势。

典范分析:对二次多项式回归方程求导数,进行优化,优化结果及优化点的变量X的特征

筛选重要因子,第一步时不选

稳定点处为鞍点

最有优化

典范分析(求导数),结果

没有典范分析。典范分析要求针对完整的二次多项式回归方程进行含区组的分析:模型项的p值<0.05.

多元分析数据格式

一行一个样本,一列一个最优指标时各个因素组合

判别分析:根据已知类别建立判别函数“有师分类”

多变量(变量特别多时)判别,回归分析:随机森林方法2001

相关主题
文本预览
相关文档 最新文档