承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):A题
我们的参赛报名号为(如果赛区设置报名号的话):S19001
所属学校(请填写完整的全名):河南师范大学新联学院
参赛队员(打印并签名) :1. 钱喜全
2. 王瑞娟
3. 常欣欣
指导教师或指导教师组负责人(打印并签名):王潭
日期: 2012 年 9 月 9 日赛区评阅编号(由赛区组委会评阅前进行编号):
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):
葡萄酒的评价
摘要本文针对葡萄酒的评价问题展开讨论,依据大量可靠的原始数据和相关信息,分别运用了概率统计方法、回归分析方法、插值与拟合方法、多元回归与拟合相结合的方法,分别建立了相应的数学模型,用matlab软件对数据进行编程,并对回归模型进行了深入的研究。此外,还有效的分析了各个模型中的优缺点,并补充了明确的推广方案。
对于问题1,我们参考附件1中两组评酒员对葡萄酒的评价结果,并运用一定的的数学方法对附录一中的数据进行奇异值的剔除,结合问题分析评价结果有无显著性差异,利用概率统计中的方差分析的方法,建立数据统计模型,并对模
型进行了合理的证明和理论推导。通过查表比较得t
1< t , t
2
> t,从而有充
分的理由认为两组评酒员对红酒的评价无显著性差异,对白酒的评论有显著性差异。第二组对白酒的评论更可信!
对于问题2,我们参考了附件2中酿酒葡萄的理化指标和附录一中葡萄酒品尝的评价结果,利用最小均方差方法对被评价对象进行筛选,根据所筛选的数据先后对红葡萄酒样品和白葡萄酒样品建立线性回归的数学模型,由数据建立的模型结果对酿酒葡萄进行优、中、差分级。
对于问题3,我们参考附件2中酿酒葡萄和葡萄酒的理化指标,根据所给问题的实验数据,以酿酒葡萄的理化指标为自变量,红、白葡萄酒的理化指标为因变量,运用数据拟合的方法,将这些离散数据确定出一类已知函数或寻找出某个近似函数。分别对红、白葡萄酒中15种成分进行数据拟合并建立相对应的图像,通过图像分析,得出酿酒葡萄和葡萄酒的理化指标之间的关系。
对于问题4,我们结合问题2的解题思路和步骤,参考附件2的数据,同样利用最小均方差的方法对被评价对象进行筛选,利用多元回归的方法分别得出红、白葡萄酒的理化指标与葡萄酒的质量的最优方程,求出对应葡萄酒的质量的理论值。以理论值为自变量,以实际值为因变量进行一元线性拟合,从而判断能否用葡萄酒的理化指标来评价葡萄酒的质量。同时用这种方法判断能否用葡萄的理化指标来评价葡萄酒的质量。
通过以上的模型分析与建立,在文末,我们就各个模型的优缺点进行了评价,并深入分析了酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量的影响。
关键词:葡萄酒评价概率统计回归分析数据拟合理化指标
葡萄酒的质量
1.问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
2.模型的假设与符号说明
2.1模型的基本假设
1.评酒员的评价结果近似满足正态分布。
2. 葡萄酒的好坏与酿酒葡萄的各个理化因子成正比关系。
3. 以两组评酒员中最可信的数据为该酒质量的真实值。
2.2符号说明
X表示第i组数据的平均值;
i
表示第i组数据的均方差;
s
i
β表示常数项;
β表示第i个自变量的系数;
i
x
表示第i个自变量;
i
y
表示第i项的因变量;
i
Y i(i=1、2、3、4)表示葡萄酒的质量得分;
3问题的分析
3.1问题1的分析
问题1属于有无显著性差异的数学问题,对于解决此类问题,我们一般用统计学中的数学方法。评酒员的评价结果可能受到不确定因素的影响,这些影响可以视为随机事件而随机事件一般是按照一定的概率发生的,所以需通过进一步的统计试验来判断其模型中随机变量(回归变量)的显著性,进而应用到葡萄酒的评价问题中。利用附件1中的数据进行T检验法,得出两组评酒员的评价结果有无显著性差异,并选出哪一组结果更可信。
3.2问题2的分析
问题2是对酿酒葡萄的理化指标和葡萄酒的质量来对酿酒葡萄进行分级的问题,对于解决此类问题,我们一般采用回归分析的方法来解决。问题2包含多个同类的被评价对象,每个被评价对象往往都涉及多个属性(或指标),根据这些属性判断确定这些系统运行(或发展)状况的优劣,即按优劣对各个被评价对象进行排序(分级)。
3.3问题3的分析
问题3是分析酿酒葡萄和葡萄酒的理化指标之间的联系,在附件2中,有酿酒葡萄和葡萄酒的理化指标的一批离散数据,运用插值和拟合方法使这些数据确定某一类已知函数的参数或寻找某个近似函数使所得到的近似函数与这些数据具有较高的拟合精度。因为不要求近似函数通过所有数据点,而是要求它能较好的反映数据的整体变化趋势,所以解决这个问题运用数据拟合的方法。
3.4问题4的分析
问题4是根据问题2的方法从红葡萄酒中选出十个相对重要指标,从白葡萄酒中选出四个相对重要指标。利用多元回归的方法分别得出红、白葡萄酒指标与葡萄酒的质量的最优方程,求出对应葡萄酒得质量的理论值。分析酿酒葡萄和葡萄酒的理化指标对葡萄酒得质量的影响,以理论值为自变量,以实际值为因变量进行一元线性拟合,从而判断能否用葡萄酒的理化指标来评价葡萄酒的质量。同时用这种方法判断能否用葡萄的理化指标来评价葡萄酒的质量。
4模型的建立与求解
4.1模型一
4.1.1剔出奇异值
按照数学处理方法的不同,测量误差可分为系统误差、随机误差、过失误差。过失误差的数值一般比系统误差及随机误差都大,严重歪曲测量结果,通常的表现形式为在测量数据中含有特别大或特别小的数据,并且难以对其合理解释,这些特大值或特小值统称为特异值。特异值的存在会大大降低数据的质量,明显影定量分析的效率。因此在对测量数据进行任何形式的加工整理之前,要高设法识别和剔除含过失误差的数据。常用的判别范围和鉴别方法如下:
(1) 3σ准则
由于随机误差服从正态分布,误差绝对值大于3σ的概率仅为0.3%。因此,此方法认为当某数据的误差绝对值大于3σ时,就剔除该数据。
(2) 肖维纳(Chauvent)准则
在n次观测中,某数据的剩余误差可能出现的次数小于半次时,即误差出现的概率小于(1/2n)时,就剔除该数据。
(3) 格拉布斯(Grubbs)准则
以t分布为基础,根据数理统计理论按显著水平α和样本容量n求得判别临界值进行判别。
4.1.2模型的建立
T检验法:分析比较两组评酒员的评价结果的样本均值,判断这两组样本均值之间是否有显著性差异,所以采用T检验法。
设两组数据分别为:
n
1 s
11
X
n 2 s 2 2X
(n -测定次数,s -标准偏差,1或2为组别) 先求合并的标准偏差S 合和合并的t 值 S 合与t 合 S 合=
总自由度
偏差平方和=
()
()
()()
11212
2
22
11-+--+-∑∑n n X X X X
i i
或S 合=()()2
11212
2
2211-+-+-n n S n S n
再计算t 合=
2
1212
1n n n n S X X +-合
在一定置信度时,查出t 表值(总自由度为f=n 1+n 2-2)。 若t 计>t 表,则两组平均值存在显著性差异。 若t 计< t 表,则两组平均值不存在显著性差异。
4.1.3模型的求解
评酒员对葡萄酒各组评价的平均值之和做为对葡萄酒评价的综合指标。 通过计算得,s 1=54.0037, 1X =73.0856
s 2=15.8244, 2X =70.5148 S 1合=5.9088,t 1=1.5986 s 3=27.0528,3X =74.2607 s 4=10.0549,4X =76.5321 S 2合=4.3074,t 2=1.9730 s 3> s 4
取显著性水平α=0.05,查附表得,t =1.676
比较得t 1< t , t 2> t 从而有充分的理由认为两组评酒员对红酒的评价无明显差异,对白酒的评论有显著差异。第二组对白酒的评论更可信! 4.2模型二
4.2.1酿酒葡萄的理化指标的筛选
因为被评价对象即酿酒葡萄的理化指标比较多,尽管有些指标可能很重要,
但由于相互之间的差别很小,所以宏观世界对这些被评价对象的评价结果所起的作用会很小,为此,在评价过程中可将这样的指标删除掉,用最小均方差法来实现。
红酒有27种样品,每种样品都有4种评价指标,其指标观测值分别为:
x i =()im i i x x x ,...,,21(i =1,2,…,n). 求第j 项指标的平均值:
j x =
n
1∑=n
i ij
x
1
(j =1,2,…,m );
求第j 项指标的均方差: s j =
()
∑=-n
i j
ij
x x n
1
2
1
(j =1,2,…,m);
求最小的均方差:
s 0j =min {}m s s s ,,,21 (1m j ≤≤0);
如果s ≈0j 0,则可将第j 0个指标x 0j 删除掉,继续筛选;否则筛选工作结束,即得到最后的评价指标体系。
选出红葡萄酒样品实验指标15个,分别为:氨基酸总量、苏氨酸、丝氨酸、谷氨酸、脯氨酸、甘氨酸、精氨酸、蛋白质、花色苷、褐变度、黄酮醇、榭皮素、还原糖、果穗质量、百粒质量;白葡萄酒样品实验指标15个,分别为:氨基酸总量、天门冬氨、苏氨酸、丝氨酸、谷氨酸、脯氨酸、甘氨酸、丙氨酸、赖氨酸、精氨酸、蛋白质、褐变度、还原糖、果穗质量、百粒质量。 4.2.2模型的建立
利用线性回归的数学模型,先对红葡萄酒样品进行建模:
设响应变量为y ,回归变量为x 1,x 2,......,x 15,通过试验(或观测)得到27组数据:( y i , x 1,x 2,......,x 15) i =1,2, (27)
Y 为评酒员对葡萄酒的综合评分即葡萄酒的质量。
假设y 与x 1,x 2,……,x 15之间有如下线性关系:
y=0β+11x β+……+1515x β+ε (1) 则有
???
??
?
?++++=++++=++++=2727151527110722
215152110211151511101εβββεβββεβββx x y x x y x x y
(2) 其中0β,1β,……28β 是28个待估计的参数,1ε,2ε,…27ε是27个相互独立的服从N (0,2σ)的随机变量,(2)式就是线性回归的数学模型。用矩阵
表示:y=?
?
??
??
??????2721y y y z=????????????2715272
27121522
211151211,,,1,,1,,1x x x x x x x x x ????????????=151
0ββββ ?????
???????=2721εεεε
模型(2)可写为Y=Z β+ε.
白葡萄酒的模型建立过程与红葡萄酒的模型建立过程类似。 4.2.3模型的求解
对红葡萄酒求得的最优化方程为:
Y1=
29.2335+0.0560*x1-0.0933*x2-0.0609*x3-0.0933*x4-0.0544*x5-0.0534*x6-0.0626*x7+0.0347*x8+0.0097*x9+0.0116*x10+0.0818*x11-0.1401*x12+0.0110*x13+0.0036*x14+0.0318*x15
把27组红葡萄的15个理化因子带入方程得(即红葡萄对应酒的理论得分): 66.9064 75.3244 76.2936 67.3510 75.1183 65.5466 65.1537 69.4842 79.4840 71.2820 66.8064 67.0562 73.4052 74.7971 67.7900 71.3472 75.6560 63.9260 73.7288 77.5487 76.4376 73.2329 81.9931 72.3712 66.9620 72.5774 70.6353
现在我们假设大于75的为优,70到75的为中,小于70的为差。可以明显看出第2,3,5,9,17,20,21,23组样品红葡萄为优,第10,13,14,16,19,22,24,26,27组样品红葡萄为中,第1,4,6,7,8,11,12,15,18,25组为差。 对白葡萄酒求得的最优化方程为:
Y2=82.9415-0.0291*x1+0.0411*x2+0.0738*x3+0.0585*x4+0.0257*x5+0.0293*x 6+0.0030*x7+0.0320*x8+0.0683*x9+0.0178*x10+0.0004*x11+0.0014*x12-0.0358*x13-0.0125*x14-0.0054*x15
把28组白葡萄的15个理化因子代入方程得(即白葡萄对应酒的理论得分): 75.6186 75.3520 78.1585 78.6853 79.6535 75.4991 74.6848 74.5235 78.5342 78.2112 73.2605 71.7757 75.9609 76.5524 74.6610 75.3786 77.1092 73.5711 76.7007 76.7777 79.7762 76.9223 76.3361 76.4314 79.1969 77.6336 78.2104 79.7979 现在我们假设大于75的为优,70到75的为中,小于70的为差。可以明显看出第1,2,3,4,5,6,9,10,13,14,16,17,19,20,21,22,23,24,25,26,27,28组样品白葡萄酒为优,第7,8,11,12,15,18组样品白葡萄酒为中。 4.3模型三
对于问题3,根据所给问题的实验数据,以酿酒葡萄的理化指标为自变量,红葡萄酒的理化指标为因变量,运用数据拟合的方法,将这些离散数据确定出一类已知函数或寻找出某个近似函数。
对附件2中的红葡萄酒的15种不同成分分别进行数据拟合,并得出其图像分别如下(其中横坐标表示酿酒葡萄的各成分的含量,纵坐标表示红葡萄酒中相对应的各成分的含量):
葡萄葡萄酒
花色苷
020
400
5
10
15单宁
020
400
510
15总酚
020
40
510
15酒(葡萄)总黄酮0
20
40
白藜芦醇
葡萄
葡萄酒
反式白藜芦醇苷0
20
40
顺式白藜芦醇苷
反式白藜芦醇
顺式白藜芦醇红葡萄红葡萄酒
0.5
1
00.2
0.40.60.8DPPH 半抑制体
积202530
050
100色泽L*
1020
色泽a*
-5
05
0102030
40色泽b*
红葡萄
红葡萄酒
-100
100
-50510H
1020
C
由所得图可以看出:花色苷、单宁、总酚、酒(葡萄)总黄酮、色泽L *这五种理化指标呈正相关,当自变量酿酒葡萄的各成分含量增大时,因变量红葡萄酒相对应的各成分含量也随之增大;酿酒葡萄中的DPPH 理化指标,当自变量DPPH 自由基的含量增大时,因变量红葡萄酒中DPPH 的含量也随之增大。
而白藜芦醇、反式白藜芦醇甘、顺式白藜芦醇甘、顺式白藜芦醇、色泽a *、色泽b *、H 、C 这些理化指标在自变量酿酒葡萄中不存在,而在红葡萄酒中分别有不同的含量,则说明这些理化指标是在酿造酒的过程中生成的。
反式白藜芦醇在酿酒葡萄中有不同的含量,而酿成的红葡萄酒中却不存在,则说明反式白藜芦醇在酿造葡萄酒过程中进行了化学反应最后转化成其他的成分了。
对附件2中的白葡萄酒的15种不同成分分别进行数据拟合,并得出其图像分别如下(其中横坐标表示酿酒葡萄的各成分的含量,纵坐标表示白葡萄酒中相对应的各成分的含量):
5101
234
5白葡萄
白葡萄酒
单宁0102001
23
4总酚
02
468酒(葡萄)总黄
酮05白藜芦醇
反式白藜芦醇苷白葡萄
白葡萄
酒
顺式白藜芦醇苷
反式白藜芦
醇顺式白藜芦醇
0.50
0.050.10.15
0.2白葡萄白葡萄酒
DPPH
30
4050
色泽
L*
-10
010
-1.5-1-0.5
0色泽a*
2040
0246
8白葡萄酒
白葡萄
色泽
b*
-100
10
-1001020H
20
40
02
468C
由所得图可以看出:单宁、总酚、酒(葡萄)总黄酮、白藜芦醇、DPPH 、色泽L *、色泽a *、色泽b *、H 、C ,这些理化指标都较集中在一定的区间内,说
明整体规律体现不明显,进而说明酿酒葡萄和白葡萄酒的理化指标之间的联系不大。
反式白藜芦醇甘、顺式白藜芦醇甘、反式白藜芦醇,这三个理化指标含量较少,且整体规律体现不明显。
顺式白藜芦醇,这个理化指标在自变量酿酒葡萄中不存在,而在酿成的白葡萄酒中却有不同的含量,则说明这个指标是在酿造过程中经过化学变化生成的。 4.4模型四
同样采用模型二的解题思路,利用最小均方差法对葡萄酒的理化指标进行筛选。模型的建立与求解同模型二的建立与求解,利用一元线性回归方程,先对红葡萄酒的理化指标对红葡萄酒的影响问题建立模型并求解:
设响应变量为y ,回归变量为x 1,x 2,……,x 10,通过试验(或观测)得到27组数据:( y i , x 1,x 2,……,x 10) i =1,2,……27 假设y 与x 1,x 2,……,x 10之间有如下线性关系:
y=0β+11x β+……+1010x β+ε (1) 则有
???
??
??++++=++++=++++=2727101027110722
21010211021
1101011101εβββεβββεβββx x y x x y x x y
(2)
其中0β,1β,……10β 是11个待估计的参数,1ε,2ε,…27ε是27个相互独立的服从N (0,2σ)的随机变量,(2)式就是线性回归的数学模型。用矩阵
表示:y=?
?
??
??
??????2721y y y z=????????????2710272
27121022
211101211,,,1,,1,,1x x x x x x x x x ????????????=101
0ββββ ?????
???????=2721εεεε
模型(2)可写为Y=Z β+ε.
红葡萄酒的理化指标对红葡萄求得的最优化方程为:
Y3=78.9352-0.0116*x1+1.3170*x2-1.8336*x3+0.6897*x4-0.0464*x5+1.4374*x 6-0.0952*x7+0.5542*x8+0.2050*x9-0.6650*x10
把红葡萄酒的10个理化因子带入方程得:
68.8688 77.5597 80.7111 70.9887 70.9246 71.4055 68.1610 67.7369 76.3336 70.3881 65.9724 70.2400 71.8336 69.8531 67.7917 69.4642 73.2501 69.4038 75.0715 70.2330 73.5285 72.0160 83.1047 72.5820 69.7180 69.1470 72.2570
红葡萄酒的理化指标对红葡萄酒的理论值与红葡萄酒的实际值做一元线性规划,得:
Y=0.9999x +0.0083
利用matlab 软件编程得:
理论值
红葡萄酒的理化因子对红葡萄酒的影响
实际值
再利用一元线性回归模型对白葡萄酒的理化指标对白葡萄酒进行建立与求解: 设响应变量为y ,回归变量为x 1,x 2,x 3,x 4,通过试验(或观测)得到28组数据:( y i , x 1,x 2,x 3,x 4) i =1,2,……28 假设y 与x 1,x 2,x 3,x 4之间有如下线性关系:
y=0β+11x β+33x β+44x β+ε (1) 则有
???
??
??+++++=+++++=+++++=2828442833282228110822244233222211021
14413312211101εβββββεβββββεβββββx x x x y x x x x y x x x x y
(2) 其中0β,1β,3β,4β 是11个待估计的参数,1ε,2ε,…28ε是28个相互独立的服从N (0,2σ)的随机变量,(2)式就是线性回归的数学模型。用矩阵
表示:y=?
?
???
?
??????2821y y y z=???????????
???28428328228124,23222114131211,,,1,,,1,,,,1x x x x x x x x x x x x ?????
???????=
4310βββββ ??????
??????=2821εεεε 模型(2)可写为Y=Z β+ε.
白葡萄酒的理化指标对白葡萄求得的最优化方程为:
Y4=75.6174-0.3367*x1-1.2955*x2+0.0291*x3+1.6795*x4 把白葡萄酒的4个理化因子带入方程得:
76.4759 76.7733 75.7589 76.9443 77.0320 76.7057 75.2192 76.5367 77.2139 76.0478 75.9545 76.3923 75.8264 75.8982 76.5120 76.5582 76.8313 75.4239 76.7039 76.4896 76.8013 77.3635 77.6614 76.0192 76.4990 78.2810 74.7917 78.1746
白葡萄酒的理化指标对白葡萄酒的理论值与白葡萄酒的实际值做一元线性规划,得:
Y=1.0000x +0.0006
利用matlab 软件编程得:
74.5
75
75.5
76
76.577
77.5
78
78.5
理论值
白葡萄酒的理化因子对白葡萄酒的影响
实际值
根据问题二算得的理论值可知:
红葡萄的理化指标对红葡萄酒的理论值与红葡萄酒的实际值做一元线性规划,得:
y=1.0009x -0.0470
利用matlab 软件编程得:
理论值
红葡萄的理化因子对红葡萄酒的影响
实际值
白葡萄的理化指标对白葡萄酒的理论值与白葡萄酒的实际值做一元线性规划,得:
y=0.9961x +0.2237
利用matlab 软件编程得:
71
72
73
74
757677
78
79
80
理论值
白葡萄的理化因子对白葡萄酒的影响
实际值
根据以上四个图和四个最优化方程,我们可以看出,通过对红葡萄和红葡萄酒的理化指标的规划我们得出的理论值和葡萄酒的真实值比较接近,而白葡萄和白葡萄酒的理化指标的规划得出的理论值和葡萄酒的真实值接近程度不如红葡萄和红葡萄酒的好。
5模型的评价
5.1问题1模型的评价
附件1中数据比较多,在建立模型时首先对所提供的数据进行了筛选,去除异常数据,对残缺数据进行适当补充,使数据更准确可信。并运用T 检验法对两组评酒员的评价结果有无显著性差异的问题进行了检验,具有较强的逻辑性与
科学性。
5.2问题2模型的评价
附件2中被评价对象即酿酒葡萄的理化指标比较多,运用最小均方差法对这些指标进行恰当的选取,尽量少的选取“主要”的评价指标用于实际评价,忽略次要指标,使建模过程的可操作性增强,使问题趋向系统性、科学性、可比性、可测性和独立性等特性。
同时根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行的分级问题采用回归分析的数学模型,分别对红、白葡萄酒进行建模求解。但模型的解题过程也存在一定的缺点,在对葡萄酒的优、中、差分段时,由于人为主观分段,使分段存在随意性,造成白葡萄酒只分出优、中等级,而没有差等级。
5.3问题3模型的评价
附件3给出了酿酒葡萄和葡萄酒的理化指标的一批离散数据,在建模中运用MATLAB程序作出其图像,并对分析酿酒葡萄与葡萄酒的理化指标之间的联系问题进行了合理的推理与分析,分析结果具体、鲜明。模型三的图像也存在一定的缺点,选取的离散点为空心且较大,造成分析结果存在一定的误差。
5.4问题4模型的评价
模型四得出:红葡萄和红葡萄酒的理化指标的规划得出的理论值和葡萄酒的真实值比较接近,白葡萄和白葡萄酒的理化指标的规划得出的理论值和葡萄酒的真实值接近程度不如红葡萄和红葡萄酒的好,原因是红葡萄酒与白葡萄酒生产工艺有区别,白葡萄酒是用澄清葡萄汁发酵的,而红葡萄酒则是用皮渣(包括果皮、种子)与葡萄汁混合发酵而成的。红葡萄酒的发酵过程中,酒精发酵作用和固体物质的浸渍作用同时存在,前都将糖转化为酒精,后者将固体物质中的丹宁、色素等酚类物质溶解在葡萄酒中。因此,红葡萄酒的颜色、气味、口感等与酚类物质密切相关。
白葡萄酒是用白葡萄汁经过酒精发酵后获得的酒精饮料,在发酵过程中不存在葡萄汁对葡萄固体部分的浸渍现象。此外,白葡萄酒的质量,主要由源于葡萄品种的一类香气和源于酒精发酵的二类香气以及酚类物质的含量所决定的(附件3)。
6模型的推广
对于葡萄酒的评价问题,主要运用了回归分析方法,回归分析方法是统计分析的重要组成部分,用回归分析方法来研究建模问题是一种常用的有效方法。回归分析方法是研究随机变量之间的关系,且与实际联系比较密切,随机变量的取值是随机的,大多数是通过试验得到的,所以可以解决许多生活实际问题,如:沼气生成问题、家庭消费支出问题等。
7参考文献
[1] 薛定宇陈阳泉,高等应用数学问题MATLAB求解,北京:清华大学出版社,2008
[2] 韩中庚,数学建模方法及其应用,北京:高等教育出版社,2005
[3] 熊启才,数学模型方法及应用,重庆:重庆大学出版社,2005
[4] 柴俊,数学实验教程,北京:科学出版社,2006
[5] 王文涛,数学建模及其基础知识详解,武汉:武汉大学出版社,2005
[6] 叶其孝,大学生数学建模竞赛辅导教材,湖南:湖南教育出版社,1993
[7] 韩中庚,数学建模竞赛——获奖论文精选与点评,北京:科学出版社,2007
[8] 百度文库,数据的评价显著性检验,https://www.doczj.com/doc/2d710307.html,/view/96887f66f5335a8102d220a2.html 20120907 [9] 百度文库,t检验临界值分布表,https://www.doczj.com/doc/2d710307.html,/view/8861f2283169a4517723a347.html 20120907
[10] 数学中国,学术交流A,https://www.doczj.com/doc/2d710307.html,/thread-167025-1-1.html 20120907
附录:
T检验临界值分布表
续上表:
模型一残差分析图: