当前位置:文档之家› 《数据库系统概论》实验报告

《数据库系统概论》实验报告

《数据库系统概论》实验报告
《数据库系统概论》实验报告

《数据库系统概论》

实验报告

专业:软件工程(2)班

姓名:鄂小妹

学号:0701********

题目:实验二(1)交互式SQL 语言

实验内容及完成情况:(写出每一种类型的SQL测试用例)

(一)数据定义

一、基本表操作

1.建立基本表

1)创建学生表Student,由以下属性组成:学号SNO(INT 型,主码),姓名SNAME(CHAR 型,长度为8,非空唯一),性别SEX(CHAR型,长度为2),所在系DEPTNO (INT型)。CREATE TABLE Student(

SNO INT PRIMARY KEY,

SNAME CHAR(8) NOT NULL UNIQUE,

SEX CHAR(2),

DEPTNO INT);

2)创建课程表Course,由以下属性组成:课程号CNO(INT型),课程名CNAME(CHAR 型,长度为20,非空),授课教师编号TNO(INT型),学分CREDIT(INT型)。其中(CNO,TNO)为主码。

CREATE TABLE Course(

CNO INT,

CNAME CHAR(20) NOT NULL,

TNO INT,

CREDIT INT,

PRIMARY KEY (CNO,TNO));

3)创建学生选课表SC,由以下属性组成:学号SNO,课程CNO,成绩GRADE。所有属性

均为INT型,其中(SNO,CNO)为主码。

CREATE TABLE SC(

SNO INT,

CNO INT,

GRADE INT,

PRIMARY KEY(SNO,CNO));

4)创建教师表Teacher,由以下属性组成:教师编号TNO(INT型,主码),教师姓名TNAME(CHAR型,长度为8,非空),所在系DEPTNO(INT型)。

CREATE TABLE Teacher(

TNO INT PRIMARY KEY,

TNAME CHAR(8) NOT NULL,

DEPTNO INT);

5)创建系表Dept,由以下属性:系号DEPTNO(INT型,主码),系名DNAME(CHAR 型,

长度为20,非空)。

CREATE TABLE Dept(

DEPTNO INT PRIMARY KEY,

DNAME CHAR(20) NOT NULL);

2.修改基本表

1)在Student表中加入属性AGE(INT型)。

ALTER TABLE Student ADD AGE INT;

2)将Student表中的属性SAGE类型改为SMALLINT型。

ALTER TABLE Student ALTER COLUMN SAGE SMALLINT;

3.删除基本表

1)在所有操作结束后删除STUDENT表。

DROP TABLE Student;

2)在所有操作结束后删除COURSE表。

DROP TABLE Course;

3)在所有操作结束后删除SC表。

DROP TABLE SC;

4)在所有操作结束后删除TEACHER表。

DROP TABLE Teacher;

5)在所有操作结束后删除DEPT表。

DROP TABLE Dept;

二、索引操作

1.建立索引

1)在Student表上建立关于SNO的唯一索引。

CREATE UNIQUE INDEX stusno ON Student(SNO);

2)在Course表上建立关于CNO升序的唯一索引。

CREATE UNIQUE INDEX coucno ON Course(CNO);

2.删除索引

1)删除Student表上的索引stusno。

DROP INDEX stusno;

2)删除Course表上的索引coucno。

DROP INDEX coucno;

三、视图操作

1.建立视图

在插入数据的Student基本表上为计算机科学与技术系的学生记录建立一个视图CS_STUDENT。

CREATE VIEW CS_STUDENT AS

SELECT *

FROM Student

WHERE DEPTNO=

(SELECT DEPTNO

FROM Dept

WHERE DNAME='计算机科学与技术')

WITH CHECK OPTION;

2.删除视图

在操作结束后删除视图CS_STUDENT。

DROP VIEW CS_STUDENT;

(二)数据操作

一、更新操作

1.插入数据

1)向STUDENT表插入下列数据:

1001,张天,男,10,20

1002,李兰,女,10,21

1003,陈铭,男,10,21

1004,刘茜,女,20,21

1005,马朝阳,男,20,22

INSERT INTO Student V ALUES(1001,'张天','男',10,20); INSERT INTO Student V ALUES(1002,'李兰','女',10,21); INSERT INTO Student V ALUES(1003,'陈铭','男',10,21); INSERT INTO Student V ALUES(1004,'刘茜','女',20,21); INSERT INTO Student V ALUES(1005,'马朝阳','男',20,22);

2)向COURSE表插入下列数据:

1,数据结构,101,4

2,数据库,102,4

3,离散数学,103,4

4,C语言程序设计,101,2

INSERT INTO Course V ALUES(1,'数据结构',101,4); INSERT INTO Course V ALUES(2,'数据库',102,4); INSERT INTO Course V ALUES(3,'离散数学',103,4); INSERT INTO Course V ALUES(4,'C语言程序设计',101,2);

3)向SC表插入下列数据:

1001,1,80

1001,2,85

1001,3,78

1002,1,78

1002,2,82

1002,3,86

1003,1,92

1003,3,90

1004,1,87

1004,4,90

1005,1,85

1005,4,92

INSERT INTO SC V ALUES(1001,1,80);

INSERT INTO SC V ALUES(1001,2,85);

INSERT INTO SC V ALUES(1001,3,78);

INSERT INTO SC V ALUES(1002,1,78);

INSERT INTO SC V ALUES(1002,2,82);

INSERT INTO SC V ALUES(1002,3,86);

INSERT INTO SC V ALUES(1003,1,92);

INSERT INTO SC V ALUES(1003,3,90);

INSERT INTO SC V ALUES(1004,1,87);

INSERT INTO SC V ALUES(1004,4,90);

INSERT INTO SC V ALUES(1005,1,85);

INSERT INTO SC V ALUES(1005,4,92);

4)向TEACHER表插入下列数据:

101,张星,10

102,李珊,10

103,赵天应,10

104,刘田, 20

INSERT INTO Teacher V ALUES(101,'张星',10); INSERT INTO Teacher V ALUES(102,'李珊',10); INSERT INTO Teacher V ALUES(103,'赵天应',10); INSERT INTO Teacher V ALUES(104,'刘田', 20);

5)向DEPT表插入下列数据:

10,计算机科学与技术

20,信息

INSERT INTO Dept V ALUES(10,'计算机科学与技术'); INSERT INTO Dept V ALUES(20,'信息');

2.修改数据

将张星老师数据结构课的学生成绩全部加2分UPDATE SC

SET GRADE = GRADE + 2

WHERE CNO IN

(SELECT CNO

FROM Course,Teacher

WHERE Course.TNO = Teacher.TNO

AND Teacher.TNAME='张星');

3.删除数据

删除马朝阳同学的所有选课记录

DELETE FROM SC

WHERE SNO IN

(SELECT SNO

FROM Student

WHERE SNAME = '马朝阳');

二、查询操作

1.单表查询

1)查询所有学生的信息。

SELECT *

FROM Student;

结果:1001 张天男10 20

1002 李兰女10 21

1003 陈铭男10 21

1004 刘茜女20 21

1005 马朝阳男20 22

2)查询所有女生的姓名。

SELECT SNAME

FROM Student

WHERE SEX = '女';

结果:李兰

刘茜

3)查询成绩在80到89之间的所有学生选课记录,查询结果按成绩的降序排列。SELECT *

FROM SC

WHERE GRADE >= 80

AND GRADE <= 89

ORDER BY GRADE DESC;

结果:1004 1 87

1002 3 86

1001 2 85

1005 1 85

1002 2 82

1001 1 80

4)查询各个系的学生人数。

SELECT DEPTNO,count(SNO)

FROM Student

GROUP BY DEPTNO;

结果:10 3

20 2

2.连接查询

查询信息系年龄在21岁以下(含21岁)的女生姓名及其年龄。

SELECT SNAME,AGE

FROM Student,Dept

WHERE Student.DEPTNO = Dept.DEPTNO

AND Dept.DNAME = '信息'

AND AGE <= 21

AND SEX = '女';

结果:刘茜21

3.嵌套查询

1)查询修课总学分在10学分以下的学生姓名。

SELECT SNAME

FROM Student

WHERE SNO IN

(SELECT SNO

FROM SC,Course

WHERE https://www.doczj.com/doc/d73484704.html,O = https://www.doczj.com/doc/d73484704.html,O

GROUP BY SNO

HAVING SUM(CREDIT)<10);

结果:陈铭

刘茜

马朝阳

2)查询各门课程取得最高成绩的学生姓名及其成绩。

SELECT CNO,SNAME,GRADE

FROM Student,SC SCX

WHERE Student.SNO = SCX.SNO AND SCX.GRADE IN

(SELECT MAX(GRADE)

FROM SC SCY

WHERE https://www.doczj.com/doc/d73484704.html,O = https://www.doczj.com/doc/d73484704.html,O

GROUP BY CNO);

结果:2 张天85

3 陈铭92

1 陈铭90

4 马朝阳92

3)查询选修了1001学生选修的全部课程的学生学号。

SELECT SNO

FROM Student

WHERE NOT EXISTS

(SELECT *

FROM SC SCX

WHERE SCX.SNO = 1001 AND NOT EXISTS

(SELECT *

FROM SC SCY

WHERE SCY.SNO = Student.SNO AND https://www.doczj.com/doc/d73484704.html,o = https://www.doczj.com/doc/d73484704.html,o));

结果:1001

1002

4)查询选修了张星老师开设的全部课程的学生姓名。

SELECT SNAME

FROM Student

WHERE NOT EXISTS

(SELECT *

FROM Course

WHERE TNO IN

(SELECT TNO

FROM Teacher

WHERE TNAME = '张星') AND NOT EXISTS

(SELECT *

FROM SC

WHERE SC.SNO = Student.SNO AND https://www.doczj.com/doc/d73484704.html,O = https://www.doczj.com/doc/d73484704.html,O));

结果:刘茜

马朝阳

出现的问题及解决方案:

1.在创建基本表时是否可以缺省主码?

可以。在定义基本表时可以定义主码也可以先不定义主码。

2.对基本表进行修改,执行ALTER TABLE Student MODIFY Sage SMALLINT显示执行失败。

当基本表中没有数据时,KingbaseES允许对基本表的属性类型进行修改,如上述修改

可以写成ALTER TABLE Student ALTER COLUMN SAGE SMALLINT,执行成功。但如果基本表

中已经存有数据时,系统则会给出数据将丢失的警告,不允许进行属性类型的修改。

3.在SQL Server中没有提供删除属性列的语句,KingbaseES则支持删除属性列。

如果要在基本表Student上删除属性列SNAME,可以执行ALTER TABLE Student DROP SNAME。

题目:实验四数据控制(完整性部分)

实验内容及完成情况:

实验环境介绍:

硬件:CPU:P3 800

硬盘:30G

内存:512M

系统:Windows 2000 Advanced Server

在本实验中,我们将对完整性进行讨论,包括3类完整性、CHECK短语、CONSTRAIN 子句、触发器。因为完整性约束绝大部分是在定义表结构时进行的,因此可能需要多次定义

表,如果表名发生重复的话,可以先将旧表删除后再建立。

1. 实体完整性

【例4】定义表的主码。

关系模型的实体完整性在CREATE TABLE中用PRIMARY KEY定义。定义主码的方法分为定义为列级约束条件和定义为表级约束条件两种。

[例4-1]定义表Student,并将其中的Sno属性定义为主码。

CREATE TABLE STUDENT(

SNO CHAR(7) PRIMARY KEY,

SNAME CHAR(8) NOT NULL,

SSEX CHAR(2),

SAGE SMALLINT,

SDEPT CHAR(20));

或者:

CREATE TABLE STUDENT(

SNO CHAR(7),

SNAME CHAR(8),

SSEX CHAR(2),

SAGE SMALLINT,

SDEPT CHAR(20),

PRIMARY KEY (SNO));

[例4-2]定义表SC,将其中的属性Sno,Cno定义为主码。

对于多个属性构成的码,只能够将其定义为表级约束条件,而无法用列级约束条件来实

现。

CREATE TABLE SC(

SNO CHAR(7) NOT NULL,

CNO CHAR(4) NOT NULL,

GRADE SMALLINT,

PRIMARY KEY (SNO,CNO));

2. 参照完整性。

【例5】定义表的外码。

关系模型的参照完整性是在CREATE TABLE中用FOREIGN KEY语句来定义的,并用REFERENCES来指明外码参照的是哪些表的主码。

定义表SC,其中Sno参照表Student的主码Sno,Cno参照表Course的主码Cno。

CREATE TABLE SC(

SNO CHAR(7) NOT NULL,

CNO CHAR(4) NOT NULL,

GRADE SMALLINT,

PRIMARY KEY (SNO,CNO),

FOREIGN KEY (SNO) REFERENCES STUDENT(SNO),

FOREIGN KEY (CNO) REFERENCES COURSE(CNO));

3. 用户定义完整性。

【例6】用户定义的属性上的约束条件。

[例6-1]列值非空。在定义SC表时,Sno、Cno和Grade属性都不允许取空值。

在不特别声明的情况下,非码属性的值是允许取空值的。

CREATE TABLE SC(

SNO CHAR(7) NOT NULL, /*列值非空的约束NOT NULL*/

CNO CHAR(4) NOT NULL,

GRADE SMALLINT NOT NULL);

[例6-2]列值唯一。建立部门表DEPT,要求部门名称Dname取值唯一,部门编号Deptno 属

性为主码。

CREATE TABLE DEPT(

DEPTNO NUMERIC(7) PRIMARY KEY,

DNAME V ARCHAR(9) UNIQUE, /*UNIQUE约束要求Dname取值唯一*/

LOCATION V ARCHAR(10));

[例6-3]CHECK短语指定列值应该满足的条件。定义表Student,属性Ssex的值只允许取“男”

或“女”;定义表SC,属性Grade的值定义在0-100之间。

CREATE TABLE STUDENT(

SNO CHAR(7) PRIMARY KEY,

SNAME CHAR(8) NOT NULL,

SSEX CHAR(2) CHECK(SSEX IN(‘男’,’女’)), /*CHECK语句约束条件*/

SAGE SMALLINT,

SDEPT CHAR(20));

CREATE TABLE SC(

SNO CHAR(7) NOT NULL,

CNO CHAR(4) NOT NULL,

GRADE SMALLINT CHECK (GRADE>0 AND GRADE<100), /*CHECK语句约束条件*/

PRIMARY KEY (SNO,CNO),

FOREIGN KEY (SNO) REFERENCES STUDENT(SNO),

FOREIGN KEY (CNO) REFERENCES COURSE(CNO));

【例7】用户定义的元组上的约束条件。

CHECK短语不光能够定义属性列上的约束条件,还允许用户定义元组级的约束条件。

定义表Student,要求当学生性别为男时,其名字不能以Ms.打头。

CREATE TABLE STUDENT(

SNO CHAR(7) PRIMARY KEY,

SNAME CHAR(8) NOT NULL,

SSEX CHAR(2),

SAGE SMALLINT,

SDEPT CHAR(20),

CHECK (SSEX = ‘女’OR SNAME NOT LIKE ‘Ms.%’));

/*定义了Sname和Ssex之间的约束条件*/

4. CONSTRAINT完整性约束命名子句。

【例8】在定义表时利用约束命名子句对完整性约束条件命名,能够灵活地增加或删除一个

完整性约束条件。

[例8-1]定义表Student,要求学号在90000-99999之间,姓名不能取空值,年龄小于30,

性别只能是“男”或“女”。要求全部用约束命名子句实现。

CREATE TABLE STUDENT(

SNO NUMERIC(5)

CONSTRAINT C1 CHECK (SNO BETWEEN 90000 AND 99999),

SNAME V ARCHAR(20)

CONSTRAINT C2 NOT NULL,

SAGE NUMERIC(3)

CONSTRAINT C3 CHECK (SAGE < 30),

SSEX V ARCHAR(2)

CONSTRAINT C4 CHECK (SSEX IN (‘男’,’女’)),

CONSTRAINT StudentKey PRIMARY KEY(SNO));

在表Student上共定义了5个约束条件,包括主码约束以及C1、C2、C3、C4四个列级约束。

[例8-2]修改表Student中的完整性限制,去掉对性别的限制,并将年龄的限制由小于30改

为小于40。

ALTER TABLE STUDENT /*去掉对性别的限制条件C4*/

DROP CONSTRAINT C4;

ALTER TABLE STUDENT /*先删掉原来的约束条件再增加一个新的约束条件*/ DROP CONSTRAINT C3;

ALTER TABLE STUDENT

ADD CONSTRAINT C3 CHECK(SAGE <40);

5. 触发器。

触发器可以看成是一类特殊的存储过程,在满足某个特定条件时自动触发执行,是提

数据库服务器性能的有力工具。

触发器分为三类,更新触发器、插入触发器和删除触发器。

能够定义触发器的用户有:

1)表的所有者;

2)系统管理员;

3)拥有创建触发器的权限,且拥有对操作对象的相应的操作权限的用户。

【例9】定义表TAB,并在其上定义触发器TRI,在对TAB的插入和更新前检查,如果插入

或更新的值在100-1000之间的话,将值置为50;如果值大于1000的话,则给出新值不允

许大于1000的提示。

CREATE TABLE tab (col int);

INSERT INTO tab V ALUES(10);

INSERT INTO tab V ALUES(20);

CREATE TRIGGER tri BEFORE UPDA TE OR INSERT ON tab

FOR EACH ROW

AS

BEGIN

IF new.col > 100 AND new.col < 1000 THEN

new.col := 50;

END IF;

IF new.col > 1000 THEN

RAISE EXCEPTION ‘New values can not more than 1000’;

END IF;

END;

检测:1)向表TAB插入数据(150)。

执行:INSERT INTO TAB V ALUES(150);

结果:插入的数据为150。值在100-1000之间,触发器TRI自动执行,将插入的值置为50。

2)对表中的数据进行更新,将20更新为1500。

执行:UPDA TE TAB SET COL = 1500 WHERE COL = 20;

结果:系统报出‘New values can not more than 1000’的错误,对表进行查询后发现,表中的数据并没有发生改变。说明在更新数据时,值大于1000 则触发触发器TRI自动执行,系统报错,更新无效。

【例10】删除触发器TRI。

DROP TRIGGER TRI ON TAB;

删除触发器TRI之后,在对TAB进行插入和更新就不再有以上限制了。

品质评价实验报告——描述性检验法(1)

食品品质评价 —描述检验法 一、实验目的 通过实验了解定量描述检验法的定义、特点及其应用;初步学会定量描述检验的方法。本实验是利用定量描述检验法评价两种品牌的西红柿薯条和薯片的总体品质,分析其感官差异。 二、实验方法原理 制定具体实验方案、对实验的样品进行准备,组织同学进行品尝并参加样品的品尝,根据人的感觉包括味觉、嗅觉、视觉、听觉和触觉等,用语言、文字、符号或数据进行记录,再运用概率统计原理进行统计分析,画出风味剖面图并对剖面图进行分析从而得出结论,对食品的色、香、味、形、质地、口感等各项指标做出评价。 三、样品及器具 1.样品:两种番茄味薯片(可比克,上好佳) 2.器具:被子,托盘,纸条,笔,纸巾 四、方法步骤 1.召开信息会,熟悉产品,确定产品特性特征及强度等级,采用GB12313-90 标度A(数字); 2.确定评价方法:独立方法; 3.评价组长按定量描述检验法程序做好样品的‘描述检验问卷’;

4两种薯条/片样品以随机三位数编号,放在托盘内,呈递给评价员; 5.评价员在熟悉薯条/片产品的各项特性特征,独立品评,并填写问卷表; 5.数据处理 分组:按编号分成两大组进行数据统计分析,其中: 1-22号为第一大组(薯条),23-44号为第二大组(薯片),结果报告形式:用QDA图报告总体评价结果; 用方差分析报告样品间和评价员差异。 五、心得体会 本次实验我对描述检验方法有了更进一步的认识,初步学会了定量描述检验的方法。作为实验员,从样品特性特征的鉴定、感觉顺序的确定、采用数字法进行强度评价、余味和滞留度的测定、综合印象的评估,到实验的前期准备工作以及本次实验的内容——利用定量描述检验法评价两种品牌的番茄薯片的总体品质,整个过程我都参与了。虽然多花了许多时间,但也有很多收获。我对定量描述检验法的整个流程有了深层理解和深刻印象,同时也交到了很多朋友。只有亲自动手实践,理论联系实际,才能更好地掌握理论知识,将所学内容应用于实践当中。 六、实验结果报告 1. 涉及的问题; 评价两种品牌的西红柿薯条/片的总体品质分析及品质差异, 2. 使用的方法(检验技术);

数据挖掘实验报告

《数据挖掘》Weka实验报告 姓名_学号_ 指导教师 开课学期2015 至2016 学年 2 学期完成日期2015年6月12日

1.实验目的 基于https://www.doczj.com/doc/d73484704.html,/ml/datasets/Breast+Cancer+WiscOnsin+%28Ori- ginal%29的数据,使用数据挖掘中的分类算法,运用Weka平台的基本功能对数据集进行分类,对算法结果进行性能比较,画出性能比较图,另外针对不同数量的训练集进行对比实验,并画出性能比较图训练并测试。 2.实验环境 实验采用Weka平台,数据使用来自https://www.doczj.com/doc/d73484704.html,/ml/Datasets/Br- east+Cancer+WiscOnsin+%28Original%29,主要使用其中的Breast Cancer Wisc- onsin (Original) Data Set数据。Weka是怀卡托智能分析系统的缩写,该系统由新西兰怀卡托大学开发。Weka使用Java写成的,并且限制在GNU通用公共证书的条件下发布。它可以运行于几乎所有操作平台,是一款免费的,非商业化的机器学习以及数据挖掘软件。Weka提供了一个统一界面,可结合预处理以及后处理方法,将许多不同的学习算法应用于任何所给的数据集,并评估由不同的学习方案所得出的结果。 3.实验步骤 3.1数据预处理 本实验是针对威斯康辛州(原始)的乳腺癌数据集进行分类,该表含有Sample code number(样本代码),Clump Thickness(丛厚度),Uniformity of Cell Size (均匀的细胞大小),Uniformity of Cell Shape (均匀的细胞形状),Marginal Adhesion(边际粘连),Single Epithelial Cell Size(单一的上皮细胞大小),Bare Nuclei(裸核),Bland Chromatin(平淡的染色质),Normal Nucleoli(正常的核仁),Mitoses(有丝分裂),Class(分类),其中第二项到第十项取值均为1-10,分类中2代表良性,4代表恶性。通过实验,希望能找出患乳腺癌客户各指标的分布情况。 该数据的数据属性如下: 1. Sample code number(numeric),样本代码; 2. Clump Thickness(numeric),丛厚度;

食品感官实验报告

食品感官分析实验报告 班级食安1201 学号 12015001xx 姓名 xxx 实验日期 2014.12.03 一、实验原理与目的 1.描述性检验是对一种制品感官特征的描述过程。评价制品的时候要考虑所有能被感知的感觉——视觉、味觉、嗅觉、听觉、触觉等。 2.评价可以是总体的,也可以集中在某一方面。 3.通过实验要求掌握用描述性检验法来评价样品的感官特性以及每种特性的强度。 二、实验材料 1.材料: 长鼻王膨化夹心卷(蛋黄口味)420g(产地:浙江嘉兴); 伊达玉米味软糖(产地:广东省揭阳市); 金丝猴奶糖(原味)118g(产地:上海市浦东新区); 小天使鲜米饼270g(产地:浙江杭州); 上好佳酸奶味硬糖(产地:上海市); 上好佳话梅糖(产地:上海市); 达利低糖海苔饼(产地:四川成都市); 达利香葱咸饼130g(产地:福建省泉州市); 饮用纯净水。 2. 检验容器:足量味碟或一次性水杯,要求清洁、干燥。 三、实验步骤 1.被检样品的制备 为评价员准备好所需容器及饮用纯净水,按样品种类分装样品,并呈送给评价员。 2、品评检验 (1)将按照准备表组合并标记好的样品连同问答表一起呈送给评价员。 (2)每个评价员品尝四组样品,品评后对样品各特性打分,并填好问答表。(后附问答表) 四、实验数据处理 根据实验回收得的32份问答表统计酸味类型及甜味类型的数据,即样品一(上好佳酸奶味硬糖)、样品二(上好佳话梅糖)、样品三(伊达玉米味软糖)、样品四(金丝猴奶糖)的数据。数据汇总如下: 1、酸味类型 各快感标度的人数统计如下:

得样品一各项平均得分: ①喜好:味道=5.69; 气味=5.03 ;口感= 5.66;整体=5.66 ②JAR:味道=3.00 ; 气味=3.09 ;口感=2.97 ;整体=2.97 表2样品二(上好佳话梅糖)人数统计数据 得样品二各项平均得分: ①喜好:味道=5.25 ; 气味=5.06 ;口感=5.25 ;整体= 5.28 ②JAR:味道=3.44 ; 气味=3.34 ;口感=3.38 ;整体= 3.34 2、甜味类型 各快感标度的人数统计如下: 表3样品三(伊达玉米味软糖)人数统计数据

土地利用规划实验指导书

《土地利用规划》课程实验指导书 环境与地理科学系 2009 年 9 月 10 日

实验一土地需求量预测 一、实验目的 1.了解土地需求量预测的必要性和意义; 2.掌握不同的土地需求量预测方法,明确不同方法的实用性; 3.能够借助传统手工方式或计算机计算方式熟练使用不同的预测方法。 二、实验原理 预测是土地利用管理的重要手段,是了解和协调时期和区域土地利用供给量与需求量之间的关系的重要内容。土地需求量受一定时期国民经济、社会发展、土地质量和区位条件等的影响。耕地需求量预测是土地利用规划预测中最基本的内容。 三、实验过程 1.确定预测目的; 2.检验土地需求量预测案例提供的资料; 3.利用传统手工方式或者计算机软件实施预测过程:分别采用趋势预测法和回归分析法对案例(见附件1)进行预测。其中,手工计算方式严格按照预测方法的原理进行逐步计算;计算机计算可以采用EXCEL数据分析工具或者SPSS软件等; 4.比较传统手工和计算机两种计算方式的优缺点; 5.分析预测误差。 四、注意事项 数据输入时要仔细,分析过程中做到谨慎认真。 五、上交资料 提交实验报告,内容书写要规范。

附件1: 例1. 根据某县市1970-1999年30年耕地面积资料(表-1),采用趋势预测法计算出预测方程并绘制趋势线,同时计算出2000年的耕地面积,最后对预测误差进行分析。 表-1 ××县1970-1999年耕地面积

例2.未来耕地面积受多种因素的制约,如人口、单产、总产、基建投资等,并随着上述因素的变化而变化,在它们之间存在着因果关系。下表提供了某县市1970-1999年30年人口、粮食总产量和耕地面积的资料(表-2),由此采用回归分析法预测2000年的耕地面积,并列出回归分析方程,最后分析预测误差。 表-2 ××县1970-1999年人口、粮食总产量和耕地面积

数据挖掘实验报告(一)

数据挖掘实验报告(一) 数据预处理 姓名:李圣杰 班级:计算机1304 学号:1311610602

一、实验目的 1.学习均值平滑,中值平滑,边界值平滑的基本原理 2.掌握链表的使用方法 3.掌握文件读取的方法 二、实验设备 PC一台,dev-c++5.11 三、实验内容 数据平滑 假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70。使用你所熟悉的程序设计语言进行编程,实现如下功能(要求程序具有通用性): (a) 使用按箱平均值平滑法对以上数据进行平滑,箱的深度为3。 (b) 使用按箱中值平滑法对以上数据进行平滑,箱的深度为3。 (c) 使用按箱边界值平滑法对以上数据进行平滑,箱的深度为3。 四、实验原理 使用c语言,对数据文件进行读取,存入带头节点的指针链表中,同时计数,均值求三个数的平均值,中值求中间的一个数的值,边界值将中间的数转换为离边界较近的边界值 五、实验步骤 代码 #include #include #include #define DEEP 3 #define DATAFILE "data.txt" #define VPT 10 //定义结构体 typedef struct chain{ int num; struct chain *next; }* data; //定义全局变量 data head,p,q; FILE *fp; int num,sum,count=0; int i,j; int *box; void mean(); void medain(); void boundary(); int main () { //定义头指针 head=(data)malloc(sizeof(struc t chain)); head->next=NULL; /*打开文件*/ fp=fopen(DATAFILE,"r"); if(!fp) exit(0); p=head; while(!feof(fp)){

食品分析实验报告

大学 食品分析 实验报告

食品中总灰分含量的测定 一、目的与要求 1.学习食品中总灰分含量测定的意义与原理 2.掌握灼烧重量法测定灰分的实验操作技术及不同样品前处理方法的选择 二、实验原理 将样品炭化后置于500~600℃高温炉内至有机物完全灼烧挥发后,无机物以无机盐和金属氧化物的形式残留下来,这些残留物即为灰分。称量残留物的质量即可计算出样品中的总灰分。 三、仪器与试剂 1.仪器 马弗炉;分析天平:感量0.0001g ;干燥器:内装有效的变色硅胶;坩埚钳;瓷坩埚。 2.试剂 三氯化铁溶液(5g/L ):称取0.5g 三氯化铁(分析纯)溶于100ml 蓝黑墨水中。 四、实验步骤 1.配制浓盐酸:蒸馏水=1:4的稀盐酸,将洗净后的坩埚放入浸泡15min 。 2.将浸泡过后的坩埚取出,放入马弗炉中灼烧30min 。 3.冷却200℃以下将坩埚取出移至干燥器内冷却至室温,称取坩埚的质量30.5337g 。 4.称取固体样品——奶粉1.0636g 放入坩埚内,置于电热炉上炭化30min 或至样品完全炭化不冒白烟。 5.把坩埚放入马弗炉内,错开坩埚盖,关闭炉门进行灼烧。 6.冷至200℃一下取出坩埚,并移至干燥器内冷却至室温,称量至恒重得30.5835g 。 五、结果计算 样品总灰分含量计算如下: 式中,X 为每100g 样品中灰分含量,g ;m 1为空坩埚质量,g ;m 2为样品和坩埚质量,g ;m 3为坩埚和灰分质量,g 。 m 3—m 1 X= × 100 m 2—m 1

X=(30.5835—30.5337)/1.0636×100 =4.68% 六、注意事项 1.样品炭化时要注意热源强度,防止产生大量泡沫溢出坩埚,造成实验误差。对于含糖分、淀粉、蛋白质较高的样品,为防止泡沫溢出,炭化前可加数滴纯净植物油 2.灼烧空坩埚与灼烧样品的条件应尽量一致,以消除系统误差。 3.把坩埚放入马弗炉或从马弗炉中取出时,要在炉口停留片刻,使坩埚预热或冷却,防止因温度骤然变化而使坩埚破裂。 4.灼烧后的坩埚应冷却到200℃以下再移入干燥器中,否则因强热冷空气的瞬间对流作用,易造成残灰飞散;而且多热的坩埚放入干燥器,冷却后干燥器内形成较大真空,盖子不易打开。 5.新坩埚使用前须在1:1盐酸溶液中煮沸1h,用水冲净烘干,经高温灼烧至恒重后使用。用过的旧坩埚经初步清洗后,可用废盐酸浸泡20min,再用水冲洗干净。 6.样品灼烧温度不能超过600℃,否则钾、钠、氯等易挥发造成误差。样品经灼烧后,若中间仍包裹炭粒,可滴加少许水,使结块松散,蒸出水分后再继续灼烧至灰化完全。 7.对较难灰化的样品,可添加硝酸、过氧化氢、碳酸铵等助灰剂,这类物质在灼烧后完全消失,不增加残灰的质量,仅起到加速灰化的作用。如,若灰分中夹杂炭粒,向冷却的样品滴加硝酸(1:1)使之湿润,蒸干后再灼烧。 8.反复灼烧至恒重是判断灰化是否完全最可靠地方法。因为有些样品即使灰化完全,残灰也不一定是白色或灰白色。例如铁含量高的食品,残灰呈褐色;锰、铜含量高的食品,残灰呈蓝绿色。反之,未灰化完全的样品,表面呈白色的灰,但内部仍夹杂有炭粒。 七、思考题 1.简述测定食品灰分的意义。 对于食品行业来说,灰分是一项重要的质量指标。例如,在面粉加工中,常以总灰分含量评定面粉等级,面粉的加工精度越高,灰分含量越低;在生产果胶、明

土地利用规划-耕地需求量预测 实验报告

贵州大学实验报告 实验 4 :耕地需求量预测 学院:农学院 专业:农业资源与环境 班级: 姓名: 学号: 指导教师:周焱 时间: 2014 年 06 月 11 日

第一部分实验目的 通过本实验的学习,使学生掌握耕地需求量预测的具体过程。 第二部分实验原理 本实验以兴义市,根据兴义市自然、社会经济条件和发展趋势,预测2010年和2020年兴义市耕地保有量和基本农田保护面积。 第三部分实验步骤 1、搜集兴义市自然经济条件等相关资料; 2、根据人口历史资料和兴义市相关发展规划,对2010年和2020年人口规模进行预测; 3、根据人口预测和相关粮食标准对耕地保有量和基本农田保护面积进行预测; 第四部分报告正文 根据表1中1997年——2005年年平均人口自然增长率,得出年平均人口增长率为0.82%,年平均人口机械增长率为0.38%,以2004年作为参考依据,预测出2010年与2020年的人口规模: P t = P o ×(1+K+P)(t-to)+(c-d) 式中:P t ——规划年人口数 P t0 ——基期年人口数 t-t ——预测年期 K——人口自然增长率 c——规划期内迁入人数 d——规划期内迁出人数 P t2010 = P t2004 ×(1+K+P)(t-to)+(c-d) =73.42×(1+0.82%+0.38%) 6+4.3 =83.17 (万人) P t2020 = P t2004 ×(1+K+P)(t-to) =73.42×(1+0.82%+0.38%) 16+4.3 = 93.16(万人) 根据年平均增长率法计算出年均粮食单产,其中r为2000年——2005年的年平均增长率的平均值1.03%: a n = a o ×(1+r)n

数据挖掘实验报告资料

大数据理论与技术读书报告 -----K最近邻分类算法 指导老师: 陈莉 学生姓名: 李阳帆 学号: 201531467 专业: 计算机技术 日期 :2016年8月31日

摘要 数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不同应用的需要。K 近邻算法(KNN)是基于统计的分类方法,是大数据理论与分析的分类算法中比较常用的一种方法。该算法具有直观、无需先验统计知识、无师学习等特点,目前已经成为数据挖掘技术的理论和应用研究方法之一。本文主要研究了K 近邻分类算法,首先简要地介绍了数据挖掘中的各种分类算法,详细地阐述了K 近邻算法的基本原理和应用领域,最后在matlab环境里仿真实现,并对实验结果进行分析,提出了改进的方法。 关键词:K 近邻,聚类算法,权重,复杂度,准确度

1.引言 (1) 2.研究目的与意义 (1) 3.算法思想 (2) 4.算法实现 (2) 4.1 参数设置 (2) 4.2数据集 (2) 4.3实验步骤 (3) 4.4实验结果与分析 (3) 5.总结与反思 (4) 附件1 (6)

1.引言 随着数据库技术的飞速发展,人工智能领域的一个分支—— 机器学习的研究自 20 世纪 50 年代开始以来也取得了很大进展。用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后的知识,这两者的结合促成了数据库中的知识发现(Knowledge Discovery in Databases,简记 KDD)的产生,也称作数据挖掘(Data Ming,简记 DM)。 数据挖掘是信息技术自然演化的结果。信息技术的发展大致可以描述为如下的过程:初期的是简单的数据收集和数据库的构造;后来发展到对数据的管理,包括:数据存储、检索以及数据库事务处理;再后来发展到对数据的分析和理解, 这时候出现了数据仓库技术和数据挖掘技术。数据挖掘是涉及数据库和人工智能等学科的一门当前相当活跃的研究领域。 数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式,以满足人们不同应用的需要[1]。目前,数据挖掘已经成为一个具有迫切实现需要的很有前途的热点研究课题。 2.研究目的与意义 近邻方法是在一组历史数据记录中寻找一个或者若干个与当前记录最相似的历史纪录的已知特征值来预测当前记录的未知或遗失特征值[14]。近邻方法是数据挖掘分类算法中比较常用的一种方法。K 近邻算法(简称 KNN)是基于统计的分类方法[15]。KNN 分类算法根据待识样本在特征空间中 K 个最近邻样本中的多数样本的类别来进行分类,因此具有直观、无需先验统计知识、无师学习等特点,从而成为非参数分类的一种重要方法。 大多数分类方法是基于向量空间模型的。当前在分类方法中,对任意两个向量: x= ) ,..., , ( 2 1x x x n和) ,..., , (' ' 2 ' 1 'x x x x n 存在 3 种最通用的距离度量:欧氏距离、余弦距 离[16]和内积[17]。有两种常用的分类策略:一种是计算待分类向量到所有训练集中的向量间的距离:如 K 近邻选择K个距离最小的向量然后进行综合,以决定其类别。另一种是用训练集中的向量构成类别向量,仅计算待分类向量到所有类别向量的距离,选择一个距离最小的类别向量决定类别的归属。很明显,距离计算在分类中起关键作用。由于以上 3 种距离度量不涉及向量的特征之间的关系,这使得距离的计算不精确,从而影响分类的效果。

火腿肠质地评价实验报告格式

食品品质评价实验 —火腿肠质地主客观评价 一、实验目的 本实验采用评分检验法对四种不同品牌的火腿肠的质地进行感官评价,用TA.XT Plus物性测试仪测定进行火腿肠的质地测定。通过实验了解感官检验方法—评分检验法的定义、特点及其应用;初步学会食品评分检验的方法和质地的仪器测定方法、感官评定与仪器测定结果的相关性分析,学习食品物性测定仪器的选择依据与方法。 二、样品及器具 1.样品:四种不同品牌的火腿肠。 2.器具:纸质托盘,一次性水杯 3.仪器:TA.XT Plus质构仪(物性测试仪)。 三、方法步骤 1.仪器测定 硬度:采用P/100 和HDP/BS两种探头测定; 弹性:采用P/100探头测定; 测试参数: 2.感官评定 (1)评价组长按评分检验法程序做好样品火腿肠的“评分检验问卷”; (2)四种火腿肠样品以随机三位数编号,放在托盘内,呈递给评价员;(3)评价员在熟悉火腿肠的评价品质标准要求的基础上独立品评,主要评价火

腿肠的硬度和弹性两项质地特性,并填写问卷表。 3.数据处理 (1)用方差分析法分析样品之间的差异和评价员之间的差异。 (2)根据感官评价结果统计数据及仪器分析数据,进行主、客观质地评价结果的相关性分析。 四、实验结果报告 (一)感官评价实验结果报告 1.检验目的:利用评分检验法对四种不同品牌的火腿肠进行硬度和弹性两项质地特性的感官评定。 2.样品情况: 样品A:新王中王;样品B:金锣王中王; 样品C:双汇王中王;样品D:金双汇 3.评价员数:初级评价员 第一组:45人(1~45号) 第二组:45人(46~90号) 4.检验结果: ……. 5.对结果进行统计解释: …… 6.检验负责人:付新萌 7.检验日期和时间:2014年12月17日 (二)仪器测定实验结果报告

数据挖掘实验报告-关联规则挖掘

数据挖掘实验报告(二)关联规则挖掘 姓名:李圣杰 班级:计算机1304 学号:1311610602

一、实验目的 1. 1.掌握关联规则挖掘的Apriori算法; 2.将Apriori算法用具体的编程语言实现。 二、实验设备 PC一台,dev-c++5.11 三、实验内容 根据下列的Apriori算法进行编程:

四、实验步骤 1.编制程序。 2.调试程序。可采用下面的数据库D作为原始数据调试程序,得到的候选1项集、2项集、3项集分别为C1、C2、C3,得到的频繁1项集、2项集、3项集分别为L1、L2、L3。

代码 #include #include #define D 4 //事务的个数 #define MinSupCount 2 //最小事务支持度数 void main() { char a[4][5]={ {'A','C','D'}, {'B','C','E'}, {'A','B','C','E'}, {'B','E'} }; char b[20],d[100],t,b2[100][10],b21[100 ][10]; int i,j,k,x=0,flag=1,c[20]={0},x1=0,i1 =0,j1,counter=0,c1[100]={0},flag1= 1,j2,u=0,c2[100]={0},n[20],v=1; int count[100],temp; for(i=0;i=MinSupCount) { d[x1]=b[k]; count[x1]=c[k]; x1++; } } //对选出的项集中的元素进行排序 for(i=0;i

土地信息系统(空间数据可视化)实验报告

一、实验目的与要求 1、对数字地图制图有初步的认识 2、掌握了解符号化、注记标注、格网绘制以及地图整饰的意义 3、掌握MAPGIS工程文件、点、线、面文件创建及保存方法 4、掌握基本的符号化方法、自动标注操作以及相关地图的整饰和数据的操作 通过综合实验,加深理解地理信息系统基本理论、核心技术,掌握GIS 图形输入、编辑、数据库建立、空间分析、地学分析、统计分析、专题图制作、制图输出等基本应用技能,结合环规专业进行开发区建设规划,为GIS 在资源环境与城乡规划管理中应用打下基础。 二、实验准备 阅读PPT严格按照下面的符号特征要求来做: 1 数据符号化显示 A.地图中共有6个区,将这6个区按照ID字段来用分类色彩表示; B.将道路按class字段分类:分为1~4级道路,并采用不同的颜色表示; C.地铁线符号Color:深蓝色,Width:1.0; D.区县界线Color:橘黄色,Width:1.0 ; E.区县政府Color:红色,Size:10,样式:Star3; F.市政府符号在区县政府基础上改为大小18 2注记标记 A.对地图中6个区的Name字段使用自动标注,标注统一使用Country2 样式,大小:16; B.手动标注黄浦江(双线河),使用宋体、斜体、16号字,字体方向为纵 向,使用曲线注记; C.地铁线使用自动标注,采用Country3样式; D.道路中,对道路的Class字段为GL03的道路进行标注,字体:宋体, 大小:10; E.区县政府使用自动标注,字体:宋体,大小:10; F.市政府使用自动标注,字体:楷体,大小:14

3绘制格网 采用索引参考格网,使用默认设置。 4 添加图幅整饰要素 A.添加图例,包括所有字段; B.添加指北针,选择ESRI North 3样式; C.添加比例尺,选择Alternating Scale Bar 1样式 三、实验内容与主要过程 制作上海市行政区划图 (一)数据符号化 首先我们打开ArcMap,点击Add Data添加各数据,选取数据层所在位置,添加各图层。 在区县界面图层上右键打开Properties对话框,在Value Field中选择字段Name,单击Add All Values按钮,将6个区的名称都添加进来,并选择合适的配色,单击确定按钮完成符号化设置

数据分析与挖掘实验报告

数据分析与挖掘实验报告

《数据挖掘》实验报告 目录 1.关联规则的基本概念和方法 (1) 1.1数据挖掘 (1) 1.1.1数据挖掘的概念 (1) 1.1.2数据挖掘的方法与技术 (2) 1.2关联规则 (5) 1.2.1关联规则的概念 (5) 1.2.2关联规则的实现——Apriori算法 (7) 2.用Matlab实现关联规则 (12) 2.1Matlab概述 (12) 2.2基于Matlab的Apriori算法 (13) 3.用java实现关联规则 (19) 3.1java界面描述 (19) 3.2java关键代码描述 (23) 4、实验总结 (29) 4.1实验的不足和改进 (29) 4.2实验心得 (30)

1.关联规则的基本概念和方法 1.1数据挖掘 1.1.1数据挖掘的概念 计算机技术和通信技术的迅猛发展将人类社会带入到了信息时代。在最近十几年里,数据库中存储的数据急剧增大。数据挖掘就是信息技术自然进化的结果。数据挖掘可以从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先不知道的但又是潜在有用的信息和知识的过程。 许多人将数据挖掘视为另一个流行词汇数据中的知识发现(KDD)的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤。知识发现过程如下: ·数据清理(消除噪声和删除不一致的数据)·数据集成(多种数据源可以组合在一起)·数据转换(从数据库中提取和分析任务相关的数据) ·数据变换(从汇总或聚集操作,把数据变换和统一成适合挖掘的形式) ·数据挖掘(基本步骤,使用智能方法提取数

据模式) ·模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式) ·知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。 1.1.2数据挖掘的方法与技术 数据挖掘吸纳了诸如数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像和信号处理以及空间数据分析技术的集成等许多应用领域的大量技术。数据挖掘主要包括以下方法。神经网络方法:神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、bp反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以hopfield 的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以art 模型、koholon模型为代表的,用于聚类的自组

大数据挖掘weka大数据分类实验报告材料

一、实验目的 使用数据挖掘中的分类算法,对数据集进行分类训练并测试。应用不同的分类算法,比较他们之间的不同。与此同时了解Weka平台的基本功能与使用方法。 二、实验环境 实验采用Weka 平台,数据使用Weka安装目录下data文件夹下的默认数据集iris.arff。 Weka是怀卡托智能分析系统的缩写,该系统由新西兰怀卡托大学开发。Weka使用Java 写成的,并且限制在GNU通用公共证书的条件下发布。它可以运行于几乎所有操作平台,是一款免费的,非商业化的机器学习以及数据挖掘软件。Weka提供了一个统一界面,可结合预处理以及后处理方法,将许多不同的学习算法应用于任何所给的数据集,并评估由不同的学习方案所得出的结果。 三、数据预处理 Weka平台支持ARFF格式和CSV格式的数据。由于本次使用平台自带的ARFF格式数据,所以不存在格式转换的过程。实验所用的ARFF格式数据集如图1所示 图1 ARFF格式数据集(iris.arff)

对于iris数据集,它包含了150个实例(每个分类包含50个实例),共有sepal length、sepal width、petal length、petal width和class五种属性。期中前四种属性为数值类型,class属性为分类属性,表示实例所对应的的类别。该数据集中的全部实例共可分为三类:Iris Setosa、Iris Versicolour和Iris Virginica。 实验数据集中所有的数据都是实验所需的,因此不存在属性筛选的问题。若所采用的数据集中存在大量的与实验无关的属性,则需要使用weka平台的Filter(过滤器)实现属性的筛选。 实验所需的训练集和测试集均为iris.arff。 四、实验过程及结果 应用iris数据集,分别采用LibSVM、C4.5决策树分类器和朴素贝叶斯分类器进行测试和评价,分别在训练数据上训练出分类模型,找出各个模型最优的参数值,并对三个模型进行全面评价比较,得到一个最好的分类模型以及该模型所有设置的最优参数。最后使用这些参数以及训练集和校验集数据一起构造出一个最优分类器,并利用该分类器对测试数据进行预测。 1、LibSVM分类 Weka 平台内部没有集成libSVM分类器,要使用该分类器,需要下载libsvm.jar并导入到Weka中。 用“Explorer”打开数据集“iris.arff”,并在Explorer中将功能面板切换到“Classify”。点“Choose”按钮选择“functions(weka.classifiers.functions.LibSVM)”,选择LibSVM分类算法。 在Test Options 面板中选择Cross-Validatioin folds=10,即十折交叉验证。然后点击“start”按钮:

土地资源调查与评价实验一

实验一土地要素分析 1208140515 土资122班 张舵 一、实验目的 根据研究区域基础数据资料,分析地形、植被、土壤、土地利用方式等土地构成要素的空间演替的规律。 二、实验数据 1.北京市海淀区数字高程模型(DEM) 2.北京市海淀区土壤类型图(土壤.*) 3.北京市海淀区土地利用现状图(简化)(HDDLTB.*) 4.北京市海淀区“凤凰岭-稻香湖”样区条带遥感影像(Sat_DXH31.tif)

三、实验过程 1.将DEM由Raster转化为TIN 打开ArcMap10.2,点击加载实验数据,在Arc Toolbox中选择3D Analyst Tools→Conversion→From Raster→Raster to TIN(图1),输入栅格为DEM图层(图2),将数字高程模型(DEM)由栅格格式(Raster)转化为不规则三角网格式(TIN)(图3)。 图 1 Arc Toolbox工具栏 图 2 Raster to TIN窗口

图 3不规则三角网格式(TIN)的数字高程图 2.选择断面 将遥感影像图层置于所有图层顶端,在研究样区条带内,点击,选择一条东西向、横跨研究样区的断面,并用红线加粗显示(图4) 图4 断面位置示意图 断面在栅格中的具体位置如下图(图5) 图5断面栅格位置图 3.断面地形分析 (1)点击生成断面高程变化图,结合遥感影像进行地形判断。 (2)在Arc Toolbox中选择Spatial Analyst Tools→Surface→Contour,

把生成的TIN图作为输入图层,等值线高差为50米,生成等值线图,进行等值线分析。(图6) 图6等值线分析 4.地貌类型分析 在Arc Toolbox中选择Spatial Analyst Tools→Surface→Slope,把生成的TIN图作为输入图层,生成坡度图,与高程变化图、等值线图对照,分析地貌类型及其部位。 5.土壤类型和属性 在土壤类型图的图层属性中选择符号系统,值字段为土类,添加所有值,并将卵石滩值移除后确定(图7) 图7 土类图层属性表

数据挖掘实验报告 超市商品销售分析及数据挖掘

通信与信息工程学院 课程设计说明书 课程名称: 数据仓库与数据挖掘课程设计题目: 超市商品销售分析及数据挖掘专业/班级: 电子商务(理) 组长: 学号: 组员/学号: 开始时间: 2011 年12 月29 日完成时间: 2012 年01 月 3 日

目录 1.绪论 (1) 1.1项目背景 (1) 1.2提出问题 (1) 2.数据仓库与数据集市的概念介绍 (1) 2.1数据仓库介绍 (1) 2.2数据集市介绍 (2) 3.数据仓库 (3) 3.1数据仓库的设计 (3) 3.1.1数据仓库的概念模型设计 (4) 3.1.2数据仓库的逻辑模型设计 (5) 3.2 数据仓库的建立 (5) 3.2.1数据仓库数据集成 (5) 3.2.2建立维表 (8) 4.OLAP操作 (10) 5.数据预处理 (12) 5.1描述性数据汇总 (12) 5.2数据清理与变换 (13) 6.数据挖掘操作 (13) 6.1关联规则挖掘 (13) 6.2 分类和预测 (17) 6.3决策树的建立 (18) 6.4聚类分析 (22) 7.总结 (25) 8.任务分配 (26)

数据挖掘实验报告 1.绪论 1.1项目背景 在商业领域中使用计算机科学与技术是当今商业的发展方向,而数据挖掘是商业领域与计算机领域的乔梁。在超市的经营中,应用数据挖掘技术分析顾客的购买习惯和不同商品之间的关联,并借由陈列的手法,和合适的促销手段将商品有魅力的展现在顾客的眼前, 可以起到方便购买、节约空间、美化购物环境、激发顾客的购买欲等各种重要作用。 1.2提出问题 那么超市应该对哪些销售信息进行挖掘?怎样挖掘?具体说,超市如何运用OLAP操作和关联规则了解顾客购买习惯和商品之间的关联,正确的摆放商品位置以及如何运用促销手段对商品进行销售呢?如何判断一个顾客的销售水平并进行推荐呢?本次实验为解决这一问题提出了解决方案。 2.数据仓库与数据集市的概念介绍 2.1数据仓库介绍 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它并不是所谓的“大型数据库”。........ 2.2数据集市介绍 数据集市,也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。....... 3.数据仓库 3.1数据仓库的设计 3.1.1数据库的概念模型 3.1.2数据仓库的模型 数据仓库的模型主要包括数据仓库的星型模型图,我们创建了四个

实验报告

五尧乡生态乡镇建设规划 目录 1.总论 1.1任务的由来 (2) 1.2编制的依据 (2) 1.3规划指导思想 (2) 1.4规划原则 (2) 1.5规划年限 (3) 1.6规划目标 (3) 2.五尧乡基本状况 (4) 2.1五尧乡自然地理状况 (4) 2.2五尧乡社会经济状况 (4) 3.城镇规划 (4) 4.生态环境规划 (5) 4.1生态资源状况 (5) 4.2环境质量现状 (6) 4.3生态环境问题 (6) 4.4生态环境保护规划 (7) 5.效益分析 (9) 5.1生态效益 (9) 5.2经济效益 (9) 5.3社会效益 (9) 6.规划实施的保障措施 (9) 6.1政策法规保障体系 (10) 6.2组织机构与管理保障体系 (10) 6.3文化教育和社会监督体系 (11) 6.4资金筹措与投资保障体系 (11) 6.5实施手段与技术保障体系 (12) 6.6决策支持信息系统体系 (12)

1.总论 1.1任务的由来 随着经济的迅速发展,以及城市的逐渐扩张,我国进入了一个中国城市化和城市高速发展的关键时期。而小城镇的发展在我国城市化进程中,正在发挥着越来越重要的作用。自1998 年党的十五届三中全会确定了“小城镇,大战略”的方针后,党的十六大又进一步把“加快城镇化进程,全面建设小康社会,走中国特色的城镇化道路”作为战略目标。“建立和谐社会,达到全社会的和谐发展”,是党的十六大报告提出的一个新的重要思想。党的十六届四中全会明确提出构建社会主义和谐社会的新命题,进一步深化和拓展了“社会更加和谐”这一思想。加快统筹城乡发展的步伐,解决“三农”问题,切实保护广大农民的利益是构建社会主义和谐社会的一个重要方面,而加快发展小城镇则是统筹城乡、解决“三农问题”、构建和谐社会的关键之一。积极有序地发展小城镇,不仅是加快城市化进程的需要,而且已成为我国国家发展战略的重要组成部分。 1.2编制的依据 城市规划5个阶段,如果按编制规划的话可以说是:纲要、总体规划(城镇体系规划)、分区规划,修建性详细规划,控制性详细规划。 编制这5个阶段的规划的依据个不一样。当然首先都是以国家颁布实施的法律法规、方针政策为依据,城镇总体规划主要有: ⑴《中华人民共和国城乡规划法》 ⑵《中共中央国务院关于促进小城镇健康发展的若干意见》 ⑶《全国生态环境保护纲要》 ⑷《国民经济和社会发展纲要》 ⑸《国家环境保护“十二五”规划》 ⑹《河北省建制镇总体规划编制导则》 ⑺《保定市志》 ⑻《保定市城市总体规划(2008—2020年)》 ⑼《保定市土地利用总体规划(2010-2020)》 ⑽《五尧乡国民经济统计资料及城建资料》 ⑾《五尧乡各类专业部门提供的规划基础资料》 1.3规划指导思想 本规划以生态化、集约化、市场化为理念,坚持突出五尧乡特色的原则,城乡经济和空间布局一体化发展的原则,土地使用集约化原则,规划弹性灵活的原则和建设精品化的原则。充分发挥城镇规划对城镇发展建设的战略性、前瞻性、综合性指导作用。 贯彻可持续发展战略,坚持环境与发展综合决策,努力解决小城镇建设与发展中的生态环境问题;坚持以人为本,以创造良好的人居环境为中心,加强城镇生态环境综合整治,努力改善城镇生态环境质量,实现经济发展与环境保护“双赢”。 1.4规划原则 ⑴区域协同发展的原则 融入区域环境,实现持续发展。五尧乡的发展必须在区域的框架内明确自身定位,发挥自身优势,实现快速发展。从广域范围内分析五尧乡的发展,增强规划的区域观念和整体竞争力,积极融入保定市新一轮发展之中,谋求以大区域为背景的城镇整体发展。

数据挖掘实验报告一

数据预处理 一、实验原理 预处理方法基本方法 1、数据清洗 去掉噪声和无关数据 2、数据集成 将多个数据源中的数据结合起来存放在一个一致的数据存储中 3、数据变换 把原始数据转换成为适合数据挖掘的形式 4、数据归约 主要方法包括:数据立方体聚集,维归约,数据压缩,数值归约,离散化和概念分层等二、实验目的 掌握数据预处理的基本方法。 三、实验内容 1、R语言初步认识(掌握R程序运行环境) 2、实验数据预处理。(掌握R语言中数据预处理的使用) 对给定的测试用例数据集,进行以下操作。 1)、加载程序,熟悉各按钮的功能。 2)、熟悉各函数的功能,运行程序,并对程序进行分析。 对餐饮销量数据进统计量分析,求销量数据均值、中位数、极差、标准差,变异系数和四分位数间距。 对餐饮企业菜品的盈利贡献度(即菜品盈利帕累托分析),画出帕累托图。 3)数据预处理 缺省值的处理:用均值替换、回归查补和多重查补对缺省值进行处理 对连续属性离散化:用等频、等宽等方法对数据进行离散化处理 四、实验步骤 1、R语言运行环境的安装配置和简单使用 (1)安装R语言 R语言下载安装包,然后进行默认安装,然后安装RStudio 工具(2)R语言控制台的使用 1.2.1查看帮助文档

1.2.2 安装软件包 1.2.3 进行简单的数据操作 (3)RStudio 简单使用 1.3.1 RStudio 中进行简单的数据处理 1.3.2 RStudio 中进行简单的数据处理

2、R语言中数据预处理 (1)加载程序,熟悉各按钮的功能。 (2)熟悉各函数的功能,运行程序,并对程序进行分析 2.2.1 销量中位数、极差、标准差,变异系数和四分位数间距。 , 2.2.2对餐饮企业菜品的盈利贡献度(即菜品盈利帕累托分析),画出帕累托图。

数据挖掘实验报告1

实验一 ID3算法实现 一、实验目的 通过编程实现决策树算法,信息增益的计算、数据子集划分、决策树的构建过程。加深对相关算法的理解过程。 实验类型:验证 计划课间:4学时 二、实验内容 1、分析决策树算法的实现流程; 2、分析信息增益的计算、数据子集划分、决策树的构建过程; 3、根据算法描述编程实现算法,调试运行; 4、对所给数据集进行验算,得到分析结果。 三、实验方法 算法描述: 以代表训练样本的单个结点开始建树; 若样本都在同一个类,则该结点成为树叶,并用该类标记; 否则,算法使用信息增益作为启发信息,选择能够最好地将样本分类的属性; 对测试属性的每个已知值,创建一个分支,并据此划分样本; 算法使用同样的过程,递归形成每个划分上的样本决策树 递归划分步骤,当下列条件之一成立时停止: 给定结点的所有样本属于同一类; 没有剩余属性可以进一步划分样本,在此情况下,采用多数表决进行 四、实验步骤 1、算法实现过程中需要使用的数据结构描述: Struct {int Attrib_Col; // 当前节点对应属性 int Value; // 对应边值 Tree_Node* Left_Node; // 子树 Tree_Node* Right_Node // 同层其他节点 Boolean IsLeaf; // 是否叶子节点 int ClassNo; // 对应分类标号 }Tree_Node; 2、整体算法流程

主程序: InputData(); T=Build_ID3(Data,Record_No, Num_Attrib); OutputRule(T); 释放内存; 3、相关子函数: 3.1、 InputData() { 输入属性集大小Num_Attrib; 输入样本数Num_Record; 分配内存Data[Num_Record][Num_Attrib]; 输入样本数据Data[Num_Record][Num_Attrib]; 获取类别数C(从最后一列中得到); } 3.2、Build_ID3(Data,Record_No, Num_Attrib) { Int Class_Distribute[C]; If (Record_No==0) { return Null } N=new tree_node(); 计算Data中各类的分布情况存入Class_Distribute Temp_Num_Attrib=0; For (i=0;i=0) Temp_Num_Attrib++; If Temp_Num_Attrib==0 { N->ClassNo=最多的类; N->IsLeaf=TRUE; N->Left_Node=NULL;N->Right_Node=NULL; Return N; } If Class_Distribute中仅一类的分布大于0 { N->ClassNo=该类; N->IsLeaf=TRUE; N->Left_Node=NULL;N->Right_Node=NULL; Return N; } InforGain=0;CurrentCol=-1; For i=0;i

相关主题
文本预览
相关文档 最新文档