当前位置:文档之家› 《新媒体数据分析与应用》教学大纲

《新媒体数据分析与应用》教学大纲

课程教学大纲

(一)课程定义
XXXXXXX专业开设的一门重要的专业核心课程。本课程主要讲
聚类分析等内容。通过学习,使学生理解新媒体数据分析的基本流程,掌握新媒
熟悉新媒体数据分析成果的表达;掌握新媒体数据分析的基
SPSS Modeler


XXXXX学院XXXXX专业本科人才培养方案》(XXXX版)编写。
(三)目的任务
使学生了解现代数据分析和知识挖掘方法的思想与技术,了解数据分
SPSS Modeler实现数据分析和挖

学时数与学分数:本课程理论36学时,实践/实验36学时,共72学时,4学分。
XXXX专业, 二年级学生。
六)课程编码:KY1810C07

教 学 安 排 小计
讨论 实验 实践
数据分析和Modeler使用概述 2 2 4
数据读入和数据集成 4 4 8
数据理解和数据准备 4 4 8
基本分析和数据精简 4 4 8
决策树和人工神经网络 6 6 12
支持向量机和贝叶斯网络 4 4 8
聚类分析 6 6 12
关联分析 4 4 8
动 2 2 4
计 36 36 72

数据分析和Modeler使用概述
数据分析的产生背景

什么是数据分析

Modeler软件概述
Modeler的数据流、窗口、数据流的基本管理
数据读入和数据集成
变量类型

读入数据
Excel电子表格、读SPSS格式文件、读数据库文件
生成实验方案

数据集成

数据质量的评估和调整
数据质量的评估和调整
数据的基本特征与质量评价报告、离群点和极端值的调整、数据质量管理
数据的分类汇总

变量变换
CLEM表达式、变量值的重新计算、变量类别值的调整
数据精简

基本分析和数据精简
数值型变量的基本分析

两分类型变量相关性的研究

特征选择

因子分析

决策树和人工神经网络
决策树算法概述

Modeler的C5.0算法及应用
C5.0决策法的生长算法、修剪算法、基本应用示例
人工神经网络算法概述

Modeler的BP反向传播网络的应用

支持向量机和贝叶斯网络
支持向量分类的基本思路

支持向量机的应用

贝叶斯方法基础

贝叶斯网络的应用
TAN贝叶斯网络的案例
聚类分析
聚类分析的一般问题

Moderler的K-Means聚类及应用
K-Means对“亲疏程度”的测度、K-Means聚类过程、应用示例
Modeler的两步聚类及应用

基于聚类分析的离群点探索

关联分析
简单关联规则及其有效性

Modeler的Apriori算法及应用
Apriori算法的应用示例
Modeler的序列关联及应用
Sequence算法、序列关联的时间约束

平时考核、平时实践考核与期末综合测试相结合。
:平时成绩与期末课程作业按5:5的比例计算本课程的总成绩。

、《数据分析与数据挖掘》,喻梅、于健主编,清华大学出版社,2018年3月第1版

、《基于SPSS Modeler的数据挖掘》,薛薇主编,中国人民大学出版社,2014年10月
2版
、《新媒体数据分析:概念、工具、方法》,勾俊伟、哈默、谢雄主编,人民邮电出版
2017年11月第1版
执笔人: 审批人: 年 月 日

相关主题
文本预览
相关文档 最新文档