当前位置:文档之家› EpiData使用手册

EpiData使用手册

目录

一、EpiData2.0软件的安装 (3)

1.EpiData2.0软件介绍 (3)

2.EpiData2.0软件的组成 (3)

3.EpiData2.0软件的安装 (3)

4.EpiData2.0软件汉化文件的安装 (5)

5.数据文件Data的安装 (5)

6.EpiData2.0软件的启动 (5)

二、EpiData2.0软件的功能 (6)

1.工具条 (6)

2.快捷键 (7)

3.调查表文件(.qes)的制作 (7)

EpiData编辑器 (7)

字段选取清单 (8)

变量符号编写器 (8)

数据表格式预览 (9)

变量命名法 (9)

自动变量命名规则 (10)

第一单词作为变量名 (11)

变量标记 (11)

自动缩进 (12)

字段输入框对齐 (12)

4.创建.REC数据文件和修改数据结构 (13)

4.1 如何创建.rec数据文件 (13)

4.2 数据文件的修改 (13)

5. .REC数据文件的追加与合并 (15)

5.1 数据文件的追加 (15)

5.2数据文件的合并 (16)

6. EpiData中的字段类型 (17)

6.1 自动编码变量 (17)

6.2 数值型变量 (17)

6.3 字符型变量 (17)

6.4 大写字符型变量 (17)

6.5 布尔变量 (17)

6.6 日期型变量 (17)

6.7 今天型日期字段 (18)

Soundex型变量 (18)

6.9 隔位符 (18)

7. 编辑.CHK核查文件及核查文件命令和函数 (19)

7.1 增加/更改核对命令 (20)

7.2 使用编辑器产生核查文件 (23)

7.3 核查文件的核对命令 (24)

7.4 操作符和函数 (38)

8. 数据的录入 (43)

8.1字段间移动 (43)

8.2 记录间移动 (44)

8.3 查找记录 (44)

8.4 过滤器 (45)

8.5 数据双录入和有效性检查 (45)

8.6 关于数据文件 (46)

9. 数据输出 (47)

9.1 数据备份 (47)

9.2数据文件转成dBase III格式 (47)

9.3 数据文件转成Excel格式 (48)

9.4 数据文件转成Stata文件 (48)

9.5 将数据转成文本文件 (48)

三、EpiData 2.0软件与EpiInfo的兼容性 (49)

1.在数据文件中的不同 (49)

2.检查文件中的区别 (49)

四、结束语 (50)

EpiData2.0软件使用指南

一、EpiData2.0软件的安装

1. EpiData

2.0软件介绍:

EpiData 软件是在EpiInfo 6.0软件基础上开发研制的。EpiData 是一个关于数据输入的程序,编写这个程序的目的是教会普通用户如何将一张调查表“计算机化”,使得数据输入工作变得很容易。它的基本设计思想是帮助用户生成较好的原始数据供以后分析使用。它是通过准确对调查表的每一个字段(变量)进行定义而达到的,例如一个变量是数字变量,只能输入数字而不能输入字符。EpiData 还提供方便的方法确定每个变量的有效性范围,例如上述数字变量只可以输入1, 2或3。

与DOS版本的EpiInfo6.0软件比较,EpiData 软件使操作过程更加简单化。它是将数据录入、数据核对、数据管理和数据报告融为一体,使调查资料信息的计算机录入工作更加方便。该软件不但可以对数据录入过程的错误进行核对,而且可以在数据录入完成后对数据进行核对,为数据的分析阶段提供尽可能最准确的数据。

EpiData 由三种基本文件组成:

(1) .QES文件(调查表文件), 它的作用是定义调查表(问卷)的结构。

(2) .REC文件(数据文件), 它包括数据以及已经定义好的编码,是录入和存储数据的。

(3) .CHK文件(数据录入核查文件), 它包括数据输入变量的有效性规则。

EpiData 2.0软件本身不具有数据的分析功能,但它具有较强的数据转换功能,由该软件建立并存储的数据文件(.REC文件),可通过该软件转化为其它六种数据文件类型,包括.dbf、Excel、SAS、SPSS、STA TA、.TXT的数据格式,供您进行数据整理与分析。由美国CDC 推出的EpiInfo6.0软件可直接对数据进行分析。可喜的是,Windows版本的EpiInfo 2000软件可以对EpiData软件录入的数据文件进行统计分析,使得.REC类型的数据文件统计分析界面更加人性化,操作更为简单。

2. EpiData2.0软件的组成:

EpiData 2.0软件由两张软盘组成。EpiData为:

EpiData2.0软件,在一张标有“EpiData2.0软件”的软

盘中;epdlang_cn为:EpiData2.0软件的汉化文件;Data

为:寄生虫调查表文件,在一张标有“数据文件Data”的软盘中。另有一备份的Data文件夹,含有需要的63个文件。

3. EpiData2.0软件的安装:

3.1将标有EpiData2.0软件的软盘插入软驱,双击“我的电脑”。

3.2 双击“3.5寸软盘”,如右图。

3.3双击如右图所示的EpiData图标,可看到如下图的对话框,此时默认的安装

路径为“D:\EpiData\”,如果需要更改路径,可在路径框中输入更改后的路径或

点击“浏览”按钮查找正确的路径。

3.4点击“安装”按钮,软盘上的文件进行复制并安装,这需要一定的时间等待。

3.5现在可以看到在蓝色安装背景下出现安装对话框,点击下方的“Next”按钮,此时换了一个对话框,再点击“Next”按钮,对话框中出现安装路径,如右下图,一般需要默认安装,默认安装路径为:C:\Program Files\Data 2.0。连续点击“Next”按钮,一共需要连续五次

点击“Next”按钮。此时出现一系列的安装过程,片刻后,出现一个新的对话框,点击下方的“Finish”按钮,完成EpiData2.0软件的安装。

4. EpiData2.0软件汉化文件(epdlang_cn)的安装:

将含有epdlang_cn文件的另一张软盘插入软驱,双击“我的电脑”,双击“3.5

寸软盘”,双击“epdlang_cn”图标,出现如3.3的对话框,默认安装路径为:

C:\Program Files\Data 2.0\ ,点击“安装”按钮,即可完成汉化文件的安装。

5. 数据文件Data的安装:

将标有“数据文件Data”的软盘插入软驱,双击“我的电脑”,双击“3.5寸

软盘”,双击“Data”图标,出现如3.3的对话框,默认安装路径为D:\EpiData\ ,

点击“安装”按钮,即可完成数据文件的安装。此时一个含有63个文件的Data

文件夹被复制在D:\EpiData\ 路径下。

或直接将“数据文件Data”的软盘中的Data文件夹直接复制到D:\EpiData\ 路

径下即可。

注意:如果你安装数据文件时改变了默认路径,需要在EpiData2.0软件启动

后,在“文件”菜单下选择“打开文件”选项打开biao1.chk文件更改倒数第四行语句:RELATE CODE d:\parasite\data\biaoone.rec中的路径为实际安装路径。否则会出错。

6. EpiData2.0软件的启动:

从桌面的“开始”按钮可找到EpiData2.0,如上图,将鼠标对准其中的“EpiData2.0”倒三角形标

志,按鼠标右

键,出现一个

下拉菜单,移

动鼠标使光标

对准“创建快

捷方式(S)”,

按鼠标左键,出现“EpiData2.0(2)”图标,光标对准它按住鼠标左键不要松开,将其拖放到桌面,此时就在桌面出现了EpiData2.0(2)的图标。

双击桌面上的“EpiData2.0”图标或单击开始菜单下EpiData2.0图标都可进入EpiData2.0程序,如下图所示,出现欢迎画面,点击下面的“关闭”按钮开始进入工作状态。

二、EpiData2.0软件的功能

1. 工具条

EpiData 2.0程序启动后的窗口如下图所示,除了下拉菜单外,在程序窗口上部还设立一个工具条, 它包括“工作过程工具条”和“编辑工具条”,在工具条上所显示的功能都能利用菜单来实现,其中一个或两个可以隐藏。这可以通过使用鼠标的右键选择或从“窗口设置/工具条”下拉菜单中选择相应工具条是否显现,在同样的菜单中会发现一个功能“数据输入中隐藏工具条”,当选择它时,对核对项使用“添加/修改”功能时工具条会自动隐藏。

2. 快捷键

编辑增加/更改核对命令

当焦点在数据表中的一个变量时:

CTRL+N 打开一个新的编辑器

CTRL+O 打开一个已存在的.qes文件CTRL+S 保存.qes文件(而不关闭窗口)CTRL+P 打印窗口编辑器的内容

CTRL+A 选择全部文本

CTRL+C 将选择文本复制到剪贴板CTRL+X 将选择文本剪切到剪贴板CTRL+V 粘贴

CTRL+Z 取消上步操作

CTRL+G 转至行(提示行号)

CTRL+F 查找文本

CTRL+R 查找和替换文本

CTRL+Q 显示变量快速显示清单

CTRL+T 数据表预览CTRL+Home 选择第一个变量

CTRL+End 选择最后一个变量

F5 转至核查功能窗口

CTRL+→转至核查函数窗口

CTRL+L 编辑范围及合理值

CTRL+J 编辑跳转

CTRL+E 双态必须输入Yes 和No

CTRL+R 双态重复Yes 和No

CTRL+A 编辑数值标记

CTRL+D 对当前变量编辑所有核查项CTRL+C 将当前所有检查项复制到剪贴板中CTRL+X 将当前所有检查项剪切到剪贴板中CTRL+V 将剪贴板内容插入检查项

ALT+S 将核查文件存盘

ALT+D 编辑当前变量的所有核查项

ALT+X 退出增加/更改检查项

数据录入增加/更改核对命令

当焦点是在核查编辑窗口时:

CTRL+N 新建记录

SHIFT+Delete 标记记录作为删除记录CTRL+PgUp 显示前一个记录

CTRL+PgDn 显示下一个记录

CTRL+ALT+Home 显示第一个记录CTRL+ALT+End 显示最后一个记录CTRL+Home 转至第一个变量为当前记录

CTRL+End 转至最后一个变量为当前记录

CTRL+G 转至指定号记录

CTRL+F 根据当前变量内容查找记录

F3 继续查找

CTRL+ ←移动数据表至左边界

F9 或数字“+”键打开合理值清单

F8 打开数据录入记录F5 转至数据表窗口

CTRL+ ←转至数据表窗口

Enter 转至下一个核查

↑转至前一个核查

↓转至下一个核查

CTRL+↑将前一个变量作为当前变量CTRL+↓将下一个变量作为当前变量ALT+S 保存核查文件

ALT+D 编辑当前变量所有核查项ALT+X 退出增加/更改检查项

3. 调查表文件(.qes)的制作

3.1 EpiData编辑器

在EpiData中包括了一个编辑器,它主要用于生成调查表文件(.QES文件),该编辑器的界面用户应当很熟悉,因为它使用标准的Windows 9x功能。然而在这个编辑中有三个特殊

的功能,这是其它程序中没有的。即:快速字段选取窗口、编码编辑器、数据表格式预览。

3.2字段选取窗口

快速字段类型提取清单

显示了在EpiData中所有可

以使用的变量类型,当快速

变量类型选取窗口打开时,

你可以选择一个变量类型插

入当前编辑窗口光标所在位

置,变量类型的选择首先选

取类型页,再设置该变量的

属性,最后按插入键或回车

键。

打开快速变量类型选取

窗口有三种方法:(1)直接按

CTRL+Q键;(2)在编辑工具

条上按“选择字段类型”按

钮;(3)在“编辑”菜单中选

择“字段选取窗口”选项。

要想从编辑器窗口移到快速变量类型提取清单窗口可按CTRL+Q键。退出“快速变量类型选取窗口”可以:(1)按关闭图标按钮(×);(2)在“编辑”菜单中去掉“字段选取窗口”选项;(3)按Ctrl+F4键。

3.3编码编辑器

编码编辑器也称为变量

符号编写器,它是一个工具,

使用它可较方便在一个调查

表中输入变量符号。如果变

量符号编写器已打开,某些

字符被解释为变量编码的开

始,而变量符号编写器在将

编码写入.QES文件前,或结

束编码或要求进一步给出变

量的长度。例如你输入字符

# ,变量符号编写器认为这是一个数字变量的开始,它将提示你输入数字变量的长度,当你输入了长度后,变量符号编写器将在当前编辑器的当前光标位置插入数字变量符号。

以下的字母组合将被变量符号编写器处理为:

# 数字变量。提示用户输入变量的长度,输入5可产生5位整数变量;输入5.2或5,2产生浮点变量小数点前有5位整数小数点后有两位小数(#####.##)。

_ 文本变量。提示用户输入变量的长度。

打开或关闭变量符号编写器可以用:(1)按CTRL+W键;(2)在编辑工具条中按“编码编辑器”按钮;(3)在“编辑”菜单选择“编码编辑器”。

按CTRL+Q将打开字段选取窗口关闭变量符号编写器,反之亦然。

注意:编辑中文时,一定首先在“文件”菜单下的“选项”中设置需要的中文字体。打开一个.qes调查表文件时,有时出现乱码现象,说明选择的字体不正确,这也需要如上述操作设置中文字体。

3.4 数据表格式预览

数据表格式预览功能显示当数据输入时调查表的格式但不产生数据文件(.REC文件)。

在数据表格式预览时所显示的变量与实际数据输入时相同。但核查功能不起作用,因为数据文件尚未产生。

在打算运行一个新的数据表预览时,没有必要关闭当前的数据表预览窗口。

当计算机处于编辑显示调查表状态时, 要想预览数据表可以有以下方法:(1)按CTRL+T键;(2)在编辑工具条中按“数据表预览”按钮;(3)在“数据文件”菜单选择“数据表预览”;(4)按鼠标右键,在弹出菜单中选择“数据表预览”;(5)在工作过程工具条上“生成数据文件”按钮时选择“数据格式预览”选项。

3.5 变量命名法

在数据表中输入变量名可根据调查表文件的上下文自动产生。

在EpiData中可用两种变量命名方法:

(1) 用“问题”(即字段左面的文本)中的第一个单词作为变量名。

(2) 按照Epi Info 所使用的规则给变量自动命名。

至于使用哪一种方法取决于在“文件/选项/生成数据文件”选项卡中进行选择。

注意:EpiData 所产生的变量名的最大长度为8个字符,而Epi Info 6 的变量名最大长度是10个字符。一般情况下这将不会引起问题,因为EpiData 可以读入Epi Info的变量名长度是10个字符的文件,但是当使用Epi Info "修改.REC文件" 功能时会出现问题。

3.6自动变量命名规则

如果在“文件”菜单下选择“选项”,在“生成数据文件”的选项卡中选择“自动添加文件名”时,EpiData 将根据变量的“问题”(即输入字段左面的文本)自动产生一个变量名,变量名是以英文字母(A-Z)开始,最长8个英文字符。其它国际字符将被跳过,变量名的产生由变量“问题”开始字母决定。

在产生变量名时遵守下面的规则:

1. 在普通文本中优先选择用大括号括进的文本。例如:如果“问题”是{my} first {field}那末变量名将为MYFIELD。

2. 通用常见单词会被跳过(如what、the、of 等)。例如:what did you do? 产生的变量名为YOUDO。

3. 如果字段前没有“问题”文本(无提示符),则变量名取前一个变量名后再加上一个

数字;例如:

前一个变量

名是d MY

变量,那末

下一个变量

(如果没有

“问题”文

本)就是 d

MYFIELD1

;如果前一

个变量是 d

V31 则下

一个变量名

就是d V32;

如果不存在

前一个变量

名则使用默

认变量名

FIELD1。

注意:对于中文提示符来说,EpiData认为无提示符,命名要按该规则进行。

4. 如果“问题”第一个字符是数字,则在第一个字符前插入一个字母N。例如3 little mice 产生的变量名N3LITTLE。

5. 变量名的大小写在“文件/选项/生成数据文件”菜单下的选择项进行设置。

例如:

问题(提示符)产生达到变量名运用的规则State your {nation}ality NA TION 规则1

Al{L} you I{i}ke is i{ce}cream LICE 规则1

What is your name ISYOURNA 规则2

3. 年龄N3QUESTI 规则4

3.7 第一单词作为变量名

如果在“文件”菜单下选择“选项”,在“生成数据文件”的选项卡中选择“用调查表第一个词命名”时, 则用输入字段左面的文本的第一个单词作为输入变量名,如果这个单词超过8个字符就使用前8个字符作为变量名。

例如,在以下行中:

v1 Enter age of patient ###

在.QES文件中定义了3位整数的变量,如果选择了“用调查表第一个词命名”选项,变量名就是"v1"。

又如在下面一行中:

Enter age of patient ###

产生的变量名将是“Enter”。在这种情况下适宜于使用“自动添加文件名”功能。如果一个字段名已经使用,当这个字段名再出现时产生的变量中会增加一个数字作为字段名。

例如:在一个调查表中有下列两行:

v1 Enter age of patient ###

v1 Heigth of patient ###

这将产生2个3位整数的字段,第一个字段名将是“v1”,而第二个字段名将是“v2”,尽管实际上在第二行第一个单词是"v1"。

在使用“用调查

表第一个词命名”选

项时,最好使提示符

能反映该问题的实际

意义,一种简单的检

查采用何种变量命名

方法的操作是用“工

具”菜单下的“更改

变量名”查看变量名,

以确定采用的变量命

名规则。请试着在编

辑器中输入上述两

行,然后用“数据文

件”菜单或按Ctrl+T

选择“数据表预览”,

检查一下产生的字段

名。

字段名的大小写

取决于“文件/选项/生

成数据文件”菜单下

选择项的设置。见上

页图示。

3.8 变量标记

变量标记是对数据字段内容的一种描述。在Epidata中变量标记是自动产生的,它取决于.QES文件中输入字段左面的文本(提示符)内容。

如果设置“用调查表第一个词命名”,那末变量标记将是字段左面文本内容,而不包括用作字段名的第一个单词。

提示:中文的问题(提示符)虽然不能作为变量名,但是可以自动生成变量标记。

例如:

v1 Age of patient ###

如果设置“用调查表第一个词命名”,“v1”作为字段名,而“Age of patient”是变量标记。

如果设置为“自动添加文件名”,字段名将是“v1ageofp”,而变量标记就是“v1 Age of patient”。

3.9自动缩进

如果在Epidata中使用编辑器并选择文本缩进选择项,下一行将自动按前一行缩进,这在使用编辑器产生检查文件(.CHK)时非常有用。这个功能可在“编辑”菜单下选择“自动缩进”实现。

3.10 字段输入框对齐

在编写.QES文件时,使用编辑器时可能要使用“字段对齐”的功能。将光标放在含有输入字段的行,在“编辑”菜单下选择“字段对齐”。

对齐输入字段框的结果取决于字段命名选项的设置,参看“3.6自动变量命名规则”。如果选“用调查表第一个词命名”,则以下行为:

将变成为:

v1 A small 文本#### v1 A small 文本####

v2 Other 文本 v3 ###.# v2 Other文本 v3 ###.#

v3 文本### v3 文本###

在调用“字段对齐”功能前,将光标放在v1行。

如果字段命名设置为“自动添加文件名”结果为:

v1 A small 文本####

v2 Other 文本 v3 ###.#

v3 文本###

使用了这个功能,数据输入表将变得更加清晰可读。

4. 创建.REC数据文件和修改数据结构

4.1 如何创建.rec数据文件

创建数据文件有以下三种方法:

(1)在“数据输入/输出”菜单下选择“根据QES文件产生数据文件”选项,出现一个“由QES文件生成数据文件”对话框,选好调查表文件后,按“确定”按钮产生。

(2)在工作过程工具条按第二个按钮,即:“2.产生数据文件”按钮,过程同上。

在创建数据文件前,没有必要打开一个调查表文件.QES文件,如果在编辑器中没有打开的.QES文件,将出现一个选择文件对话框,选择一个.QES文件后可产生一个相应的数据文件,默认状态下数据文件.REC的名称和调查表文件.QES的名称相同,扩展名不同。建议使用相同的变量名称。数据文件将把.QES文件名作为默认文件名,只是后缀是.REC而不是.QES。但这不是必须的,只是推荐这样命名数据文件。

注意:在“文件/选项/生成数据文件”中的选项设置决定了生成数据文件中的字段名。参看“3.5 字段命名法”。

在选择了数据文件名后, 还可选择输入一个50个字符以内的关于数据文件的简单描述,这叫做“数据文件标记(标签)”,“数据文件标记”将作为数据文件的一部分而显示。参看“8.6中的数据文件信息”。可在“文件”菜单下选择“数据文件提示”选项时或按F5键显示出来。当数据转出为Stata文件时它将作为数据文件的一部分被存储。你会发现EpiInfo中的一些命令不能读取带标记的数据文件。建议你验证一下数据标签是否引起错误,如果引起错误则不要制定数据标记。编辑数据文件标记的方法见8.6中的“数据文件标记”。

在数据文件生成前可以进行预览。方法是在编辑窗口中打开一个.QES文件,选择“数据表预览”按钮或在“数据文件”菜单下选择“数据表预览”或按Ctrl+T键。

注意:如果在产生一个新的数据文件时使用了一个与原来数据文件相同的名字,则原来的数据文件将被覆盖,数据也将丢失。所以在修改数据文件时, 可以增加一个字段或改变字段类型, 这样才保证不丢失数据,参看:“4.2 数据文件的修改”。

4.2 数据文件的修改

对一个已经包含数据的数据文件也可以进行修改而不丢失数据。已经输入的数据可以拷贝到一个新的表中,只要新表具有同样的字段名。你还可以通过增加字段, 改变字段的定义或删除字段的方法修改。这个功能可从主菜单(首先关闭所有文件)下选择“工具/根据修改的调查表更新数据文件”选项来实现。见下页图示。

可以按如下步骤修改数据文件:

(1)打开定义该数据文件的.QES文件,然后修改它,如果.QES文件不存在,则在“工具”菜单中选择“根据数据文件产生调查表”。

(2)编辑.QES文件。即:增加新字段、去除字段、改变字段类型。

(3)存储.QES文件并关闭文件。

(4)在“工具”菜单中选择“根据修改的调查表更新数据文件”,选择“修改的.QES文件名”和“被修改的数据文件”,按“确定”按钮。

注意:如果你删除了某个字段或改变了字段名(改变输入字段框左面的文本),数据将会丢失!请仔细检查修改的数据文件。如果发现错误,原始数据文件可以恢复,原始文件被保存为名称是old.rec的文件,并且放在与新文件同一目录中。

EpiData 支持两种根据.QES文件对字段命名的方法。请看“3.5 字段命名法”。至于选用哪种方法取决于“文件”菜单下的“选项”的设置。如果改变了命名方法就意味着改变了字段名,这可能导致数据的丢失。

特别注意:Epi Info 6 产生的字段名最多可以是10字符,而EpiData最多只有8个字符。这是在EpiData中修改数据唯一需要注意的问题。如果在EpiInfo中有字段名比8个字符长,请一定使用Epi Info 6 来修改数据。

在修改数据文件时,计算机将检查数据文件使用何种变量命名系统,如果它与系统的选择项设置不相同,将给出警告信息,并建议使用原始数据文件所使用的变量命名系统。

原始数据文件的字段类型可以修改,方法是首先在修改.QES文件时修改字段类型,然后修改数据文件。

所有字段类型都可以改变成文本字段或大写文本字段。

数字字段可以改变小数点位数,但不能将两位小数的浮点变成整数,否则会丢失数据。

在原始数据文件中数据类型可以改变为:

整数浮点, 文本, 大写文本

浮点浮点具有相同小数点数或更多文本, 大写文本

IDNUM 整数, 浮点, 文本, 大写文本

文本大写文本

大写文本文本

日期(dd/mm/yyyy) 今天日期(dd/mm/yyyy) , 文本, 大写文本

日期(mm/dd/yyyy) 今天日期(mm/dd/yyyy) , 文本, 大写文本

今天日期(dd/mm/yyyy) 日期(dd/mm/yyyy) , 文本, 大写文本

今天日期(mm/dd/yyyy) 日期(mm/dd/yyyy) , 文本, 大写文本

Soundex型文本, 大写文本

5. .REC数据文件的追加与合并

5.1 数据文件的追加

数据文件的追加(Append)用来连接数据结构相同或相似的两个.REC数据文件。在“数据输入/输出”菜单下选择“追加/合并数据文件”选项时会出现一个对话框,选择需要连接

的两个文件后按“确定”按钮。这时出现的对话框会显示要连接的两个数据文件的一般情况,下面有两个选项框,“追加”和“合并”。在“追加”选项框中有两个选项,选择“只追加在

数据文件A和数据文件B同时存在的字段中的数据”选项,或者选择“追加数据文件B中所有字段的数据”选项后,在“结果数据文件”框中键入连接后的新文件路径及名称后按“追加”按钮,操作过程中两个文件不发生任何改变。两者新生成的数据文件结果为:(1) 新生成的数据文件和第一个原始文件A的结构相同,第二个数据文件B只有和第一个文件A中相同的变量才追加到第一个文件中形成新的数据文件。(2) 新生成的数据文件中包含第一个数据文件A和第二个数据文件B中的所有变量。

注意:第一个数据文件A为主数据文件,如果第一个数据文件A和第二个数据文件B 的变量类型不同,新生成的文件中以第一个文件为准。如果第一个数据文件A和第二个数据文件B都有.CHK核对文件,会自动把两个核对文件合成一个核对文件,我们应根据需要对新的核对文件进行修改。特别要注意labels、jumps、goto及if…then…endif等语句。

5.2数据文件的合并

数据文件合并(Merge)可以使两个数据库结构不同的两个数据文件进行横向连接,但前提条件是这两个数据文件中必须有相同的标示变量或关键变量。例如一个文件中包含调查对象的家庭情况,而另一个文件中包含调查对象的实验室检查数据,但两个文件中都有一个相同变量来区别不同的调查对象,比如个人编号等。这时就可以把两个文件合并。

在上述“追加/合并数据文件”对话框中选择“合并”选项框,会出现两组共四个选项

按钮,还有一个“选择关键字段”文本框,同样在合并操作过程中两个原始文件不发生任何改变。

数据文件合并需要用户指定一个或多个标示变量来保证同一个调查对象的数据连接。将指定的标示变量输入到“选择关键字段”文本框中。最多可指定3个标示变量,标示变量不必非要指定为“KEY”或者“KEY UNIQUE”这样的模式,但是必须保证它在两个文件中都存在。当选择“合并”后,计算机会把两个文件中的变量显示出来,如果没有共同变量,合并将不能实现。另外,标示变量在数据文件中不能有重复。

选择项目不同会生成不同的新文件,主要方式为:(1)只有两个原始文件都存在的记录进行了连接。(2)两个原始文件中的数据都连接起来,这会导致很多变量的值为缺失值,因为两个数据文件中不匹配的记录不能进行连接。为了保证连接成功,两个原始文件中必须含有相同的字段。合并完成后计算机会显示一个有关文件连接的总结。

注意:和数据文件的追加情形一样,如果第一个数据文件A和第二个数据文件B都

有.CHK核对文件,会自动把两个核对文件合成一个核对文件,我们应根据需要对新的核对文件进行修改。特别要注意labels、jumps、goto、及if…then…endif等语句。

6. EpiData中的字段类型

变量类型实例变量类型实例

自动编码变量(ID号)

日期型变量

(欧洲型)

数值型变量(数字字段) ### ###.## (美国型)字符型变量(文本字段) ___ _________ 当前日期变量 大写型字符变量 Soundex型变量

是否型变量(布尔字段) 隔位符(制表编码) @

6.1 自动编码变量(ID 号)

IDNUM型变量是一个数值型变量,其值由计算机自动生成。其赋值原则是随着每一条记录的输入,变量值加1。在数据录入过程中它的值不能手动修改,只能自动增加。该变量的初始值默认时为1,用户可以在“文件”菜单下“选择项”中的“高级设置”中进行设置。

6.2 数值型变量(数字字段)### ###.##

数字字段允许输入数字,负号和小数点。它能接受从0到9的数字,数值可以是整数也可以是小数。一个“#”号代表一位数,用户可以根据需要定义所需的数值位数,但包括小数点在内最大为14个字符长。无论在.QES文件中和数据输入中小数点(.) 与逗号(,) 都认为是小数点,而且在一个字段中只允许有一个小数点,这意味着不能使用“千”位分隔号。

6.3 字符型变量(文本字段)_ ______ _________

下划线字符的个数定义了文本字段的长度,文本字段接受所有字符,最大字符字段的长度为80个字符。注意:中文的每个字占2个字符长。

6.4 大写字符型变量(大写文本字段)

大写文本字段接受所有字符, 但计算机将把他们转换成大写形式,字段的长度由< 和> 间的字符数决定,包括大写字母A。例如:第一个字段是1位字符,第二个是5位字符长。

6.5 布尔变量(yes/no字段)

布尔值字段允许接受Y、N、1、0和空格。当输入"1"时计算机自动将其转换为"Y"。同样,当输入"0"时则自动转换为"N"。布尔字段的长度为1位,如.QES文件中字段编码定为 将会出错。

6.6 日期型变量(日期字段)

日期变量有两种形式:欧洲形式“日/月/年”和美国形式“月/日/年”。日期字段的长度总是10字符长。在数据输入中有效的字符为数字和斜线(/)。如果输入过程中所有数字位都输入的话则不必输入斜线(/)。例如:对于欧洲日期形式1999年5月4日输入为04051999,当光标移至下一个字段时日期字段将自动变成04/05/1999的形式。

有时不必输入所有8个数字。对于欧洲日期形式,2位年数字50和99认为是1950和1999,而数字00至49默认为2000至2049。例如:如果输入040599,则计算机自动转变为

04/05/1999;如果输入040502,则计算机自动转变为04/05/2002。如果只输入0405的话,则计算机会将系统当前的年份自动加入到字段中。

在录入完成后计算机会对录入的日期进行核对,以保证录入的日期是合法的日期值。在EpiData中只支持4位年日期。

6.7 今天型日期字段(当前日期字段)

今天型日期字段将用计算机登记的当前日期作为“今天日期字段”的值。这个类型字段不能编辑,如果以前存储的记录中有“今天日期字段”,当它被编辑后它的日期将会被当前日期代替。这个特点使得用户可利用今天型日期字段作为最后更改日期的标记。

注意:今天型日期字段与EpiInfo不兼容。在EpiData中最好用欧洲日期格式。要使用EpiInfo软件分析结果时,尽量不要使用今天型日期字段。

6.8 Soundex型变量

Soundex型变量可以输入任何字符,但只有录入的最后一个词用来创建Soundex码。在需要匿名时要使用Soundex型变量。例如参与调查人员的姓名需要匿名时,要使用Soundex 型变量。Soundex型变量编码总是用A-999格式,其中包括一个大写字母,一个连字符和一个3位数值。

Soundex型变量编码按以下规定产生:

(1) 词的第一个字母总是保存。该词的其它字母按以下规则压缩成一个3位数。

A E I O U Y H W不编码;

B F P V编码为1;

C G J K Q S X Z编码为2;

D T编码为3;L编码为4;M N编码为5;R编码为6。

(2) 其它字母的编码按其出现顺序排列。例如:HOLMES=H-452;ADOMOMI=A-355。

(3) 编码总是使用3位数,3位数编码以后的字母忽略不计。例如:VONDERLEH=V-536。

(4) 当3位数未排满时用0补足。例如:BALL=B-100;SHAW=S-000。

(5) 两个重复字母编码时按一个对待。例如:BALL=B-400。

(6) 连续属于同一编码组的字母不编码。例如:JACKSON=J-250。

(7) 连字符不编码。例如:KING-SMITH=K-525。

注意:Soundex型变量与EpiInfo不兼容。所以要使用EpiInfo软件分析结果时,尽量不要使用Soundex型变量。

6.9 隔位符(跳格符)@

当我们根据.QES文件产生一个.REC调查表文件时,字段的位置就由.QES文件中“问题”的(该字段前的文本)位置决定。但这样可能会引起字段位置不对齐,所以需要对字段进行自动对齐的功能。可以在.QES文件中使用跳格符解决这个问题。

注意:跳格符在EpiInfo系列软件中不存在,所以它会被认为是其它字符。

跳格符对于数据文件的字段没有影响,只是改变字段在调查表中的位置。在字段变量符号前插入@符号使得两行输入框自动对齐。例如:

v1@####

v20@####

这些.QES文件行将产生两个4位整数字段。“问题”("v1"和"v20")将出现在调查表的左边。这两个字段的左边界将放在左空白处。跳格停止位将以屏幕象素数决定,默认值是40个象素,这个值可在“文件/菜单/选择项/显示数据表”内进行设定。

7. 编辑.CHK核查文件及核查文件命令和函数

使用EpiData最简单的步骤是:(1)根据调查表产生.QES文件(2)根据.QES调查表文件生成.REC数据文件(3)输入数据。

使用了.CHK核查文件使得在数据输入过程中检查数据的有效性成为可能。核查(check)文件中包括对一个或多个输入字段的有效性描述。核查文件还可包含一些命令根据数据,控制输入的流向。例如从一个字段至另一个字段的自动跳转,要求核查文件与数据文件同名(只是后缀不同.CHK 和.REC)。

如果核查文件中已经写入适当的程序,在数据输入过程中上述的功能就可起作用:

(1)限制输入数字(或日期)字段的数值或范围。

(2)对字段进行强行输入。

(3)拷贝前一个记录的数据至新记录。

(4)根据一个字段的数据实现条件跳转。

(5)根据其它字段的数值计算该字段的数值。

(6)复杂计算和条件操作(IF-THEN 操作)。

(7)对数据录入者提供帮助信息。

当数据文件产生后, 可以有两种方法产生核查文件:

(1)选择主菜单中“数据核对”菜单下的“增加/更改核对命令”或在工作过程工具条中点第三个按钮,即:“添加核对程序”按钮,选择“添加/修改字段核对命令”选项,这时出现一个“查找范围”对话框,单击要产生核查文件的数据文件,按“打开”按钮。这种方法只可用于对字段的核查内容进行编辑, 但对于字段以外的块(例如:Before file,label block 等)只能使用下面的编辑方法。

(2)使用文本编辑器手工书写所有命令。注意保存文件时文件名必须与数据文件相同,只是后缀不同。通常可用记事本编写。

当选择输入数据时,如果核查文件存在,核查文件中的命令会同时自动装入内存。使用“增加/更改核对命令”功能很容易编写这些基本的核查命令。这些命令包括:范围检查、指定合理值、指定为必须输入字段(Must Enter)、字段间的条件跳转、重复上次输入值、添加数值标记等。

如果只想使用这些命令可连续使用“增加/更改核对命令”功能;如果需要使用其它命

令(如Before entry、after entry、hide、unhide、goto、help、if-then-endif等)请参看:“7.21 核查文件结构”和“7.22 核查文件的实例”;对于所有核查命令参看“7.3 核查文件的核对命令”。

7.1 增加/更改核对命令

7.11 添加/修改核对命令

这个功能是对已经有的数据文件进行添加/修改或建立有效性规则。按上一页产生核查文件的方法1打开一个数据文件。当一个数据文件被选择后,一个数据表也被建立,同时出现一个核查功能窗口。如上页图示。功能键F5可在数据表与检查功能窗口间进行切换。如果光标位于数据表状态,按CTRL+→,这将把当前状态变成检查功能窗口状态;如果光标位于检查功能窗口,按CTRL+←,这将把当前状态变成数据表状态。

选择输入字段并为它添加有效性规则的方法是:

(1)在数据表中选择字段(使用鼠标按键或TAB键或用回车键移动至某个字段)。

(2)在检查功能窗口的上部使用快速字段查找功能。

(3)当光标处于检查功能窗口的状态按CTRL +↑或CTRL +↓。参看:“2. 快捷键”。

在字段快速查找清单中,数据文件中字段名的顺序与字段在数据表中的顺序是一样的。如果光标处于检查功能窗口激活状态,当使用箭头键、TAB键或回车键达到某个字段时,可以使用以下有效性检查规则之一:范围/合理值、跳转、必须输入、数值标记。如果光标位于数据表中,使用以下复合键可以直接跳转至下述有效规则选择状态:按CTRL+L改变当前字段的范围或合理值。

按CTRL+J改变跳转目的字段。

按CTRL+E设当前字段为必须输入字段(或解除该功能)。

按CTRL+R设当前字段为重复字段(或解除该功能)。

按CTRL+A为当前字段进行标记(或解除该功能)。

如果光标位于数据表中时请注意以下复合键的特殊使用CTRL+C、CTRL+V和CTRL+X。参看:“7.18 复制、剪切和插入”。

按钮的作用:存盘(ALT+S)。按存盘按钮将所有核查项存盘,而不退出“添加/更改核对命令”功能;编辑(ALT+D)。按“编辑”按钮编辑所有字段核查项, 参看:“7.17对当前字段编辑所有核查项”;关闭(ALT+X)。按“关闭”按钮退出添加/修改核对命令功能。如果用户对核查项作了修改,需要回答是否将修改存盘。

请注意:为保证对一个核对命令的修改结果存盘一定要使用回车键或箭头键确认。

7.12 范围/合理值(Range, Legal)

如果光标处于数据表的某个字段,按CTRL+L将使光标跳至范围/合理值定义行。要定义一个字段的范围,输入最小数,再输入减号,最后输入最大值。例如2-5表示该字段只可输入2,3,4,5。如果只需对最大值进行限制,使用(-INF)负无限为最小值。如果只需对最小值进行限制,使用(INF)正无限为最大值。输入“-INF-5”定义所有小于或等于5为合理值;输入“0-INF”定义所有正数为合理值。

为一个字段定义合理值的方法是给出所有可接受的数值,中间用逗号或空格分割。如输入“4,6,8,10”,表示在当前字段中只可输入4,6,8或10。如果想既要定义范围又要定义合理值,那末必须先输入范围,再给出合理值。如输入2-6, 8则将把2,3,4,5,6,8视为合理值。若定义8, 2-6将会出错。如果你想用分号代替逗号作为小数点,注意要使用双括号。

EpiData使用手册

目录 一、EpiData2.0软件的安装 (3) 1.EpiData2.0软件介绍 (3) 2.EpiData2.0软件的组成 (3) 3.EpiData2.0软件的安装 (3) 4.EpiData2.0软件汉化文件的安装 (5) 5.数据文件Data的安装 (5) 6.EpiData2.0软件的启动 (5) 二、EpiData2.0软件的功能 (6) 1.工具条 (6) 2.快捷键 (7) 3.调查表文件(.qes)的制作 (7) EpiData编辑器 (7) 字段选取清单 (8) 变量符号编写器 (8) 数据表格式预览 (9) 变量命名法 (9) 自动变量命名规则 (10) 第一单词作为变量名 (11) 变量标记 (11) 自动缩进 (12) 字段输入框对齐 (12) 4.创建.REC数据文件和修改数据结构 (13) 4.1 如何创建.rec数据文件 (13) 4.2 数据文件的修改 (13) 5. .REC数据文件的追加与合并 (15) 5.1 数据文件的追加 (15) 5.2数据文件的合并 (16) 6. EpiData中的字段类型 (17) 6.1 自动编码变量 (17) 6.2 数值型变量 (17) 6.3 字符型变量 (17) 6.4 大写字符型变量 (17) 6.5 布尔变量 (17) 6.6 日期型变量 (17) 6.7 今天型日期字段 (18) Soundex型变量 (18) 6.9 隔位符 (18) 7. 编辑.CHK核查文件及核查文件命令和函数 (19) 7.1 增加/更改核对命令 (20) 7.2 使用编辑器产生核查文件 (23)

7.3 核查文件的核对命令 (24) 7.4 操作符和函数 (38) 8. 数据的录入 (43) 8.1字段间移动 (43) 8.2 记录间移动 (44) 8.3 查找记录 (44) 8.4 过滤器 (45) 8.5 数据双录入和有效性检查 (45) 8.6 关于数据文件 (46) 9. 数据输出 (47) 9.1 数据备份 (47) 9.2数据文件转成dBase III格式 (47) 9.3 数据文件转成Excel格式 (48) 9.4 数据文件转成Stata文件 (48) 9.5 将数据转成文本文件 (48) 三、EpiData 2.0软件与EpiInfo的兼容性 (49) 1.在数据文件中的不同 (49) 2.检查文件中的区别 (49) 四、结束语 (50)

EPIDATA教程

EPIDATA使用方法简介 一、建立新QES文件 第一种:在菜单中,点击“文件”(File)→“生成调查表文件QES文件”。 第二种:在工作栏的工作流程中,点击“1. 打开文件”(1.Define Data)→“建立新QES文件”。 第三种:在按钮栏中,点击,这时窗口中会在工作区显示一个空白的文档,你可以在此文档中键入调查表内容和框架,编辑完成后,将调查表文件保存,文件的扩展名统一为.QES。 二、调查表书写生成 1.“文件”(File)→“选项”(Option)→“生成REC文件”(Create data file)→ 在“如何生成字段名”(How to generate field names)中选择字段的命名方式。 2. 1 如果选择:以调查表第一个词命名、更新问题为实际文件名效果。

2 如果只选择:以调查表第一个词命名,字段名为汉字显示。 3 如果只选择:使用{ }内的内容自动添加字段名,则显示{ }的内容。【①在普通文本中优先选择“{ }”括进的文本。如果问题是{my}first{field}?那末字段名将为MYFIELD;如果问题是“姓名{name}?”,产生的字段名为name。 4 ②通用常见单词不予考虑(即What?Who?If?etc.)。What did you do?产生的字段名为YOUDO。 5 ③如果字段前没有“问题”文本,字段名就取前一个字段名再加上一个数字。如果前一个字段名是dMY字段,那末下一个字段(如果没 有“问题”文本)就是dMY1。如果前一个字段是dV31,则下一个字段名就是dV32。如果不存在前一个字段名则使用隐含字段名FIELD1。 6 ④如果第一个字符是数字则在第一个字符前插入一个字母N。例如3 little mice?产生的字段名为N3LITTLE。】 3. 数值型字段:##,###.##… ;仅接受数字和空格,不输按空格 处理,分析时作缺失值处理,以“.”显示。数字位数由“#”个数决 定,小数位数由小数点右边的“#”个数确定。最长可达14位,小 数点按1个字符计算。 文本型字段:包括三种。一种是常用的文本(或下划线、或底线)型字段:________;该型字段由连续下划线来定义,长度由下划线字符个数决定,最大值为80,空白字段(字段内容空缺)时,数据管理时将按缺失值处理。另一种为大写文本型字段:。 日期型字段:包括两种。一种为常用日期字段:

,分美式、英式两种,输入时即进行合法性检验;只需输入日期,系统自动插入斜杠。另一种为自动日期型字段: ;储存或修改数据时该字段自动输入系统日期,如系统日期正确,也即当天日期。 自动ID号型字段:;这是一种专用字段,用作记录识别号,文件的第一个记录为1,以后记录自动赋值顺次较前增加1,并自动保证编号的唯一性。输入数据时光标跳过此字段。如需使第一个记录号大于1,则可在“文件”菜单“选择项”中的“高级设置”中设置。 逻辑型字段(即布尔函数型字段):;只接受Y、N、空格或回车键。后两者作缺失值处理。Y、N字符输入后即转为大写字母。 4①编写过程中及时保存文件,文件类型为.qes文件。 ②系统只会根据“特殊符号”来定义一个输入字段(包括类型和长度),并根据符号前的字符给字段命名。建议在编写过程中利用“字段快速清单”插入“特殊符号”,即:选择字段类型,定义好长度后,按“插

Epidata软件使用

临床研究数据库的建立与数据录入 ——EpiData软件的使用 一、 常见数据库软件简介 1.E xcel 大多数临床大夫和研究生常用的一种数据库软件, 优点:简单易得,界面熟悉。 缺点:数据库用简单表格列出,录入时易串行,发生录入错误;变量类型不清,允许一列内同时存在不同类型的内容(如:字符和数值),影响分析;无法进行双录入核对。 2.S PSS 常见的一种数据统计分析软件,也可利用此软件进行录入。

优点:数据库录入完成后即可统计,无需进行格式转换;可指定变量类型、长度、并设置标签。 缺点:数据库用简单表格列出,录入时易录入错误;无法进行双录入核对。 3.E piData 因大型流行病学调查需要而产生的一个数据库建立、录入、管理软件。 优点:绿色,自由软件,录入界面简单友好,可指定变量的类型、长度,可简单完成数据库双录入核查,可进行数据库追加、合并操作,数据库可转化各种数据分析软件格式。 缺点:查询功能弱,不带数据分析功能。

由丹麦欧登塞(Odense, Denmark)的一个非盈利组织,即The EpiData Association (http://www.epidata.dk)开发。EpiData 的工作原理源自DOS 版本的Epi Info 6,但是工作界面为Windows版。 翻译成各国语言:英语、中文、丹麦语、德语、西班牙语、法语、意大利语、荷兰语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、塞尔维亚语、斯洛文尼亚语、阿拉伯语 中文最高版本:v3.1 (2008.01更新) EpiData数据库录入、管理步骤 1. 建立调查表(QES) 2. 创建数据库(REC) 3. 建立录入规范文件(CHK) 4. 录入数据 5. 输出数据(output) 理论上,该程序对录入的记录数没有限制。而实际应用中,记录数最好不要超过200,000~300,000(曾经用250,000 测试过)。整个录入界面不能超过999行。对数值或字符串编码进行解释的文字长度最多80个字符,变量名建议控制在8个字符以内,否则可能转出到统计软件时可能出错。

文本预览