当前位置:文档之家› 期末试卷分析报告(含信度、效度、难度、区分度)

期末试卷分析报告(含信度、效度、难度、区分度)

期末试卷分析报告(含信度、效度、难度、区分度)
期末试卷分析报告(含信度、效度、难度、区分度)

期末考试质量分析报告

新疆师范大学附属中学小学部2017-2018学年第二学期

小学数学学科五年级

质量分析报告

姓名:项彪学号:164895

一、期末考试基本情况(总体评述)

2018年五年级下册数学期末试卷属乌市教研室统一命题,全市统一监考、阅卷。本次检测分成五个部分:判断题;选择题;填空题;计算题;解决问题。从试卷检测内容看总体情况良好,学生检测成绩属正常水平。

本次考试,各班的差别不大,相对来说比较理想。从试卷上反映出来的情况看,有好的地方,当然也存在着许多问题。总体上来说,学生的基础概念掌握情况不够扎实,失分率相对较高,个别学生读题不够仔细。小部分学生的口算有小错误,这也反应了孩子的口算是不能忽视的。对于一些稍微灵活和比较灵活的知识点,学生失分则相对较多,比如应用题题的“第三题有一张长方形的纸,长70厘米,宽50厘米。如果要剪成同样大小的正方形而没有剩余,剪出的正方形的边长最大是多少”,缺乏全面思考的能力,不能够灵活处理,给自己的解答造成了一定的困扰。解决问题这部分内容,大部分学生的失分较少,失分点也都集中在计算和规范答题的问题上。

二、数据统计

表一:(按低中高不同分数段划分;

低段:0—59、60 —74、75—84、85—94、95—100;

中段:0—59、60—69、70—79、80—89、90—100;

高段:0—59、60—65、66—75、76—84、85—100)

表二:

(注:1分以内包括1分,2分以内包括2分,以此类推,统计人数。

三、 答卷情况具体分析(优点与存在问题)

1、判断、选择、填空题

这部分的题目主要是一些基本的知识和计算,学生的完成情况还是比较理想的。主要出

错的试题是“两根绳子一样长,第一根用去41

,第二根用去4

1

米,余下的相比(哪根长)”,

孩子们见的较少,导致有的孩子理解有误,大部分题目学生的完成情况还是比较好的,但极个别孩子稍稍粗心就容易出错。填空题第4小题“盐占盐水以及水占盐水的分水比率问题”这道题失分率比较高。判断题中出错的试题是 “找次品以及因数和倍数的概念 。”这道题属于基础概念知识,考验学生的空间想象能力和全面思考问题的能力,说明出错的这些孩子的基础知识掌握的还不够扎实,不能够灵活运用所学知识。 2、计算题

这里主要考察学生的口算能力,大部分学生的完成情况还可以,能够全部算对,但是也存在部分学生由于粗心而错了一题的情况。还有个别学生,由于计算基础薄弱,甚至错了两三道题。另外笔算题有漏写得数的现象,也有漏题的现象,要重视学生的答题习惯、检查习惯。 3、解决问题

这里主要考察学生解决问题的能力,大部分学生的解决问题能力较好。少部分学生失分较高,仔细分析这部分学生都没有认真读题,造成理解失误。第3小题考察学生的阅读理解分析能力,可以说也是我们平时经常练习的题目。

三、试卷的信度、效度、难度、区分度

(一)试卷的信度

本次考试最大程度排除了外界的干扰:(1)考前教师没有划定考试范围,是本学期所学的所有章节;(2)本次考试使用AB卷随机抽题的方式,进行考核;(3)保密措施可靠;(4)考试时严格执行考试纪律;(5)阅卷标准严格、规范、统一;(6)集体阅卷且实行流水作业(7)考试结果认真对比;

本次考试成绩期望值与实际成绩平均值差异不大,考试成绩的预期及格率比实际及格率高,信度大约为0.8左右,因为我们没办法采用重测法等来提高信度,只能在试题的保密程度,严格考试纪律,统一阅卷等方式来提高信度。

(二)试卷的效度

效度指考试的准确性,反映的是考试内容与教学大纲或考试大纲的吻合程度。(1)本次考试内容与教学大纲或考试大纲的基本吻合,能够较准确地测试出学生掌握和运用所学知识的真实度;(2)各单元试题分数分配与学时数分配基本保持一致,成正比关系;(3)本次考试在命题的同时制订了试题参考答案与评分标准;(4)同时集体阅卷且实行流水作业;(5)认真复核,分数基本真实。

(三)试卷的难度

本次考试的难度适中,难度系数为

55

.0

500

121

1

=

=∑

=

W

P i

i

i

P

,旨在测试同学们对课本知

识的掌握程度,通过测试之后,让学生们寻找知识点薄弱的地方,方便查漏补缺,另外已给普通班的学生鼓励一下信心,难度太大,可能会让他们失去学习的兴趣,考虑的到各方面的原因,

所以本次考试的难度适中,只有最后一题和选择题第十题有些难度,这是优生和差生之间拉开距离。

(四)试卷的区分度

本次考试的区分度不是很好,区分度大致为

2.0

150

121

1

=

=∑

=

W

D i

i

i

D

,大致能考出学生的

不同水平,能把优秀、一般、差三个层次的学生分别开。本次考试高分组,既是95以上的占10.2%,低分组,既是90分以下的占28%,及格率为100%,所以说本次考试结果达到了预期的效果。

四、反思与建议

这次期末考试的成绩似乎比较理想,但与我们的付出似乎还有一定的差距,学生的“应战”能力、计算能力、学习习惯、审题习惯都有待于提高。我们要及时发现学生存在的问题,及时采取相对应的措施,在下一学期的教学中有针对性地改进。

这次各班的成绩平均分相差不大,糟糕的地方究其原因,个别学生在试卷上写的字并不是特别认真,而且在考试时也显得非常浮燥,做完以后都不会检查,考试态度首先没有端正起来。对于学生计算能力、解决问题的能力、思维能力的训练还要多多关注,引起重视。

通过这次考试,发现各班存在的问题还是比较突出的,主要集中在计算与基础概念上,其中基础概念尤为突出,在今后的教学中,还要更加关注基础概念的严谨性和扩展性。大部分学生的审题能力、解题能力都比较好,个别学生的审题、解题能力还有待提高。

此外,从这次考试中反映出来的最大问题便是学生太粗心了,许多本不该错的题目都错了,这样的失分是非常可惜的。

措施:

1、加强自身的教育教学能力,加深对教材的钻研,对学生的了解,以及对练习的设计与讲解。

多和同年级的老师交流,取长补短,共同提高。

2、培养学生认真仔细的习惯,要求学生无论在做作业或是考试时都要认真审题,及时检查,

3、对学困生要进一步加强辅导,争取他们在基础知识上面不失分,提高成绩。还要采取“一帮一”的方式,希望他们可以有所进步!

4、通过各种方法提高学生的计算能力,让学生在熟练掌握乘法口诀的基础上,多思,多练,形成熟练技能。

5、通过各种方法提高学生解决问题的能力,结合生活中的具体事例,让学生学生从日常生活中发现问题、提出问题并解决问题,提高学生的思考能力,培养学生的创新精神。

附件1:2017-2018乌鲁木齐市第二学期质量监测五年级数学

信度与效度的关系

研究信度与效度的关系 一、信度与效度的定义 信度即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度,或者说,信度是指测量结果的一致性或稳定性。 效度即准确度,它是指测量工具或测量手段能够准确测出所要测量的变量的程度,或者说能够准确、真实地度量事物属性的程度.二、信度与效度的关系 (一)教育科学研究中信度与效度的关系 信度是研究结果所显示的一致性、稳定性程度,也是对研究结果一致性和稳定性的评价标准。一个具有信度的研究程序,不论其过程是由谁操作,或进行多少次同样的操作,其结果总是非常一致的.效度是一个研究程序的性质和功能,也是对研究结果正确性的评价标准,一个有效度的研究程序,不仅能够明确地回答研究的问题和解释研究结果,而且能够保证研究结果在一定规模的领域中推广。把两者的作用结合起来看,信度和效度是一项教育科学研究活动和结果具有科学价值和意义的保证。研究的信度是研究的效度的一个必要的前提,没有信度,效度不可能单独存在,也就是说,一项研究不可能没有信度却具有效度。 (二)人力资源招聘信度与效度的关系 影响测评信度的因素有很多,主要是系统误差和随机误差.包括测评者的专业性和素质、被测评者本人的心理、侧评工具的稳定性、

环境的稳定性等都会影响测评的可信度。影响测评的效度因素也有很多,如测评工具、测评过程及测评者因素、被测评者状态、效标因素和信度因素等。在实际招聘与录用评估过程中要把握各相关方面,不仅要有专业的测评人员,同时也要在稳定的环境中为被测评者提供一个放松真实的氛围。信度和效度是人才侧评与选拔质量的重要指标.图形形式表现分析得出的信度和效度的三种关系,则会是以下这些样式,如图8—l .图8-2和图8—3所示。所以,:高信度是高效度的必要条件,但非充分条件.即信度高不一定其效度就高,但要想获得较高的测评效度,其信度必定要高, (三)用结构式问卷来测量家长“溺爱孩子”的行为中信度与效

信度、效度、区分度、难度地使用

信度、效度、难度、区分度及其在试卷分析中的使用教学测量(instructional measurement)是考核教学成效的一种方法。这是借助于一定的手段与方式,对学生的学习成绩(简称学绩)进行探察,并以一定的数量来表示的考核办法。2. 在教学测量中应注意什么(1)教学测量的目的在于考核教学成效,也就是考察教学目标的完成情况。因此,教学测量的目标应以教学目标为依据,测量目标应与教学目标一致,而不能偏离教学目标(2)教学测量的对象是学生在的能力与品德等的形成状况,它不可能像物理测量那样直接进行,只能借助于一定的手段与方式间接进行。(3)教学成效是通过量化的学绩进行考察的。也就是说,教学成效是以学生的学习成绩为直接考察依据的,而学绩是以一定的数量来表示的,因此命题的合理性与评分的客观性是有效教学测量的一个重要影响因素 教学评价(instructional evaluation)就是依据教学目标,对学绩测验所得测量结果进行分析及解释。它主要包含以下两个方面的工作。(1)教学评价必须对学绩测验数据所表明的教学成效作出确切的诊断。(2)教学评价必须对教学的成败原因进行分析,并对今后教学工作的改进方面作出明确的规定。评价(估)的功能:为家长提供信息,为选拔提供信息,为学生提供信息,为教师提供信息,为学校(间)提供信息

教学目标,有时也称为行为目标,是指对学生在一段时间教学后应该掌握的技能与概念的述。 v信度 信度指的是测量结果的稳定性程度,信度是衡量一个量表质量高低的重要指标。信度不高的量表是不能使用的。3.常见的信度种类(1)重测信度(2)复本信度(3)分半信度(4)同质信度(部一致性信度)(5)评分者信度 影响信度的因素 ?被试 ?主试者 ?施测情境 ?测量工具

问卷的信度与效度

调查问卷的信度效度分析方法 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析,本文主要讨论后者。 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 1、重测信度法 这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 2、复本信度法 复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 3、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的

心理学中的各种信度和效度

心理学中的各种信度和效度 一、信度 所谓信度,指的是测量结果的稳定性程度,其操作定义是,信度乃是一个测验X与它的任意一个“平行测验X'的相关系数。无关因素、测验的长度、测验试题的区分度、被试团体的代表性都会影响信度。 (一)重测信度 1、定义:利用同一量表,让同一被试群体在不同时间两次施测之后的相关值。这一信度值表示的是测验结果的稳定性,故也称之为稳定性系数。 2、形式:施测——经过适当时间——再施测 3、举例:假设有一份主观幸福感调查表,先后两次施测于10名学生,时间间隔为半年,结果如下表所示,求该测验的重测信度。 4、使用的前提条件 (1)所测量的心理特质必须是稳定的。 (2)遗忘和练习的效果基本上互相抵消。 (3)在两次施测的间隔期内,被试在所要测查的心理特质方面没有更多的学习和训练。5、注意事项 (1)有些测验不宜采用重测法估计信度,如测量推理和创造力的测验。那些不易受重复使用影响的测验才能用再测法估计信度。如感觉运动测验、人格测验。 (2)两次测验间隔的时间要适当,并注意提高被试的积极性 (3)测验手册中报告重测信度时应说明两次施测的间隔,以及在此期间内被试的有关经历(4)时间间隔的把握:适宜时间间隔依照测验目的、性质及被试特点而定,可以是几分钟甚至几年。例如对于年幼儿童的间隔要小;年长群体的间隔可大。但智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月,既不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘。 6、重测信度的评价: (1)优点:能够提供有关测验结果是否随时间而变异的资料,可作为预测受测者将来行为表现的依据。 (2)缺点:易受练习和记忆的影响,前后两次施测间隔的长短必须要适度。 (二)复本信度

第五讲 心理学研究的信度和效度

第五讲心理学研究的信、效度 长江大学教育科学系严磊 研究设计的主要目标是特高整个研究的科学性水平,即保证研究结果、结论能真实的反映人的心理活动规律和教育规律。信度与效度不但是研究设计应当遵循的标准,而且也是评价研究设计质量乃至整个研究结果科学水平。信度、效度源于心理与教育测验领域,现在心理学者将诶用了测量领域的信度与效度概念,并把研究的信度和效度作为设计与评价各种研究的标准,以提高心理与教育科学中各类研究的客观性、可靠性和科学性。如今,有关研究信度和效度的理论和方法已经为心理、教育研究者普遍接受,成为研究和实验设计的关键,也成为心理、教育研究方法发展的里程碑。 一心理测量的信度和效度射击打靶 1.真分数假设 假设一:在所讨论的问题范围内,真分数不变,亦即个体具有恒定的特质,其分量一定,取值是常数。 假设二:误差是完全随机的。这里有二层意思,一是测量误差是平均数(期望值)为零的正态随机变量;二是测量误差跟被测心理特质即真分数间相互独立。 假设三:观察分数是真分数与误差分数的和。 2.测量的信度 信度(reliability)是指测量结果的稳定性和可靠性程度。 重测信度、复本信度、分半信度、评分者一致性信度 3.测量的效度

一研究的信度 二研究的信度 1.研究信度的概念 研究的信度指研究所的事实、数据的一致性和稳定性程度。一向好的心理与教育研究,其结果必须稳定可靠,即重复研究的结果要保持稳定、一致,否则便可不信。 根据影响信度的误差来源,信度可分为两大类:稳定性和同质性。稳定性指研究结果跨时间、跨情境的一致性。同质性指研究工具本身各项目内容的一致性。举例:用同一思维研究工具在前后相隔较短的时间内测查某一年级的儿童两次,结果发现两次测查结果不一致,第一次测查结果表明被试未达到逻辑思维水平,第二次结果发现他们已经达到逻辑思维水平。 2.判定研究信度的方法 重复法运用重复测量、重复研究的方法,在相同条件下用相同方 法进行两次以上的研究,然后考察它们是否取得相同结果。 重测信度 相似法通过比较同质或类似研究工作、或同类研究的结果的一致 性程度,来判断研究工具或研究结果的可靠性。 复本信度 独立评判法即两个或两个以上的研究者同时对一组被试的行为、操作 水平等各种表现进行独立判断或评价,然后比较它们之间 的一致性,此法可以判定研究者之间一致性的程度。 评分者一 致信度 举例: 相似法:将某一特定研究的结果与国内外同类研究的结果进行比较,是判定研究的信度的常用方法。新编智力量表与韦克斯勒智力量表的比较。 独立评定法:采用观察法、问卷法、访谈法、测验法、实验法等方法进行的研究中,日益注重观察者、评定者和计分者之间的信度。攻击性行为,助人行为。二研究的效度

信度和效度

信度和效度 社会学系02研王丽云 当我们建构和评估测量时,我们通常使用信度和效度这两个技术性指标。 简单地说信度就是指测量数据和结论的可靠性程度,也就是说测量工具能否稳定地测量到它要测量的事项的程度。 我们可以举例说明信度的问题:如果想知道某人的体重,我们可以叫两个人来估计,一个人的估计为150镑,另一个人的估计为300镑,那么我们就可以认为,叫别人来估计体重是非常不可信的方法。如果用磅秤,连续测量两次的结果都是相同的,因而我们可以说,在测量体重方面,用磅秤的方法要比叫人来估计更可信。我们可以用信度系数来表示信度的大小。 我们知道在进行测量时,误差是难免的,这就使得真实值和测量值之间是不可能完全一致。我们可以这样来表示真实值和测量值之间的关系。 X=T+B+E T表示真实值,B表示偏差即系统误差,E表示测量误差即随机误差。由于系统误差很难分解,因而有些书中的分解式将系统误差包括在真实值之中,因而X可以简单地概括为X=T+E 对于测量误差E,一般假定他的期望值是0,却与真实值相独立,在此假定下,可以证明:E(x)=E(T)实得分数和真分数的总体均值相等。σ2x=σ2T+σ2E实得分的方差等于真分数的方差与误差方差

之和。 信度一般规定是真分数的方差在总体方差中所占的比例,即:信度系数Rxx=σ2T/σ2X=1-(σ2E/σ2X) 信度系数越大,表明测量的可信程度越大。在实际应用中,信度主要有以下几种类型: (一) 重测信度 这种方法通常是重复同样的测量来检验信度信度系数可以用相关系数来表示。假如我们第一次测量时的观测值是X,第二次的观测值是Y,那么重测信度就等于X与Y的相关系数。 但重复测量时,我们要注意两次测量的时间间隔要恰当。如果时间间隔太久,可能会发生一些变故,影响到被调查者的态度,那么前后的测量就会有很大的差异。 (二)复本信度 复本是针对原本而言的,它使原本的复制品。 对一项调查的问题,让被调查者接受问卷测量,并同时接受调查问卷的副本的调查,然后根据结果计算原本和复本的相关系数,就得到复本信度。 (三)折半信度 通常是在无副本且不准备重测的情况下,我们就用折半信度来计算信度系数。 举例来说,如果有一份问卷,其中有十个问题涉及到女性歧视现象。利用折半信度时,可将是个问题随机分成两组,每组有五个问题,

试卷分析信度效度难度和区分度

附件6、 难度、区分度、信度和效度的一般说明 一、难度 难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。 一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。 1、难度的两种定义 (1)P=1-x/w 其中:x为某题得分的平均分数,w为该题的满分。 这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。 (2)P=x/w 这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。 2、难度的计算 (1)主观性试题的难度 A、基本公式法:P=1-x/w B、极端分组法P=1-(XH+XL)/2W 其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)。

(2)客观性试题的难度 A、基本公式法:P=1-R/N 其中:R为答对人数,N为全体人数。 B 极端分组法:P=1-(PH+PL)/2 其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n 为总人数的前27%。PL=RL/n 叫低分组通过率,RL为低分组答对人数。 二、区分度 区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分。而区分度低则反映不出不同应试者的水平差异。 试题的区分度与试题的难度直接相关。通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。 1、区分度指标的评价 -1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。 2、区分度的计算方法 (1)基本公式法:D=(H-L)/N 其中:D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之

信度与效度的关系

信度与效度的关系 信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。 信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象。 信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。 效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。 效度高,信度也必然高。 信度:测量的数据准确性

效度:结果的符合程度 1请问为什么随机分派前后测就可以控制选择、被试缺失的干扰了。而随即分派后侧就不能对被试缺失加以控制了。它们的不同只是多了一次前侧,怎么会对被试产生影响呢? 2消除无关变量的方法平衡法和恒定法,有何区别呢,我总是有点弄混,能各举个例子吗? 1、在一个延续时间较长的研究中,被试的更换、淘汰或者中途退出可能会对研究结果产生深刻的影响。所以如果只有后测,两组或多组相等的假设就无法保证,很难控制被试的情况。而前后测可以解决这个问题。 2、恒定法。恒定法就是采取一定措施,使某些无关变量在整个研究过程中保持恒定不变。它也是控制无关变量的基本方法。平衡法。平衡法就是对某些不能被消除,又不能或不便被恒定的无关变量,通过采取某些综合平衡的措施或方式,使其影响通过平衡而抵消,达到控制它们的方法。平衡法主要采用对比组方法和循环法。

先体会一下两者定义。简单的说: 恒定法:前后不变,比如上课时间、学生作业 平衡法:分组实验中,各组作用相同,比如教师水平,学生数目,知识基础。 在实验设计主要格式中,带有随机分配的优点是可以控制选择与成熟的交互作用,是什么意思啊?这里的成熟是指的被试身心的成熟程度吗? 支持(0) 中立(0) 反对(0) 单帖管理 举报帖子 使用道具 | 引用| 回复 zdjy 小大2楼个性首页| 博客| 信息| 搜索| 邮箱| 主页| UC

浅说试题的难度、区分度、信度和效度

浅说试题的难度、区分度、信度和效度 北屯初中2011-3-16 一.试题的难度 (一)什么是难度 难度是指试题的难易程度,是评价考试的一个非常重要的一个指标。一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。 (二)难度的计算 1.单个选择题目的难度计算 单个选择题的难度通常以通过率表示,即以答对或通过该题目的人数占考生人数的百分比表示。 计算公式为:P=R/N. 其中P代表题目的通过率,R为答对或通过该题目的人数,N为全体考生人数。 P值越大,题目难度越小,答对人数越多。 2.单个非选择题目的难度计算 此类题目考试结果不是只有答对或答错两种,而是具有从满分到零分之间多种结果。计算公式为:P= X/W. 其中P为难度,X为考生在某一题目上的平均得分,W为该题目的满分。 3.整个试题的难度计算(常用) 计算公式为:P= X/W. 其中P为难度,X为样本平均得分,W为试卷总分。 如满分150分的试题,考生平均得分108分,则难度为108/150=0.72 如考生人数太多时,可先将考生总分从高到低排列,然后将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生的难度值,然后求它们的平均值即可。 (三)试题难度的一般要求 就高考来说,难度以适中为宜,单个试题的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。 一般将难度值大于和等于0.7的试题定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试题定为难题。 命题时难度一般要按一定比例分配,如3:6:1或3:5:2,一般说来,容易题、难度系数为0.95-0.75,中档题为0.74-0.6,难题为0.59-0.20。 二.试题的区分度 (一)什么是区分度 区分度是指考试题目对考生心理特征的区分能力。区分度高的试题能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。 (二)区分度的计算 1.单个选择题目区分度的计算 将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。 计算公式为:D=PH-PL. PH和PL分别为高分组和低分组的通过率。

问卷的信度与效度

?调查问卷的信度效度分析方法 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析,本文主要讨论后者。 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 1、重测信度法 这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 2、复本信度法

复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 3、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级克特(Likert)量表。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(r hh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式: 求出整个量表的信度系数(r )。 u 4、α信度系数法 Cronbach α信度系数是目前最常用的信度系数,其公式为: 其中,K为量表中题项的总数,为第i题得分的题方差,为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。 二、效度分析

试题的难度、区分度、信度和效度

试卷的难度、区分度、信度和效度 一.试卷的难度 (一)什么是难度 难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。 客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。试卷难度计算公式:P=为平均分,K 为试卷满分值。易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。 (二)难度的计算 (1)客观性试卷难度P(这时也称通过率)计算公式: P=k/N(k为答对该题的人数,N为参加测验的总人数) (2)主观性试卷难度P计算公式: P=X/M(X为试卷平均得分;M为试卷满分) (3)适用于主、客观试卷的计算公式: P=(P H +P L )/2(P H 、P L 分别为试卷针对高分组和低分组考生的难度值) 步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。 (三)试卷难度的一般要求 就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。命题时难度一般要按一定比例分配,如3:6:1或3:5:2。 二.试卷的区分度 (一)什么是区分度 区分度是指考试卷目对考生心理特征的区分能力。区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。区分度高的

信度、效度、难度、区分度

信度、效度、难度、区分度 一、信度(稳定性) 信度是表明评价工具质量的又一重要指标,主要指测验结果的前后一致性程度。(多次测量的一致性) 根据影响信度的不同因素,可以把信度分为以下几类,信度指标通常用相关系数表示。 1.再测信度 用同一种测验在不同时间里两次测验同一组学生,然后统计两次测试成绩的相关,求得的相关系数即为再测信度系数。信度系数的最大值为1,表示再测信度最高;最小值为0,表示再测信度最低。 2.分半信度 将一个测验分为等质量的两半,求这对半分的两半测验所得分数的一致性程度,即为分半信度。 3.评分者信度 把相同的测验结果提供给不同的评分者打分,若不同评分者给的分数大致相同,说明该测验有较高的信度。 二、效度(准确性) 效度是指一个测验或测量工具能真实地测量出所要测量的事物的程度。一次测验是否有效,主要看其是否能准确地测量所要测量的东西。 测验的效度有多种类型,主要有内容效度、构想效度和预测效度。根据不同的需要,一个测验可以采用一种或几种效度。 1.内容效度

所谓测验的内容效度,是指它从需要测验的教材中提取样本的适当程度。内容效度的高低,取决于测验题目的代表性,要看选出的题目能否包含所测量内容范围的主要方面,并使各方面题目比例适当。 2.构想效度 所谓测验的构想效度,是指一个测验能够测量理论上的构想或内在心理特性的程度。 3.预测效度 所谓测验的预测效度,是指一个测验能够预测学生将来某种特定行为或表现的程度。预测得越准,效度就越高。 例:在小学低年级的某次测验中,由于数学试卷中试题的文字表述过于复杂,学生不能完全理解题干的要求,也不能正确的解答题目,以至于该试卷无法正确测量学生数学学习的状况。据此可以判断这次数学测验是( ) A.高信度的 B.低信度的 C.低效度的 D.高效度的 【答案】C。解析:信度强调某一次测验前后多次测量所得结果的一致程度。效度强调某一测验的测量结果的有效性和准确性。该试卷无法准确测量学生学习的状况,说明这次教学测验是低效度的。故选C。 【知识点】教育学——教学——教学评价——教学测验 三、难度 难度指测验的难易程度。在教学测量中,通常用答对或通过测验的人数比例作为难度值。 难度值(P)=答对人数(R)/被试总人数(N)×100% P值越大,难度越低;P值越小,难度越高。(难度值与难度之间成反比)一般来说,难度值平均在0.5最佳。 四区分度

难度、区分度、信度、效度

试卷分析的四个度:难度、区分度、信度、效度 一、难度 难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。 一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。 1、难度的两种定义: (1)P=1—x/w x为某题得分的平均分数,w为该题的满分。这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。 (2)P=x/w 这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。 2、难度的计算: (1)主观性试题的难度 A 基本公式法:P=1—x/w B 极端分组法P=1—(XH+XL)∕2W XH:高分组的平均得分(前27%),X L:低分组的平均得分(后27%)。 (2)客观性试题的难度 A 基本公式法:P=1—R/N R 为答对人数,N 为全体人数。 B 极端分组法:P=1—(PH+PL)∕2 PH=RH/n 叫高分组通过率,RH:高分组答对人数,n:总人数的前27%。PL =RL/n 叫低分组通过率,RL:低分组答对人数。

二、区分度 区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分,而区分度低则反映不出不同应试者的水平差异。 试题的区分度与试题的难度直接相关,通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。 区分度指标的评价:-1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。 2、区分度的计算方法: 基本公式法:D=(H-L)÷N(D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和)。 极端分组法: (1)主观性试题:D=SH—SL∕n(WH-WL)

问卷信度效度检验

从统计数据质量角度谈调查问卷的设计质量 一、引言 从保证统计数据质量的统计工作过程看,统计数据质量可以被划分为统计设计质量、统计调查质量、统计整理质量、统计分析质量以及数据发布传输质量等。统计设计质量是保证统计数据质量的首要环节,在统计数据质量保证体系中起着关键性作用。统计设计质量一般包括调查问卷设计质量与调查方案设计质量,其中调查问卷设计质量指的是:通过问卷测量得到的,反映调查对象客观现象的统计数据的准确性和有效性,即调查问卷设计质量的好坏,需要通过问卷测量能力的高低来检验。 在市场调查中,为了深入地研究一些本质的或理论性的现象,问卷调查法被广泛运用,除了调查时采用的抽样方法以及所抽取的调查对象是否具有代表性之外,调查者最关心的就是调查问卷的测量能力。问卷测量能力包含了两个方面的内容,即问卷测量结果的准确性和有效性。准确性和有效性是统计数据质量蕴涵的最主要的两个特性,一个好的调查问卷设计不仅可以保证在多次重复使用下得到可靠的数据结果,即准确性;也可以保证所得测量结果能够反映它所应该反映的客观现实,即有效性。 所以我们可以通过对问卷测量能力的分析来检验问卷的设计质量,对问卷设计进行质量控制,进而发现问卷设计中应注意的问题。在此基础上,通过不断改进问卷设计,提高其测量能力,最终将有助于我们得到高质量的调查数据。 二、调查问卷的设计质量检验 信度和效度的概念来源于心理测试中关于测验的可靠性和有效性研究,当建构和评估测量时,通常使用信度和效度这两个技术性指标。因此我们采用问卷的信度和效度分析来评估其测量能力,进而实现对问卷设计质量的检验。 1.问卷设计质量的信度检验 所谓问卷设计质量的信度检验,指的是对问卷测量结果准确性的分析,即对设计的问卷在多次重复使用下得到的数据结果的可靠性的检验。在实际应用中,信度检验多以相关系数表示,常用的方法有:重测信度,复本信度,折半信度,克朗巴哈信度,评分者信度等。国内外已经有很多关于这些信度分析方法介绍的文献,在这里,笔者不再一一详述,仅列出相关公式作为参考。 (1)重测信度,也叫稳定系数,对同一组调查对象采用同一调查问卷进行先后两次调 查,采用检验公式,其中为两次调查结果的协方差,为第一次调查结果 的协方差,为第二次调查结果的协方差。系数值越大说明信度越高。 (2)复本信度,也叫等值系数,对同一组调查对象进行两种相等或相近的调查,要求两份问卷的题数、形式、内容及难度和鉴别度等方面都要尽可能的一致。检验公式同稳定系数公式,系数越大,说明两份问卷的信度越高,具体调查时使用哪一份都可以。 (3)折半信度,也叫内在一致性系数,将调查的项目按前后分成两等份或按奇偶题号分成两部分,通过计算这两部分调查结果的相关系数来衡量信度。当假定两部分调查结果得 分的方差相等时,检验用Spearman-Brown公式来表示:,其中表示折半信度系数;当假定方差不相等时,采用Flanagan 公式:,其中、分别 表示两部分调查结果的方差,表示整个问卷调查结果的方差。如果折半信度很高,则说明这份问卷的各项题之间难度相当,调查结果信度高。 (4)克朗巴哈信度,是对折半信度的改进,检验公式是:,其中

完整word版,SPSS信效度难度区分度分析举例

SPSS信度分析 一、分半信度 例1:李老师对班上9位同学的随堂测验,Y表示答对,N表示答错,测验结果如表1所示,请计算其信度。 表1 随堂测验成绩 表2 相关性 解:(1)首先根据题意,将资料输入SPSS,建立数据文件; (2)选择"转换"|"重新编码为相同变量"命令,打开"重新编码到相同的变量中"对话框; (3)单击"旧值和新值"按钮,打开"重新编码成相同变量:旧值和新值"对话框。将"N"定义为"0",将"Y"定义为"1",单击"继续"按钮,完成转换。在SPSS文件中将 "字符串" 属性改为"数值"。 (4)计算奇数题与偶数题的和:选择"转换"|"计算变量"命令,打开"计算变量"对话框。将奇数题变量相加移入数字表达式列表框内求和,偶数题的计算方法亦同样。 (5)执行双变量相关:选择"分析"|"相关"|"双变量"命令,打开"双变量相关"对话框。将变量"奇数"和"偶数"移入右侧"变量"列表框中,在"相关系数"选项组中勾选Pearson复选框,在"显著性检验"选项中选中"双侧检验"单选按钮,并勾选"标记显著性相关"复选框,单击"确定"按钮。 (6)结果中输出对该测验奇、偶数题目进行的Pearson积差相关分析表,如表2所示。Pearson 相关系数为0.109,双侧检验的显著性概率(Sig)为0.78,远大于0.05,说明该测验奇、偶题目的相关非常低且不显著,同时也说明了该测验的信度非常低。

分半信度也可直接使用"可靠性分析"命令来完成,简要步骤如下。 (1)建立数据文件。 (2)将资料转为数字(同上)。 (3)选择模型:选择"分析"|"度量"|"可靠性分析"命令,弹出"可靠性分析"对话框。将左边列表框中的题目依所需次序前后分半选入右边的"项目"列表框中,在左下角的"模型"下拉列表框中选取"半分"选项。 (4)选择统计量,单击"统计量"按钮,打开"统计量"对话框并完成相应的设置。最后单击"确定"按钮,输出统计结果。 二、同质性信度 (1)点击分析-度量-可靠性分析。 (2)将要检验的问卷或者维度放入变量框中。 (3)点击确定,生成结果。信度指标就是Cronbach's Alpha。

细说试题的难度、区分度、信度和效度以及对高考复习的启示

细说试题的难度、区分度、信度和效度以及对高考复习的启示 一.试题的难度 (一)什么是难度 难度是指试题的难易程度,是评价考试的一个非常重要的一个指标。一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。 客观题难度计算公式:P(难度指数)=试题答对人数/考生人数;主观题难度计算公式:P=试题平均得分/试题满分。试卷难度计算公式:P=为平均分,K为试卷满分值。易、中、 难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。当然,在实际的评价过程中,测验的难度水平多高才合适,也还要取决于测验的目的。如果教师要对学生的知识准备状况进行一次诊断性测验,为了真实、准确地了解学生的知识掌握情况,测验难度大一点也是正常的。 (二)难度的计算 (1)客观性试题难度P(这时也称通过率)计算公式: P=k/N(k为答对该题的人数,N为参加测验的总人数) (2)主观性试题难度P计算公式: P=X/M(X为试题平均得分;M为试题满分) (3)适用于主、客观试题的计算公式: P=(P H+P L)/2(P H、P L分别为试题针对高分组和低分组考生的难度值) 在大群体标准化中,此法较为方便。具体步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④按上面的公式计算。 例1:一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5分,这道题的难度为: P H=20/27=0.74 P L=5/27=0.19 P=(0.74+0.19)/2=0.47 整个试卷的难度等于所有试题难度之平均值(包括主、客观试题)。 (三)试题难度的一般要求 就高考来说,难度以适中为宜,单个试题的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。 一般将难度值大于和等于0.7的试题定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试题定为难题。 命题时难度一般要按一定比例分配,如3:6:1或3:5:2,一般说来,容易题、难度系数为0.95-0.75,中档题为0.74-0.6,难题为0.59-0.20。 二.试题的区分度 (一)什么是区分度 区分度是指考试题目对考生心理特征的区分能力。区分度高的试题能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。

什么是测试的信度和效度,如何保证测试的信度和效度

什么是测试的信度和效度,如何保证测试的信度和效度 棋盘中小张倩倩 在教育研究中,信度与效度是很常见的两个概念。但每次看到或听到这两个名词,我的脑袋老反应不过来,看来基础就是不扎实。我在这里就谈谈我浅显的认识。 一、信度 所谓的信度,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的可能性。如果说某个指标或测量工具的信度高,那它提供的测量结果就不会因为指标、测量工具或测量设计本身的特性而发生变化;反之亦然。根据测量过程中不同的误差来源,可分为再测信度、复本信度和折半信度。 再测信度,是用同一测量工具在不同的时间对同一群受试者前后测量两次,然后计算两次测量分数的相关系数,相关系数越大说明两次测量的一致性越高。相隔的时间不应该太长。 复本信度,是用两个完全等值的(平行的)复本对同一群受试者进行测试,计算两种复本测量分数的相关系数,相关系数越大说明两个复本构成带来的变异越小。如考试中使用的A、B卷 折半信度,只用一个测量工具对同一群受试者实施一次测量,但将奇数题和偶数题分开计分,再计算奇数试题和偶数试题分数之间的相关系数。 二、效度 所谓的效度,是指测量工具能够测出其所要测量的特征的正确性程

度。效度越高,即表示测量结果越能显示其所要测量的特征。如果说根据某项特征能够区分人、物或事件,那么说某个测量该特征的测量工具是有效的,就是指它的测量结果能把具有不同特征的人、物或事件进行有效的区分。常用的有变面效度、内容效度和效标效度。 表面效度是指测量效果和人们头脑中的印象或学术界形成的共识之间的吻和程度,吻合程度高,表面效度就高。 内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵,测量工具代表概念定义的内容越多,内容效度就越高。 效标效度是指测量结果与一些标准之间的一致性程度,这些标准能够精确表示被测概念。 三、信度与效度的关系 信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。 信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象。 信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。 效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。 效度高,信度也必然高。

江苏教师资格证考试:信度、效度、难度、区分度

江苏教师资格证考试:信度、效度、难度、区分度临近考试,江苏教师招聘考试网为考生整理了信度、效度、难度、区分度,希望对大家有所帮助。 在全国统考教师资格考试中,对于备考的考生而言,无论是教育学还是心理学都存在一些学习方面的难点,这对于自己备考的考生而言是非常困难的。中公讲师结合自己的教学经验与深厚的专业知识,将中学《教育知识与能力》的教学难点进行专题讲解,希望能够对各位考生的笔试备考提供一些帮助。 1、测量指标的含义 信度、效度、难度、区分度是中学教学部分的考试内容,主要是用来检验测验质量本身的重要指标。所谓信度指的是多次测量结果额一致性与稳定性。它本身强调是测量结果是不是一样的,例如:小明第一次测量得分是80分,第二次测量得分也是80分,说明两次结果一样,则说明两次测量的信度高。反之,第一次测量得分80分,第二次测量得分40分,两次结果不一样,说明信度低。所谓效度指的是测量的正确性,是指一个测量所要测量的结果的程度。效度所关注的是测量到对象多少程度?比如:假如小明本身的真实成绩是80分,第一次测量得分是正常发挥得分是80分,说明本次测量的效度高,如果失常发挥,高于80分或者低于80分,本次测量的效度低。所谓难度主要指的是测量的难易程度,测量的难度系数值的范围是0—1,难度系数值越小,则反映试卷难度越大,难度系数值越大,则反映试卷难度越小。所谓区分度,指的是测量对不同考生的区分程度,也就是可以理解为通过测验能够将好的选出来,差的筛下去。比如高考的就是区分度很高的测验,否则就难以将好生、差生进行区分。 2、测量指标之间的关系 信度与效度的十大关系: 信度高,效度不一定高(或效度不一定低) 信度低,效度一定低 效度高,信度一定高

信度和效度的关系口诀

信度: 信度是指测验结果的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。信度系数愈高即表示该测验的结果愈一致、稳定与可靠。系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。反之,随机误差可能导致不一致性,从而降低信度。 定义: 信度(reliability)即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。从另一方面来说,信度就是指测量数据的可靠程度。 信度和效度的关系: 问卷的信度与效度之间既有明显的区别,又存在着相互联系、相互制约的关系。信度主要回答测量结果的一致性、稳定性和可靠性问题;效度主要回答测量结果的有效性和正确性问题。 效度和信度的关系可以用测量值的构成公式O=T S R来理解。如果测量是完全有效的,即0=T,S=0,R=0,此时测量必然是完全可信的,若量表的信度不足,它也不可能完全有效,因为有O=T R。如果量表是完全可信的,可以达到完全有效,也可能达不到,因为有可能存在导致误差,虽然缺乏信度必然缺乏效度,但信度的大小并不能体现效度的大小。信度是效度的必要条件,但不是充分条件。从理论的角度来看,量应具有足够的效度和信度;从实践的观点来看,一个好的量表还应该具有实用性。实用性指量表的经济性、便利性和可

解释性。 一般来说,信度是效度的必要条件,也就是说,效度都必须建立在信度的基础上;但是没有效度的测量,即使它的信度再高,这样的测量也是没有意义的。信度和效度的关系有如下几种类型: ①可信且有效 这种问卷准确地反映被调查人员的真实态度,问卷中的题目是和调查目标紧密关联的。若调查结果能真实地反映所调查的对象,测量的误差较小,则说明问卷调查的结果是可信而且有效的。 ②可信但无效 这种问卷调查结果虽然能准确地反映被调查人员的真实态度,但问卷中题目与真实的调查目的的关联程度较弱,与调查的目标不相一致。。这种情况表明,虽然调查中所得的结果是可信的,但可能在某些环节上出了差错,例如问卷中题目的设计使得所有的被调查人员都出现了理解的偏差,从而出现了系统性的偏差。 ③不可信亦无效 在这种情况下,统计调查的结果分布较为分散,是难以从调查问卷中得出有效结果的,这是测量中应避免的类型。

相关主题
文本预览
相关文档 最新文档