当前位置：文档之家› 试题的难度、区分度、信度和效度

试题的难度、区分度、信度和效度

试卷的难度、区分度、信度和效度

一.试卷的难度

（一）什么是难度

难度是指试卷的难易程度，是评价考试的一个非常重要的一个指标。一个题目，如果大部分考生都能答对，那么这个题目的难度就小；如果大部分考生都不能答对，那么这个题目的难度就大。

客观题难度计算公式：P（难度指数）＝试卷答对人数/考生人数；主观题难度计算公式：P＝试卷平均得分/试卷满分。试卷难度计算公式：P＝为平均分，K 为试卷满分值。易、中、难的标准为：易：P≥0.7，中：0.4≤P≤0.69，难：P≤0.39；P值越大，难度越低，P值越小，难度越高。一般来说，难度值平均在0.5最佳，难度值过高或过低，都会降低测验的信度。

（二）难度的计算

（1）客观性试卷难度P（这时也称通过率）计算公式：

P=k/N（k为答对该题的人数，N为参加测验的总人数）

（2）主观性试卷难度P计算公式：

P=X/M（X为试卷平均得分；M为试卷满分）

（3）适用于主、客观试卷的计算公式：

P=（P

H +P

）/2（P

、P

分别为试卷针对高分组和低分组考生的难度值）

步骤为:①将考生的总分由高至低排列；②从最高分开始向下取全部试卷的27%作为高分组；③从最低分开始向上取全部试卷的27%作为低分组；④计算。

（三）试卷难度的一般要求

就高考来说，难度以适中为宜，单个试卷的难度以0.3--0.7之间为好，整卷以0.5--0.6之间为最佳。一般将难度值大于和等于0.7的试卷定为容易题；大于0.4和小于0.7的定为中档题；小于和等于0.4的试卷定为难题。命题时难度一般要按一定比例分配，如3：6：1或3：5：2。

二.试卷的区分度

（一）什么是区分度

区分度是指考试卷目对考生心理特征的区分能力。区分度高的试卷能将不同水平的考生区分开来，水平高的考生得高分，水平低的考生得低分。区分度高的

考试，优秀、一般、差三个层次的学生都有一定比例，如果某一分数区间学生相对集中，高分太多或不及格太多的考试，区分度则低。

（二）区分度的计算

1.单个选择题目区分度的计算

将全体考生总分从高到低排列，将总分最高的27%考生定为高分组，总分最低的27%考生定为低分组，分别计算两组考生在某道题目上的通过率，两个通过率之差就是这道题的区分度（又叫鉴别指数）。

计算公式为：D=P

H -P

. P

和P

分别为高分组和低分组的通过率。

2.整个试卷的区分度计算（常用）

计算公式为：D=2（X

H —X

）/W，其中D为试卷区分度，X

为27%高分组平均

分，X

为27%低分组平均分，W 为试卷总分。

一般也将全体考生总分从高到低排列，将总分最高的27%的考生定为高分组，总分最低的27%考生定为低分组，再分别计算各组的平均分。

（三）试卷区分度的一般要求

区分度（D）的取值范围介于-1.00至+1.00之间。通常D为正值，称为积极区分；D为负值称为消极区分；D值为0称为无区分作用。具有积极区分作用的试卷，其D值越大，区分的效果越好。

试卷的区分度在0.4以上表明此题的区分度很好，0.3～0.39表明此题的区分度较好，0.2～0.29表明此题的区分度不太好需要修改，0.19以下表明此题的区分度不好应淘汰，高考的区分度一般要求在0.3以上。

三.试卷的信度

信度是指使用同一试卷对考生重复测验时，或两个平行试卷对考生测验时，所得测验分数的一致性和稳定性程度。信度除了要说明成绩的真实性之外，还要说明题目涉及的内容与教学的相关程度。

信度系数愈高即表示该测验的结果愈一致、稳定与可靠。系统误差对信度没什么影响，因为系统误差总是以相同的方式影响测量值的，因此不会造成不一致性。反之，随机误差可能导致不致性，从而降低信度。信度可以定义为随机误差R影响测量值的程度。如果R=0，就认为测量是完全可信的，信度最高。

信度主要是指测量结果的可靠性、一致性和稳定性，即测验结果是否反映了被测者的稳定的、一贯性的真实特征。和信度相关的一个概念是效度，信度是效度的前提条件。

信度只受随机误差的影响，随机误差越大，信度越低。因此，信度可以视为测试结果受随机误差影响的程度。系统误差产生恒定效应，不影响信度。

四.试卷的效度

效度是指考试有效性或正确性的质量指标，即是否考了要考的内容，试卷难度、区分度是否适宜，考试最终是否达到了它的预定目的等。

测试效度(test validity)亦称测试的有效性，指一套测试对应该测试的内容所测的程度。也就是说，一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。

测试的效度一般可分为以下几类：

1）表面效度（face validity）。指测试应达到的卷面标准，即一套测试卷从表面看来是否是合适的。例如，若一次阅读理解力的测试包括许多受试者没有学过的方言词汇，则可认为这次测试缺乏表面效度。表面效度是测试出受试者正常水平的一种保证因素。

2）内容效度（content validity）。指测试卷是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求，即测试的代表性和覆盖面的程度。

3）编制效度（construct validity）。指测试卷的诸项目对编制该测试所依据的理论的各个基本方面的反映程度。

4）经验效度（empirical validity）。经验效度是一种衡量测试有效性的量度，通过把一次测试与一个或多个标准尺度相对照而得出。

一般来说，对某次测试的效度进行检验时，除了要根据教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外，还须采用计算相关系数的定量方法，即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间的相关系数。系数高则有效性大。课堂测试的效度应在0.4-0.7之间，规模较大的测试其效度应在0.7以上。

五、高考题的信度、效度、难度和区分度

高考的性质最主要的在两个方面：首先、高考是一种选拔性考试，高考成绩是高等学校录取新生的依据，这是高考的选拔性质。其次、高考是一种导向性考试，高考是中学教学的指挥棒，起着对中学教学的引导作用，这是高考的引导性质。高考性质的这两方面决定了高考试卷应有的信度、效度、难度和区分度，而这些是我们进行高考复习首先要清楚的，能够避免我们在复习时的盲目。

浅谈语言测试的信度与效度

?２００９年第１期? ５陈静浅谈语言测试的信度与效度收稿日期：2008-09-24作者简介：陈静（1981-），女，吉林华桥外国语学院科研处，讲师，长春130117 [摘要]本文通过测试的信度与效度的对比分析，结合其发展过程分析了信度与效度的相互关系对语言测试及语言教学的影响。正确、科学的现代语言测试的取向应该是效度重于信度。提高测试的效度可以提高语言测试的正面反拨作用，即促进语言教学的质量。 [关键词]语言测试；信度；效度[中图分类号]H087[文献标识码]A [文章编号](2009 01-0005-04 语言测试学, 作为应用语言学的一个分支, 现已发展成一个相对独立的学科。作为对语言教学进行测量和评估的一个重要手段, 语言测试愈来愈受到广大外语教学工作者的重视。Bachman (2004:54 曾说:“在教育程序中, 语言测试的基本运用是给教学评估提供重要的信息。”通过测试可以检查学生对知识的掌握情况和教学中存在的问题，对今后的教学提供指导和帮助；同时，通过测试可以衡量教学任务和教

学大纲的执行情况。不科学的测试不仅不能起指挥棒的作用, 有时反而会误导教学, 将学生和教师引向歧途。因此我们主张的是科学的, 符合教育原理的测试, 这样的测试会对教学产生积极的反拨作用。一套设计比较科学的测试，一般认为应该有四点特征, 即效度, 信度, 实用性和良好的反拨作用。其中信度与效度是后两者的基础，是语言测试的永恒主题，信度与效度孰重孰轻, 也是现代语言测试学家一直争论不休的话题。本篇论文通过测试信度与效度的研究，旨在帮助教师设计合理的测试，并在测试后对试题总结、归纳，以加大测试力度，提高测试效果。一、信度与效度的概念语言测试的信度是指测试结果的可靠程度。浅谈语言测试的信度与效度吉林华桥外国语学院学报６即当被测试对象发生变化，用同样的“尺子”去重复测量时，总是获得类似的结果。影响信度的因素很多, 它们存在于语言测试的每个环节中，就试卷本身来说主要是样本的大小和区分度等。取样大, 样本具有广泛性, 测试的信度就高, 反之信度就低。另外试题太难或太易, 考试分数集中于某一点或某一区域测试也失去信度。在测试的组织、实施这个环节中, 一方面考试的环境和条件要对考试有利。另一方面考试的环境和条件对所有的受试者是否一致也影响到考试的信度。在测试评分的环节上, 评分标准是否一致对信度影响很大，尤其是主观题的评分很难能达到很高的标准。

信度和效度练习题答案归纳.doc

《心理测量学》信度和效度练习题参考答案 1．一个59道题目的测验，奇偶分半后的得分积差相关系数是0.50，那么该测验的信度是多少？解： 2．已知16人参加一次测验后在奇数题和偶数题上的得分情况见下表，分别用斯皮尔曼-布朗公式、弗朗那根公式、卢伦公式估计测量的分半信度。就该测验而言，哪种分半信度更合适？，解：（一）、计算总分、d 值见上表，计算平均数、方差、标准差得： hh hh xx r r r += 12? ??? ??+-?=222 12x b a S S S r 221x d S S r - =67 .06667.050 .0150 .02)1(111≈=+?=?-+?=r m r m r xx

842 .55836.131375.93419443772.45303422 ====?===∑偶偶偶偶奇奇奇奇，，，，，s s x x x s s x 5117 .25586.60625.17614.108086.115375.96822 ==-====d d d x x s s x s s x ，，，，， 930 .80842 .55772.4516375 .934341619443=????-= ????-?= ∑偶奇偶奇偶奇 s s n x x n x x r hh （二）、用斯皮尔曼-布朗公式估计： 9435 .08930 .018930 .0212=+?=+?=hh hh xx r r r 用弗朗那根公式估计： 9434.08086.1151836.3130121222 2=??? ??+-?=???? ? ?+-?=x xx s s s r 偶奇用卢伦公式估计： 9434.08086 .1155586.61122 =-=-=x d xx s s r （三）、两个半个测验的等值检验 ①.总体方差齐性检验 2 2210:σσ=H 22211:σσ≠H 0395.115 16301516 1836.3122=? ?= = 小大S S F 查表得，当 15,1521==df df 时，()39.215,15,05.0 F

问卷的信度与效度

调查问卷的信度效度分析方法问卷调查法是教育研究中广泛采用的一种调查方法，根据调查目的设计的调查问卷是问卷调查法获取信息的工具，其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性，在形成正式问卷之前，应当对问卷进行试测，并对试测结果进行信度和效度分析，根据分析结果筛选问卷题项，调整问卷结构，从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析，本文主要讨论后者。一、信度分析信度（Reliability）即可靠性，它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示，大致可分为三类：稳定系数（跨时间的一致性），等值系数（跨形式的一致性）和内在一致性系数（跨项目的一致性）。信度分析的方法主要有以下四种： 1、重测信度法这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测，计算两次施测结果的相关系数。显然，重测信度属于稳定系数。重测信度法特别适用于事实式问卷，如性别、出生年月等在两次施测中不应有任何差异，大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变，这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次，被调查者容易受到各种事件、活动和他人的影响，而且间隔时间长短也有一定限制，因此在实施中有一定困难。 2、复本信度法复本信度法是让同一组被调查者一次填答两份问卷复本，计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外，在内容、格式、难度和对应题项的提问方向等方面要完全一致，而在实际调查中，很难使调查问卷达到这种要求，因此采用这种方法者较少。 3、折半信度法折半信度法是将调查项目分为两半，计算两半得分的相关系数，进而估计整个量表的信度。折半信度属于内在一致性系数，测量的是两半题项得分间的

量表的信度效度检验

第六章量表的信度效度检验我们采用含有多个项目的量表来测量人们的意见、态度、看法等、这样得到的结果是否准确、可靠，是否有适用性？这就需要评价量表的信度和效度。从理论的观点来看，一个良好的测量工具（量表）应具有足够的效度和信度。一、信度检验信度（Reliability）即可靠性，是指采用同一方法对同一对象进行调查时，问卷调查结果的稳定性和一致性，即测量工具（问卷或量表）能否稳定地测量所测的事物或变量。信度指标多以相关系数表示，具体评价方法大致可分为三类：稳定系数（跨时间的一致性），等值系数（跨形式的一致性\替换形式）和内在一致性系数（跨项目的一致性）。信度表示的方法主要有以下四种： 1、稳定性系数稳定性系数是采用同样的问卷，对同一组访问对象在尽可能相同的情况下，在不同时间内进行两次测量，用两次测量结果间的相关分析来评价量表信度的高低，连皮尔逊积差相关系数即是信度系数，也称为重测信度，或再测信度。两次测量，如果间隔时间过长，调查对象容易受环境和个人经历的影响而发生态度的转变，如果间隔时间过短，则受到上次调查记忆的影响。适当的间隔时间是既不能让调查对象记住上一次测验的内容，也不能让其被测的主观特征在两次测验之间没有发生较大的变化。适合的间隔时间要视调查对象和测量内容不同而不同，一般来说，年幼儿童，间隔时间要小，年长者，间隔时间可以延长。并且调查对象在两次测量期间没有发生于相关的重大事件。在最后提交调研报告时，要对间隔时间加以说明，报告间隔的时间。 2、等值系数（复本信度）用两个复本在最短时间内对同一组调查对象进行测量所得结果的一致性程度，复本信度系数等于两个复本测量所得分数的皮尔逊积差相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度，是等值系数。复本类似于考试中得A、B卷，如果一个人在A卷和B卷的得分相同，就说明考题具有信度；如果两者差异很大，则缺乏信度。复本信度的使用前提是测量所用的两个复本必须是等效的，两个复本要满足以下几个条件：两个复本测量的是同一种特征。两个复本具有相同的内容和形

试题的难度、区分度、信度和效度

试卷的难度、区分度、信度和效度一.试卷的难度（一）什么是难度难度是指试卷的难易程度，是评价考试的一个非常重要的一个指标。一个题目，如果大部分考生都能答对，那么这个题目的难度就小；如果大部分考生都不能答对，那么这个题目的难度就大。客观题难度计算公式：P（难度指数）＝试卷答对人数/考生人数；主观题难度计算公式：P＝试卷平均得分/试卷满分。试卷难度计算公式：P＝为平均分，K 为试卷满分值。易、中、难的标准为：易：P≥0.7，中：0.4≤P≤0.69，难：P≤0.39；P值越大，难度越低，P值越小，难度越高。一般来说，难度值平均在0.5最佳，难度值过高或过低，都会降低测验的信度。（二）难度的计算（1）客观性试卷难度P（这时也称通过率）计算公式： P=k/N（k为答对该题的人数，N为参加测验的总人数）（2）主观性试卷难度P计算公式： P=X/M（X为试卷平均得分；M为试卷满分）（3）适用于主、客观试卷的计算公式： P=（P H +P L ）/2（P H 、P L 分别为试卷针对高分组和低分组考生的难度值）步骤为:①将考生的总分由高至低排列；②从最高分开始向下取全部试卷的27%作为高分组；③从最低分开始向上取全部试卷的27%作为低分组；④计算。（三）试卷难度的一般要求就高考来说，难度以适中为宜，单个试卷的难度以0.3--0.7之间为好，整卷以0.5--0.6之间为最佳。一般将难度值大于和等于0.7的试卷定为容易题；大于0.4和小于0.7的定为中档题；小于和等于0.4的试卷定为难题。命题时难度一般要按一定比例分配，如3：6：1或3：5：2。二.试卷的区分度（一）什么是区分度区分度是指考试卷目对考生心理特征的区分能力。区分度高的试卷能将不同水平的考生区分开来，水平高的考生得高分，水平低的考生得低分。区分度高的

信度和效度

信度和效度社会学系02研王丽云当我们建构和评估测量时，我们通常使用信度和效度这两个技术性指标。简单地说信度就是指测量数据和结论的可靠性程度，也就是说测量工具能否稳定地测量到它要测量的事项的程度。我们可以举例说明信度的问题：如果想知道某人的体重，我们可以叫两个人来估计，一个人的估计为150镑，另一个人的估计为300镑，那么我们就可以认为，叫别人来估计体重是非常不可信的方法。如果用磅秤，连续测量两次的结果都是相同的，因而我们可以说，在测量体重方面，用磅秤的方法要比叫人来估计更可信。我们可以用信度系数来表示信度的大小。我们知道在进行测量时，误差是难免的，这就使得真实值和测量值之间是不可能完全一致。我们可以这样来表示真实值和测量值之间的关系。 X=T+B+E T表示真实值，B表示偏差即系统误差，E表示测量误差即随机误差。由于系统误差很难分解，因而有些书中的分解式将系统误差包括在真实值之中，因而X可以简单地概括为X=T+E 对于测量误差E，一般假定他的期望值是0，却与真实值相独立，在此假定下，可以证明：E(x)=E(T)实得分数和真分数的总体均值相等。σ2x=σ2T+σ2E实得分的方差等于真分数的方差与误差方差

之和。信度一般规定是真分数的方差在总体方差中所占的比例，即：信度系数Rxx=σ2T/σ2X=1-(σ2E/σ2X) 信度系数越大，表明测量的可信程度越大。在实际应用中，信度主要有以下几种类型： (一) 重测信度这种方法通常是重复同样的测量来检验信度信度系数可以用相关系数来表示。假如我们第一次测量时的观测值是X，第二次的观测值是Y,那么重测信度就等于X与Y的相关系数。但重复测量时，我们要注意两次测量的时间间隔要恰当。如果时间间隔太久，可能会发生一些变故，影响到被调查者的态度，那么前后的测量就会有很大的差异。（二）复本信度复本是针对原本而言的，它使原本的复制品。对一项调查的问题，让被调查者接受问卷测量，并同时接受调查问卷的副本的调查，然后根据结果计算原本和复本的相关系数，就得到复本信度。（三）折半信度通常是在无副本且不准备重测的情况下，我们就用折半信度来计算信度系数。举例来说，如果有一份问卷，其中有十个问题涉及到女性歧视现象。利用折半信度时，可将是个问题随机分成两组，每组有五个问题，

spss数据分析教程之spss信度分析和效度分析

信度分析和效度分析数据计分方法说明

讲问卷调查的数据进行如上表的数据预处理后，接下来再进行如下分析。 1 信度分析这里有63份问卷，首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图，问卷中的各个问题是否测量了相同的内容和信息；同时，对于调查问卷所得到的数据是否具有可靠性，就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关，它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言，如果问卷的信度系数达到0.9以上，该问卷调查的信度就较好；信度系数在0.8以上，是不错的；一般认为试卷信度在0.5至0.9以内是合理的，如果信度系数低于0.5，则此问卷的调查结果就不可信了。将以上63份问卷的数据用SPSS21.0先进行标准化处理，再进行信度分析，其结果如表一所示：表一信度分析表

浅析语言测试中信度与效度两者之间的关系

浅析语言测试中信度与效度两者之间的关系语言测试在语言教学中处于中心地位，是从属于应用语言学这一学科的。在过去语言测试在应用语言学中处于边缘地位，而在长达三十多年的发展中，语言测试现已发展成为一个相对独立的学科，已经在学术上占有了一席之地。通过语言测试教育者可以及时发现学习者学习上存在的不足之处并在日后的教学过程中加以正确引导，也可以衡量教学任务和教学大纲的执行情况，但是这些都是基于科学的语言测试能够得到良好的反馈情况，反之，如果是一套不科学的语言测试就很可能对学习者做出错误的判断从而影响学习效率，所以科学的语言测试无论是对受教育者还是对教育者来说都是非常重要的。一套设计比较科学的测试应该是具有信度，效度，难度和区分度四点特征，信度与效度是难度和区分度的基础，同时也是语言测试的两大根本要求，只有正确认识了信度与效度两者之间的关系才能寻找出一个科学的方法使得语言测试更加科学准确。信度指的是测量的一致性，一个实验或测试的信度指它在重复测量时产生同样结果的程度，也就是说测量的稳定性是否一致。影响信度的因素很多，其不仅存在于考试过程中的各个环节，也存在于阅卷的过程中，如试卷中的试题长度偏长，项目种类多，那么测试的信度就会提高，反之则会降低，考试分数集中于某一点或某一个区域时信度也会有所降低；考试期间考生时间充裕那么估算能力考试的信度也相对较高等等，这些都是存在于考试过程中各个环节的部分举例，在阅卷过程中阅卷者自身的信度和阅卷者之间的信度等问题也是影响信度的因素之一，如在评阅主观性的题目时（作文，口语等），阅卷者在评分时就具有很大的主观色彩，而不同的阅卷者掌握的主观的评分标准在评阅主观性试题时，不容易取得一致，也会使得测试的信度不稳定。效度指的是我们所获的证据在多大程度上支持我们根据分数所做出的推断，也就是考试是否检测到了它所要检测的东西，是否达到了它的预定目标。效度共分为三种不同的类型，其不同类型的效度测试有各自不同的测试着重面，内容效度测试的目的是为了了解测试者在一些实际环境中是如何运作的，如果测试的样本能够充分代表总体，那么测试在内容上就是有效的，反之效度则不高；预测效度和共时效度都是属于与标准有关的效度，预测效度是标志测试者将来能力的标准，如通过摸底考试分班，共时效度是指一个测试结果与另一个同时使用的标准的结果的关系;构想效度是指要考察一个测试者在多大程度上和我们根据某一理论所作出的预测是否一致，也就是说验证的是我们所做的假设是否有效。信度和效度是语言测试中的两个最重要的方面，两者之间既相互依存又相互对立，可以说二者是存在于对立统一的一个整体中。

试卷分析：信度、效度、难度和区分度

附件6、难度、区分度、信度和效度的一般说明一、难度难度是指试题的难易程度，它是衡量试题质量的一个重要指标参数，它和区分度共同影响并决定试卷的鉴别性。一般认为，试题的难度指数在－之间比较合适，整份试卷的平均难度最好在左右，高于和低于的试题不能太多。 1、难度的两种定义（1）P=1－x/w 其中：x为某题得分的平均分数，w为该题的满分。这种定义法，难度值小时表明试题容易，值大时表明试题难，最小值为0，最大值为1。（2）P=x/w 这种定义法，难度值小时表明试题难，值大时表明试题容易，最小值为0，最大值为1。 2、难度的计算（1）主观性试题的难度 A、基本公式法：P=1－x/w B、极端分组法 P=1－(XH+XL)/2W 其中：XH为高分组的平均得分（前27%），XL为低分组的平均得

分（后27%）。（2）客观性试题的难度 A、基本公式法：P=1－R/N 其中：R为答对人数，N为全体人数。 B 极端分组法： P=1－（PH+PL）/2 其中：PH=RH/n叫高分组通过率，RH为高分组答对人数，n为总人数的前27%。PL=RL/n 叫低分组通过率，RL为低分组答对人数。二、区分度区分度是区分应试者能力水平高低的指标。试题区分度高，可以拉开不同水平应试者分数的距离，使高水平者得高分，低水平者得低分。而区分度低则反映不出不同应试者的水平差异。试题的区分度与试题的难度直接相关。通常来说，中等难度的试题区分度较大。另外，试题的区分度也与应试者的水平密切相关，试题难度只有等于或略低于应试者的实际能力，其区分性能才能充分显现出来。 1、区分度指标的评价 ≤D≤+，区分度指数越高，试题的区分度就越强。一般认为，区分度指数高于，试题便可以被接受。 2、区分度的计算方法（1）基本公式法：D＝（H－L）/N 其中：D代表区分度指数，H代表高分组答对题的人数，L代表

SPSS测量问卷信效度分析

测量问卷信效度分析信度和效度分析是问卷分析的第一步，也是检验该问卷是否合格的标准之一，所以，我们在做问卷调查的时候第一步就要进行信度和效度的分析，才能确保我们的问卷有意义。信度（Reliability）即可靠性，是指使用相同指标或测量工具重复测量相同事物时，得到相同结果的一致性程度。一个好的测量工具，对同一事物反复多次测量，其结果应该始终保持不变才可信。例如，我们用一把尺子测量一张桌子的高度，今天测量得高度与明天测量的高度不同，那么我们就会对这把尺子产生怀疑。因此，一张设计合理的调查问卷应该具有它的可靠性和稳定性。目前最常用的是Alpha信度系数，一般情况下我们主要考虑量表的内在信度——项目之间是否具有较高的内在一致性。通常认为，信度系数应该在0～1之间，如果量表的信度系数在0.9以上，表示量表的信度很好；如果量表的信度系数在0.8～0.9之间，表示量表的信度可以接受；如果量表的信度系数在0.7～0.8之间，表示量表有些项目需要修订；如果量表的信度系数在0.7以下，表示量表有些项目需要抛弃。信度分析是：“分析”——“度量”——“可靠性分析”，把所有主观题选到：“项目”中，确定即可,得出总的信度。把统一维度的题目选中，得出先关维度的信度。具体步骤：分析——度量——可靠性分析模型选择a，点击确定即可。结果分析：分析各个维度和总量的信度后，将它们列出一个表格，其中每个维度的a信度系数都大于0.7，说明该量表信度较好，符合问卷调查。效度（Validity）即有效性，是衡量综合评价体系是否能够准确反映评价目的和要求。是指测量工具能够测出其所要测量的特征的正确性程度。效度越高，即表示测量结果越能显示其所要测量的特征，反之，则效度越低。常用于调查问卷效度分析的方法主要有以下几种。 1、单项与总和相关效度分析这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度，它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和相关分析法获得评价结果，即计算每个题项得分与题项

调查表的的信度与效度评价方法

调查表的的信度与效度评价方法问卷调查法是教育研究中广泛采用的一种调查方法，根据调查目的设计的调查问卷是问卷调查法获取信息的工具，其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性，在形成正式问卷之前，应当对问卷进行试测，并对试测结果进行信度和效度分析，根据分析结果筛选问卷题项，调整问卷结构，从而提高问卷的信度和效度。一、信度分析信度（Reliability）即可靠性，是指采用同一方法对同一对象进行调查时，问卷调查结果的稳定性和一致性，即测量工具（问卷或量表）能否稳定地测量所测的事物或变量。信度指标多以相关系数表示，具体评价方法大致可分为三类：稳定系数（跨时间的一致性），等值系数（跨形式的一致性）和内在一致性系数（跨项目的一致性）。信度分析的方法主要有以下四种： 1、重测信度法同样的问卷，对同一组访问对象在尽可能相同的情况下，在不同时间进行两次测量。两次测量相距一般在两到四周之内。用两次测量结果间的相关分析或差异的显著性检验方法，评价量表信度的高低。 2、折半法。折半法是将上述两份问卷合成一份问卷（通常要求

这两份问卷的问题数目相等），每一份作为一部分，然后考察这两个部分的测量结果之间的相关性。 3、折半信度法折半信度法是将调查项目分为两半，计算两半得分的相关系数，进而估计整个量表的信度。折半信度属于内在一致性系数，测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷（如年龄与性别无法相比），常用于态度、意见式问卷的信度分析。在问卷调查中，态度测量最常见的形式是5级李克特（Likert）量表。进行折半信度分析时，如果量表中含有反意题项，应先将反意题项的得分作逆向处理，以保证各题项得分方向的一致性，然后将全部题项按奇偶或前后分为尽可能相等的两半，计算二者的相关系数（rhh，即半个量表的信度系数），最后用斯皮尔曼-布朗（Spearman-Brown）公式：求出整个量表的信度系数（ru）。 4、α信度系数法 Cronbach α信度系数是目前最常用的信度系数，其公式为：其中，K为量表中题项的总数，为第i题得分的题内方差，为全部题项总得分的方差。从公式中可以看出，α系数评价的是量表中各题项得分间的一致性，属于内在一致性系数。这种方法适用于态度、意见式问卷（量表）的信度分析。二、效度分析效度（Validity）即有效性，它是指测量工具或手段能够准确测出所需测量的事物的程度。效度分为三种类型：内容效度、准则效度

浅论语言测试的效度

浅论语言测试的效度 [摘要] 信度与效度是语言测试两大基本要求,信度与效度的关系问题是语言测试的根本问题。考试的效度指的是考试在多大程度上测出预期要测量的东西,信度指的是考试结果的可靠性。本文重点介绍了效度的含义,对效度的测量方法以及效度与信度的关系等问题做了详细的阐述。 [关键词] 语言测试效度信度 [Abstract] As a branch of applied linguistics, language testing has developed into a relative independent subject. Validity and reliability is the most important two criteria of language testing and the relationship of both is the ultimate issue. This article makes comments on the two criteria in detail. Validity is concerned with if a test measures accurately what it is intended to measure. Reliability means the quality of being reliable on consistency. This article puts emhasis on validity and also explains the testing methods of validity as well as the relation between validity and reliability. [Key words] Language testing validity reliability 一、引言语言测试学作为应用语言学的一个分支,现已发展成一个相对独立的学科。信度与效度原是计量学中的两个重要概念,30年代被引入语言测试领域,60年代以Lado等人为代表的结构主义测试学家对这两个概念进行了系统的阐述和论证,标志着语言测试已形成科学的体系,成为一门独立的学科。可以说语言测试理论和实践上的发展和纷争都是以信度与效度为主线进行的,信度与效度是语言测试的永恒主题。二、效度( Validity) 效度是一个相对概念。效度的有效性总是相对于一定的目的、功能和范围而言。效度具有相对性:任何测验的效度是对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效。同时,效度具有连续性,测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。根据美国心理学会1974年出版的《教育与心理测试标准》一书,考试的效度可分成三大类:内容效度(Content Validity)、构想效度(Construct Validity)和效标关联效度(Criterion-related Validity)。 (一)内容效度(Content Validity) 内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是

spss数据分析教程之spss信度分析和效度分析

s p s s数据分析教程之 s p s s信度分析和效度分析 Prepared on 21 November 2021

信度分析和效度分析数据计分方法说明 1 信度分析这里有63份问卷，首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图，问卷中的各个问题是否测量了相同的内容和信息；同时，对于调查问卷所得到的数据是否具有可靠性，就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关，它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言，如果问卷的信度系数达到0.9以上，该问卷调查的信度就较好；信度系数在0.8以上，是不错的；一般认为试卷信度在0.5至0.9以内是合理的，如果信度系数低于0.5，则此问卷的调查结果就不可信了。将以上63份问卷的数据用SPSS21.0先进行标准化处理，再进行信度分析，其结果如表一所示：表一信度分析表

表一显示，整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于 0.6，所以可以推断此问卷的可信度一般，该评价问卷只具有很较高的内在一致性。 2 效度分析具备信度的问题不一定具备效度，因此做完信度分析，再用SPSS21.0对其进行效度分析。 2.1 因子模型适应性分析效度分析使用的是因子分析模型，在运用因子模型分析之前，首先要对问卷数据进行因子模型适应性分析，分析结果如下表所示：表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.657 Bartlett 的球形度检验近似卡方1187.636 df465 Sig..000 由上表的数据可知，问卷数据的KMO值为0.657，并且通过了显着性水平为0.05的巴特利球型检验，说明问卷调查的数据非常适合做因子分析。 2.2 因子分析结果在进行了适应性检验之后，接下来就进行因子分析，其结果如下：表三方差贡献率解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 % 18.75228.23128.2318.75228.23128.231 4.93715.92615.926 2 3.25910.51438.745 3.25910.51438.745 3.76612.14828.074 3 2.7158.75847.503 2.7158.75847.503 2.9969.66637.740 4 2.2867.37454.877 2.2867.37454.877 2.7148.75646.496 5 1.51 6 4.89159.768 1.516 4.89159.768 2.5848.33554.831 6 1.342 4.32864.096 1.342 4.32864.096 2.076 6.69761.528 7 1.252 4.03868.134 1.252 4.03868.134 1.709 5.51167.040 8 1.053 3.39871.532 1.053 3.39871.532 1.393 4.49271.532 9.958 3.08974.620 10.880 2.84077.461 11.762 2.45979.920 12.714 2.30282.222 13.684 2.20784.429 14.623 2.01186.440 15.580 1.87088.309 16.509 1.64289.951

spss数据分析教程之SPSS信度分析和效度分析

信度分析和效度分析数据计分方法说明类别小分类对应题项每题计分方法维度计分方法题项职业倦怠情感枯竭 1-3题正向计分全部题项直接加总 3 去个性化 4-6题正向计分全部题项直接加总 3 个人成就感 7-10题逆向计分全部题项取倒数后加总 4 心理资本 11-18题正向计分全部题项直接加总 8 组织气氛 19-26题 21题为逆向计分，其余题项正向计分 21题取倒数后与其余题项加总 8 总体幸福感 27-31题 27题和31题为逆向计分，其余题项为正向计分 27和31题取到术后与其余题项加总 5 整体问卷以上各个维度的总分直接加总 31 讲问卷调查的数据进行如上表的数据预处理后，接下来再进行如下分析。 1 信度分析这里有63份问卷，首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图，问卷中的各个问题是否测量了相同的内容和信息；同时，对于调查问卷所得到的数据是否具有可靠性，就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关，它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言，如果问卷的信度系数达到0.9以上，该问卷调查的信度就较好；信度系数在0.8以上，是不错的；一般认为试卷信度在0.5至0.9以内是合理的，如果信度系数低于0.5，则此问卷的调查结果就不可信了。将以上63份问卷的数据用SPSS21.0先进行标准化处理，再进行信度分析，其结果如表一所示：表一信度分析表

类别Cronbach's Alpha项数整体问卷.61731 职业倦怠.82210 心理资本.8018 组织气氛.8378 总体幸福感.6795 表一显示，整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于0.6，所以可以推断此问卷的可信度一般，该评价问卷只具有很较高的内在一致性。 2 效度分析具备信度的问题不一定具备效度，因此做完信度分析，再用SPSS21.0对其进行效度分析。 2.1 因子模型适应性分析效度分析使用的是因子分析模型，在运用因子模型分析之前，首先要对问卷数据进行因子模型适应性分析，分析结果如下表所示：表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.657 Bartlett 的球形度检验近似卡方1187.636 df 465 Sig. .000 由上表的数据可知，问卷数据的KMO值为0.657，并且通过了显著性水平为0.05的巴特利球型检验，说明问卷调查的数据非常适合做因子分析。 2.2 因子分析结果在进行了适应性检验之后，接下来就进行因子分析，其结果如下：表三方差贡献率解释的总方差成份初始特征值提取平方和载入旋转平方和载入

语言测试的信度和效度及其关系

科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION 我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判断一份试卷的好坏的主要标准是:是否有信度、效度、区分度、实用性、全面性、公正性及后期效应。其中, 以信度和效度最为重要。一、语言测试的信度语言测试的信度, 又叫可靠性, 是指考试结果的可靠性和稳定性。即看学生的分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么我们说这次考试是有信度的; 反之 , 如果分数忽高忽低就说明信度不高 , 那么表明考试的信度不高。信度可以分为复测的效度、判卷的效度和每一个测试项目的效度。同一学生不管考多少次, 所得的分数都是一样, 那么就说这个分数有复测的可靠性。影响分数的一个很重要的因素就是判卷人, 在判卷过程中, 不同的判卷人对同一试卷也会做出不同的反映; 同一个人在不同的时间对同一试卷给的分数也是不一样的。试卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有信度的试卷。与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气热、考场周围太吵闹等。 2. 考试条件不一样。同一个学生在安静与吵闹的环境中做同一份试卷,其结果不一样。 3. 监考施策。不同的老师对考生的松与严, 看见考生作弊或违纪不勒令禁止。 4. 题目要求不清, 学生根本无法弄清题义, 也就无法真实的反映考生的水平。 5. 保密工作做的不好, 泄题事件发生。 6. 评分。主观测试的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评卷人的影响因此信度较高。 7. 样品数量太小, 样本不足。 8. 身体及心理状态不好等等, 这些因素都会影响到信度。因此, 为了提高信度, 我们必须对症下药, 采取各种措施。例如:提供统一规范的考试环境、规范监考、题目必须做到明了易懂等等。

信度真分数-练习题答案

心理测量学---真分数和信度部分的练习题 1.心理测量中有三种误差的形式，它们是___________，___________，抽样误差。 2.测验的分数就是该被试的真实水平或特征。（） 3.真分数是一个理论上的构想，在实际测量中可以得到。（） 4.真分数是无数次测量结果的平均值。（） 5.真分数和测量误差之间相互独立，即二者相关为0。（） 6.如何减少心理测量中的误差？ 7.测量分数、真分数和误差分数之间存在怎样的关系？ 8.计算重测信度时，相隔时间越长，稳定性系数（）。 9.对信度最严格的考验是（）系数。 10.同质性信度主要代表测验内部（）间的一致性。 A．两半测验 B．所有题目 C．题目与分测验 D．分测验 11.一般而言，若获得信度的取样团体较为异质的话，往往会（）测验的信度。 A．高估 B．低估 C．忽略 D．不清楚 12.用两个平行的（等值的）测验，间隔一段时距施测于同一组被试得到两组测验分数，求这两组测是（）。 A．复本信度 B．重测信度C．等值稳定性系数 D．内部一致性系数 13.用重测法估计信度，最适宜的时距一般是（）周为宜，间隔时间最好不超过（）个月。 A． 1周左右；4 B．4周左右；6 C．6周左右；8 D．8周左右；10 14.复本信度反映的是测验在（）上的等值性。 A．时间 B．题目 C．评分 D．形式

15.每个测验信度的估计值是唯一的。（） 16.每个测验信度的估计值不是唯一的。（） 18.重测信度就是稳定系数。（） 19.系统误差影响测验的信度。（） 20.随机误差影响测验的信度。（） 21.任何一个测验都只有一个重测信度。（） 22.任何一个测验都不只有一个重测信度。（） 23.任何一个测验都只有一个分半信度。（） 24.任何一个测验都不只有一个分半信度。（） 25.并不是所有的心理测验都要求有较高的同质性信度。（） 26.所有的心理测验都要求有较高的同质性信度。（） 27.测验的题目数量越多，信度越高。（） 28.影响信度系数的因素有哪些? 29.什么是信度？估计信度的方法有哪些？提高信度的方法有哪些？ 30.一个包含60个题目的测验信度是0.80，欲将信度提高到0.90，需要增加多少题目？某测验有10个项目，信度是0.60，问测验应增加到多少个项目，才能使信度达到0.90？ 31.一个测验有20道测题，其信度仅为0.55，若把测题增加到60题，信度能达到多少？ 32.已知一个测验的分半信度为0.61，请问校正后的信度是多少？ 33.同质性信度主要反映测验内部（）间的一致性。 A.两半测验 B.题目与分测验 C.所有题目

spss数据分析教程之SPSS信度分析和效度分析

信度分析和效度分析数据计分方法说明讲问卷调查的数据进行如上表的数据预处理后，接下来再进行如下分析。 1 信度分析这里有 63 份问卷，首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图，问卷中的各个问题是否测量了相同的内容和信息；同时，对于调查问卷所得到的数据是否具有可靠性，就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关，它的用途在于检测问卷本身的稳定性。信度分析中常用 Cronbach α系数的大小来衡量调查问卷的信度。一般而言，如果问卷的信度系数达到 0.9 以上，该问卷调查的信度就较好；信度系数在 0.8 以上，是不错的；一般认为试卷信度在 0.5至 0.9以内是合理的，如果信度系数低于 0.5，则此问卷的调查结果就不可信了。将以上 63份问卷的数据用 SPSS21.0先进行标准化处理，再进行信度分析，其结果如表一所示：表一信度分析表类别小分类对应题项每题计分方法维度计分方法心理资本组织气氛总体幸福感整体问卷情感枯竭 1-3 题正向计分去个性化 4-6 题正向计分个人成就感 7-10 题逆向计分 11-18 题 19-26 题 27-31 正向计分全部题项直接加总全部题项直接加总全部题项取倒数后加总全部题项直接加总 21 题为逆向计分，其余题项正向计分 27 题和 31 题为逆向计分，其余题项为正向计分 21 题取倒数后与其余题项加总 27 和 31题取到术后与其余题项加总以上各个维度的总分直接加总 3 3 4 8 8 5 31

整体问卷.617 31 职业倦怠.822 10 心理资本.801 8 组织气氛.837 8 总体幸福感.679 5 表一显示，整体问卷和问卷中的各个维度的 Cronbach's Alpha 系数值均大于 0.6，所以可以推断此问卷的可信度一般，该评价问卷只具有很较高的内在一致性。 2 效度分析具备信度的问题不一定具备效度，因此做完信度分析，再用 SPSS21.0 对其进行效度分析。 2.1 因子模型适应性分析效度分析使用的是因子分析模型，在运用因子模型分析之前，首先要对问卷数据进行因子模型适应性分析，分析结果如下表所示：表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验取样足够度的 Kaiser-Mey er-Olkin 度量。.657 近似卡方1187.636 Bartlett 的球形度检验df465 Sig..000 由上表的数据可知，问卷数据的KMO 值为0.657，并且通过了显著性水平为0.05 的巴特利球型检验，说明问卷调查的数据非常适合做因子分析。 2.2 因子分析结果在进行了适应性检验之后，接下来就进行因子分析，其结果如下：表三方差贡献率解释的总方差成份初始特征值提取平方和载入旋转平方和载入

如何进行问卷效度与信度分析

如何进行问卷信效度分析问卷调查法是教育研究中广泛采用的一种调查方法，根据调查目的设计的调查问卷是问卷调查法获取信息的工具，其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性，在形成正式问卷之前，应当对问卷进行试测，并对试测结果进行信度和效度分析，根据分析结果筛选问卷题项，调整问卷结构，从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析，本文主要讨论后者。一、信度分析信度（Reliability）即可靠性，它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示，大致可分为三类：稳定系数（跨时间的一致性），等值系数（跨形式的一致性）和内在一致性系数（跨项目的一致性）。信度分析的方法主要有以下四种：重测信度法：这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测，计算两次施测结果的相关系数。显然，重测信度属于稳定系数。重测信度法特别适用于事实式问卷，如性别、出生年月等在两次施测中不应有任何差异，大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变，这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次，被调查者容易受到各种事件、活动和他人的影响，而且间隔时间长短也有一定限制，因此在实施中有一定困难。复本信度法：复本信度法是让同一组被调查者一次填答两份问卷复本，计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外，在内容、格式、难度和对应题项的提问方向等方面要完全一致，而在实际调查中，很难使调查问卷达到这种要求，因此采用这种方法者较少。折半信度法：折半信度法是将调查项目分为两半，计算两半得分的相关系数，进而估计整个量表的信度。折半信度属于内在一致性系数，测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷（如年龄与性别无法相比），常用于态度、意见式问卷的信度分析。在问卷调查中，态度测量最常见的形式是5级李克特（Likert）量表。进行折半信度分析时，如果量表中含有反意题项，应先将反意题项的得分作逆向处理，以保证各题项得分方向的一致性，然后将全部题项按奇偶或前后分为尽可能相等的两半，计算二者的相关系数（rhh，即半个量表的信度系数），最后用斯皮尔曼-布朗（Spearman-Brown）公式，求出整个量表的信度系数（ru）。 α信度系数法：Cronbach α信度系数是目前最常用的信度系数。其中，K为量表中题项的总数，为第i题得分的题内方差，为全部题项总得分的方差。从公式中可以看出，α系数评价的是量表中各题项得分间的一致性，属于内在一致性系数。这种方法适用于态度、意见式问卷（量表）的信度分析。二、效度分析效度（Validity）即有效性，它是指测量工具或手段能够准确测出所需测量的事物的程度。效度分为三种类型：内容效度、准则效度和结构效度。效度分析有多种方法，其测量结果反映效度的不同方面。常用于调查问卷效度分析的方法主要有以下几种：单项与总和相关效度分析：这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度，它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和相关分析法获得评价结果，即计算每个题项得分与题项总分的相关系数，根据相关是否显著判断是否有效。若量表中有反意题项，应将其逆向处理后再计算总分。准则效度分析：准则效度又称为效标效度或预测效度。准则效度分析是根据已经得到确定的某种理论，选择一种指标或测量工具作为准则（效标），分析问卷题项与准则的联系，若二者相关显著，或者问卷题项对准则的不同取值、特性表现出显著