主办:人力资源和社会保障部人事考试中心  协办:  中国共产党新闻网 设为首页加入收藏联系我们
中国人事考试网>>考试文化

考试测量学基础知识介绍

2014年01月16日10:36        手机看新闻
打印网摘纠错商城分享推荐           字号

在测量学中,评价考试试题、试卷质量的指标主要有难度、区分度、信度和效度。

一、难度

难度是题目的难易程度的指标,是指正确答对一道题的比例或通过的百分比,试题的难度值在0到1之间。

试题的难度值越高,表明答对该题的人越多,该题越容易。

试卷的难度值为全部试题的平均难度。

二、区分度

区分度是指试题对不同水平的考生的区分能力,取值范围在-1到1之间。测验的区分度高,则水平高的考生得分高,水平低的考生得分低。

一道试题的区分度好,意味着得分高的考生在这道题上答对的可能性高于得分低的考生。

一份试卷的区分度好,则水平高的考生得分高,水平低的考生得分低。

难度适中(0.5)的试题,区分度一般较好。

三、信度

信度是反映测验成绩在不同条件下的一致性程度的指标,它反映了测验受随机误差的影响程度。例如,用一把尺子测量桌子的长度,无论谁测量、什么时候测量、在哪儿测量,结果都是一致的,我们就认为尺子这个测量工具是可靠的,具有高信度。

测验作为一个测量工具,如果使用同一试卷测验多次,且测量结果较为一致,就说明这个测验的信度较高(比较可靠)。测验在多大程度上反映了考生的真实水平,就是测验的信度(测验的可靠性),是评价考试质量最基本的指标。

四、效度

效度是测验的有效性指标。一个测量只是对某一种目的来说才是有效的。比如尺子只是在测量长度时才有效,对于测量重量就是无效的。同样,一个能力测验总会反映出一个人的某些能力特质,一个信度高的测验还会反映出一个人的真实水平,但这不一定恰好反映出我们想要了解的那个方面的水平。

所谓效度就是测验对于想要了解的(能力)特质进行测评的有效程度。比如说,历史考试主要测量的是一个人的历史知识,但他的得分不仅反映了他的历史知识,还反映了其他方面的能力和知识,如语文、地理等。一个效度低的测验,得分在很大程度上受到其他能力特质的影响,很大程度上反映的并不是所要测量的心理特质。

(责编:高雷、权娟)