Irt模型的鉴别标准200909292. IRT 模型的 准鉴别标
IRT 理 是否适合于 个 ,取决于 数据与所论 这 测验 测验 选
用的 IRT 模型是否匹配
如果数据匹配模型,那么该 IRT 模型适用于 个这 测验
3. 准一:准 用标 确选 1PLM , 2PLM 或
3PLM
参考文献: 63 , 66 , 68 , 141 , 119
4PLM 的 理念是 了削弱被 的疏忽 来的影响,设计 为 试 带
但 用 并不能 个效果实际应 发现 实现这
( 126 , 6 , 11 )
是否需要猜 系数测 c 依靠 判断经验
区分度 a 是否相等的 准是:鉴别标
算 目得分与 分的点二列相 ,如果“区分度计 项 总 关 a 相等”的假
成立的 ,那么 些相 系数 集中在一个 小的范 内设 话 这 关 应该 较 围
,例如 MEAN±15%
一 准是 性的这 标 经验
4. 准二:标 IRT 模型的强假设
性假 :单维 设
主成分分析,第一因子解 方差比例大于释 40% ( 149 )
目特征曲 假 :项 线 设
将 θ 从( -3 , 3 )分做 12 等分,以各区 的中点作 区间 为该
的能力 代表间 值
以落在区 内的被 的平均正 反 概率作 正 反 概间 试 确 应 为实际 确 应
率的估计
制作散点 ,模型匹配程度需要 察和图 观 经验
非限 性假 :时 设
,比 限经验 较 时 30 分 的成 和限钟 绩 时 40 分 的成钟 绩
5. 准三: 目参数和能力参数估 不 性标 项 计 变
目参数估 不 性:项 计 变
由于不同被 本能力分布不同, 以 度参数试样 鉴别 难 b 量表 基为
准,即 b 的均值为 0 , 准差标 为 1
取 4 个子 本,样 M1 , M2 , F1 , F2
每个子 本分 估 目参数,以 度参数量表 基准对 样 别 计项 难 为
作散点 以及相 分析(两两 图 关 Augofl ,“基 ,线 baseline” )
能力参数估 不 性:计 变
特(赖 215 )的方法是将 目分成 度高和 度低的 个项 难 难 两 组
,但是在 度与能力不相符合的情况下,信息量就会 少难 减
所以更好的 法是随机分 ,然后 不同 估 出来的能办 组 对 试题组 计
力参数作相 分析关
6. 准四:模型 能力(效度)标 预测
残差分析( 65 ):
IRT 的残差分析可以 每一道 目,而针对 题 CTT 只 全部 目针对 题
定 被义 试 j 在 目项 i 上的 准残差:标
对 θ 的每一个小区 算平均 准残差:间计 标
作 θ 对 Zres 的散点 ,图 Zres 当平均分布在应 θ 的 ,越轴 两侧
靠近 θ 越好轴
, ,
, ,
, ,
i j i j
res i j
i j i j
u P
Z
P Q
−
=
, , , ,
1
1 gn
res i g res i j
jg
Z Z
n =
= ∑
7. RMSE
root mean square error 均方根 差:误
δ=sqrt[(Σ(di^2))/(n-1)]
n 量次数;为测 di 一 量 与平均 的偏差。如果 差为 组测 值 值 误 统
分布是正 分布,那么随机 差落在土计 态 误 σ 以内的概率为
68 %。
8. 目之 的比 (项 间 较 Tatsuok )
差 性系数:异
即 条两 ICC 之 的面间 积
2
( , ) ( ( ) ( ))i ji j P P dθ θ θ
+∞
−∞
∆ = −∫