开放期刊系统

论证模式下考试分数解释效度研究

霄雁 徐(内蒙古自治区教育科学研究与监测评估院,中国)

摘要

效度作为教育测量的核心指标,其验证模式历经效标效度、分类效度、证据整合及系统论证四个发展阶段,逐步从单一技术验证转向多维度逻辑推理。本文聚焦Kane提出的解释使用论证模式(IUA),系统梳理其理论架构与实践价值。IUA模式引入图尔敏实用论证框架,将效度验证重构为由“评分”“概化”“外推”“决策”等环节组成的动态逻辑链条,强调通过多层级推理与反驳机制确保考试分数解释与使用的合理性。该模式突破传统效度验证的局限性,推动效度研究从“工具有效性证明”转向“解释合理性”论证,并通过整合多源证据、关注决策后果及动态更新机制,提升考试的社会信任与公平性。案例分析表明,IUA框架已成果应用于托福考试、医师资格考试等高风险测评,推动效度验证标准向实践理性转型。未来研究需进一步探索智能技术赋能、跨文化效度论证等方向,以应对复杂测评生态的挑战。

关键词

考试分数解释效度;效度验证;解释使用论证模式

全文:

PDF

参考

周群.基于论证的我国高考开发质量评价模型研究[D].华东师范大学,2011.

杨志明, 林兰兰. 基于效度证据的英语测验研发[J]. 教育测量与评价, 2021, (08): 3-9.

肖媛, 李玲玉, 李群锋, 张欣, 李佩泽. 基于证据观的医学汉语水平考试(MCT)效度研究[J]. 天津师范大学学报(社会科学版), 2021, (04): 52-57.

Kane, M. (1992). An argument-based approach to validity. Psychological Bulletin, 112(3), 527–535.

Kane, M. (2013). Validating the interpretation and uses of test scores. Journal of Educational Measurement, 50(1), 1–73.

Kane, M. (2016). Explicating validity. Assessment in Education: Principles, Policy & Practice. 23(2), 198–211.

Kane, M. (2021). Articulating a validty argument. In G. Fulcher & L. Harding (Eds.), The Routledge Handbook of Language Testing (pp.34-47).

周艳琼.《中国英语能力等级量表》自评量表的效度验证[J].现代外语,2021,44(01):101-112.

谢小庆. 效度:从分数的合理解释到可接受解释[J]. 中国考试, 2013, (07): 3-8.

Chapelle, C. A., Enright, M. K., & Jamieson, J. M. (2008). Building a validity argument for the Test of English as a Foreign Language.

Chapelle, C. A., Chung, Y.-R., Hegelheimer, V., Pendar, N., & Xu, J. (2010). Language Testing, 27(4), 443–469.

Ching-Ni Hsieh.(2024).Building a Validity Argument for the TOEFL Junior Tests.TOEFL® Research Report.



DOI: http://dx.doi.org/10.12345/jxffcxysj.v8i6.24811

Refbacks

  • 当前没有refback。
版权所有(c)2025 霄雁 徐 Creative Commons License
此作品已接受知识共享署名-非商业性使用 4.0国际许可协议的许可。
  • :+65-62233778 QQ:2249355960 :contact@s-p.sg