При разработке тестов в первую очередь определяются объективные характеристики заданий теста, для этого производится математико-статическая обработка результатов тестирования на большой группе учащихся. В середине прошлого века на Западе была разработана теория создания тестов (Item Response Theory), которая направлена на оценку латентных параметров испытуемых и заданий теста.
В основе этой теории лежит предположение о наличии вероятностной связи между результатами, наблюдаемыми при тестировании и латентными характеристиками испытуемого и заданий теста, которую можно записать в виде:
,
где xij - элемент матрицы ответов, который равен 1, если ответ i-го испытуемого на j-е задание верный, 0 - в противном случае; Θi - значение параметра уровня подготовленности i-го испытуемого, i =1..N; βj - значение параметра трудности j-го задания, j=1..n; f - логистическая функция, зависящая от выбранной модели IRT(Item Response Theory).
Item Response Theory (IRT) - английское название теории, используемой преимущественно в педагогических и психологических измерениях. Эта теория смогла привлечь к себе внимание классиков мировой теории педагогических измерений и психометрики, математиков, статистиков, программистов, педагогов и управленцев сферы образования многих стран мира.
В данной работе рассматривает одна из моделей IRT - однопараметрическая модель Г.Раша [1]. Модель Г.Раша описывает вероятность правильного решения тестового задания как функцию, зависящую от уровня подготовленности испытуемого и трудности тестового задания. Исходными данными для модели Г.Раша являются результаты тестирования испытуемых, представленные бинарной матрицей ответов (эмпирических данных):
,
где - количество участников тестирования; - количество заданий в тесте.
Используя данную матрицу требуется найти уровень подготовленности испытуемых и трудность для каждого тестового задания , соответствующие дихотомической модели Г.Раша:
.
где - вероятность того, что -й испытуемый выполнит правильно -е задание (и, таким образом, получит 1 балл за выполнение этого задания) [2].
На основе значений модели Г.Раша можно получить следующие характеристики:
- информационная функция j-го тестового задания:
- информационная функция теста:
- стандартная ошибка измерения:
Рассмотрим решение задачи поиска параметров модели Г.Раша в среде MathCAD. Результаты тестирования испытуемых представим бинарной матрицей ответов:
Вычислим начальные приближения и :
Вычислим первичные баллы испытуемых и среднюю сложность тестового задания:
Решение системы уравнений для нахождения и :
Визуализация функций вероятности успеха для каждого участника тестирования и вероятности успешного выполнения для каждого тестового задания:
Вычисление информационной функции для j-го тестового задания:
Вычисление информационной функции теста:
Стандартная ошибка измерения по модели Г.Раша:
Список литературы
1. Рыбанов А.А. Поиск наилучшего значения параметра дифференцирующей силы тестового задания для модели Бирнбаума // Педагогические измерения. 2012. №4. С. 40-50.
2. B.D.Wright, G.N.Masters. Rating scale analysis. Rasch measurements. - Chicago: MESA Press, 1982.