РУБРИКИ |
Психометрическое обоснование диагностических методик |
РЕКОМЕНДУЕМ |
|
Психометрическое обоснование диагностических методикПсихометрическое обоснование диагностических методикКонтрольная работа по психодиагностике ПСИХОМЕТРИЧЕСКОЕ ОБОСНОВАНИЕ ДИАГНОСТИЧЕСКИХ МЕТОДИК 1. ТРУДНОСТЬ ТЕСТОВЫХ ЗАДАНИЙ Теоретическая справка Определение степени трудности тестовых заданий является обязательной процедурой, с которой начинается анализ качества разрабатываемого теста. Основная цель анализа трудности заданий сводится к выбору оптимальных по сложности заданий, которые затем можно было бы упорядочить по нарастанию сложности. Тест не должен включать слишком легкие и слишком трудные задания. Обычно, если задачу решает большинство, ее помещают (как легкую) в начале теста. Если задачу решает незначительный процент испытуемых, то ее (как трудную) помещают в конце теста. Трудность задания определяется числом правильных ответов на данное задание в сравнении с общим объемом выборки по формуле: , где – количество испытуемых, давших правильный ответ, – общее количество испытуемых. Чем легче задание, тем выше этот показатель (А. Анастази,1982). Для большинства тестов принято, что задания с от 0,8 до 0,2 считаются удовлетворительными. То есть задачи, с которыми не справилось более 80% и менее 20% испытуемых, в тест не включают как мало полезные. Анастази считает, что уровень трудности должен иметь некоторый разброс, но в среднем он должен составлять 0,5. Именно в этом случае, тест обеспечивает лучшую дифференциацию результатов (см. ниже о дискриминативности теста). Если при составлении теста необходимо расположить его задания в порядке возрастания трудности, то тогда необходимо сравнить насколько одна задача трудней другой. Для этого используют статистические критерии, специально предназначенные для оценки значимости различий. В данном случае, чаще используют критерий хи-квадрат Мак-Немары: ([b - c]-1)2 c2= ¾¾¾¾ , где b + c где b – количество решивших первую задачу, но не решивших вторую,c – количество решивших вторую задачу, но не решивших первую. При χ2 > 6,63[1] различия в индексах трудности двух задач следует считать достоверными. Задание 1. Расчет индекса трудности заданий Цель задания: овладение приемами расчета индекса трудности заданий и их сравнения. Оснащение: микрокалькулятор, таблица первичных результатов (таблица №1). Таблица №1 Первичные результаты исследования с помощью теста Равена
Порядок работы: 1. Рассчитываем индексы трудности всех 12 задач. По формуле ,
U1=20/20=1 U2=16/20=0,8 U3=19/20=0,95 U4=20/20=0,55 U5=11/20=0,55 U6=15/20=0,75 U7=11/20=0,55 U8=8/20=0,4 U9=13/20=0,65 U10=18/20=0,9 U11=16/20=0,8 U12=17/20=0,85 2. Выделяем задачи, индекс трудности которых оказался оптимальным или близким к оптимальному для данной выборки испытуемых. : № 2,№ 5,№ 6,№ 7,№ 8,№ 9,№ 11 Форма протокола
3. Проранжировать задания по принципу возрастающей трудности.
4. Сравнить индексы трудности самой трудной и самой легкой задачи, используя критерий Мак-Немары. Самые легкие задачи № 1 и № 4,так как их решили все. Самая трудная задача № 8,решили восемь человек. Сравним индексы трудности ([b - c]-1)2 ([12 - 0]-1)2 c2= ¾¾¾¾ = ¾¾¾¾ = 10,083 b + c 12 + 0 5. Оформить протокол и сделать выводы о том, индекс трудности каких заданий оказался оптимальным для данной выборки испытуемых; какие задачи были самой легкой и самой трудной для них; какова достоверность различий между самой трудной и легкой задачей. 6. Вывод:10,083 больше, чем 6,63 значит, различия в индексах трудности следует считать достоверным. 2. ДИСКРИМИНАТИВНОСТЬ ТЕСТОВЫХ ЗАДАНИЙТеоретическая справка При разработке теста необходимо стремиться к тому, чтобы его задания как можно тоньше измеряли тестируемое свойство. Например, если в результате обследования почти все испытуемые получают примерно одинаковые результаты, то это означает, что тест измеряет очень грубо. Чем большее количество градаций результатов можно получить при помощи теста, тем выше его разрешающая способность. Мера тонкости измерения (или степень диффиренцируемости результатов) теста называется в психометрике дискриминативностью. Дискриминативность теста измеряется показателем дельта Фергюсона: , где N – количество испытуемых , n – количество заданий, fi - частота встречаемости каждого показателя. Наименьшая дискриминативность теста при δ = 0, наибольшая при δ = 1. Задание 2. Расчет индекса дискриминативности заданий. Цель задания: овладение навыком расчета индекса дискриминативности. Оснащение: микрокалькулятор, таблица первичных результатов (таблица №2). Первичные результаты исследования по субтесту «Арифметические задачи», которые выполняли 122 испытуемых. Таблица №2
Порядок работы: 1. Составьте таблицу. 2. Подсчитайте, как часто встречаются значения показателей для данного теста. 3. Возведите эти числа в квадрат и проссумируйте: Σ f². 4. Прибавьте 1 к количеству заданий: n + 1. 5. Возведите в квадрат количество испытуемых: N². 6. Помножьте количество заданий на результат шага 4: n N² 7. Теперь у нас есть все элементы формулы. Подставьте их и рассчитайте коэффициент. 8. Сделайте вывод о дискриминативности субтеста «Арифметические задачи». Рассчитываем по формуле : Фергюсона:
N - количество испытуемых N=122, n - количество заданий n=25, fi - частота встречаемости каждого показателя. Σ f²=812 2 δ = (25+1) х (122-812) = 0,98 25х122 Вывод: δ = 0,98 данный показатель указывает на высокую дискриминативность, так как наибольшая дискриминативность при δ = 1. Показатель δ = 0,98 приближается к единице. 3. НАДЕЖНОСТЬ ТЕСТОВЫХ ЗАДАНИЙ Теоретическая справка Под надежностью теста понимается степень точности, с которой тест измеряет определенное свойство или качество. Надежность теста – это характеристика точности его как измерительного инструмента, его устойчивость к действию помех (как внешних, так и внутренних). Эмпирическое определение надежности теста является обязательным условием его допуска для использования в практической деятельности психолога. Задание 3. Расчет коэффициентов надежности Цель задания: овладение приемами расчета коэффициентов надежности заданий при помощи расщепления теста на две части (надежность частей теста). Оснащение: микрокалькулятор, таблица первичных результатов (таблица №3). Таблица №3 Первичные результаты исследования с помощью теста Равена (n=36, N=80).
Порядок работы: 1. Разделить задачи из Таблицы №3 на две части – нечетные (X) и четные (Y). 2. Вычислить средние арифметические для каждой части (). Результаты вычислений занесите в следующую таблицу: Вычисляем средние арифметические для каждой части ().
= 955/18=53 = 864/18= 48; 3. Вычислить стандартные отклонения для каждой части (, ) по формуле: , где- разность между значениями варианты и средней арифметической величиной нечетной и четной частей теста, - количество задач в нечетной и четной частях теста. Вычисляем стандартные отклонения для каждой части (, ) по формуле: , n – количество задач в нечетной и четной частях теста = 18 (для нечетной части теста)= ,22,5 ( для четной части) = = = 24,1624,2 4. Вычислить коэффициент полной корреляции между частями теста используя формулу Пирсона: , где- разность между значениями варианты и средней арифметической величиной нечетной части теста, - разность между значениями варианты и средней арифметической величиной четной части теста. Вычисляем коэффициент полной корреляции между частями теста используя формулу Пирсона: , == = 0,7950,8 0,8 коэффициент полной корреляции между частями теста. 5. Вычислить коэффициенты надежности, используя следующие формулы: а) Спирмана - Брауна: где - коэффициент корреляции по Пирсону, - стандартные отклонения нечетных и четных задач, - общее количество задач в тесте. 6. Сделайте вывод о надежности теста Равена. а) Спирмана - Брауна: = = 0,88 0,9 б) Фланагана: = = = Вывод: тест Равенна можно считать надежным, так как коэффициенты надежности приближаются к единице. 4. СТАНДАРТИЗАЦИЯ ТЕСТОВЫХ ШКАЛТеоретическая справка Стандартизация тестовых шкал – это создание таких критериев (таблиц), по которым можно будет преобразовывать первичные результаты выполнения теста в относительные оценки. Например, испытуемый выполнил 16 заданий теста математических достижений из 32 и получил за это 16 баллов из 32 максимально возможных. Таким образом, получается, что он выполнил половину всех заданий, - 50% . Значит ли это, что его достижения можно оценить как СРЕДНИЙ УРОВЕНЬ? Ответ на этот вопрос будет зависеть от того, с чем именно мы будем сравнивать полученный испытуемым результат, с чем будем его соотносить. Если соотносить с максимально возможным баллом, то действительно можно будет сказать, что у испытуемого средний уровень математических достижений. Ну, а сели сравнить с результатами других испытуемых? Например, одинаковых с ним по возрасту, полу, социальному положению и т.п.? Вполне может оказаться, что в этом случае наш испытуемый имеет низкий или высокий уровень достижений. Все будет зависеть от того, сколько еще людей из сравниваемой выборки набрали такие же результаты, сколько - набрали ниже, сколько - набрали выше. Таким образом, во-первых, необходимо иметь данные о результативности выполнения теста определенной выборкой испытуемых, с которой мы будем соотносить наши результаты. А во-вторых, эти данные о результативности мы должны как-то разделить на равные уровни по степени результативности. При этом количество уровней может быть разным – 5 уровней результативности, 9, 10 или 100. И затем, сравнив полученные конкретным испытуемым баллы, мы можем определить его место в той выборке, с которой его соотносим. В данной работе предлагается познакомиться с методами разделения распределения результативности выполнения теста на отдельные уровни. 1.Наиболее простым способом нормирования (разделения распределения на уровни) является шкала процентилей. Процентиль – это точка на числовой шкале, состоящей из 100 уровней. Ранг показателя в процентилях определяется процентным отношением в нормативной группе тех испытуемых, которые получили более низкий показатель. Например, 15 процентиль (Р15)означает, что 15% из нормативной выборки получили показатели ниже данного. Вычисление процентиля немногим сложнее, чем его определение. Оно выражается следующей формулой: Pp = L + , где Pp - искомая величина на шкале процентилей, L - фактическая нижняя граница интервала оценок, содержащего частоту rn, pn - произведение общего количества данных n на относительную частоту (т.е.p/100), f cum - накопленная к L частота, f - частота оценок в интервале, содержащем оценку rn. Расчет рекомендуется проводить по следующему алгоритму: а) Упорядочить полученные результаты по возрастанию. б) Каждому первичному результату приравнять его частоту, т.е.количество испытуемых получивших такой же результат; в) Произвести накопление частот г) Подставить значения в формулу. ПРИМЕРПреподаватель предложил 125 учащимся контрольное задание, состоящее из 40 вопросов. В качестве оценки теста выбиралось количество вопросов, на которые были получены правильные ответы. Распределение частот различных результатов приводится в таблице № 4. Необходимо определить каков 25-й процентиль в группе 125 оценок, т.е. чему равен Р25. Р25 – это точка, ниже которой лежат 25% 125 оценок. Таблица № 4. Оценки по тесту и их частоты.
Вычисление любого процентиля упростится, если построить распределение накопленных частот. Накопленные частоты к любой заданной оценке представляют собой суммарное количество частот на этой оценке и ниже ее. В третьем столбце таблицы указаны накопленные частоты для 125 оценок контрольного задания. Так, например тестовую оценку 33 и меньше получило 106 учащихся. Вычисление Р25 можно выполнить за 5 шагов: Шаг 1. r= 0,25, rn = 0,25n =0,25X125 = 31,25 Шаг 2. Найти фактическую нижнюю границу разряда оценок, содержащую испытуемого с оценкой 31,25 снизу: так как 16 человек имеют оценки 28 или меньше, а 34 – оценки 29 или меньше, то частота 31,25 лежит в интервале разряда оценок 28,5- 29,5. L = 28,5 Шаг 3. Вычесть накопленную к L частоту из 31,25 31,25 – 16 = 15,25 Шаг 4. Разделить результат 3-го шага на частоту f в интервале, содержащем оценку 31,25 = 0,85 Шаг 5. Прибавить результат 4-го шага к L Р25 = 28,5 + 0,85 = 29,35 Шкала процентилей позволяет оценить отдельный индивидуальный результат относительно других индивидуальных результатов в исследуемой выборке. Самым большим недостатком шкалы процентилей является то, что она не отражает формы первичного распределения результатов. Распределение процентилей всегда равномерно (прямоугольно), тогда как распределение для многих тестов приближается к нормальному и небольшие отклонения от среднего значения сильно увеличиваются процентилями, а относительно большие отклонения, наоборот, сжимаются. Процентили могут таким образом исказить результаты и поэтому их использование не рекомендуется. 2. Наиболее распространенными преобразованиями первичных оценок являются центрирование и нормирование посредством среднеквадратических отклонений (z-преобразование). Под центрированием понимается линейная трансформация величин признака, при которой средняя величина распределения становится равной нулю. Так, если при обследовании группы испытуемых с помощью вновь разрабатываемого теста, средний результат по группе равен 17 «сырых» баллов, то эта величина может быть выбрана в качестве центра отсчета шкалы, в обе стороны от которой симметрично располагаются значения больше и меньше среднего. Для z-преобразования применяется следующая формула: где- разность между первичным результатом тестового измерения и средней арифметической величиной, - стандартное отклонение для данной выборки. Неудобство дальнейшей работы со стандартной шкалой состоит в том, что приходится оперировать отрицательными и положительными величинами, а также нулем. От стандартной z-шкалы легко осуществить переход к любой другой, более удобной шкале. Для этого используется линейное преобразование типа , где a>0,0, константы a и b – произвольные действительные числа, выбор которых определяется исключительно удобством дальнейшей работы со шкалой. В практике психологического тестирования используют ряд так называемых нормализованных шкал: T-шкала, шкала Векслера, шкала Амтхауэра, шкала стенов, шкала станайнов и др. Задание № 4 Стандартизация тестовых шкал Оценки по тесту и их частоты
На основе данных таблицы рассчитываем процентили: Pp = L + , Шаг 1. Рр =5/100х125=6,25 Шаг 2. Находим нижнюю границу разряда оценок содержащую испытуемого с оценкой 6,25 снизу: так как 6 человек имеют оценки 27 или меньше, а 16 человек – оценки 28 или меньше, то частота 6,25 лежит в интервале (27-28) следовательно, L=(27+28)/2=27,5. Шаг 3. Вычитаем накопленную к L частоту из 6,25 6,25-6=0,25,где 6= f cum Шаг 4. Разделим результаты третьего шага на частоту f в интервале, содержащим оценку 6,25 0,25/10=0,05, где f = 10. Шаг 5.Р5=27,5+0,025=27,52527,53 Таким, образом, 5 % испытуемых имеют оценку 27,53 и ниже Р10=27,5+(12,5-6)/10=27,5+0,65=28,15 Р20=28,5+(25-16)/18=28,5+0,5=29 Р30=29,5+(37,5-34)/24=29,5+0,145 29,65 Р40=29,5+(50-34)/24=29,5+0,66 30,17 Р50=30,5+(62,5-58)/23=30,5+0,195 30,7 Р60=30,5+(75-58)/23=30,5+0,74 31,24 Р70=31,5+(87,5-81)/17=31,5+0,38 31,88 Р80=32,5+(100-98)/8=32,5+0,25= 32,75 Р90=33,5+(112,5-106)/9=33,5+0,72= 34,2 Р95=34,5+(118,75-115)/5=34,5+0,75= 32,25 Р100=38 Задание 4. Построение шкалы процентилей Цель задания: овладение приемами стандартизации тестовых шкал на примере построения шкалы процентилей. Оснащение: микрокалькулятор, таблица первичных результатов (таблица № 4). Порядок работы: 1. На основе данных таблицы № 4, рассчитать P1, P5, P10, P20, P30, P40, P50, P60, P70, P80, P90, P95, P100. 2. На основе полученных данных построить шкалу процентилей. 24 38 P1 P100 Задание 5. Построение нормализованных шкал Цель: овладение приемами преобразования первичных результатов в нормализованные шкалы. Оснащение: микрокалькулятор, таблица первичных результатов (таблица №4). Порядок работы: 1. Произвести линейное преобразование первичных результатов (z-трансформацию): 1) вычислить среднюю арифметическую величину (); 2) рассчитать среднеквадратическое (стандартное) отклонение по формуле: , где - разность между значениями варианты и средней арифметической величиной, - частота варианты, - количество вариант. 1. Произвести линейное преобразование первичных результатов (z-трансформацию):
= 465/15=31 = 727 2) рассчитаем среднеквадратическое (стандартное) отклонение по формуле: , где - разность между значениями варианты и средней арифметической величиной, - частота варианты, - количество вариант. ====7,206 2) произвести линейное преобразование по формуле: , где- разность между первичным результатом тестового измерения и средней арифметической величиной, - стандартное отклонение для данной выборки. Результаты вычислений занести в таблицу.
1) T-шкала ; 2) Шкала Векслера ; 3) Шкала Амтхауэра . [1] 6,63 – это критическое значение критеря хи-квадрат с 1 степенью свободы и при ρ = 1%. |
|
© 2010 |
|