О НЕКОТОРЫХ ПРОБЛЕМАХ СТАТИСТИКИ В ПЕДАГОГИЧЕСКОЙ ПСИХОЛОГИИ

 

Черненко В.В., Кадыров Р.В.

В различных областях человеческой деятельности часто возникают ситуации, когда по имеющейся информации (данным) Х требуется предсказать (спрогнозировать) некоторую величину Y, стохастически связанную с Х (т.е. Х и Y имеют некоторое совместное распределение L (X, Y)), но которую непосредственно измерить невозможно (например, Y может относиться к будущему, а Х – к настоящему). Так, например, безусловно представляется интересным спрогнозировать уровень успешности обучения курсантов 1-го курса на основе учета некоторых характеристик их личности, полученных при профессионально психологическом отборе (ППО) во ВВМУЗ. Заметим, что при этом совместное распределение L (X, Y) можно оценить по аналогичным данным за прошлые годы. Такой прогноз позволяет преподавателям применить управляющие воздействия различного характера на процесс обучения тех курсантов, прогноз успешности обучения которых явно неутешителен.
Решение задачи прогнозирования успешности обучения можно решить рядом методов: методом многопараметрической линейной регрессии (однопараметрической регрессии), методом дискриминантного анализа, методом нелинейной регрессии [1 - 4].
Необходимо заметить, что на использование выше указанных методов прогнозирования (в частности, метода  многопараметрической регрессии) накладывается ряд ограничений [1, 3]:
1. Зависимость между зависимой переменной и независимыми переменными должна быть линейной.
2. Переменные должны быть измерены в шкале интервалов или отношений.
3. Иметь гауссовское распределение.
4. Нельзя пользоваться суммой независимых переменных наряду с самими независимыми переменными.
5. Следует избегать включения в анализ независимых переменных, коэффициент корреляции между которыми больше 0,8.
При нарушении этих условий к полученным результатам необходимо относиться с осторожностью [1, 3].
Таким образом, требование п. 2 означает невозможность использования вышеуказанных методов прогнозирования в педагогике, так как согласно мнения авторов работ [5 - 7] как зависимая переменная Y (в нашем случае - успешность обучения) так и независимые переменные (в нашем случае – уровни структурных составляющих интеллекта – УССИ) измерены в порядковой шкале.
Однако необходимо заметить, что в работе [1] изобретен “удивительный” способ доказательства, что признак измерен в шкале интервалов или шкале отношений, который заключается в том что “… если выборочное распределение не отличается от нормального, то это значит, что измеряемое свойство удалось отразить в метрической шкале (обычно – интервальной)” [1].
В работах [1, 3] предлагается ряд критериев для проверки закона распределения выборки на соответствие нормальной модели, в частности, критерий, основанный на оценке коэффициентов асимметрии и эксцесса и сравнении их со стандартными ошибками в оценке этих коэффициентов, критерий Колмогорова-Смирнова, c2-Пирсона. Но заметим, что в работе [8] указано, что критерий Уилка-Шапиро для проверки на соответствие нормальной модели, является наиболее мощным критерием, правда, если измерение проведено в шкале интервалов или шкале отношений. Если мы не знаем, в какой шкале проведено измерение, то для этой же цели разумнее использовать критерий c2-Пирсона, так как по утверждению автора работы [3] его можно использовать при любой шкале измерений. Однако заметим, что согласно мнению авторов работ [8, 9], критерии c2-Пирсона, Уилка-Шапиро, Колмогорова-Смирнова являются критериями согласия и которые в свою очередь могут гарантированно отвергать модель, но утверждать, что модель верна, они не могут. То есть при использовании критериев согласия утверждение, что для отклонения модели (в частности, нормальной) основания нет, отнюдь не есть утверждение, что данная модель и есть искомое распределение, поэтому не отклонение модели нельзя рассматривать как утверждение о правильно выбранной модели. Определенным ответом является лишь отрицательный ответ. Действительно, как указывается в работе [10], априорные соображения о нормальном законе распределения, якобы чаще встречаемся в различных областях науки и техники и основанные на центральной теореме представляются сомнительными, так утверждение центральной предельной теоремы носит асимптотический характер, и никогда нет уверенности в том, что число факторов достаточно велико, чтобы гарантировать нормальность и кроме того однородность факторов по мощности тоже сомнительна. Также в этой работе приводятся данные о значении коэффициента асимметрии (b1) и коэффициента эксцесс (b2), регистрируемого в различных областях науки. Так для технических измерений значение b2 лежало в пределах от 3,7 до 3,9, а b1 – от -0,4 до 1,8. Величины (b1, b2) принимают следующие: (2; 6,3) – для распределения возраста невест в Австралии в 1907 – 1914 гг.; (2; 5,3) – для распределения возраста женихов; (2,1; 4,8) – для длины бобов; (-0,4; 3,6) – для их ширины. Таким образом, реальные распределения наблюдаемых величин асимметричны и имеют более “тяжелые” хвосты, чем нормальное распределение.
Однако заметим, что большинству статистических критериев, основанных на допущении нормального распределения выборки, существуют их непараметрические аналоги, которые часто являются критериями робастными как к эффективности, так и к наличию в выборке аномальных измерений. Поэтому часть проблем статистической обработки результатов измерений, связанных с идентификацией закона распределения явно надумана. Так как если выполняется условие нормальности распределения (а это условие, как было показано выше, очень трудно проверяемо), то параметрические критерии эффективнее, чем непараметрические. Однако, если же это условие не выполняется, то эффективность параметрических критериев может резко снизиться и непараметрические критерии получают явное преимущество.
Как указано в работе [11], Ходжес и Леман показали, что асимптотическая относительная эффективность непараметрических методов, основанных на статистике знаковых рангов по отношению к их соперникам, использующим теорию нормального распределения при альтернативах сдвига, задается величиной I1 (F), где F – функция распределения, общая для всех наблюдений и для непрерывных симметричных совокупностей I1 (F) не может быть менее 0,864, зато может быть бесконечной. В частности для нормального распределения I1 (F) = 0,955, а для равномерного распределения I1 (F) равно 1,0, а для распределения Лапласа I1 (F) равно 1,5. В этой же работе показано, что асимптотическая эффективность критериев, основанных на критерии знаков, по отношению к их соперникам, использующим теорию нормального распределения, выражается величиной I2 (F), где F – функция распределения, общая для всех наблюдений, причем I2 (F) никогда не бывает менее 0,333, но может быть бесконечной. Данные эффективности приведены в случае одновыборочных указанных методов, в случае же повторных парных наблюдений нижние границы I1 (F) и I2 (F) не достигаются. В случае непараметрических методов, основанных на статистике суммы рангов W, для альтернатив сдвига по отношению к из соперникам, использующих теорию нормального распределения асимптотическая эффективность выражается через параметр I1 (F).
Таким образом, вышесказанное позволяет сделать вывод, что целесообразнее использовать непараметрические критерии, так как это позволит минимизировать максимальный проигрыш в случае неадекватности предлагаемой модели. Кроме того, большинство непараметрических критериев (подчеркиваем – не все) могут быть корректно использованы в шкалах порядка, интервалов и отношений, тогда как параметрические критерии можно корректно использовать только в шкалах интервалов и отношений.
Ранее мы указывали, что для проверки гипотезы о возможном соответствии закона распределения выборок, получаемых при психологических измерениях целесообразно использование c2 (при соблюдении условия, что объем выборок должен быть большим – порядка 500 значений [9]). Проведенные нами исследования для проверки нулевой гипотезы (Н0) для ряда выборок различных психологических характеристик обучаемых показали следующие результаты.
Ни одна выборка результатов измерений УССИ не принадлежит гауссовской совокупности, так как уровни значимости отвержения Н0 не превышает a = 0,0. Аналогичный результат получен и при использовании критерия Колмогорова-Смирнова, использование которого позволило отвергнуть Н0 на уровнях значимости a < 0,01.
Заметим, что применение критерия Уилка-Шапиро к выборкам УССИ (М1 – М10) позволяет сделать вывод, что Р = 0,0, что в свою очередь свидетельствует о том, что выборки взяты не из гауссовской совокупности.
Объем исследуемой выборки составляет 3023 респондента.
Аналогичную проверку на соответствие принадлежности выборок, определяющих характерологические черты личности по многофакторному личностному опроснику Р. Кеттела 16PF (версия С) [12] проведем с помощью критерия c2-Пирсона из пакета статистических программ, предложенного в работе [4]. Объем исследуемой выборки составляет 2379 респондентов.
Из полученных нами результатов следует, что ни одна из выборок не принадлежит гауссовской совокупности, так отвержение Н0 проведено на уровне значимости a = 0,0. Применение критерия Колмогорова-Смирнова к этим данным позволяет отвергнуть Н0 на уровне значимости a £ 0,01, что также свидетельствует о не принадлежности выборок гауссовской совокупности.
Применение критерия Уилка-Шапиро [4] дает вероятность принадлежности выборок к гауссовской совокупности Р = 0,0.   Но заметим, что все критерии дают одинаковые результаты. Хотим обратить внимание на мнение автора работы [12], что при анализе и интерпретации данных тестирования по опроснику Р. Кеттела 16PF (версия С), в различных литературных источниках описываются особенности характерологического профиля личности в зависимости от уровневых показателей в стенах, при этом постулируется, что распределение является нормальным. Однако заметим, что полученные нами данные это отвергают. А, следовательно, возникает вопрос, как же интерпретировать данные опросника Р. Кеттела.
Таким образом, применение различных методов статистической обработки результатов измерений в задачах психологии требует очень корректного подхода к выбору тех или иных методов и, безусловно, состояние данного вопроса весьма актуализирует задачу разработки новых методов.

Литература:
1. Наследов А.Д. Математические методы психологического исследования. Анализ и интерпретация данных. Учебное пособие. – СПб.: Речь, 2007.
2. Гланц С. Медико-биологическая статистика / пер. с англ.. – М.: Практика, 1998.
3. Ермолаев О.Ю. Математическая статистика для психологов: Учебник. – М.: Московский психолого-социальный институт Флинта, 2003.
4. Боровиков В. STATISTICA: искусство анализа данных на компьютере. Для профессионалов. - СПб.: Питер, 2001.
5. Дружинин В.Н. Экспериментальная психология. – СПб.: Питер, 2000.
6. Новиков А.М. Как работать над диссертацией: Пособие для начинающего педагога-исследователя. - М.: Издательство “Этвес”, 2003.
7. Стивенс С.  Математика, измерение и психофизика  // Экспериментальная психология  /Под. ред. С. Стивенса . Т.1 .1950 .
8. Хан Г., Шапиро С. Статистические модели в инженерных задачах. – М.: Статистика, 1980.
9. Новицкий П.В., Зограф И.А.Оценка погрешностей результатов измерений. - Л.: Энергоиздат, 1991.
10. Тихонов А.Н., Уфимцев М.К. Статистическая обработка результатов экспериментов: Учеб. пособие. – М.: Изд-во Московского ун-та, 1988.
11. Холлендер М., Вулф Д. Непараметрические методы статистики. - М.: Финансы и статистика, 1983.
12. Батаршев А.В. Психология индивидуальных различий: От темперамента к характеру и типологии личности. – М.: Гуманит, изд. центр ВЛАДОС, 2000.

Автор: Руслан Васитович Кадыров
 



Поиск

Семинары, Тренинги

Актуальная информация

Статьи наших специалистов