Понятие корреляционной связи и факторного анализа 


В результате различных экспериментальных измерений может быть получено большое и постоянно увеличивающееся количество связей между различными психологическими переменными, различными особенностями личности. Поэтому понятна необходимость решения задачи получения универсального, пригодного для всех набора таких характерологических черт. Эти черты «обычно выделяются посредством факторного анализа и измеряются при помощи стандартизированных тестов, которые предполагают оценку результатов испытуемого с точки зрения групповых норм» [7, с. 482].
Примером реализации корреляционно-факторного направления индивидуально-психометрического подхода может служить разработанная Р. Кэттеллом факторная модель личности. Кэттелл использовал результаты исследования, проведенного Г. Олпортом и X. Олдбергом, которые из 18 000 слов отобрали 4500, ясно обозначающих особенности личности и поведения. Из этих характеристик Кэттелл выделил 171 синонимическую группу, в каждой из которых он отобрал по одному слову, в наибольшей мере отражающему ее специфику. Затем эксперты оценили выделенные качества с целью определения наиболее значимых для характеристики личности. Сравнение экспертных оценок привело к выявлению статистически связанных между собой характеристик, которые, очевидно, выражали сходные суждения.
В статистике для оценки совпадения случайных событий могут применяться таблицы сопряженности признаков. Для сравнения двух признаков используется таблица сопряженности 2 х 2 (табл. 3.1).
Таблица 3.1. Общая форма таблицы сопряженности 2 х 2


Признак X

Итог

1

0

Признак Y

1

а

Ь

а + Ь

0

с

й

с + й

Итог

а + с

Ь + й

п

Наличие признака обозначается 1, а его альтернативы — 0. Буквенные индексы а, Ь, с, й обозначают количество совместных появлений (совпадений) 0 и 1 в различных сочетаниях. Общее количество событий п = а + Ь + с + й. Максимальное количество совпадений одинаково обозначенных признаков достигается при условии Ь = с = 0иа = й; обратных совпадений — при условии а = й = 0иЬ = с. Равенство между количеством прямых совпадений и обратных, когда ситуация наиболее неопределенна и характеризуется отсутствием связи между появлением событий, достигается при а = Ь = с = й.
Для оценки степени совпадения признаков как случайных событий используется мера вероятностной (стохастической) связи, называемой сопряженностью. Степень сопряженности, ее теснота чаще всего рассчитывается с помощью коэффициента ассоциации по формуле:
ай - сй
Ф = I              •
-^(а+Ь)(с+й )(Ь+й )( а+с)
Величина коэффициента ф изменяется от -1 до +1. Крайние значения характеризуют максимальную степень сопряженности событий, их прямое и обратное совпадение. При преобладании совпадений разноименных событий коэффициент Ф принимает отрицательные значения, что свидетельствует об отрицательном направлении сопряженности. Коэффициент ассоциации принимает нулевое значение при полном отсутствии сопряженности, связи между событиями. Таким образом, соблюдается условие симметричности полярных признаков, позволяющее осуществлять дифференциацию на самом обобщенном уровне.
Но при индивидуально-психометрическом подходе отрицается единственность существования абсолютно выраженных, полярных психологических черт, а принимается преобладание средних по интенсивности качеств. В ходе оценки сопряженности это приводит к недостаточности дихотомической классификации и в результате к снижению значения коэффициента ф по абсолютной величине. Тогда возникает вопрос о величине коэффициента, допускающей наличие стохастической связи.
Так, коэффициент ф, измеряющий связь между событиями, сам является случайной величиной, т. е. переменной, принимающей числовые значения, он характеризуется определенным распределением. Принято, что при п gt;20 величина 4Пф приближенно описывается нормальным законом распределения случайной величины. При этом нормальное распределение можно использовать в качестве статистического критерия оценивания и проверки гипотез, т. е. правила, обеспечивающего принятие истинной и отклонение ложной гипотезы с высокой степенью вероятности. За исходную нуль-гипотезу принимается 4Пф = 0, а любое другое его значение есть обычная флюктуация случайной величины. Считается, что исходная гипотеза подтверждается, когда 4Пф принимает значение, находящееся в интервале, соответствующем 95 или 99% всех возможных событий. Другими словами, если его абсолютная величина меньше 1,96 (5%-ный уровень значимости) или 2,58 (1%-ный уровень значимости). При превышении указанных пределов исходная гипотеза отвергается с соответствующей степенью вероятности и принимается альтернативная гипотеза 4Пф Ф 0, допускающая наличие связи в гораздо большей мере, чем ее отсутствие.
Таким образом, за «эталонную» принимается ситуация, когда события равномерно распределены по клеткам таблицы сопряженности (см. табл. 3.1). Статистически оценивается степень отклонения эмпирически полученного распределения от эталонного. Если такое отклонение статистически значимо, то делается вывод о наличии тенденции, объединяющей сравниваемые события, связи между рассматриваемыми признаками. Показательно для индивидуально-психометрического подхода, что при оценке значимости коэффициента ассоциации допустимое отклонение определяется не от 1, а от 0, и это соответствует посылке об изначальном отсутствии связи между психологическими чертами различных людей.
В целом функциональная статистическая связь между переменными называется корреляцией, и ее величина определяется расчетом соответствующего коэффициента корреляции, форма которого зависит от характера сравниваемых переменных. Основополагающим, базовым коэффициентом корреляции считается коэффициент линейной корреляции Пирсона:
2(хг - Мх )У - Му)
гх
гдех,иу% — значения сравниваемых переменных, приблизительно распределенные по нормальному закону. Так же как и у коэффициента ассоциации, величина коэффициента гу изменяется от -1 до +1. Крайние значения характеризуют максимальную степень связи переменных, их абсолютное совместное прямое (+1) или обратное изменение (-1). При полном отсутствии связи между переменными коэффициент корреляции равен 0. В остальных случаях существования связи значимость коэффициента корреляции определяется по результатам его сравнения со специально рассчитанными критическими значениями. Учитывая, что при г = 0 величина
{foto} Формула гх
имеет основанное на нормальном распределении ^распределение с числом степеней свободы п - 2, такие критические значения для показателей ? или непосредственно для гу определены и приводятся в соответствующих таблицах, опубликованных в любых распространенных справочных изданиях по математической статистике. Для отклонения предположения об отсутствии корреляции полученная величина ? или гху должна превысить табличную при соответствующем числе степеней свободы (п - 2).
Наличие значимых отрицательных корреляций между противоположными характеристиками позволило Кэттеллу получить перечень из 36 биполярных наименований, который он расширил до 46 пар, включив специальные термины из работ других исследователей. Каждое биполярное определение было снабжено описанием. Например:
  • гибкий: легко меняет свои планы, легко перестраивается, способен

на компромиссы, не удивляется, не становится раздражительным,
не отказывается от задуманного и не меняет своих планов, если развитие событий не совпадает с его ожиданиями;
  • ригидный: настаивает на том, чтобы все выполнялось так, как он привык это делать, не изменяет своих привычек и поведения под давлением окружающих, теряется, если привычные способы поведения не приводят к успеху.

Такие описания были необходимы для формирования единства понимания оцениваемых черт личности. Результаты такого оценивания были подвергнуты факторному анализу. Факторный анализ — это группа методов, предназначенных для определения свойств, которые нельзя непосредственно наблюдать и измерить. В самом общем виде цель факторного анализа заключается в сведении определенного количества переменных к меньшему количеству характеристик (факторов), способных воспроизвести без существенных потерь первоначальную структуру показателей. В результате факторного анализа все многообразие черт личности может быть последовательно сведено к нескольким общим факторам (рис. 3.2).
{foto}   Рис. 3.2. Упрошенная схема факторного анализа. Источник: [21, с. 15]
  
Кэттелл подверг факторному анализу выделенные 46 характеристик личности, по итогам которого выделялось в различных исследованиях от 12 до 15 факторов первого порядка. В дальнейшем, используя информацию, полученную с помощью опросников, Кэттелл расширил перечень факторов. Полученный набор факторов можно назвать корреляционно-факторной моделью личности.
Из всех модификаций факторных моделей личности Кэттелла наиболее известной стала 16-факторная. Каждый из 16 факторов первого порядка имеет техническое и бытовое название. Технические названия связаны с научно установленным содержанием факторов. В их качестве часто используются искусственно созданные названия, например: сизотимия, сургенсия, пармия и т. д. Бытовые названия представляют собой общедоступные определения, ориентированные на непрофессионалов. Кроме того, 16-факторная модель включает в себя 4 фактора второго порядка, выделенных в результате факторизации факторов первого порядка и являющихся более обобщенными характеристиками. Модель Р. Кэттелла не является единственной. Поэтому целесообразно ее рассмотреть в сравнении с другими известными факторными моделями личности.
В заключение следует заметить, что в целом расчет корреляции и применение факторного анализа наиболее корректны в отношении случайных величин, распределенных по нормальному закону. Это условие в полной мере адекватно индивидуально-психометрическому подходу, основывающемуся на преобладании людей со средним уровнем выраженности психологических показателей. Следовательно, устраняется один из недостатков типологического подхода — дифференциация людей на полярные, далеко отстающие друг от друга группы. 

Источник: Машков В. Н., «Дифференциальная психология человека. — СПб.: Питер. — 288 с.: ил. — (Серия «Учебное пособие»).» 2008

А так же в разделе «  Понятие корреляционной связи и факторного анализа  »