Критерий хи-квадрат

Когда две переменные имеют категории, обычно используется критерий хи-квадрат (^2), чтобы проверить нулевую гипотезу, состоящую в том, что распределения этих переменных являются независимыми друг от друга (т.е. что частотапопадания переменной А в определенную категорию такая же, что и всех категорий переменной В). В табл. 4.2 показаны распределения двух переменных, А и В, и уравнение для вычисления статистики, %2, требующейся для оценки соотно­шения между ними. В отношении данных табл. 3.4, нулевая гипотеза предполагала бы независимость таких двух переменных, как недавнее потребление мяса и развитие некротического энтерита. При уровне значимости 0,05 отсечка для величиныпо таблице 2x2 равна 3,84 (;— таблицы можно найти в обычных
статистических справочниках). Если вычисленное значение превышает 3,84, то нулевая гипотеза должна быть отброшена при уровне значимости 5 %. _
Используя значения, представленные в табл. 3.4, мы получаем => 32,57. Поэтому мы отклоняем нулевую гипотезу и принимаем альтернативный вариант, а именно: между недав­ним потреблением мяса и развитием некротического энтерита существует взаимосвязь.
Корреляция
■Корреляция — это степень, в которой две переменные изме­няются вместе. Она измеряется коэффициентом корреляции.
. В эпидемиологических исследованиях часто используются несколько коэффициентов корреляции. Все они имеют мно­жество значений от +1 до -1, при этом ноль указывает на отсутствие корреляции, а значения +1 и -1 — на четкуюположительную или четкую отрицательную корреляцию со­ответственно. Коэфициентом корреляции Пирсона (г) изме­ряют степень линейной зависимости между двумя перемен­ными. Наличие четкой линейной корреляции между двумя переменными означает, что все наблюдаемые величины лежат на прямой линии и г 1,0 или - 1,0.
Рис. 4.7. Уменьшение распространенности случаев понижен­ной массы тела у детей в зависимости от потребления килокалорий на человека, по данным из 11 стран Азии

Коэффициент корреляции Пирсона (г) для переменных х и у вычисляется по формуле:

При этом следует подчеркнуть, что коэффициент корреляции Пирсона отражает только степень линейной зависимости и что две данные переменные могут иметь высокую степень зависимости нелинейного характера и очень низкий коэффи­циент корреляции.В эпидемиологии часто используются также два других коэффициента корреляции — коэффициент ранговой корреля­ции Спирмэна (г$) и коэффициент ранговой корреляции Кендалла (т). Оба они применимы к упорядоченным данным. Углубленное описание этих коэффициентов можно найти в публикации Siegel & Casterllan (1988).

Источник: Бигпхоп Р., «Основы эпидемиологии» 1993

А так же в разделе «Критерий хи-квадрат »