Основные статистические методы, используемые в эпидемиологии


Средняя арифметическая простая - часто используемая средняя арифметическая величина, рассчитывается суммированием величин всех наблюдений и делением этой суммы на число наблюдений.
Средняя арифметическая взвешенная вычисляется из вариаци­онного ряда, когда одна и та же варианта встречается более одного раза.
Медиана буквально обозначает середину, которая делит вариаци­онный ряд на две половины, одна из них состоит из чисел, величина ко­торых больше медианы, вторая - из чисел, меньших значения медианы.
Мода - это значение, наиболее часто встречающееся в наборе дан­ных. Обычно моду вычисляют путем построения таблицы частотного распределения, в которую вносят частоту встречаемости каждого из значений. Если окажется, что каждое значение встречается один раз, то у такого распределения не будет моды. Если же два значения встреча­ются чаще других, то у распределения будет более одной моды. За моду принимают ту варианту, которой соответствует наибольшее количество частот вариационного ряда.
Средняя геометрическая. Средняя геометрическая подсчитывает­ся как корень п-й степени произведения п наблюдений. Средняя геомет­рическая используется при обработке данных лабораторных исследова­ний, когда требуются последовательные разведения сывороток крови или другого материала.
Показатели варьирования или разнообразия. Показатель варьи­рования указывает, насколько велик разброс данных вокруг центрально­го значения. Разница между наибольшим (максимальным) и наимень­шим (минимальным) значениями называется размахом.
Оценка достоверности результатов исследования. Достовер­ность исследования предполагает степень соответствия полученных ре­зультатов отображаемой действительности. Оценить достоверность ре­зультатов можно при определении:
> средних ошибок средних величин;
> доверительных границ средних величин.
Ошибка репрезентативности показывает, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследо­вания. Стандартная ошибка рассчитывается по формуле:
8Б = ст / ^и.
Доверительные интервалы. Для того, чтобы оценить насколько полученные данные исследования одной выборки соответствуют значе­нию всей популяции необходимо рассчитать доверительные интервалы. Доверительный интервал - это интервал, в пределах которого с 95%-й уверенностью можно сказать, что истинные значения находятся в этих пределах. Для вычисления доверительных интервалов вокруг расчетного среднего значения для популяции необходимы следующие критерии:
стандартное отклонение - сигма;
расчетное среднее значение - (х) - число наблюдений - (п);
определенная вероятность включения истинного значения для по­пуляции.
Если предположить, что исходная популяция имеет нормальное распределение с известным стандартным отклонением - сигма, то дове­рительные пределы 95%-го доверительного интервала можно рассчитать по формуле:
нижний предел = Х - 1,96 х ст / ^и;
верхний предел = Х + 1,96 х ст / ^и.
Для расчета 90%-го доверительного интервала вместо 1,96 исполь­зуется величина 1,64. Оценка выборки должна даваться вместе с довери­тельным интервалом. При этом важно помнить, что размер этого интер­вала связан с объемом выборки: чем больше выборка, тем меньше дове­рительный интервал для данного коэффициента доверия. Для 68%-го интервала используется величина 1 99% - 2,58.
Корреляция. Корреляция - это степень, в которой две переменные изменяются вместе. Она измеряется коэффициентом корреляции. В эпи­демиологических исследованиях часто используются несколько коэф­фициентов корреляции. Все они имеют множество значений от +1 на четкую положительную и -1 на четкую отрицательную корреляцию. Ко­эффициентом корреляции Пирсона (г) измеряют степень линейной зави­симости между двумя переменными. Наличие четкой линейной корре­ляции между двумя переменными означает, что все наблюдаемые вели­чины лежат на прямой линии и г = 1,0 или -1,0. Коэффициент корреляции Пирсона (г) для переменных х и у вычисляется по формуле:
Я = Е(х - х)(у - у) \< Е(х - х)2 Е (у - у)2.
При этом следует помнить, что коэффициент корреляции Пирсона отражает только степень линейной зависимости и что две данные пере­менные могут иметь высокую степень зависимости нелинейного харак­тера и очень низкий коэффициент корреляции.
В эпидемиологии часто используются также два других коэффици­ента корреляции - коэффициент ранговой корреляции Спирмэна (гу) и коэффициент ассоциации (КА), которые применимы к упорядоченным данным.

Источник: С.Т. Карагулова, В.С. Тойгомбаева, «ОБЩАЯ ЭПИДЕМИОЛОГИЯ Учебное пособие» 2009

А так же в разделе «Основные статистические методы, используемые в эпидемиологии »