Основные статистические методы, используемые в эпидемиологии
Средняя арифметическая простая - часто используемая средняя арифметическая величина, рассчитывается суммированием величин всех наблюдений и делением этой суммы на число наблюдений.
Средняя арифметическая взвешенная вычисляется из вариационного ряда, когда одна и та же варианта встречается более одного раза.
Медиана буквально обозначает середину, которая делит вариационный ряд на две половины, одна из них состоит из чисел, величина которых больше медианы, вторая - из чисел, меньших значения медианы.
Мода - это значение, наиболее часто встречающееся в наборе данных. Обычно моду вычисляют путем построения таблицы частотного распределения, в которую вносят частоту встречаемости каждого из значений. Если окажется, что каждое значение встречается один раз, то у такого распределения не будет моды. Если же два значения встречаются чаще других, то у распределения будет более одной моды. За моду принимают ту варианту, которой соответствует наибольшее количество частот вариационного ряда.
Средняя геометрическая. Средняя геометрическая подсчитывается как корень п-й степени произведения п наблюдений. Средняя геометрическая используется при обработке данных лабораторных исследований, когда требуются последовательные разведения сывороток крови или другого материала.
Показатели варьирования или разнообразия. Показатель варьирования указывает, насколько велик разброс данных вокруг центрального значения. Разница между наибольшим (максимальным) и наименьшим (минимальным) значениями называется размахом.
Оценка достоверности результатов исследования. Достоверность исследования предполагает степень соответствия полученных результатов отображаемой действительности. Оценить достоверность результатов можно при определении:
> средних ошибок средних величин;
> доверительных границ средних величин.
Ошибка репрезентативности показывает, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования. Стандартная ошибка рассчитывается по формуле:
8Б = ст / ^и.
Доверительные интервалы. Для того, чтобы оценить насколько полученные данные исследования одной выборки соответствуют значению всей популяции необходимо рассчитать доверительные интервалы. Доверительный интервал - это интервал, в пределах которого с 95%-й уверенностью можно сказать, что истинные значения находятся в этих пределах. Для вычисления доверительных интервалов вокруг расчетного среднего значения для популяции необходимы следующие критерии:
стандартное отклонение - сигма;
расчетное среднее значение - (х) - число наблюдений - (п);
определенная вероятность включения истинного значения для популяции.
Если предположить, что исходная популяция имеет нормальное распределение с известным стандартным отклонением - сигма, то доверительные пределы 95%-го доверительного интервала можно рассчитать по формуле:
нижний предел = Х - 1,96 х ст / ^и;
верхний предел = Х + 1,96 х ст / ^и.
Для расчета 90%-го доверительного интервала вместо 1,96 используется величина 1,64. Оценка выборки должна даваться вместе с доверительным интервалом. При этом важно помнить, что размер этого интервала связан с объемом выборки: чем больше выборка, тем меньше доверительный интервал для данного коэффициента доверия. Для 68%-го интервала используется величина 1 99% - 2,58.
Корреляция. Корреляция - это степень, в которой две переменные изменяются вместе. Она измеряется коэффициентом корреляции. В эпидемиологических исследованиях часто используются несколько коэффициентов корреляции. Все они имеют множество значений от +1 на четкую положительную и -1 на четкую отрицательную корреляцию. Коэффициентом корреляции Пирсона (г) измеряют степень линейной зависимости между двумя переменными. Наличие четкой линейной корреляции между двумя переменными означает, что все наблюдаемые величины лежат на прямой линии и г = 1,0 или -1,0. Коэффициент корреляции Пирсона (г) для переменных х и у вычисляется по формуле:
Я = Е(х - х)(у - у) \< Е(х - х)2 Е (у - у)2.
При этом следует помнить, что коэффициент корреляции Пирсона отражает только степень линейной зависимости и что две данные переменные могут иметь высокую степень зависимости нелинейного характера и очень низкий коэффициент корреляции.
В эпидемиологии часто используются также два других коэффициента корреляции - коэффициент ранговой корреляции Спирмэна (гу) и коэффициент ассоциации (КА), которые применимы к упорядоченным данным.
Источник: С.Т. Карагулова, В.С. Тойгомбаева, «ОБЩАЯ ЭПИДЕМИОЛОГИЯ Учебное пособие» 2009
А так же в разделе «Основные статистические методы, используемые в эпидемиологии »
- Цели и задачи эпидемиологического надзора
- Элементы системы эпидемиологического надзора
- Эпидемиологические исследования
- Этические вопросы проведения исследований
- Графическое изображение полученных данных
- Эпидемиологический анализ информации
- Анализ уровня и структуры регистрируемой заболеваемости
- Анализ многолетней динамики заболеваемости
- Анализ заболеваемости в группах, выделенных по эпидемиологическим признакам
- Оперативный анализ заболеваемости