Доверительные интервалы


После формирования выборки можно приступить к оценке характеристик исходной популяции. Поскольку эти оценки являются разными для разных выборок, важно установить, насколько близка оценка, сделанная на основании какой-либо одной выборки, к соответствующему значению для всей популя­ции. Один из способов определения этой вероятности состоит в построении доверительного интервала вокруг данной оценки, т.е. множества значений вокруг оценки, которые с определенной вероятностью будут включать истинные значения для популяции. Вероятность, определенная таким образом, называется коэффи­циентом доверия (доверительный уровень), а конечные точки доверительного интервала являются доверительными пределами.
Для вычисления доверительных пределов вокруг расчетного среднего значения для популяции необходимы следующие кри­терии: 1) вариация, такая, как стандартное отклонение а, 2) расчетное среднее значение (х), 3) объем выборки (и) и 4) определенная вероятность включения истинного значения для популяции Если принять, что исходная популяция имеет нормальное распределение с известным стандартным отклонением а, то доверительные пределы 95 % доверительного интервала вокруг среднего значения можно рассчитать по следующей формуле:

(Для расчета 90% доверительного интервала вместо 1,96 используется величина 1,67.)
Рис. 4.5. Доверительные интервалы для разных критериев доверия

то 92782

В качестве примера можно привести случайную выборку, состоящую из 100 фабричных рабочих, -в которой средняя концентрация свинца в крови (х) составляет 90 мкг/л. Предположим далее, что величина его концентрации в крови имеет нормальное распределение со стандартным отклонением 10 (т.е. а = 10). Тогда пределы 95% доверительного интервала вокруг расчетной величины могут быть вычислены следующим образом:

Таким образом, длина доверительного интервала будет 88,04 — 91,96.
Оценка выборки обычно дается вместе с Доверительным интервалом. При этом важно помнить, что размер этогоинтервала связан с объемом выборки: чем больше выборка, тем меньше доверительный интервал для данного коэффици­ента доверия. Размер доверительного интервала также связан с коэффициентом доверия. Для имеющейся совокупности данных чем выше доверительный уровень, тем больше доверительный интервал. Это проиллюстрировано на рис. 4.5, где показаны доверительные интервалы в зависимости от разных коэффициентов доверия для одних и тех же данных.

Источник: Бигпхоп Р., «Основы эпидемиологии» 1993

А так же в разделе «Доверительные интервалы »