Ошибки первого и второго рода

Как было указано выше, при статистическом анализе гипотеза никогда не может быть доказана как истинная или ложная, она только принимается или отвергается на основании статистических критериев. Это решение ассоциируется с двумя типами ошибки: нулевая гипотеза отвергается, будучи истинной (ошибка первого рода или альфа-ошибка), или принимается, будучи ложной (ошибка второго рода или бета-ошибка). Вероятность совершения ошибки первого рода представляет собой уровень значимости статистического критерия, который всегда должен указываться при представлении • результатов.
Например, рандомизированные клинические испытания лекарственных средств могут привести к ошибкам обоих типов. На основании полученных результатов может быть сделан вывод об эффективности нового препарата, когда на самомделе он не имеет преимуществ перед стандартным лечением. В этом случае ошибка, которая ведет к ложному положительному выводу об эффективности препарата, является ошибкой первого рода. И наоборот, может быть сделано заключение о неэффективности нового лекарственного средства, когда в действительности оно является эффективным. Такой ложный отрицательный вывод свидетельствует об ошибке второго рода.
Вероятность отказа от нулевой гипотезы, когда она является ложной, называется мощностью статистического критерия. Она равна единице минус вероятность ошибки второго рода. Мощность статистического критерия зависит от объема выборки: чем больше выборка, тем больше мощность критерия при всех других одинаковых параметрах. Мощность критерия также зависит от выбранного уровня значимости. При любом данном объеме выборки чем выше уровень значимости (т.е. чем ниже вероятность ошибки первого рода), тем меньше мощность критерия (тем выше вероятность ошибки второго рода). Во многих исследованиях ставится задача достичь мощности критерия, равной 0,8 при уровне значимости 0,05. Это означает, что вероятность ошибки второго рода (0,2) в 4 раза превышает вероятность ошибки первого рода (0,05), а это в свою очередь отражает тот факт, что в большинстве исследований ошибка первого рода считается более серьезной, чем ошибка второго рода. Мощность критерия должна указываться при получении отрицательного результата.
Мощность статистического критерия должна обязательно приниматься во внимание в процессе планирования эпидемиологического исследования, поскольку она показывает, будет ли данная проверка иметь статистически значимый результат при различных обстоятельствах.

к содержанию

Источник: Бигпхоп Р., «Основы эпидемиологии» 1993

Ошибки первого и второго рода

А так же в разделе «Ошибки первого и второго рода »