Ошибки первого и второго рода

Как было указано выше, при статистическом анализе гипотеза никогда не может быть доказана как истинная или ложная, она только принимается или отвергается на основании статистических критериев. Это решение ассоциируется с двумя типами ошибки: нулевая гипотеза отвергается, будучи истин­ной (ошибка первого рода или альфа-ошибка), или прини­мается, будучи ложной (ошибка второго рода или бета-ошиб­ка). Вероятность совершения ошибки первого рода представляет собой уровень значимости статистического кри­терия, который всегда должен указываться при представлении • результатов.
Например, рандомизированные клинические испытания ле­карственных средств могут привести к ошибкам обоих типов. На основании полученных результатов может быть сделан вывод об эффективности нового препарата, когда на самомделе он не имеет преимуществ перед стандартным лечением. В этом случае ошибка, которая ведет к ложному положи­тельному выводу об эффективности препарата, является ошибкой первого рода. И наоборот, может быть сделано заключение о неэффективности нового лекарственного сред­ства, когда в действительности оно является эффективным. Такой ложный отрицательный вывод свидетельствует об ошибке второго рода.
Вероятность отказа от нулевой гипотезы, когда она является ложной, называется мощностью статистического критерия. Она равна единице минус вероятность ошибки второго рода. Мощность статистического критерия зависит от объема вы­борки: чем больше выборка, тем больше мощность критерия при всех других одинаковых параметрах. Мощность критерия также зависит от выбранного уровня значимости. При любом данном объеме выборки чем выше уровень значимости (т.е. чем ниже вероятность ошибки первого рода), тем меньше мощность критерия (тем выше вероятность ошибки второго рода). Во многих исследованиях ставится задача достичь мощности критерия, равной 0,8 при уровне значимости 0,05. Это означает, что вероятность ошибки второго рода (0,2) в 4 раза превышает вероятность ошибки первого рода (0,05), а это в свою очередь отражает тот факт, что в большинстве исследований ошибка первого рода считается более серьезной, чем ошибка второго рода. Мощность критерия должна ука­зываться при получении отрицательного результата.
Мощность статистического критерия должна обязательно при­ниматься во внимание в процессе планирования эпидемиоло­гического исследования, поскольку она показывает, будет ли данная проверка иметь статистически значимый результат при различных обстоятельствах.

Источник: Бигпхоп Р., «Основы эпидемиологии» 1993

А так же в разделе «Ошибки первого и второго рода »