Ошибки первого и второго рода
Как было указано выше, при статистическом анализе гипотеза никогда не может быть доказана как истинная или ложная, она только принимается или отвергается на основании статистических критериев. Это решение ассоциируется с двумя типами ошибки: нулевая гипотеза отвергается, будучи истинной (ошибка первого рода или альфа-ошибка), или принимается, будучи ложной (ошибка второго рода или бета-ошибка). Вероятность совершения ошибки первого рода представляет собой уровень значимости статистического критерия, который всегда должен указываться при представлении • результатов.
Например, рандомизированные клинические испытания лекарственных средств могут привести к ошибкам обоих типов. На основании полученных результатов может быть сделан вывод об эффективности нового препарата, когда на самомделе он не имеет преимуществ перед стандартным лечением. В этом случае ошибка, которая ведет к ложному положительному выводу об эффективности препарата, является ошибкой первого рода. И наоборот, может быть сделано заключение о неэффективности нового лекарственного средства, когда в действительности оно является эффективным. Такой ложный отрицательный вывод свидетельствует об ошибке второго рода.
Вероятность отказа от нулевой гипотезы, когда она является ложной, называется мощностью статистического критерия. Она равна единице минус вероятность ошибки второго рода. Мощность статистического критерия зависит от объема выборки: чем больше выборка, тем больше мощность критерия при всех других одинаковых параметрах. Мощность критерия также зависит от выбранного уровня значимости. При любом данном объеме выборки чем выше уровень значимости (т.е. чем ниже вероятность ошибки первого рода), тем меньше мощность критерия (тем выше вероятность ошибки второго рода). Во многих исследованиях ставится задача достичь мощности критерия, равной 0,8 при уровне значимости 0,05. Это означает, что вероятность ошибки второго рода (0,2) в 4 раза превышает вероятность ошибки первого рода (0,05), а это в свою очередь отражает тот факт, что в большинстве исследований ошибка первого рода считается более серьезной, чем ошибка второго рода. Мощность критерия должна указываться при получении отрицательного результата.
Мощность статистического критерия должна обязательно приниматься во внимание в процессе планирования эпидемиологического исследования, поскольку она показывает, будет ли данная проверка иметь статистически значимый результат при различных обстоятельствах.
Например, рандомизированные клинические испытания лекарственных средств могут привести к ошибкам обоих типов. На основании полученных результатов может быть сделан вывод об эффективности нового препарата, когда на самомделе он не имеет преимуществ перед стандартным лечением. В этом случае ошибка, которая ведет к ложному положительному выводу об эффективности препарата, является ошибкой первого рода. И наоборот, может быть сделано заключение о неэффективности нового лекарственного средства, когда в действительности оно является эффективным. Такой ложный отрицательный вывод свидетельствует об ошибке второго рода.
Вероятность отказа от нулевой гипотезы, когда она является ложной, называется мощностью статистического критерия. Она равна единице минус вероятность ошибки второго рода. Мощность статистического критерия зависит от объема выборки: чем больше выборка, тем больше мощность критерия при всех других одинаковых параметрах. Мощность критерия также зависит от выбранного уровня значимости. При любом данном объеме выборки чем выше уровень значимости (т.е. чем ниже вероятность ошибки первого рода), тем меньше мощность критерия (тем выше вероятность ошибки второго рода). Во многих исследованиях ставится задача достичь мощности критерия, равной 0,8 при уровне значимости 0,05. Это означает, что вероятность ошибки второго рода (0,2) в 4 раза превышает вероятность ошибки первого рода (0,05), а это в свою очередь отражает тот факт, что в большинстве исследований ошибка первого рода считается более серьезной, чем ошибка второго рода. Мощность критерия должна указываться при получении отрицательного результата.
Мощность статистического критерия должна обязательно приниматься во внимание в процессе планирования эпидемиологического исследования, поскольку она показывает, будет ли данная проверка иметь статистически значимый результат при различных обстоятельствах.
Источник: Бигпхоп Р., «Основы эпидемиологии» 1993
А так же в разделе «Ошибки первого и второго рода »
- Наблюдения и эксперименты
- Эпидемиологические исследования, проводимые путем наблюдений Описательные исследования
- Экологические исследования
- Поперечные исследования
- Исследования типа случай — контроль
- Когортные исследования
- Экспериментальные эпидемиологические исследования
- Рандомизированные контролируемые испытания
- Полевые испытания
- Испытания на коммунальном уровне
- Потенциальные ошибки в эпидемиологических исследованиях
- Случайная ошибка
- Систематическая ошибка
- Достоверность
- Вопросы этики
- Глава 4 Основные статистические аспекты,
- Распределения и основные критерии Распределения
- Характеристика положения
- Нормальное и логарифмически нормальное распределения
- Оценка Популяции и выборки
- Доверительные интервалы
- Статистические выводы Проверка гипотез
- Различия между статистической значимостью, значимостью в клиническом отношении и значимостью с точки зрения общественного здравоохранения
- Взаимосвязь двух переменных
- Критерий хи-квадрат
- Регрессия
- Глава 5 Причинная обусловленность болезней в эпидемиологии
- Единичные и множественные причины
- Взаимодействие причин
- Временная связь
- Убедительность ассоциации
- Последовательность выявления ассоциации
- Степень выраженности ассоциации
- Зависимость доза — ответ
- Организация исследования
- Вынесение суждений