Регрессия
Регрессионный анализ можно охарактеризовать как нахождение наилучшей математической модели для предсказания одной переменной на основании другой. Одна переменная расценивается как зависимая и ее значение изменяется в зависимости от одной или большего числа независимых переменных. Наиболее распространенной формой регрессии является линейная регрессия, при которой математическая модель представляет собой прямую линию; уравнение регрессии есть уравнение прямой линии, наилучшим образом подобранной к соответствующим данным.
Линия регрессии на рис. 4.7 построена по данным, касающимся распространенности дефицита массы тела у детей и , потребления энергии одним ребенком, которые были получены в 11 странах Азии. Эти данные указывают на наличие негативной линейной зависимости между этими двумя переменными, но как видно из диаграммы разброса, наблюдаемая зависимость далека от идеальной.
Линию регрессии в данном случае можно представить как у = 162,5 -г- 0,05х, .
где у — процент детей с дефицитом массы тела,
х — потребление энергии в день (в ккал).
В данном примере фигурирует только одна независимая переменная, тогда как модели регрессии обычно включают несколько таких переменных, и тогда речь идет о множественной регрессии.
Другие часто используемые модели регрессии принимают во внимание нелинейную зависимость между переменными; кэтой категории относятся полиномиальная регрессия, логистическая регрессия и модели пропорциональных рисков.
Вопросы по изучаемой теме
4.1. Рассчитайте среднее значение и медиану по данным в табл. 4.1. Почему среднее и медиана имеют различные значения?
4.2. В ходе исследований терапевтических эффектов высокой и низкой дозы антидепрессанта пациентов случайным образом разделили на две группы. В одной группе больные получали низкую и в другой высокую дозу. Их состояние оценивали перед началом лечения и через 14 и 28 дней по стандартизованной оценочной шкале. Какие критерии следует использовать для сравнения этих двух групп — односторонние или двусторонние? Поясните ваш ответ.
4.3. Приведите пример ситуации, в которой более целесообразным будет анализ медианы распределения, чем анализ среднего значения.
Линия регрессии на рис. 4.7 построена по данным, касающимся распространенности дефицита массы тела у детей и , потребления энергии одним ребенком, которые были получены в 11 странах Азии. Эти данные указывают на наличие негативной линейной зависимости между этими двумя переменными, но как видно из диаграммы разброса, наблюдаемая зависимость далека от идеальной.
Линию регрессии в данном случае можно представить как у = 162,5 -г- 0,05х, .
где у — процент детей с дефицитом массы тела,
х — потребление энергии в день (в ккал).
В данном примере фигурирует только одна независимая переменная, тогда как модели регрессии обычно включают несколько таких переменных, и тогда речь идет о множественной регрессии.
Другие часто используемые модели регрессии принимают во внимание нелинейную зависимость между переменными; кэтой категории относятся полиномиальная регрессия, логистическая регрессия и модели пропорциональных рисков.
Вопросы по изучаемой теме
4.1. Рассчитайте среднее значение и медиану по данным в табл. 4.1. Почему среднее и медиана имеют различные значения?
4.2. В ходе исследований терапевтических эффектов высокой и низкой дозы антидепрессанта пациентов случайным образом разделили на две группы. В одной группе больные получали низкую и в другой высокую дозу. Их состояние оценивали перед началом лечения и через 14 и 28 дней по стандартизованной оценочной шкале. Какие критерии следует использовать для сравнения этих двух групп — односторонние или двусторонние? Поясните ваш ответ.
4.3. Приведите пример ситуации, в которой более целесообразным будет анализ медианы распределения, чем анализ среднего значения.
Источник: Бигпхоп Р., «Основы эпидемиологии» 1993
А так же в разделе «Регрессия »
- Наблюдения и эксперименты
- Эпидемиологические исследования, проводимые путем наблюдений Описательные исследования
- Экологические исследования
- Поперечные исследования
- Исследования типа случай — контроль
- Когортные исследования
- Экспериментальные эпидемиологические исследования
- Рандомизированные контролируемые испытания
- Полевые испытания
- Испытания на коммунальном уровне
- Потенциальные ошибки в эпидемиологических исследованиях
- Случайная ошибка
- Систематическая ошибка
- Достоверность
- Вопросы этики
- Глава 4 Основные статистические аспекты,
- Распределения и основные критерии Распределения
- Характеристика положения
- Нормальное и логарифмически нормальное распределения
- Оценка Популяции и выборки
- Доверительные интервалы
- Статистические выводы Проверка гипотез
- Ошибки первого и второго рода
- Различия между статистической значимостью, значимостью в клиническом отношении и значимостью с точки зрения общественного здравоохранения
- Взаимосвязь двух переменных
- Критерий хи-квадрат
- Глава 5 Причинная обусловленность болезней в эпидемиологии
- Единичные и множественные причины
- Взаимодействие причин
- Временная связь
- Убедительность ассоциации
- Последовательность выявления ассоциации
- Степень выраженности ассоциации
- Зависимость доза — ответ
- Организация исследования
- Вынесение суждений