Регрессия

Регрессионный анализ можно охарактеризовать как нахожде­ние наилучшей математической модели для предсказания одной переменной на основании другой. Одна переменная расценивается как зависимая и ее значение изменяется в зависимости от одной или большего числа независимых переменных. Наиболее распространенной формой регрессии является линейная регрессия, при которой математическая модель представляет собой прямую линию; уравнение регрес­сии есть уравнение прямой линии, наилучшим образом подобранной к соответствующим данным.
Линия регрессии на рис. 4.7 построена по данным, касаю­щимся распространенности дефицита массы тела у детей и , потребления энергии одним ребенком, которые были получены в 11 странах Азии. Эти данные указывают на наличие негативной линейной зависимости между этими двумя пере­менными, но как видно из диаграммы разброса, наблюдаемая зависимость далека от идеальной.
Линию регрессии в данном случае можно представить как у = 162,5 -г- 0,05х, .
где у — процент детей с дефицитом массы тела,
х — потребление энергии в день (в ккал).
В данном примере фигурирует только одна независимая пере­менная, тогда как модели регрессии обычно включают несколько таких переменных, и тогда речь идет о множественной регрессии.
Другие часто используемые модели регрессии принимают во внимание нелинейную зависимость между переменными; кэтой категории относятся полиномиальная регрессия, логисти­ческая регрессия и модели пропорциональных рисков.
Вопросы по изучаемой теме
4.1. Рассчитайте среднее значение и медиану по данным в табл. 4.1. Почему среднее и медиана имеют различные значения?
4.2. В ходе исследований терапевтических эффектов высокой и низкой дозы антидепрессанта пациентов случайным образом разделили на две группы. В одной группе больные получали низкую и в другой высокую дозу. Их состояние оценивали перед началом лечения и через 14 и 28 дней по стандартизованной оценочной шкале. Какие критерии следует использовать для сравнения этих двух групп — односторонние или двусторонние? Поясните ваш ответ.
4.3. Приведите пример ситуации, в которой более целесооб­разным будет анализ медианы распределения, чем анализ среднего значения.

Источник: Бигпхоп Р., «Основы эпидемиологии» 1993

А так же в разделе «Регрессия »