Анализ многолетней динамики заболеваемости
В эпидемиологической диагностике проведение анализа многолетней динамики заболеваемости является одним из основных разделов. Анализ эпидемического процесса в многолетней динамике направлен на выявление причин, которые обусловливают его многолетнюю тенденцию, периодичность, нерегулярные изменения в интенсивности течения эпидемического процесса, и прогноз на будущее.
Многолетнюю тенденцию определяет группа причин и условий, которые действуют постоянно, не меняясь в течение многих лет или меняясь преимущественно в одном направлении, вызывая рост, снижение или стабилизацию заболеваемости.
Периодичность или цикличность зависит от ряда причин и условий, которые ритмически меняются, достигая максимума и минимума, через равные промежутки времени.
Нерегулярные изменения в интенсивности эпидемического процесса вызваны причинами и условиями, беспорядочно меняющимися во времени и вызывающими отклонения фактической заболеваемости от возможного теоретического уровня.
Так как на эпидемический процесс одновременно действуют причины и условия, относящиеся ко всем группам, их сочетанное действие и определяет фактическую многолетнюю динамику заболеваемости. Поэтому задачей анализа многолетней динамики заболеваемости является определение закономерных и случайных проявлений.
В ходе проведения анализа предусматривается:
1. Построение таблиц и графиков.
2. Оценка заболеваемости за отчетный год.
3. Оценка многолетней тенденции.
4. Оценка многолетней цикличности.
5. Оценка нерегулярных колебаний эпидемического процесса.
6. Прогноз заболеваемости на будущий год.
Построение таблиц и графиков. Для построения таблиц и графиков составляются динамические ряды. Динамическим рядом называется ряд статистических величин, показывающих изменения какого-либо явления (например, эпидемического процесса) во времени. Величины динамического ряда могут быть выражены абсолютными и относительными числами, а также средними величинами. Числа, образующие динамический ряд (члены ряда), принято называть уровнем ряда.
Для оценки многолетней динамики эпидемического процесса при составлении динамического ряда преимущественно используют интен-
сивные годовые показатели заболеваемости. Пример построения динамического ряда приведен в табл. 5.
Выбор длительности периода, подлежащего анализу, определяется продолжительностью интервала между периодическими подъемами. Для достаточно точной оценки закономерных проявлений необходимо включение в изучаемый период 3-5-ти циклов.
Так, например, для инфекции со сравнительно коротким (2-3 г.) интервалом между периодическими подъемами длительность изучаемого периода должна составлять не менее 8-15 лет. На основе динамического ряда проводятся все необходимые расчеты, и строится графическое изображение многолетней динамики заболеваемости (см. рис. 1).
Оценка заболеваемости за отчетный год. Оценка показателя заболеваемости за отчетный год проводится несколькими методами.
Наиболее широко применяемый в практике метод - сравнение заболеваемости отчетного года с показателем предыдущего года.
Пример: Из данных табл. 5 видно, что показатель заболеваемости в 2004 г. (отчетном) составил - 13,3, а в 2003 г. - 8,8.
13,3 / 8,8 = 1,5.
Вывод: в отчетном 2004 г. заболеваемость эхинококкозом среди населения республики выросла по сравнению с предыдущим 2003 г. в 1,5 раза (см. табл. 5 и рис. 1).
Пример: 2003 г. - 8,8 = 100%;
2004 г. - 13,3 = X%;
X =13,3 \ 8,8 х 100 = 151%.
Вывод: в отчетном 2004 г. заболеваемость эхинококкозом среди населения республики выросла по сравнению с 2003 г. на 151%. Оценить фактический показатель заболеваемости за отчетный период можно также, сравнивая его со среднемноголетним показателем или прогностической величиной заболеваемости, полученной в предыдущем году.
Сравнение заболеваемости в отчетном году со среднемноголетней заболеваемостью позволит ориентировочно оценить эпидемиологическую ситуацию по табл. 6.
Таблица 6
Оценка заболеваемости в отчетном году по средней многолетней заболеваемости
- среднеквадратическое отклонение, которое рассчитывается по формуле:
Оценку фактического показателя заболеваемости за отчетный период можно провести, сравнивая его с полученной в прошлом году прогностической величиной заболеваемости. При этом, если фактический показатель не выходит за пределы прогностических границ заболеваемости, можно полагать, что он существенно не отличается от того уровня заболеваемости, который должен был быть в отчетном году, учитывая характер многолетней динамики.
Таким образом, можно сделать вывод, что активность причин, определяющих заболеваемость в отчетном году, находится в соответствии с многолетней тенденцией.
Оценка многолетней тенденции. Для получения достоверной многолетней тенденции необходимо выбрать достаточно длительный период. Многолетняя тенденция зависит от выраженности многолетней периодичности и размаха эпизодических (случайных) колебаний динамического ряда.
При отсутствии периодичности или слабой ее выраженности достоверно оценить тенденцию возможно за период не менее 8-10 лет. Если для заболеваемости характерна выраженная цикличность, то для достоверной оценки тенденции необходимо исследовать динамический ряд, включающий несколько эпидемических циклов (не менее 5-6). В том случае, если для многолетней периодичности присущи медленно растущие волны или большие циклы, состоящие из нескольких коротких, создается опасность принять за оценку тенденции заболеваемости одну из ветвей периодических волн.
Использование для анализа многолетней тенденции коротких временных рядов (менее 8-10 лет) не рекомендуется, так как при этом существенное влияние на выводы могут оказать не только периодические, но и нерегулярные колебания эпидемического процесса.
Многолетнюю тенденцию можно оценить визуально по графическому изображению, построенному на основе данных динамического ряда, или же предварительно выровняв эмпирические данные.
Визуальная оценка графического изображения как первый и простейший этап анализа необходима для предварительного определения многолетней направленности тенденции, количества восходящих и нисходящих компонентов многолетней кривой.
Для большей точности и наглядности оценку многолетней тенденции заболеваемости проводят с использованием различных методик выравнивания эмпирических данных, что уменьшает или даже устраняет нерегулярные (случайные) и регулярные (периодические) колебания заболеваемости. При этом на графике фактической кривой наносится теоретическая линия тенденции.
Самый простой способ определения линии-тенденции - выравнивание фактической кривой методом «от руки». Следует подчеркнуть, что при достаточном навыке, этот метод обладает достаточно высокой информативностью, однако он, как и визуальная оценка графика, в известной степени субъективен.
Для уменьшения субъективизма при выравнивании эмпирических данных применяются такие методы, как:
1) метод укрупнения периодов;
2) метод скользящей средней;
3) метод наименьших квадратов (м.н.к.) и т.д.
Выравнивание динамического ряда показателей заболеваемости методом укрупнения периодов. При данном методе динамический ряд, состоящий из интенсивных годовых показателей заболеваемости, заменяют динамическим рядом, состоящим из средних величин показателей заболеваемости за равные промежутки времени (укрупненные периоды). Периоды укрупнения подбираются эмпирически и могут составлять два года и более, в зависимости от длительности изучаемого периода. При изучении крупных промежутков времени чаще всего берут 5 и 10 лет.
Метод укрупнения периода уменьшает влияние периодических и нерегулярных колебаний на характер многолетней тенденции, но, к сожалению, приемлем только для больших динамических рядов, т.к. сильно их укорачивает. Кроме того, методу присущ некоторый элемент субъективизма.
Расчет ведется по формуле:
где- среднемноголетняя заболеваемость за период укрупнения;-
сумма фактической заболеваемости за период укрупнения; п - число лет, входящих в период укрупнения.
Пример. Выровнять динамический ряд показателей заболеваемости эхинококкозом в КР за период с 1962-2004 гг. по данным табл. 5. Взять в качестве периода укрупнения 3 года (п = 3 года).
Метод укрупнения периода не информативен для коротких динамических рядов и дает искаженную тенденцию. Для получения достоверных данных требуются более продолжительные периоды (80100 лет) при слабовыраженной цикличности и нерегулярных колебаниях.
Выравнивание динамического ряда показателей заболеваемости методом скользящей средней интервальных периодов. Сглаживание с помощью скользящих средних проводится путем суммирования показателей фактической заболеваемости двух, трех и более смежных лет и деления полученной суммы на число суммированных лет. В полученных средних величинах взаимно погашаются случайные отклонения. Это происходит вследствие того, что фактические показатели заболеваемости заменяются средней арифметической величиной внутри выбранного интервала времени. Вычисленная средняя относится к середине выбранного интервала. Затем период сдвигается на одно наблюдение и расчет средней повторяется, причем периоды берутся одинаковые. Таким образом, в каждом случае средняя центрирована, т.е. отнесена к средней точке интервала сглаживания и представляет собой уровень для этой точки. При сглаживании в расчетах участвуют все уровни ряда. Чем шире интервал скольжения, тем более плавным получается тренд. Одновременно сокращается количество наблюдений, что является одним из отрицательных свойств этого метода. Поэтому при анализе многолетней динамики заболеваемости выбор интервала сглаживания приобретает большое значение, это зависит и от целей исследования. В большинстве случаев используется двух- или трехлетний период сглаживания (шаг осреднения).
Пример. Выровнять динамический ряд показателей заболеваемости эхинококкозом в КР за период с 1962 по 2004 гг. методом скользящей средней.
А. Шаг осреднения 3 года (п=3).
Расчет ведется по формуле:
Как видно, метод выравнивания с помощью скользящей средней можно использовать и для более коротких периодов, в отличие от метода укрупнения периода. Но он также мало информативен при больших перепадах заболеваемости.
Методы укрупнения периодов и скользящей средней наиболее показательны для динамических рядов с линейными тенденциями во всех интервалах сглаживания кривой. Если же на отдельных участках изменения уровня ряды идут по нелинейному тренду, указанные методы оказываются недостаточно информативными. В этом случае можно использовать метод взвешенных скользящих средних, который представляет комбинацию обычного метода скользящих средних с методом наименьших квадратов. Но и в этом случае теоретическую линию тенденции трудно оценить количественно. Наиболее информативным является построение теоретической линии тенденции с помощью метода наименьших квадратов.
Выравнивание динамического ряда показателей заболеваемости методом наименьших квадратов. Суть метода сводится к тому, что характер причин, определяющих долговременные изменения интенсивности эпидемического процесса, а также форма их связи с ведущими факторами его регуляции остаются постоянными на протяжении всего анализируемого периода.
Выравнивание динамического ряда происходит по формуле:
где- теоретические (расчетные) уровни заболеваемости за каждый год динамического ряда, которые необходимы для построения теоретической линии тенденции;
- среднемноголетний уровень заболеваемости (постоянная величина);
В хХ - переменная величина для каждого анализируемого года, формирующая прямолинейную тенденцию;
В - коэффициент, показывающий разницу между теоретическим и фактическим уровнем заболеваемости за смежные годы;
Х - натуральные числа, проставляемые от центра ряда в оба его конца.
Динамический ряд делится на две равные части. Уровни нумеруются, начиная от середины ряда. Верхняя часть номеров получает знак «-», нижняя часть - «+» При четном количестве анализируемых лет отсчет начинается от двух центральных показателей, которым присваиваются номера «-1» и «+1». При нечетном количестве центральному динамическому уровню присваивается номер «0», прочим показателям с обеих сторон присваиваются номера от «1» в возрастающем порядке.
Среднеарифметический уровень заболеваемости за изучаемый периодрассчитывается по формуле:
где- сумма показателей фактической заболеваемости за изучае
мый период;
п - число членов (уровней) динамического ряда (число лет наблюдения).
Коэффициент В рассчитывается по формуле:
где -сумма произведений фактической заболеваемости за ка
ждый год на соответствующее натуральное число Х. Половина значений имеет отрицательное значение другая, - положительное;
- сумма натуральных чисел Х, возведенных в квадрат.
Перед началом выравнивания динамического ряда методом наименьших квадратов необходимо исследовать динамический ряд для выявления низких или высоких (аномальных, «выскакивающих») показателей заболеваемости. Они формируются, как правило, под влиянием случайных факторов, не присущих основной части совокупности показателей, и могут привести к существенным искажениям многолетней тенденции заболеваемости.
Наиболее целесообразно заменить такие показатели величинами, равными верхнему или нижнему уровню доверительных границ среднемноголетнего показателя (в зависимости от того, среди каких показателей, высоких или низких, выявлена искомая величина). Для этиго выполняют следующие этапы анализа.
Пользуясь табл. 5, определить среднемноголетний показатель заболеваемости (1ср) и вычислить среднее квадратическое отклонение этого показателя по формуле:
где- (сигма) - среднеквадратическое отклонение;
- (дисперсия) - квадрат отклонений фактических показателей заболеваемости от среднемноголетнего показателя для каждого года; п - 1 - число лет без одного анализируемого года.
Проводят ранжирование показателей заболеваемости в нарастающем порядке. В ранжированном ряду показателей резко выделяющиеся минимальные и максимальные величины занимают, как правило, крайние места. Для доказательства того, что они обладают свойствами резко выделяющихся величин в исследуемой совокупности показателей, в математической статистике существует ряд способов и критериев. Наиболее строгими являются критерии Шовене. Для исследования величин применяются следующие формулы:
а) для крайних минимальных показателей:
где- показатель первого ранга;
б) для крайних максимальных показателей:
где 1п - показатель последнего ранга.
Полученные производные сравнивают с табличными критериями Шовене для данного числа наблюдений. Критерии Шовене представлены в Приложении 2. Если производная величина вычисления будет больше табличного коэффициента, исследуемый показатель считается резко выделяющимся. Резко выделяющиеся показатели заболеваемости заменяются величинами, равными верхнему или нижнему уровню доверительных границ среднемноголетнего показателя. Динамический ряд может содержать несколько резко выделяющихся показателей как среди максимальных, так и среди минимальных величин. В таких случаях после замены первого аномального показателя снова определяют среднемноголетний показатель и среднее квадратичное отклонение, и весь цикл вычислений повторяется в аналогичной последовательности.
Теоретические показатели используются в ходе анализа только на этапах определения динамического ряда многолетних теоретических показателей прямолинейной и криволинейной тенденции. Необходимость замены диктуется тем, что абсолютное исключение резко выделяющихся показателей может исказить линии тенденций.
Теоретические величины для замены резко выделяющихся показателей заболеваемости рассчитываются по формулам:
- для замены минимальных показателей;
- для замены максимальных показателей.
Вычисление теоретических величин по этим формулам производится после исключения резко выделяющихся показателей.
Экспресс-метод наименьших квадратов. Для экономии времени можно рассчитатьтолько для первого и последнего года, нанести их на график и соединить прямой, которая и будет линией тенденции. Выравнивание по прямой методом наименьших квадратов проводится при
отсутствии переломов в тенденции, независимо от наличия циклических колебаний и их амплитуды. В тех случаях, когда при однонаправленных тенденциях интенсивность изменения процесса варьирует, выравнивание за весь период не противопоказано, если при этом соблюдаются условия качественной однородности эпидемического процесса. В противном случае эпидемиологически более правильно разделить анализируемый ряд на несколько периодов, характеризующихся действием различных факторов.
Пример. Рассчитать линию тенденции для заболеваемости эхино- коккозом в Кыргызской Республике за период с 1962 по 2004 гг. по данным табл. 5.
1. Рассчитать среднемноголетний показатель.
1ср = (3 + 0 + 2,7 + 0,6 + 2,6 + 2,7 + 3,2 + 0 + 3,4 + 3,3 + 3,9 + 3,6 + 2,1 + + 3,2 + 2,8 + 0,8 + 2,5 + 3,7 + 2,8 + 1,9 + 2,4 + 3,1 + 3,3 + 2,5 + 2,7 + 2,6 + + 3,6 + 3,0 + 5,2 + 6,1 + 6,4 + 5,2 + 6,1 + 10,1 + 8,3 + 9,8 + 14,2 + 11,1 + + 12,1 + 9,8 + 9,5 + 8,8 + 13,3) / 43 = 4,8.
1. Выявить резко выделяющиеся минимальные и максимальные уровни.
3.1. Для этого провести ранжирование в возрастающем порядке (см. последнюю графу табл. 8).
3.2. Выяснить, является ли I1 = 0 резко выделяющимся минимальным значением. 4,8 - 0 / 1,26 = 3,8. Полученное значение сравнить с критерием Шовене (Приложение 2) для выборки из 43 уровней 3,8 > 2,58, значит, I1 является резко выделяющимся значением.
4.1. На основании рассчитанных 1теор строим линию тенденции многолетней динамики для визуальной оценки полученной линии (рис. 2). Как видно из рис. 2, заболеваемость эхинококкозом имеет выраженную тенденция к повышению.
Выравнивание динамического ряда по параболе второго порядка. Метод наименьших квадратов, как уже выше отмечалось, является выравнивание
Многолетнюю тенденцию определяет группа причин и условий, которые действуют постоянно, не меняясь в течение многих лет или меняясь преимущественно в одном направлении, вызывая рост, снижение или стабилизацию заболеваемости.
Периодичность или цикличность зависит от ряда причин и условий, которые ритмически меняются, достигая максимума и минимума, через равные промежутки времени.
Нерегулярные изменения в интенсивности эпидемического процесса вызваны причинами и условиями, беспорядочно меняющимися во времени и вызывающими отклонения фактической заболеваемости от возможного теоретического уровня.
Так как на эпидемический процесс одновременно действуют причины и условия, относящиеся ко всем группам, их сочетанное действие и определяет фактическую многолетнюю динамику заболеваемости. Поэтому задачей анализа многолетней динамики заболеваемости является определение закономерных и случайных проявлений.
В ходе проведения анализа предусматривается:
1. Построение таблиц и графиков.
2. Оценка заболеваемости за отчетный год.
3. Оценка многолетней тенденции.
4. Оценка многолетней цикличности.
5. Оценка нерегулярных колебаний эпидемического процесса.
6. Прогноз заболеваемости на будущий год.
Построение таблиц и графиков. Для построения таблиц и графиков составляются динамические ряды. Динамическим рядом называется ряд статистических величин, показывающих изменения какого-либо явления (например, эпидемического процесса) во времени. Величины динамического ряда могут быть выражены абсолютными и относительными числами, а также средними величинами. Числа, образующие динамический ряд (члены ряда), принято называть уровнем ряда.
Для оценки многолетней динамики эпидемического процесса при составлении динамического ряда преимущественно используют интен-
сивные годовые показатели заболеваемости. Пример построения динамического ряда приведен в табл. 5.
Год | 1962 | 1963 | 1964 | 1965 | 1966 | 1967 | 1968 | 1969 | ||||||
Заболеваемость | 3,0 | 0 | 2,7 | 0,6 | 2,6 | 2,7 | 3,2 | 0 | ||||||
Год | 1970 | 1971 | 1972 | 1973 | 1974 | 1975 | 1976 | 1977 | ||||||
Заболеваемость | 3,4 | 3,3 | 3,9 | 3,6 | 2,1 | 3,2 | 2,8 | 0,8 | ||||||
Год | 1978 | 1 979 | 1980 | 1981 | 1982 | 1983 | 1984 | 1985 | 1986 | |||||
Заболеваемость | 2,5 | 3,7 | 2,8 | 1,9 | 2,4 | 3,1 | 3,3 | 2,5 | 2,7 | |||||
Год | 1987 | 1988 | 1989 | 1990 | 1991 | 1992 | 1993 | 1994 | 1995 | |||||
Заболеваемость | 2,6 | 3,6 | 3,0 | 5,2 | 6,1 | 6,4 | 5,2 | 6,1 | 10,1 | |||||
Год | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | |||||
Заболеваемость | 8,3 | 9,8 | 14,2 | 11,1 | 12,1 | 9,8 | 9,5 | 8,8 | 13,3 | |||||
Таблица 5 |
Заболеваемость эхинококкозом в КР (на 100тыс.) |
Выбор длительности периода, подлежащего анализу, определяется продолжительностью интервала между периодическими подъемами. Для достаточно точной оценки закономерных проявлений необходимо включение в изучаемый период 3-5-ти циклов.
Так, например, для инфекции со сравнительно коротким (2-3 г.) интервалом между периодическими подъемами длительность изучаемого периода должна составлять не менее 8-15 лет. На основе динамического ряда проводятся все необходимые расчеты, и строится графическое изображение многолетней динамики заболеваемости (см. рис. 1).
годы Рис. 1. Многолетняя динамика заболеваемости эхинококкозом в КР. |
Оценка заболеваемости за отчетный год. Оценка показателя заболеваемости за отчетный год проводится несколькими методами.
Наиболее широко применяемый в практике метод - сравнение заболеваемости отчетного года с показателем предыдущего года.
Пример: Из данных табл. 5 видно, что показатель заболеваемости в 2004 г. (отчетном) составил - 13,3, а в 2003 г. - 8,8.
13,3 / 8,8 = 1,5.
Вывод: в отчетном 2004 г. заболеваемость эхинококкозом среди населения республики выросла по сравнению с предыдущим 2003 г. в 1,5 раза (см. табл. 5 и рис. 1).
Пример: 2003 г. - 8,8 = 100%;
2004 г. - 13,3 = X%;
X =13,3 \ 8,8 х 100 = 151%.
Вывод: в отчетном 2004 г. заболеваемость эхинококкозом среди населения республики выросла по сравнению с 2003 г. на 151%. Оценить фактический показатель заболеваемости за отчетный период можно также, сравнивая его со среднемноголетним показателем или прогностической величиной заболеваемости, полученной в предыдущем году.
Сравнение заболеваемости в отчетном году со среднемноголетней заболеваемостью позволит ориентировочно оценить эпидемиологическую ситуацию по табл. 6.
Таблица 6
Оценка заболеваемости в отчетном году по средней многолетней заболеваемости
- среднеквадратическое отклонение, которое рассчитывается по формуле:
Оценку фактического показателя заболеваемости за отчетный период можно провести, сравнивая его с полученной в прошлом году прогностической величиной заболеваемости. При этом, если фактический показатель не выходит за пределы прогностических границ заболеваемости, можно полагать, что он существенно не отличается от того уровня заболеваемости, который должен был быть в отчетном году, учитывая характер многолетней динамики.
Таким образом, можно сделать вывод, что активность причин, определяющих заболеваемость в отчетном году, находится в соответствии с многолетней тенденцией.
Оценка многолетней тенденции. Для получения достоверной многолетней тенденции необходимо выбрать достаточно длительный период. Многолетняя тенденция зависит от выраженности многолетней периодичности и размаха эпизодических (случайных) колебаний динамического ряда.
При отсутствии периодичности или слабой ее выраженности достоверно оценить тенденцию возможно за период не менее 8-10 лет. Если для заболеваемости характерна выраженная цикличность, то для достоверной оценки тенденции необходимо исследовать динамический ряд, включающий несколько эпидемических циклов (не менее 5-6). В том случае, если для многолетней периодичности присущи медленно растущие волны или большие циклы, состоящие из нескольких коротких, создается опасность принять за оценку тенденции заболеваемости одну из ветвей периодических волн.
Использование для анализа многолетней тенденции коротких временных рядов (менее 8-10 лет) не рекомендуется, так как при этом существенное влияние на выводы могут оказать не только периодические, но и нерегулярные колебания эпидемического процесса.
Многолетнюю тенденцию можно оценить визуально по графическому изображению, построенному на основе данных динамического ряда, или же предварительно выровняв эмпирические данные.
Визуальная оценка графического изображения как первый и простейший этап анализа необходима для предварительного определения многолетней направленности тенденции, количества восходящих и нисходящих компонентов многолетней кривой.
Для большей точности и наглядности оценку многолетней тенденции заболеваемости проводят с использованием различных методик выравнивания эмпирических данных, что уменьшает или даже устраняет нерегулярные (случайные) и регулярные (периодические) колебания заболеваемости. При этом на графике фактической кривой наносится теоретическая линия тенденции.
Самый простой способ определения линии-тенденции - выравнивание фактической кривой методом «от руки». Следует подчеркнуть, что при достаточном навыке, этот метод обладает достаточно высокой информативностью, однако он, как и визуальная оценка графика, в известной степени субъективен.
Для уменьшения субъективизма при выравнивании эмпирических данных применяются такие методы, как:
1) метод укрупнения периодов;
2) метод скользящей средней;
3) метод наименьших квадратов (м.н.к.) и т.д.
Выравнивание динамического ряда показателей заболеваемости методом укрупнения периодов. При данном методе динамический ряд, состоящий из интенсивных годовых показателей заболеваемости, заменяют динамическим рядом, состоящим из средних величин показателей заболеваемости за равные промежутки времени (укрупненные периоды). Периоды укрупнения подбираются эмпирически и могут составлять два года и более, в зависимости от длительности изучаемого периода. При изучении крупных промежутков времени чаще всего берут 5 и 10 лет.
Метод укрупнения периода уменьшает влияние периодических и нерегулярных колебаний на характер многолетней тенденции, но, к сожалению, приемлем только для больших динамических рядов, т.к. сильно их укорачивает. Кроме того, методу присущ некоторый элемент субъективизма.
Расчет ведется по формуле:
где- среднемноголетняя заболеваемость за период укрупнения;-
сумма фактической заболеваемости за период укрупнения; п - число лет, входящих в период укрупнения.
Пример. Выровнять динамический ряд показателей заболеваемости эхинококкозом в КР за период с 1962-2004 гг. по данным табл. 5. Взять в качестве периода укрупнения 3 года (п = 3 года).
Таблица 7
Выровненный динамический ряд методами укрупнения периода и скользящей средней
|
Год | 1971 | 1972 | 1973 | 1974 | 1975 | 1976 | 1977 | 1978 | 1979 |
Заболеваемость (фактическая) 1фак | 3,3 | 3,9 | 3,6 | 2,1 | 3,2 | 2,8 | 0,8 | 2,5 | 3,7 |
Укрупнение периода - 3 года | 3,6 | 2,7 | 2,3 | ||||||
Скользящая средняя (шаг=3 года) | 3,5 | 3,6 | 3,2 | 2,9 | 2,7 | 2,2 | 2,0 | 3,0 | 3,0 |
Скользящая средняя (шаг =5 лет) | 2,8 | 3,2 | 3,2 | 3,1 | 2,5 | 2,3 | 2,6 | 2,5 | 2,3 |
Год | 1980 | 1981 | 1982 | 1983 | 1984 | 1985 | 1986 | 1987 | 1988 |
Заболеваемость
(фактическая) |
2,8 | 1,9 | 2,4 | 3,1 | 3,3 | 2,5 | 2,7 | 2,6 | 3,6 |
Укрупнение периода -Згода | 2,3 | 2,9 | 2,9 | ||||||
Скользящая средняя (шаг = 3 года) | 2,8 | 2,3 | 2,4 | 2,9 | 2,9 | 2,8 | 2,6 | 2,9 | 3,0 |
Скользящая средняя (шаг = 5 лет) | 2,6 | 2,7 | 2,7 | 2,6 | 2,8 | 2,9 | 2,9 | 2,8 | 3,4 |
Год | 1989 | 1990 | 1991 | 1992 | 1993 | 1994 | 1995 | 1996 | 1997 |
Заболеваемость
(фактическая) |
3,0 | 5,2 | 6,1 | 6,4 | 5,2 | 6,1 | 10,1 | 8,3 | 9,8 |
Укрупнение периода -3 года | 4,7 | 5,9 | 9,4 | ||||||
Скользящая средняя (шаг = 3 года) | 4,9 | 4,7 | 5,9 | 5,9 | 5,9 | 7,1 | 8,1 | 9,4 | 10,7 |
Скользящая средняя (шаг = 5 лет) | 4,1 | 4,8 | 5,1 | 5,8 | 6,8 | 7,2 | 7,9 | 9,7 | 10,7 |
Год | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | ||
Заболеваемость
(фактическая) |
14,2 | 11,1 | 12,1 | 9,8 | 9,5 | 8,8 | 13,3 | ||
Укрупнение периода - 3 года | 12,4 | 9,3 | |||||||
Скользящая средняя (шаг = 3 года) | 11,7 | 12,4 | 11,0 | 10,4 | 9,3 | 10,5 | |||
Скользящая средняя (шаг = 5 лет) | 11,1 | 11,3 | 10,2 | 10,1 | 10,7 |
Метод укрупнения периода не информативен для коротких динамических рядов и дает искаженную тенденцию. Для получения достоверных данных требуются более продолжительные периоды (80100 лет) при слабовыраженной цикличности и нерегулярных колебаниях.
Рис. 2. Выравнивание динамического ряда укрупнением периода и скользящей средней. |
Выравнивание динамического ряда показателей заболеваемости методом скользящей средней интервальных периодов. Сглаживание с помощью скользящих средних проводится путем суммирования показателей фактической заболеваемости двух, трех и более смежных лет и деления полученной суммы на число суммированных лет. В полученных средних величинах взаимно погашаются случайные отклонения. Это происходит вследствие того, что фактические показатели заболеваемости заменяются средней арифметической величиной внутри выбранного интервала времени. Вычисленная средняя относится к середине выбранного интервала. Затем период сдвигается на одно наблюдение и расчет средней повторяется, причем периоды берутся одинаковые. Таким образом, в каждом случае средняя центрирована, т.е. отнесена к средней точке интервала сглаживания и представляет собой уровень для этой точки. При сглаживании в расчетах участвуют все уровни ряда. Чем шире интервал скольжения, тем более плавным получается тренд. Одновременно сокращается количество наблюдений, что является одним из отрицательных свойств этого метода. Поэтому при анализе многолетней динамики заболеваемости выбор интервала сглаживания приобретает большое значение, это зависит и от целей исследования. В большинстве случаев используется двух- или трехлетний период сглаживания (шаг осреднения).
Пример. Выровнять динамический ряд показателей заболеваемости эхинококкозом в КР за период с 1962 по 2004 гг. методом скользящей средней.
А. Шаг осреднения 3 года (п=3).
Расчет ведется по формуле:
Как видно, метод выравнивания с помощью скользящей средней можно использовать и для более коротких периодов, в отличие от метода укрупнения периода. Но он также мало информативен при больших перепадах заболеваемости.
Методы укрупнения периодов и скользящей средней наиболее показательны для динамических рядов с линейными тенденциями во всех интервалах сглаживания кривой. Если же на отдельных участках изменения уровня ряды идут по нелинейному тренду, указанные методы оказываются недостаточно информативными. В этом случае можно использовать метод взвешенных скользящих средних, который представляет комбинацию обычного метода скользящих средних с методом наименьших квадратов. Но и в этом случае теоретическую линию тенденции трудно оценить количественно. Наиболее информативным является построение теоретической линии тенденции с помощью метода наименьших квадратов.
Выравнивание динамического ряда показателей заболеваемости методом наименьших квадратов. Суть метода сводится к тому, что характер причин, определяющих долговременные изменения интенсивности эпидемического процесса, а также форма их связи с ведущими факторами его регуляции остаются постоянными на протяжении всего анализируемого периода.
Выравнивание динамического ряда происходит по формуле:
где- теоретические (расчетные) уровни заболеваемости за каждый год динамического ряда, которые необходимы для построения теоретической линии тенденции;
- среднемноголетний уровень заболеваемости (постоянная величина);
В хХ - переменная величина для каждого анализируемого года, формирующая прямолинейную тенденцию;
В - коэффициент, показывающий разницу между теоретическим и фактическим уровнем заболеваемости за смежные годы;
Х - натуральные числа, проставляемые от центра ряда в оба его конца.
Динамический ряд делится на две равные части. Уровни нумеруются, начиная от середины ряда. Верхняя часть номеров получает знак «-», нижняя часть - «+» При четном количестве анализируемых лет отсчет начинается от двух центральных показателей, которым присваиваются номера «-1» и «+1». При нечетном количестве центральному динамическому уровню присваивается номер «0», прочим показателям с обеих сторон присваиваются номера от «1» в возрастающем порядке.
Среднеарифметический уровень заболеваемости за изучаемый периодрассчитывается по формуле:
где- сумма показателей фактической заболеваемости за изучае
мый период;
п - число членов (уровней) динамического ряда (число лет наблюдения).
Коэффициент В рассчитывается по формуле:
где -сумма произведений фактической заболеваемости за ка
ждый год на соответствующее натуральное число Х. Половина значений имеет отрицательное значение другая, - положительное;
- сумма натуральных чисел Х, возведенных в квадрат.
Перед началом выравнивания динамического ряда методом наименьших квадратов необходимо исследовать динамический ряд для выявления низких или высоких (аномальных, «выскакивающих») показателей заболеваемости. Они формируются, как правило, под влиянием случайных факторов, не присущих основной части совокупности показателей, и могут привести к существенным искажениям многолетней тенденции заболеваемости.
Наиболее целесообразно заменить такие показатели величинами, равными верхнему или нижнему уровню доверительных границ среднемноголетнего показателя (в зависимости от того, среди каких показателей, высоких или низких, выявлена искомая величина). Для этиго выполняют следующие этапы анализа.
Пользуясь табл. 5, определить среднемноголетний показатель заболеваемости (1ср) и вычислить среднее квадратическое отклонение этого показателя по формуле:
где- (сигма) - среднеквадратическое отклонение;
- (дисперсия) - квадрат отклонений фактических показателей заболеваемости от среднемноголетнего показателя для каждого года; п - 1 - число лет без одного анализируемого года.
Проводят ранжирование показателей заболеваемости в нарастающем порядке. В ранжированном ряду показателей резко выделяющиеся минимальные и максимальные величины занимают, как правило, крайние места. Для доказательства того, что они обладают свойствами резко выделяющихся величин в исследуемой совокупности показателей, в математической статистике существует ряд способов и критериев. Наиболее строгими являются критерии Шовене. Для исследования величин применяются следующие формулы:
а) для крайних минимальных показателей:
где- показатель первого ранга;
б) для крайних максимальных показателей:
где 1п - показатель последнего ранга.
Полученные производные сравнивают с табличными критериями Шовене для данного числа наблюдений. Критерии Шовене представлены в Приложении 2. Если производная величина вычисления будет больше табличного коэффициента, исследуемый показатель считается резко выделяющимся. Резко выделяющиеся показатели заболеваемости заменяются величинами, равными верхнему или нижнему уровню доверительных границ среднемноголетнего показателя. Динамический ряд может содержать несколько резко выделяющихся показателей как среди максимальных, так и среди минимальных величин. В таких случаях после замены первого аномального показателя снова определяют среднемноголетний показатель и среднее квадратичное отклонение, и весь цикл вычислений повторяется в аналогичной последовательности.
Теоретические показатели используются в ходе анализа только на этапах определения динамического ряда многолетних теоретических показателей прямолинейной и криволинейной тенденции. Необходимость замены диктуется тем, что абсолютное исключение резко выделяющихся показателей может исказить линии тенденций.
Теоретические величины для замены резко выделяющихся показателей заболеваемости рассчитываются по формулам:
- для замены минимальных показателей;
- для замены максимальных показателей.
Вычисление теоретических величин по этим формулам производится после исключения резко выделяющихся показателей.
Экспресс-метод наименьших квадратов. Для экономии времени можно рассчитатьтолько для первого и последнего года, нанести их на график и соединить прямой, которая и будет линией тенденции. Выравнивание по прямой методом наименьших квадратов проводится при
отсутствии переломов в тенденции, независимо от наличия циклических колебаний и их амплитуды. В тех случаях, когда при однонаправленных тенденциях интенсивность изменения процесса варьирует, выравнивание за весь период не противопоказано, если при этом соблюдаются условия качественной однородности эпидемического процесса. В противном случае эпидемиологически более правильно разделить анализируемый ряд на несколько периодов, характеризующихся действием различных факторов.
Пример. Рассчитать линию тенденции для заболеваемости эхино- коккозом в Кыргызской Республике за период с 1962 по 2004 гг. по данным табл. 5.
1. Рассчитать среднемноголетний показатель.
1ср = (3 + 0 + 2,7 + 0,6 + 2,6 + 2,7 + 3,2 + 0 + 3,4 + 3,3 + 3,9 + 3,6 + 2,1 + + 3,2 + 2,8 + 0,8 + 2,5 + 3,7 + 2,8 + 1,9 + 2,4 + 3,1 + 3,3 + 2,5 + 2,7 + 2,6 + + 3,6 + 3,0 + 5,2 + 6,1 + 6,4 + 5,2 + 6,1 + 10,1 + 8,3 + 9,8 + 14,2 + 11,1 + + 12,1 + 9,8 + 9,5 + 8,8 + 13,3) / 43 = 4,8.
Таблица 8 |
Расчет среднеквадратического отклонения
|
1 | 2 | 3 | 4 | 5 |
1976 | 2,8 | 2,0 | 4 | 2,8 |
1977 | 0,8 | 4,0 | 16 | 2,8 |
1978 | 2,5 | 2,3 | 5,29 | 3,0 |
1979 | 3,7 | 1,1 | 1,21 | 3,0 |
1980 | 2,8 | 2.0 | 4 | 3,1 |
1981 | 1,9 | 2,9 | 8,41 | 3,2 |
1982 | 2,4 | 2,4 | 5,76 | 3,2 |
1983 | 3,1 | 1,7 | 2,89 | 3,3 |
1984 | 3,3 | 1,5 | 2,25 | 3,3 |
1985 | 2,5 | 2,3 | 5,29 | 3,4 |
1986 | 2,7 | 2,1 | 4,41 | 3,6 |
1987 | 2,6 | 2,2 | 4,84 | 3,6 |
1988 | 3,6 | 1,2 | 1,44 | 3,7 |
1989 | 3,0 | 1,8 | 3,24 | 3,9 |
1990 | 5,2 | -0,4 | 0,16 | 5,2 |
1991 | 6,1 | -1,3 | 1,69 | 5,2 |
1992 | 6,4 | -1,6 | 2,56 | 6,1 |
1993 | 5,2 | -0,4 | 0,16 | 6,1 |
1994 | 6,1 | -1,3 | 1,69 | 6,4 |
1995 | 10,1 | -5,3 | 28,09 | 8,3 |
1996 | 8,3 | -3,5 | 12.25 | 8,8 |
1997 | 9,8 | -5 | 25 | 9.5 |
1998 | 14,2 | 9,4 | 88,36 | 9,8 |
1999 | 11,1 | -6,3 | 39,69 | 9,8 |
2000 | 12,1 | -7,3 | 53,29 | 10,1 |
2001 | 9,8 | -5 | 25 | 11,1 |
2002 | 9,5 | -4,7 | 22,09 | 12,1 |
2003 | 8,8 | -4 | 16 | 13,3 |
2004 | 13,3 | -8,5 | 72,26 | 14,2 |
1ср | 208 \ 43 = 4,8 | 2821,77 | ||
а (сигма) | 1,26 |
1. Выявить резко выделяющиеся минимальные и максимальные уровни.
3.1. Для этого провести ранжирование в возрастающем порядке (см. последнюю графу табл. 8).
3.2. Выяснить, является ли I1 = 0 резко выделяющимся минимальным значением. 4,8 - 0 / 1,26 = 3,8. Полученное значение сравнить с критерием Шовене (Приложение 2) для выборки из 43 уровней 3,8 > 2,58, значит, I1 является резко выделяющимся значением.
Таблица 9 |
Выравнивание динамического ряда методом наименьших квадратов с учетом критерия Шовене
|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
11 | 1972 | 3,9 | -11 | -42,9 | 121 | 2,64 |
12 | 1973 | 3,6 | -10 | -36,0 | 100 | 2,78 |
13 | 1974 | 2,1 | -9 | -18,9 | 81 | 2,92 |
14 | 1975 | 3,2 | -8 | -25,6 | 64 | 3,-06 |
15 | 1976 | 2,8 | -7 | -19,6 | 49 | 3,36 |
16 | 1977 | 0,8 | -6 | -4,8 | 36 | 3,34 |
17 | 1978 | 2,5 | -5 | -12,5 | 25 | 3,48 |
18 | 1979 | 3,7 | -4 | -14,8 | 16 | 3,62 |
19 | 1980 | 2,8 | -3 | -8,4 | 9 | 3,76 |
20 | 1981 | 1,9 | -2 | -3,8 | 4 | 3,9 |
21 | 1982 | 2,4 | -1 | -2,4 | 1 | 4,04 |
22 | 1983 | 3,1 | 0 | 0 | 0 | 4,18 |
23 | 1984 | 3,3 | 1 | 3,3 | 1 | 4,32 |
24 | 1985 | 2,5 | 2 | 5 | 4 | 4,46 |
25 | 1986 | 2,7 | 3 | 8,1 | 9 | 4,6 |
26 | 1987 | 2,6 | 4 | 10,4 | 16 | 4,74 |
27 | 1988 | 3,6 | 5 | 18 | 25 | 4,88 |
28 | 1989 | 3,0 | 6 | 18 | 36 | 5,02 |
29 | 1990 | 5,2 | 7 | 36,4 | 49 | 5,16 |
30 | 1991 | 6,1 | 8 | 48,8 | 64 | 5,3 |
31 | 1992 | 6,4 | 9 | 57,6 | 81 | 5,44 |
32 | 1993 | 5,2 | 10 | 52 | 100 | 5,58 |
33 | 1994 | 6,1 | 11 | 67,1 | 121 | 5,72 |
34 | 1995 | 7,3 | 12 | 87,84 | 144 | 5,86 |
35 | 1996 | 8,3 | 13 | 107,9 | 169 | 6,0 |
36 | 1997 | 7,2 | 14 | 102,48 | 196 | 6,14 |
37 | 1998 | 7,3 | 15 | 109,8 | 225 | 6,28 |
38 | 1999 | 7,2 | 16 | 117,12 | 256 | 6,42 |
39 | 2000 | 7,1 | 17 | 124,44 | 289 | 6,56 |
40 | 2001 | 7,0 | 18 | 131,76 | 324 | 6,7 |
41 | 2002 | 7,0 | 19 | 139,08 | 361 | 6,84 |
42 | 2003 | 6,9 | 20 | 146,4 | 400 | 6,98 |
43 | 2004 | 6,9 | 21 | 153,7 | 441 | 7,12 |
Сумма | 180,34 | 958,42 | 6622 | |||
1ср | 4,9 | В = 0,14 | ||||
Т | -1,27199868 | | |
4.1. На основании рассчитанных 1теор строим линию тенденции многолетней динамики для визуальной оценки полученной линии (рис. 2). Как видно из рис. 2, заболеваемость эхинококкозом имеет выраженную тенденция к повышению.
Выравнивание динамического ряда по параболе второго порядка. Метод наименьших квадратов, как уже выше отмечалось, является выравнивание
Источник: С.Т. Карагулова, В.С. Тойгомбаева, «ОБЩАЯ ЭПИДЕМИОЛОГИЯ Учебное пособие» 2009
А так же в разделе «Анализ многолетней динамики заболеваемости »
- Цели и задачи эпидемиологического надзора
- Элементы системы эпидемиологического надзора
- Основные статистические методы, используемые в эпидемиологии
- Эпидемиологические исследования
- Этические вопросы проведения исследований
- Графическое изображение полученных данных
- Эпидемиологический анализ информации
- Анализ уровня и структуры регистрируемой заболеваемости
- Анализ заболеваемости в группах, выделенных по эпидемиологическим признакам
- Оперативный анализ заболеваемости