Период сглаживания. Расчет показателей динамики экономических процессов

Перейдем к вопросу о сглаживании временных рядов экономических показателей. Очень часто уровни рядов динамики колеблются, при этом тенденция развития экономического явления во времени скрыта случайными отклонениями уровней в ту или иную сторону. С целью четко выявить тенденцию развития исследуемого процесса, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание (выравнивание) временных рядов. Таким образом, сглаживание можно рассматривать как устранение случайной составляющей t из модели временного ряда.

Самым простым методом механического сглаживания является метод простой скользящей средней. Сначала для временного ряда y 1 , y 2 , y 3 ,…, y n определяется интервал сглаживания т (т < п). Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания. При прочих равных условиях интервал сглаживания рекомендуется брать нечетным. Для первых т уровней временного ряда вычисляется их средняя арифметическая; это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление средней арифметической и т.д.

Для вычисления сглаженных уровней ряда применяется формула

при нечетном m ;

для четных т формула усложняется.

В результате такой процедуры получаются п - т + 1 сглаженных значений уровней ряда; при этом первые р и последние р уровней ряда теряются (не сглаживаются).

Особенность метода экспоненциального сглаживания заключается в том, что в процедуре нахождения сглаживания i -го уровня используются значения только предшествующих уровней ряда (i -1, i -2,…), взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня ряда.

Если для исходного временного ряда y 1 , y 2 , y 3 ,…, y n соответствующие сглаженные значения уровней обозначить через S t , t = 1,2, …, п, то экспоненциальное сглаживание осуществляется по формуле

здесь S 0 – величина, характеризующая начальные условия.

В практических задачах обработки экономических временных рядов рекомендуется выбирать величину параметра сглаживания в интервале от 0,1 до 0,3.

Пример 4.4. Вернемся к примеру 1, в котором рассматриваются квартальные объемы продаж компании «Lewplan». Мы уже выяснили, что этим данным отвечает аддитивная модель, т.е. фактически объемы продаж можно выразить следующим образом:

Y = U + V + E.

Для того чтобы элиминировать влияние сезонной компоненты, воспользуемся методом скользящей средней. Просуммировав первые четыре значения, получим общий объем продаж в 1998 г. Если поделить эту сумму на четыре, можно найти средний балл продаж в каждом квартале 1998 г., т.е.

(239 + 201 +182 + 297)/4 = 229,75;
(201+182+297+324)/4 и т. д.

Полученное значение уже не содержит сезонной компоненты, поскольку представляет собой среднюю величину за год. У нас появилась оценка значения тренда для середины года, т.е. для точки, лежащей в середине между кварталами II и III. Если последовательно передвигаться вперед с интервалом в три месяца, можно рассчитать средние квартальные значения на промежутке апрель – март 1998 (251), июль – июнь 1998 (270,25) и т.д. Данная процедура позволяет генерировать скользящие средние по четырем точкам для исходного множества данных. Получаемое таким образом множество скользящих средних представляет наилучшую оценку искомого тренда.

Теперь полученные значения тренда можно использовать для нахождения оценок сезонной компоненты. Мы рассчитываем:

Y U = V + E .

К сожалению, оценки значений тренда, полученные в результате расчета средних по четырем точкам, относятся к нескольким иным моментам времени, чем фактические данные. Первая оценка, равная 229,75, представляет собой точку, совпадающую с серединой 1998 г., т.е. лежит в центре промежутка фактических значений объемов продаж во II и III кварталах. Вторая оценка, равная 251, лежит между фактическими значениями в III и IV кварталах. Нам же требуются десезонализированные средние значения, соответствующие тем же интервалам времени, что и фактические значения за квартал. Положение десезонализированных средних во времени сдвигается путем дальнейшего расчета средних для каждой пары значений. Найдем среднюю из первой оценок, центрируя их на июль – сентябрь 1998 г., т.е.

(229,75 + 251)/2 = 240,4.

Это и есть десезонализированная средняя за июль – сентябрь 1999 г. Эту десезонализированную величину, которая называется центрированной скользящей средней , можно непосредственно сравнивать с фактическим значением за июль – сентябрь 1998 г., равным 182. Отметим, что это означает отсутствие оценок тренда за первые два или последние два квартала временного ряда. Результаты этих расчетов приведены в табл.4.5.

Для каждого квартала мы имеем оценки сезонной компоненты, которые включают в себя ошибку или остаток. Прежде чем мы сможем использовать сезонную компоненту, нужно пройти два следующих этапа. Найдем средние значения сезонных оценок для каждого сезона года. Эта процедура позволит уменьшить некоторые значения ошибок. Наконец, скорректируем средние значения, увеличивая или уменьшая их на одно и тоже число таким образом, чтобы общая их сумма была равна нулю. Это необходимо, чтобы усреднить значения сезонной компоненты в целом за год.

Таблица 4.5. Оценка сезонной компоненты

Объем продаж Y , тыс. шт.

за четыре

квартала

Скользящая

средняя за четыре

квартала

Центрированная скользящая средняя U

сезонной компоненты

Y - U = V + E

Январь-март 1998

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 1999

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 2000

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 2001

Таблица 4.6. Расчет средних значений сезонной компоненты

Рассчитываемые

компоненты

Номер квартала

Среднее значение

Оценка сезонной

компоненты

Сумма = -0,2

Скорректированная

сезонная компонента 1

Корректирующий фактор рассчитывается следующим образом: сумма оценок сезонных компонент делится на 4. В последнем столбце табл. 4.5 эти оценки записаны под соответствующими квартальными значениями. Сама процедура приведена в табл. 4.6.

Значение сезонной компоненты еще раз подтверждает наши выводы, сделанные в примере 4.1 на основе анализа диаграммы. Объемы продаж за два зимних квартала превышают среднее трендовое значение приблизительно на 40 тыс. шт., а объемы продаж за два летних периода ниже средних на 21 и 62 тыс.шт. соответственно.

Аналогичная процедура применима при определении сезонной вариации за любой промежуток времени. Если, например, в качестве сезона выступают дни недели, для элиминирования влияния ежедневной сезонной компоненты также рассчитывают скользящую среднюю, но уже не по четырем, а по семи точкам. Эта скользящая средняя представляет собой значение тренда в середине недели, т.е. в четверг; таким образом, необходимость в процедуре центрирования отпадает.

Боярышник обыкновенный Боярышник обыкновенный Научная классификация Царство: Растения … Википедия

Экспоненциальное сглаживание метод математического преобразования используемый при прогнозировании временных рядов … Википедия

Индикатор Стохастик - (Stochastic Oscillator) Стохастический осциллятор, описание Stochastic, версии трендового индикатора Stochastic, Торговые сигналы индикатора Стохастик Добавление индикатора Stochastics на график торгового терминала Metatrader (MT), настройка… … Энциклопедия инвестора

Содержание: I. Физический очерк. 1. Состав, пространство, береговая линия. 2. Орография. 3. Гидрография. 4. Климат. 5. Растительность. 6. Фауна. II. Население. 1. Статистика. 2. Антропология. III. Экономический очерк. 1. Земледелие. 2.… …

I КАРТА ЯПОНСКОЙ ИМПЕРИИ. Содержание: I. Физический очерк. 1. Состав, пространство, береговая линия. 2. Орография. 3. Гидрография. 4. Климат. 5. Растительность. 6. Фауна. II. Население. 1. Статистика. 2. Антропология. III. Экономический очерк. 1 … Энциклопедический словарь Ф.А. Брокгауза и И.А. Ефрона

I Урал территория, расположенная между Восточно Европейской и Западно Сибирской равнинами и вытянутая с С. на Ю. от Сев. Ледовитого океана до широтного участка р. Урал ниже г. Орска. Основной частью её является Уральская горная система,… …

Схизейные травянистые, реже лиановидные папоротники, преимущественно тропические и субтропические. Лишь немногие виды встречаются в умеренных областях Северной Америки и Японии, Чили, Новой Зеландии, Тасмании и Южной Африки. Схизейные,… … Биологическая энциклопедия

У этого термина существуют и другие значения, см. Поза (значения). Поза (из фр. pose через немецкий, ранее из лат. pono (супин positum) «класть, ставить») положение, принимаемое человеческим телом, положение тела, головы и… … Википедия

Поза (лат. positum класть, ставить; fr: pose) положение, принимаемое человеческим телом, положение тела, головы и конечностей по отношению к друг другу. Содержание 1 Общая характеристика позы … Википедия

Урал, территория, расположенная между Восточно Европейской и Западно Сибирской равнинами и вытянутая с С. на Ю. от Сев. Ледовитого океана до широтного участка р. Урал ниже г. Орска. Основной частью её является Уральская горная система,… … Большая советская энциклопедия

Распространенным приемом при выявлении тенденции развития является сглаживание временного ряда. Суть различных приемов сглаживания сводится к замене фактических уровней временного ряда расчетными уровнями, которые подвержены колебаниям в меньшей степени. Это способствует более четкому проявлению тенденци и развития. Иногда сглаживание применяют как предварительный этап перед использованием других методов выделения тенденции

Скользящие средние позволяют сгладить как случайные, так и периодические колебания, выявить имеющуюся тенденцию в развитии процесса, и поэтому, являются важным инструментом при фильтрации компонент временного ряда.

Если рассматриваемое явление носит линейный характер, то применяется простая скользящая средняя. Алгоритм сглаживания по простой скользящей средней может быть представлен в виде следующей последовательности шагов:

1. Определяют длину интервала сглаживания g, включающего в себя g последовательных уровней ряда (gбольшей степени взаимопогашаются колебания, и тенденция развития носит более плавный, сглаженный характер. Чем сильнее колебания, тем шире должен быть интервал сглаживания.

2. Разбивают весь период наблюдений на участки, при этом интервал сглаживания как бы скользит по ряду с шагом, равным 1.

3. Рассчитывают арифметические средние из уровней ряда, образующих каждый участок.

4. Заменяют фактические значения ряда, стоящие в центре каждого участка, на соответствующие средние значения.

При этом удобно брать длину интервала сглаживания g в виде нечетного числа: g=2p+1, т.к. в этом случае полученные значения скользящей средней приходятся на средний член интервала.

Наблюдения, которые берутся для расчета среднего значения, называются активным участком сглаживания.

При нечетном значении g все уровни активного участка могут быть представлены в виде: yt-p, yt-p+1, ... , yt-1, yt, yt+1, ... , yt+p-1, yt+p,

а скользящая средняя определена по формуле:

Процедура сглаживания приводит к полному устранению периодических колебаний во временном ряду, если длина интервала сглаживания берется равной или кратной циклу, периоду колебаний.

Для устранения сезонных колебаний желательно было бы использовать четырех- и двенадцатичленную скользящие средние, но при этом не будет выполняться условие нечетности длины интервала сглаживания. Поэтому при четном числе уровней принято первое и последнее наблюдение на активном участке брать с половинными весами:

Тогда для сглаживания сезонных колебаний при работе с временными рядами квартальной или месячной динамики можно использовать следующие скользящие средние:

При использовании скользящей средней с длиной активного участка g=2p+1 первые и последние p уровней ряда сгладить нельзя, их значения теряются. Очевидно, что потеря значений последних точек является существенным недостатком, т.к. для исследователя последние "свежие" данные обладают наибольшей информационной ценностью. Рассмотрим один из приемов, позволяющих восстановить потерянные значения временного ряда . Для этого необходимо:

1.Вычислить средний прирост на последнем активном участке yt-p, yt-p+1, ... , yt, ... , yt+p-1, yt+p

2.Получить P сглаженных значений в конце временного ряда путем последовательного прибавления среднего абсолютного прироста к последнему сглаженному значению.

Аналогичную процедуру можно реализовать для оценивания первых уровней временного ряда.

Метод простой скользящей средней применим, если графическое изображение динамического ряда напоминает прямую. Когда тренд выравниваемого ряда имеет изгибы, и для исследователя желательно сохранить мелкие волны, применение простой скользящей средней нецелесообразно.

Если для процесса характерно нелинейное развитие, то простая скользящая средняя может привести к существенным искажениям. В этих случаях более надежным является использование взвешенной скользящей средней.

При построении взвешенной скользящей средней на каждом участке сглаживания значение центрального уровня заменяется на расчетное, определяемое по формуле средней арифметической взвешенной, т.е. уровни ряда взвешивают.

Взвешенная скользящая средняя приписывает каждому уровню вес, зависящий от удаления данного уровня до уровня, стоящего в середине участка сглаживания.

При сглаживании по взвешенной скользящей средней используются полиномы второго (парабола) или третьего порядка.

Сглаживание с помощью взвешенной скользящей средней осуществляется следующим образом: для каждого участка сглаживания подбирается полином вида:

Y i = a j + a 1 t

Y i = a o + a 1 t + a 2 t 2 +… a p t p

Параметры полинома находятся по методу наименьших квадратов.

При этом начало отсчета переносится в середину участка сглаживания, например, если длина интервалов сглаживания = 5, то индексы уровней участка сглаживания будут равны: -2, -1, 0, 1, 2.

у t t t
у1 -2
у2 -1
у3
у4
у5
t=0

Тогда сглаживающим значением для уровня, стоящего в середине участка сглаживания, будет значение параметра а 0 .

Нет необходимости каждый раз заново вычислять весовые коэффициенты при уровнях ряда, входящих в участок сглаживания, поскольку они будут одинаковыми для каждого участка сглаживания, например, если в интервал сглаживания входит 5 последующих уровней ряда и выравнивание производится по параболе, то коэффициенты параболы находят по методу наименьших квадратов, учитывая, что t = 0.

Метод наименьших квадратов в этой ситуации дает следующую систему уравнений:

Для нахождения параметра а0 используют 1 и 3 уравнение

-

34-=5*34а0-10*10а0

34-=а0(170-100)

а0=

Если длина интервала сглаживания равна 7, весовые коэффициенты следующие:

Отметим важные свойства приведенных весов:

1) Они симметричны относительно центрального уровня.

2) Сумма весов с учетом общего множителя, вынесенного за скобки, равна единице.

3) Наличие как положительных, так и отрицательных весов, позволяет сглаженной кривой сохранять различные изгибы кривой тренда.

Существуют приемы, позволяющие с помощью дополнительных вычислений получить сглаженные значения для Р начальных и конечных уровней ряда при длине интервала сглаживания g=2p+1.

Весовые коэффициенты при сглаживании по полиномам второго и третьего порядка


Тема 5: Методы измерения и изучения устойчивости временного ряда.

o устойчивость уровней ряда;

o устойчивость тренда.

Согласно статистической теории, статистический показатель содержит в себе элементы необходимого и случайного. Необходимость проявляется в форме тенденции временных рядов, а случайность в форме колебаний уровней относительно тренда. Тенденцией характеризуется процесс эволюции.

Расчленение временных рядов на составляющие элементы – условный описательный прием. Тем не менее, решающим фактором, обусловливающим тенденцию является целенаправленная деятельность человека, а главной причиной колеблемости – изменение условий жизнедеятельности.

Отсюда следует, что устойчивость не означает обязательного повторения одинакового уровня из года в год. Слишком узким было понятие устойчивости ряда как полное отсутствие любых колебаний уровней.

Сокращение колебаний уровней ряда – одна из главных задач при повышении устойчивости.

Устойчивость временных рядов - это наличие необходимой тенденции изучаемого показателя с минимальным влиянием на него неблагоприятных условий.

Для измерения устойчивости уровней временных рядов используют следующие показатели:

1) размах колеблемости - определяется как разница средних уровней за благоприятные и неблагоприятные по отношению к изучаемому явлению периоды времени:

R=y благопр – унеблагопр

К благоприятным периодам времени относятся все периоды с уровнями выше тренда, а к неблагоприятным – ниже тренда.

3)среднее линейное отклонение:

1) среднее квадратическое отклонение:

S(t)=

Уменьшение колеблемости во времени будет равнозначно устойчивости уровней.

Для характеристики устойчивости рекомендуются также следующие показатели:

1) процентный размах (PR):

Wmax/min – max/min относительный прирост.

W=

2) Скользящая средняя (МА) оценивает величину среднего отклонения от уровня скользящих средних (хt):

3) Среднее процентное изменение (АРС) оценивает среднее значение абсолютных величин, относительных приростов и квадратов относительных приростов:

АРС=

Для оценки устойчивости уровней временных рядов применяются относительные показатели колеблемости:

K=100 – V(t) – коэффициент устойчивости (в процентах или долях единиц).

Для измерения устойчивости тенденции динамики (тренда) используют следующие показатели:

1) коэффициент корреляции рангов (коэффициент Спирмена):

d - разность рангов уровней изучаемого ряда и рангов номеров периодов или моментов времени.

Для определения этого коэффициента величины уровней нумеруют в порядке возрастания, а при наличии одинаковых уровней им присваивается определенный ранг равный частному от деления рангов, приходящихся на число этих равных значений.

Коэффициент Спирмена может принимать значения в пределах от 0 до ±1. Если каждый уровень исследуемого периода выше, чем предыдущего, то ранги уровней ряда и номера лет совпадают – Кр=+1. Это означает полную устойчивость самого факта роста уровней ряда, то есть непрерывность роста. Чем ближе Кр к +1, тем ближе рост уровней к непрерывному, то есть выше устойчивости роста. Если Кр=0, рост совершенно неустойчив.

При отрицательных значениях чем ближе Кр к -1, тем устойчивее уменьшение изучаемого показателя.

I=

Индекс корреляции показывает степень сопряженности колебаний исследуемых показателей с совокупностью факторов, изменяющих их во времени. Приближение индекса корреляции к 1 означает, большую устойчивость изменения уровней временных рядов.

Число уровней ряда у двух показателей должно быть одинаково.

Применяются также комплексные показатели устойчивости , сущность которых заключается в определении их не через уровни временных рядов, а через показатели их динамики.

1. Показатель Каякиной определяется как отношение среднего прироста линейного тренда, т.е. параметра а1 к среднему квадратическому отклонению уровней от тренда:

Чем больше величина этого показателя, тем менее вероятно, что уровень ряда в следующем периоде будет меньше предыдущего.

2. Показатель опережения, который получают, сопоставляя темпы роста уровней ряда с темпами значения колеблемости:

Если показатель опережения > 1, то это свидетельствует о том, что уровни ряда в среднем растут быстрее колебаний или снижаются медленнее колебаний. В таком случае коэффициент колеблемости уровней будет уменьшаться, а коэффициент устойчивости уровней увеличиваться. Если показатель опережения меньше 1, то колебания растут быстрее уровней тренда и коэффициент колеблемости растет, а коэффициент устойчивости уровней уменьшается, то есть показатель опережения определяет направление динамики коэффициента устойчивости уровней.

16.02.15 Виктор Гаврилов

38133 0

Временным рядом называется последовательность значений, изменяемых во времени. О некоторых простых, но эффективных подходах к работе с подобными последовательностями я попробую рассказать в данной статье. Примеров таких данных можно встретить очень много – котировки валют, объемы продаж, обращения клиентов, данные в различных прикладных науках (социология, метеорология, геология, наблюдения в физике) и многое другое.

Ряды являются распространенной и важной формой описания данных, так как позволяют наблюдать всю историю изменения интересующего нас значения. Это даёт нам возможность судить о «типичном» поведении величины и об отклонениях от такого поведения.

Передо мной встала задача выбрать набор данных, на котором можно было бы наглядно продемонстрировать особенности временных рядов. Я решил воспользоваться статистикой пассажиропотока на международных авиалиниях, поскольку этот набор данных весьма нагляден и стал своего рода стандартным (http://robjhyndman.com/tsdldata/data/airpass.dat , источник Time Series Data Library, R. J. Hyndman). Ряд описывает количество пассажиров международных авиалиний в месяц (в тысячах) за период с 1949 по 1960 года.

Поскольку у меня всегда под рукой , в которой есть интересный инструмент « » для работы с рядами, я воспользуюсь именно им. Перед импортом данных в файл нужно добавить столбец с датой, чтобы была привязка значений ко времени, и столбец с именем ряда для каждого наблюдения. Ниже видно, как выглядит мой исходный файл, который я импортировал в Prognoz Platform с помощью мастера импорта непосредственно из инструмента анализа временных рядов.

Первое, что мы обычно делаем с временным рядом, это отображаем его на графике. Prognoz Platform позволяет построить график, просто «перетащив» ряд в рабочую книгу.

Временной ряд на графике

Символ ‘M’ в конце имени ряда означает, что ряд имеет месячную динамику (интервал между наблюдениями равен одному месяцу).

Уже из графика мы видим, что ряд демонстрирует две особенности:

  • тренд – на нашем графике это долгосрочный рост наблюдаемых значений. Видно, что тренд практически линейный.
  • сезонность – на графике это периодические колебания величины. В следующей статье на тему временных рядов мы узнаем, как можно вычислить период.

Наш ряд достаточно «аккуратный», однако часто встречаются ряды, которые помимо двух описанных выше характеристик демонстрируют ещё одну – наличие «шума», т.е. случайных вариаций в той или иной форме. Пример такого ряда можно увидеть на графике ниже. Это синусоидальный сигнал, смешанный со случайной величиной.

При анализе рядов нас интересует выявление их структуры и оценка всех основных компонентов – тренда, сезонности, шума и других особенностей, а также возможность строить прогнозы изменения величины в будущих периодах.

При работе с рядами наличие шума часто затрудняет анализ структуры ряда. Чтобы исключить его влияние и лучше увидеть структуру ряда, можно использовать методы сглаживания рядов.

Самый простой метод сглаживания рядов – скользящее среднее. Идея заключается в том, что для любого нечётного количества точек последовательности ряда заменять центральную точку на среднее арифметическое остальных точек:

где x i – исходный ряд, s i – сглаженный ряд.

Ниже можно увидеть результат применения данного алгоритма к двум нашим рядам. Prognoz Platform по умолчанию предлагает использовать сглаживание с размером окна в 5 точек (k в нашей формуле выше будет равно 2). Обратите внимание, что сглаженный сигнал уже не так подвержен влиянию шума, однако вместе с шумом, естественно, пропадает и часть полезной информации о динамике ряда. Также видно, что у сглаженного ряда отсутствуют первые (и также последние) k точек. Это связано с тем, что сглаживание выполняется для центральной точки окна (в нашем случае для третьей точки), после чего окно сдвигается на одну точку, и вычисления повторяются. Для второго, случайного ряда, я использовал сглаживание с окном равным 30, чтобы лучше выявить структуру ряда, так как ряд «высокочастотный», точек очень много.

Метод скользящего среднего имеет определённые недостатки:

  • Скользящее среднее неэффективно в вычислении. Для каждой точки среднее необходимо перевычислять по новой. Мы не можем переиспользовать результат, вычисленный для предыдущей точки.
  • Скользящее среднее нельзя продлить на первые и последние точки ряда. Это может вызвать проблему, если нас интересуют именно эти точки.
  • Скользящее среднее не определено за пределами ряда, и как следствие, не может использоваться для прогнозирования.

Экспоненциальное сглаживание

Более продвинутый метод сглаживания, который также можно использовать для прогнозирования – экспоненциальное сглаживание, также иногда называемое методом Хольта-Уинтерса (Holt-Winters) в честь имён его создателей.

Существует насколько вариантов данного метода:

  • одинарное сглаживание для рядов, у которых нет тренда и сезонности;
  • двойное сглаживание для рядов, у которых есть тренд, но нет сезонности;
  • тройное сглаживание для рядов, у которых есть и тренд, и сезонность.

Метод экспоненциального сглаживания вычисляет значения сглаженного ряда путём обновления значений, рассчитанных на предыдущем шаге, используя информацию с текущего шага. Информация с предыдущего и текущего шагов берётся с разными весами, которыми можно управлять.

В простейшем варианте одинарного сглаживания соотношение такое:

Параметр α определяет соотношение между несглаженным значением на текущем шаге и сглаженным значением с предыдущего шага. При α =1 мы будем брать только точки исходного ряда, т.е. никакого сглаживания не будет. При α =0 ряд мы будем брать только сглаженные значения с предыдущих шагов, т.е. ряд превратится в константу.

Чтобы понять, почему сглаживание называется экспоненциальным, нам нужно раскрыть соотношение рекурсивно:

Из соотношения видно, что все предыдущие значения ряда вносят вклад в текущее сглаженное значение, однако их вклад угасает экспоненциально за счёт роста степени параметра α .

Однако, если в данных есть тренд, простое сглаживание будет «отставать» от него (либо придётся брать значения α близкими к 1, но тогда сглаживание будет недостаточным). Нужно использовать двойное экспоненциальное сглаживание.

Двойное сглаживание использует уже два уравнения – одно уравнение оценивает тренд как разницу между текущим и предыдущим сглаженным значениями, потом сглаживает тренд простым сглаживанием. Второе уравнение выполняет сглаживание как в случае простого варианта, но во втором слагаемом используется сумма предыдущего сглаженного значения и тренда.

Тройное сглаживание включает ещё один компонент – сезонность, и использует ещё одно уравнение. При этом различаются два варианта сезонного компонента – аддитивный и мультипликативный. В первом случае амплитуда сезонного компонента постоянна и со временем не зависит от базовой амплитуды ряда. Во втором случае амплитуда меняется вместе с изменением базовой амплитуды ряда. Это как раз наш случай, как видно из графика. С ростом ряда амплитуда сезонных колебаний увеличивается.

Так как наш первый ряд имеет и тренд, и сезонность, я решил подобрать параметры тройного сглаживания для него. В Prognoz Platform это довольно просто сделать, потому что при обновлении значения параметра платформа сразу же перерисовывает график сглаженного ряда, и визуально можно сразу увидеть, насколько хорошо он описывает наш исходный ряд. Я остановился на следующих значениях:

Как я вычислил период, мы рассмотрим в следующей статье о временных рядах.

Обычно в качестве первых приближений можно рассматривать значения между 0,2 и 0,4. Prognoz Platform также использует модель с дополнительным параметром ɸ , который дэмпфирует тренд так, что он приближается к константе в будущем. Для ɸ я взял значение 1, что соответствует обычной модели.

Также я сделал прогноз значений ряда данным методом на последние 2 года. На рисунке ниже я пометил точку начала прогноза, проведя через неё черту. Как видно, исходный ряд и сглаженный весьма неплохо совпадают, в том числе и на периоде прогнозирования – неплохо для такого простого метода!

Prognoz Platform также позволяет автоматически подобрать оптимальные значения параметров, используя систематический поиск в пространстве значений параметров и минимизируя сумму квадратов отклонений сглаженного ряда от исходного.

Описанные методы весьма просты, их легко применять, и они являются хорошей отправной точкой для анализа структуры и прогнозирования временных рядов.

Еще больше о временных рядах читайте в следующей статье.

Механическое сглаживание по скользящим средним

Методы сглаживания временных рядов

Очень часто уровни экономических рядов динамики колеблются. При этом тенденция развития экономического явления во времени скрыта случайными отклонениями значений ряда в ту или иную сторону. С целью более чёткого выявления тенденции развития исследуемого процесса производят сглаживание (выравнивание) временных рядов экономических показателей. Суть различных методов сглаживания сводится к замене фактических уровней временного ряда расчётными значениями, которые подвержены колебаниям в меньшей степени. Это способствует чёткому проявлению тенденции.

Методы сглаживания временных рядов делятся на две основные группы :

1) аналитическое выравнивание с использованием кривой, проведённой между конкретными уровнями ряда так, чтобы она отображала тенденцию, присущую ряду, и одновременно освобождала его от незначительных колебаний;

2) механическое выравнивание отдельных уровней временного ряда с использованием фактических значений соседних уровней.

Суть методов аналитического сглаживания основана на том математическом правиле, что через любые n точек, лежащих на плоскости, можно провести полином минимум (n – 1) степени так, что он будет проходить через все обозначенные точки.

Суть методов механического сглаживания заключается в том, что берётся несколько уровней ряда динамики, образующих интервал сглаживания. Для них подбирается полином, степень которого должна быть меньше числа уровней, входящих в интервал сглаживания. С помощью полинома определяются сглаженные значения уровней ряда в середине интервала сглаживания. Далее интервал сглаживания сдвигается на одно наблюдение вперёд, вычисляется следующее сглаженное значение и т.д.

Механическое сглаживание по скользящим средним

Самым простым методом механического сглаживания является сглаживание по простой скользящей средней . Метод называется так потому, что в его основе лежит вычисление простого среднего значения нескольких уровней ряда. Простое среднее скользит вдоль ряда динамики с шагом равным периоду наблюдений.

Сначала для временного ряда y t определяется интервал сглаживания m , причём m < n . Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания. Чем шире интервал сглаживания, тем в большей степени взаимопогашаются колебания, и тенденция развития носит более плавный характер. Чем сильнее колебания, тем шире должен быть интервал сглаживания. При одинаковых условиях рекомендуется использовать интервал сглаживания нечётной длины. Для первых m уровней временного ряда вычисляется их средняя арифметическая; это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания.

Для вычисления сглаженных значений используется формула:

где m = 2·p + 1 – интервал сглаживания временного ряда нечётной длины. В результате такой процедуры получаются (n – m + 1)

Процедуру сглаживания можно применять и для интервала сглаживания чётной длины. Особенно это актуально для анализа и прогнозирования явлений, имеющих сезонные колебания. При сглаживании сезонных процессов интервал сглаживания обязательно должен быть равен длине сезонной волны. В противном случае произойдёт искажение компонент временного ряда, в особенности, компоненты v t . В случае, когда используется интервал сглаживания чётной длины, т.е. m = 2·p , применяется формула:

(4.2).

В результате данной процедуры получаются (n – m) сглаженных значений уровней ряда.

В любом случае первые и последние p значений ряда не сглаживаются . Потерянные сглаженные значения уровней временного ряда находятся с помощью использования показателя среднего абсолютного прироста, найденного для первого и последнего интервалов сглаживания. Для восстановления потерянных наблюдений в начале временного ряда значение величины среднего абсолютного прироста, найденное для первого интервала сглаживания, вычитается из первого сглаженного значения. Получается сглаженное значение уровня ряда для y p y 1 . Для восстановления потерянных наблюдений в конце временного ряда значение величины среднего абсолютного прироста, найденное для последнего интервала сглаживания, прибавляется к последнему сглаженному значению. Получается сглаженное значение уровня ряда для y n – p + 1 . Далее алгоритм повторяется до получения сглаженного значения y n .

Ещё один недостаток метода простой скользящей средней заключается в том, что он может использоваться лишь для рядов, имеющих линейную тенденцию. Если для процесса характерно нелинейное развитие и необходимо сохранить изгибы тенденции, то применение простой скользящей средней нецелесообразно, т.к. это может привести к существенным искажениям. В таких случаях используется метод взвешенной скользящей средней.

Метод взвешенной скользящей средней отличается от метода простой скользящей средней тем, что уровни, входящие в интервал сглаживания, суммируются с разными весами. Это связано с тем, что аппроксимация исходного ряда в пределах интервала сглаживания осуществляется с использованием полинома не первой степени, как в методе простой скользящей средней, а степени, начиная со второй. Используется формула средней арифметической взвешенной.