Сглаживание динамических рядов. Методы сглаживания временного ряда

Вы здесь: Открытие бизнеса

16.02.15 Виктор Гаврилов

38133 0

Временным рядом называется последовательность значений, изменяемых во времени. О некоторых простых, но эффективных подходах к работе с подобными последовательностями я попробую рассказать в данной статье. Примеров таких данных можно встретить очень много – котировки валют, объемы продаж, обращения клиентов, данные в различных прикладных науках (социология, метеорология, геология, наблюдения в физике) и многое другое.

Ряды являются распространенной и важной формой описания данных, так как позволяют наблюдать всю историю изменения интересующего нас значения. Это даёт нам возможность судить о «типичном» поведении величины и об отклонениях от такого поведения.

Передо мной встала задача выбрать набор данных, на котором можно было бы наглядно продемонстрировать особенности временных рядов. Я решил воспользоваться статистикой пассажиропотока на международных авиалиниях, поскольку этот набор данных весьма нагляден и стал своего рода стандартным (http://robjhyndman.com/tsdldata/data/airpass.dat , источник Time Series Data Library, R. J. Hyndman). Ряд описывает количество пассажиров международных авиалиний в месяц (в тысячах) за период с 1949 по 1960 года.

Поскольку у меня всегда под рукой , в которой есть интересный инструмент « » для работы с рядами, я воспользуюсь именно им. Перед импортом данных в файл нужно добавить столбец с датой, чтобы была привязка значений ко времени, и столбец с именем ряда для каждого наблюдения. Ниже видно, как выглядит мой исходный файл, который я импортировал в Prognoz Platform с помощью мастера импорта непосредственно из инструмента анализа временных рядов.

Первое, что мы обычно делаем с временным рядом, это отображаем его на графике. Prognoz Platform позволяет построить график, просто «перетащив» ряд в рабочую книгу.

Временной ряд на графике

Символ ‘M’ в конце имени ряда означает, что ряд имеет месячную динамику (интервал между наблюдениями равен одному месяцу).

Уже из графика мы видим, что ряд демонстрирует две особенности:

тренд – на нашем графике это долгосрочный рост наблюдаемых значений. Видно, что тренд практически линейный.
сезонность – на графике это периодические колебания величины. В следующей статье на тему временных рядов мы узнаем, как можно вычислить период.

Наш ряд достаточно «аккуратный», однако часто встречаются ряды, которые помимо двух описанных выше характеристик демонстрируют ещё одну – наличие «шума», т.е. случайных вариаций в той или иной форме. Пример такого ряда можно увидеть на графике ниже. Это синусоидальный сигнал, смешанный со случайной величиной.

При анализе рядов нас интересует выявление их структуры и оценка всех основных компонентов – тренда, сезонности, шума и других особенностей, а также возможность строить прогнозы изменения величины в будущих периодах.

При работе с рядами наличие шума часто затрудняет анализ структуры ряда. Чтобы исключить его влияние и лучше увидеть структуру ряда, можно использовать методы сглаживания рядов.

Самый простой метод сглаживания рядов – скользящее среднее. Идея заключается в том, что для любого нечётного количества точек последовательности ряда заменять центральную точку на среднее арифметическое остальных точек:

где x i – исходный ряд, s i – сглаженный ряд.

Ниже можно увидеть результат применения данного алгоритма к двум нашим рядам. Prognoz Platform по умолчанию предлагает использовать сглаживание с размером окна в 5 точек (k в нашей формуле выше будет равно 2). Обратите внимание, что сглаженный сигнал уже не так подвержен влиянию шума, однако вместе с шумом, естественно, пропадает и часть полезной информации о динамике ряда. Также видно, что у сглаженного ряда отсутствуют первые (и также последние) k точек. Это связано с тем, что сглаживание выполняется для центральной точки окна (в нашем случае для третьей точки), после чего окно сдвигается на одну точку, и вычисления повторяются. Для второго, случайного ряда, я использовал сглаживание с окном равным 30, чтобы лучше выявить структуру ряда, так как ряд «высокочастотный», точек очень много.

Метод скользящего среднего имеет определённые недостатки:

Скользящее среднее неэффективно в вычислении. Для каждой точки среднее необходимо перевычислять по новой. Мы не можем переиспользовать результат, вычисленный для предыдущей точки.
Скользящее среднее нельзя продлить на первые и последние точки ряда. Это может вызвать проблему, если нас интересуют именно эти точки.
Скользящее среднее не определено за пределами ряда, и как следствие, не может использоваться для прогнозирования.

Экспоненциальное сглаживание

Более продвинутый метод сглаживания, который также можно использовать для прогнозирования – экспоненциальное сглаживание, также иногда называемое методом Хольта-Уинтерса (Holt-Winters) в честь имён его создателей.

Существует насколько вариантов данного метода:

одинарное сглаживание для рядов, у которых нет тренда и сезонности;
двойное сглаживание для рядов, у которых есть тренд, но нет сезонности;
тройное сглаживание для рядов, у которых есть и тренд, и сезонность.

Метод экспоненциального сглаживания вычисляет значения сглаженного ряда путём обновления значений, рассчитанных на предыдущем шаге, используя информацию с текущего шага. Информация с предыдущего и текущего шагов берётся с разными весами, которыми можно управлять.

В простейшем варианте одинарного сглаживания соотношение такое:

Параметр α определяет соотношение между несглаженным значением на текущем шаге и сглаженным значением с предыдущего шага. При α =1 мы будем брать только точки исходного ряда, т.е. никакого сглаживания не будет. При α =0 ряд мы будем брать только сглаженные значения с предыдущих шагов, т.е. ряд превратится в константу.

Чтобы понять, почему сглаживание называется экспоненциальным, нам нужно раскрыть соотношение рекурсивно:

Из соотношения видно, что все предыдущие значения ряда вносят вклад в текущее сглаженное значение, однако их вклад угасает экспоненциально за счёт роста степени параметра α .

Однако, если в данных есть тренд, простое сглаживание будет «отставать» от него (либо придётся брать значения α близкими к 1, но тогда сглаживание будет недостаточным). Нужно использовать двойное экспоненциальное сглаживание.

Двойное сглаживание использует уже два уравнения – одно уравнение оценивает тренд как разницу между текущим и предыдущим сглаженным значениями, потом сглаживает тренд простым сглаживанием. Второе уравнение выполняет сглаживание как в случае простого варианта, но во втором слагаемом используется сумма предыдущего сглаженного значения и тренда.

Тройное сглаживание включает ещё один компонент – сезонность, и использует ещё одно уравнение. При этом различаются два варианта сезонного компонента – аддитивный и мультипликативный. В первом случае амплитуда сезонного компонента постоянна и со временем не зависит от базовой амплитуды ряда. Во втором случае амплитуда меняется вместе с изменением базовой амплитуды ряда. Это как раз наш случай, как видно из графика. С ростом ряда амплитуда сезонных колебаний увеличивается.

Так как наш первый ряд имеет и тренд, и сезонность, я решил подобрать параметры тройного сглаживания для него. В Prognoz Platform это довольно просто сделать, потому что при обновлении значения параметра платформа сразу же перерисовывает график сглаженного ряда, и визуально можно сразу увидеть, насколько хорошо он описывает наш исходный ряд. Я остановился на следующих значениях:

Как я вычислил период, мы рассмотрим в следующей статье о временных рядах.

Обычно в качестве первых приближений можно рассматривать значения между 0,2 и 0,4. Prognoz Platform также использует модель с дополнительным параметром ɸ , который дэмпфирует тренд так, что он приближается к константе в будущем. Для ɸ я взял значение 1, что соответствует обычной модели.

Также я сделал прогноз значений ряда данным методом на последние 2 года. На рисунке ниже я пометил точку начала прогноза, проведя через неё черту. Как видно, исходный ряд и сглаженный весьма неплохо совпадают, в том числе и на периоде прогнозирования – неплохо для такого простого метода!

Prognoz Platform также позволяет автоматически подобрать оптимальные значения параметров, используя систематический поиск в пространстве значений параметров и минимизируя сумму квадратов отклонений сглаженного ряда от исходного.

Описанные методы весьма просты, их легко применять, и они являются хорошей отправной точкой для анализа структуры и прогнозирования временных рядов.

Еще больше о временных рядах читайте в следующей статье.

Эконометрика 1 модуль
1. В каком законе выяснялись закономерности спроса на основе соотношений между урожаем зерновых и ценами на зерно?
в законе Кинга
2. Как называется мера разброса случайной величины?
дисперсия
3. При исследований каких моделей эконометрическое исследование может включать в себя выявление трендов, лагов, циклической компоненты?
моделей временных рядов
4. Какая из перечисленных шкал не относится к основным шкалам качественных признаков?
шкала отношений
5. Кто основал журнал «Эконометрика»?
Р. Фриш
6. Что из перечисленного может включать эконометрическое исследование на современном этапе развития при исследовании моделей по независимым неупорядоченным наблюдениям?
оценку параметров модели
7. В какой шкале есть естественная единица измерения, но нет естественного начала отсчета?
в шкале разностей
8. Кто из ученых создал теорию интегрированных моделей авторегрессии ¾ скользящего среднего?
Дж. Бокс и Г. Дженкинс
9. В какой системе каждая объясняемая переменная рассматривается как функция одного и того же набора факторов?
в системе независимых уравнений
10. Какая шкала измерений относится к шкалам количественных признаков?
шкала интервалов
11. Какие эконометрические модели разработали в 80 - в начале 90-х гг. Р.Э. Игл, Т. Боллеслев и Нельсон?
модели авторегрессионной условной гетероскедастичности
12. Какие шкалы измерений являются наиболее распространенными и удобными?
шкалы отношений
13. Какому ученому в 1980 г. присуждена Нобелевская премия за применение эконометрических моделей к анализу экономических колебаний и в экономической политике?
Л. Клейну
14. В какой стране было создано первое международное эконометрическое общество?
в США
15. Что из перечисленного является постоянной составляющей случайной величины?
среднеарифметическое значение
16. Что является целью эконометрики как науки? (по Э. Маленво)
эмпирический анализ экономических законов
17. Кто из исследователей придавал широкое толкование эконометрике, интерпретируя ее как любое применение математики или статистических методов к изучению экономических явлений?
Э. Маленво
18. Какие компоненты входят в состав случайных величин в процессе анализа?
постоянная и случайная компоненты
19. Чему равно среднее случайной компоненты, или остатка?
0
20. Кто впервые ввел термин «эконометрия»?
П. Цьемпа
21. Кто из отечественных ученых на союзном уровне описал динамику урожайности зерновых культур уравнениями с малым числом параметров?
В. Обухов
22. Какие разделы содержит эконометрика?
моделирование данных, неупорядоченных во времени, и теория временных рядов
23. Какие характеристики экономики невозможно измерить непосредственно?
латентные характеристики
24. Кто из ученых занимался проблемой цикличности?
К. Жюгляр
25. Кто является автором первой книги по эконометрике «Законы заработной платы: эссе по статистической экономике»?
Г. Мур

2 модуль
1. Если регрессия значима, то
Fнабл>Fкрит
2. Что показывает величина коэффициента регрессии?
среднее изменение результата с изменением фактора на одну единицу
3. Что означает совпадение среднего от выборочной оценки с искомой неизвестной величиной соответствующего параметра для генеральной совокупности?
несмещенность
4. Какой является регрессия, если k= 2?
множественной
5. Чем характеризуется рассеяние (отклонение) точек наблюдения относительно кривой регрессии?
остаточной регрессией
6. Какой коэффициент является показателем тесноты связи?
линейный коэффициент корреляции
7. Какая величина равна просто средней от суммы квадратов остатков (отклонений)?
остаточная регрессия
8. Каким выражением определяется коэффициент корреляции, являющийся мерой линейной связи между случайными величинами x и y?
r(x, y)=…
9. Какого значения не должна превышать средняя ошибка аппроксимации?
7-8%
10. Кто ввел термин «регрессия»?
Ф. Гальтон
11. Какой коэффициент в функции потребления используется для расчета мультипликатора?
коэффициент регрессии
12. С помощью какого коэффициента определяется качество подбора линейной функции?
с помощью коэффициента детерминации
13. Каким выражением определяется выборочный коэффициент корреляции?
r(x,y) с квадратами
14. Что называют результативным признаком в регрессионном анализе?
зависимую переменную
15. Дисперсию какой переменной исследует дисперсионный анализ?
зависимой переменной
16. Какая регрессия характеризуется прозрачной интерпретацией параметров модели?
линейная регрессия
17. Какой коэффициент характеризует долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака y?
коэффициент детерминации
18. Какой коэффициент показывает, на сколько процентов в среднем по совокупности изменится результат y от своей средней величины при изменении фактора x на 1% от его (фактора x) среднего значения?
коэффициент эластичности
19. Чему равна величина остаточной дисперсии, если фактические значения результативного признака совпадают с теоретическими или расчетными значениями?
0
20. Какой метод применяют для оценки параметров a, b уравнения регрессии?
метод наименьших квадратов (МНК)
21. Какой метод основан на требовании минимизации суммы квадратов отклонений фактических значений результативного признака от расчетных?
метод наименьших квадратов
22. При каком значении k регрессия называется парной?
k= 1
23. Что из перечисленного не относится к нелинейным регрессиям по оцениваемым параметрам?
показательная функция
24. Суть какой теоремы в том, что если случайная величина является общим результатом взаимодействия большого числа других случайных величин, ни одна из которых не оказывает преобладающего влияния на общий результат, то такая результирующая случайная величина будет описываться приблизительно нормальным распределением?
центральной предельной теоремы
25. Каким уравнением описывается линейная регрессия?
y = a + bx + ε
(3 ошибки)

3 модуль ()1 ошибка
1. Как проверяется гетероскедастичность моделей в асимптотическом тесте Бреуша и Пагана?
по критерию c2(r)
2. Какой критерий позволяет выбирать наилучшую модель из множества различных спецификаций и численно построен так, чтобы учесть влияние на качество подгонки модели двух противоположных тенденций?
критерий Шварца
3. По какой величине судят о качестве модели?
по средней относительной ошибке аппроксимации
4. Каким выражением описывается условие однородности (гомоскедастичности) наблюдений?
s2(yu) =s2(hu+eu) =s2(eu) =s2
5. Какой метод применим при условии диагональности матрицы ковариаций вектора ошибок?
метод наименьших квадратов
6. Каким выражением определяется абсолютная ошибка аппроксимации?
yi-y1i=e
7. Что понимается под мультиколлинеарностью?
высокая степень коррелированности объясняющих переменных
8. Какие переменные представляют собой исходные переменные, из которых вычитаются соответствующие средние, а полученная разность делится на стандартное отклонение?
стандартизованные переменные
9. Какая ошибка на контрольной выборке свидетельствует о хорошем качестве построенной модели?
4-9%
10. Каким методом может быть проведена оценка значимости мультиколлинеарности факторов?
методом испытания гипотезы о независимости переменных
11. Какая переменная должна выражаться в виде линейной функции от неизвестной переменной?
замещающая переменная
12. Дисперсии и ковариации ошибок наблюдений в обобщенной линейной модели множественной регрессии
могут быть произвольными
13. В чем заключается второй подход к решению проблемы гетероскедастичности?
в построении моделей, учитывающих гетероскедастичность ошибок наблюдений
14. Чем в простейшем случае парной регрессии является стандартизованный коэффициент регрессии?
линейным коэффициентом корреляции
15. Что из перечисленного используют для проверки гипотезы, если исследователь предполагает, что за время наблюдений произошли резкие структурные изменения в виде связей между зависимой и независимыми переменными?
тест Чоу
16. Чему равен определитель матрицы, если между факторами имеется полная линейная зависимость и все коэффициенты корреляции равны 1?
0
17. По какой формуле производят расчет коэффициентов модели при использовании метода гребневой регрессии?
bгр= (XTX+DгрIk+ 1)-1XTY
18. По какой формуле, согласно теореме Айткена, производится оценка коэффициентов модели?
b= (X¢W-1X)-1X¢W-1Y
19. Какой из перечисленных тестов не требует предположения о нормальности распределения регрессионных остатков?
тест ранговой корреляции Спирмена
20. Как называют переменную, которая должна быть в модели согласно правильной теории?
существенной
21. Чем ближе к единице значение определителя матрицы межфакторной корреляции, тем
меньше мультиколлинеарность факторов
22. Какой критерий используется для оценки значимости уравнения регрессии в целом?
F-критерия Фишера
23. Какой показатель фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии факторов?
показатель детерминации
24. Какие коэффициенты позволяют исключать из модели дублирующие факторы?
коэффициенты интеркорреляции
25. Чему равно число степеней свободы остаточной суммы квадратов при линейной регрессии?
n- 2
Модуль 4
1. Какие этапы включает в себя процесс структурного моделирования?
все перечисленные этапы
2. Суть какого метода заключается в частичной замене непригодной объясняющей переменной на такую переменную, которая не коррелирована со случайным членом?
метода инструментальных переменных
3. Что представляет переменная x, входящая в выражение?
возмущающий процесс
4. При каком условии общее решение разностного уравнения вида носит «взрывной» характер?
при |a1|> 2
5. Как называются взаимозависимые переменные, которые определяются внутри модели (внутри самой системы) и обозначаются у?
эндогенными переменными
6. В какой модели на основе коэффициентов приведенной формы можно получить два или более значений одного структурного коэффициента?
в сверхидентифицируемой
7. Какие коэффициенты называются структурными коэффициентами модели?
коэффициенты при эндогенных и экзогенных переменных в структурной форме модели
8. Какой метод при ограниченной информации, называется методом наименьшего дисперсионного отношения?
метод максимального правдоподобия
9. Как называются переменные, относящиеся к предыдущим моментам времени?
лаговыми переменными
10. Если набор чисел X связан с другим набором чисел Y зависимостью Y= 4X, то дисперсия Y должна быть
в 16 раз больше, чем дисперсия X
11. Какой метод применяется для решения идентифицируемой системы?
косвенный метод наименьших квадратов
12. Какие переменные понимаются под предопределенными переменными?
экзогенные переменные и лаговые эндогенные переменные
13. Какой метод используют, если нужно всего лишь уточнить характер связей переменных?
метод путевого анализа
14. Что позволяет сделать построение моделей корреляционной структуры?
проверить гипотезу о том, что матрица корреляции имеет определенный вид
15. Какой является модель, если все ее структурные коэффициенты однозначно определяются по коэффициентам приведенной формы модели и при этом число параметров в обеих формах модели одинаково?
идентифицируемой
16. Каким выражением определяется зависимость потребления в год с номером t от дохода в предыдущий период y(t- 1)?
C(t) =b+cy(t- 1)
17. Как называются независимые переменные, которые определяются вне системы и обозначаются как х?
экзогенными переменными
18. При каком условии вся модель считается идентифицируемой?
если идентифицируемо хотя бы одно уравнение системы
19. В каком случае модель является неидентифицируемой?
если число приведенных коэффициентов меньше числа структурных коэффициентов
20. Какие переменные часто приходится вводить для учета влияния качественных факторов?
фиктивные переменные
21. Что позволяет сделать построение моделей структуры средних?
исследовать структуру средних одновременно с анализом дисперсий и ковариаций
22. Какие переменные могут включать в себя причинные модели?
явные и латентные переменные
23. При каком условии уравнение неидентифицируемо?
если число предопределенных переменных, отсутствующих в уравнении, но присутствующих в системе, увеличенное на единицу, меньше числа эндогенных переменных в уравнении
24. При решении выражения способом движения «назад» ошибки ei
накапливаются
25. Что позволяет сделать моделирование ковариационной структуры?
проверить гипотезу о том, что матрица ковариации имеет определенный вид

4 модуль
1. О чем свидетельствуют большие значения, близкие к 1, величины (1 -а1) модели корректировки ошибок (МКО)?
о том, что экономические факторы сильно изменяют результат
2. На какое количество участков разбивается последовательность для проверки условия стационарности ряда?
на два участка
3. Для уменьшения амплитуды колебаний у сглаженного ряда Y(t)необходимо
увеличивать ширину интервала сглаживания m
4. Какое предположение является одним из априорных предположений при применении параметрических тестов для проверки стационарности?
предположение о нормальном законе распределения значений временного ряда
5. Что называется временным рядом?
последовательность значений признака, принимаемых в течение нескольких последовательных моментов времени или периодов
6. Как изменяется дисперсия сглаженного по квадратичному полиному ряда Y(t) при увеличении числа m уравнений?
уменьшается
7. Какие тренды коррелируют между собой?
временные
8. Что из перечисленного используют для проверки стационарности временного ряда?
сериальный критерий стационарности
9. Как называют корреляционную зависимость между последовательными уровнями временного ряда?
автокорреляцией уровней ряда
10. Как называется случайная переменная с переменной дисперсией?
гетероскедастической
11. При каком условии сглаживание ряда называется центрированным?
при k=l
12. Каким путем может быть исключен временной тренд из результирующей переменной?
путем построения регрессии этой переменной по времени и перехода к остаткам, которые образуют новую стационарную переменную, уже свободную от тренда
13. По какой формуле рассчитываются коэффициенты,если в качестве сглаживающего многочлена взять прямую?
ar= 1/m
14. Какая компонента объясняет отклонения от тренда с периодичностью от 2 до 10 лет?
циклическая компонента
15. Что в выражении обозначают параметром L?
функцию правдоподобия
16. Какая последовательность является белым шумом?
если каждая случайная величина последовательности имеет нулевое среднее и некоррелирована с другими элементами последовательности
17. К какому классу принадлежит ряд, если он содержит единичные корни и интегрируем с порядком d?
I(d)
18. Как называется стохастическая переменная с постоянной дисперсией?
гомоскедастическая переменная
19. Какой принцип разработки прогнозов предполагает соответствие, максимальное приближение теоретических моделей к реальным производственно-экономическим процессам?
адекватность прогнозирования
20. Как называется число значений исходного ряда, одновременно участвующих в сглаживании?
шириной интервала сглаживания
21. Что относится к основным принципам разработки прогнозов?
системность, адекватность, альтернативность
22. Для чего применяется сериальный критерий стационарности?
для проверки стационарности временного ряда
23. Как называется модель вида?
авторегрессионной условной гетероскедастической моделью (АРУГ-моделью)
24. Что представляет уравнение?
АРСС-процесс для {et2}-последовательности
25. Какие переменные используются в процессе случайного блуждания?
некоррелированные нестационарные переме

Углубленный анализ временных рядов требует использования более сложных методик математической статистики. При наличии в динамических рядах значительной случайной ошибки (шума) применяют один из двух простых приемов - сглаживание или выравнивание путем укрупнения интервалови вычисления групповых средних. Этот метод позволяет повысить наглядность ряда, если большинство «шумовых» составляющих находятся внутри интервалов. Однако, если «шум» не согласуется с периодичностью, распределение уровней показателей становится грубым, что ограничивает возможности детального анализа изменения явления во времени.

Более точные характеристики получаются, если используют скользящие средние - широко применяемый способ для сглаживания показателей среднего ряда. Он основан на переходе от начальных значений ряда к средним в определенном интервале времени. В этом случае интервал времени при вычислении каждого последующего показателя как бы скользит по временному ряду.

Применение скользящего среднего полезно при неопределенных тенденциях динамического ряда или при сильном воздействии на показатели циклически повторяющихся выбросов (резко выделяющиеся варианты или интервенция).

Чем больше интервал сглаживания, тем более плавный вид имеет диаграмма скользящих средних. При выборе величины интервала сглаживания необходимо исходить из величины динамического ряда и содержательного смысла отражаемой динамики. Большая величина динамического ряда с большим числом исходных точек позволяет использовать более крупные временные интервалы сглаживания (5, 7, 10 и т.д.). Если процедура скользящего среднего используется для сглаживания не сезонного ряда, то чаще всего величину интервала сглаживания принимают равной 3 или 5. https://tvoipolet.ru/iz-moskvi-v-nyu-jork/ - отличная возможность выбрать авиакомпанию на перелет из Москвы в Нью-Йорк

Приведем пример вычисления скользящего среднего числа хозяйств с высокой урожайностью (более 30 ц/га) (табл. 10.3).

Таблица 10.3 Сглаживание динамического ряда укрупнением интервалов искользящим средним

Учетный год	Число хозяйств с высокой урожайностью	Суммы за три года	Скользящие за три года	Скользящие средние

			90,0	89,7
1984				88,7
				87,3
			87,3	87,0
				86,7
				83,0
			83,0	82,3
				82,3
				82,6
			82,7	82,7

Примеры вычисления скользящего среднего:

1982 г.(84 + 94 + 92) / 3 = 90,0;

1983 г. (94 + 92 + 83) / 3 = 89,7;

1984 г.(92 + 83 + 91) / 3 = 88,7;

1985 г.(83 + 91 + 88) / 3 = 87,3.

Составляется график. На оси абсцисс указываются годы, на оси ординат - число хозяйств с высокой урожайностью. Указываются координаты числа хозяйств на графике и соединяют полученные точки ломаной линией. Затем указываются координаты скользящей средней по годам на графике и соединяются точки плавной полужирной линией.

Более сложным и результативным методом является сглаживание (выравнивание) рядов динамики с помощью различных функций аппроксимации. Они позволяют формировать плавный уровень общей тенденции и основную ось динамики.

Наиболее эффективным методом сглаживания с помощью математических функций является простое экспоненциальное сглаживание. Этим методом учитываются все предшествующие наблюдения ряда по формуле:

S t = α∙X t + (1 - α ) ∙S t - 1 ,

где S t - каждое новое сглаживание в момент времени t ; S t - 1 - сглаженное значение в предыдущий момент времени t -1; X t - фактическое значение ряда в момент времени t ; α - параметр сглаживания.

Если α = 1, то предыдущие наблюдения полностью игнорируются; при величине α = 0 игнорируются текущие наблюдения; значения α между 0 и 1 дают промежуточные результаты. Изменяя значения этого параметраможно подобрать наиболее приемлемый вариант выравнивания. Выбор оптимального значения α осуществляется путем анализа полученных графических изображений исходной и выравненной кривых, либо на основе учета суммы квадратов ошибок (погрешностей) вычисленных точек. Практическое использование этого метода следует проводить с использованием ЭВМ в программе MS Excel . Математическое выражение закономерности динамики данных можно получить с помощью функции экспоненциального сглаживания.

Очень часто, урони рядов динамики колеблются, при этом тенденция развития явления во времени скрыта случайными отклонениями уровней в ту или иную сторону. С целью более четко выявить тенденцию развития исследуемого процесса, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание (выравнивание ) временных рядов.

Методы сглаживания временных рядов делятся на две основные группы:

1. аналитическое выравнивание с использованием кривой, проведенной между конкретными уровнями ряда так, чтобы она отображала тенденцию, присущую ряду, и одновременно освобождала его от незначительных колебаний;

2. механическое выравнивание отдельных уровней временного ряда с использованием фактических значений соседних уровней.

Суть методов механического сглаживания заключается в следующем. Берется несколько уровней временного ряда, образующих интервал сглаживания. Для них подбирается полином, степень которого должна быть меньше числа уровней, входящих в интервал сглаживания; с помощью полинома определяются новые, выровненные значения уровней в середине интервала сглаживания. Далее интервал сглаживания сдвигается на один уровень ряда вправо, вычисляется следующее сглаженное значение и так далее.

Самым простым методом механического сглаживания является метод простой скользящей средней.

2.4.1. Метод простой скользящей средней.

Сначала для временного ряда: определяется интервал сглаживания . Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания.

Для первых уровней ряда вычисляется их среднее арифметическое. Это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление среднего арифметического и так далее. Для вычисления сглаженных уровней ряда применяется формула:

где (при нечетном ); для четных формула усложняется.

В результате такой процедуры получаются сглаженных значений уровней ряда; при этом первые и последние уровней ряда теряются (не сглаживаются). Другой недостаток метода в том, что он применим лишь для рядов, имеющих линейную тенденцию.

2.4.2. Метод взвешенной скользящей средней.

Метод взвешенной скользящей средней отличается от предыдущего метода сглаживания тем, что уровни, входящие в интервал сглаживания, суммируются с разными весами. Это связано с тем, что аппроксимация ряда в пределах интервала сглаживания осуществляется с использованием полинома не первой степени, как в предыдущем случае, а степени начиная со второй.

Используется формула средней арифметической взвешенной:

причем веса определяются с помощью метода наименьших квадратов. Эти веса рассчитаны для различных степеней аппроксимирующего полинома и различных интервалов сглаживания.

1. для полиномов второго и третьего порядков числовая последовательность весов при интервале сглаживания имеет вид: , а при имеет вид: ;

2. для полиномов четвертой и пятой степеней и при интервале сглаживания последовательность весов выглядит следующим образом: .

Распределение весов на протяжении интервала сглаживания, полученное на основе метода наименьших квадратов см. на диаграмме 1.

2.4.3. Метод экспоненциального сглаживания.

К той же группе методов относится метод экспоненциального сглаживания.

Его особенность заключается в том, что в процедуре нахождения сглаженного уровня используются значения только предшествующих уровней ряда, взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня ряда.

Если для исходного временного ряда

соответствующие сглаженные значения обозначить через , то экспоненциальное сглаживание осуществляется по формуле:

где параметр сглаживания ; величина называется коэффициентом дисконтирования.

Используя, приведенное рекуррентное соотношение для всех уровней ряда, начиная с первого и кончая моментом времени , можно получить, что экспоненциальная средняя, то есть сглаженное данным методом значение уровня ряда, является взвешенной средней всех предшествующих уровней.

Одной из задач анализа рядов динамики, является установление закономерностей изменения уровней изучаемого показателя во времени.

В некоторых случаях эта закономерность развития объекта вполне ясно отображается уровнями динамического ряда. Однако часто приходится встречаться с такими рядами динамики, когда уровни ряда претерпевают самые различные изменения. В подобных случаях для определения основной тенденции развития, достаточно устойчивой на протяжении данного периода, используют особые приёмы обработки рядов динамики.

Уровни ряда динамики формируются под совокупным влиянием множества длительных и кратковременных факторов, в том числе различных, случайных обстоятельств. В то же время выявление основной тенденции изменения уровня ряда предполагает её количественное выражение, которое свободно от случайных воздействий. Существуют различные методы выявления тенденции развития динамики. Одним из приёмов выявления основной тенденции является метод укрупнения интервалов. Этот способ основан на укрупнении периодов времени, к которым относятся уровни ряда. Например, ряд ежесуточного выпуска продукции заменяется рядом месячного выпуска продукции и т.д.

Другой метод - метод подвижной (скользящей) средней. Суть метода состоит в замене исходных уровней средними арифметическими за определённые периоды. При этом сначала для временного ряда определяется интервал сглаживания . Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нежно сохранить более мелкие колебания. При прочих равных условиях интервал сглаживания рекомендуется брать нечетным. Процесс сглаживания, для первых уровней динамического ряда вычисляется их средняя арифметическая; это будет сглаженное значение уровня ряда, находящегося в средине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление средней арифметической и т. д. Для вычисления сглаженных уровней временного ряда применяется формула:

(5.6)

В результате такой процедуры получаются сглаженных значений уровней ряда; при этом первые уровней и последние уровней ряда теряются (не сглаживаются).

К этому методу сглаживания (выравнивания) примыкает экспоненциальное сглаживание. Особенность данного метода заключается в том, что в процедуре нахождения сглаженного уровня используются значения только предшествующих уровней ряда, взятые с определенным весом. Если для исходного динамического ряда соответствующие сглаженные значения уровней обозначить через , , то экспоненциальное сглаживание осуществляется по формуле:

где параметр сглаживания; называется коэффициентом дисконтирования.

Используя приведенное выше рекуррентное соотношение (5.7) для всех уровней ряда, начиная с первого и кончая моментом времени , можно получить, что экспоненциальная средняя, т. е. сглаженное данным методом значение уровня ряда, является взвешенной средней всех предшествующих уровней:

, (5.8)

где величина, характеризующая начальные условия.

В практических задачах обработки экономических временных рядов рекомендуется (необоснованно) выбирать величину параметра сглаживания в интервале от 0,1 до 0,3. Других точных рекомендаций для выбора оптимальной величины параметра пока нет. В отдельных случаях Р. Браун предлагает определять величину исходя из длины сглаживаемого ряда:

Что касается начального параметра So, то в конкретных задачах его берут или равным значению первого уровня ряда , или равным средней арифметической нескольких первых членов ряда, например, членов :

Указанный выше порядок выбора величины So обеспечивает хорошее согласование сглаженного и исходного рядов для первых уровней. Если при подходе к правому концу временного ряда сглаженные этим методом значения при выбранном параметре начинают значительно отличаться от соответствующих значений исходного ряда, необходимо перейти на другой параметр сглаживания. Заметим, что при этом методе сглаживания не теряются ни начальные, ни конечные уровни сглаживаемого временного ряда.

Выбор редакции

Салат из огурцов на зиму «Пикантный Салат из огурцов пикантный на зиму

Особое место по популярности среди консервированных зимних солений, занимают огурцы. Известно множество рецептов огуречных салатов:...

Телячья вырезка в духовке

Телятина – превосходное диетическое мясо молодых животных, разумеется, оно гораздо нежнее, чем мясо взрослых бычков. Регулярное включение...

Кукурузная крупа – что это?

В конце прошлого столетия кукурузу называли не иначе как королева полей. Сегодня ее выращивают, конечно, не в таких масштабах, но, тем не...

Ажурные блинчики на молоке — рецепты тонких блинов с дырочками Блины ажурные тонкие дрожжевые

Блины — это традиционное русское блюдо. По традиции блины всегда пекут на Масленицу, а также радуют этим лакомством себя и своих близких...

Отличается насыщенный пар

После закипания температура воды перестает расти и остается неизменной до полного испарения. Парообразование - это процесс перехода из...

Чем звуки отличаются от букв?

Звуки относятся к разделу фонетики. Изучение звуков включено в любую школьную программу по русскому языку. Ознакомление со звуками и их...

Какой разновидности языков естественных или формальных может

1. Логика и язык .Предметом изучения логики являются формы и законы правильного мышления. Мышление есть функция человеческого мозга....

Прямоугольный параллелепипед — Гипермаркет знаний

Определение Многогранником будем называть замкнутую поверхность, составленную из многоугольников и ограничивающую некоторую часть...

Рассказ о себе на английском

Мое эссе Я, Рыбалкина Ольга Викторовна. Образование средне - специальное, в 1989 году окончила Петропавловский ордена трудового...

Новое