Пример использования arima для прогноза продаж

График проекта в excel и диаграмма ганта с выполнением

Составляющие временного ряда

При анализе временного ряда выделяют три составляющие: тренд, сезонность и шум. Тренд — это общая тенденция, сезонность, как следует из названия — влияния периодичности (день недели, время года и т.д.) и, наконец, шум — это случайные факторы.

Что бы понять отличие этих трёх величин, смоделируем функцию расстояния от земли до луны. Известно, что в среднем луна каждый год отдаляется на 4 см — это тренд, в течение дня луна совершает оборот вокруг земли и расстояние колеблется от ~362600 км до ~405400 км — это сезонность. Шум — это «случайные» факторы, например, влияние других планет. Если мы изобразим сумму этих трёх графиков, то мы получим временной ряд — функцию, показывающую изменение расстояния от земли до луны во времени.

Составляющие временного ряда

При анализе временного ряда выделяют три составляющие: тренд, сезонность и шум. Тренд – это общая тенденция, сезонность, как следует из названия – влияния периодичности (день недели, время года и т.д.) и, наконец, шум – это случайные факторы.

Что бы понять отличие этих трёх величин, смоделируем функцию расстояния от земли до луны. Известно, что в среднем луна каждый год отдаляется на 4 см – это тренд, в течение дня луна совершает оборот вокруг земли и расстояние колеблется от ~362600 км до ~405400 км – это сезонность. Шум – это “случайные” факторы, например, влияние других планет. Если мы изобразим сумму этих трёх графиков, то мы получим временной ряд – функцию, показывающую изменение расстояния от земли до луны во времени.

Как оценить точность модели Хольта – Винтерса и подобрать оптимальные коэффициенты сглаживания для ряда, тренда и сезонности.

1. Рассчитываем прогноз на 1 период вперед для каждого месяца , когда продажи нам известны (во вложенном файле столбец “прогноз для оценки модели “).

Прогноз для оценки модели в первом и втором году (сезоне) = значению экспоненциально-сглаженного ряда за предыдущий период + значение тренда за предыдущий период. (значение тренда мы не умножаем на p, т.к. прогноз делаем на 1 период, а в этом случае p=1).

Прогноз для третьего года (сезона) = (значение экспоненциально-сглаженного ряда за предыдущий период + значение тренда за предыдущий период) умножить на коэффициент сезонности этого периода в предыдущем сезоне.

2. Рассчитаем ошибку модели = из фактических данных вычитаем прогноз на этот период.

3. Определим отклонение ошибки модели от прогнозной модели = Отношение ошибки модели в квадрате к фактическому значению в квадрате.

4. Рассчитаем точность прогноза = единица минус среднее значение отклонений.

Для подбора коэффициентов сглаживания ряда, тренда и сезонности k, b и q, при которых прогноз будет максимально точным, нам необходимо последовательно перебрать все значения k, b и q в диапазоне от 0 до 1 и найти такое сочетание, при котором точность прогноза будет максимальна приближена к 100%.

Обращаю ваше внимание, что программа для прогнозирования Forecast4AC PRO умеет

  1. автоматически выбирать экспоненциальную модель прогноза (простое экспоненциальное сглаживание, модель Хольта или Хольта-Винтерса);
  2. автоматически подбирать коэффициенты сглаживания ряда, тренда и сезонности

для каждого ряда значений. значительно экономя ваше время и увеличивая точность прогнозирования.

Формулы для модели составления прогноза Хольта-Винтерса в Excel

Теперь, согласно сделанным в начале предположениям, приведем начальные значения для параметров F1 и S1. В нашем случае это будет y1 = F1 и y2-y1 = S1. Далее мы вводим альфа и бета параметры, временно принимая их значения равными 0,4 (позже мы будем оптимизировать данные с помощью инструмента «Поиск решения» Солвера).

На следующем шаге мы вычисляем Ft и St одновременно в соответствии с приведенными выше формулами, перетаскивая формулы вниз.

Перейдем к столбцу F, в котором с помощью формул рассчитываем, что для 1998-2015 годов прогнозы истекли, а для 2016-2018 годов – реальные прогнозы.

Мы заполняем столбцы GI, которые в данный момент будут использоваться для расчета фактической ошибки прогнозов с истекшим сроком (для получения абсолютного значения в столбце H мы можем использовать функцию Excel =ABS()).

Затем, используя функцию =СРЗНАЧ() и =КОРЕНЬ(), мы вычисляем вышеуказанные индикаторы ошибок MAE, MSE и RMSE.

Когда мы уже рассчитали показатели, мы можем приступить к оптимизации альфа- и бета-параметров, чтобы индекс MAE был как можно меньше. Для этого мы будем использовать аналитический инструмент в Excel «Поиск решения», доступный на вкладке «ДАННЫЕ» в группе «Анализ». Параметры поиска решения устанавливаются так, чтобы минимизировать индекс MAE, изменяя ячейки, помеченные как альфа и бета, закрытые в интервале .

После нажатия кнопки «Найти решение» и сохранения полученных результатов параметры альфа- и бета-сглаживания должны быть a = 1 и b = 0.228657122399511. На этом этапе мы можем предварительно проверить, может ли наша модель использоваться в качестве эффективного инструмента прогнозирования. Для этой цели мы рассчитываем коэффициент приемлемости прогноза, определенный формулой RMSE / фактическим прогнозом для последующих периодов T16-T18. В нашем случае на 2016 год это 5%, поэтому прогноз можно считать достоверным. Наконец, стоит визуализировать весь анализ на графике, принимая реальные значения и прогнозы в виде серии данных.

Когда у нас есть прогноз, ничего не остается делать, кроме как следить за новыми данными, чтобы проверить, имеет ли смысл использовать модель. Из того, что можно найти на одном из информационных порталов о авиаперелетах данной компании, общее количество ее обслуженных пассажиров в 2017 году составило более 4,6 млн. человек. Поэтому высокая вероятность, что прогнозируемые нами значения работают на практике.

Стационарность, единичные корни

Перед тем, как перейти к моделированию, стоит сказать о таком важном свойстве временного ряда, как стационарность.
Под стационарностью понимают свойство процесса не менять своих статистических характеристик с течением времени, а именно постоянство матожидания, постоянство дисперсии (она же гомоскедастичность) и независимость ковариационной функции от времени (должна зависеть только от расстояния между наблюдениями). Наглядно можно посмотреть на эти свойства на картинках, взятых из поста Sean Abu:

Почему стационарность так важна? По стационарному ряду просто строить прогноз, так как мы полагаем, что его будущие статистические характеристики не будут отличаться от наблюдаемых текущих. Большинство моделей временных рядов так или иначе моделируют и предсказывают эти характеристики (например, матожидание или дисперсию), поэтому в случае нестационарности исходного ряда предсказания окажутся неверными. К сожалению, большинство временных рядов, с которыми приходится сталкиваться за пределыми учебных материалов, стационарными не являются, но с этим можно (и нужно) бороться.

Чтобы бороться с нестационарностью, нужно узнать её в лицо, потому посмотрим, как её детектировать. Для этого обратимся к белому шуму и случайному блужданию, чтобы выяснить как попасть из одного в другое бесплатно и без смс.

График белого шума:

Итак, процесс, порожденный стандартным нормальным распределением, стационарен, колеблется вокруг нуля с отклонением в 1. Теперь на основании него сгенерируем новый процесс, в котором каждое последующее значение будет зависеть от предыдущего:

Код для отрисовки графиков

На первом графике получился точно такой же стационарный белый шум, который строился раньше. На втором значение увеличилось до 0.6, в результате чего на графике стали появляться более широкие циклы, но в целом стационарным он быть пока не перестал. Третий график всё сильнее отклоняется от нулевого среднего значения, но всё ещё колеблется вокруг него. Наконец, значение равное единице дало процесс случайного блуждания — ряд не стационарен.

Происходит это из-за того, что при достижении критической единицы, ряд перестаёт возвращаться к своему среднему значению. Если вычесть из левой и правой части , то получим , где выражение слева — первые разности. Если , то первые разности дадут стационарный белый шум . Этот факт лёг в основу теста Дики-Фуллера на стационарность ряда (наличие единичного корня). Если из нестационарного ряда первыми разностями удаётся получить стационарный, то он называется интегрированным первого порядка. Нулевая гипотеза теста — ряд не стационарен, отвергалась на первых трех графиках, и принялась на последнем. Стоит сказать, что не всегда для получения стационарного ряда хватает первых разностей, так как процесс может быть интегрированным с более высоким порядком (иметь несколько единичных корней), для проверки таких случаев используют расширенный тест Дики-Фуллера, проверяющий сразу несколько лагов.

Бороться с нестационарностью можно множеством способов — разностями различного порядка, выделением тренда и сезонности, сглаживаниями и преобразованиями, например, Бокса-Кокса или логарифмированием.

5) ГАРЧ

Предыдущие модели предполагали, что члены ошибки в случайных процессах, порождающих временные ряды, былигетероскедастичныт.е. с постоянной дисперсией.

Вместо этогоGARCHМодель предполагает, что дисперсия слагаемых ошибок следует процессу AutoRegressive Moving Average (ARMA), что позволяет ей изменяться во времени. Это особенно полезно для моделирования финансовых временных рядов, волатильность которых изменяется во времени. Название является аббревиатурой от Обобщенной авторегрессионной условной гетероскедастичности.

На следующих графиках показаны прогнозы, полученные на 2007 год с использованием модели GARCH, чтобы соответствовать сезонно скорректированным временным рядам.

Методы экспоненциального сглаживания

Методы экспоненциального сглаживания: обучающий период с 1956 г.

  • Метод простого экспоненциального сглаживания (simple exponential smoothing, SES) позволяет выделить лишь среднее значение временного ряда — уровень (Level).

  • В методе Хольта с помощью экспоненциального сглаживания выделяются два закономерных компонента ряда — уровень (Level) и скорость роста (Trend).

  • Метод Винтерса позволяет учитывать как скорость изменения ряда, так и сезонность. По подходу к учету сезонности выделяют два вида моделей: мультипликативная и аддитивная модели.

Сравним ошибки моделей:

Автоматический подбор параметр основан на сравнении прогноза в историческом периоде и факта и минимизации ошибки подгонки модели. Но модель, которая хорошо объясняет прошлое — не обязательно хорошо предсказывает будущее.

В данном случае очевидно, что компоненты модели плохо адаптируются к данным из-за неудачно подобранных констант. Имеет смысл задать константы вручную. Это рассмотрено далее в моделях с нелинейным трендом.

Описание модели Хольта-Уинтерса

Более сложный метод прогнозирования, чем рассмотренные ранее методы скользящего среднего и экспоненциального сглаживания

Метод может учитывать сезонность, что немаловажно, и общий тренд

Модель Хольта-Уинтерса является расширением метода Хольта до трехпараметрического экспоненциального сглаживания. Это значит, что метод характеризуется тремя параметрами, которые необходимо выбрать, чтобы получить прогноз. Выбор этих параметров может производится путем простого перебора. Потом смотрим на полученные «прогнозы» в прошлом – модель, выбираем те параметры, при которых модель наиболее точно повторяет реальность.

Модели Хольта-Винтерса могут учитывать сезонность в мультипликативном и аддитивном вариантах. Грубо говоря, мультипликативный случай представляет сезонность как произведение, а аддитивный как сумму.

Гироскоп

Самый простой инклинометр может быть сконструирован либо с помощью гироскопа, либо с помощью акселерометра. В случае использования гироскопа, угол наклона устройства легко вычисляется с помощью дискретного интегрирования скорости его вращения. Напомним:

гдеa(t) — искомый угол наклона тела;a(t-1) — угол тела в предыдущий момент времени;gx — скорость вращения тела вокруг оси X — это то, что измеряет гироскоп;dt — время, которое прошло с момента предыдущего вычисления угла a.

Однако, у MEMS гироскопа есть один коварный недостаток, который называется дрейфом нуля. Суть этого недостатка сводится к тому, что при остановке вращения гироскопа, он все еще будет показывать значение отличное от нуля.

Другим недостатком такого решения, является применение процедуры дискретного интегрирования, которая по своей природе дает неточный результат.

Третья проблема тесно связана с предыдущей. Она выражается в постепенном накоплении ошибки вычисления угла из-за ограниченной точности переменных микроконтроллера.

Какой же вывод можно сделать из сказанного выше? А такой, что если строить инклинометр только на основе гироскопа, он будет довольно неточен. Значит и стабилизация машины будет весьма посредственная. Убедиться в этом можно, посмотрев на график в конце 3-го раздела.

Как построить диаграмму Ганта за пять шагов

Создание диаграммы Ганта состоит из пяти главных шагов:

  • определения временных рамок;
  • добавления задач и подзадач;
  • описания зависимости между задачами;
  • добавления вех;
  • обновления работы.

Определение временных рамок — первый шаг. Диаграмма Ганта — это визуализация хронологии проекта. На первом этапе назначают даты начала и завершения проекта — их размещают в начале и в конце графика.

График состоит из столбиков: это могут быть часы, дни, недели в зависимости от продолжительности проекта. Задачи размещают в столбиках в соответствии с тем, когда над ними будут работать.

Так выглядит график работ в диаграмме ГантаИллюстрация: предоставлена Павлом Кухновцом

Проект разбивают на задачи и подзадачи. Для каждой из них назначают даты начала и завершения. Потом задачи размещают на графике. Сразу можно назначить ответственных за выполнение задач.

Для дифференциации задач используют разные цвета. Например, можно пометить синим этапы, над которыми работает отдел маркетинга, а зелёным — этапы, над которыми работает отдел продаж.

Некоторые задачи невозможно начать без выполнения других. Например, нельзя начать тестирование приложения, если оно не готово. Связи между задачами на диаграмме Ганта чаще всего отмечают стрелками.

Потом на диаграмму добавляют вехи. Это даты, контрольные точки, обозначающие завершение больших частей работы. Вехи показывают, какие задачи нужно завершить к контрольным точкам, и помогают расставить приоритеты.

Вехи на диаграмме Ганта могут выглядеть такИллюстрация: предоставлена Павлом Кухновцом

Что такое диаграмма Ганта и как она помогает в планировании

Диаграмма Ганта — это визуальное представление графика работ, построенное согласно плану проекта. На ней отражены задачи и последовательность их выполнения.

График работ состоит из ряда отрезков, размещённых вдоль временной оси. Каждый из них соответствует отдельной задаче или подзадаче. Начало и конец отрезка соответствуют моменту начала и завершения работы по задаче. Длина отрезка — продолжительность работ.


На каждый отрезок можно назначить исполнителей задачиИллюстрация: предоставлена Павлом Кухновцом

Диаграмма Ганта нужна, чтобы наглядно представить все этапы работы. Она показывает:

  • задачи, включённые в проект;
  • их продолжительность;
  • даты начала и окончания проекта;
  • время, которое занимает каждая задача;
  • исполнителей, работающих над задачами;
  • способы объединения задач.

Всё это позволяет оценить все ресурсы и взаимосвязи задач. А значит, запланировать работу так, чтобы не пришлось глобально пересматривать подход, менять команду или инструменты.


С помощью инструмента вы найдёте возможные проблемы и построите график так, чтобы реализовать проект в срокИллюстрация: предоставлена Павлом Кухновцом

Диаграмму Ганта используют для планирования как небольших, так и масштабных проектов. Она может разрастись как снежный ком и превратиться в сложную конструкцию. Однако разобраться в ней просто.

1) Наивный, SNaive

вНаивныемодели, прогнозы для каждого горизонта соответствуютпоследнее наблюдаемое значение.

Такой прогноз предполагает, что стохастическая модель, генерирующая временной ряд, является случайным блужданием.

Расширение Наивной модели даетсяSNaïve(Сезонная наивная) модель. Предполагая, что временной ряд имеет сезонную составляющую и что период сезонностиTпрогнозы, заданные моделью SNaive, определяются как:

Поэтому прогнозы на следующиеTвременные шаги равны предыдущемуTвременные шаги. В нашем приложении SNaive прогноз на следующий год равен прошлогодним наблюдениям.

Эти модели часто используются какэталонные модели, На следующих графиках показаны прогнозы, полученные с помощью двух моделей на 2007 год.

Другие модели

Другие моделине включены в этот список, например:

  • Любая стандартная модель регрессии, для которой требуется время (и / или другие функции)

Заключительные замечания

Цель этого проекта состояла не в том, чтобы соответствовать наилучшей возможной модели прогнозирования индекса промышленного производства, а в том, чтобы дать обзор моделей прогнозирования. В реальных приложениях много времени должно быть потрачено напредварительная обработка,особенность техникиа такжевыбор функции,

Большинство ранее описанных моделей позволяют легко включать изменяющиеся во времени предикторы. Они могут быть извлечены из одного и того же временного ряда или могут соответствовать внешним предикторам (например, временным рядам другого индекса)

В последнем случае следует обратить внимание нане использовать информацию из будущего, что может быть удовлетворено путем прогнозирования предикторов или использования их запаздывающих версий

Методы прогнозирования

Методы прогнозирования основываются на выявлении тенденции во временном ряду и последующем использовании найденного значения для предсказания будущих значений. В методах прогнозирования выделяют тренд и сезонность, в общем случае, все типы сезонности могут быть найдены последовательными итерациями. Например, при анализе данных за год, можно выделить сезонность времени года, а в оставшемся тренде найти сезонность по дням недели и так далее.

Двойное экспоненциальное сглаживание

Двойное экспоненциальное сглаживание выдаёт сглаженное значение уровня и тенденции.

Внимание! Может возникнуть путаница, метод Хольт-Винтерса отличается терминами: тренд, сезонность и шум соответственно называются уровень, тренд и сезонность. При расчёте, значения s и t для первого периода назначают s1 = D1 и t=0

При расчёте, значения s и t для первого периода назначают s1 = D1 и t=0

График 8. Данные (персиковая линия), экспоненциальное сглаживание — уровень (жёлтая линия), тренд (линия цвета охры) и прогноз (чёрная линия) методом экспоненциального сглаживания

Метод Хольт-Винтерса

Метод Хольт-Винтерса включает в себя сезонную составляющую, т.е. периодичность. Существуют две разновидности метода — мультипликативный и аддитивный. В отличие от двойного экспоненциального сглаживания, метод Хольт-Винтерса изучает также влияние периодичности.

Общая идея нахождения значений сглаженного уровня, тренда и периодичности заключается в следующем: сглаженный уровень (s — smooth, иногда используют l — level) — это базовый уровень значений, тренд (t — trend) — это показатель скорости роста, разница между сглаженными значениями текущего и предыдущего периода. Для изучения периодичности (p — period), мы разбиваем данные на периоды размером k и выделяем влияние каждого элемента (1,2. k) периода на сглаженный уровень.

Для более точных расчётов вводится показатель обратной связи.

Для начала расчётов, значения s, t и k, в самом простом виде, могут быть выбраны как sτ = Dτ, t = 0, p = 0.

Для прогнозирования используется следующая формула:

Мультипликативный метод Хольт-Винтерса

Мультипликативный метод отличается от аддитивного тем, что параметры, влияющие на периодичность и сглаженный уровень рассчитываются отношением:

Для прогнозирования используется следующая формула:

Как рассчитать прогноз по методу Хольта Винтерса?

1. Рассчитываем экспоненциально-сглаженный ряд:

2. Определяем значение тренда:

3. Оцениваем сезонность:

4. Делаем прогноз:

Рассмотрим подробнее:

1. Рассчитываем экспоненциально-сглаженный ряд:

  • Lt – сглаженная величина на текущий период;
  • k – коэффициент сглаживания ряда;
  • St-s — коэффициент сезонности предыдущего периода;
  • Yt – текущее значение ряда (например, объём продаж);
  • Lt-1 – сглаженная величина за предыдущий период;
  • Tt-1 – значение тренда за предыдущий период;

Lt (Сглаженная величина текущий период) = k(коэффициент сглаживания ряда)* Yt (текущее значение ряда (например, объём продаж))/St-s (коэффициент сезонности за этот же период в предыдущем сезоне) )+(1-коэффициент сглаживания ряда)*( Lt-1(сглаженная величина за предыдущий период) -Tt-1(тренд за предыдущий период)

Коэффициент сглаживания ряда k задается вами вручную и находится в диапазоне от 0 до 1.

Для первого периода в начале данных экспоненциально-сглаженный ряд равен первому значению ряда (например, объему продаж за первый месяц) L1=Y1;

Сезонность в первом и втором периоде St-s равна 1.

В приложенном файле вводим значение L:

2. Определяем значение тренда

  • Tt – значение тренда на текущий период;
  • b – коэффициент сглаживания тренда;
  • Lt – экспоненциально сглаженная величина за текущий период;
  • Lt-1 – экспоненциально сглаженная величина за предыдущий период;
  • Tt-1 – значение тренда за предыдущий период.

Tt(значение тренда на текущий период)=b(коэффициент сглаживания тренда)*(Lt(экспоненциально сглаженная величина за текущий период) — Lt-1экспоненциально сглаженная величина за предыдущий период))+(1-b(коэффициент сглаживания тренда))*Tt-1 (значение тренда за предыдущий период)

Коэффициент сглаживания тренда b задается вами вручную и находится в диапазоне от 0 до 1

Значение тренда для первого периода равно 0 (T1 =0);

В приложенном файле рассчитаем значения тренда:

3. Оцениваем сезонность:

  • St — коэффициент сезонности для текущего периода;
  • q — коэффициент сглаживания сезонности;
  • Yt — текущее значение ряда (например, объём продаж));
  • Lt — сглаженная величина за текущий период;
  • St-s — коэффициент сезонности за этот же период в предыдущем сезоне;

St(коэффициент сезонности для текущего периода)=q (коэффициент сглаживания сезонности)*Yt(текущее значение ряда (например, объём продаж))/Lt(Сглаженная величина за текущий период) +(1-q(коэффициент сглаживания сезонности)*)*St-s (коэффициент сезонности за этот же период в предыдущем сезоне)

Коэффициенты сезонности для первого сезона (года) = 1;

4. Сделаем прогноз по методу Хольта-Винтерса

Прогноз на p периодов вперед равен:

  • Ŷt+p — прогноз по методу Хольта-Винтерса на p периодов вперед;
  • Lt – экспоненциально сглаженная величина за последний период;
  • p – порядковый номер периода, на который делаем прогноз;
  • Tt – тренд за последний период;
  • St-s+p — коэффициент сезонности за этот же период в последнем сезоне;

Ŷt+p (Прогноз по методу Хольта-Винтерса)=( Lt (экспоненциально сглаженная величина за последний период)+ p (количество периодов вперед, на которое делаем прогноз) *Tt (тренд за последний период))*St-s+p (коэффициент сезонности за этот же период в последнем сезоне)

Во вложенном файле сделаем прогноз на 10 месяцев вперед. Для этого заполним номера периодов, на сколько будем делать прогноз

Вводим формулу прогноза в ячейку. Для этого сумму значений экспоненциального ряда и тренда за последний период, умноженное на номер периода для прогноза, умножаем на коэффициент сезонности.

Чтобы протянуть формулу прогноза на 10 периодов вперед, зафиксируем ссылку на экспоненциальный ряд и значение тренда за последний период — для этого выделяем ссылку и нажимаем F4:

Протягиваем формулу на 10 периодов вперед, получаем прогноз:

При появлении новых данных прогноз по методу Хольта — Винтерса желательно пересчитать для уточнения ряда, тренда и сезонности. Также при подготовке данных для прогноза всегда стоит очищать данные от факторов, которые в прогнозном периоде не повторятся (например, прирост продаж по крупной акции) или учитывать запланированные факторы, которые дадут дополнительный прирост продаж (например, ввод продукции в сеть или проведение мероприятия по стимулированию сбыта).

Особенности использования функции ПРЕДСКАЗ в Excel

Функция имеет следующую синтаксическую запись:

  • x – обязательный для заполнения аргумент, характеризующий одно или несколько новых значений независимой переменной, для которых требуется предсказать значения y (зависимой переменной). Может принимать числовое значение, массив чисел, ссылку на одну ячейку или диапазон;
  • известные_значения_y – обязательный аргумент, характеризующий уже известные числовые значения зависимой переменной y. Может быть указан в виде массива чисел или ссылки на диапазон ячеек с числами;
  • известные_значения_x – обязательный аргумент, который характеризует уже известные значения независимой переменной x, для которой определены значения зависимой переменной y.
  1. Второй и третий аргументы рассматриваемой функции должны принимать ссылки на непустые диапазоны ячеек или такие диапазоны, в которых число ячеек совпадает. Иначе функция ПРЕДСКАЗ вернет код ошибки #Н/Д.
  2. Если одна или несколько ячеек из диапазона, ссылка на который передана в качестве аргумента x, содержит нечисловые данные или текстовую строку, которая не может быть преобразована в число, результатом выполнения функции ПРЕДСКАЗ для данных значений x будет код ошибки #ЗНАЧ!.
  3. Статистическая дисперсия величин (можно рассчитать с помощью формул ДИСП.Г, ДИСП.В и др.), передаваемых в качестве аргумента известные_значения_x, не должна равняться 0 (нулю), иначе функция ПРЕДСКАЗ вернет код ошибки #ДЕЛ/0!.
  4. Рассматриваемая функция игнорирует ячейки с нечисловыми данными, содержащиеся в диапазонах, которые переданы в качестве второго и третьего аргументов.
  5. Функция ПРЕДСКАЗ была заменена функцией ПРЕДСКАЗ.ЛИНЕЙН в Excel версии 2016, но была оставлена для обеспечения совместимости с Excel 2013 и более старыми версиями.
  6. Для предсказания только одного будущего значения на основании известного значения независимой переменной функция ПРЕДСКАЗ используется как обычная формула. Если требуется предсказать сразу несколько значений, в качестве первого аргумента следует передать массив или ссылку на диапазон ячеек со значениями независимой переменной, а функцию ПРЕДСКАЗ использовать в качестве формулы массива.

Качество прогнозирования

Проверка качества прогнозирования возможна в случае наличия достаточной выборки и является важной проверкой на достоверность
прогноза, для проверки и оптимизации значений α, β и γ необходимо построить прогноз на существующие данные,
например, если у нас в наличии данные за пять лет и мы хотим предсказать следующий год, то необходимо построить модель на первых
четырёх годах, проверить и оптимизировать коэффициенты для минимизации ошибки между прогнозом и данными на 5й год. После оптимизации
модель может быть перестроена с учётом последнего периода для повышения точности, далее следует построение прогноза.. Методы оптимизации будут описаны в отдельной статье, ниже представлен пример прогнозирования методом Хольт Винтерса.

Методы оптимизации будут описаны в отдельной статье, ниже представлен пример прогнозирования методом Хольт Винтерса.

График 9. Данные о посещаемости сайта за четыре недели

# Данные s t p s t p
1 93 93 93
2 91 92 -0.1 -0.5 92 -0.1 0.99
3 72 84 -0.89 -6 84 -0.89 0.93
4 75 80 -1.2 -2.5 80 -1.2 0.97
5 75 77 -1.38 -1 77 -1.38 0.99
6 57 68 -2.14 -5.5 68 -2.14 0.92
7 66 66 -2.13 66 -2.13 1
8 123 88 0.28 17.5 38 -4.72 1.62
9 85 87 0.15 -1.25 54 -2.65 1.28
10 85 89 0.34 -5 67 -1.09 1.1
11 91 91 0.51 -1.25 77 0.02 1.08
12 102 96 0.96 2.5 87 1.02 1.08
13 73 90 0.26 -11.25 85 0.72 0.89
14 60 78 -0.97 -9 75 -0.35 0.9
15 99 79 -0.77 18.75 69 -0.92 1.53
16 108 91 0.51 7.88 75 -0.23 1.36
17 98 96 0.96 -1.5 80 0.29 1.16
18 104 100 1.26 1.38 87 0.96 1.14
19 83 93 0.43 -3.75 84 0.56 1.03
20 68 88 -0.11 -15.63 81 0.2 0.86
21 62 81 -0.8 -14 76 -0.32 0.86
22 59 64 -2.42 6.88 61 -1.79 1.25
23 80 66 -1.98 10.94 59 -1.81 1.36
24 121 87 0.32 16.25 76 0.07 1.38
25 112 97 1.29 8.19 85 0.96 1.23
26 85 94 0.86 -6.38 85 0.86 1.02
27 106 106 1.97 -7.82 101 2.37 0.95
28 82 103 1.47 -17.5 100 2.03 0.84

График 9. Пример предсказания посещаемости сайта на основе данных за четыре недели. Жёлтая линия — исходные данные, красная — прогноз на пятую
неделю на основе первых четырёх. Закрашена линия сглаженного уровня при α=0.4, β=0.1, γ=0.5

Увеличение точности прогноза

В случае, когда точность прогноза с автоматически заданными параметрами оказалась недостаточной, можно задать эти значения вручную.

Важно понимать, что нет универсальных правил, которые могут быть применимы ко всем задачам прогнозирования, поэтому для каждого набора данных они будут свои. В документации можно подробно ознакомиться с описанием структуры ARIMAX и определениями каждого из настраиваемых параметров

Изменим показатели в окне настройки ARIMAX, как это показано на рисунке ниже.

Настройка обработчика ARIMAX

Далее необходимо будет произвести переобучение данного узла.

Значения прогноза будут пересчитаны, и в визуализаторе мы сможем увидеть, что графики кривых на 2 временном периоде приняли почти одинаковый вид. Это говорит о том, что точность прогноза увеличилась.

График прогноза продаж

Чтобы убедиться в том, что прогноз стал точнее, откроем вкладку «Сводка» на третьем выходном порте модели. Значение средней относительной ошибки на обучающем множестве сократились в несколько раз по сравнению с предыдущими.

Ошибки сводки ARIMAX

Сообщений 1 страница 3 из 3

Поделиться12013-02-07 08:40:54

Цель работы: освоение приемов прогнозирования количественных характеристик системы по регрессионной модели путем восстановления значений и экстраполяции. Используемое программное обеспечение: табличный процессор Microsoft Excel.

Задание 1

Требуется выполнить прогнозирование заболеваемости бронхиальной астмой при концентрации угарного газа равной 3 мг/куб. м. методом восстановления значения, воспользовавшись квадратичной зависимостью, полученной в предыдущей работе.

1. Построить следующую электронную таблицу:

2. Подставить в ячейку А2 значение концентрации угарного газа, равного 3 мг/куб. м. В результате получим:

Справочная информация

Число, получаемое по формуле в ячейке В2, на самом деле является дробным. Однако не имеет смысла считать число людей, даже среднее, в дробных величинах. Дробная часть удалена — в формате вывода числа указано 0 цифр после запятой.

Задание 2

Требуется выполнить прогнозирование заболеваемости бронхиальной астмой при концентрации угарного газа равной б мг/куб. м. методом графической экстраполяции у воспользовавшись квадратичной зависимостью, полученной в предыдущей работе. 1. Выполнить построение квадратичного тренда по алгоритму, описанному в предыдущей работе, добавив в него следующее действие: => на вкладке Параметры в области Прогноз в строке вперед на установить 2 единицы.

Здесь имеются в виду единицы используемого масштаба по горизонтальной оси.

Полученный график приведен на рисунке.

2. Оценить приблизительно на полученном графике значение функции при значении аргумента, равном 6.

Задание для самостоятельного выполнения на получение регрессионных зависимостей

В следующей таблице приводится прогноз средней дневной температуры на последнюю неделю мая в различных городах европейской части России. Названия городов расставлены в алфавитном порядке. Указана также географическая широта этих городов. Построить несколько вариантов регрессионных моделей (не менее трех), отражающих зависимость температуры от широты города. Выбрать наиболее подходящую функцию.

4) АРИМА, САРИМА

Что касается экспоненциального сглаживания, такжеARIMAМодели являются одним из наиболее широко используемых подходов для прогнозирования временных рядов. Название является аббревиатурой от AutoRegressive Integrated Moving Average.

ВавторегрессионныйМодели прогнозов соответствуют линейной комбинации прошлых значений переменной. ВСкользящая средняяМодель прогноза соответствует линейной комбинации прошлых ошибок прогноза.

В основном, модели ARIMA объединяют эти два подхода. Поскольку они требуют, чтобы временной ряд былстационарные, разностные (Интегрирование) временной ряд может быть необходимым шагом, т. е. рассматривать временной ряд различий вместо исходного.

SarimaМодель (Seasonal ARIMA) расширяет ARIMA, добавляя линейную комбинацию сезонных прошлых значений и / или ошибок прогноза.

На следующих графиках показаны прогнозы, полученные на 2007 год с использованием модели SARIMA и модели ARIMA для сезонно скорректированных временных рядов.

Понравилась статья? Поделиться с друзьями:
Самоучитель Брин Гвелл
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: