Автокорреляция и ее устранение - OXFORDST.RU

Автокорреляция и ее устранение

Реферат: Автокорреляция

1. Суть и причины автокорреляции

2. Обнаружение автокорреляции

3. Последствия автокорреляции

4. Методы устранения

4.1 Определение на основе статистики Дарбина-Уотсона

Список использованной литературы

Модели, построенные по данным, характеризующим один объект за ряд последовательных моментов (периодов), называются моделями временных рядов. Временной ряд – это совокупность значений какого-либо показателя за несколько последовательных моментов или периодов. Применение традиционных методов корреляционно-регрессионного анализа для изучения причинно-следственных зависимостей переменных, представленных в форме временных рядов, может привести к ряду серьезных проблем, возникающих как на этапе построения, так и на этапе анализа эконометрических моделей. В первую очередь эти проблемы связаны со спецификой временных рядов как источника данных в эконометрическом моделировании.

Предполагается, что в общем случае каждый уровень временного ряда содержит три основные компоненты: тенденцию (Т), циклические или сезонные колебания (S) и случайную компоненту (E). Если временные ряды содержат сезонные или циклические колебания, то перед проведением дальнейшего исследования взаимосвязи необходимо устранить сезонную или циклическую компоненту из уровней каждого ряда, поскольку ее наличие приведет к завышению истинных показателей силы и связи изучаемых временных рядов в случае, если оба ряда содержат циклические колебания одинаковой периодичности, либо к занижению этих показателей в случае, если сезонные или циклические колебания содержит только один из рядов или периодичность колебаний в рассматриваемых временных рядах различна. Устранение сезонной компоненты из уровней временных рядов можно проводить в соответствии с методикой построения аддитивной и мультипликативной моделей. Если рассматриваемые временные ряды имеют тенденцию, коэффициент корреляции по абсолютной величине будет высоким, что в данном случае есть результат того, что х и у зависят от времени, или содержат тенденцию. Для того чтобы получить коэффициенты корреляции, характеризующие причинно-следственную связь между изучаемыми рядами, следует избавиться от так называемой ложной корреляции, вызванной наличием тенденции в каждом ряде. Влияние фактора времени будет выражено в корреляционной зависимости между значениями остатков за текущий и предыдущие моменты времени, которая получила название «автокорреляция в остатках».

1.Суть и причины автокорреляции

Автокорреляция — это взаимосвязь последовательных элементов временного или пространственного ряда данных. В эконометрических исследованиях часто возникают и такие ситуации, когда дисперсия остатков постоянная, но наблюдается их ковариация. Это явление называют автокорреляцией остатков.

Автокорреляция остатков чаще всего наблюдается тогда, когда эконометрическая модель строится на основе временных рядов. Если существует корреляция между последовательными значениями некоторой независимой переменной, то будет наблюдаться и корреляция последовательных значений остатков. Автокорреляция может быть также следствием ошибочной спецификации эконометрической модели. Кроме того, наличие автокорреляции остатков может означать, что необходимо ввести в модель новую независимую переменную.

Автокорреляция в остатках есть нарушение одной из основных предпосылок МНК – предпосылки о случайности остатков, полученных по уравнению регрессии. Один из возможных путей решения этой проблемы состоит в применении к оценке параметров модели обобщенного МНК.

Среди основных причин, вызывающих появление автокорреляции, можно выделить ошибки спецификации, инерцию в изменении экономических показателей, эффект паутины, сглаживание данных.

Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводит к системным отклонениям точек наблюдений от линии регрессии, что может обусловить автокорреляцию.

Инерция. Многие экономические показатели (например, инфляция, безработица, ВНП и т.п.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Действительно, экономический подъем приводит к росту занятости, сокращению инфляции, увеличению ВНП и т.д. Этот рост продолжается до тех пор, пока изменение конъюктуры рынка и ряда экономических характеристик не приведет к замедлению роста, затем остановке и движению вспять рассматриваемых показателей. В любом случае эта трансформация происходит не мгновенно, а обладает определенной инертностью.

Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом). Например, предложение сельскохозяйственной продукции реагирует на изменение цены с запаздыванием (равным периоду созревания урожая). Большая цена сельскохозяйственной продукции в прошедшем году вызовет (скорее всего) ее перепроизводство в текущем году, а следовательно, цена на нее снизится и т.д.

Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его подынтервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может послужить причиной автокорреляции.

2.Обнаружение автокорреляции

В силу неизвестности значений параметров уравнения регрессии неизвестными будут также и истинные значения отклонений ,t=1,2…T. Поэтому выводы об их независимости осуществляются на основе оценок ,t=1,2…T, полученные из эмпирического уравнения регрессии. Рассмотрим возможные методы определения автокорреляции.

Существует несколько вариантов графического определения автокорреляции. Один из них, указывающий отклонения с моментами t их получении (их порядковыми номерами i), приведен на рис. 2.1.Это так называемые последовательно-временные графики. В этом случае по оси абсцисс обычно откладывают либо время (момент) получения статистических данных, либо порядковый номер наблюдения, а по оси ординат- отклонения (либо оценки отклонений )

Рис.2.1.

Естественно предположить, что на рис 2.1. а-г имеются определенные связи между отклонениями, т.е. автокорреляция имеет место. Отсутствие зависимости на рис. д скорее всего свидетельствует об отсутствии автокорреляции.

Например, на рис. 2.1.б отклонения вначале в основном отрицательные, затем положительные, потом снова отрицательные. Это свидетельствует о наличии между отклонениями определенной зависимости.

2.2. Метод рядов

Этот метод достаточно прост: последовательно определяются знаки отклонений ,t=1,2…T. Например,

Т.е. 5 «-», 7 «+», 3 «-», 4 «+», 1 «-» при 20 наблюдениях.

Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда.

Визуальное распределение знаков свидетельствует о неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений n, то вполне вероятна положительная автокорреляция. Если же рядов слишком много, то вероятна отрицательная автокорреляция .

2.3 Критерий Дарбина-Уотсона

Наиболее известным критерием обнаружения автокорреляции первого порядка является критерий Дарбина- Уотсона и расчет величины

(2.3.1)

Согласно (2.3.1) величина d есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии. Значение критерия Дарбина – Уотсона указывается наряду с коэффициентом детерминации, значениями t- и F- критериев.

Коэффициент автокорреляции остатков первого порядка определяется как

(2.3.2)

Между критерием Дарбина–Уотсона и коэффициентом автокорреляции остатков первого порядка имеет место следующее соотношение:

§ 4. Методы устранения автокорреляции

Основной причиной наличия случайного члена в модели являются несовершенные знания о причинах и взаимосвязях, определяющих то или иное значение зависимой переменной. Поэтому свойства случайных отклонений, в том числе и автокорреляция, в первую очередь зависят от выбора формулы зависимости и состава объясняющих переменных.

Однако если все разумные процедуры изменения спецификации модели исчерпаны, а автокорреляция имеет место, то можно предположить, что она обусловлена какими-то внутренними свойствами ряда . В этом случае можно воспользоваться авторегрессионным преобразованием. В линейной регрессионной модели либо в моделях, сводящихся к линейной, наиболее целесообразным и простым преобразованием является авторегрессионная схема первого порядка AR(1).

Читайте также  Модели предоставления сестринского ухода

Для простоты изложения AR(1) рассмотрим модель парной линейной регрессии:

Тогда наблюдениям t и (t — 1) соответствуют формулы:

Пусть случайные отклонения подвержены воздействию авторегрессии первого порядка:

гд — случайные отклонения, удовлетворяющие

всем предпосылкам МНК, а коэффициент р известен.

Так как по предположению коэффициент р известен, то оче-

видно, у*, xt, vt вычисляются достаточно просто. В силу того что случайные отклонения vt удовлетворяют предпосылкам МНК, оценки параметров в 0 и в1 будут обладать свойствами наилучших линейных несмещенных оценок.

Способ вычисления уt, xt приводит к потере первого наблюдения (если мы не обладаем предшествующим ему наблюдением). Число степеней свободы уменьшится на единицу, что при больших выборках не так существенно, но при малых может привести к потере эффективности. Эта проблема обычно преодолевается с помощью поправки Прайса-Винстена:

Отметим, что авторегрессионное преобразование может быть обобщено на произвольное число объясняющих переменных, т. е. использовано для уравнения множественной регрессии.

Авторегрессионное преобразование первого порядка AR(1) может быть обобщено на преобразования более высоких порядков AR(2), AR(3) и т. д.:

Можно показать, что в случае автокорреляции остатков ковариационная матрица вектора случайных отклонений имеет вид:

В обобщенном методе наименьших квадратов, если известны элементы матрицы Q, параметры уравнения регрессии определяются по формуле Эйткена (AC AifkenV

Однако на практике значение коэффициента р обычно неизвестно и его необходимо оценивать.

Рассмотрим определение р на основе статистики Дарбина- Уотсона.

Напомним, что статистика Дарбина-Уотсона тесно связана с коэффициентом корреляции между соседними отклонениями через соотношение:

Тогда в качестве оценки коэффициента р может быть взят коэффициент r = r :

Этот метод оценивания весьма неплох при большом числе наблюдений. В этом случае оценка r параметра р будет достаточно точной.

Другим возможным методом оценивания р и устранения автокорреляции остатков является итеративный процесс, называемый методом Кохрана-Оркатта. Опишем данный метод на примере парной регрессии:

и авторегрессионной схемы первого порядка St = р St-1 + Vt.

  1. Оцениваетсяпо мнк регрессия Y = в0 + в1 X + s (находится

и определяются остатки (оценки

Пусть р — оценка коэффициента р .

  1. На основе данной оценки строится уравнение:

Коэффициенты в0, в1 оцениваются по уравнению регрессии:

  1. Значения b0 = b0/(1 — /Р),b1 подставляются в Y = b0 + bX . Вновь вычисляются оценки et = yt-yt, t = 1, 2. T отклонений et

и процесс возвращается к этапу 2.

Чередование этапов осуществляется до тех пор, пока не будет достигнута требуемая точность, т. е. пока разность между предыдущей и последующей оценками р не станет меньше любого наперед заданного числа.

Вернемся к примеру 4.1. Полагая, что остаток et линейно зависит от предыдущего значения остатка et-1, и оценивая коэффициент р, получим:

При такой оценке р рассчитаем по приведенным выше форму* *

лам значения xt,yt.

Оценим параметры уравнения обычным ме

тодом наименьших квадратов. Получим:

тогда исправленные оценки коэффициентов исходного уравнения

(первоначальные оценки равны b0 = 2,09, b1 = 2,014). Мы выполнили один цикл процедуры Кохрана-Оркатта.

По данному методу регрессия (4.10) оценивается для каждого возможного значения р из отрезка [-1, 1] с небольшим шагом (например, 0,001; 0,01 и т. д.). Величина р, дающая наименьшую стандартную ошибку регрессии, принимается в качестве оценки коэффициента р . И значения в0, в1 оцениваются из уравнения

регрессии yt = b 0 + b1xt именно с данным значением р . Этот метод широко используется в пакетах прикладных программ.

Итак, подведем итог. В силу ряда причин (ошибок спецификации, инерционности рассматриваемых зависимостей и др.) в регрессионных моделях может иметь место корреляционная зависимость между соседними случайными отклонениями. Это нарушает одну из фундаментальных предпосылок МНК. Вследствие этого оценки, полученные на основе МНК, перестают быть эффективными. Это делает ненадежными выводы по значимости коэффициентов регрессии и по качеству самого уравнения. Поэтому достаточно важным является умение определить наличие автокорреляции и устранить это нежелательное явление. При установлении автокорреляции необходимо в первую очередь проанализировать правильность спецификации модели. Если после ряда возможных усовершенствований регрессии (уточнения состава объясняющих переменных либо изменения формы зависимости) автокорреляция по-прежнему имеет место, то, возможно, это связано с внутренними свойствами ряда отклонений . В этом случае возможны определенные преобразования, устраняющие автокорреляцию. Среди них выделяется авторегрессионная схема первого порядка AR(1), которая, в принципе, может быть обобщена в AR(k), k = 2, 3, . Для применения указанных схем необходимо оценить коэффициент корреляции между отклонениями. Это может быть сделано различными методами: на основе статистики Дарбина-Уотсона, Кохрана-Оркатта, Хилдрета-Лу и др. В случае наличия среди объясняющих переменных лаговой зависимой переменной наличие автокорреляции устанавливается с помощью й-статистики Дарби- на. А для ее устранения в этом случае предпочтителен метод Хилдрета-Лу.

Рассмотрим применение формулы Эйткена для авторегрессионной схемы первого порядка. В этом случае:

Подставив в матрицу Q 1 вместо параметра р его оценку, найдем оценку коэффициентов уравнения по формуле Эйткена:

При автокорреляции случайных возмущений оценки параметров регрессионной модели остаются несмещенными и состоятельными, но становятся неэффективными, и их стандартные ошибки оцениваются неправильно, часто занижаются. Критерий Дарбина-Уотсона является одним из методов обнаружения автокорреляции остатков регрессионной модели. Этот критерий применяется только для обнаружения автокорреляции первого порядка между соседними рядами случайных остатков. Наиболее простым и распространенным методом обнаружения автокорреляции случайных остатков регрессионной модели является графический метод, сутью которого является построение графиков автокорреляционной и частной автокорреляционной функций. Для устранения автокорреляции можно применять методы Кохрана-Оркатта и Хилдрета-Лу.

Вопросы для самопроверки

  1. Как ведут себя остатки относительно линии регрессии в случае положительной автокорреляции случайных возмущений?
  2. Как ведут себя остатки относительно линии регрессии в случае отрицательной автокорреляции случайных возмущений?
  3. Как выглядит ковариационная матрица вектора случайных отклонений, если предпосылки Гаусса-Маркова выполняются?
  4. Как выглядит ковариационная матрица вектора случайных отклонений в случае автокорреляции?
  5. Как выглядит ковариационная матрица вектора случайных отклонений в случае автокорреляции этих отклонений в соседних наблюдениях?
  6. Сохраняется ли несмещенность оценок параметров линейной модели при автокорреляции случайных возмущений?
  7. Сохраняется ли эффективность оценок параметров линейной модели при автокорреляции случайных возмущений?
  8. Сохраняется ли состоятельность оценок параметров линейной модели при автокорреляции случайных возмущений?
  9. По какой формуле рассчитывается статистика Дарбина- Уотсона?
  10. Сколько критических значений имеет статистика Дарбина- Уотсона?
  11. В каких диапазонах статистики Дарбина-Уотсона имеется автокорреляция случайных возмущений?
  12. Запишите формулы, по которым преобразуются переменные в методе Кохрана-Оркатта.
  13. Когда применяется обобщенный метод наименьших квадратов?

Автокорреляция

6 июня 2021 14:08

Что такое автокорреляция?

Автокорреляция – это математическое представление степени сходства между заданным временным рядом и запаздывающей версией самого себя в последовательных временных интервалах. Это концептуально похоже на корреляцию между двумя разными временными рядами, но автокорреляция использует один и тот же временной ряд дважды: один раз в исходной форме и один раз с запаздыванием на один или несколько периодов времени.

Например, если сегодня дождь, данные говорят о том, что завтра будет дождь с большей вероятностью, чем если сегодня будет ясно. Когда дело доходит до инвестирования, акция может иметь сильную положительную автокорреляцию доходности, что говорит о том, что если она «растет» сегодня, то с большей вероятностью она вырастет и завтра.

Читайте также  Деловая культура и модель менеджмента Норвегии

Естественно, автокорреляция может быть полезным инструментом для трейдеров; особенно для технических аналитиков.

Ключевые выводы

  • Автокорреляция представляет собой степень сходства между заданным временным рядом и запаздывающей версией самого себя в последовательных временных интервалах.
  • Автокорреляция измеряет взаимосвязь между текущим значением переменной и ее прошлыми значениями.
  • Автокорреляция +1 представляет собой идеальную положительную корреляцию, а автокорреляция отрицательного значения 1 представляет собой идеальную отрицательную корреляцию.
  • Технические аналитики могут использовать автокорреляцию, чтобы измерить, насколько прошлые цены на ценные бумаги влияют на их будущую цену.

Понимание автокорреляции

Автокорреляцию также можно называть корреляцией с задержкой или последовательной корреляцией, поскольку она измеряет взаимосвязь между текущим значением переменной и ее прошлыми значениями.

В качестве очень простого примера взгляните на пять процентных значений в таблице ниже. Мы сравниваем их с столбцом справа, который содержит тот же набор значений, только что перемещенный на одну строку вверх.

При вычислении автокорреляции результат может находиться в диапазоне от -1 до +1.

Автокорреляция +1 представляет собой идеальную положительную корреляцию (увеличение, наблюдаемое в одном временном ряду, приводит к пропорциональному увеличению в другом временном ряду).

С другой стороны, автокорреляция -1 представляет собой идеальную отрицательную корреляцию (увеличение, наблюдаемое в одном временном ряду, приводит к пропорциональному уменьшению в другом временном ряду).

Автокорреляция измеряет линейные отношения. Даже если автокорреляция мала, все равно может существовать нелинейная взаимосвязь между временным рядом и самой лаговой версией.

Тестирование на автокорреляцию

Наиболее распространенным методом тестовой автокорреляции является тест Дарбина-Ватсона. Не вдаваясь в технические подробности, можно сказать, что Durbin-Watson – это статистика, которая обнаруживает автокорреляцию на основе регрессионного анализа.

Метод Дарбина-Ватсона всегда дает диапазон значений теста от 0 до 4. Значения, близкие к 0, указывают на большую степень положительной корреляции, значения, близкие к 4, указывают на большую степень отрицательной автокорреляции, а значения, близкие к среднему, предполагают меньшую автокорреляцию.

Итак, почему автокорреляция важна на финансовых рынках? Простой. Автокорреляция может применяться для тщательного анализа исторических движений цен, которые инвесторы затем могут использовать для прогнозирования будущих движений цен. В частности, автокорреляция может использоваться, чтобы определить, имеет ли смысл стратегия импульсной торговли.

Автокорреляция в техническом анализе

Автокорреляция может быть полезна для технического анализа, потому что технический анализ больше всего касается тенденций и взаимосвязей между ценами на ценные бумаги с использованием методов построения графиков. Это контрастирует с фундаментальным анализом, который вместо этого фокусируется на финансовом состоянии или управлении компанией.

Технические аналитики могут использовать автокорреляцию, чтобы выяснить, насколько прошлые цены на ценные бумаги влияют на их будущую цену.

Автокорреляция может помочь определить, действует ли фактор импульса для данной акции. Если, например, акция с высокой положительной автокорреляцией демонстрирует значительный рост в течение двух дней подряд, было бы разумно ожидать, что она вырастет и в следующие два дня.

Пример автокорреляции

Предположим, Эмма хочет определить, обнаруживает ли доходность акций в ее портфеле автокорреляцию; то есть доходность акций связана с доходностью предыдущих торговых сессий.

Если доходность демонстрирует автокорреляцию, Эмма могла бы охарактеризовать ее как импульсную акцию, потому что прошлые доходности, похоже, влияют на будущую доходность. Эмма выполняет регрессию с доходностью предыдущей торговой сессии в качестве независимой переменной и текущей доходностью в качестве зависимой переменной. Она обнаружила, что доходность за день до этого имеет положительную автокорреляцию 0,8.

Поскольку 0,8 близко к +1, прошлые прибыли кажутся очень хорошим положительным предиктором будущей доходности для этой конкретной акции.

Следовательно, Эмма может скорректировать свой портфель, чтобы воспользоваться преимуществами автокорреляции или импульса, продолжая удерживать свою позицию или накапливая больше акций.

Понятие автокорреляции. Методы ее обнаружения и устранения

Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные данные). Среди основных причин, вызывающих появление автокорреляции, можно выделить ошибки спецификации, инерцию в изменении экономических показателей, эффект паутины, сглаживание данных.

Методы обнаружения автокорреляции остатков.

1. Критерий Дарбина-Уотсона.

При статистическом анализе уравнения регрессии на начальном этапе чаще других проверяют выполнимость одной предпосылки, а именно, условия статистической независимости отклонений между собой. Поскольку значения ε­i теоретического уравнения регрессии Y = β + β1X + ε остаются неизвестными ввиду неопределенности истинных значений коэффициентов регрессии, то проверяется статистическая незначимость их оценок – отклонений еi, i = 1,2, …, n. При этом обычно проверяется их некоррелированность, являющаяся необходимым, но недостаточным условием независимости. Причем проверяется некоррелированность не любых, а только соседних величин еi. Соседними обычно считаются соседние во времени (при рассмотрении временных рядов) или по возрастанию объясняющей переменной X (в случае перекрестной выборки) значения еi. Для этих величин несложно рассчитать коэффициент корреляции, называемый в этом случае коэффициентом автокорреляции первого порядка,

(3.1)

При этом учитывается, что M(ei) = 0, i = 1,2, …, n.

На практике для анализа коррелированности отклонений вместо коэффициента корреляции используют тесно с ним связанную статистику Дарбина-Уотсона DW, рассчитываемую по формуле:

(3.2)

.

Здесь сделано допущение, что при больших n выполняется соотношение: .

. (3.3)

Нетрудно заметить, что если при любом i, то и DW = 0. Если , то , и DW = 4. Во всех других случаях 0

2. По формуле 3.2 рассчитывается статистика DW.

3. По таблице критических точек Дарбина-Уотсона определяются два числа dL и dU и осуществляют вывод по следующей схеме:

0 ≤ DW

k – количество рядов.

При достаточно большом количестве наблюдений (n1 >10, n2 >10) и отсутствии автокорреляции СВ k имеет асимптотически нормальное распределение с

; .

Тогда, если , то гипотеза об отсутствии автокорреляции не отклоняется.

При небольшом числе наблюдений (n1

Нежное введение в автокорреляцию и частичную автокорреляцию

Дата публикации 2017-02-06

Графики автокорреляции и частичной автокорреляции широко используются при анализе и прогнозировании временных рядов.

Это графики, которые графически суммируют силу взаимосвязи с наблюдением во временном ряду с наблюдениями на предыдущих временных шагах. Разница между автокорреляцией и частичной автокорреляцией может быть трудной и запутывающей для новичков в прогнозировании временных рядов.

В этом руководстве вы узнаете, как рассчитать и построить графики автокорреляции и частичной корреляции с помощью Python.

После завершения этого урока вы узнаете:

  • Как построить и просмотреть функцию автокорреляции для временного ряда.
  • Как построить и просмотреть функцию частичной автокорреляции для временного ряда.
  • Разница между автокорреляционными и частичными автокорреляционными функциями для анализа временных рядов.

Набор данных минимальных суточных температур

Этот набор данных описывает минимальные дневные температуры за 10 лет (1981-1990) в городе Мельбурн, Австралия.

Единицы измерения — градусы Цельсия, 3650 наблюдений. Источник данных зачисляется в Австралийское бюро метеорологии.

Загрузите набор данных и поместите его в текущий рабочий каталог с именем файла «ежедневно минимальной temperatures.csv«».

Заметка: Загруженный файл содержит несколько знаков вопроса («?»), Которые необходимо удалить, прежде чем вы сможете использовать набор данных. Откройте файл в текстовом редакторе и удалите символы «?». Также удалите любую информацию нижнего колонтитула в файле.

Читайте также  Имидж современного руководителя

В приведенном ниже примере будут загружены минимальные дневные температуры и график временных рядов.

Выполнение примера загружает набор данных как серию Pandas и создает линейный график временного ряда.

Корреляция и автокорреляция

Статистическая корреляция суммирует силу взаимосвязи между двумя переменными.

Можно предположить, что распределение каждой переменной соответствует распределению Гаусса (кривая колокола). Если это так, мы можем использовать коэффициент корреляции Пирсона, чтобы суммировать корреляцию между переменными.

Коэффициент корреляции Пирсона представляет собой число от -1 до 1, которое описывает отрицательную или положительную корреляцию соответственно. Нулевое значение указывает на отсутствие корреляции.

Мы можем вычислить корреляцию для наблюдений временного ряда с наблюдениями с предыдущими временными шагами, называемыми лагами. Поскольку корреляция наблюдений временного ряда рассчитывается со значениями того же ряда в предыдущие моменты времени, это называется последовательной корреляцией или автокорреляцией.

График автокорреляции временного ряда по лагу называется токоррекцияСorrelationFUnction, или акроним ACF. Этот график иногда называют коррелограммой или автокорреляционным графиком.

Ниже приведен пример расчета и построения графика автокорреляции для минимальных дневных температур с использованиемplot_acf ()функция из библиотеки statsmodels.

При выполнении примера создается двухмерный график, показывающий значение задержки по оси X и корреляцию по оси Y между -1 и 1.

Доверительные интервалы нарисованы в виде конуса. По умолчанию это 95-процентный доверительный интервал, что позволяет предположить, что значения корреляции вне этого кода, скорее всего, являются корреляцией, а не статистической случайностью.

По умолчанию печатаются все значения запаздывания, что делает график зашумленным.

Мы можем ограничить число лагов по оси X до 50, чтобы сделать график более удобным для чтения.

Функция частичной автокорреляции

Частичная автокорреляция — это сводка взаимосвязи между наблюдением во временном ряду с наблюдениями на предыдущих временных этапах с удалением взаимосвязей между промежуточными наблюдениями.

Частичная автокорреляция при лаге k — это корреляция, возникающая после устранения влияния любых корреляций, связанных с членами с более короткими лагами.

— стр. 81, раздел 4.5.6 Частичные автокорреляции,Вводный временной ряд с R,

Автокорреляция для наблюдения и наблюдения на предыдущем временном шаге состоит из прямой и косвенной корреляций. Эти косвенные корреляции являются линейной функцией корреляции наблюдения с наблюдениями на промежуточных временных шагах.

Именно эти косвенные корреляции стремится устранить частичная автокорреляционная функция. Не вдаваясь в математику, это интуиция для частичной автокорреляции.

В приведенном ниже примере вычисляется и строится график частичной автокорреляционной функции для первых 50 лагов в наборе данных «Минимальные дневные температуры» с использованиемplot_pacf ()из библиотеки statsmodels.

Выполнение примера создает двухмерный график частичной автокорреляции для первых 50 лагов

Интуиция для участков ACF и PACF

Графики функции автокорреляции и функции частичной автокорреляции для временного ряда рассказывают совсем другую историю.

Мы можем использовать интуицию для ACF и PACF выше, чтобы исследовать некоторые мысленные эксперименты.

Авторегрессия Интуиция

Рассмотрим временной ряд, который был сгенерирован процессом авторегрессии (AR) с задержкойК,

Мы знаем, что ACF описывает автокорреляцию между наблюдением и другим наблюдением на предыдущем временном шаге, который включает в себя информацию о прямой и косвенной зависимости.

Это означает, что мы ожидаем, что ACF для временного ряда AR (k) будет сильным с запаздыванием k, и инерция этого отношения продолжится к последующим значениям запаздывания, отступая в некоторой точке, когда эффект будет ослаблен.

Мы знаем, что PACF описывает только прямую связь между наблюдением и его отставанием. Это предполагает, что не будет корреляции для значений запаздывания за пределамиК,

Это точно ожидание графиков ACF и PACF для процесса AR (k).

Скользящая средняя интуиция

Рассмотрим временной ряд, сгенерированный процессом скользящего среднего (MA) с запаздываниемК,

Помните, что процесс скользящего среднего представляет собой модель авторегрессии временных рядов остаточных ошибок из предыдущих прогнозов. Другой способ думать о модели скользящего среднего состоит в том, что она корректирует будущие прогнозы на основе ошибок, допущенных в последних прогнозах.

Мы ожидаем, что ACF для процесса MA (k) покажет сильную корреляцию с недавними значениями вплоть до запаздывания k, затем резкое снижение до низкой или без корреляции. По определению, именно так и был создан процесс.

Что касается PACF, мы ожидаем, что график покажет сильную связь с отставанием и отставание корреляции от отставания и далее.

Опять же, это в точности ожидание графиков ACF и PACF для процесса MA (k).

Дальнейшее чтение

Этот раздел предоставляет некоторые ресурсы для дальнейшего чтения об автокорреляции и частичной автокорреляции для временных рядов.

  • Корреляция и зависимостьв Википедии
  • автокорреляцияв Википедии
  • коррелограммв Википедии
  • Частичная автокорреляционная функцияв Википедии.
  • Раздел 3.2.5 Функция частичной автокорреляции, стр. 64,Анализ временных рядов: прогнозирование и контроль,

Резюме

В этом руководстве вы узнали, как рассчитать графики автокорреляции и частичной автокорреляции для данных временных рядов с помощью Python.

В частности, вы узнали:

  • Как рассчитать и создать автокорреляционный график для данных временных рядов.
  • Как рассчитать и создать график частичной автокорреляции для данных временных рядов.
  • Разница и интуиция для интерпретации графиков ACF и PACF.

У вас есть вопросы по этому уроку?
Задайте свои вопросы в комментариях ниже, и я сделаю все возможное, чтобы ответить.

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: