Расчет акф и ее применение. Автокорреляционная функция и ее применение. Дискретная автокорреляционная функция

Автокорреляционная функция. Коррелограмма.

При наличии во временном ряду тенденции и циклических изменений значения последующего уровня ряда зависят от предыдущих. Зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда.

Количественно ее можно измерить с помощью индекса корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.

Пусть задан временный ряд: у ,у,…у и пусть имеет место линейная корреляция между y t и y t -1 .

Определим коэффициент корреляции между рядами у t и у t -1 .

Для этого воспользуемся следующей формулой:

Пологая x j = у t -1 , y j = у t -1 , получим

(5.1)

Аналогично определяются коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции 2-го порядка характеризует тесноту связи между уровнями у и у и определяется по формуле:

(5.2)

Порядок уровня ряда автокорреляции называют лагом.

Для формулы (5.1) лаг равен единице, для (5.3) –двум.

Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорреляционной функцией временного ряда (АКФ).

График зависимости ее значений от величины лага называется коррелограмой.

АКФ и коррелограмма позволяют определить лаг, при котором автокорреляция наиболее высокая, а, следовательно, и лаг, при котором связь между текущим и предыдущим уровнями ряда наиболее тесная, т.е. с их помощью можно выявить структуру ряда.

Коэффициент автокорреляции и АКФ целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты и циклической компоненты:

­ если наиболее высоким оказался коэффициент автокорреляции 1-го порядка, то исследуемый ряд содержит только тенденцию;

­ если наиболее высоким оказался коэффициент автокорреляции к-го порядка, то ряд содержит циклические колебания с периодичностью в к-моментов времени;

­ если, ни один из коэффициентов не является значимым, то можно сделать одно из двух предположений, относительно структуры этого ряда: либо ряд не содержит тенденции и циклических изменений и имеет структуру, сходную со структурой ряда, изображенного на рис.5.1в, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ.

49. Обобщенная модель регрессии. Обобщенный метод наименьших квадратов. Теорема Айткена

При построении модели, например, линейного вида

У = а + b 1 * x 1 + b 2 * x 2 +… + b p * x p + ε (59.1)

случайная величина  представляет собой ненаблюдаемую величину. Для разных спецификаций модели разности между теоретическими и фактическими значениями могут меняться. В задачу регрессионного анализа входит не только построение самой модели, но и исследование случайных отклонений  i т.е. остаточных величин. После построения уравнения регрессии проводится проверка наличия у оценок  i некоторых свойств. Эти свойства оценок, полученных МНК, имеют очень важное практическое значение в использовании результатов регрессии и корреляции.

Коэффициенты регрессии b­ i , найденные на основе системы нормальных уравнений и представляющие собой выборочные оценки характеристики силы связи, должны обладать свойством несмещености. Несмещенность оценки означает, что математическое ожидание остатков равно нулю.

Это означает, что найденный параметр регрессии b­ i , можно рассматривать как среднее значение возможных значений коэффициентов регрессии с несмещенными оценками остатков.

Для практических целей важны не только несмещенность, но и эффективность оценок. Оценки считаются эффективными,если они характеризуются наименьшей дисперсией.

Для того, чтобы доверительные интервалы параметров регрессии были реальными, необходимо, чтобы оценки были состоятельными. Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки.

Исследования остатков  i предполагают проверку наличия следующих пяти предпосылок МНК:

­ случайный характер остатков;

­ нулевая средняя величина остатков, не зависящая от х i ;

­ гомоскедастичность–дисперсия каждого отклонения  i одинакова для всех значений х;

­ отсутствие автокорреляции остатков. Значения остатков  i распределены независимо друг от друга;

­ остатки подчиняются нормальному распределению.

Если распределение случайных остатков  i не соответствует некоторым предпосылкам МНК, то следует корректировать модель.

Прежде всего, проверяется случайный характер остатков  i .

Если на графике получена горизонтальная полоса распределения остатков, то остатки представляют собой случайные величины и МНК оправдан, теоретические значения у x хорошо аппроксимируют фактические значения у.

Возможны следующие случаи: если  i . зависит от у x то:

­ остатки  i . не случайны

­ остатки  i . не имеют постоянной дисперсии

­ остатки  i . носят систематический характер

В этих случаях необходимо либо применить другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки  i не будут случайными величинами.

Вторая предпосылка означает равенство нулю средней величины остатков:

. (59.2)

В соответствии с третьей предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора х j остатки  i имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность.

50. Доступный обобщенный метод наименьших квадратов

Метод наименьших квадратов. Некоторые более общие типы регрессионных моделей рассмотрены в разделе Основные типы нелинейных моделей. После выбора модели возникает вопрос: каким образом можно оценить эти модели? Если вы знакомы с методами линейной регрессии (описанными в разделе Множественная регрессия) или дисперсионного анализа (описанными в разделе Дисперсионный анализ), то вы знаете, что все эти методы используют оценивание по методу наименьших квадратов. Основной смысл этого метода заключается в минимизации суммы квадратов отклонений наблюдаемых значений зависимой переменной от значений, предсказанных моделью. (Термин наименьшие квадраты впервые был использован в работе Лежандра - Legendre, 1805.)
Метод взвешенных наименьших квадратов. Третьим по распространенности методом, в дополнение к методу наименьших квадратов и использованию для оценивания суммы модулей отклонений (см. выше), является метод взвешенных наименьших квадратов. Обычный метод наименьших квадратов предполагает, что разброс остатков одинаковый при всех значениях независимых переменных. Иными словами, предполагается, что дисперсия ошибки при всех измерениях одинакова. Часто, это предположение не является реалистичным. В частности, отклонения от него встречаются в бизнесе, экономике, приложениях в биологии (отметим, что оценки параметров по методу взвешенных наименьших квадратов могут быть также получены с помощью модуля Множественная регрессия).



Например, вы хотите изучить связь между проектной стоимостью постройки здания и суммой реально потраченных средств. Это может оказаться полезным для получения оценки ожидаемых перерасходов. В этом случае разумно предположить, что абсолютная величина перерасходов (выраженная в долларах) пропорциональна стоимости проекта. Поэтому, для подбора линейной регрессионной модели следует использовать метод взвешенных наименьших квадратов. Функция потерь может быть, например, такой (см. книгу Neter, Wasserman, and Kutner, 1985, стр.168):

Потери = (наблюд.-предск.) 2 * (1/x 2)

В этом уравнении первая часть функции потерь означает стандартную функцию потерь для метода наименьших квадратов (наблюдаемые минус предсказанные в квадрате; т.е., квадрат остатков), а вторая равна “весу” этой потери в каждом конкретном случае - единица деленная на квадрат независимой переменной (x) для каждого наблюдения. В ситуации реального оценивания, программа просуммирует значения функции потерь по всем наблюдениям (например, конструкторским проектам), как описано выше и подберет параметры, минимизирующие сумму. Возвращаясь к рассмотренному примеру, чем больше проект (x), тем меньше для нас значит одна и та же ошибка в предсказании его стоимости. Этот метод дает более устойчивые оценки для параметров регрессии (более подробно, см. Neter, Wasserman, and Kutner. 1985).

51. Тест Чоу

Формальный статистический тест для оценки модели тенденции временного ряда при наличии структурных изменений был предложен Грегори Чоу*. Применение этого теста предполагает расчет параметров уравнений трендов. Введем систему обозначений, приведенную в табл.

Таблица 3 –Условные обозначения для алгоритма теста Чоу

Предположим, гипотеза Н0 утверждает структурную стабильность тенденции изучаемого временного ряда. Остаточную сумму квадратов по кусочно-линейной модели (C кл ост) можно найти как сумму С 1 ост и C 2 ост

C кл ост = С 1 ост + C 2 ост (62.1)

Соответствующее ей число степеней свободы составит:

(n 1 - k 1) + (n 2 – k 2) = n – k 1 - k 2 (62.2)

Тогда сокращение остаточной дисперсии при переходе единого уравнения тренда к кусочно-линейной модели определить следующим образом:

DС ост = C 3 ост - С кл ост (62.3)

Число степеней свободы, соответствующее DС с учетом соотношения (23) составит:

n – k 3 - (n – n 1 – k 2) = k 1 + k 2 - k 3 (62.4)

Затем, в соответствии с Г. Чоу методикой Г. Чоу находится фактическое значение F-критерия по следующим дисперсиям на одну степень свободы вариации:

(62.5)

Найденное значение F факт сравнивают с табличным, (таблица распределения Фишера для уровня значимости α ‚ а и числа степеней свободы (k 1 + k 2 – k 3) и (n - k 1 - k 2)

Если F факт > F табл ‚ то гипотеза о структурной стабильности тенденции отклоняется, а влияние структурных измен на динамику изучаемого показателя признают значимым. В этом случае моделирование тенденции временного ряда следует произвести с помощью кусочно-линейной модели. Если

F факт < F табл то нулевая гипотеза структурной стабильности тенденции не отвергается. Ее моделирование следует осуществлять с помощью единого для всей совокупности уравнения тренда.

Особенности применения теста Чоу.

1. Если число параметров во всех уравнениях из таблицы 3 (1), (2), (3) одинаково и равно k, то формула (56) упрощается:

(62.6)

2. Тест Чоу позволяет сделать вывод о наличии или отсутствии структурной стабильности в изучаемом временном ряде. Если F факт < F табл, то это означает, что уравнения (1) и (2) описывают одну и ту же тенденцию, а различия численных оценок их пара метров а 1 и а 2 , а также b 1 и b 2 соответственно статистически не значимы. Если же F факт > F табл то гипотеза о структурной стабильности отклоняется, что означает статистическую значимость различий в оценках параметров уравнений (1) и (2).

З. Применение теста Чоу предполагает соблюдение предпосылок о нормальном распределении остатков в уравнениях (1) и (2) и независимость их распределений.

Если гипотеза о структурной стабильности тенденции ряда у, отклоняется, дальнейший анализ может заключаться в, исследовании вопроса о причинах этих структурных различий и более де 1 изучении характера изменения тенденции. В принятых обозначениях эти причины обусловливают различия в оценках параметров уравнений (1) и (2).

Возможны следующие сочетания изменений числейных оценок параметров этих уравнений:

Изменение численной оценки свободного члена уравнения Тренда а 2 по сравнению с а 1 при условии, что различия b 1 и b 2 статистически незначимы. Геометрически это означает, что прямые (1) (2) параллельны. Происходит скачкообразное изменение уровня ряда у t , в момент времени t ‚ и неизменном среднем абсолютном приросте за период;

Изменение численной оценки параметра b 2 по сравнению с b 1 при условии, что различия между а 1 и а 2 статистически незначимы. Геометрически это означает, что прямые (1) и (2) пересекают ось координат в одной точке. Изменение тенденции происходит посредством изменение среднего абсолютного прироста временного ряда, начиная с момента времени t ‚ при неизменном начальном уровне ряда в момент времени t =0

Изменение численных оценок параметров а 1 и а 2 , а так же b 1 и b 2 . На графике это отображается изменением начального уровня и счреднего за период абсолютного прироста

Изучая АКФ пачки прямоугольных видеоимпульсов, читатель, безусловно, обратил внимание на то, что соответствующий график имел специфический лепестковый вид. С практической точки зрения, имея в виду использование АКФ для решения задачи обнаружения такого сигнала или измерения его параметров, совершенно несущественно, что отдельные лепестки имеют треугольную форму. Важен лишь их относительный уровень по сравнению с центральным максимумом при .

Наша ближайшая задача - изменить определение автокорреляционной функции таким образом, чтобы можно было извлекать из нее полезную информацию, абстрагируясь от второстепенных подробностей. Основой для этого служит идея математической модели дискретного сигнала (см. гл. 1).

Описание сложных сигналов с дискретной структурой.

Пачка одинаковых прямоугольных видеоимпульсов - простейший представитель класса сложных сигналов, построенных в соответствии со следующим принципом. Весь интервал времени существования сигнала разделен на целое число М > 1 равных промежутков, называемых позициями. На каждой из позиций сигнал может находиться в одном из даух состояний, которым отвечают числа +1 и -1.

Рис. 3.6 поясняет некоторые способы формирования многопозиционного сложного сигнала. Для определенности здесь М = 3.

Видно, что физический облик дискретного сигнала может быть различным.

Рис. 3.6. Трехпозиционный сложный сигнал: а - амплитудное кодирование; б - фазовое кодирование

В случае а символу соответствует положительное значение высоты видеоимпульса, передаваемого на соответствующей позиции; символу -1 отвечает отрицательное значение - . Говорят, что при этом реализовано амплитудное кодирование сложного сигнала. В случае б происходит фазовое кодирование. Для передачи символа +1 на соответствующей позиции генерируется отрезок гармонического сигнала с нулевой начальной фазой. Чтобы отобразить символ -1, используется отрезок синусоиды такой же длительности и с той же частотой, но его фаза получает дополнительный сдвиг на 180°.

Несмотря на различие графиков этих даух сигйалов, между ними, в сущности, можно установить полное тождество с точки зрения их математических моделей. Действительно, модель любого такого сигнала - это последовательность чисел в которой каждый символ принимает одно из даух возможных значений +1. Для удобства договоримся в дальнейшем дополнять такую последовательность нулями на «пустых» позициях, где сигнал не определен. При этом, например, развернутая форма записи дискретного сигнала {1 1, -1, 1} будет иметь вид

Важнейшая операция при обработке дискретных сигналов состоит в сдвиге такого сигнала на некоторое число позиций относительно исходного положения без. изменения его формы. В качестве примера ниже представлен некоторый исходный сигнал (первая строка) и его копии (последующие строки), сдвинутые на 1, 2 и 3 позиции в сторону запаздывания:

Дискретная автокорреляционная функция.

Постараемся так обобщить формулу (3.15), чтобы можно было вычислять дискретный аналог АКФ применительно к многопозиционным сигналам. Ясно, что операцию интегрирования здесь следует заменить суммированием, а вместо переменной использовать целое число (положительное или отрицательное), указывающее, на сколько позиций сдвинута копия относительно исходного сигнала.

Так как в «пустых» позициях математическая модель сигнала содержит нули, запишем дискретную АКФ в виде

Эта функция целочисленного аргумента , естественно, обладает многими уже известными свойствами обычной автокорреляционной функции. Так, легко видеть, что дискретная АКФ четна:

При Пулевом сдвиге эта АКФ определяет энергию дискретного сигнала:

Некоторые примеры.

Для иллюстрации сказанного вычислим дискретную АКФ трехпозиционного сигнала с одинаковыми значениями на каждой позиции: Выпишем этот сигнал вместе с копиями, сдвинутыми на 1, 2 и 3 позиции:

Видно, что уже при сигнал и копия перестают накладываться друг на друга, так что произведения, входящие в формулу (3.29), становятся равными нулю при . Вычисляя суммы, получаем

Боковые лепестки автокорреляционной функции линейно спадают с ростом номера и, подобно тому, как в случае автокорреляционной функции трех аналоговых видеоимпульсов.

Рассмотрим дискретный сигнал, отличающийся от предыдущего знаком отсчета на второй позиции:

Поступая аналогичным образом, вычислим для этого сигнала значения дискретной автокорреляционной функции:

Можно обнаружить, что первый боковой лепесток изменяет свой знак, оставаясь неизменным по абсолютному значению.

Наконец, рассмотрим трехпозиционный дискретный сигнал с математической моделью вида

Его автокорреляционная функция такова:

Из трех изученных здесь дискретных сигналов именно третий наиболее совершенен с точки зрения корреляционных свойств, поскольку при этом реализуется наименьший уровень боковых лепестков автокорреляционной функции.

Сигналы Баркера.

Дискретные сигналы с наилучшей структурой автокорреляционной функции явились в 50-60-е годы объектом интенсивных исследований специалистов в области теоретической радиотехники и прикладной математики. Были найдены целые классы сигналов с совершенными корреляционными свойствами. Среди них большую известность получили так называемые сигналы (коды) Баркера. Эти сигналы обладают уникальным свойством: независимо от числа позиции М значения их автокорреляционных функций, вычисляемые по формуле (3.29), при всех не превышают единицы. В то же время энергия этих сигналов, т. е. величина численно равна М.

Сигналы Баркера удается реализовать лишь при числе позиций М = 2, 3, 4, 5, 7, 11 и 13. Случай является тривиальным. Сигнал Баркера при был исследован нами в конце предыдущего пункта. Математические модели сигналов Баркера и отвечающие им автокорреляционные функции приведены в табл. 3.2.

Таблица 3.2 Модели сигналов Баркера

Для иллюстрации на рис. 3.7 приведен вид наиболее часто используемого 13-позиционного сигнала Баркера при даух способах кодирования, а также графическое представление его АКФ.

Рис. 3.7. Сигнал Баркера при М = 13: а - амплитудное кодирование; б - фазовое кодирование; в - автокорреляционная функция

Отметим в заключение, что исследование некоторых свойств дискретных сигналов и их автокорреляционных функций, проведенное в данной главе, имеет предварительный, вводный характер. Систематическое изучение этого круга вопросов будет предпринято в гл. 15.

Периодическая зависимость представляет собой общий тип компонент временного ряда. Можно легко видеть, что каждое наблюдение очень похоже на соседнее; дополнительно, имеется повторяющаяся периодическая составляющая, это означает, что каждое наблюдение также похоже на наблюдение, имевшееся в том же самое время период назад. В общем, периодическая зависимость может быть формально определена как корреляционная зависимость порядка k между каждым i-м элементом ряда и (i-k)-м элементом. Ее можно измерить с помощью автокорреляции (т.е. корреляции между самими членами ряда); k обычно называют лагом (иногда используют эквивалентные термины: сдвиг, запаздывание). Если ошибка измерения не слишком большая, то периодичность можно определить визуально, рассматривая поведение членов ряда через каждые k временных единиц .

Периодические составляющие временного ряда могут быть найдены с помощью коррелограммы. Коррелограмма (автокоррелограмма) показывает численно и графически автокорреляционную функцию (AКФ), иными словами коэффициенты автокорреляции для последовательности лагов из определенного диапазона. На коррелограмме обычно отмечается диапазон в размере двух стандартных ошибок на каждом лаге, однако обычно величина автокорреляции более интересна, чем ее надежность, потому что интерес в основном представляют очень сильные автокорреляции .

При изучении коррелограмм следует помнить, что автокорреляции последовательных лагов формально зависимы между собой. Рассмотрим следующий пример. Если первый член ряда тесно связан со вторым, а второй с третьим, то первый элемент должен также каким-то образом зависеть от третьего и т.д. Это приводит к тому, что периодическая зависимость может существенно измениться после удаления автокорреляций первого порядка, (т.е. после взятия разности с лагом 1).

Цель работы:

1. Дать основные теоретические сведения

2. Дать примеры расчета АКФ

Глава 1. Теоретические сведения

Коэффициент автокорреляции и его оценка

Для полной характеристики случайного процесса недостаточно его математического ожидания и дисперсии. Еще в 1927 г. Е.Е.Слуцкий ввел для зависимых наблюдений понятие «связанного ряда»: вероятность возникновения на определенном месте тех или иных конкретных значений зависит от того, какие значения случайная величина уже получила раньше или будет получать позже. Иными словами, существует поле рассеяния пар значений x(t), x(t+k) временного ряда, где k - постоянный интервал или задержка, характеризующее взаимозависимость последующих реализаций процесса от предыдущих. Теснота этой взаимосвязи оценивается коэффициентами автоковариации –

g (k) = E[(x(t) - m)(x(t + k) - m)] –

и автокорреляции

r (k) = E[(x(t) - m)(x(t + k) - m)] / D ,

где m и D - математическое ожидание и дисперсия случайного процесса. Для расчета автоковариации и автокорреляции реальных процессов необходима информация о совместном распределении вероятностей уровней ряда p(x(t 1),x(t 2)). Однако для стационарных процессов, находящихся в определенном статистическом равновесии, это распределение вероятностей одинаково для всех времен t 1 , t 2 , разделенных одним и тем же интервалом. Поскольку дисперсия стационарного процесса в любой момент времени (как в t, так и в t + k) равна D = g (0), то автокорреляция с задержкой k может быть выражена как

r (k) = g (k) /g (0),

откуда вытекает, что r (0) = 1. В тех же условиях стационарности коэффициент корреляции r (k) между двумя значениями временного ряда зависит лишь от величины временного интервала k и не зависит от самих моментов наблюдений t.

В статистике имеется несколько выборочных оценок теоретических значений автокорреляции r (k) процесса по конечному временному ряду из n наблюдений. Наиболее популярной оценкой является нециклический коэффициент автокорреляции с задержкой k (Андерсон, 1976; Вайну, 1977):

Наиболее важным из различных коэффициентов автокорреляции является первый - r 1 , измеряющий тесноту связи между уровнями x(1), x(2) ,..., x(n -1) и x(2), x(3), ..., x(n).

Распределение коэффициентов автокорреляции неизвестно, позтому для оценки их достоверности иногда используют непараметрическую теорию Андерсона (1976), предложившего статистику

t = r 1 (n -1) 0.5 ,

которая при достаточно большой выборке распределена нормально, имеет нулевую среднюю и дисперсию, равную единице (Тинтнер, 1965).

Автокорреляционные функции

Последовательность коэффициентов корреляции r k , где k = 1, 2, ..., n, как функция интервала k между наблюдениями называется автокорреляционной функцией (АКФ).

Вид выборочной автокорреляционной функции тесно связан со структурой ряда.

· Автокорреляционная функция r k для «белого шума», при k >0, также образует стационарный временной ряд со средним значением 0.

· Для стационарного ряда АКФ быстро убывает с ростом k. При наличии отчетливого тренда автокорреляционная функция приобретает характерный вид очень медленно спадающей кривой .

· В случае выраженной сезонности в графике АКФ также присутствуют выбросы для запаздываний, кратных периоду сезонности, но эти выбросы могут быть завуалированы присутствием тренда или большой дисперсией случайной компоненты.

Рассмотрим примеры автокорреляционной функции:

· на рис. 1 представлен график АКФ, характеризующегося умеренным трендом и неясно выраженной сезонностью;

· рис. 2 демонстрирует АКФ ряда, характеризующегося феноменальной сезонной детерминантой;

· практически незатухающий график АКФ ряда (рис. 3) свидетельствует о наличии отчетливого тренда.

В общем случае можно предполагать, что в рядах, состоящих из отклонений от тренда, автокорреляции нет. Например, на рис. 4 представлен график АКФ для остатков, полученных от сглаживания ряда, очень напоминающий процесс «белого шума». Однако нередки случаи, когда остатки (случайная компонента h) могут оказаться автокоррелированными, например, по следующим причинам :

· в детерминированных или стохастических моделях динамики не учтен существенный фактор

· в модели не учтено несколько несущественных факторов, взаимное влияние которых оказывается существенным вследствие совпадения фаз и направлений их изменения;

· выбран неправильный тип модели (нарушен принцип контринтуитивности);

· случайная компонента имеет специфическую структуру.

Критерий Дарбина-Уотсона

Критерий Дарбина-Уотсона (Durbin, 1969) представляет собой распространенную статистику, предназначенную для тестирования наличия автокорреляции остатков первого порядка после сглаживания ряда или в регрессионных моделях.

Численное значение коэффициента равно

d = [(e(2)-e(1)) 2 + ... + (e(n)-e(n -1)) 2 ]/,

где e(t) - остатки.

Возможные значения критерия находятся в интервале от 0 до 4, причем табулированы его табличные пороговые значения для разных уровней значимости (Лизер, 1971).

Значение d близко к величине 2*(1 - r 1), где r - выборочный коэффициент автокорреляции для остатков. Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения соответствуют положительной автокорреляции остатков, большие – отрицательной .

Например, после сглаживания ряда ряд остатков имеет критерий d = 1.912. Аналогичная статистика после сглаживания ряда - d = 1.638 - свидетельствует о некоторой автокоррелированности остатков.

Глава 2. Примеры практических расчетов с помощью макроса Excel «Автокорреляционная функция»

Все данные взяты с сайта http://e3.prime-tass.ru/macro/

Пример 1. ВВП РФ

Приведем данные о ВВП РФ

первая разность

Исследуем ряд

На диаграммах показаны: исходный ряд (сверху) и автокорреляционная функция до лага 9 (снизу). На нижней диаграмме штриховой линией обозначен уровень «белого шума» - граница статистической значимости коэффициентов корреляции. Видно, что имеется сильная корреляция 1 и 2 порядка, соседних членов ряда, но и удаленных на 1 единицу времени друг от друга. Корреляционные коэффициенты значительно превышают уровень «белого шума». По графику автокорреляции видим наличие четкого тренда.

Ниже даны значения автокорреляционной функции и уровня белого шума

Ошибка АКФ

Если нас интересует внутренняя динамика ряда необходимо найти первую разность его членов, т.е. для каждого квартала найти изменение значения по сравнению с предыдущим кварталом. Для первой разности построим автокорреляционную функцию.

Пример 2. Импорт

значение

разность

Построим автокорреляционную функцию

Ошибка АКФ

Видим, что есть автокорреляция 1-го и 2-го порядков. График показывает наличие тренда. Положительная автокорреляция объясняется неправильно выбранной спецификацией, т.к. линейный тренд тут непригоден, он скорее экспоненциальный. Поэтому сделаем ряд стационарным, взяв первую разность.

Ошибка АКФ

Видим наличие автокорреляции 4-го порядка, что соответствует корреляции данных, отдаленных на год. Автокорреляцию первого порядка не имеем.

Статистика Дарбина-Ватсона (DW) =2,023

Пример 3. Экспорт

Приведем данные

значение

разность


Для исходного ряда имеем:

Ошибка АКФ

Очевидно наличие четкого тренда, значимыми являются коэффициенты автокорреляции 1-го и 2-го порядков. Для первой разности

Ошибка АКФ

Автокорреляции уже не видим, остатки распределены как «белый шум».

Заключение

Другой полезный метод исследования периодичности состоит в исследовании частной автокорреляционной функции (ЧАКФ), представляющей собой углубление понятия обычной автокорреляционной функции. В ЧАКФ устраняется зависимость между промежуточными наблюдениями (наблюдениями внутри лага). Другими словами, частная автокорреляция на данном лаге аналогична обычной автокорреляции, за исключением того, что при вычислении из нее удаляется влияние автокорреляций с меньшими лагами. На лаге 1 (когда нет промежуточных элементов внутри лага), частная автокорреляция равна, очевидно, обычной автокорреляции. На самом деле, частная автокорреляция дает более "чистую" картину периодических зависимостей.

Как отмечалось выше, периодическая составляющая для данного лага k может быть удалена взятием разности соответствующего порядка. Это означает, что из каждого i-го элемента ряда вычитается (i-k)-й элемент. Имеются два довода в пользу таких преобразований. Во-первых, таким образом можно определить скрытые периодические составляющие ряда. Напомним, что автокорреляции на последовательных лагах зависимы. Поэтому удаление некоторых автокорреляций изменит другие автокорреляции, которые, возможно, подавляли их, и сделает некоторые другие сезонные составляющие более заметными. Во-вторых, удаление периодических составляющих делает ряд стационарным, что необходимо для применения некоторых методов анализа.

Литература

1. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 1977.

2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. М.: Высшая школа, 1997.

3. Калинина В.Н., Панкин В.Ф. Математическая статистика. М.: Высшая школа, 1994.

4. Мацкевич И.П., Свирид Г.П., Булдык Г.М. Сборник задач и упражнений по высшей математике (Теория вероятностей и математическая статистика). Минск: Вышейша школа, 1996.

5. Тимофеева Л.К., Суханова Е.И., Сафиулин Г.Г. Сборник задач по теории вероятностей и математической статистике / Самарск. экон. ин-т. Самара, 1992.

6. Тимофеева Л.К., Суханова Е.И., Сафиулин Г.Г. Теория вероятностей и математическая статистика / Самарск. гос. экон. акад. Самара, 1994.

7. Тимофеева Л.К., Суханова Е.И. Математика для экономистов. Сборник задач по теории вероятностей и математической статистике. –М.: УМиИЦ «Учебная литература», 1998.


А, следовательно, высоко значимые

Коэффициент автокорреляции может быть оценен и для нестационарного ряда, но в этом случае его вероятностная интерпретация теряется.

Фактически, нарушен принцип омнипотентности

Задача корреляционного анализа возникла из радиолокации, когда нужно было сравнить одинаковые сигналы, смещённые во времени.

Для количественного определения степени отличия сигнала и его смещённой во времени копии
принято вводить автокорреляционную функцию (АКФ) сигнала равную скалярному произведению сигнала и его сдвинутой копии.

(4.1)

Свойства АКФ

1) При
автокорреляционная функция становится равной энергии сигнала:

(4.2)

2) АКФ – функция чётная

(4.3)

3) Важное свойство автокорреляционной функции состоит в следующем: при любом значении временного сдвига модуль АКФ не превосходит энергии сигнала:

4) Обычно, АКФ представляется симметричной линей с центральным максимумом, который всегда положителен. При этом в зависимости от вида сигнала автокорреляционная функция может иметь как монотонно убывающей, так и колеблющийся характер.

Существует тесная связь между АКФ и энергетическим спектром сигнала.

В соответствии с формулой (4.1) АКФ есть скалярное произведение
. Здесь символомобозначена смещённая во времени копия сигнала
.

Обратившись к теореме Планшереля – можно записать равенство:

(4.4) Таким образом, приходим к результату

(4.5)

Квадрат модуля спектральной плотности представляет собой энергетический спектр сигнала. Итак энергетический спектр и автокорреляционная функция связаны парой преобразований Фурье.

Ясно, что имеется и обратное соотношение

(4.6)

Эти результаты принципиально важны по двум причинам: во-первых, оказывается возможным оценивать корреляционные свойства сигналов, исходя из распределения их энергии по спектру. Во-вторых, формулы (4.5), (4.6) указывают путь экспериментального определения энергетического спектра. Часто удобнее вначале получить АКФ, а затем, используя преобразование Фурье, найти энергетический спектр сигнала. Такой приём получил распространение при исследовании свойств сигналов с помощью быстродействующих ЭВМ в реальном масштабе времени.

Часто вводят удобный числовой параметр – интервал корреляции , представляющий собой оценку ширины основного лепестка АКФ.

9.. Взаимокорреляционная функция и ее свойства. Связь взаимокорреляционной функции и взаимного энергетического спектра.

Взаимокорреляционная функция двух сигналов

Взаимокорреляционной функцией (ВКФ) двух вещественных сигналов и называется скалярное произведение вида:

(4.8)

ВКФ служит мерой «устойчивости» ортогонального состояния при сдвигах сигналов во времени.

При прохождении этих сигналов через различные устройства возможно, что сигнал будет сдвинут относительно сигнала на некоторое время .

Свойства ВКФ.

1) В отличие от АКФ одиночного сигнала, ВКФ, описывающая свойства системы двух независимых сигналов, не является чётной функцией аргумента :

(4.9)

2) Если рассматриваемые сигналы имеют конечные энергии, то их ВКФ ограничена.

3) При
значения ВКФ вовсе не обязаны достигать максимума.

Примером ВКФ может служить взаимокорреляционная функция прямоугольного и треугольного видеоимпульсов.

На основании теоремы Планшереля

получаем

(4.11)

Таким образом, взаимокорреляционная функция и взаимный энергетический спектр связаны между собой парой преобразований Фурье.

Периодическая зависимость представляет собой общий тип компонент временного ряда. Можно легко видеть, что каждое наблюдение очень похоже на соседнее; дополнительно, имеется повторяющаяся периодическая составляющая, это означает, что каждое наблюдение также похоже на наблюдение, имевшееся в том же самое время период назад. В общем, периодическая зависимость может быть формально определена как корреляционная зависимость порядка k между каждым i-м элементом ряда и (i-k)-м элементом. Ее можно измерить с помощью автокорреляции (т.е. корреляции между самими членами ряда); k обычно называют лагом (иногда используют эквивалентные термины: сдвиг, запаздывание). Если ошибка измерения не слишком большая, то периодичность можно определить визуально, рассматривая поведение членов ряда через каждые k временных единиц .

Периодические составляющие временного ряда могут быть найдены с помощью коррелограммы. Коррелограмма (автокоррелограмма) показывает численно и графически автокорреляционную функцию (AКФ), иными словами коэффициенты автокорреляции для последовательности лагов из определенного диапазона. На коррелограмме обычно отмечается диапазон в размере двух стандартных ошибок на каждом лаге, однако обычно величина автокорреляции более интересна, чем ее надежность, потому что интерес в основном представляют очень сильные автокорреляции .

При изучении коррелограмм следует помнить, что автокорреляции последовательных лагов формально зависимы между собой. Рассмотрим следующий пример. Если первый член ряда тесно связан со вторым, а второй с третьим, то первый элемент должен также каким-то образом зависеть от третьего и т.д. Это приводит к тому, что периодическая зависимость может существенно измениться после удаления автокорреляций первого порядка, (т.е. после взятия разности с лагом 1).

Цель работы:

1. Дать основные теоретические сведения

2. Дать примеры расчета АКФ

Глава 1. Теоретические сведения

Коэффициент автокорреляции и его оценка

Для полной характеристики случайного процесса недостаточно его математического ожидания и дисперсии. Еще в 1927 г. Е.Е.Слуцкий ввел для зависимых наблюдений понятие «связанного ряда»: вероятность возникновения на определенном месте тех или иных конкретных значений зависит от того, какие значения случайная величина уже получила раньше или будет получать позже. Иными словами, существует поле рассеяния пар значений x(t), x(t+k) временного ряда, где k - постоянный интервал или задержка, характеризующее взаимозависимость последующих реализаций процесса от предыдущих. Теснота этой взаимосвязи оценивается коэффициентами автоковариации –

g (k) = E[(x(t) - m)(x(t + k) - m)] –

и автокорреляции

r (k) = E[(x(t) - m)(x(t + k) - m)] / D ,

где m и D - математическое ожидание и дисперсия случайного процесса. Для расчета автоковариации и автокорреляции реальных процессов необходима информация о совместном распределении вероятностей уровней ряда p(x(t 1),x(t 2)). Однако для стационарных процессов, находящихся в определенном статистическом равновесии, это распределение вероятностей одинаково для всех времен t 1 , t 2 , разделенных одним и тем же интервалом. Поскольку дисперсия стационарного процесса в любой момент времени (как в t, так и в t + k) равна D = g (0), то автокорреляция с задержкой k может быть выражена как

r (k) = g (k) /g (0),

откуда вытекает, что r (0) = 1. В тех же условиях стационарности коэффициент корреляции r (k) между двумя значениями временного ряда зависит лишь от величины временного интервала k и не зависит от самих моментов наблюдений t.

В статистике имеется несколько выборочных оценок теоретических значений автокорреляции r (k) процесса по конечному временному ряду из n наблюдений. Наиболее популярной оценкой является нециклический коэффициент автокорреляции с задержкой k (Андерсон, 1976; Вайну, 1977):

Наиболее важным из различных коэффициентов автокорреляции является первый - r 1 , измеряющий тесноту связи между уровнями x(1), x(2) ,..., x(n -1) и x(2), x(3), ..., x(n).

Распределение коэффициентов автокорреляции неизвестно, позтому для оценки их достоверности иногда используют непараметрическую теорию Андерсона (1976), предложившего статистику

t = r 1 (n -1) 0.5 ,

которая при достаточно большой выборке распределена нормально, имеет нулевую среднюю и дисперсию, равную единице (Тинтнер, 1965).

Автокорреляционные функции

Последовательность коэффициентов корреляции r k , где k = 1, 2, ..., n, как функция интервала k между наблюдениями называется автокорреляционной функцией (АКФ).

Вид выборочной автокорреляционной функции тесно связан со структурой ряда.

· Автокорреляционная функция r k для «белого шума», при k >0, также образует стационарный временной ряд со средним значением 0.

· Для стационарного ряда АКФ быстро убывает с ростом k. При наличии отчетливого тренда автокорреляционная функция приобретает характерный вид очень медленно спадающей кривой .

· В случае выраженной сезонности в графике АКФ также присутствуют выбросы для запаздываний, кратных периоду сезонности, но эти выбросы могут быть завуалированы присутствием тренда или большой дисперсией случайной компоненты.

Рассмотрим примеры автокорреляционной функции:

· на рис. 1 представлен график АКФ, характеризующегося умеренным трендом и неясно выраженной сезонностью;

· рис. 2 демонстрирует АКФ ряда, характеризующегося феноменальной сезонной детерминантой;

· практически незатухающий график АКФ ряда (рис. 3) свидетельствует о наличии отчетливого тренда.




В общем случае можно предполагать, что в рядах, состоящих из отклонений от тренда, автокорреляции нет. Например, на рис. 4 представлен график АКФ для остатков, полученных от сглаживания ряда, очень напоминающий процесс «белого шума». Однако нередки случаи, когда остатки (случайная компонента h) могут оказаться автокоррелированными, например, по следующим причинам :

· в детерминированных или стохастических моделях динамики не учтен существенный фактор

· в модели не учтено несколько несущественных факторов, взаимное влияние которых оказывается существенным вследствие совпадения фаз и направлений их изменения;

· выбран неправильный тип модели (нарушен принцип контринтуитивности);

· случайная компонента имеет специфическую структуру.


Критерий Дарбина-Уотсона

Критерий Дарбина-Уотсона (Durbin, 1969) представляет собой распространенную статистику, предназначенную для тестирования наличия автокорреляции остатков первого порядка после сглаживания ряда или в регрессионных моделях.

Численное значение коэффициента равно

d = [(e(2)-e(1)) 2 + ... + (e(n)-e(n -1)) 2 ]/,

где e(t) - остатки.

Возможные значения критерия находятся в интервале от 0 до 4, причем табулированы его табличные пороговые значения для разных уровней значимости (Лизер, 1971).

Значение d близко к величине 2*(1 - r 1), где r - выборочный коэффициент автокорреляции для остатков. Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения соответствуют положительной автокорреляции остатков, большие – отрицательной .

Например, после сглаживания ряда ряд остатков имеет критерий d = 1.912. Аналогичная статистика после сглаживания ряда - d = 1.638 - свидетельствует о некоторой автокоррелированности остатков.

Глава 2. Примеры практических расчетов с помощью макроса Excel «Автокорреляционная функция»

Все данные взяты с сайта http://e3.prime-tass.ru/macro/

Пример 1. ВВП РФ

Приведем данные о ВВП РФ

Год квартал ВВП первая разность
2001 I 1900,9
II 2105,0 204,1
III 2487,9 382,9
IV 2449,8 -38,1
2002 I 2259,5 -190,3
II 2525,7 266,2
III 3009,2 483,5
IV 3023,1 13,9
2003 I 2850,7 -172,4
II 3107,8 257,1
III 3629,8 522,0
IV 3655,0 25,2
2004 I 3516,8 -138,2
II 3969,8 453,0
III 4615,2 645,4
IV 4946,4 331,2
2005 I 4479,2 -467,2
II 5172,9 693,7
III 5871,7 698,8
IV 6096,2 224,5
2006 I 5661,8 -434,4
II 6325,8 664,0
III 7248,1 922,3
IV 7545,4 297,3
2007 I 6566,2 -979,2
II 7647,5 1081,3