Построить матрицу парных коэффициентов корреляции в excel. Построим матрицу коэффициентов парной корреляции. Порядок выполнения работы

При наличии тенденции в ряде динамики уровни ряда характеризуются автокорреляцией, т.е. каждый последующий уровень ряда зависит от предыдущего. Например, цена на товар сегодня, как правило, зависит от цены вчерашнего дня. Корреляционная связь между последовательными значениями уровней динамического ряда называется автокорреляцией уровней динамического ряда .

Для измерения автокорреляции уровней динамического ряда используется коэффициент автокорреляции уровней

где у, – фактические уровни динамического ряда; у с_ Т – уровни того же динамического ряда, но сдвинутые на τ шагов во времени; τ – величина лага (сдвига во времени), принимающая значения 1,2, 3,.... и определяющая порядок коэффициента автокорреляции.

При τ = 1 рассчитывается коэффициент автокорреляции первого порядка, т.е. измеряется корреляция текущих значений уровней динамического ряда уг с предшествующими уровнями уг_г.

При τ = 2 изучается зависимость текущих уровней ряда у, с уровнями этого же ряда, сдвинутыми на 2 временных шага у ,_2, т.е. рассчитывается коэффициент автокорреляции второго порядка, а при х = 3 – соответственно третьего порядка, при X = к – коэффициент автокорреляции к-го порядка. Чем длиннее динамический ряд, тем выше может быть порядок коэффициента автокорреляции уровней.

Коэффициент автокорреляции уровней ряда практически рассчитывается по формуле линейного коэффициента корреляции. Поэтому его величина изменяется в пределах от -1 до +1. Чем ближе его величина , тем сильнее зависимость текущих уровней динамического ряда от предыдущих.

Если ряд характеризуется четко выраженной тенденцией, то для него коэффициент автокорреляции первого порядка приближается к +1. Так, для рассмотренного ранее ряда динамики заработной платы работника коэффициент автокорреляции уровней первого порядка составил 0,9987, демонстрируя тесную связь последующих уровней ряда от предыдущих.

Поскольку в примере рассчитывается коэффициент автокорреляции первого порядка, т.е. когда τ = 1, формула его расчета приобретает вид

(5.2)

где у, – уровни ряда в момент времени f; yf_j – те же уровни ряда, но сдвинутые на год, т.е.уровни ряда в момент времени (t – 1) (предыдущий год).

Так как оба ряда (у, иум) для расчета коэффициента автокорреляции должны быть одинаковой длины, то первое значение по ряду уг в расчетах не участвует. По нашему примеру необходимые суммы для подсчета отдельных элементов формулы коэффициента автокорреляции уровней составили

Соответственно коэффициент автокорреляции уровней составит

Методика расчета коэффициентов автокорреляции более высоких порядков та же, но при этом число коррелируемых пар уменьшается. В нашем примере их восемь (ct = 2 по t = 9). Если же увеличим лаг до 2 лет, т.е. τ = 2, то останется семь коррелируемых пар (с t = 3 по ί = 9), при τ = 3 будет шесть коррелируемых пар (с t = 4 по t = 9). Ввиду уменьшения числа наблюдений при расчете коэффициента автокорреляции уровней, увеличение величины лага не беспредельно: принято считать, что максимальная величина лага должна быть не более чем п / 4 (n – длина динамического ряда). Для нашего примера при л = = 9 максимальная величина лага составит 2 года (τ = 2).

Для расчета коэффициента автокорреляции второго порядка составим таблицу.

Таблица 5.1. Расчет коэффициента автокорреляции уровней второго порядка (для ряда динамики заработной платы работника)

y t – 2

y t y t – 2

* Подсчитано без первых двух строк

Так как теперь в расчете участвует семь коррелируемых пар и , то первые две строки табл. 5.1 не принимаются во внимание. Коэффициенты автокорреляции разных порядков принято обозначать где указывает на номер порядка коэффициента автокорреляции. Формула расчета коэффициента автокорреляции второго порядка следующая:

где

Соответственно коэффициент автокорреляции равен

В рассмотренном примере уровни динамического ряда имеют тенденцию к возрастанию, и коэффициенты автокорреляции приближаются к +1. Аналогичная картина будет наблюдаться и при тенденции к уменьшению уровней динамического ряда. Например, лесовосстановление в России за 1995–2002 гг. характеризуется тенденцией к снижению. Уровни ряда (в тыс. га) составили:

Коэффициенты автокорреляции первого и второго порядков оказались равными η = 0,812 и г2 =0,885, что подтверждает наличие тенденции в ряду динамики. При этом г, > 0 и г2 > 0, хотя ряд и имеет тенденцию к снижению. Чем тенденция по ряду динамики более четкая, тем ближе г, и г2 к +1.

Для стационарного динамического ряда с небольшими колебаниями уровней, гг достаточно близок к нулю и может принимать небольшое отрицательное значение. Так, предположим, что уровни ряда приняли следующие значения (последовательно во времени):

Коэффициент автокорреляции первого порядка составил -0,209, а коэффициент автокорреляции второго порядка составил 0,056.

Серию коэффициентов автокорреляции уровней ряда с последовательным увеличением величины лага принято называть автокорреляционной функцией (АКФ).

Для стационарного временного ряда с увеличением величины лага взаимосвязь у с и y,_t ослабевает и АКФ характеризуется монотонным убыванием, что графически должно представлять затухающую кривую (рис. 5.7).

По стационарному ряду АКФ оценивается исходя из формулы коэффициента автокорреляции

(5.3)

где n – длина временного ряда; τ –временной сдвиг; – средняя арифметическая по исходному ряду .

В нашем примере АКФ для стационарного ряда составила: г, = -0,209; г 2 = 0,056; г3 = -0,114; г4 – -0,356; г5 = 0,057; г6 = -0,074; г7 = -0,003. Однако при ограниченной длине динамического ряда поведение АКФ в виде рис. 5.7 не всегда соблюдается.

АКФ дает представление о внутренней структуре динамического ряда. С помощью АКФ можно определить наличие или отсутствие в ряду динамики периодических колебаний и соответственно величину периода колебаний: она равна той величине лага τ, при которой коэффициент автокорреляции уровней наибольший.

Предположим, что объем продаж товара за 18 мес. характеризуют следующим образом (рис. 5.8).

График показывает наличие тенденции, а также периодических колебаний. Это подтверждает и АКФ:

Рис. 5.7.

Рис. 5.8

Достаточно высокое значение коэффициента автокорреляции первого порядка (Г] = 0,863) означает наличие тенденции в ряде динамики. Вместе с тем максимальное значение коэффициента автокорреляции наблюдается при лаге 3 и кратном ему лаге 6, т.е. для ряда характерна регулярная колеблемость уровней через 3 мес.: подъем в течение 3 мес. сменяется спадом в следующий месяц. Иными словами, волнообразное изменение объема продаж повторяется через 3 мес., что и демонстрирует АКФ. Для динамического ряда с монотонной тенденцией к возрастанию (или уменьшению) уровней АКФ имеет значения, близкие к +1, которые медленно снижаются с возрастанием величины лага. Например, за 60 кварталов динамика объема продаж характеризовалась уравнением тренда

где у – объем продаж в тыс. руб.;

Коэффициент детерминации для него составил 0,973, характеризуя хорошее качество описания тенденции ряда: отклонения фактических уровней ряда от теоретических, обусловленных тенденцией, составляют всего 2,7%. АКФ для данного ряда оказалась следующей: rj = 0,991; г2 = 0,984; г3 = 0,980; г4 = = 0,979; г5 = 0,973; г6 = 0,968; г7 = 0,963; г8 = 0,965; г9 = 0,963; гю = 0,962; ги = 0,959; г12 = 0,957; г13 = 0,952; г14 = 0,955; г15 = 0,943.

Если ряд характеризуется сменой тенденций, то АКФ примет значения, стремительно уменьшающиеся с возрастанием величины лага, сопровождаемые иногда сменой знака коэффициента автокорреляции. Так, например динамический ряд описывается параболой второго порядка (рис. 5.9).

АКФ оказывается следующей:

Рис. 5.9.

Похожая ситуация имеет место, например, при анализе динамики числа раненых в ДТП (на 100 тыс. человек населения) за 1999–2008 гг. по Тюменской области. Тенденция описывается параболой видау = 80,537 + 45,756t- 3,5053г2. Коэффициенты автокорреляции уровней с увеличением величины лага составили: 0,831; 0,588; 0,179; -0,544.

Иными словами, знание АКФ может помочь при подборе модели рассматриваемого динамического ряда.

После расчетов необходимо определить на каком лаге коэффициент будет максимальным (как правило, это первый лаг) и оценить его значимость. Предпосылкой для решения данной задачи является возможность проявления ошибки репрезентативности при анализе выборочных данных. Проверяется статистическая гипотеза: генеральный коэффициент автокорреляции равен нулю (следовательно, полученное значение выборочного коэффициента автокорреляции является следствием проявление случайной ошибки репрезентативности). Альтернативная гипотеза: генеральный коэффициент автокорреляции отличен от нуля (следовательно, полученное значение выборочного коэффициента автокорреляции может рассматриваться как оценка неизвестного генерального коэффициента автокорреляции по выборочным данным). Гипотезы проверяются через расчет t-критерия Стьюдента и сравнение расчетного значения с теоретическим.

Где r – коэффициент автокорреляции, σ r стандартная ошибка коэффициента автокорреляции.

Ошибка рассчитывается следующим образом:

Где n – число уровней ряда

Теоретическое значение критерия Стьюдента при уровне значимости 0,05 и числе степеней свобод 12 равно 2,17

Расчетное значение критерия превосходит теоретическое (16,69 против 2,17), следовательно коэффициент автокорреляции на первом лаге признается значимым.

Наличие высокой автокорреляции в сочетании со значимостью коэффициента дает нам возможность рассмотреть регрессионную модель вида

(один из видов модели регрессии). Такая модель называется авторегрессией и позволяет решать задачу экстраполяции и прогнозирования.

Практика показывает, что часто в отклонениях от тренда сохраняется автокорреляция. Прежде чем приступить к расчету коэффициента корреляции по остаткам, необходимо проверить наличие в них автокорреляции. Проверяемая статистическая гипотеза (H0:) формулируется следующим образом:

H0: автокорреляция в анализируемом динамическом ряду отсутствует.

Наиболее распространенным статистическим критерием оценки автокорреляции в отклонениях от тренда, является критерий Дарбина – Уотсона (d0 ), статистика критерия определяется по следующей формуле:

,

где случайные отклонения от тренда .

Значение критерия изменяется в интервале от «0» до «4». При 0 < d < 2 - автокорреляция положительная,

если 2 < d < 4 – автокорреляция отрицательная.

Близость величины критерия к «2» говорит об отсутствии или несущественной автокорреляции. Оценки, получаемые по критерию «d», являются интервальными. Существуют таблицы распределения значений критерия Дарбина – Уотсона, составленные для различных уровней значимости. Таблицы составлены с учетом числа наблюдений в динамическом ряду и числа переменных в уравнении тренда.

По таблице в каждом конкретном случае находят нижнюю ( ) и верхнюю ( ) границы критерия. Результат сравнения расчетного значения с табличным интерпретируется следующим образом:

1. > , - H0 - принимается;

2. < , - H0 - отвергается;

3. , необходимо дальнейшее исследование (например, по более протяженному временному ряду).

Для проверки остатков на наличие автокорреляции можно просто рассчитать коэффициенты автокорреляции по остаткам. Данная задача решается аналогично задаче оценки автокорреляции динамических рядов. Единственное отличие: исходные данные в этом случае – это остатки по оптимальному тренду (берутся из отчетов)

Отсутствие автокорреляции в остатках определяется по величине коэффициента (меньше 0,5 – автокорреляция отсутствует). Решение данной задачи дополнительно подтверждает качество выбора тренда.

Кросс-корреляция динамических рядов – это корреляционная зависимость между динамическими рядами с заданным временным смещением (лагом). Внимание! Расчет коэффициентов кросс-корреляции проводится по остаткам с оптимальных трендов по динамическим рядам. Необходимость исключения трендовой составляющей динамического ряда объясняется тем, что при коррелировании уровней однонаправленных рядов значительно искажаются (завышаются результаты расчетов).

Остатки по двум динамическим рядам берутся из отчетов по оптимальным трендам.

Смещение (лаг) задается по аналогии с задачей автокорреляции.

Вторым отличием является необходимость рассмотрения прямой и обратной зависимости.

Последовательность задания исходных данных значения в данном случае не имеет, так как в любом случае рассматривается прямая зависимость – импорт к экспорту, и обратная – экспорт к импорту соответственно.

Третье отличие - на нулевом лаге смещение не задается

По полученным коэффициентам кросс-корреляции строится коррелограмма

По аналогии с решением задачи автокорреляции необходимо оценить значимость максимального коэффициента кросс-корреляции (как правило, это коэффициент на нулевом лаге).

Наличие высокой кросс-корреляции в сочетании со значимостью коэффициента дает нам возможность рассмотреть регрессионную модель вида

(в качестве модели регрессии выбирается оптимальный тренд. В данном случае линейный). Такая модель называется регрессионной моделью с включением фактора времени) и позволяет решать задачу экстраполяции и прогнозирования.

Уровни второго динамического ряда с заданным смещением на величину лага

Проверка показателя и факторов на автокорреляцию установила, что все включенные в анализ переменные имели высокий (надежный) коэффициент автокорреляции (+ г > г табл = 0,299, - г > г табл = 0,399 при а = 5 % и /V= 20) . Однако известно, что фактор времени, введенный в модель, снимает автокорреляцию (основанием к такому утверждению являются теоремы Фриша и Роу ), поэтому для получения динамических моделей нами использовались и простейшие формы связи типа (23), (24).  


Распространены следующие способы вычисления коэффициента автокорреляции.  

Если полученное по одной из этих формул значение коэффициента автокорреляции окажется меньше табличного, то это свидетельствует об отсутствии во временном ряде существенной автокорреляции.  

Рекомендуется исчислять ряд коэффициентов автокорреляции в зависимости от временного лага (напомним, что коэффициент автокорреляции исчисляется между двумя векторами данных, один из которых - исходный динамический ряд, а другой - такой же, но сдвинутый на 1,2, 3 и т.д. моментов наблюдения). Формула коэффициента автокорреляции  

Рассмотрим коэффициенты автокорреляции валютного курса рубля к доллару США  

Приведем рассчитанные нами значения коэффициента автокорреляции для упомянутых факторов (лаг = 1-3 мес.) ВВП 0,86 -0,52  

Автокорреляция - это корреляция между уровнями ряда или отклонениями от тренда, взятыми со сдвигом во времени на 1 период (год), на 2, на 3 и т. д., поэтому говорят о коэффициентах автокорреляции разных порядков первого, второго и т. д. Рассмотрим сначала коэффициент автокорреляции отклонений от тренда первого порядка.  

Автокорреляцию измеряют при помощи нециклического коэффициента автокорреляции, который может рассчитываться не только между соседними уровнями, т.е. сдвинутыми на один период, но и между сдвинутыми на любое число единиц времени (I). Этот сдвиг, именуемый временным лагом, определяет и порядок коэффициентов автокорреляции. Различают коэффициенты автокорреляции первого порядка (при L- 1), второго порядка (при L = 2) и т.д. Однако наибольший интерес для исследования представляет вычисление нециклического коэффициента первого порядка, так как наиболее  

Тогда формулу коэффициента автокорреляции можно записать следующим образом  

Если фактическое значение коэффициента автокорреляции меньше табличного, то гипотеза об отсутствии автокорреляции в ряду может быть принята. Когда фактическое значение больше табличного, можно сделать вывод о наличии автокорреляции в ряду динамики.  

Следовательно, прежде чем коррелировать ряды динамики (по уровням), необходимо проверить каждый ряд на наличие или отсутствие в них автокорреляции (при помощи коэффициента автокорреляции, описанного в предыдущем параграфе). В случае наличия автокорреляции между уровнями ряда она должна быть устранена. Рассмотрим способы ее исключения в рядах динамики.  

Так как коэффициент р(т) измеряет корреляцию между членами одного и того же ряда, его называют коэффициентом автокорреляции, а зависимость р(т) - автокорреляционной функцией . В силу стационарности временного ряда у, (t= 1,2,..., ri) автокорреляционная функция р(т) зависит только от лага т, причем  

Пример 6.1. По данным табл. 6.1 для временного ряда у, найти среднее значение , среднее квадратическое отклонение , коэффициенты автокорреляции (для лагов т=1 2) и частный коэффициент автокорреляции 1-го порядка.  

Найдем коэффициент автокорреляции г(т) временного ряда (для лага т = 1), т. е. коэффициент корреляции между последовательностями семи пар наблюдений yt и у/ч-i (t= 1,2,...,7)  

Л =213 171+171 291+... +351 361=642 583.

Коэффициент автокорреляции г(2) для лага т = 2 между членами ряда yt и yt+2 (1,2 -. 6) по шести парам наблюдений вычисляем аналогично г(2)=0,842.  

Эту величину называют еще коэффициентом автокорреляции первого порядка. Так как согласно допущениям МНК математическое ожидание ошибки равно нулю, то формулу можно упростить  

Мы можем считать, что автокорреляция отсутствует, если выборочный коэффициент автокорреляции незначимо отличается от нуля, то есть в данном случае мы должны проверить гипотезу  

На практике проверяется не независимость, а некоррелированность ошибок, которая является необходимым, но недостаточным условием независимости. Для этого нужно рассчитать коэффициент автокорреляции первого порядка  

Для рассматриваемого здесь случая эта величина равна Pk k+i = 0.987. Очевидно, что коэффициент автокорреляции  

Формулы для расчета коэффициентов автокорреляции старших порядков легко получить из формулы линейного коэффициента корреляции.  

Коэффициент автокорреляции остатков первого порядка определяется по формуле  

Фактическое значение d сравниваем с табличными значениями при 5%-ном уровне значимости. При п = 18 месяцев и т = 2 (число факторов) нижнее значение d равно 1,05, а верхнее - 1,53. Так как фактическое значение d близко к 4, можно считать, что автокорреляция в остатках характеризуется отрицательной величиной. Чтобы проверить значимость отрицательного коэффициента автокорреляции, найдем величину  

По данным за 30 месяцев некоторого временного ряда хг были получены значения коэффициентов автокорреляции уровней П = 0,63 г2 = 0,38 гг = 0,72 г4 = 0,97 г5 = О,55 г6 = 0,40 г7 = 0,65 г - коэффициенты автокорреляции t-го порядка.  

Так как значения всех коэффициентов автокорреляции достаточно высокие, ряд содержит тенденцию. Поскольку наибольшее абсолютное значение имеет коэффициент автокорреляции 4-го порядка г4, ряд содержит периодические колебания, цикл этих колебаний равен 4.  

Определите коэффициенты автокорреляции уровней этого ряда первого и второго порядка.  

Оцените качество каждого тренда через среднюю ошибку аппроксимации , линейный коэффициент автокорреляции отклонений.  

Для определения типа колебаний применяются графическое изображение, метод поворотных точек М. Кендэла, вычисление коэффициентов автокорреляции отклонений от тренда. Эти методы будут рассмотрены далее.  

Теперь обратимся к рис. 9.2. При маятниковой колеблемости все произведения в числителе будут отрицательными величинами, и коэффициент автокорреляции первого порядка будет близок к -1. При долгопериодических циклах будут преобладать положительные произведения соседних отклонений, а смена знака происходит лишь дважды за цикл. Чем длиннее цикл, тем больше перевес положительных произведений в числителе, и коэффициент автокорреляции первого порядка ближе к +1. При случайно распределенной во времени колеблемости знаки отклонений чередуются хаотически, число положительных произведений близко к числу отрицательных , ввиду чего коэффициент автокорреляции близок к нулю. Полученное значение говорит о наличии как случайно распределенных во времени колебаний, так и циклических. Коэффициенты автокорреляции следующих порядков II = - 0,577 III = -0,611 IV = -0,095 V = +0,376 VI = +0,404 VII = +0,044. Следовательно, противофаза цикла ближе всего к 3 годам (наибольший отрицательный коэффициент при сдвиге на 3 года), а совпадающие фазы ближе к 6 годам, что и дает длину цикла колебаний. Эти максимальные по абсолютной величине коэффициенты не близки к единице. Это означает, что циклическая колеблемость смешана со значительной случайной колеблемостью. Таким образом, подробный автокорреляционный анализ в целом дал те же результаты, что и выводы по автокорреляции первого порядка.  

Для суждения о наличии или отсутствии автокорреляции в исследуемом ряду фактическое значение коэффициентов автокорреляции сопоставляется с табличным (критическим) для 5%-ного или 1%-ного уровня значимости (вероятности допустить ошибку при принятии нулевой гипотезы

Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорреляционной функцией временного ряда , а график зависимости ее значений от величины лага (порядка коэффициента автокорреляции) - коррело-граммой.  

Критерий Дарбина - Уотсона и коэффициент автокорреляции остатков первого порядка связаны соотношением  

Если временной ряд содержит только случайную компоненту, то уровни временного ряда будут независимы друг от друга. Если же временной ряд содержит тенденцию или циклические колебания, то значения каждого последующего уровня зависят от предыдущих.

Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда. Автокорреляцию можно измерить количественно. Для этого рассчитывают линейный коэффициент корреляции между уровнями исходного временного ряда и уровнями этого же ряда, сдвинутыми на один или несколько шагов во времени.

Например, разумно предположить, что доходы домохозяйства в текущем году зависят от доходов домохозяйства предыдущих лет. Определим коэффициент корреляции между ними. Известна рабочая формула линейного коэффициента корреляции

В качестве фактора мы рассмотрим доходы предшествующего периода (у t-1 ), а в качестве результата – доходы текущего периода (у t ), тогда приведенная выше формула примет вид

Средний уровень по исходному ряду динамики, определенный без учета первого уровня,

а - это средний уровень по ряду динамики, сдвинутому на одну дату.

Расстояние между уровнями временного ряда, для которых определяется коэффициент корреляции, называется лагом. Приведенная выше формула определяет величину автокорреляции между соседними уровнями, то есть при лаге = 1, поэтому этот коэффициент называют коэффициентом автокорреляции первого порядка. Допустим, r 1 = 0,98. Полученное значение свидетельствует об очень сильной зависимости между доходами текущего и предшествующего периода и, следовательно, о наличии в ряду сильной линейной тенденции.

Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями со сдвигом на две даты, то есть с лагом 2 и т.д.

С увеличением лага число пар, по которым рассчитывается коэффициент автокорреляции, уменьшается и, следовательно, снижается достоверность коэффициентов. Поэтому для обеспечения статистической достоверности лаг не должен быть больше, чем п / 4, где п – число уровней.

При анализе коэффициентов автокорреляции следует помнить следующее:

1. он определяется по формуле линейного коэффициента корреляции, таким образом, он измеряет тесноту только линейной связи текущего и предыдущего уровней временного ряда. Для временных, рядов, имеющих сильную нелинейную тенденцию, коэффициент автокорреляции уровней может быть близким к нулю;

2. Знак коэффициента автокорреляции не указывает на направление тенденции в исходном ряду данных (возрастание или убывание). Большинство временных рядов экономических переменных содержат положительную автокорреляцию уровней, но при этом сам ряд может иметь и отрицательную тенденцию.

Если расположить коэффициенты по величине лага (то есть коэффициенты первого порядка, второго, третьего и т.д.), то мы получим автокорреляционную функцию временного ряда . График зависимости величины коэффициента автокорреляции от лага называют коррелограммой.

Анализ автокорреляционной функции и коррелограммы позволяет выявить структуру временного ряда. Выявить структуру временного ряда – это значит выявить наличие или отсутствие его основных компонент (Т – трендовой компоненты и S – сезонной или циклической компоненты). Ряд может состоять только из трендовой и случайной компонент; или циклической и случайной; может содержать только случайную компоненту или все три компоненты одновременно.

Если наиболее высоким оказался коэффициент первого порядка, то исследуемый ряд содержит только тенденцию.

Если наиболее высоким оказался коэффициент автокорреляции порядка К, то ряд содержит циклические колебания с периодичностью в К моментов времени, Так, например, если при анализе временного ряда наиболее высокими оказались коэффициенты автокорреляции второго порядка, то ряд имеет циклы в два периода времени, то есть имеет так называемую пилообразную структуру. Наиболее высокий коэффициент четвертого порядка указывает на наличие в ряду цикла в четыре момента (периода) времени. Если ни один из коэффициентов не является статистически значимым, то можно сделать следующие предположения:

1. ряд не содержит ни тенденции, ни циклов, а состоит только из случайной компоненты;

2. ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ.

При моделировании временных рядов встречаются ситуации, когда остатки содержат тенденцию или цикличность. В этом случае остатки не являются независимыми, каждое последующее значение остатка зависит от предыдущего. Это явление получило название автокорреляция остатков.

Назовем причины существования автокорреляции остатков:

1. в модель не включен фактор, оказывающий существенной воздействие на результат; его влияние будет отражаться в остатках, то есть они могут быть автокоррелированы;

2. модель не учитывает влияние нескольких второстепенных факторов, совместное влияние которых может быть существенным (если их тенденции совпадают или фазы цикличности совпадают);

3. автокорреляция остатков может заключаться в неверной функциональной спецификации модели.

Существуют два способа определения автокорреляции в остатках. Первый заключается в визуальном анализе графика зависимостей остатков от времени. Второй способ предполагает использование критерия Дарбина-Уотсона. Величину критерия (d) можно определить по одной из формул

либо d 2(1 – r e 1) ,

где r e 1 – коэффициент автокорреляции остатков первого порядка.

Если в остатках существует полная положительная автокорреляция , то r e 1 =1 и d = 0. Если в остатках полная отрицательная автокорреляция, то

r e 1 =-1 и d = 4. Если автокорреляция остатков отсутствует, то r e 1 =0 и d = 2.

На практике используется следующий алгоритм проверки гипотезы об автокорреляции остатков:

1. выдвигается нулевая гипотеза об отсутствии автокорреляции в остатках;

2. определяется фактическое значение критерия Дарбина – Уотсона (d);

3. по специальным таблицам (приложение учебника по эконометрике) находят критические значения критерия d L и d u , где п – число наблюдений, k - независимых переменных в модели, - уровень значимости;

4. числовой промежуток всех возможных значений d разбивается на 5 отрезков

0 d L d u 2 4- d u 4 - d L 4

5. если d - фактическое попадает в зону неопределенности, то предполагают существование автокорреляции в остатках.

В последнем случае исследовать причинно-следственные связи переменных по остаткам нельзя, получим ложную корреляцию.

При нарушении гомоскедастичности (т.е. наличие гетероскедастичности) и наличии автокорреляции остатков рекомендуется традиционный метод наименьших квадратов (МНК), который проводится по исходным данным, заменять обобщенным методом наименьших квадратов (ОМНК), который проводится по преобразованным данным.

4.1. Автокорреляция уровней временного ряда

(4.1)

Где

Эту величину называют коэффициентом автокорреляции уровней ряда первого порядка, так как он измеряет зависимость между соседними уровнями ряда и
.

Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями и
и определяется по формуле:

(4.2)

где

(7.1.)

где
, а
.

Число периодов , по которым рассчитывается коэффициент автокорреляции, называют лагом . С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило – максимальный лаг должен быть не больше
.

Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой .

Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию . Если наиболее высоким оказался коэффициент автокорреляции порядка , то ряд содержит циклические колебания с периодичностью в моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты и циклической (сезонной) компоненты.

Рассмотрим пример . Пусть имеются некоторые условные данные об общем количестве правонарушений на таможне одного из субъектов РФ (например, Республики Татарстан).

Таблица 4.1

Количество возбужденных дел,

Построим поле корреляции:

Рис. 4.4.

Уже исходя из графика видно, что значения образуют пилообразную фигуру. Рассчитаем несколько последовательных коэффициентов автокорреляции. Для этого составляем первую вспомогательную таблицу.

Таблица 4.2

Среднее значение

Следует заметить, что среднее значение получается путем деления не на 16, а на 15, т.к. у нас теперь на одно наблюдение меньше.

Теперь вычисляем коэффициент автокорреляции первого порядка по формуле (4.1):

Составляем вспомогательную таблицу для расчета коэффициента автокорреляции второго порядка.

Таблица 4.3

Среднее значение

Следовательно

Аналогично находим коэффициенты автокорреляции более высоких порядков, а все полученные значения заносим в сводную таблицу.

Таблица 4.4

Коэффициент автокорреляции уровней

Коррелограмма:

Рис. 4.5.

Анализ коррелограммы и графика исходных уровней временного ряда позволяет сделать вывод о наличии в изучаемом временном ряде сезонных колебаний периодичностью в четыре квартала.

Автокорреляция уровней временного ряда

При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда.

Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.

Формула для расчета коэффициента автокорреляции имеет вид:

Эту величину называют коэффициентом автокорреляции уровней ряда первого порядка, так как он измеряет зависимость между соседними уровнями ряда и .

Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями и и определяется по формуле:

Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило – максимальный лаг должен быть не больше .

Свойства коэффициента автокорреляции.

    Он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Поэтому по коэффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, параболу второго порядка или экспоненту), коэффициент автокорреляции уровней исходного ряда может приближаться к нулю.

    По знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных содержат положительную автокорреляцию уровней, однако при этом могут иметь убывающую тенденцию.

Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой.

Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, т.е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.

Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка , то ряд содержит циклические колебания с периодичностью в моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты и циклической (сезонной) компоненты.

Автокорреляция во временных рядах

Для характеристики динамики изменения экономических показателей часто используется понятие автокорреляции , которая характеризует не только взаимозависимость уровней одного и того же ряда, относящихся к разным моментам наблюдений, но и степень устойчивости развития процесса во времени, величину оптимального периода прогнозирования и т.п.

Степень тесноты статистической связи между уровнями временного ряда, сдвинутыми на t единиц времени определяется величиной коэффициента корреляции , так как измеряет тесноту связи между уровнями одного и того же временного ряда, поэтому его принято называть . График автокорреляционной функции называется корреллограммой .

Выборочный коэффициент автокорреляции вычисляется по формуле:

(3.4.13)

Для расчета коэффициента автокорреляции по формуле (3.4.12) в Excel можно воспользоваться функцией КОРРЕЛ. Предположим, что базовая переменная включает диапазон А1:А34.

Тогда коэффициент автокорреляции равен:

КОРРЕЛ (А1:А33; А2:А34).

На практике, как правило, при вычислении автокорреляции используется формула (3.4.13).

Анализ автокорреляционной функции и коррелограммы поз­воляет определить лаг, при котором автокорреляция наиболее высокая, т.е. при помощи анализа автокорреляционной функции и коррелограм­мы можно выявить структуру ряда.

Если наиболее высоким оказался коэффициент автокорреля­ции первого порядка, исследуемый ряд содержит только тенден­цию. Если наиболее высоким оказался коэффициент автокорре­ляции порядка t, то ряд содержит циклические колебания с перио­дичностью в t моментов времени.

Если ни один из коэффициен­тов автокорреляции не является значимым, то можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и сезонных колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреля­ционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компонен­ты (f(t)) и сезонной компоненты (S).

Пример 3.4.3. Анализ временного ряда валового внутреннего продукта

Валовой внутренний продукт (ВВП ) – представляет собой на стадии производства сумму добавленных стоимостей отраслей экономики, а на стадии использования – стоимость товаров и услуг, предназначенных для конечного потребления, накопления и экспорта.

В качестве исходной информации используются данные: номинальный объем валового внутреннего продукта, млрд. руб. (с 1998 г млн. руб.) – квартальные данные с 1994:1 по 2003:1 (Табл. 3.4.7). График этого ряда приведен на рис.3.4.6.

Из него видно, что данные обладают повышающим трендом. Таким образом, уже визуальный анализ позволяет сделать вывод о нестационарности исходного временного ряда.

Проверим данное предположение, вычислим коэффициенты автокорреляции (табл. 3.4.8) и построим график автокорреляционной функции временного ряда ВВП (коррелограмму) (см. Рис. 3.4.7).

Табл. 3.4.7. ВВП[

Дата 4кв.1994 1кв.1995 2кв.1995 3кв.1995 4кв.1995 1кв.1996 2кв.1996 3кв.1996 4кв.1996 1кв.1997
ВВП 225.00 235.00 325.00 421.00 448.00 425.00 469.00 549.00 565.00 513.00
Дата 2кв.1997 3кв.1997 4кв.1997 1кв.1998 2кв.1998 3кв.1998 4кв.1998 1кв.1999 2кв.1999 3кв.1999
ВВП 555.00 634.00 641.00 551.00 602.00 676.00 801.00 901.00 1102.00 1373.00
Дата 4кв.1999 1кв.2000 2кв.2000 3кв.2000 4кв.2000 1кв.2001 2кв.2001 3кв.2001 4кв.2001 1кв.2002
ВВП. 1447.00 1527.00 1697.00 2038.00 2044.00 1922.00 2120.00 2536.00 2461.00 2268.00
Дата 2кв.2002 3кв.2002 4кв.2002 1кв.2003
ВВП 2523.00 3074.00 2998.00 2893.10

Табл. 3.4.8.

Рис. 3.4.7. Коррелограмма.

Коррелограмма автокорреляционной функции в случае стационарного временного ряда должна быстро убывать с ростом t после нескольких первых значений. Рис. 3.4.7 показывает, что исследуемый ряд не является стационарным. Временной ряд валового внутреннего продукта содержит трендовую компоненту.

Временной ряд является нестационарным , если он содержит такие систематические составляющие как тренд и цикличность.

Нестационарные временные ряды характеризуются тем, что значения каждого последующего уровня временного ряда корреляционно зависят от предыдущих значений.

Автокорреляцией уровней временного ряда называется корреляционная зависимость между настоящими и прошлыми значениями уровней данного ряда.

Лагом l называется величина сдвига между рядами наблюдений.

Лаг временного ряда определяет порядок коэффициента автокорреляции. Например, если уровни временного ряда x t и x t–1 корреляционно зависимы, то величина временного лага равна единице. Следовательно, данная корреляционная зависимость определяется коэффициентом автокорреляции первого порядка между рядами наблюдений x 1 …x n–1 и x 2 …x n . . Если лаг между рядами наблюдений равен двум, то данная корреляционная зависимость определяется коэффициентом автокорреляции второго порядка и т. д.

При увеличении величины лага на единицу число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается на единицу. Поэтому максимальный порядок коэффициента автокорреляции рекомендуется брать равным n/4 , где n – количество уровней временного ряда.

Автокорреляция между уровнями временного ряда оценивается с помощью выборочного коэффициента автокорреляции, который рассчитывается по формуле:

где x t *x t-l – среднее арифметическое произведения двух рядов наблюдений, взятых с лагом l :

x t x 1+l ,x 2+l ,…,x n :

x t-l – значение среднего уровня ряда x 1 ,x 2 ,…,x n–l :

G(x t), G(x t–l) – средние квадратические отклонения, рассчитанные для рядов наблюдений x 1+l ,x 2+l ,…,x n и x 1 ,x 2 ,…,x n–l соответственно.

Структуру временного ряда можно определить, рассчитав несколько последовательных коэффициентов автокорреляции. В результате данных вычислений можно выявить лаг l , для которого значение выборочного коэффициента автокорреляции r l является наибольшим.

Анализ структуры временного ряда с помощью коэффициентов автокорреляции стоится на следующих правилах:

1) исследуемый временной ряд содержит только трендовую компоненту, если наибольшим является значение коэффициента автокорреляции первого порядка r l–1 ;

2) исследуемый временной ряд содержит трендовую компоненту и колебания периодом l, если наибольшим является коэффициент автокорреляции порядка l. Эти колебания могут быть как циклическими, так и сезонными;

3) если ни один из коэффициентов автокорреляции r l (l =1,L ) не окажется значимым, то делается один из двух возможных выводов:

а) данный временной ряд не содержит трендовой и циклической компонент, а его колебания вызваны воздействием случайной компоненты, т. е. ряд представляет собой модель случайного тренда;

б) данный временной ряд содержит сильную нелинейную тенденцию, для выявления которой необходимо провести его дополнительный анализ.

Графическим способом анализа структуры временного ряда является построение графиков автокорреляционной и частной автокорреляционной функций.

Автокорреляционной функцией называется функция оценки коэффициента автокорреляции в зависимости от величины временного лага между исследуемыми рядами.

Графиком автокорреляционной функции является коррелограмма.

Частная автокорреляционная функция отличается от автокорреляционной функции тем, что при её построении устраняется корреляционная зависимость между наблюдениями внутри лагов.