Корреляционное поле представляет собой графическое изображение. Смотреть страницы где упоминается термин поле корреляции. Коэффициенты корреляции и их свойства

Корреляционный анализ

1.3 Корреляционные поля и цель их построения

Корреляция изучается на основании экспериментальных данных, представляющих собой измеренные значения (x i , y i) двух признаков. Если экспериментальных данных немного, то двумерное эмпирическое распределение представляется в виде двойного ряда значений x i и y i . При этом корреляционную зависимость между признаками можно описывать разными способами. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т. д.

Корреляционный анализ, как и другие статистические методы, основан на использовании вероятностных моделей, описывающих поведение исследуемых признаков в некоторой генеральной совокупности, из которой получены экспериментальные значения x i и y i . Когда исследуется корреляция между количественными признаками, значения которых можно точно измерить в единицах метрических шкал (метры, секунды, килограммы и т.д.), то очень часто принимается модель двумерной нормально распределенной генеральной совокупности. Такая модель отображает зависимость между переменными величинами x i и y i графически в виде геометрического места точек в системе прямоугольных координат. Эту графическую зависимость называются также диаграммой рассеивания или корреляционным полем.
Данная модель двумерного нормального распределения (корреляционное поле) позволяет дать наглядную графическую интерпретацию коэффициента корреляции, т.к. распределение в совокупности зависит от пяти параметров: м x , м y - средние значения (математические ожидания); у x ,у y - стандартные отклонения случайных величин Х и Y и р - коэффициент корреляции, который является мерой связи между случайными величинами Х и Y.
Если р = 0, то значения, x i , y i , полученные из двумерной нормальной совокупности, располагаются на графике в координатах х, у в пределах области, ограниченной окружностью (рисунок 5, а). В этом случае между случайными величинами Х и Y отсутствует корреляция и они называются некоррелированными. Для двумерного нормального распределения некоррелированность означает одновременно и независимость случайных величин Х и Y.

Рисунок 5 - Графическая интерпретация взаимосвязи между показателями

Если р = 1 или р = -1, то между случайными величинами Х и Y существует линейная функциональная зависимость (Y = c + dX). В этом случае говорят о полной корреляции. При р = 1 значения x i , y i определяют точки, лежащие на прямой линии, имеющей положительный наклон (с увеличением x i значения y i также увеличиваются), при р = -1 прямая имеет отрицательный наклон (рисунок 5, б). В промежуточных случаях (-1 < p < 1) точки, соответствующие значениям xi , y i , попадают в область, ограниченную некоторым эллипсом (рисунок 5, в, г), причем при p > 0 имеет место положительная корреляция (с увеличением x i значения y i имеют тенденцию к возрастанию), при p < 0 корреляция отрицательная. Чем ближе р к, тем уже эллипс и тем теснее экспериментальные значения группируются около прямой линии. Здесь же следует обратить внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, а иметь любую другую форму: парабола, гипербола и т. д. В этих случаях мы рассматривали бы так называемую, нелинейную (или криволинейную) корреляцию (риунок 5, д).

Таким образом, визуальный анализ корреляционного поля помогает выявить не только наличия статистической зависимости (линейную или нелинейную) между исследуемыми признаками, но и ее тесноту и форму. Это имеет существенное значение для следующего шага в анализе ѕ выбора и вычисления соответствующего коэффициента корреляции.

Корреляционную зависимость между признаками можно описывать разными способами. В частности, любая форма связи может быть выражена уравнением общего вида Y = f(X), где признак Y - зависимая переменная, или функция от независимой переменной X, называемой аргументом. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т. д.

Динамическое программирование

В сельском хозяйстве непрерывно протекают разнообразные экономические процессы, в результате которых складываются определенные производственные результаты, формируются экономические явления...

Целью курсовой работы является: развитие умения разрабатывать имитационные модели организационных и технических объектов, а также получения практических навыков работы в среде GPSS World...

Имитационное моделирование работы билетной кассы железнодорожного вокзала

Исследование функционирования работы билетной кассы на железнодорожном вокзале и анализ влияния времени обслуживания в каждой кассе на очереди и количество обслуженных гражданских и военных пассажиров...

Исследование свойств случайных величин, планирование эксперимента и анализ данных

Корреляционное поле используется для выявления и демонстрации зависимостей между двумя связанными наборами данных и для подтверждения предполагаемых зависимостей между ними...

Корреляционно-регрессионный анализ однофакторной стохастической связи

Метод последовательных сравнений

Программно реализовать интерактивный метод последовательных...

Моделирование систем массового обслуживания

Развитие современного общества характеризуется повышением технического уровня, усложнением организационной структуры производства, углублением общественного разделения труда...

Обработка результатов полного факторного плана для получения математической модели результатов полного факторного плана

Основными целями и задачами планирования эксперимента являются: 1) Планирование эксперимента с целью математического описания объекта. Целью данного эксперимента является получение математической модели методом регрессионного анализа...

Определение рационального маршрута следования коммивояжера

Целью данной работы является определение рационального маршрута следования коммивояжера и выбора экономически целесообразного способа поездки. Задача - выбрать такой вид транспорта для объезда коммивояжером населенных пунктов...

Оценка инвестиционных проектов

Необходимо разработать имитационную модель финансово-экономической деятельности фирмы по реализации этого проекта, выбрать схему финансирования и оценить показатели экономической эффективности проекта...

Построение структурной схемы устройства станка 3Б722

Выбор объекта морфологического исследования. Приобретение практических навыков структурного анализа. 2. Общие сведения Шлифование - это процесс обработки заготовок абразивными материалами...

Разработка модели предприятия тепличного хозяйства, используя методологии проектирования IDEF0, DFD и IDEF3

Целями данной курсовой работы были: применение методов предпроектного обследования предприятия; анализ полученных материалов для последующего моделирования; разработка модели процесса в стандарте IDEF0; описание документооборота и...

Трендовые и корреляционные модели

Функциональное моделирование

Создаваемая IDEF0-модель имеет конкретное назначение, называемое целью модели. Цель моделирования можно понять из следующего формального определения модели : M есть модель системы S...

Эконометрические модели рентабельности собственного капитала (на примере СПК "Слава")

Так как в данной курсовой работе рассматривается рентабельность собственного капитала, то возьмем ее за результативный показатель. Одним из факторов, оказывающих влияние, является рентабельность продаж, %...

Строим корреляционное поле для основного и попутного компонентов. По оси абсцисс откладываем содержание основного компонента, в данном случае Hg, а по оси ординат – содержание попутного, т.е. Sn.

Для предварительной оценки силы связи на корреляционном поле необходимо провести линии, соответствующие медианам значений основного и попутного компонентов, разделив ими поле на четыре квадрата.

Количественной мерой силы связи является коэффициент корреляции. Его приближённую оценку рассчитывают по формуле:

где n1 суммарное количество точек в I и III, n2 = суммарное количество точек в II и IV.

I = 4 II = 8 III = 7 IV = 5

Далее используя вычисленные компьютером исходные данные (Хср, Yср, дисперсии Dx, Dy, и их ковариацию cov(x,y)) вычисляем значение коэффициента корреляции r и параметры уравнений линейной регрессии попутного компонента по основному и основного компонента по попутному.

Вычисляем по следующим формулам:

Исходные данные:

cov (x, y) = 163,86

r = cov(x, y)/√Dx * Dy = 163,86/√157,27* 645,61= 0,51

b = cov(x, y)/Dx = 163,86/157,27= 1,04

a = Yср – b * Xср = 153,13– (-0.08) * 36,75= 150.19

d = cov(x, y)/ Dy = 163,86/645,61= 0.25

c = Хср – d * Yср = 36,75– (0.25) * 153,13= -1.5

y =150.19+1.04x x = -1.5+0.25y

Строим линии регрессии на корреляционном поле.

Этап 7. Проверка гипотезы о наличии корреляционной связи

Проверка гипотезы о наличии корреляционной связи основана на том, что для двумерной нормально распределённой случайной величины X, Y при отсутствии корреляции между х и y, коэффициент корреляции равен «0». Для проверки гипотезы об отсутствии корреляционной связи необходимо вычислить значение критерия:

t = r * √(N – 2)/√(1 – r2) = 0,51* √(24-2)/√(1 – (0,51) 2) = 2.65

Для наших значений t = 2.65

Табличное значение ttab = 2.02

Так как вычисленное значение t превышает табличное значение, то гипотеза об отсутствии корреляционной связи отвергается. Связь присутствует.

Этап 8. Построение линий эмпирической регрессии. Вычисление корреляционного отношения

Выборочные данные группируются в классы по значениям содержаний основного компонента, в данном случае Hg. Для этого весь интервал значений от минимального содержания основного полезного компонента до максимального содержания делится на 6 интервалов. Для каждого интервала:

    Определяется количество значений, попавших в этот интервал n(i)

    Считается количество значений содержаний попутного компонента соответствующих значениям основного(y(I,ср)) и делится это количество на n(i)

Таблица 3

Граница интервалов

На корреляционном поле строим линию эмпирической регрессии.

dобщ = √Dy = 25,4

dусл = /N = 66,14

Величина корреляционного отношения попутного компонента по основному r рассчитывается по формуле:

r = dусл/ dобщ = 66,14/25,4 = 2,6

Наглядным изображением корреляционной таблицы служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладываются значения X, по оси ординат – Y, а точками показываются сочетания X и Y. По расположению точек можно судить о наличии связи.

Использование графического метода.

Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X.

Совокупность точек результативного и факторного признаков называется полем корреляции.

На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.

Линейное уравнение регрессии имеет вид y = bx + a + ε

Здесь ε - случайная ошибка (отклонение, возмущение).

Причины существования случайной ошибки:

1. Невключение в регрессионную модель значимых объясняющих переменных;

2. Агрегирование переменных. Например, функция суммарного потребления – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.

3. Неправильное описание структуры модели;

4. Неправильная функциональная спецификация;

21. Корреляционно-регрессионный анализ.

Корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты и направления связи и установление аналити­ческого выражения (формы) связи (регрессионный анализ).

Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (У) от факторных (х1, х2, …, хk).

Уравнение регрессии, или статистическая модель связи социально-эко­номических явлений, выражается функцией:

Yx = f(х1, х2, …, хn),

где “n” – число факторов, включенных в модель;

Хi – факторы, влияющие на результат У.

Этапы корреляционно-регрессионного анализа:

Предварительный (априорный) анализ. Он дает неплохие результаты если проводится достаточно квалифицированным исследователем.

Сбор информации и ее первичная обработка.

Построение модели (уравнения регрессии). Как правило эту процедуру выполняют на ПК используя стандартные программы.

Оценка тесноты связей признаков, оценка уравнения регрессии и анализ модели.

Прогнозирование развития анализируемой системы по уравнению регрессии.

На первом этапе формулируется задача исследования, определяется методика измерения показателей или сбора информации, определяется число факторов, исключаются дублирующие факторы или связанные в жестко-детерминированную систему.

На втором этапе анализируется объем единиц: совокупность должна быть достаточно большой по числу единиц и наблюдений (N>>50), число факторов “n” должно соответствовать количеству наблюдений “N”. Данные должны быть количественно и качественно однородны.

На третьем этапе определяется форма связи и тип аналитической функции (парабола, гипербола, прямая) и находятся ее параметры.

На четвертом этапе оценивается достоверность всех характеристик корреляционной связи и уравнения регрессии используя критерий достоверности Фишера или Стьюдента, производится экономико-технологический анализ параметров.

На пятом этапе осуществляется прогноз возможных значений результата по лучшим значениям факторных признаков, включенных в модель. Здесь выбираются наилучшие и наихудшие значения факторов и результата.

22. Виды уравнений регрессии.

Для количественного описания взаимосвязей между экономическими переменными в статистике используют методы регрессии и корреляции.

Регрессия - величина, выражающая зависимость среднего значения случайной величины у от значений случайной величины х.

Уравнение регрессии выражает среднюю величину одного признака как функцию другого.

Функция регрессии - это модель вида у = л», где у - зависимая переменная (результативный признак); х - независимая, или объясняющая, переменная (признак-фактор).

Линия регрессии - график функции у = f (x).

2 типа взаимосвязей между х и у:

1) может быть неизвестно, какая из двух переменных является независимой, а какая - зависимой, переменные равноправны, это взаимосвязь корреляционного типа;

2) если х и у неравноправны и одна из них рассматривается как объясняющая (независимая) переменная, а другая - как зависимая, то это взаимосвязь регрессионного типа.

Виды регрессий:

1) гиперболическая - регрессия равносторонней гиперболы: у = а + b / х + Е;

2) линейная - регрессия, применяемая в статистике в виде четкой экономической интерпретации ее параметров: у = а+b*х+Е;

3) логарифмически линейная - регрессия вида: In у = In а + b * In x + In E

4) множественная - регрессия между переменными у и х1 , х2 ...xm, т. е. модель вида: у = f(х1 , х2 ...xm)+E, где у - зависимая переменная (результативный признак), х1 , х2 ...xm - независимые, объясняющие переменные (признаки-факторы), Е- возмущение или стохастическая переменная, включающая влияние неучтенных факторов в модели;

5) нелинейная - регрессия, нелинейная относительно включенных в анализ объясняющих переменных, но линейная по оцениваемым параметрам; или регрессия, нелинейная по оцениваемым параметрам.

6) обратная - регрессия, приводимая к линейному виду, реализованная в стандартных пакетах прикладных программ вида: у = 1/a + b*х+Е;

    парная - регрессия между двумя переменными у и x, т. е, модель вида: у = f (x) + Е, где у -зависимая переменная (результативный признак), x – независимая, объясняющая переменная (признак - фактор), Е - возмущение, или стохастическая переменная, включающая влияние неучтенных факторов в модели.

    Ряды динамики и их виды

Динамический ряд всегда состоит из 2 элементов: 1) момент времени или временной период, по отношению к которому приводятся статистические данные, 2)статистического показателя, который называется уровнем динамического ряда.

В зависимости от содержания временного показателя, ряды динамики бывают моментные или интервальные

В зависимости от вида статистического показателя, динамические ряды подразделяются на ряды абсолютных, относительных и средних величин

Абсолютные показывают точные значения

Относительные показывают изменение удельных весов показателя в общей совокупности

Средние величины содержат об изменении во времени показателя, являющимся средним уровнем явления

    Показатели ряда динамики. Средний уровень ряда динамики.

Показатели: 1)средний уровень дин.ряда, 2)абс.приросты, цепные и базисные, ср.абс.прирост, 3)тымпы роста и прироста, цепные и базисные, ср.темп роста и прироста, 4)fmcjk.nystзначения 1% прироста

Средние показатели динамики

Обобщённые характеристики ряда динамики, с их помощью сравнивают интенсивность развития явления по отношению к разным объектам, например по странам, отраслям, предприятиям

Средний уровень в мом.времени уи. Методика расчета среднего уровня зависит от вида ряда(моментальный/интервальный)(с равными/разными интервалами). Если дан интервальныя ряд динамики абсолютных или средних вельчин с равными промежутками времени, то для расчета среднего уровня применяются формула для расчета средней простой. Если промежутки времени интервального ряда неравные, то средний уровень находят по средней арифметической взвешенной. Уср=сммУи*Ти/сммТи

25. Абсолютный прирост (дельта и) – это разность между двумя уровнями динамического ряда, которая пока­зывает, насколько данный уровень ряда превышает уровень, принятый за базу сравнения. Дельта и=Уи-У0

Дельта и=Уи-Уи-1

Абсолютное ускорение - разность между абсолютным приростом за данный период и абсолютным приростом за предыдущий период одинаковой дли­тельности: Дельта и с чертой=дельта и- дельта и-1. Абсолютное ускорение показывает, насколько увеличилась (уменьшилась) скорость изменения показателя. Показатель ускорения применяется для цепных абсолютных приростов. Отрицательная величина ускорения говорит о замедлении роста или об ускорении снижения уровней ряда.

    Показатели относительного изменения уровней ряда динамики.

Коэффициент роста (темп роста) - это отношение двух сравниваемых уровней, которое показывает, во сколько раз данный уровень превышает уровень базисного периода. Отражает интенсивность изменения уровней ряда динамики и показывает, во сколько раз увеличился уровень по сравнению с базисным, а в случае уменьшения - какую часть базисного уровня составляет сравниваемый уровень.

Формула расчета коэффициента роста: при сравнении с постоянной базой : K i .=y i /y 0 , при сравнении с переменной базой : K i .=y i /y i -1 .

Темп роста - это коэффициент роста, выраженный в процентах:

T р = К 100 %.

Темпы роста для любых рядов динамики являются интервальными показателями, т.е. характеризуют тот или иной промежуток (интервал) времени.

Темп прироста - относительная величина прироста, т. е. отношение абсолютного прироста к предыдущему или базисному уровню. Характеризует, на сколько процентов уровень данного периода больше (или меньше) базисного уровня.

Темп прироста - отношение абсолютного прироста к уровню, принятому за базу сравнения:

Тпр=Уи-У0/У0*100%

Темп прироста - разность между темпом роста (в процентах) и 100,

1. Тема работы.

2. Краткие теоретические сведения.

3. Порядок выполнения работы.

4. Исходные данные для разработки математической модели.

5. Результаты разработки математической модели.

6. Результаты исследования модели. Построение прогноза.

7. Выводы.

В задачах 2-4 можно использовать ППП Excel для расчетов характеристик модели.

Работа № 1.

Построение моделей парной регрессии. Проверка остатков на гетероскедастичность.

По 15 предприятиям, выпускающим один и тот же вид продукции известны значения двух признаков:

х - выпуск продукции, тыс. ед.;

у - затраты на производство, млн. руб.

x y
5,3 18,4
15,1 22,0
24,2 32,3
7,1 16,4
11,0 22,2
8,5 21,7
14,5 23,6
10,2 18,5
18,6 26,1
19,7 30,2
21,3 28,6
22,1 34,0
4,1 14,2
12,0 22,1
18,3 28,2

Требуется:

1. Построить поле корреляции и сформулировать гипотезу о форме связи .

2. Построить модели:

Линейной парной регрессии.

Полулогарифмической парной регрессии.

2.3 Степенной парной регрессии.
Для этого:


2. Оценить тесноту связи с помощью коэффициента (индекса)
корреляции.

3. Оценить качество модели с помощью коэффициента (индекса)
детерминации и средней ошибки аппроксимации
.

4. Дать с помощью среднего коэффициента эластичности
сравнительную оценку силы связи фактора с результатом
.

5. С помощью F -критерия Фишера оценить статистическую надежность результатов регрессионного моделирования .

По значениям характеристик, рассчитанных в пунктах 2-5 выбрать лучшее уравнение регрессии.

Используя метод Гольфрельда-Квандта проверить остатки на гетероскедастичность.

Строим поле корреляции.

Анализируя расположение точек поля корреляции, предполагаем, что связь между признаками х и у может быть линейной, т.е. у=а+bх , или нелинейной вида: у=а+blnх, у = ах b .

Основываясь на теории изучаемой взаимосвязи, предполагаем получить зависимость у от х вида у=а+bх, т. к. затраты на производство y можно условно разделить на два вида: постоянные, не зависящие от объема производства - a , такие как арендная плата, содержание администрации и т.д.; и переменные, изменяющиеся пропорционально выпуску продукции bх, такие как расход материала, электроэнергии и т.д.


2.1. Модель линейной парной регрессии .

2.1.1. Рассчитаем параметры a и b линейной регрессии у=а+bх .

Строим расчетную таблицу 1.

Таблица 1

Параметры a и b уравнения

Y x = a + bx


Разделив на n b :

Уравнение регрессии:

=11,591+0,871x

С увеличением выпуска продукции на 1 тыс. руб. затраты на производство увеличиваются на 0,871 млн. руб. в среднем, постоянные затраты равны 11,591 млн. руб.

2.1.2. Тесноту связи оценим с помощью линейного коэффициента парной корреляции.

Предварительно определим средние квадратические отклонения признаков.

Средние квадратические отклонения:

Коэффициент корреляции:

Между признаками X и Y наблюдается очень тесная линейная корреляционная связь.

2.1.3. Оценим качество построенной модели.

т. е. данная модель объясняет 90,5% общей дисперсии у , на долю необъясненной дисперсии приходится 9,5%.

Следовательно, качество модели высокое.

А i .

Предварительно из уравнения регрессии определим теоретические значения для каждого значения фактора.

Ошибка аппроксимации А i , i =1…15:

Средняя ошибка аппроксимации:

2.1.4. Определим средний коэффициент эластичности:

Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,515%.

2.1.5. Оценим статистическую значимость полученного уравнения.
Проверим гипотезу H 0 , что выявленная зависимость у от х носит случайный характер, т. е. полученное уравнение статистически незначимо. Примем α=0,05. Найдем табличное (критическое) значение F- критерия Фишера:

Найдем фактическое значение F - критерия Фишера:

следовательно, гипотеза H 0 H 1 x и y неслучайна.

Построим полученное уравнение.

2.2. Модель полулогарифмической парной регрессии .

2.2.1. Рассчитаем параметры а и b в регрессии:

у x =а +blnх .

Линеаризуем данное уравнение, обозначив:

y=a + bz .

Параметры a и b уравнения

= a + bz

определяются методом наименьших квадратов:


Рассчитываем таблицу 2.

Таблица 2

Разделив на n и решая методом Крамера, получаем формулу для определения b :

Уравнение регрессии:

= -1,136 + 9,902z

2.2.2. Оценим тесноту связи между признаками у и х .

Т. к. уравнение у = а + bln x линейно относительно параметров а и b и его линеаризация не была связана с преобразованием зависимой переменной _у , то теснота связи между переменными у и х , оцениваемая с помощью индекса парной корреляции R xy , также может быть определена с помощью линейного коэффициента парной корреляции r yz

среднее квадратическое отклонение z :

Значение индекса корреляции близко к 1, следовательно, между переменными у и х наблюдается очень тесная корреляционная связь вида = a + bz.

2.2.3. Оценим качество построенной модели.

Определим коэффициент детерминации:

т. е. данная модель объясняет 83,8% общей вариации результата у , на долю необъясненной вариации приходится 16,2%. Следовательно, качество модели высокое.

Найдем величину средней ошибки аппроксимации А i .

Предварительно из уравнения регрессии определим теоретические значения для каждого значения фактора. Ошибка аппроксимации А i , :

, i =1…15.

Средняя ошибка аппроксимации:

.

Ошибка небольшая, качество модели высокое.

2.2.4.Определим средний коэффициент эластичности:

Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,414%.

2.2.5. Оценим статистическую значимость полученного уравнения.
Проверим гипотезу H 0 , что выявленная зависимость у от х носит случайный характер, т.е. полученное уравнение статистически незначимо. Примем α=0,05.

Найдем табличное (критическое) значение F -критерия Фишера:

Найдем фактическое значение F -критерия Фишера:

следовательно, гипотеза H 0 отвергается, принимается альтернативная гипотеза H 1 : с вероятностью 1-α=0,95 полученное уравнение статистически значимо, связь между переменными x и y неслучайна.

Построим уравнение регрессии на поле корреляции

2.3. Модель степенной парной регрессии.

2.3.1. Рассчитаем параметры а и b степенной регрессии:

Расчету параметров предшествует процедура линеаризации данного уравнения:

и замена переменных:

Y=lny, X=lnx, A=lna

Параметры уравнения:

определяются методом наименьших квадратов:


Рассчитываем таблицу 3.

Определяем b :

Уравнение регрессии:

Построим уравнение регрессии на поле корреляции:

2.3.2. Оценим тесноту связи между признаками у и х с помощью индекса парной корреляции R yx .

Предварительно рассчитаем теоретическое значение для каждого значения фактора x, и , тогда:

Значение индекса корреляции R xy близко к 1, следовательно, между переменными у и х наблюдается очень тесная корреляционная связь вида:

2.3.3. Оценим качество построенной модели.

Определим индекс детерминации:

R 2 =0,936 2 =0,878,

т. е. данная модель объясняет 87,6% общей вариации результата у, а на долю необъясненной вариации приходится 12,4%.

Качество модели высокое.

Найдем величину средней ошибки аппроксимации.

Ошибка аппроксимации А i , i =1…15:

Средняя ошибка аппроксимации:

Ошибка небольшая, качество модели высокое.

2.3.4. Определим средний коэффициент эластичности:

Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,438%.

2.3.5.Оценим статистическую значимость полученного уравнения.

Проверим гипотезу H 0 , что выявленная зависимость у от х носит случайный характер, т. е. полученное уравнение статистически незначимо. Примем α=0,05.

табличное (критическое) значение F -критерия Фишера:

фактическое значение F -критерия Фишера:

следовательно, гипотеза H 0 отвергается, принимается альтернативная гипотеза H 1 : с вероятностью 1-α=0,95 полученное уравнение статистически значимо, связь между переменными x и y неслучайна.

Таблица 3

3. Выбор лучшего уравнения.

Составим таблицу полученных результатов исследования.

Таблица 4

Анализируем таблицу и делаем выводы.

ú Все три уравнения оказались статистически значимыми и надежными, имеют близкий к 1 коэффициент (индекс) корреляции, высокий (близкий к 1) коэффициент (индекс) детерминации и ошибку аппроксимации в допустимых пределах.

ú При этом характеристики линейной модели указывают, что она несколько лучше полулогарифмической и степенной описывает связь между признаками x и у.

ú Поэтому в качестве уравнения регрессии выбираем линейную модель.

Вам понадобится

  • - ряд распределения из зависимой и независимой переменной;
  • - бумага, карандаш;
  • - компьютер и программа для работы с электронными таблицами.

Инструкция

Выберите две , между которыми, как вы полагаете, есть взаимосвязь, обычно берут , которые изменяются со временем. Учтите, что одна из переменных должна быть независимой, она будет выступать в качестве причины. Вторая при этом должна изменяться с ней – уменьшаться, увеличиваться или меняться случайным образом.

Измерьте значение зависимой переменной для каждого независимой. Занесите результаты в таблицу, в две строки или два столбца. Для обнаружения наличия связи нужно не менее 30 показаний, но для получения более точного результата позаботьтесь о наличии не менее 100 точек.

Постройте координатную плоскость, при этом на оси ординат отложите значения зависимой переменной, а на оси абсцисс – независимой. Подпишите оси и укажите единицы измерения каждого показателя.

Отметьте на графике точки корреляционного поля. На оси абсцисс найдите первое значение независимой переменной, а на оси ординат – соответствующее ему значение зависимой. Постройте перпендикуляры к этим проекциям и найдите первую точку. Отметьте ее, обведите мягким карандашом или ручкой. Точно также постройте все остальные точки.

Полученная совокупность точек и называется корреляционным полем . Проанализируйте полученный график, сделайте выводы о наличии сильной или слабой причинно-следственной связи, либо ее отсутствии.

Обратите внимание на случайные отклонения от графика. Если в целом прослеживается линейная или другая зависимость, но всю «картину» портят одна-две точки, оказавшиеся в стороне от общей совокупности, их можно случайными ошибками и не учитывать при интерпретации графика.

Если вам необходимо построить и проанализировать поле корреляции для большого количества данных, воспользуйтесь программами, предназначенными для работы с электронными таблицами, например, Excel, или приобретите специальные программы.

Взаимосвязь нескольких величин, во время которой изменения одной приводит к изменению остальных, называется корреляцией. Она бывает простой, множественной или частичной. Это понятие принято не только в математике, но и в биологии.

Слово корреляция произошло от латинского correlatio, взаимосвязь. Все явления, события и предметы, а также характеризующие их величины связаны между собой. Корреляционная зависимость отличается от функциональной тем, что в этом типе зависимости, каких-либо могут быть измерены только в среднем, приближенно.Корреляционная зависимость предполагает, что переменная величина соответствует изменениям независимой величины лишь с определенной степенью вероятности. Степень зависимости носит название коэффициента корреляции.В понятие корреляции - это соотношение строения и функций отдельных частей организма.Довольно часто понятием корреляция пользуются статистики. В статистке это взаимоотношение между статистическими величинами, рядами и группами. Для определения наличия или отсутствия или наличия корреляции используют специальный метод. Метод корреляции применяется для определения прямого или обратного в изменениях чисел в рядах, которые сравнивают. Когда найден, то саму меру или степень параллелизма. Но внутренние причинно-следственные факторы таким путем не отыскиваются. Основная задача статистики как науки - обнаруживать такие причинные зависимости другим наукам.По форме корреляционная связь может быть линейной или нелинейной, положительной и отрицательной. Когда с увеличением или убыванием одной из переменных другая так же растет или убывает, то взаимосвязь линейна. Если же при изменении одной величины, характер изменений другой нелинеен, то это корреляция нелинейна.Положительной корреляция считается тогда, когда повышение уровня одной величины сопровождается повышением уровня другой. Например, когда усиление звука сопровождается ощущением повышения его тона.Корреляция, когда рост уровня одной переменной сопровождается снижением уровня другой, называется отрицательной. В сообществах повышенный уровень тревожности особи приводит к тому, что снижается вероятность занять этой особью главенствующей ниши среди собратьев.Когда связь переменных отсутствует, корреляция носит названий нулевой.

Видео по теме

Источники:

  • Нелинейная корреляция в 2019

Корреляцией называют взаимную зависимость двух случайных величин (чаще - двух групп величин), при которой изменение одной из них приводит и к изменению другой. Коэффициент корреляции показывает, насколько вероятно изменение второй величины при смене значений первой, т.е. степень ее зависимости. Самый простой способ вычисления этой величины - воспользоваться соответствующей функцией, встроенной в табличный редактор Microsoft Office Excel.

Вам понадобится

Инструкция

Запустите Excel и откройте документ, содержащий группы данных, коэффициент корреляции между которыми требуется вычислить. Если такого документа еще не создано, то введите данные в - табличный редактор создает ее автоматически при запуске программы. Каждую из групп значений, корреляция между которыми вас интересует, вводите в отдельную колонку. Это не обязательно должны быть соседние колонки, вы свободны оформить таблицу наиболее удобным образом - добавить дополнительные столбцы с пояснениями к данным, заголовки колонок, итоговые ячейки с суммарными или средними значениями и т.д. Можно даже располагать данные не в вертикальном (в колонках), а в горизонтальном (в строках) направлении. Единственное требование, которое надо соблюдать - ячейки с данными каждой группы должны располагаться последовательно одна за другой, чтобы таким образом создавался непрерывный массив.

Перейдите в ячейку, которая должна будет содержать значение корреляции данных двух массивов, и кликните в меню Excel закладку «Формулы». В группе команд «Библиотека функций» щелкните по самой последней пиктограмме - «Другие функции». Раскроется выпадающий список, в котором вам следует перейти в раздел «Статистические» и выбрать функцию КОРРЕЛ. В результате откроется окно мастера функций с формой, предназначенной для заполнения. Это же окно можно вызвать и без вкладки «Формулы», просто щелкнув по пиктограмме вставки функции, размещенной левее строки формул.

Укажите первую группу коррелирующих данных в поле «Массив1» мастера формул. Чтобы ввести диапазон ячеек вручную наберите адрес первой и последней клеток, разделив их двоеточием (без пробелов). Другой вариант - просто выделите нужный диапазон мышкой, а нужную запись в это поле формы Excel поместит самостоятельно. Такую же операцию надо проделать и со второй группой данных в поле «Массив2».

Нажмите кнопку OK. Табличный редактор рассчитает и отобразит значение корреляции в ячейке с формулой. При необходимости вы можете сохранить этот документ для дальнейшего использования (сочетание клавиш Ctrl + S).