Квадрат абсолютного отклонения. Среднее линейное и среднее квадратическое отклонение. Отрывок, характеризующий Среднеквадратическое отклонение

    Часто эти два показателя путают, а иногда и принимают их за одно и то же. Давайте разберемся.

    Формула (темпа роста) выглядит следующим образом:

    Темп роста = (Текущее значение / Предыдущее значение) * 100%.

    А вот для того, чтобы определить темп прироста, нужно:

    Темп прироста = (Темп роста - 1) * 100%

    Темп прироста можно найти и так: из полученного результата (темпа роста) отнимаем 100 % (положительное значение будет говорить о приросте, отрицательное - об убыли).

    Итак, темп роста показывает, как увеличивается (растет) показатель в рассматриваемом периоде, а именно во сколько раз он изменяется (возможны три варианта: увеличивается, снижается или же остается на прежнем уровне) по сравнению с предыдущим значением.

    А вот темп прироста нам уже показывает то, на сколько показатель в текущем периоде отличается от показателя в предыдущем периоде (при этом показатель может быть как положительным, так и отрицательным: прирост или же убыль).

    За октябрь 2014 года в восточном региона продажи составили 300000, а за ноябрь этого же года - уже 600000.

    Темп роста составил сразу 200 %: (600000/300000) х 100%.

    Темп прироста за ноябрь месяц в жтом регионе составил 100 % (200 100).

    темп роста = значение отчетного года / значение базового (предыдущего) года * 100%

    темп прироста = (значение базового (предыдущего) года - значение отчетного года) /значение отчетного года *100%

    1. Высчитать разницу между двумя сравниваемыми периодами (назовем их первый и второй)
    2. Эту разницу разделить на исходное число (первый период) и умножить то, что получилось на 100.

    Если результатом стало отрицательное число, то это говорит о процентном снижении.

    В статистических отчтах часто используются такие показатели, как Темп роста и Темп прироста . Они измеряются в процентах и отражают, насколько изменилось значение той или иной величины за определнный период времени.

    Темп роста

    Это показатель, который отражает, сколько процентов составляет рост статистической величины в текущем периоде по сравнению с предыдущим.

    Пусть П1 - значение прошлого периода, а П2 - значение текущего периода.

    Для расчта темпа роста используется следующая формула :

    Темп роста = (П2 / П1) * 100%.

    Здесь возможны 3 варианта:

    1) Темп роста > 100% - положительная динамика.

    2) Темп роста = 100% - изменений не произошло.

    3) Темп роста lt; 100% - отрицательная динамика.

    Темп прироста

    Это показатель, отражающий, на сколько процентов изменилась величина в текущем периоде по сравнению с предыдущим.

    Для расчта темпа прироста используется следующая формула :

    Темп прироста = (П2 / П1) * 100% - 100%.

    Если значение положительное, то можно говорить о росте значения величины (темп прироста). Если значение отрицательное - имеет место снижение (темп снижения).

    Пример

    Рассмотрим показатели, отражающие величину прибыли организации в 2015 и 2016 годах.

    Здесь в 2016 году был прирост у 1 показателя (на 10%) и снижение у 2 показателя (на 16,67%).

При анализе развития явлений часто возникает потребность дать обобщенную характеристику интенсивности развития на длительный период. Для чего используют средние показатели динамики:

1. Средний абсолютный прирост находится по формуле:

где n - число периодов (уровней), включая базисный.

2. Средний темп роста вычисляется по формуле средней геометрической простой из цепных коэффициентов роста:

, .

Когда приходится производить расчет средних темпов роста по периодам различной продолжительности (неравноотстоящие уровни), то используют среднюю геометрическую, взвешенную по продолжительности периодов. Формула средней геометрической взвешенной будет иметь вид:

где t – интервал времени, в течение которого сохраняется данный темп роста.

3. Средний темп прироста не может быть определен непосредственно на основании последовательных темпов прироста или показателей среднего абсолютного прироста. Для его вычисления необходимо сначала найти средний темп роста, а затем его уменьшить на 100%:

Пример 7.1 . Имеются данные о приростах объемов продаж по месяцам (в процентах к предыдущему месяцу): январь – +4,5, февраль – +5,2, март – +2,4, апрель – -2,1.

Определить темпы роста и прироста за 4 месяца и среднемесячные значения.

Решение: имеем данные о цепных темпах прироста. Преобразуем их в цепные темпы роста по формуле: Т р = Т р + 100%.

Получим следующие значения: 104,5; 105,2; 102,4; 97,9

Для расчётов используются только коэффициенты роста: 1,045; 1,052; 1,024; 0,979.

Произведение цепных коэффициентов роста дают базисный темп роста.

К = 1,045·1,052·1,024·0,979 = 1,1021

Темп роста за 4 месяца Т р = 1,1021·100= 110,21%

Темп прироста за 4 месяца Т пр = 110,21 – 100 = +10,21%

Средний темп роста находим по формуле средней геометрической простой:

Средний темп роста за 4 месяца = 1,0246·100= 102,46%

Средний темп прироста за 4 месяца = 102,46 – 100 = +2,46%

4. Средний уровень интервального ряда находится по формуле средней арифметической простой, если интервалы равны, или по средней арифметической взвешенной, если интервалы не равны:

, .

где t - длительность интервала времени.

5. Средний уровень моментного ряда динамики так исчислить нельзя, так как отдельные уровни содержат элементы повторного счета.

а) Средний уровень моментного равноотстоящего ряда динамики находится по формуле средней хронологической:

.

где у 1 и у n - значения уровней на начало и конец периода (квартала, года).

б) Средний уровень моментных рядов динамики с неравноотстоящими уровнями определяется по формуле средней хронологической взвешенной:

где t - длительность периода между смежными уровнями.

Пример 7.2 . Имеются следующие данные об объёмах производства продукции за первый квартал (тыс.шт.) - январь - 67, февраль – 35, март – 59. Определить среднемесячный объем производства за 1 квартал.

Решение: по условию задачи имеем интервальный ряд динамики с равными периодами. Среднемесячный объем производства находится по формуле средней арифметической простой:

тыс.шт.

Пример 7.3 . Имеются следующие данные об объёмах производства продукции за первое полугодие (тыс.т.) - среднемесячный объем за 1 квартал - 42, апрель – 35, май – 59, июнь – 61. Определить среднемесячный объем производства за полугодие.

Решение: по условию задачи имеем интервальный ряд динамики с неравными периодами. Среднемесячный объем производства находится по формуле средней арифметической взвешенной:

Пример 7.4 . Имеются следующие данные об остатках товаров на складе, млн. руб.: 1.01 – 17; на 1.02 – 35; на 1.03 – 59; на 1.04 – 61.

Определить среднемесячный остаток сырья и материалов на складе предприятия за I квартал.

Решение: По условию задачи имеем моментный ряд динамики с равноотстоящими уровнями, поэтому средний уровень ряда будет исчислен по формуле средней хронологической:

млн.руб.

Пример 7.5 . Имеются следующие данные об остатках товаров на складе, млн. руб.: 1.01.11 – 17; на 1.05 – 35; на 1.08 – 59; на 1.10 – 61, на 1.01.12 – 22.

Определить среднемесячный остаток сырья и материалов на складе предприятия за год.

Решение: По условию задачи имеем моментный ряд динамики с неравноотстоящими уровнями, поэтому средний уровень ряда будет исчислен по формуле средней хронологической взвешенной.

Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом . В то же время не все так плохо. При увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной. Поэтому при работе с большими размерами выборок можно использовать формулу выше.

Язык знаков полезно перевести на язык слов. Получится, что дисперсия — это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Разгадка заключается всего в трех словах.

Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который необходим для других видов статистического анализа. У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных. Без бутылки, как говорится, не разберешься.

{module 111}

Дабы вернуть дисперсию в реальность, то есть использовать в более приземленных целей, из нее извлекают квадратный корень. Получается так называемое среднеквадратичное отклонение (СКО) . Встречаются названия «стандартное отклонение» или «сигма» (от названия греческой буквы). Формула стандартного отклонения имеет вид:

Для получения этого показателя по выборке используют формулу:

Как и с дисперсией, есть и немного другой вариант расчета . Но с ростом выборки разница исчезает.

Среднеквадратичное отклонение, очевидно, также характеризует меру рассеяния данных, но теперь (в отличие от дисперсии) его можно сравнивать с исходными данными, так как единицы измерения у них одинаковые (это явствует из формулы расчета). Но и этот показатель в чистом виде не очень информативен, так как в нем заложено слишком много промежуточных расчетов, которые сбивают с толку (отклонение, в квадрат, сумма, среднее, корень). Тем не менее, со среднеквадратичным отклонением уже можно работать непосредственно, потому что свойства данного показателя хорошо изучены и известны. К примеру, есть такое правило трех сигм , которое гласит, что у данных 997 значений из 1000 находятся в пределах ±3 сигмы от средней арифметической. Среднеквадратичное отклонение, как мера неопределенности, также участвует во многих статистических расчетах. С ее помощью устанавливают степень точности различных оценок и прогнозов. Если вариация очень большая, то стандартное отклонение тоже получится большим, следовательно, и прогноз будет неточным, что выразится, к примеру, в очень широких доверительных интервалах.

Коэффициент вариации

Среднее квадратическое отклонение дает абсолютную оценку меры разброса. Поэтому чтобы понять, насколько разброс велик относительно самих значений (т.е. независимо от их масштаба), требуется относительный показатель. Такой показатель называется коэффициентом вариации и рассчитывается по следующей формуле:

Коэффициент вариации измеряется в процентах (если умножить на 100%). По этому показателю можно сравнивать самых разных явлений независимо от их масштаба и единиц измерения. Данный факт и делает коэффициент вариации столь популярным.

В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. Мне здесь трудно что-то прокомментировать. Не знаю, кто и почему так определил, но это считается аксиомой.

Чувствую, что я увлекся сухой теорией и нужно привести что-то наглядное и образное. С другой стороны все показатели вариации описывают примерно одно и то же, только рассчитываются по-разному. Поэтому разнообразием примеров блеснуть трудно, Отличаться могут лишь значения показателей, но не их суть. Вот и сравним, как отличаются значения различных показателей вариации для одной и той же совокупности данных. Возьмем пример с расчетом среднего линейного отклонения (из ). Вот исходные данные:

И график для напоминания.

По этим данным рассчитаем различные показатели вариации.

Среднее значение – это обычная средняя арифметическая.

Размах вариации – разница между максимумом и минимумом:

Среднее линейное отклонение считается по формуле:

Стандартное отклонение:

Расчет сведем в табличку.

Как видно, среднее линейное и среднеквадратичное отклонение дают похожие значения степени вариации данных. Дисперсия – это сигма в квадрате, поэтому она всегда будет относительно большим числом, что, собственно, ни о чем не говорит. Размах вариации – это разница между крайними значениями и может говорить о многом.

Подведем некоторые итоги.

Вариация показателя отражает изменчивость процесса или явления. Ее степень может измеряться с помощью нескольких показателей.

1. Размах вариации – разница между максимумом и минимумом. Отражает диапазон возможных значений.
2. Среднее линейное отклонение – отражает среднее из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины.
3. Дисперсия – средний квадрат отклонений.
4. Среднеквадратичное отклонение – корень из дисперсии (среднего квадрата отклонений).
5. Коэффициент вариации – наиболее универсальный показатель, отражающий степень разброса значений независимо от их масштаба и единиц измерения. Коэффициент вариации измеряется в процентах и может быть использован для сравнения вариации различных процессов и явлений.

Таким образом, в статистическом анализе существует система показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных (расчет доверительных интервалов

Математическое ожидание и дисперсия

Пусть мы измеряем случайную величину N раз, например, десять раз измеряем скорость ветра и хотим найти среднее значение. Как связано среднее значение с функцией распределения?

Будем кидать игральный кубик большое количество раз. Количество очков, которое выпадет на кубике при каждом броске, является случайной величиной и может принимать любые натуральные значения от 1 до 6. Среднее арифметическое выпавших очков, подсчитанных за все броски кубика, тоже является случайной величиной, однако при больших N оно стремится ко вполне конкретному числу – математическому ожиданию M x . В данном случае M x = 3,5.

Каким образом получилась эта величина? Пусть в N испытаниях раз выпало 1 очко, раз – 2 очка и так далее. Тогда При N → ∞ количество исходов, в которых выпало одно очко, Аналогично, Отсюда

Модель 4.5. Игральные кости

Предположим теперь, что мы знаем закон распределения случайной величины x , то есть знаем, что случайная величина x может принимать значения x 1 , x 2 , ..., x k с вероятностями p 1 , p 2 , ..., p k .

Математическое ожидание M x случайной величины x равно:

Ответ. 2,8.

Математическое ожидание не всегда является разумной оценкой какой-нибудь случайной величины. Так, для оценки средней заработной платы разумнее использовать понятие медианы, то есть такой величины, что количество людей, получающих меньшую, чем медиана, зарплату и большую, совпадают.

Медианой случайной величины называют число x 1/2 такое, что p (x < x 1/2) = 1/2.

Другими словами, вероятность p 1 того, что случайная величина x окажется меньшей x 1/2 , и вероятность p 2 того, что случайная величина x окажется большей x 1/2 , одинаковы и равны 1/2. Медиана определяется однозначно не для всех распределений.

Вернёмся к случайной величине x , которая может принимать значения x 1 , x 2 , ..., x k с вероятностями p 1 , p 2 , ..., p k .

Дисперсией случайной величины x называется среднее значение квадрата отклонения случайной величины от её математического ожидания:

Пример 2

В условиях предыдущего примера вычислить дисперсию и среднеквадратическое отклонение случайной величины x .

Ответ. 0,16, 0,4.

Модель 4.6. Стрельба в мишень

Пример 3

Найти распределение вероятности числа очков, выпавших на кубике с первого броска, медиану, математическое ожидание, дисперсию и среднеквадратичное отклонение.

Выпадение любой грани равновероятно, так что распределение будет выглядеть так:

Среднеквадратичное отклонение Видно, что отклонение величины от среднего значения очень велико.

Свойства математического ожидания:

Пример 4

Найти математическое ожидание суммы и произведения очков, выпавшей на двух кубиках.

В примере 3 мы нашли, что для одного кубика M (x ) = 3,5. Значит, для двух кубиков

Свойства дисперсии:

  • Дисперсия суммы независимых случайных величин равно сумме дисперсий:

D x + y = D x + D y .

Пусть за N бросков на кубике выпало y очков. Тогда

Этот результат верен не только для бросков кубика. Он во многих случаях определяет точность измерения математического ожидания опытным путем. Видно, что при увеличении количества измерений N разброс значений вокруг среднего, то есть среднеквадратичное отклонение, уменьшается пропорционально

Дисперсия случайной величины связана с математическим ожиданием квадрата этой случайной величины следующим соотношением:

Найдём математические ожидания обеих частей этого равенства. По определению,

Математическое же ожидание правой части равенства по свойству математических ожиданий равно

Среднее квадратическое отклонение

Среднеквадратическое отклонение равно квадратному корню из дисперсии:
При определении среднего квадратического отклонения при достаточно большом объеме изучаемой совокупности (n > 30) применяются формулы:

Похожая информация.


В данной статье я расскажу о том, как найти среднеквадратическое отклонение . Этот материал крайне важен для полноценного понимания математики, поэтому репетитор по математике должен посвятить его изучению отдельный урок или даже несколько. В этой статье вы найдёте ссылку на подробный и понятный видеоурок, в котором рассказано о том, что такое среднеквадратическое отклонение и как его найти.

Среднеквадратическое отклонение дает возможность оценить разброс значений, полученных в результате измерения какого-то параметра. Обозначается символом (греческая буква «сигма»).

Формула для расчета довольно проста. Чтобы найти среднеквадратическое отклонение, нужно взять квадратный корень из дисперсии. Так что теперь вы должны спросить: “А что же такое дисперсия?”

Что такое дисперсия

Определение дисперсии звучит так. Дисперсия — это среднее арифметическое от квадратов отклонений значений от среднего.

Чтобы найти дисперсию последовательно проведите следующие вычисления:

  • Определите среднее (простое среднее арифметическое ряда значений).
  • Затем от каждого из значений отнимите среднее и возведите полученную разность в квадрат (получили квадрат разности ).
  • Следующим шагом будет вычисление среднего арифметического полученных квадратов разностей (Почему именно квадратов вы сможете узнать ниже).

Рассмотрим на примере. Допустим, вы с друзьями решили измерить рост ваших собак (в миллиметрах). В результате измерений вы получили следующие данные измерений роста (в холке): 600 мм, 470 мм, 170 мм, 430 мм и 300 мм.

Вычислим среднее значение, дисперсию и среднеквадратическое отклонение.

Сперва найдём среднее значение . Как вы уже знаете, для этого нужно сложить все измеренные значения и поделить на количество измерений. Ход вычислений:

Среднее мм.

Итак, среднее (среднеарифметическое) составляет 394 мм.

Теперь нужно определить отклонение роста каждой из собак от среднего :

Наконец, чтобы вычислить дисперсию , каждую из полученных разностей возводим в квадрат, а затем находим среднее арифметическое от полученных результатов:

Дисперсия мм 2 .

Таким образом, дисперсия составляет 21704 мм 2 .

Как найти среднеквадратическое отклонение

Так как же теперь вычислить среднеквадратическое отклонение, зная дисперсию? Как мы помним, взять из нее квадратный корень. То есть среднеквадратическое отклонение равно:

Мм (округлено до ближайшего целого значения в мм).

Применив данный метод, мы выяснили, что некоторые собаки (например, ротвейлеры) – очень большие собаки. Но есть и очень маленькие собаки (например, таксы, только говорить им этого не стоит).

Самое интересное, что среднеквадратическое отклонение несет в себе полезную информацию. Теперь мы можем показать, какие из полученных результатов измерения роста находятся в пределах интервала, который мы получим, если отложим от среднего (в обе стороны от него) среднеквадратическое отклонение.

То есть с помощью среднеквадратического отклонения мы получаем “стандартный” метод, который позволяет узнать, какое из значений является нормальным (среднестатистическим), а какое экстраординарно большим или, наоборот, малым.

Что такое стандартное отклонение

Но… все будет немного иначе, если мы будем анализировать выборку данных. В нашем примере мы рассматривали генеральную совокупность. То есть наши 5 собак были единственными в мире собаками, которые нас интересовали.

Но если данные являются выборкой (значениями, которые выбрали из большой генеральной совокупности), тогда вычисления нужно вести иначе.

Если есть значений, то:

Все остальные расчеты производятся аналогично, в том числе и определение среднего.

Например, если наших пять собак – только выборка из генеральной совокупности собак (всех собак на планете), мы должны делить на 4, а не на 5, а именно:

Дисперсия выборки = мм 2 .

При этом стандартное отклонение по выборке равно мм (округлено до ближайшего целого значения).

Можно сказать, что мы произвели некоторую “коррекцию” в случае, когда наши значения являются всего лишь небольшой выборкой.

Примечание. Почему именно квадраты разностей?

Но почему при вычислении дисперсии мы берём именно квадраты разностей? Допустим при измерении какого-то параметра, вы получили следующий набор значений: 4; 4; -4; -4. Если мы просто сложим абсолютные отклонения от среднего (разности) между собой … отрицательные значения взаимно уничтожатся с положительными:

.

Получается, этот вариант бесполезен. Тогда, может, стоит попробовать абсолютные значения отклонений (то есть модули этих значений)?

На первый взгляд получается неплохо (полученная величина, кстати, называется средним абсолютным отклонением), но не во всех случаях. Попробуем другой пример. Пусть в результате измерения получился следующий набор значений: 7; 1; -6; -2. Тогда среднее абсолютное отклонение равно:

Вот это да! Снова получили результат 4, хотя разности имеют гораздо больший разброс.

А теперь посмотрим, что получится, если возвести разности в квадрат (и взять потом квадратный корень из их суммы).

Для первого примера получится:

.

Для второго примера получится:

Теперь – совсем другое дело! Среднеквадратическое отклонение получается тем большим, чем больший разброс имеют разности … к чему мы и стремились.

Фактически в данном методе использована та же идея, что и при вычислении расстояния между точками, только примененная иным способом.

И с математической точки зрения использование квадратов и квадратных корней дает больше пользы, чем мы могли бы получить на основании абсолютных значений отклонений, благодаря чему среднеквадратическое отклонение применимо и для других математических задач.

О том, как найти среднеквадратическое отклонение, вам рассказал , Сергей Валерьевич