Тест: Бесплатный тест по статистике. Средние величины и показатели вариации. Методы анализа основной тенденции в рядах динамики

Среднее есть абстрактная типическая характеристика всей совокупности. Оно уничтожает, погашает, сглаживает случайные и неслучайные колебания, влияние индиви­дуальных особенностей и позволяет представить в одной величине, некоторую общую характеристику реальной совокупности единиц. Основное условие научного использования средних заключается в том, чтобы каждое среднее характеризовало такую совокупность единиц, которая в существенном отношении, и в первую очередь в отношении осредняемых значений признака, была бы качественно однородной. Среди всего многообразия средних практически наибо­лее часто используемой считается среднее арифметическое.

Среднее арифметическое. Среднее арифметическое есть частное от деления суммы всех значений признака на их число. Обознача­ется оно х. Формула для вычисления имеет вид

По следующим данным вычислим среднее число газет, читаемых ежедневно индивидами в выборке, из 10 человек:

Формула (1) для сгруппированных данных преобразуется в следующую:

где n t - частота для i -го значения признака.

Если находят среднюю для интервального ряда.распределения, то в качестве значения признака для каждого интервала условно принимают его середину.

Процедуру вычисления среднего по сгруппированным данным удобно выполнять по следующей схеме (табл. 3).

Существует ряд упрощенных приемов вычисления средних. На с. 163 как промежуточный этап рассмотрено вычисление среднего методом отсчета от условного нуля.

Пример. Вышеприведенные данные о количестве прочитанных газет (см. с. 159) сгруппируем следующим образом:

Медиана. Медианой называется значение признака у той еди­ницы совокупности, которая расположена в середине ряда частот­ного распределения.

Если в ряду четное число членов (2k), то медиана равна средне­му арифметическому из двух серединных значений признака. При нечетном числе членов (2k+ 1) медианным будет значение призна­ка у (k + 1) объекта.

Предположим, что в выборке из 10 человек респонденты проранжированы по стажу работы на данном предприятии:

Серединные ранги 5 и 6, поэтому медиана равна

В интервальном ряду с различными значениями частот вычисление медианы распадается на два этапа: сначала находят медиан­ный интервал, которому соответствует первая из накопленных ча­стот, превышающая половину всего объема совокупности, а затем находят значение медианы по формуле

где Х0 - начало (нижняя граница) медианного интервала; d - ве­личина медианного интервала; n = Sn t - сумма частот (относитель­ных частот) интервалов; n н - частота (относительная), накоплен­ная до медианного интервала; n мe - частота (относительная) меди­анного интервала.


Проведем вычисление по данным табл. 2, где в нижней строке приведены накопленные относительные частоты. Первая из них, превышающая половину совокупности (100/2 = 50%), равна 57,9%. Следовательно, медиана принадлежит интервалу 3-4 года. По­этому

Таким образом, для данной выборки медиана, равная 3,7 года, показывает, что 50% семей имеют соотношение возрастов, меньшее этой величины, а другие 50%-большее. Медиана может быть легко определена графически по кумуляте распределения (см. рис. 3).

Медиана может быть применена для дискретных переменных, хотя дробные значения часто не имеют непосредственной содержа­тельной интерпретации.

По данным распределения рабочих по тарифным разрядам см. с. 156) вычислим медиану этого распределения, используя приведенную выше формулу 1 8 . Получим

Узнали, что 50% рабочих имеют разряд, меньший 3,1, и 50%-больший.

Медиана, как уже отмечалось, делит упорядоченный вариацион­ный ряд на две равные по численности группы.

Наряду с медианой можно рассматривать величины, называемые квантилями, которые делят ряд распределения на 4 равные части, на 10 и т. д.

Квантили, которые делят ряд на 4 равные по объему совокупно­сти, называются квартилями. Различают нижний Q1/4 и верхний квартили (рис. 6). Величина Q 1/2 является медианой. Вычисле­ние квартилей совершенно аналогично вычислению медианы:

где х 0 - минимальная граница интервала, содержащего нижний (верхний) квартиль; n н - частота (относительная частота), накоп­ленная до квартального интервала; n Q - частота (относительная частота) квартального интервала; d - величина квартального ин­тервала.

Процентили делят множество наблюдений на 100 частей с рав­ным числом наблюдений в каждой. Децили делят множество наблю­дений на десять равных частей. Квантили легко вычисляются по распределению накопленных частот (по кумуляте).

Мода. Модой в статистике называется наиболее часто встречаю­щееся значение признака, т. е. значение, с которым наиболее веро­ятно можно встретиться в серии зарегистрированных наблюдений. В дискретном ряду мода (Мо) - это значение с наибольшей частотой.

В интервальном ряду (с равными интервалами) модальным яв­ляется класс с наибольшим числом наблюдений. Значение моды находится в его пределах и вычисляется по формуле

где х 0 - нижняя граница модального интервала; d - величина ин­тервала; n- - частота интервала, предшествующего модальному; n Мо - частота модального класса; n + - частота интервала, следую­щего за модальным.

В совокупностях, в которых может быть произведена лишь опе­рация классификации объектов по какому-нибудь качественному признаку, вычисление моды является единственный способом ука­зать некий центр тяжести совокупности.

К недостаткам моды следует отнести следующие: невозможность совершать над ней алгебраические действия; зависимость ее величи­ны от интервала группировки; возможность существования в ряду распределения нескольких модальных значений признака (см., например, рис. 4, в).

Сравнение средних . Целесообразность использования того или иного типа средней величины зависит по крайней мере от следующих условий: цели усреднения, вида распределения, уровня измерения признака, вычислительных соображений. Цель усреднения свя­зана с содержательной трактовкой рассматриваемой задачи. Однако форма распределения может существенно усложнить исследование средних. Если для симметричного распределения (см. рис. 4, а) мода, медиана и среднее арифметическое тождественны, то для асимметричного распределения это не так. На выбор средней мо­жет повлиять и вид распределения. Например, для ряда с откры­тыми конечными интервалами нельзя вычислять среднее арифмети­ческое, но если распределение близко к симметричному, можно под­считать тождественную ему в этом случае медиану.

Метод группировок позволяет изучить состояние и взаимосвязи экономических явлений, если группы будут охарактеризованы показателями, раскрывающими наиболее существенные стороны изучаемого явления.

При анализе и планировании необходимо опираться не на случайные факты, а на показатели, выражающие основное, типичное, коренное. Такую характеристику дают различные виды средних величин, а также мода и медиана.

Вопрос об однородности совокупности не должен решаться формально по форме ее распределения. Его, как и вопрос о типичной средней, нужно решать, исходя из причин и условий, формирующих совокупность. Однородной является такая совокупность, единицы которой формируются под воздействием общих главных причин и условий, определяющих общий уровень данного признака, характерный для всей совокупности.

Согласно теории типологических группировок, решающее значение в оценке однородности совокупности принадлежит не форме распределения, а размеру вариации и условиям ее формирования. Для качественно однородной совокупности характерна вариация в определенных пределах, после чего начинается новое качество. Вместе с тем к этим границам для оценки качественной однородности совокупности надо подходить с точки зрения существа дела, а не формально, так как одно и то же количество в разных условиях выражает новое качество. Например, при одной и той же численности рабочих предприятия одних отраслей промышленности являются крупными, а других – мелкими.

Для всестороннего и углубленного изучения явлений, для объективной характеристики типов явлений, их взаимоотношений и процессов, обусловленных развитием системы как целого, необходимо сочетать групповые средние с общими средними. Сочетание таких средних и является одним из основных элементов анализа сложных систем. Это сочетание связывает в одно целое два органически дополняющих друг друга статистических метода: метод средних величин и метод группировки. При расчете средней индивидуальные варьирующие по группе значения заменяются одним средним значением. При этом случайные отклонения значения признака по отдельным единицам в сторону увеличения или уменьшения взаимно уравновешиваются и погашают друг друга, а в величине средней проявляется типичный размер признака, свойственный данной группе. Средняя величина служит характеристикой совокупности и в то же время относится к отдельному ее элементу – носителю качественных особенностей явления. Значение средней вполне конкретно, но одновременно и абстрактно; оно получено путем абстрагирования от случайного индивидуального по каждой единице с целью выявления того общего, типичного, что свойственно всем единицам и что формирует данную совокупность. При расчете средней величины численность единиц совокупности должна быть достаточно большой. Величина средней определяется как отношение общего объема явлений к числу единиц совокупности в группе. Для несгруппированных данных это будет средняя арифметическая простая:

а для сгруппированных данных, где каждое значение признака имеет свою частоту, – средняя арифметическая взвешенная:

где X i – значение признака; f i – частота этих значений признака.

Поскольку средняя арифметическая рассчитывается как отношение суммы значений признака к общей численности, она никогда не выходит за пределы этих значений. Средняя арифметическая обладает рядом свойств, которые широко используются в целях упорядочения расчетов.

1. Сумма отклонений индивидуальных значений признака от средней величины всегда равна нулю:

Доказательство. n

Разделив левую и правую часть на

2. Если значения признака (X i) изменить в k раз, то средняя арифметическая также изменится в x раз.

Доказательство.

Среднюю арифметическую из новых значений признака обозначим X, тогда:

Постоянную величину 1/k можно вынести за знак суммы, и тогда получим:

3. Если из всех значений признака X i вычесть или прибавить одно и то же постоянное число, то средняя арифметическая уменьшится или увеличится на эту величину.

Доказательство.

Средняя из отклонений значений признака от постоянного числа будет равна:

Точно так же доказывается это и в случае прибавления постоянного числа.

4. Если частоты всех значений признака уменьшить или увеличить в n раз, то средняя не изменится:

При наличии данных об общем объеме и известных значениях признака, но неизвестных частотах для определения среднего показателя используют формулу среднеарифметической взвешенной.

Например, имеются данные о ценах реализации капусты и общей выручке за различные сроки реализации (табл. 1).

Таблица 1.

Цена реализации капусты и общая выручка за различные сроки реализации


Так как средняя цена представляет отношение общей выручки к общему объему реализованной капусты, то вначале следует определить количество реализованной капусты по разным срокам реализации как отношение выручки к цене, а затем уже определить среднюю цену реализованной капусты.

В нашем примере средняя цена будет:

Если рассчитать в данном случае среднюю цену реализации по средней арифметической простой, то получим иной результат, который исказит истинное положение и завысит среднюю цену реализации, так как не будет учтен тот факт, что большая доля в реализации приходится на позднюю капусту с более низкой ценой.

Иногда требуется определить среднюю величину, когда значения признака даются в виде дробных чисел, т. е. обратных целым числам (например, при изучении производительности труда через обратный его показатель, трудоемкость). В таких случаях целесообразно использовать формулу средней гармонической:

Так, среднее время, необходимое для изготовления единицы продукции, есть средняя гармоническая. Если Х 1 = 1/4 часа, Х 2 = 1/2 часа, Х 3 = 1/3 часа, то средняя гармоническая этих чисел есть:

Для расчета средней величины из отношений двух одноименных показателей, например темпов роста, применяется средняя геометрическая, рассчитанная по формуле:

где Х 1 x Х 2 … x … Х 4 – отношение двух одноименных величин, например цепных темпов роста; n – численность совокупности отношений темпов роста.

Рассмотренные средние величины обладают свойством маорантности:

Пусть, например, имеем следующие значения Х (20; 40), тогда рассмотренные ранее виды средних величин будут равны:

При изучении состава совокупности о типичном размере признака можно судить по так называемым структурным средним – моде и медиане.

Модой называется наиболее часто встречающееся значение признака в совокупности. В интервальных вариационных рядах сначала находят модальный интервал. В найденном модальном интервале мода рассчитывается по формуле:

где Х 0 – нижняя граница модального интервала; d – величина интервала; f 1 , f 2 , f 3 – частоты предмодального, модального и послемодаль-ного интервалов.

Значение моды в интервальном ряду довольно просто можно отыскать на основе графика. Для этого в самом высоком столбце гистограммы от границ двух смежных столбцов проводят две линии. Из точки пересечения этих линий опускают перпендикуляр на ось абсцисс. Значение признака на оси абсцисс и будет модой (рис. 2).


Рис. 2

Для решения практических задач наибольший интерес представляет обычно мода, выраженная в виде интервала, а не дискретным числом. Объясняется это назначением моды, которая должна выявить наиболее распространенные размеры явления.

Средняя – величина, типичная для всех единиц однородной совокупности. Мода – тоже типичная величина, но она определяет непосредственно размер признака, свойственный хотя и значительной части, но все же не всей совокупности. Она имеет большое значение для решения некоторых задач, например для прогнозирования того, какие размеры обуви, одежды должны быть предназначены для массового производства, и т. д.

Медиана – значение признака, находящееся посредине ранжированного ряда. Она указывает на центр распределения единиц совокупности и делит ее на две равные части.

Медиана является лучшей характеристикой центральной тенденции, когда границы крайних интервалов открыты. Медиана является более приемлемой характеристикой уровня распределения и в том случае, если в ряду распределения имеются чрезмерно большие или чрезмерно малые значения, которые оказывают сильное влияние на среднюю величину, а на медиану – нет. Медиана, кроме того, обладает свойством линейного минимума: сумма абсолютных значений отклонений величины признака у всех единиц совокупности от медианы минимальная, т. е.

Это свойство имеет большое значение для решения некоторых практических задач – например, для расчета самого короткого из всех возможных расстояний для разных видов транспорта, для размещения станций техобслуживания таким образом, чтобы расстояние до всех обслуживаемых данной станцией машин было минимальным, и т. п.

При отыскании медианы сначала определяется ее порядковый номер в ряду распределения:

Далее, соответственно порядковому номеру, по накопленным частотам ряда находят саму медиану. В дискретном ряду – без всякого расчета, а в интервальном ряду, зная порядковый номер медианы, по накопленным частотам отыскивается медианный интервал, в котором путем простейшего приема интерполяции определяется уже значение медианы. Расчет медианы осуществляется по формуле:

где Х 0 – нижняя граница медианного интервала; d – величина интервала; f _ 1 – частота, накопленная до медианного интервала; f – частота медианного интервала.

Рассчитаем среднюю величину, моду и медиану на примере интервального распределения. Данные приведены в табл. 2.


Таким образом, в качестве центра распределения могут быть использованы различные показатели: средняя величина, мода и медиана,


и каждая из этих характеристик имеет свои особенности. Так, для средней величины характерно то, что все отклонения от нее отдельных значений признака взаимно погашаются, т. е.

Для медианы характерно то, что сумма отклонений индивидуальных значений признака от нее (без учета знаков) является минимальной. Мода же характеризует наиболее часто встречающееся значение признака. Поэтому в зависимости от того, какая из особенностей интересует исследователя, и должна выбираться одна из рассмотренных характеристик. В отдельных случаях рассчитываются все характеристики.

Их сравнение и выявление соотношений между ними помогает выяснить особенности распределения того или иного вариационного ряда. Так, в симметричных рядах, как в нашем случае, все три характеристики (средняя, мода и медиана) примерно совпадают. Чем больше расхождение между модой и средней величиной, тем более асимметричен ряд. Установлено, что для умеренно асимметричных рядов разность между модой и средней арифметической примерно в три раза превышает разность между медианой и средней арифметической:

Это соотношение можно использовать для определения одного показателя по двум известным. Из этого следует, что сочетание моды, медианы и средней важно и для характеристики типа распределения.

где – соответственно максимальное и минимальное значение признака в совокупности;

– число групп.

Наглядно ряды распределения можно представить при помощи их графического изображения. Для этой цели строят полигон, гистограмму, кумулятивную кривую, огиву.

ТЕМА 4. Абсолютные и относительные величины

Понятие статистического показателя и его виды

Статистический показатель – это количественно-качественная обобщающая характеристика, какого-то свойства группы единиц или совокупности в целом в конкретных условиях места и времени. В отличие от признака, статистический показатель получается расчетным путем. Это может быть простой подсчет единиц совокупности, суммирование значений признака, сравнение двух и нескольких величин, более сложные сравнения.

1. По охвату единиц совокупности статистические показатели подразделяются:


2. По способу расчета статистические показатели подразделяются:

3. По пространственной определенности статистические показатели подразделяются:


По форме выражения статистические показатели подразделяются:

Абсолютные величины

Абсолютная величина (показатель) – это число, которое выражает размер, объем явления в конкретных условиях места и времени. Абсолютные величины всегда являются именованными величинами, т. е. имеют какую-либо единицу измерения. В зависимости от выбранной единицы измерения различают следующие виды абсолютных величин:

1. Натуральные – характеризуют объем и размер явления в мерах длины, веса, объема, количеством единиц, числом событий. Натуральные показатели используются для характеристики объема, размера отдельных одноименных видов продукции, в связи, с чем их использование ограничено.

2. Условно-натуральные – используются в том случае, если необходимо перевести разные виды продукции, но одинакового значения в один условный показатель. Условно-натуральный показатель рассчитывают путем перемножения натурального показателя на коэффициент перевода (пересчета). Коэффициенты перевода пересчета берутся из справочников или рассчитываются самостоятельно. Условно-натуральные показатели используются для характеристики объема, размера однородной продукции, в связи, с чем их использование ограничено.

3. Трудовые – имеют такие единицы измерения, как чел.-час., чел.-день. Используются для определения затрат рабочего времени, для расчета заработной платы и производительности труда.

4. Стоимостные (универсальные) измеряются в денежных единицах соответствующей страны. Стоимостные показатели = количество продукции в натуральном выражении * цена единицы продукции. Стоимостные показатели являются универсальными, так как позволяют определить объем, размер разного вида продукции.

Недостатки абсолютных показателей: нельзя охарактеризовать качественные особенности и структуру изучаемого явления, для этого используются относительные показатели, которые рассчитываются на основе абсолютных показателей.

Относительные величины

Относительный показатель – это показатель, который представляет собой частное от деления одного абсолютного показателя на другой и дает числовую меру соотношения между ними.


Неименованные О. П.

1. Коэффициент получается в том случае, если база сравнения равна 1. Если коэффициент больше 1, то он показывает во сколько раз сравниваемая величина больше, базы сравнения . Если коэффициент меньше 1 , то он показывает какую часть базы сравнения составляет сравниваемая величина .

2. Процент, получатся в том случае, если база сравнения равна 100. Процент получают умножением коэффициента на 100.

3. Промилле (‰) – если база сравнения равна 1000. Получают умножением коэффициента на 1000. Промилле используются для того, чтобы избежать дробных значений показателей. Они широко используются в демографической статистике, где показатели смертности, рождаемости, браков определяются на 1000 человек.

4. Продецимилле (‰0)если база сравнения равна 10000. Получают умножением коэффициента на 10000. Например, сколько приходится врачей, больничных коек на 10000 человек.

Виды относительных величин (показателей):

1. Относительный показатель структуры:

Данный показатель рассчитывается по группированным данным и показывает долю отдельных частей в общем объеме совокупности. Может выражаться в форме коэффициента (доли) или процента (удельные веса). Пример, 0,4 – доля, 40% – удельный вес. Сумма всех долей равна 1, а удельных весов 100%.

2. Относительный показатель динамики:

.

Данный показатель показывает изменение явления во времени. Выражается в форме коэффициента – коэффициент роста, и форме процента – темп роста.

3. Относительный показатель выполнения плана:

Данный показатель показывает степень выполнения плана и выражается в форме %.

Относительный показатель планового задания:

Данный показатель показывает, какое планируется изменение показателя в будущем по сравнению с предшествующем периодом и выражается в форме процента.

Взаимосвязь между показателями: .

5. Относительный показатель координации:

Данный показатель может рассчитываться на 1, 10, 100 единиц и показывает, сколько единиц одной части приходится в среднем на 1, 10, 100 единиц другой части. Например, численность городского населения на 1, 10, 100 жителей села

6. Относительный показатель интенсивности:

Данный показатель рассчитывается путем сравнения разноименных показателей, находящихся в определенной взаимосвязи между собой. Данный показатель может рассчитываться на 1, 10, 100 единиц и является именованным показателем. Например, плотность населения – чел./1, 10, 100 км2.

7. Относительный показатель сравнения:

Данный показатель рассчитывается путем сравнения одноименных показателей относящихся к одному и тому же периоду времени, но к разным объектам или территориям. Выражается в форме коэффициента и процента.

ТЕМА 5. Средние величины и показатели вариации

1. Средняя величина: понятие и виды

Средняя величина – это обобщающий показатель, характеризующий типичный уровень варьирующего количественного признака на единицу совокупности в определенных условиях места и времени.

Условия расчета средней величины:

1. Совокупность, по которой рассчитывается средняя величина, должна быть достаточно большой, иначе случайные отклонения в величине признака не будут погашаться и средняя не проявит закономерности, свойственной данному процессу.

2. Совокупность, по которой рассчитывается средняя величина, должна быть качественно однородной, иначе они не только не будут иметь научной ценности, но и могут принести вред, искажая истинный характер изучаемого явления.

3. Общая средняя величина должна дополняться групповыми средними. Общая средняя показывает типический размер всей совокупности, а групповые средние − отдельных ее частей со специфическими свойствами.

4. Для всесторонней характеристики явления должна быть рассчитана система средних показателей, по наиболее существенным признакам.

Средняя величина всегда именованная, она имеет ту же размерность, что и усредняемый признак.

Виды средних величин:

1. Степенные средние (к ним относятся средняя арифметическая, средняя гармоническая, средняя квадратическая, средняя геометрическая);

2. Структурные средние (мода и медиана).

Степенные средние рассчитываются по формуле (корень в степени R из средних всех вариантов взятых в какой-то степени):

где − степенная средняя величина исследуемого признака;

− индивидуальное значение усредняемого признака;

− показатель степени средней;

− число признаков (единичной совокупности);

− сумма.

В зависимости от степени получают различные виды простых средних.

Значение

Наименование простой средней

простая гармоническая

где П – произведение

простая геометрическая

простая арифметическая

простая квадратическая

Чем выше показатель степени () в степенной средней, тем больше величина самой средней. Если рассчитать все эти средние по одним и тем же данным получим следующее соотношение:

Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется правилом мажорантности средних.

Из этих видов средних наиболее часто используется средняя арифметическая и средняя гармоническая. Выбор вида средней зависит от исходной информации.

Средняя арифметическая: способы расчета и ее свойства

Средняя арифметическая – это частное от деления суммы индивидуальных значений признака всех единиц совокупности на число единиц совокупности.

Средняя арифметическая применяется в форме простой средней и взвешенной средней. Средняя арифметическая простая рассчитывается по формуле:

где − среднее значение признака;

индивидуальные значения признака (варианты);

− число единиц совокупности (вариант).

Средняя арифметическая простая применяется в двух случаях:

· когда каждая варианта встречается только один раз в ряду распределения;

· когда все частоты равны между собой.

Средняя арифметическая взвешенная используется, когда частоты не равны между собой:

где − частоты или веса (числа, показывающие, сколько

раз встречаются индивидуальные значения

признака).

Свойства средней арифметической (без доказательств):

1. Средняя величина от постоянной величины равна ей самой: .

2. Произведение средней величины на сумму частот равно сумме произведения вариантов на их частоты: .

3. Если каждую варианту увеличить или уменьшить на одну и ту же величину, то средняя величина увеличится или уменьшится на эту же величину: .

4. Если каждую варианту увеличить или уменьшить в одно и то же число раз, то средняя величина увеличится или уменьшится в то же число раз: .

5. Если все частоты увеличить или уменьшить в одинаковое число раз, средняя величина не изменится: .

6. Средняя величина суммы равна сумме средних величин: .

7. Сумма отклонений всех значений признака от средней величины рана нулю.

3. Способы расчета средней гармонической

В некоторых случаях характер исходных данных такой, что расчет средней арифметической теряет смысл и единственным обобщающим показателей может быть средняя гармоническая.

Виды средней гармонической:

1. Средняя гармоническая простая рассчитывается по формуле:

Средняя гармоническая простая используется очень редко, только для расчета средних затрат времени на изготовление единицы продукции при условии, если частоты всех вариант равны.

2. Средняя гармоническая взвешенная рассчитывается по формуле:

.

где – весь объем явления.

Средняя гармоническая взвешенная используется, если известен весь объем явления, но не известны частоты. Эта гармоническая используется для расчета средних качественных показателей: средней заработной платы, средней цены, средней себестоимости, средней урожайности, средней производительности труда.

4. Структурные средние: мода и медиана

Структурные средние (мода, медиана) применяются для изучения внутреннего строения и структуры рядов распределения значений признака.

Мода − наиболее часто встречающееся значение признака у единиц совокупности. В ряду распределения, где каждая варианта встречается один раз, мода не рассчитывается. В дискретном ряду модой является варианта с наибольшей частотой . Для интервального ряда с равными интервалами мода рассчитывается по формуле:

.

где − начальная (нижняя) граница модального интервала;

− величина соответственно модального, до – и послемодального интервалов

− частота модального, до – и послемодального интервалов соответственно.

Модальный интервал – это интервал, который имеет наибольшую частоту.

Медиана – это значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные части по числу единиц: одна часть имеет значения признака меньше медианы, а другая больше медианы.

Ранжированный ряд – это расположение значений признака в порядке возрастания или убывания.

В дискретном ранжированном ряду, где каждая варианта встречается один раз, а число вариант не четное номер медианы определяется по формуле:

где – число членов ряда.

В дискретном ранжированном ряду, где каждая варианта встречается один раз и число вариант четное медианой будет средняя арифметическая из двух вариант, расположенных в середине ранжированного ряда.

В дискретном ранжированном ряду, где каждая варианта встречается несколько раз, номер медианы определяется по формуле:

Затем, начиная с первой варианты, последовательно суммируются частоты, до тех пор пока не получите .

Для интервального ряда медиана рассчитывается по формуле:

,

где − нижняя граница медианного интервала;

− величина медианного интервала;

общее число единиц совокупности;

− накопленная частота до медианного интервала;

− частота медианного интервала.

Медианный интервал – это такой интервал, в котором его накопленная частота равна или превышает полусумму всех частот ряда.

5. Показатели вариации

Вариация признака – это различие индивидуальных значений признака внутри изучаемой совокупности. Вариация признака характеризуется показателями вариации. Показатели вариации дополняют средние величины, характеризуют степень однородности статистической совокупности по данному признаку, границы вариации признака. Соотношение показателей вариации определяет взаимосвязь между признаками.

Показатели вариации подразделяются на:

1) Абсолютные: размах вариации; среднее линейное отклонение; среднее квадратическое отклонение; дисперсия. Они имеют те же единицы измерения, что и значения признака

2) Относительные: коэффициент осцилляции, коэффициент вариации, относительное линейное отклонение.

Размах вариации показывает, на какую величину изменяется значение признака:

где – максимальное значение признака;

– минимальное значение признака.

Среднее линейное отклонение и среднее квадратическое отклонение показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.

Среднее линейное отклонение определяется:

– простое; – взвешенное.

Дисперсия определяются:

– простая; – взвешенная;

– простое; – взвешенное.

Если средняя величина признака рассчитывалась по простой арифметической, тогда рассчитываются по простой формуле, если средняя рассчитывалась по взвешенной, тогда рассчитываются по взвешенной формуле.

Дисперсия и среднее квадратическое отклонение также могут рассчитываться по другой формуле:

– простая; – взвешенная.

Для сравнения вариации различных признаков в одной и той же совокупности или же одного и того же признака в разных совокупностях рассчитывается относительный показатель вариации, именуемый коэффициентом вариации :

Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

6. Виды дисперсий и закон (правило) сложения дисперсий

Если изучаемая совокупность состоит из нескольких групп, образованных на основе какого-либо признака, то помимо общей дисперсии определяют также межгрупповую дисперсию

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью – неизвестную, а также судить о силе влияния группировочного признака.

Эмпирический коэффициент детерминации показывает долю, обусловленную вариацией группировочного признака, в общей вариации изучаемого признака:

Эмпирическое корреляционное отношение показывает влияние признака, положенного в основание группировки, на вариацию результативного признака:

Эмпирическое корреляционное отношение варьирует в пределах от 0 до 1. При связи нет, при – связь полная. Промежуточные значения оцениваются в зависимости от их близости к предельным значениям.

ТЕМА 6. Ряды динамики

1. Ряды динамики: понятие и виды

Ряд динамики (хронологический ряд, динамический ряд, временной ряд) – это ряд числовых значений статистического показателя расположенных в хронологической последовательности. Ряд динамики состоит из двух элементов (граф):

1. время (t) – это моменты (даты) или периоды (годы, кварталы, месяцы, сутки) времени, к которым относятся статистические показатели (уровни ряда).

2. уровень ряда (y) – значения статистического показателя, характеризующие состояние явления на указанный момент времени или за период времени.

Уровень ряда y

Виды рядов динамики:

1. По времени:

А) интервальные – ряды, уровни которых характеризуют размер явления за период времени (сутки, месяц, квартал, год). Примером такого ряда могут служить данные о динамике производства продукции, количества отработанных человеко-дней и т. д. Абсолютные уровни интервального ряда суммировать можно, сумма имеет смысла, что позволяет получать ряды динамики более укрупненных периодов.

Б) моментные – ряды, уровни которых характеризуют размер явления на дату (момент) времени. Примером такого ряда могут служить данные о динамике численности населения, численности скота, величины запаса, стоимости основных средств, оборотных активов и т. д. Уровни моментного ряда суммировать нельзя, сумма не имеет смысла, так как последующий уровень полностью или частично включает в себя предыдущий уровень.

2. По форме представления (способу выражения) уровней:

А) ряды абсолютных величин.

Б) ряды относительных величин. Относительными величинами характеризуются, например, динамика доли городского и сельского населения (%) и уровня безработицы.

В прошлом уроке, и поняли, что она знает многое, кто не понял, забыл или прошел мимо, может перейти по ссылке и освежить свои знания)). Но в теории статистики есть еще одно очень интересное изречение. В мире есть три вида лжи – ложь, наглая ложь и… СТАТИСТИКА!!!

Совершенно противоречивое утверждение другое – статистика знает все . Но отчасти в нем есть доля правды. Все дело в данных, которые были собраны для обработки.

Но об этом поговорим позже…

Однако вернемся к статистическим категориям. Категории или основные статистические термины важная часть науки. И дело здесь в том, что эти термины регулярно употребляются в процессе обработки и анализа данных. Именно в этом кроется их такая важность для статистической науки.

Статистическая совокупность – это группа социально-экономических объектов или явлений общественной жизни объединенных общей связью, но отличающихся друг от друга отдельными признаками. Это наиболее часто встречающее определение совокупности. Включает в себя ее особенности, и что очень важно и другие статистические категории. Попытаемся упростить или понять, что же такое совокупность на примере.
Совокупность это некоторое объединение элементов или явлений или людей и т.п. Мало того что в совокупности как правило много частей или элементом (всегда больше одного), так еще все они в чем-то похожи. Так вот эта похожесть и есть признак, по которому объединили эти элементы. Общее у элементов одно, и масса других характеристик отличающихся.



Вот небольшой такой пример. На картинке у нас изображены условно люди. Это совокупность людей – по этому признаку их и объединили в совокупность. Однако все мы разные и у нас масса признаков, которые отличают нас друг от друга – пол, возраст, образование, семейное положение, уровень доходов, место жительства и так далее.
Вообще в совокупность можно объединить разные элементы, лишь бы было что изучать:
— совокупность школьников – общее учатся в школе, а различия пол, возраст, класс, место учебы и многое другое;
— совокупность деревьев в лесу – общее это деревья, различия возраст, разновидность дерева, высота и т.п.;
— совокупность предприятий – общее предприятия, различия, отрасль, число работников, объем выпуска, объем прибыли и др.
И таких примеров можно привести огромное количество.

Задание. Предположим на картинке представлена совокупность студентов. Опишите ее, почему она является совокупностью, какие есть признаки у студентов. Нет ли на картинке лишних элементов, не относящихся к данной совокупности?

И последний очень важный термин вариация!
Вариация – это колебания признака статистической совокупности. В статистике говорят – признак колеблется или ВАРЬИРУЕТСЯ.
Вариация признака это основа статистической науке. Не было бы вариации, не было бы статистики. Именно потому что признаки изменяются и происходит их изучении. Если не было бы изменений и отличий и все было одинаковым, то изучать было бы нечего и статистики не было.

А дальше мы перейдем к . Но прежде домашние задания.

Контрольное задание. Приведите примеры двух трех совокупностей, выделите в них единицы совокупности и охарактеризуйте их признаками. Приведите пример статистических показателей и вариации признака.

Доклад – Органы государственной статистики в РФ – функции, задачи, структура. – Федеральная служба государственной статистики — http://www.gks.ru/

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

хорошую работу на сайт">

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Задача 1

В некотором регионе в текущем году было совершено 12 390 преступлений, а в предыдущем году - 11 800 преступлений. Вычислите (в %) темп роста и темп прироста количества преступлений, зарегистрированных в текущем году по отношению к предыдущему. Рассчитайте также коэффициенты преступности за каждый год, если численность населения региона в конце предыдущего года составляла 1 475 000, а в конце текущего года - 1 770 000 чел. Сделайте выводы о динамике преступности в регионе.

Решение: Для получения точной картины преступности огромное значение имеет такой показатель преступности, как динамика, то есть изменение во времени. Динамика преступности характеризуется понятиями абсолютный рост (или снижение) и темпы роста и прироста преступности, для определения которых производится вычисление этих характеристик согласно определенным формулам.

Темпы роста преступности рассчитываются на основе базисных показателей динамики, что предполагает сопоставление данных за ряд лет (а иногда десятилетий, если нужен широкий охват материала) с постоянным базисом, под которым понимается уровень преступности в начальном для анализа периоде. Такой расчет позволяет криминологам в значительной мере гарантировать сопоставимость относительных показателей, вычисляемых в процентах, которые показывают, каким образом соотносится преступность последующих периодов с предыдущим.

В расчете за 100 % принимаются данные исходного года; показатели, полученные за последующие годы, отражают только процент прироста, что делает расчет точным, а картину более объективной; при оперировании относительными данными удается исключить влияние на снижение или рост преступности увеличения или снижения численности жителей, достигших возраста уголовной ответственности.

Темп прироста преступности вычисляется в процентах. Темп прироста преступности показывает, насколько увеличился или уменьшился последующий уровень преступности по сравнению с предыдущим периодом. Принято условное обозначение вектора темпа прироста: если процентное соотношение возрастает, ставится знак "плюс", если снижается - ставится знак "минус".

Применительно к условиям нашей задаче следует применить соответствующие формулы и вычислить рост и прирост преступности.

1) Темп роста преступности исчисляется по формуле^

Тр=U/U2 * 100 %,

где U - показатель уровня преступности, а U2 - показатель уровня преступности предшествующего периода. Так темп роста преступности по условиям задачи составит - 12390/11800*100 %=1,05 %.

2) Темп прироста преступности рассчитывается по следующей формуле:

Тпр=Тр-100 %.

Так темп прироста по условиям задачи составит 1,05 %-100 %= 98,95 %.

Коэффициент преступности - это конкретный обобщающий показатель общего количества учтенных преступлений, соотнесенного с численностью населения. Он расшифровывается как число преступлений на 100 тыс., 10 тыс. или 1 тыс. населения и является объективным измерителем преступности, позволяющим сопоставлять ее уровни в разных регионах и в разные годы.

Коэффициент преступности помогает более адекватно оценить и динамику уровня преступности, рассчитанного на душу населения.

Коэффициент преступности рассчитывается по формуле:

КП = (П х 100000): Н,

где П - абсолютное число учтенных преступлений; а Н - абсолютная численность всего населения.

Оба показателя берутся в одном и том же территориальном и временном объеме. Число преступлений обычно рассчитывается на 100 тыс. населения. Но при малых числах преступлений и населения (в городе, районе, на предприятии) коэффициент преступности может рассчитываться на 10 тыс. или на 1 тыс. жителей. в любом случае эти числа означают размерность рассматриваемого коэффициента, которая обязательно указывается: число преступлений на 100 тыс. или 10 тыс. населения.

Рассчитаем коэффициент преступности применительно к условиям нашей задачи:

1) КП= (12390*100000): 1 770 000 чел. = 700 (в текущем году).

2) КП= (11800*100000): 1 475 000 = 800 (в предыдущем году).

Преступность в регионе снижается, поскольку, анализируя коэффициент преступности, можно сделать вывод, что при увеличении населения в регионе (на 16,6 %), и незначительном увеличении количества преступлений на 1,05 %, в целом прирост преступности снижается (-98,95 %).

Задача 2

Возраст 11 молодых специалистов учреждения, принятых на службу, в текущем году составил соответственно 19,25,21,23,23,23,25,20,18,20,21 лет. Произведите сводку и группировку данных в виде статистической таблицы частот. Для наглядности постройте полигон частот, а также найдите модальное, медианное и среднее значение возраста принятых сотрудников.

Решение: Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка - это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Метод группировки основывается на следующих категориях - это группировочный признак, интервал группировки и число групп.

Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Определение числа групп .

Число групп приближенно определяется по формуле Стэрджесса:

n = 1 + 3,2log n = 1 + 3,2log(11) = 4.

Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности. Xmin - минимальное значение группировочного признака. Определим границы группы.

Номер группы

Нижняя граница

Верхняя граница

Одно и тоже значение признака служит верхней и нижней границами двух смежных (предыдущей и последующей) групп.

Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.

№ совокупности

Частота fi

Полигон частоты - это график плотности и вероятности случайной величины, представляет собой ломанную соединяющую точки, соответствующие срединным значениям интервалов группировки частотам этих интервалов.

Среднее значение :

Мода льное значение. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

где x 0 - начало модального интервала; h - величина интервала; f 2 - частота, соответствующая модальному интервалу; f 1 - предмодальная частота; f 3 - послемодальная частота.

Выбираем в качестве начала интервала 19.75, так как именно на этот интервал приходится наибольшее количество.

Наиболее часто встречающееся значение ряда - 20.92.

Медиана . Медиана делит выборку на две части: половина вариант меньше медианы, половина - больше.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 19.75-21.5, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Таким образом, 50 % единиц совокупности будут меньше по величине 21.28.

Задача 3

Определите требуемый объем выборки для исследования среднего возраста аттестованных сотрудников ФСИН России при условии, что среднее квадратическое отклонение составляет 10 лет, а максимально допустимая ошибка выборки не должна превышать 5 %.

Решение ищем по формуле определения численности выборки для повторного отбора.

Ф(t) = г/2 = 0.95/2 = 0.475 и этому значению по таблице Лапласа соответствует t=1.96.

Оценка среднеквадратического отклонения s = 10; ошибка выборки е = 5.

Задача 4

В следующей таблице даны официальные ведомственные статистические сведения о распределении осужденных по срокам заключения (наказания) за 2002-2011 годы, размещенные на официальном сайте ФСИН России: www.fsin.su. Найдите размах и коэффициент вариации количества осужденных за каждый календарный год и сделайте выводы об однородности структуры данного статистического признака.

Основным показателем, характеризующим однородность данных, является коэффициент вариации. В статистике принято считать, что, если значение коэффициента менее 33 %, то совокупность данных является однородной, если более 33 %, то - неоднородной.

Коэффициент вариации

Поскольку v ? 30 %, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.

Срок наказания

От 1 до 3 лет

От 3 до 5 лет

От 5 до 10 лет

От 10 до 15 лет

Свыше 15 лет

Максимальное значение (функция МАКС)

Минимальное значение (функция МИН)

Размах вариации

Среднее значение (функция СРЗНАЧ)

Среднее квадратическое отклонение (функция СТАНДАР ЛОНА)

Коэффициент вариации

Простая средняя :

Мода льное значение

Медиана

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 70580. Следовательно, медиана Me = 70580.

Показатели вариации . .

R = X max - X min .

R = 295916-2250 = 293666.

Среднее линейное отклонение

Каждое значение ряда отличается от другого в среднем на 90895.71.

Дисперсия

(средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 103008 в среднем на 107169.83.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>

или

Коэффициент осцилляции

Простая средняя :

Мода

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76186. Следовательно, медиана Me = 76186.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 291112-3101 = 288011.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 83422.69.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 97334.29 в среднем на 100750.25.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя :

Мода льное значение. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 71093. Следовательно, медиана Me = 71093.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 243852-3856 = 239996.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 68998.08.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 85765.57 в среднем на 82541.55.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

:

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 74588. Следовательно, медиана Me = 74588.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min ,

R = 242984-5304 = 237680.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 73148.73.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 92104.14 в среднем на 82873.1.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76678. Следовательно, медиана Me = 76678

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 249346-6536 = 242810.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 79680.53.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 99551.71 в среднем на 87389.04.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76461. Следовательно, медиана Me = 76461.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 254722-6704 = 248018.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 82302.82.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 102346.71 в среднем на 89787.88.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 78959. Следовательно, медиана Me = 78959.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 261334-7635 = 253699.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 83791.55.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 104898.86 в среднем на 91616.15.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 75916. Следовательно, медиана Me = 75916.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 263863-8145 = 255718.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 82767.96.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 103440.71 в среднем на 91207.92.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 78019. Следовательно, медиана Me = 78019.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 260094-7798 = 252296.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 77827.76.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 99212.29 в среднем на 88081.39.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 72248. Следовательно, медиана Me = 72248.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 242137-7173 = 234964.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 70459.02.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 91375.14 в среднем на 80674.43.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Задача 5

В условиях предыдущей задачи произведите перегруппировку заданных интервалов сроков наказания с целью улучшения относительных показателей вариации признака в 2010 году. Постройте гистограммы распределения осужденных по срокам заключения (наказания) за 2010 год до и после произведенной группировки данных и сделайте выводы об однородности структуры исследуемого статистического признака.

Решение:

Поскольку v>30 %, но v<70 %, то вариация умеренная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична.

Совершим перегруппировку данных следующим образом:

В группу 1) входит группы: до года, год, от 1-3 лет соответственно 156978.

В группу 2) входит от группы свыше 3 до 5 лет полностью и 1\5 от группы свыше 5 до 10 лет получаем 1\5*260094+168651=220669,8.

В группу 3) входит 3\5 группы от 5 до 10 т.е. 3\5*260094=156056,4.

Группа 4) (1\5*260094)+(1\5*78019)=67622,6.

Группа 5) 3\5*78019=46811,4.

Группа 6 30744+(1\5*78019)=46347,8.

Гистограмма. Для получения вывода о однородности исследуемого статистического признака Вычислим коэффициент вариации:

Поскольку v>30 %, но v<70 %, то вариация умеренная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична.

Задача 6

Изложить в краткой форме (тезисно, на 1-2 страницах) содержание и результаты недавнего официального статистического исследования в социально-правовой сфере (тематика - на Ваш выбор, ссылки на Интернет-ресурсы - обязательны), сделать выводы и выдвинуть соответствующие статистические гипотезы на краткосрочную перспективу.

В качестве официального статистического исследования было взято исследование о просроченной задолженности по заработной плате на 1 декабря 2015 года.

На 1 декабря 2015 г., по сведениям организаций (не относящихся к субъектам малого предпринимательства), суммарная задолженность по заработной плате по кругу наблюдаемых видов экономической деятельности составила3900 млн. рубл ей и по сравнению с 1 ноября 2015 г. увеличилась на 395 млн. рублей (на 11,3 %).

Просроченная задолженность по заработной плате из-за отсутствия у организаций собственных средств на 1 декабря 2015г. составила3818 млн. рубл ей , или 97,9 % общей суммы просроченной задолженности. По сравнению с 1 ноября 2015г. она увеличилась на 389 млн. рублей (на 11,3 %). Задолженность из-за несвоевременного получения денежных средств из бюджетов всех уровней составила82 млн. рубл ей и увеличилась по сравнению с 1 ноября 2015г. на 6 млн. рублей (на 7,7 %), в том числе задолженность из федерального бюджета составила 62 млн. рублей и снизилась по сравнению с 1 ноября 2015г. на 6 млн. рублей (на 8,6 %),бюджетов субъектов Российской Федерации составила 1,1 млн. рублей (увеличение на 0,2 млн. рублей или на 20,7 %), местных бюджетов - 19 млн. рублей (увеличение на 12 млн. рублей, или в 2,5 раза).

В добыче полезных ископаемых, обрабатывающих производствах, здравоохранении и предоставлении социальных услуг, рыболовстве и рыбоводстве 100 % просроченной задолженности по заработной плате образовано из-за нехватки у организаций собственных средств.

В общем объеме просроченной задолженности по заработной плате 37 % приходится на обрабатывающие производства, 29 % - на строительство, 9 % - на производство и распределение электроэнергии, газа и воды, 7 % - на транспорт, 6 % - на добычу полезных ископаемых, 5 % - на сельское хозяйство, охоту и предоставление услуг в этих областях, лесозаготовки.

Объем просроченной задолженности по заработной плате на 1 декабря 2015г. составил менее 1 % месячного фонда заработной платы работников наблюдаемых видов экономической деятельности.

Задолженность по заработной плате за последний месяц , за который производились начисления, в общем объеме просроченной задолженности составила в среднем 29 %: производстве и распределении электроэнергии, газа и воды - 75 %, деятельности в области образования - 37 %, здравоохранения и предоставления социальных услуг - 35 %, научных исследований и разработок - 32 %, строительства - 29 %, транспорта - 23 %, обрабатывающих производствах - 22 %.

Из общей суммы невыплаченной заработной платы на долги, образовавшиеся в 2014г.,приходится 457 млн. рублей (11,7 %), в 2013г. и ранее - 657 млн. рублей (16,8 %).

В целом наблюдая картину задолженности по заработной плате в динамике (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif), можно сделать вывод что значительный спад придется на январь, февраль 2016 года.

Основной процент задолженности приходится на обрабатывающие производства - 37 %, 29 % - на строительство скорее всего это происходит в связи со снижением потребительского спроса на продукцию, соответственно уменьшается прибыль.

Выдвинем гипотезу. С января 2016 года процент задолженности будет сокращаться, в связи с распределением годового бюджета на будущий год с учетом частичного погашения задолженности по заработной плате, и составит 2700 млн. динамика преступность вариация медианное

Для проверки гипотезы (За основу берем данный таблицы http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif).

Построим дискретный вариационный ряд. Для этого отсортируем ряд по возрастанию и подсчитаем количество повторения для каждого элемента ряда.

Вычислим среднюю:

Вычислим дисперсию. Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Используя односторонний критерий с б = 0,05, проверить эту гипотезу, если в выборке из n =24 месяца средний показатель оказался равным 2741,25, а дисперсия известна и равна у =193469,27

Решение . Среднеквадратическое отклонение:

Выдвигается нулевая гипотеза H 0 о том, что значение математического ожидания генеральной совокупности равно числу м 0: = 2700.

Альтернативная гипотеза:

H 1: м? 2700, критическая область - двусторонняя.

Для проверки нулевой гипотезы используется случайная величина:

где x - выборочное среднее; S - среднеквадратическое отклонение генеральной совокупности.

Если нулевая гипотеза верна, то случайная величина T имеет стандартное нормальное распределение. Критическое значение статистики T определяется исходя из вида альтернативной гипотезы:

P(|T|

Найдем экспериментальное значение статистики T:

Поскольку объем выборки достаточно большой (n>30), то вместо истинного значения среднеквадратического отклонения можно использовать его оценку S=439.851.

Ф(t кр)=(1-б)/2 = (1-0.05)/2 = 0.475.

По таблице функции Лапласа найдем, при каком t kp значение Ф(t kp) = 0.475.

Экспериментальное значение критерия T не попало в критическую область T ? t kp , поэтому нулевую гипотезу следует принять. Значение математического ожидания генеральной совокупности можно принять равным 2700

Список используемой литературы

1. Казанцев С.Я. Правовая статистика: Учебник / Под ред. С.Я. Казанцева, С.Я. Лебедева - М.: ЮНИТИ-ДАНА: Закон и право, 2009 г.

2. Курыс?в К.Н. Основы правовой статистики: учеб. пособие / К.Н. Курыс?в; ВЮИ ФСИН России. - Владимир, 2005. - 44 с.

3. Макарова Н.В. Статистика в Exсel: учеб. пособие / Н.В. Макарова, В.Я. Трофимец. - М.: Финансы и статистика.

4. Кондратюк Л.В., Овчинский В.С. Криминологическое измерение /под ред. К.К. Горяинова. - М.: Норма, 2008.

5. Яковлев В.Б. Статистика. Расчеты в Microsoft Excel: учеб. Пособие для вузов / В.Б. Яковлев. - М.: Колосc, 2005. - 352 c.

Размещено на Allbest.ru

...

Подобные документы

    Исследование преступности несовершеннолетних с позиций объекта криминологического исследования. Взаимосвязь подросткового алкоголизма, токсикомании, наркомании и преступности. Причины и условия и пути профилактики преступности несовершеннолетних.

    курсовая работа , добавлен 08.04.2011

    Методика конкретного криминологического исследования. Криминологическая характеристика насильственной преступности и ее предупреждение. Общественная опасность и тяжесть причиняемых последствий насильственных преступлений. Статистика преступности.

    контрольная работа , добавлен 15.01.2011

    Формула расчета коэффициента преступности. Расчет среднегодовой нагрузки на одного судью, среднего срока расследования уголовных дел, среднегодовых темпов роста преступности. Расчет показателей моды, медианы, вариации и среднеквадратического отклонения.

    контрольная работа , добавлен 20.04.2011

    Изучение основ корыстной преступности: понятие, элементы, объекты и субъективные стороны. Описание социального и специально-криминологического предупреждения преступности из корыстных побуждений. Разработка комплекса мер по предупреждению преступлений.

    дипломная работа , добавлен 09.11.2012

    Понятие и предмет криминологического прогнозирования. Установление возможных изменений в состоянии, уровне, структуре и динамике преступности в будущем. Оценка развития преступности в перспективе. Планирование борьбы с преступностью, ее предупреждение.

    курсовая работа , добавлен 29.05.2015

    Исследование видов криминологического прогнозирования и проектирования в сфере преступности. Особенности прогнозирования преступности несовершеннолетних в Республике Казахстан. Разработка программ борьбы с преступностью на общегосударственном уровне.

    дипломная работа , добавлен 25.10.2015

    Преступность несовершеннолетних как объект криминологического исследования. Основные, криминологические характеристики преступности несовершеннолетних. Состояние преступности. Особенности личностной характеристики несовершеннолетних.

    реферат , добавлен 01.04.2003

    Тенденции криминального поведения современных женщин: рост и устойчивый удельный вес тяжких и рецидивных преступлений, омоложение преступниц и увеличение количества женщин пожилого возраста среди осужденных. Общие меры предупреждения женской преступности.

    реферат , добавлен 01.03.2014

    Расчет относительных показателей структуры и координации категорий осужденных по степени тяжести совершенных преступлений. Коэффициенты преступности и судимости по федеральным округам и в целом по России. Расчет показателей динамики с помощью MS Excel.

    контрольная работа , добавлен 31.07.2011

    Понятие, виды, значения, детерминанты латентной преступности, причины ее возникновения, предупреждение и способы сокращения. Определение уровня и анализ структуры преступности. Системный подход в изучении латентной преступности как социального явления.