Основные статистические категории. Статистическая совокупность, ее виды. Единицы совокупности и классификация их признаков. а) «занятое население»

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле:

где х 0 – нижняя граница интервала;

h – величина интервала;

fm – частота интервала;

f – число членов ряда;

?m- 1 – сумма накопленных членов ряда, предшествующих данному.

    Понятие вариации и её значение. Основные показатели вариации, их достоинства и значение.

Вариация - колеблемость, изменяемость величины признака у единиц совокупности. Отдельные числовые значения признака, встречающиеся в изу­чаемой совокупности, называют вариантами значений. Недостаточность средней величины для полной характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Наличие вариации обусловлено влиянием большого числа факторов на формирование уровня признака. Эти факторы действуют с неодинаковой силой и в разных направлениях. Для описания меры изменчивости признаков используют показатели вариации. Задачи статистического изучения вариации: 1) изучение характера и степени вариации признаков у отдельных единиц совокупности; 2) определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. В статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых изме­ряется вариация. Исследование вариаций имеет важное значение. Измерение вариаций необходимо при проведении выборочного наблюдения, корреляционном и дисперсионном анализе и т. д. По степени вариации можно судить об однородности совокупности, об устойчивости отдельных значений признаков и типичности средней. На их основе разрабатываются показатели тесноты связи между признаками, показатели оценки точности выборочного наблюдения. Различают вариацию в пространстве и вариацию во времени . Под вариацией в пространстве понимают колеблемость значений признака у единиц совокупности, представляющих отдельные территории. Под вариацией во времени подразумевают изменение значений признака в различные периоды времени. Для изучения вариации в рядах распределения проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Самыми простыми признаками вариации являются минимум и максимум - самое наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения (fi). Частоты удобно заменять частостями – wi. Частость - относительный показатель частоты, который может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Выражается формулой: Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение. К относительным показателям колеблемости относят коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации.

    Виды дисперсий и правило их сложения. Коэффициент детерминации и эмпирическое корреляционное отношение: экономическое значение и их расчёт.

Показатели вариации

Одних только средних недостаточно для оценки тех или иных явлений, так как средние уравнивают, сглаживают индивидуальные особенности отдельных единиц совокупности, показывают типичный для данных условий уровень варьирующих признаков, и тем самым могут затушевывать различные тенденции в развитии. В этом случае исчисляют показатели вариации ,характеризующие средние отклонения каждой единицы совокупности от среднего значения признака в целом .

Вариация имеет объективный характер и помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов, описательная характеристика которых представлена в табл. 5.6.

Дисперсия имеет ряд математических свойств, упрощающих технику ее расчета.

1. Если из всех вариант отнять какое-то постоянное число А , то дисперсия от этого не изменится.

2. Если все значения вариант разделить на какое-то постоянное число h , то дисперсия уменьшится от этого в h 2 раз, а среднее квадратическое отклонение – в h раз.

Таблица 5.6.

Показатели вариации

Название показателя

Обозначение и методика расчета

Сущностная храктеристика

по несгруппированным данным

по сгруппированным данным

Размах вариации

Улавливает только крайние отклонения значений признака, но не отражает отклонений от средней всех вариант в ряду. Чем больше размах вариации, тем менее однородна исследуемая совокупность

Среднее линейное отклонение

Представляет собой среднее арифметическое значение абсолютных отклонений признака от его среднего уровня. Чем меньше среднее линейное отклонение, тем более однородны значения признака изучаемого явления

Дисперсия

Представляет собой средний квадрат отклонений значений признака от его среднего уровня

Среднее квадратическое отклонение

Является абсолютной мерой вариации и зависит не только от степени вариации признака, но и от абсолютных уровней вариант и средней, что не позволяет непосредственно сравнивать средние квадратические отклонения вариационных рядов с разными уровнями. Оно выражается в тех именованных числах, в которых выражены варианта и средняя

Коэффициент вариации

Является относительной мерой вариации. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна (типична) средняя

Методика расчета показателя дисперсии упрощенными способами показана на рис. 5.4. Отметим, что способ моментов применим в том случае, если задан интервальный ряд с равными интервалами , а способ разности применяется в любых рядах распределения : дискретных и интервальных с равными и неравными интервалами.

Вариация признака определяется различными факторами, в результате чего различают общую дисперсию, межгрупповую дисперсию и внутригрупповую дисперсию.

Общая дисперсия (σ 2 ) измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Вместе с тем, благодаря методу группировок можно выделить и измерить вариацию, обусловленную группировочным признаком, и вариацию, возникающую под влиянием неучтенных факторов.

Межгрупповая дисперсия (σ 2 м.гр ) характеризует систематическую вариацию, т. е. различия в величине изучаемого признака, возникающие под влиянием признака – фактора, положенного в основание группировки.

Рис.5.4. Упрощенные способы расчета дисперсии

,

где k – количество групп, на которые разбита вся совокупность;

m j – количество объектов, наблюдений, включенных в группу j ;

–среднее значение признака по группе j ;

–общее среднее значение признака.

Внутригрупповая дисперсия (σ 2 j,вн.гр ) отражает случайную вариацию, т.е. часть вариации, возникающую под влиянием неучтенных факторов и независящую от признака фактора, положенного в основание группировки.

, или, на основе метода разностей ,

где x ij – значение i -ой варианты в группе j .

Если в сформированных группах отдельные данные встречаются не один раз, то для расчета внутригрупповой дисперсии используется формула средней арифметической взвешенной.

Среднее значение внутригрупповых дисперсий рассчитывается по формуле:

.

Существует закон согласно которому, общая дисперсия, возникающая под воздействием всех факторов, равна сумме дисперсии, возникающей за счет группировочного признака и дисперсии, появляющейся под влиянием всех прочих факторов. Этот закон связывает три вида дисперсии.

Правило сложения дисперсий : .

Правило сложения дисперсии широко применяется при исчислении тесноты связей между признаками (факторным и результативным). Для этого определяют эмпирический коэффициент детерминации и эмпирическое корреляционное отношение.

Эмпирический коэффициент детерминации (η 2) показывает, какая доля всей вариации признака обусловлена признаком, положенным в основание группировки . (η – греческая буква «эта»).

Эмпирическое корреляционное отношение (η ) показывает тесноту связи между признаками - группировочным и результативным.

Оно изменяется в пределах от 0 до 1. Если η = 0, то группировочный признак не оказывает влияния на результативный, если η =1,то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторов равно нулю. Характеристика связи между признаками при соответствующих значениях эмпирического корреляционного отношения приведена в табл. 5.7.

Таблица 5.7

Качественная оценка связи между признаками

  1. Понятие и классификация рядов динамики. Сопоставимость уровней и смыкание рядов динамики.

Динамика – процесс развития движения соц.эк. явлений во времени. Для её отображения строят ряды динамики. Ряд динамики представл. Собой ряд расположенных в хронологической последовательности знач. Стат. показателей, характер. развитие явления Анализ рядов динамики позволяет выявить тенденции и закономерности соц.эк развития. Ряд динамики состоит из 2-ух элементов: 1)показатели времени (t) – либо определенные даты, либо отдельные периоды (годы, кварталы и тд.) 2)Уровни ряда (y) – они отображают количественную оценку развития во времени изучаемого явления. Виды рядов динамики : 1. По времени отражаемому в динамич. Рядах они делятся на: -моментальные отображают состояние изучаемых явлений на опр даты (моменты времени) С помощью моментных рядов изучают: численность населения, стоимость осн средств, товар запасы. Уровни мом. Рядов динамики суммировать не имеет смысла, т.к. мож. Возникнуть повторный счет – интервальные – отображают итоги развития изучаемого явления за отдельные периоды (интервалы времени) : ряды динамики произ-ва прод-ции, инвестиций, затраченных средств. Уровни интервального ряда динамики абсолют. Величин мож суммировать, т.к. их можно рассматривать как итог за более длительный период времени. 2. В зависимости от способа выражения уровней ряда динамики различают ряды: - абсолютных величин, - относительных, - средних величин. 3. В зависимости от расстояния м/у уровнями различ. ряды динамики с равностоящими и не равностоящими уровнями во времени. Основ условием для получения правильных выводов при анализе ряда динамики явл-ся сопоставимость его уровней. Условия сопоставимости уров. Ряда динамики. 1)Долж. Быть обеспечена одинаковая полнота охвата различных частей явления. Уровни динамического ряда за отдельные периоды времени долж харка-вать размер явления по одному и тому же кругу, входящий в его состав частей. 2)При определении сравниваемых уровней ряда динамики необх. Использовать единую методологию их расчета. 3)Равенство периодов, за к-рые приводятся данные. 4)Необходимо использовать одинаковые единицы измерения. При харак-ки стоимостных показателей во времени долж. б. устранено влияние изменение цен необх. оценка изучаемого показ-ля в ценах одного периода (в сопоставимых ценах) 5)Исходя из цели исследов-ия данные по тер-риям, границы которые изменились долж. б. пересчитаны в старых пределах. Для приведения уровней ряда дин-ки к сопоставимому виду использ. Прием, который наз-ся Смыкание рядов динамики. Смыкание- объединение в один ряд двух или нескольких рядов динам., уровни которых исчислены по разной методике или разными территориальными границами. Чтобы произвести смыкание рядов необх, чтобы для одного из периодов (переходного) имелись данные, рассчитанные по разной методике или в разных границах.

    Показатели интенсивности изменения уровня ряда динамики. Цепной и базисный способы расчёта.

Для качественной оценки динамики, изучаемых явлений применяется ряд стат. показателей получаемых в результате сравнения уровней м/у собой. При этом сравниваемый уров. Наз-ся отчетный, а уров., с которым происх. Сравнение базисным. К основ. показателям динамики относятся абсолют. Прирост, темп роста, темп прироста, абсолют. Значение одного % прироста. В зависимости от применяемого способа сопоставления показатели динамики мог. вычисляться с постоянной и переменной базой сравнения y 1← y 2← y 3← y 4← y 5 Абсолютный прирост характ. размер увеличения или уменьшения уровня ряда динамики за определенный период времени и определ-ся как разность м/у 2-мя уровнями ряда. ∆y ц = y i – y i - 1 ∆ y б = y i – y 0 м/у цепным и базисными абсолютными приростами сущ-ет взаимосвязь: сумма ценных абсол-ых приростов равна базисному абсол-му приросту последнего периода ряда динамики. ∑∆y ц = ∆ y бп Темп роста характеризует интенсивность изменения уравнения ряда и показывает во сколько раз уров. текущего периода больше или меньше уровня предыдущего (базисного) периода или сколько % он составляет по отношению к предыдущему периоду Трц = y i /y i-1 * 100% Трб = y i /y 0 * 100% м/у цепными и базис темпами роста имеется взаимосвязь: произведение последовательных цепных коэффициентов роста равно базисному коэффициенту роста последнего периода ряда динамики. П Крц = Крб Темп прироста показывает на сколько % - ов уров. данного периода больше или меньше уровня принятого за базу сравнения: Он мож б рассчитан 2 способами: а) как отношение абсол.-го прироста к уровню, принятому за базу сравнения Тпрц = ∆ y i / y i-1 * 100% Тпрб = ∆ y i / y 0 * 100% б) как разность м/у темпом роста и 100%-ми Тпр = Тр – 100% Абсолютное значение 1% присрота показывает какая абсло-ая величина содержится в относ-ном показателе – одном % прироста. Это отношение абсло-ого прироста к темпу прироста, выраженному в %-ах. Данный показатель рассчитывается по цепным данным А % =∆ y i / Тпр % = ∆ y i / (∆ y i / y i-1)*100 = y i-1 / 100 Для получения обобщающих показателей динамики соц.эк. явлений определяют средние величины: ср уровень ряда, сред абсол-ый прирост, след темп роста, сред темп прироста. Средний уровень ряда динамики дает общую характ-ку уровня явлен. За весь период. Методы его расчета зависят от вида ряда динамики. а) для моментных рядов для ровно стоящими расчит сред. уров. ряда осущ-ся по форм. средней хронологич-кой. y` = (½ y 1 + y 2 + y 3 + ….½y n)/n-1 n – число уровней ряда. б)для моментных рядов с не равностоящими уров-ми предварительно находятся значения уровней в серединах интервалов y` 1 = y 1 + y 2 /2 ; y 2 = y 2 + y 3 /2,……..,y` n = y n-1 + y n /2 Затем определяется общий сред уров. ряда по формуле средней арифм-ой взвешенной: y` = ∑y` i * t i / ∑t i y` I – сред уровни в интервалах м/у датами, ti – длительность интервала времени м/у уровнями. в) Для интервальных рядов с равностоящими уровн-ми во времени, сред уров расситыв-ся по формуле средней арифм-кой простой y` = ∑ y i /n Средний абсолютгый прирост показывает на сколько в среднем за единицу времени увеличивается (уменьшается) уровень ряда. ∆ y i = ∑ y iц / n-1 или ∆ y i = y n – y 1 /n-1

y1 – начальный уровень ряда динамики yn – конечный уровень ряда динамики. Средний темп роста показывает во сколько раз в среднем за единицу времени изменился уровень ряда динамик. Он опред-ся по форм. средней геометрической из цепных коэф-тов роста. Т`р = n – 1 √К ц р 1 * К ц р 2 *……*К ц р n – 1 = n – 1 √ ПКр ц = n -1 √Крб = n – 1 √ y n /y 1 * x 100%

Средний темп прироста показ-ет на сколько % в среднем за единицу времени увеличился (уменьшился) уровень ряда Т`пр = Т` - 100%.

    Средние показатели ряда динамики, их расчёт.

Каждый ряд динамики можно рассматривать как некую совокупность n меняющихся во времени показателей, которые можно обобщать в виде средних величин. Такие обобщенные (средние) показатели особенно необходимы при сравнении изменений того или иного показателя в разные периоды, в разных странах и т.д.

Обобщенной характеристикой ряда динамики может служить прежде всего средний уровень ряда . Способ расчета среднего уровня зависит от того, моментный ряд или интервальный (периодный).

В случае интервального ряда его средний уровень определяется по формуле простой средней арифметической величины из уровней ряда, т.е.

Если имеетсямоментный ряд, содержащий n уровней (y1, y2, …, yn ) с равными промежутками между датами (моментами времени), то такой ряд легко преобразовать в ряд средних величин. При этом показатель (уровень) на начало каждого периода одновременно является показателем на конец предыдущего периода. Тогда средняя величина показателя для каждого периода (промежутка между датами) может быть рассчитана как полусумма значений у на начало и конец периода, т.е. как . Количество таких средних будет. Как указывалось ранее, для рядов средних величин средний уровень рассчитывается по средней арифметической. Следовательно, можно записать. После преобразования числителя получаем,

где Y1 и Yn - первый и последний уровни ряда; Yi - промежуточные уровни.

Эта средняя известна в статистике каксредняя хронологическая для моментных рядов. Такое название она получила от слова «cronos» (время, лат.), так как рассчитывается из меняющихся во времени показателей.

В случае неравных промежутков между датами среднюю хронологическую для моментного ряда можно рассчитать как среднюю арифметическую из средних значений уровней на каждую пару моментов, взвешенных по величине расстояний (отрезков времени) между датами, т.е. . В данном случае предполагается, что в промежутках между датами уровни принмали разные значения, и мы из двух известных (yi и yi+1 ) определяем средние, из которых затем уже рассчитываем общую среднюю для всего анализируемого периода. Если же предполагается, что каждое значение yi остается неизменным до следующего (i+ 1)- го момента, т.е. известна точная дата изменения уровней, то расчет можно осуществлять по формуле средней арифметической взвешенной: ,

где – время, в течение которого уровеньоставался неизменным.

Кроме среднего уровня в рядах динамики рассчитываются и другие средние показатели – среднее изменение уровней ряда (базисным и цепным способами), средний темп изменения .

Базисное среднее абсолютное изменение представляет собой частное от деления последнего базисного абсолютного изменения на количество изменений. То есть

Цепное среднее абсолютное изменение уровней ряда представляет собой частное от деления суммы всех цепных абсолютных изменений на количество изменений, то есть

По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост, спад или стабильность.

Из правила контроля базисных и цепных абсолютных изменений следует, что базисное и цепное среднее изменение должны быть равными.

Наряду со средними абсолютным изменением рассчитывается и среднее относительное тоже базисным и цепным способами.

Базисное среднее относительное изменение определяется по формуле

Цепное среднее относительное изменение определяется по формуле

Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность. Вычитанием 1 из базисного или цепного среднего относительного изменения образуется соответствующий среднийтемп изменения , по знаку которого также можно судить о характере изменения изучаемого явления, отраженного данным рядом динамики.

    Методы анализа основной тенденции в рядах динамики.

Измените уровней ряда динамики обуславливается на изучаемое явление определяющее влияние и формируют в рядах динамики основную тенденцию развития (тренд) Воздействие факторов действующих периодически вызывает повторяемые во времени колебания уровней ряда динамики. Действие разовых факторов отображается случайными (кратковременных) изменениями уровней ряда дин-ки. Т.т ряд дин-ки вкл след основ. компоненты: 1)основ тенденция (тренд) 2)циклические (периодические колебания) 3)Случайные колебания Основной тенденцией развития (трендом) наз-ся плавное и устойчивое изменения уровня явлений во времени свободное от случ. Колебний. Выявление основ тенденции изменения уровней ряда предполагает её количественное выражение в некоторой мере свободное от случайных воздействий. Для выявления тренда испо-ся различные способы сглаживания (выравнивания ряда) : 1)Метод укрепления интервалов – заключ-ся в том что первоначальный ряд динамики преобразуется в ряд более продолжительных периодов (Напр. ряд, содержащий данные в месячном выпуске продукции преобразуется в ряд квартальных данных) 2)Метод скользящей средней. Состоит в том сто исходные уровни ряда заменяются средними величинами, к-рые получают из данного уровня и нескольких симметрично его окружающих. Число уровней, поск-ым рассчитываются сред. значение наз-ся интервалом сглаживания, он мож. четным и нечетным. Расчет средних ведется способом скольжения, т.е. постепенным исключением их принятого периода скольжения. 1-ого уровня и включением следующего. Нахождение скользящей средней по четному числу уровней осложняется тем, что средняя мож быть отнесена толь. к середине укрупненного интер-ла. Поэт. для определения сглаженных уровней производится центрирование, т.е. нахождение средней из двух смежных скользящих средних для отнесения полученного уровня к определенной дате. 3)Аналитическое выравнивание. Суть метода заключается в подборе матем. Функции, к-рая наилучшим образом характеризует исходные уровни ряда динамики. Эмпирические (фактические) уровни ряда динамики заменяют на плавно изменяющиеся теоретические уровни, рассчитанные по какой-либо функц. Зависимости отклонение исходных уровней ряда от уровней, соответ-щих общей тенденции объясняется действием случайных или периодических факторов. Для выравнивания используют след. матем. Функции: а) линейная y t =a 0 +a 1 t

Предмет статистической науки и задачи статистики на современном этапе

Статистика произошло от лат «ststus»-состояние или положение. Статистика - это совокупность цифр; это вид деятельности по сбору и анализу данных; это наука сформировавшаяся в 18в и изначально называл «политическая арифметика». Предмет статист - количественная сторона массовых соц-экон явл в неразрывной связи с их качественной стороной в конкретн услов места и времени. Объект – общество происходящие в нем процессы, т.е. совокупность соц-экономических явлений. Основн метод статистики – закон больших чисел. Важнейшие задачи стат-ки – организ стат наблюдений; обраб-ка данных и получение системы обобщ показателей для анализа; предоставлен гос управл достов информации для своевремен принятия управл решений; публикац информации для информиров-я по соц-экон процессам. Стат. исследования проходят след этапы : 1.статистичек наблюдение(формы и виды сбора информ);2.стасистическа сводка и группировка(систематизация);3.расчет и анализ обобщающих показателей(абсолютн и относ велич, средн велич, показатели вариации, показатели выборочного наблюдения, показатели рядов динамики, индексы).

Статистическая совокупность, ее виды. Единицы совокупности и классификация их признаков.

Статистическая совокупность – совокупность однородных по какому-либо признаку предметов, ограниченных пространством и временем. Совокупность называется однородной, если один или несколько изучаемых существенных признаков ее объектов являются общими для всех единиц. Совокупность, в которую входят явления разного типа, считается разнородной. Пример СС - множество студентов некоторого вуза, обучающихся на 2-ом курсе дневного отделения. Данное множество является качественно однородным, так как объединяет молодых людей, обучающихся в одном и том же вузе на 2-ом курсе дневного отделения. В то же время элементы данного множества - студенты отличаются друг от друга успеваемостью, способностями, состоянием здоровья и т.п. Единица совокупности (элемент) - частный случай проявления изучаемой закономерности; это первичный элемент статистической совокупности, являющийся носителем признаков, подлежащих регистрации и основой ведущегося при обследовании счета. Признак - это свойство, характеристика единицы статистической совокупности. Например, единица статистической совокупности - «студент» имеет следующие признаки: фамилия, имя, отчество, возраст, оценки по предметам, посещаемость занятий и т.д Чем более однороднее совокупность, тем больше общих признаков имеют ее единицы и меньше варьируют их значения.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

хорошую работу на сайт">

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Задача 1

В некотором регионе в текущем году было совершено 12 390 преступлений, а в предыдущем году - 11 800 преступлений. Вычислите (в %) темп роста и темп прироста количества преступлений, зарегистрированных в текущем году по отношению к предыдущему. Рассчитайте также коэффициенты преступности за каждый год, если численность населения региона в конце предыдущего года составляла 1 475 000, а в конце текущего года - 1 770 000 чел. Сделайте выводы о динамике преступности в регионе.

Решение: Для получения точной картины преступности огромное значение имеет такой показатель преступности, как динамика, то есть изменение во времени. Динамика преступности характеризуется понятиями абсолютный рост (или снижение) и темпы роста и прироста преступности, для определения которых производится вычисление этих характеристик согласно определенным формулам.

Темпы роста преступности рассчитываются на основе базисных показателей динамики, что предполагает сопоставление данных за ряд лет (а иногда десятилетий, если нужен широкий охват материала) с постоянным базисом, под которым понимается уровень преступности в начальном для анализа периоде. Такой расчет позволяет криминологам в значительной мере гарантировать сопоставимость относительных показателей, вычисляемых в процентах, которые показывают, каким образом соотносится преступность последующих периодов с предыдущим.

В расчете за 100 % принимаются данные исходного года; показатели, полученные за последующие годы, отражают только процент прироста, что делает расчет точным, а картину более объективной; при оперировании относительными данными удается исключить влияние на снижение или рост преступности увеличения или снижения численности жителей, достигших возраста уголовной ответственности.

Темп прироста преступности вычисляется в процентах. Темп прироста преступности показывает, насколько увеличился или уменьшился последующий уровень преступности по сравнению с предыдущим периодом. Принято условное обозначение вектора темпа прироста: если процентное соотношение возрастает, ставится знак "плюс", если снижается - ставится знак "минус".

Применительно к условиям нашей задаче следует применить соответствующие формулы и вычислить рост и прирост преступности.

1) Темп роста преступности исчисляется по формуле^

Тр=U/U2 * 100 %,

где U - показатель уровня преступности, а U2 - показатель уровня преступности предшествующего периода. Так темп роста преступности по условиям задачи составит - 12390/11800*100 %=1,05 %.

2) Темп прироста преступности рассчитывается по следующей формуле:

Тпр=Тр-100 %.

Так темп прироста по условиям задачи составит 1,05 %-100 %= 98,95 %.

Коэффициент преступности - это конкретный обобщающий показатель общего количества учтенных преступлений, соотнесенного с численностью населения. Он расшифровывается как число преступлений на 100 тыс., 10 тыс. или 1 тыс. населения и является объективным измерителем преступности, позволяющим сопоставлять ее уровни в разных регионах и в разные годы.

Коэффициент преступности помогает более адекватно оценить и динамику уровня преступности, рассчитанного на душу населения.

Коэффициент преступности рассчитывается по формуле:

КП = (П х 100000): Н,

где П - абсолютное число учтенных преступлений; а Н - абсолютная численность всего населения.

Оба показателя берутся в одном и том же территориальном и временном объеме. Число преступлений обычно рассчитывается на 100 тыс. населения. Но при малых числах преступлений и населения (в городе, районе, на предприятии) коэффициент преступности может рассчитываться на 10 тыс. или на 1 тыс. жителей. в любом случае эти числа означают размерность рассматриваемого коэффициента, которая обязательно указывается: число преступлений на 100 тыс. или 10 тыс. населения.

Рассчитаем коэффициент преступности применительно к условиям нашей задачи:

1) КП= (12390*100000): 1 770 000 чел. = 700 (в текущем году).

2) КП= (11800*100000): 1 475 000 = 800 (в предыдущем году).

Преступность в регионе снижается, поскольку, анализируя коэффициент преступности, можно сделать вывод, что при увеличении населения в регионе (на 16,6 %), и незначительном увеличении количества преступлений на 1,05 %, в целом прирост преступности снижается (-98,95 %).

Задача 2

Возраст 11 молодых специалистов учреждения, принятых на службу, в текущем году составил соответственно 19,25,21,23,23,23,25,20,18,20,21 лет. Произведите сводку и группировку данных в виде статистической таблицы частот. Для наглядности постройте полигон частот, а также найдите модальное, медианное и среднее значение возраста принятых сотрудников.

Решение: Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка - это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Метод группировки основывается на следующих категориях - это группировочный признак, интервал группировки и число групп.

Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Определение числа групп .

Число групп приближенно определяется по формуле Стэрджесса:

n = 1 + 3,2log n = 1 + 3,2log(11) = 4.

Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности. Xmin - минимальное значение группировочного признака. Определим границы группы.

Номер группы

Нижняя граница

Верхняя граница

Одно и тоже значение признака служит верхней и нижней границами двух смежных (предыдущей и последующей) групп.

Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.

№ совокупности

Частота fi

Полигон частоты - это график плотности и вероятности случайной величины, представляет собой ломанную соединяющую точки, соответствующие срединным значениям интервалов группировки частотам этих интервалов.

Среднее значение :

Мода льное значение. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

где x 0 - начало модального интервала; h - величина интервала; f 2 - частота, соответствующая модальному интервалу; f 1 - предмодальная частота; f 3 - послемодальная частота.

Выбираем в качестве начала интервала 19.75, так как именно на этот интервал приходится наибольшее количество.

Наиболее часто встречающееся значение ряда - 20.92.

Медиана . Медиана делит выборку на две части: половина вариант меньше медианы, половина - больше.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 19.75-21.5, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Таким образом, 50 % единиц совокупности будут меньше по величине 21.28.

Задача 3

Определите требуемый объем выборки для исследования среднего возраста аттестованных сотрудников ФСИН России при условии, что среднее квадратическое отклонение составляет 10 лет, а максимально допустимая ошибка выборки не должна превышать 5 %.

Решение ищем по формуле определения численности выборки для повторного отбора.

Ф(t) = г/2 = 0.95/2 = 0.475 и этому значению по таблице Лапласа соответствует t=1.96.

Оценка среднеквадратического отклонения s = 10; ошибка выборки е = 5.

Задача 4

В следующей таблице даны официальные ведомственные статистические сведения о распределении осужденных по срокам заключения (наказания) за 2002-2011 годы, размещенные на официальном сайте ФСИН России: www.fsin.su. Найдите размах и коэффициент вариации количества осужденных за каждый календарный год и сделайте выводы об однородности структуры данного статистического признака.

Основным показателем, характеризующим однородность данных, является коэффициент вариации. В статистике принято считать, что, если значение коэффициента менее 33 %, то совокупность данных является однородной, если более 33 %, то - неоднородной.

Коэффициент вариации

Поскольку v ? 30 %, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.

Срок наказания

От 1 до 3 лет

От 3 до 5 лет

От 5 до 10 лет

От 10 до 15 лет

Свыше 15 лет

Максимальное значение (функция МАКС)

Минимальное значение (функция МИН)

Размах вариации

Среднее значение (функция СРЗНАЧ)

Среднее квадратическое отклонение (функция СТАНДАР ЛОНА)

Коэффициент вариации

Простая средняя :

Мода льное значение

Медиана

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 70580. Следовательно, медиана Me = 70580.

Показатели вариации . .

R = X max - X min .

R = 295916-2250 = 293666.

Среднее линейное отклонение

Каждое значение ряда отличается от другого в среднем на 90895.71.

Дисперсия

(средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 103008 в среднем на 107169.83.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>

или

Коэффициент осцилляции

Простая средняя :

Мода

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76186. Следовательно, медиана Me = 76186.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 291112-3101 = 288011.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 83422.69.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 97334.29 в среднем на 100750.25.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя :

Мода льное значение. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 71093. Следовательно, медиана Me = 71093.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 243852-3856 = 239996.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 68998.08.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 85765.57 в среднем на 82541.55.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

:

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 74588. Следовательно, медиана Me = 74588.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min ,

R = 242984-5304 = 237680.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 73148.73.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 92104.14 в среднем на 82873.1.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76678. Следовательно, медиана Me = 76678

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 249346-6536 = 242810.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 79680.53.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 99551.71 в среднем на 87389.04.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76461. Следовательно, медиана Me = 76461.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 254722-6704 = 248018.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 82302.82.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 102346.71 в среднем на 89787.88.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 78959. Следовательно, медиана Me = 78959.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 261334-7635 = 253699.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 83791.55.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 104898.86 в среднем на 91616.15.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 75916. Следовательно, медиана Me = 75916.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 263863-8145 = 255718.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 82767.96.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 103440.71 в среднем на 91207.92.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 78019. Следовательно, медиана Me = 78019.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 260094-7798 = 252296.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 77827.76.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 99212.29 в среднем на 88081.39.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 72248. Следовательно, медиана Me = 72248.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 242137-7173 = 234964.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 70459.02.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 91375.14 в среднем на 80674.43.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Задача 5

В условиях предыдущей задачи произведите перегруппировку заданных интервалов сроков наказания с целью улучшения относительных показателей вариации признака в 2010 году. Постройте гистограммы распределения осужденных по срокам заключения (наказания) за 2010 год до и после произведенной группировки данных и сделайте выводы об однородности структуры исследуемого статистического признака.

Решение:

Поскольку v>30 %, но v<70 %, то вариация умеренная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична.

Совершим перегруппировку данных следующим образом:

В группу 1) входит группы: до года, год, от 1-3 лет соответственно 156978.

В группу 2) входит от группы свыше 3 до 5 лет полностью и 1\5 от группы свыше 5 до 10 лет получаем 1\5*260094+168651=220669,8.

В группу 3) входит 3\5 группы от 5 до 10 т.е. 3\5*260094=156056,4.

Группа 4) (1\5*260094)+(1\5*78019)=67622,6.

Группа 5) 3\5*78019=46811,4.

Группа 6 30744+(1\5*78019)=46347,8.

Гистограмма. Для получения вывода о однородности исследуемого статистического признака Вычислим коэффициент вариации:

Поскольку v>30 %, но v<70 %, то вариация умеренная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична.

Задача 6

Изложить в краткой форме (тезисно, на 1-2 страницах) содержание и результаты недавнего официального статистического исследования в социально-правовой сфере (тематика - на Ваш выбор, ссылки на Интернет-ресурсы - обязательны), сделать выводы и выдвинуть соответствующие статистические гипотезы на краткосрочную перспективу.

В качестве официального статистического исследования было взято исследование о просроченной задолженности по заработной плате на 1 декабря 2015 года.

На 1 декабря 2015 г., по сведениям организаций (не относящихся к субъектам малого предпринимательства), суммарная задолженность по заработной плате по кругу наблюдаемых видов экономической деятельности составила3900 млн. рубл ей и по сравнению с 1 ноября 2015 г. увеличилась на 395 млн. рублей (на 11,3 %).

Просроченная задолженность по заработной плате из-за отсутствия у организаций собственных средств на 1 декабря 2015г. составила3818 млн. рубл ей , или 97,9 % общей суммы просроченной задолженности. По сравнению с 1 ноября 2015г. она увеличилась на 389 млн. рублей (на 11,3 %). Задолженность из-за несвоевременного получения денежных средств из бюджетов всех уровней составила82 млн. рубл ей и увеличилась по сравнению с 1 ноября 2015г. на 6 млн. рублей (на 7,7 %), в том числе задолженность из федерального бюджета составила 62 млн. рублей и снизилась по сравнению с 1 ноября 2015г. на 6 млн. рублей (на 8,6 %),бюджетов субъектов Российской Федерации составила 1,1 млн. рублей (увеличение на 0,2 млн. рублей или на 20,7 %), местных бюджетов - 19 млн. рублей (увеличение на 12 млн. рублей, или в 2,5 раза).

В добыче полезных ископаемых, обрабатывающих производствах, здравоохранении и предоставлении социальных услуг, рыболовстве и рыбоводстве 100 % просроченной задолженности по заработной плате образовано из-за нехватки у организаций собственных средств.

В общем объеме просроченной задолженности по заработной плате 37 % приходится на обрабатывающие производства, 29 % - на строительство, 9 % - на производство и распределение электроэнергии, газа и воды, 7 % - на транспорт, 6 % - на добычу полезных ископаемых, 5 % - на сельское хозяйство, охоту и предоставление услуг в этих областях, лесозаготовки.

Объем просроченной задолженности по заработной плате на 1 декабря 2015г. составил менее 1 % месячного фонда заработной платы работников наблюдаемых видов экономической деятельности.

Задолженность по заработной плате за последний месяц , за который производились начисления, в общем объеме просроченной задолженности составила в среднем 29 %: производстве и распределении электроэнергии, газа и воды - 75 %, деятельности в области образования - 37 %, здравоохранения и предоставления социальных услуг - 35 %, научных исследований и разработок - 32 %, строительства - 29 %, транспорта - 23 %, обрабатывающих производствах - 22 %.

Из общей суммы невыплаченной заработной платы на долги, образовавшиеся в 2014г.,приходится 457 млн. рублей (11,7 %), в 2013г. и ранее - 657 млн. рублей (16,8 %).

В целом наблюдая картину задолженности по заработной плате в динамике (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif), можно сделать вывод что значительный спад придется на январь, февраль 2016 года.

Основной процент задолженности приходится на обрабатывающие производства - 37 %, 29 % - на строительство скорее всего это происходит в связи со снижением потребительского спроса на продукцию, соответственно уменьшается прибыль.

Выдвинем гипотезу. С января 2016 года процент задолженности будет сокращаться, в связи с распределением годового бюджета на будущий год с учетом частичного погашения задолженности по заработной плате, и составит 2700 млн. динамика преступность вариация медианное

Для проверки гипотезы (За основу берем данный таблицы http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif).

Построим дискретный вариационный ряд. Для этого отсортируем ряд по возрастанию и подсчитаем количество повторения для каждого элемента ряда.

Вычислим среднюю:

Вычислим дисперсию. Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Используя односторонний критерий с б = 0,05, проверить эту гипотезу, если в выборке из n =24 месяца средний показатель оказался равным 2741,25, а дисперсия известна и равна у =193469,27

Решение . Среднеквадратическое отклонение:

Выдвигается нулевая гипотеза H 0 о том, что значение математического ожидания генеральной совокупности равно числу м 0: = 2700.

Альтернативная гипотеза:

H 1: м? 2700, критическая область - двусторонняя.

Для проверки нулевой гипотезы используется случайная величина:

где x - выборочное среднее; S - среднеквадратическое отклонение генеральной совокупности.

Если нулевая гипотеза верна, то случайная величина T имеет стандартное нормальное распределение. Критическое значение статистики T определяется исходя из вида альтернативной гипотезы:

P(|T|

Найдем экспериментальное значение статистики T:

Поскольку объем выборки достаточно большой (n>30), то вместо истинного значения среднеквадратического отклонения можно использовать его оценку S=439.851.

Ф(t кр)=(1-б)/2 = (1-0.05)/2 = 0.475.

По таблице функции Лапласа найдем, при каком t kp значение Ф(t kp) = 0.475.

Экспериментальное значение критерия T не попало в критическую область T ? t kp , поэтому нулевую гипотезу следует принять. Значение математического ожидания генеральной совокупности можно принять равным 2700

Список используемой литературы

1. Казанцев С.Я. Правовая статистика: Учебник / Под ред. С.Я. Казанцева, С.Я. Лебедева - М.: ЮНИТИ-ДАНА: Закон и право, 2009 г.

2. Курыс?в К.Н. Основы правовой статистики: учеб. пособие / К.Н. Курыс?в; ВЮИ ФСИН России. - Владимир, 2005. - 44 с.

3. Макарова Н.В. Статистика в Exсel: учеб. пособие / Н.В. Макарова, В.Я. Трофимец. - М.: Финансы и статистика.

4. Кондратюк Л.В., Овчинский В.С. Криминологическое измерение /под ред. К.К. Горяинова. - М.: Норма, 2008.

5. Яковлев В.Б. Статистика. Расчеты в Microsoft Excel: учеб. Пособие для вузов / В.Б. Яковлев. - М.: Колосc, 2005. - 352 c.

Размещено на Allbest.ru

...

Подобные документы

    Исследование преступности несовершеннолетних с позиций объекта криминологического исследования. Взаимосвязь подросткового алкоголизма, токсикомании, наркомании и преступности. Причины и условия и пути профилактики преступности несовершеннолетних.

    курсовая работа , добавлен 08.04.2011

    Методика конкретного криминологического исследования. Криминологическая характеристика насильственной преступности и ее предупреждение. Общественная опасность и тяжесть причиняемых последствий насильственных преступлений. Статистика преступности.

    контрольная работа , добавлен 15.01.2011

    Формула расчета коэффициента преступности. Расчет среднегодовой нагрузки на одного судью, среднего срока расследования уголовных дел, среднегодовых темпов роста преступности. Расчет показателей моды, медианы, вариации и среднеквадратического отклонения.

    контрольная работа , добавлен 20.04.2011

    Изучение основ корыстной преступности: понятие, элементы, объекты и субъективные стороны. Описание социального и специально-криминологического предупреждения преступности из корыстных побуждений. Разработка комплекса мер по предупреждению преступлений.

    дипломная работа , добавлен 09.11.2012

    Понятие и предмет криминологического прогнозирования. Установление возможных изменений в состоянии, уровне, структуре и динамике преступности в будущем. Оценка развития преступности в перспективе. Планирование борьбы с преступностью, ее предупреждение.

    курсовая работа , добавлен 29.05.2015

    Исследование видов криминологического прогнозирования и проектирования в сфере преступности. Особенности прогнозирования преступности несовершеннолетних в Республике Казахстан. Разработка программ борьбы с преступностью на общегосударственном уровне.

    дипломная работа , добавлен 25.10.2015

    Преступность несовершеннолетних как объект криминологического исследования. Основные, криминологические характеристики преступности несовершеннолетних. Состояние преступности. Особенности личностной характеристики несовершеннолетних.

    реферат , добавлен 01.04.2003

    Тенденции криминального поведения современных женщин: рост и устойчивый удельный вес тяжких и рецидивных преступлений, омоложение преступниц и увеличение количества женщин пожилого возраста среди осужденных. Общие меры предупреждения женской преступности.

    реферат , добавлен 01.03.2014

    Расчет относительных показателей структуры и координации категорий осужденных по степени тяжести совершенных преступлений. Коэффициенты преступности и судимости по федеральным округам и в целом по России. Расчет показателей динамики с помощью MS Excel.

    контрольная работа , добавлен 31.07.2011

    Понятие, виды, значения, детерминанты латентной преступности, причины ее возникновения, предупреждение и способы сокращения. Определение уровня и анализ структуры преступности. Системный подход в изучении латентной преступности как социального явления.

В процессе обработки и обобщения статистических данных существует необходимость определения средних величин. Каждая однородная статистическая совокупность состоит из достаточно большого числа единиц, которые отличаются размерами количественных признаков. Вместе с тем, каждая единица совокупности по определению несет черты, свойственные всей совокупности. Расчёт средних величин позволяет выявить типичный уровень признаков и черт изучаемой совокупности.

Средними величинами называются обобщающие показатели, характеризующие типичный уровень варьирующего признака в расчёте на единицу совокупности в конкретных условиях места и времени.

Правильное понимание сущности средней величины определяет её особую значимость в условиях рыночной экономики, когда среднее через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития. В условиях реальной экономической, в том числе коммерческой, деятельности постоянные причины (факторы) действуют одинаково на каждое изучаемое явление и именно они делают эти явления похожими друг на друга и создают общие для всех закономерности. Результатом учения об общих и индивидуальных причинах явлений стало выделение средних величин в качестве основного приёма статистического анализа, базирующегося на утверждении, что статистические средние величины представляют собой не просто меру математического измерения, а категорию объективной действительности. В статистической теории типическая реально существующая средняя величина отожествляется с истинной для данной совокупности величиной, отклонения от которой могут быть только случайными.

Например, выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, воспитания, здоровья и т.д. А средняя выработка (продажа) на одного продавца отражает общее типичное свойство всей совокупности продавцов. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Таким образом, средние величины – обобщающие показатели, в которых находит выражение действие общих условий, закономерность изучаемого явления.

В практике статистической обработки данных возникают различные задачи, имеются особенности изучаемых явлений, и поэтому для их решения требуются различные средние.

По уровню обобществления данных изучаемой совокупности средние могут быть общими и групповыми. Средняя, рассчитанная по совокупности в целом, называется общей средней, а средние, исчисленные для каждой группы, - групповыми средними.

Различают степенные и структурные средние.

Степенные средние выводятся из общей формулы вида:



С изменением показателя степени приходим к определенному виду средней:

при - средняя гармоническая ;

при - средняя геометрическая ;

при - средняя арифметическая ;

при - средняя квадратическая .

Вопрос о том, какой вид средней необходимо применять в отдельном случае, решается путём конкретного анализа изучаемой совокупности, материальным содержанием изучаемого явления, осмыслением результатов осреднения. Только тогда средняя величина применена правильно, когда в результате осреднения получают величины, имеющие реальный смысл.

Вводятся следующие обозначения:

– количественный признак, по которому находится средняя, называется осредняемым признаком;

среднее значение признака (с чертой сверху), представляющее результат осреднения;

Индивидуальные значения признака у единиц совокупности называемые вариантами;

– общее число единиц совокупности;

- частота или повторяемость индивидуального значения признака (его вес);

Усредняющий признак (индекс).

В зависимости от наличия исходных данных средние можно рассчитать различным образом. В случае, если индивидуальные значения осредняемого признака (варианты) не повторяются при конкретных значениях усредняющего признака применяются формулы простых степенных средних. Однако, когда в практических исследованиях отдельные значения изучаемого признака встречаются несколько раз у единиц исследуемой совокупности, тогда частота повторения индивидуальных значений признака (- вес признака) присутствует в формулах степенных средних. В этом случае они называются формулами взвешенных степенных средних. В формулах взвешенных средних вместо частот может содержаться частость

определяемая как отношение частоты признака к сумме частот.

В табл.9 приведены формулы расчёта различных видов степенных простых и взвешенных средних величин.

Табл.9. Формулы расчёта степенных средних величин

Значение Название средней Формула средней
простая взвешенная
- 1 Средняя гармоническая
Средняя геометрическая
Средняя арифметическая
Средняя квадратическая

Средняя арифметическая – наиболее распространённый вид средней. Она исчисляется в случаях, когда объём осредняемого признака образуется как сумма его значений у отдельных единиц совокупности. Например, требуется вычислить средний стаж десяти работников предприятия, причём дан ряд одиночных значений признака 6, 5, 4, 3, 3, 4, 5, 4, 5, 4. Тогда объём осредняемого признака

а среднее значение вычисляется по формуле простой средней

Если те же данные сгруппированы по величине признака, то среднее значение вычисляется по формуле взвешенной средней

Средняя гармоническая величина чаще всего вычисляется, когда статистическая информация не содержит частот по отдельным вариантам совокупности, а имеются данные по объёмам осредняемого признака, относящимся к отдельным вариантам совокупности. Например, необходимо вычислить среднюю цену единицы товара, причём даны объёмы реализации по каждому виду товара в виде ряда 600, 1000, 850 (тыс. руб.) и соответствующие цены по каждому виду товара в виде ряда 20, 40, 50 (тыс. руб./шт.). Тогда средняя цена вычисляется по формуле средней гармонической взвешенной

Можно видеть, что средняя гармоническая является превращённой (обратной) формой средней арифметической. Вместо средней гармонической всегда можно рассчитать среднюю арифметическую, но для этого сначала нужно определить веса отдельных значений признака.

При использовании формулы средней геометрической индивидуальные значения признака, как правило, представляют собой относительные величины динамики, построенные в виде цепных величин (как отношения последующих уровней показателя к предыдущим уровням в ряду динамики), причём временные отрезки ряда динамики одинаковы (сутки, месяц, год). Средняя геометрическая величина характеризует, таким образом, средний коэффициент роста. Например, для данных ряда динамики, представленных в табл.10,

Табл.10. Ряд динамики роста доходов населения

средний темп роста доходов населения вычисляется по формуле средней геометрической простой

Формула средней квадратической величины используется для измерения средней степени колеблемости значений признака около среднего арифметического значения в рядах распределения. Так, например, при расчёте такого показателя вариации, как дисперсия, среднюю вычисляют из квадратов отклонений индивидуальных значений признака от средней арифметической величины (см. в главе 6).

Степенные средние разных видов, исчисленные по одной и той же совокупности, имеют различные количественные значения, причём чем больше показатель степени тем больше и величина соответствующей средней

Это свойство степенных средних называется мажорантностью средних.

Для характеристики структуры совокупности применяются особые показатели, которые называют структурными средними. К таким показателям относятся мода и медиана.

Модой называется наиболее часто встречающееся значение признака у единиц данной совокупности. Она соответствует определенному значению признака.

Например, выборочное обследование 8 пунктов обмена валюты позволило зафиксировать различные цены за доллар (табл.11). В этом случае модальной ценой за доллар является величина поскольку в обследованной совокупности пунктов обмена валюты она встречается наиболее часто (3 раза).

№ пункта
Цена за 1 $

Медиана – это величина признака, которая делит численность упорядоченного вариационного ряда на две равные части.

Для примера возьмём данные табл.10 и расположим индивидуальные значения признака в возрастающем порядке.

2150 2155 2155 2155 2160 21652165 2175

Порядковый номер медианы определяется по формуле

а) В случае чётного числа номер медианы имеет не целое значение (в нашем случае 4,5). Медиана будет равна средней арифметической из соседних значении и

б) В случае нечётного числа индивидуальных признаков (допустим, )

Следовательно, в этом случае

В рассмотренном примере нахождение таких средних, как мода и медиана, было целесообразно, поскольку исследователь не располагал объёмом продаж по каждому пункту и не мог поэтому с хорошей точностью провести расчёт средней арифметической цены за доллар. Также рассмотренный пример иллюстрирует положение о том, что выбор вида соответствующей средней всегда зависит от имеющихся в наличии данных.

4.3. Свойства и методы расчёта средних величин

Наиболее часто используемая в экономико-статистической практике средняя арифметическая величина обладает рядом математических свойств, которые иногда упрощают её расчёт. Эти свойства следующие:

1. Если варианты уменьшить или увеличить на некоторое постоянное число, то

средняя арифметическая величина соответственно уменьшится или увеличится на это

2. Если варианты изменить в постоянное число раз то средняя тоже изменится во

столько же раз

3. Если частоты разделить или умножить на некоторое постоянное число, то средняя не изменится

4. Произведение средней арифметической на сумму частот равно сумме произведений вариантов на частоты

5. Алгебраическая сумма отклонения вариантов от средней величины равна нулю

Все перечисленные свойства следуют из определения средней арифметической взвешенной (см.раздел 4.2).

Иногда расчёт средней арифметической величины удобно упростить, используя её математические свойства. Для этого нужно из всех вариант вычесть произвольную постоянную величину, полученную разность разделить на общий множитель, а затем исчисленную среднюю величину умножить на общий множитель и прибавить произвольную постоянную. В результате формула средней арифметической взвешенной получит следующий вид.

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину.

Известно, что единицы каждого массового явления обладают многочисленными признаками. Какой бы из этих признаков мы ни взяли, его значения у отдельных единиц будут различными, они изменяются, или, как говорят в статистике , варьируют от одной единицы к другой. Так, например, заработная плата работника определяется его квалификацией, характером труда, стажем работы и целым рядом других факторов, поэтому изменяется в весьма широких пределах. Совокупное влияние всех факторов определяет размер заработка каждого работника, тем не менее можно говорить о среднемесячной заработной плате работников разных отраслей экономики . Здесь мы оперируем типичным, характерным значением варьирующего признака, отнесенным к единице многочисленной совокупности.

Средняя величина отражает то общее, что характерно для всех единиц изучаемой совокупности. В то же время она уравновешивает влияние всех факторов, действующих на величину признака отдельных единиц совокупности, как бы взаимно погашая их. Уровень (или размер) любого общественного явления обусловлен действием двух групп факторов. Одни из них являются общими и главными, постоянно действующими, тесно связанными с природой изучаемого явления или процесса, и формируют то типичное для всех единиц изучаемой совокупности, которое и отражается в средней величине. Другие являются индивидуальными, их действие выражено слабее и носит эпизодический, случайный характер. Они действуют в обратном направлении, обусловливают различия между количественными признаками отдельных единиц совокупности, стремясь изменить постоянную величину изучаемых признаков. Действие индивидуальных признаков погашается в средней величине. В совокупном влиянии типичных и индивидуальных факторов, которое уравновешивается и взаимно погашается в обобщающих характеристиках, проявляется в общем виде известный из математической статистики фундаментальный закон больших чисел.

В совокупности индивидуальные значения признаков сливаются в общую массу и как бы растворяются. Отсюда и средняя величина выступает как «обезличенная», которая может отклоняться от индивидуальных значений признаков, не совпадая количественно ни с одним из них. Средняя величина отражает общее, характерное и типичное для всей совокупности благодаря взаимопогашению в ней случайных, нетипичных различий между признаками отдельных ее единиц, так как ее величина определяется как бы общей равнодействующей из всех причин.

Однако для того, чтобы средняя величина отражала наиболее типичное значение признака, она должна определяться не для любых совокупностей, а только для совокупностей, состоящих из качественно однородных единиц. Это требование является основным условием научно обоснованного применения средних величин и предполагает тесную связь метода средних величин и метода группировок в анализе социально-экономических явлений. Следовательно, средняя величина - это обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени.

Определяя, таким образом, сущность средних величин, необходимо подчеркнуть, что правильное исчисление любой средней величины предполагает выполнение следующих требований:

  • качественная однородность совокупности, по которой вычислена средняя величина. Это означает, что исчисление средних величин должно основываться на методе группировок, обеспечивающем выделение однородных, однотипных явлений;
  • исключение влияния на вычисление средней величины случайных, сугубо индивидуальных причин и факторов. Это достигается в том случае, когда вычисление средней основывается на достаточно массовом материале, в котором проявляется действие закона больших чисел, и все случайности взаимно погашаются;
  • при вычислении средней величины важно установить цель ее расчета и так называемый определяющий показа-телъ (свойство), на который она должна быть ориентирована.

Определяющий показатель может выступать в виде суммы значений осредняемого признака, суммы его обратных значений, произведения его значений и т. п. Связь между определяющим показателем и средней величиной выражается в следующем: если все значения осредняемого признака заменить средним значением, то их сумма или произведение в этом случае не изменит определяющего показателя. На основе этой связи определяющего показателя со средней величиной строят исходное количественное отношение для непосредственного расчета средней величины. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Средняя величина, рассчитанная в целом по совокупности, называется общей средней; средние величины, рассчитанные для каждой группы, - групповыми средними. Общая средняя отражает общие черты изучаемого явления, групповая средняя дает характеристику явления, складывающуюся в конкретных условиях данной группы.

Способы расчета могут быть разные, поэтому в статистике различают несколько видов средней величины, основными из которых являются средняя арифметическая, средняя гармоническая и средняя геометрическая.

В экономическом анализе использование средних величин является основным инструментом для оценки результатов научно-технического прогресса, социальных мероприятий, поиска резервов развития экономики. В то же время следует помнить о том, что чрезмерное увлечение средними показателями может привести к необъективным выводам при проведении экономико-статистического анализа. Это связано с тем, что средние величины, будучи обобщающими показателями, погашают, игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Виды средних величин

В статистике используют различные виды средних величин, которые делятся на два больших класса:

  • степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);
  • структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины - средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй - 7, третий - 4, четвертый - 10, пятый- 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для определения средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек , возраст которых варьируется от 18 до 22 лет, где xi - варианты осредняемого признака, fi - частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:


Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины - средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как Σfi, а время, затраченное на весь путь, - как Σ fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi - отдельные варианты; n - число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2


Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая - при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где - средняя величина; - индивидуальное значение; n - число единиц изучаемой совокупности; k - показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние - мода (Мо) и медиана (Ме).

Мода - величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; fm_ 1 - частота предшествующего интервала; fm+ 1 - частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; f - число членов ряда;

∫m-1 - сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили - на 10 равных частей. Квартилей насчитывается три, а децилей - девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения - атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум - это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k - число вариантов значений признака. Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты - может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax - Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:


Абсолютное значение (модуль) отклонения варианта от средней арифметической; f- частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая - в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации - дисперсию.

Дисперсия (σ 2) - средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков - среднее линейное и среднее квадртическое отклонение - не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:


Наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.