Дисперсионный анализ статистика. Многофакторный дисперсионный анализ. В этом окне также можете выбрать способ построения модели: диалоговый режим или использовать мастер анализа. Выберем диалоговый режим

Статистическая группировка – это разделение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Задачи, решаемые с помощью метода группировок:

Выделение социально-экономических типов явлений;

Изучение структуры явления и структурных сдвигов, происходящих в нем;

Выявление связи и зависимости между явлениями;

В соответствии с этими задачами различают следующие виды группировок:

1. Типологическая - расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений;

2. Структурная - группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку или нескольким признакам

3. Аналитическая - группировка, выявляющая взаимосвязи между изучаемыми признаками.

Особенностями аналитической группировки является:

а) единицы группируются по факторному признаку;

б) каждая группа характеризуется средними величинами результативного признака.

Примеры видов группировок:

1. Типологические

Таблица 1

Распределение пенсионеров РФ по видам пенсионного обеспечения (на конец года, тыс. чел.)

    Структурные

Таблица 2

Распределение населения РФ по величине среднедушевых денежных доходов (в процентах)

Все население

в том числе со среднедушевыми денежными доходами, руб. в месяц:

1500,1 – 2000,0

2000,1 – 3000,0

3000,1 – 4000,0

4000,1 – 5000,0

5000,1 – 7000,0

7000,1 – 12000,0

Свыше 12000,1

    Аналитические

Таблица 3

Распределение региона по численности занятых в экономике (данные условные)

№ группы

Группы регионов по численности занятых в экономике, тыс.чел.

Число регионов

Численность занятых в экономике, тыс. чел.

Валовой региональный продукт, млрд. руб.

в среднем на один регион

в среднем на один регион

Разновидностью типологической группировки является классификация.

Под классификацией в статистике понимается группировка явлений, каких-либо объектов по относительно однообразным и устойчивым признакам (например, классификация экономики по секторам). Классификации используются в качестве национальных и международных стандартов в определенный промежуток времени.

Построение группировки начинается с определения группировочного признака (основания группировки) .

Группировочный признак – это расчленение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Группировочный признак (основание группировки) делится на:

    Количественный - число групп зависит от степени вариации группировочного признака: чем она больше, тем больше можно образовать групп;

    Атрибутивный - число групп определяется числом градаций атрибутивного признака (например, группировка населения по полу предполагает только две группы).

Если в основание группировки положен один признак, то группировка называется простой , если несколько, то – сложной (комбинационная и многомерная).

Комбинационные группировки строятся путем разбиения группы на подгруппы в соответствии с дополнительными признаками.

Многомерные группировки формируются с помощью специальных алгоритмов, когда определяются скопления в N-мерном пространстве, где каждый объект – точка.

После того, как определено основание группировки, решается вопрос о количестве групп , на которые необходимо разбить изучаемую совокупность.

Число групп зависит от:

Задач исследования;

Группировочного признака;

Объёма совокупности;

Степени вариации группировочного признака.

Если основанием группировки служит количественный признак, то для определения количества групп (группировка с равными интервалами) можно воспользоваться формулой американского ученого Стерджесса .

Формула Стерджесса:

n =1+3,322 lgN

n – число групп;

N – число единиц совокупности.

Когда определено число групп, то следует установить интервалы группировки.

Интервал группировки – это значения варьирующего признака, лежащие в определенных границах.

Интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижняя граница интервала – это минимальное значение признака, верхняя граница – наибольшее значение признака в интервале.

Величина интервала (ширина) представляет собой разность между верхней и нижней границами интервала.

Виды интервалов группировки бывают:

    Равный - применяется в тех случаях, когда вариация признака происходит в сравнительно узких границах и носит более или менее равномерный характер (таблица 3.3);

    Неравный - применяется в тех случаях, когда размах вариации признака в совокупности велик и значения признака варьируют неравномерно. Неравные интервалы делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные (таблица 3.2)

    Открытый - это интервал, у которого указана только одна граница: верхняя - у первого, нижняя – у последнего (таблица 3.2)

    Закрытый - это интервал, у которого имеются верхняя и нижняя границы (таблица 3.3)

При равных интервалах расчет величины интервала определяется по формуле:

h =(X max - X min )/ n (2)

где X max , X min - максимальное и минимальное значения признака в совокупности соответственно.

При определении величины интервала группировки следует учитывать следующие правила:

    если величина интервала, рассчитанная по формуле (2), имеет один знак до запятой (например, 0,7; 0,58; 2,359), то полученное значение следует округлить до десятых (в приведенном примере это будут значения: 0,7; 0,6; 2,4);

    если величина интервала, рассчитанная по формуле (2), имеет две значащие цифры до запятой и несколько после запятой (например, 11,2; 23,385), то это значение следует округлить до целого числа (в указанном примере это будут значения: 11; 23);

    если величина интервала, рассчитанная по формуле (2), представляет собой трехзначное число (например, 123; 757), то это значение целесообразно округлить до ближайшего число, кратного 10 (в приведенном примере это будут значения: 120; 760);

    если интервалы групп закрытые и основанием группировки служит непрерывный признак, то нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно» (например, если нижняя граница i - группы равна 50, а верхняя – 100, то единица совокупности со значением признака равным 100, попадет в группу i+1) (пример 3);

    если значение признака совпадает с границами интервалов, то можно использовать открытые интервалы, введя слова «до», «менее» и «более» (таблица 3.2);

    если в основании группировки лежит дискретный признак, то верхняя граница i-го интервала равна нижней границе i+1-го интервала, увеличенной на 1.

: 10]. Используют классификации: отраслевую; профессиональную; основных фондов; капитальных вложений; строительных машин. В статистике внешней торговли используется «Товарная номенклатура внешнеэкономической деятельности». В условиях возникновения новых форм хозяйствования начинают использоваться классификаторы форм собственности, организационно-правовых форм хозяйствующих субъектов.

Для дальнейшей обработки собранных в ходе статистического наблюдения первичных данных широко используют и метод группировки.

Это распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком. Метод группировки позволяет обеспечивать первичное обобщение данных, представление их в более упорядоченном виде. Благодаря группировке можно соотнести сводные показатели по совокупности в целом со сводными показателями по группам. Появляется возможность сравнивать, анализировать причины различий между группами, изучать взаимосвязи между признаками. Группировка позволяет делать вывод о структуре совокупности и о роли отдельных групп этой совокупности. Именно группировка формирует основу для последующей сводки и анализа данных.

Признаки, по которым проводится группировка, называют группировочными признаками . Группировочный признак иногда называют основанием группировки . Правильный выбор существенного группировочного признака дает возможность сделать научно обоснованные выводы по результатам статистического исследования. Группировочные признаки могут иметь как количественное выражение (объем, доход, курс валюты, возраст и т.д.), так и качественное (форма собственности предприятия, пол человека, отраслевая принадлежность, семейное положение и т.д.).

При определении числа групп, как правило, учитываются задача исследования, объем совокупности и виды признаков, которые берутся в качестве основания группировки. Например, по количественному признаку возраст населения может быть разбит на самые различные группы. Их число будет зависеть от поставленных задач. Например, это могут быть группы по возрасту трудоспособного населения; экономически активного населения и т.д.

Если берется, предположим, такой качественный признак, как образование, то групп будет ровно столько, сколько существует ступеней или профилей образования. В образовании по ступеням групп будет шесть (неполное среднее; среднее; неполное среднее специальное; специальное среднее; неполное высшее; высшее). По профилю образования количество групп может совпадать или с числом профессиональных групп, или с числом сфер образования (гуманитарное; инженерно-техническое; естественнонаучное).

Основные приемы построения и выполнения группировок

Если для построения группировки используется только один признак, то такую группировку называются простой, если группировка проводится по нескольким признакам, ее называют сложной. Сложная группировка бывает или комбинационная, или многомерная.

Комбинационная группировка выполняется последовательно: группы, выделенные по одному признаку, затем выделяются в подгруппы по другому признаку, которые, в свою очередь, могут выделяться по следующему другому признаку. В этом случае число групп будет равно произведению числа выделенных групп на число группировочных признаков. Процедура определения оптимального числа групп основана на применении формулы Стерджесса

где n - число групп; N - число единиц совокупности.

Из формулы видно, что выбор числа групп зависит от объема совокупности. Если групп оказывается много и они включают малое число единиц, то групповые показатели могут стать ненадежными. Поэтому альтернативой комбинационной группировке является многомерная группировка , которая осуществляется по комплексу признаков одновременно. Ее применение требует использования электронной вычислительной техники. С помощью специально разработанных электронных программ формируются однородные группы на основании близости по всему комплексу признаков.

Определение числа групп тесно связано с понятием величина интервала : чем больше число групп, тем меньше величина интервала, и наоборот. - разница между максимальным и минимальным значениями признака в каждой группе. Он определяет количественные границы групп, что для статистической практики имеет большое значение, особенно когда нужно образовать качественно однородные группы. Например, исследуется совокупность предприятий по выполнению коллективных договоров. Здесь нельзя объединять предприятия, которые не выполнили обязательства, и те, которые их перевыполнили. Показатель здесь - величина интервала.

Другим примером является невозможность образовывать группу 95 - 105%, поскольку это разные части совокупности. Следует образовать две группы: 95 - 100% и 101 - 105%. В этом случае границы, по которым различаются совокупности, абсолютно соблюдаются.

Каждый интервал имеет нижнюю (наименьшее значение признака) и верхнюю (наибольшее значение признака) границы или одну из них. Поэтому величина интервала есть разность между верхней и нижней границами интервала. Если у интервала указана лишь одна граница (у первого - верхняя, у последнего - нижняя), то речь идет об открытых интервалах . Если у интервала имеются и нижняя, и верхняя границы, то речь идет о закрытых интервалах . Закрытые интервалы подразделяются на равные и неравные (прогрессивно возрастающие, прогрессивно убывающие), а также специализированные и произвольные.

Группировку с равными интервалами строят тогда, когда исследуются количественные различия в величине признака внутри групп одинакового качества, а также если распределение носит более или менее равномерный характер. Если можно заранее установить определенное количество групп, то величину равного интервала можно вычислить по формуле

(3.2)

где i - величина равного интервала; x max , x min - наибольшее и наименьшее значения признака; n - число групп.

Если не требуется предварительного установления числа групп, то используется другой способ определения величины равного интервала - по формуле

(3.3)

где n - число наблюдений.

Если величина равного интервала рассчитывается по данной формуле, то следует знаменатель предварительно округлить до целого числа (как правило, всегда большего), так как количество групп не может быть дробным числом.

В статистической практике чаще применяются неравные интервалы (постепенно возрастающие или постепенно убывающие). При этом исследуемая совокупность делится на группы примерно равного заполнения с большим числом единиц. Неравные интервалы могут использоваться, например, в таких случаях:

    а) при исследовании группировки с применением нескольких признаков, дающих возможность составить несколько подгрупп, где требуются уже и более длинные и более короткие интервалы;

    б) при образовании крупных групп с новым качеством на базе мелких групп при условии сохранения их однородности, что приводит к увеличению интервалов.

В статистической практике используются также специализированные интервалы . Интервалы называют специализированными, если речь идет об установлении границ интервала в группах, схожих по типу и по признаку, но имеющих отношение, скажем, к разным отраслям производства.

Виды группировок. Статистическая таблица

Виды группировок зависят от целей и задач, которые они выполняют. С помощью метода статистических группировок выделяют качественно однородные совокупности, изучают структуры совокупности и изменения, происходящие в них, а также решают задачи по исследованию существующих связей и зависимостей.

С известной мерой условности для выполнения этих задач группировки соответственно делят на типологические, структурные и аналитические.

Метод типологической группировки заключается в выявлении в качественно разнородной совокупности однородных групп. При этом очень важно правильно отобрать группировочный признак, который поможет идентифицировать выбранный тип. Типологические группировки широко применяются в исследовании социально- экономических явлений. Примерами такого вида группировок могут быть группы предприятий по формам собственности (табл. 3.1), по формам хозяйствования, социальные группы населения и т.д. В типологических группировках часто используются специализированные интервалы.

Таблица 3.1

Группировка полиграфических предприятий
одного из городов России
по формам собственности

Метод структурной группировки есть разделение однородной совокупности на группы по тому или иному варьирующему группировочному признаку. Примерами такого вида группировок могут быть группы населения по полу, возрасту, месту проживания, доходу и т.д., то есть может решаться задача по изучению структурного состава той или иной однородной совокупности, структурных изменений по тому или иному группировочному признаку. На основе структурных изменений изучаются закономерности общественных явлений (табл. 3.2).

Таблица 3.2

Группировка населения России
по размеру среднедушевого дохода

(условные цифры)

Метод аналитической группировки заключается в исследовании взаимосвязей между факторными признаками в качественно однородной совокупности. С помощью аналитических группировок удается выявлять признаки, которые могут выступать или причиной, или следствием того или иного явления. В аналитических группировках чаще всего используются неравные интервалы. Пример аналитической группировки представлен в табл. 3.3.

Таблица 3.3

Группировка продолжительности договорных связей
книжного магазина и качества продукции

Продолжительность договорных связей магазина с поставщиками, лет Число поставщиков Доля качественной стандартной книжной продукции, %
абсолютное в % к итогу
До 2 3 14 65
3–5 8 38 69
5–8 6 29 74
Свыше 8 4 19 91
Итого 21 100 74,8

Результаты группировочного материала оформляются в виде таблиц, где он излагается в наглядно-рациональной форме. Не всякая таблица может быть статистической. Табличные формы календарей, тестовых и опросных листов, таблица умножения не являются статистическими. - это таблица, где подлежащее представляет собой группировку единиц совокупности по двум и более признакам, которые распределяются на группы сначала по одному признаку, а затем на подгруппы по другому признаку внутри каждой из уже выделенных групп. Комбинационная таблица устанавливает существенную связь между факторами группировки. Примером комбинационной группировки может быть распределение полиграфических предприятий по трем существенным признакам: степени оснащенности современным полиграфическим оборудованием, степени применения современных технологий и уровню производительности труда. Такого рода статистические таблицы позволяют осуществить всесторонний анализ, но они менее наглядны.

При составлении таблиц необходимо соблюдать общие правила :

    таблица должна быть легко обозримой;

    общий заголовок должен кратко выражать основное содержание;

    наличие строк «общих итогов»;

    наличие нумерации строк, которые заполняются данными;

    соблюдение правила округления чисел.

Сводка и группировка статистических данных

В результате первой стадии статистического исследования – статистического наблюдения – получают сведения о каждой единице совокупности. Задача второй стадии статистического исследования состоит в том, чтобы упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщающую характеристику совокупности. Этот этап в статистике называется сводкой и группировкой статистических данных .

Различают простую сводку (подсчет только общих итогов) и статистическую группировку (расчленение совокупности на группы по существенному для единиц совокупности признаку).

Группировка позволяет получить такие результаты, по которым можно выявить состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи.

Результаты сводки и группировки могут быть представлены в виде статистических рядов распределения.

Статистическим рядом распределения называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку. В зависимости от признака ряды могут быть вариационными (количественными) и атрибутивными (качественными).

Вариационные ряды могут быть дискретными или интервальными.

Дискретный ряд распределения - это ряд, в котором варианты выражены целым числом.

Примером может служить распределение рабочих по тарифным разрядам:

Интервальный ряд распределения - это ряд, в котором значения признака заданы в виде интервала. Например, распределение рабочих по разрядам можно представить в виде интервального ряда.

Статистические ряды распределения позволяют систематизировать и обобщать статистический материал, однако они не дают всесторонней характеристики выделенных групп. Чтобы решить ряд конкретных задач, выявить особенности в развитии явления, обнаружить тенденции, установить зависимости, необходимо произвести группировку статистических данных.

В зависимости от цели и задач исследования различают следующие виды группировок: типологические, структурные, аналитические, комбинированные.

К типологическим группировкам относят такие группировки, которые характеризуют качественные особенности и различия между типами явлений.

Типологические группировки широко применяются в экономических, социальных и других исследованиях. Приведем пример типологической группировки (табл. 1).

Таблица 1

Распределение промышленной продукции, произведенной на предприятиях различных форм собственности за отчетный период.

Структурная группировка - это группировка, выявляющая состав (строение, структуру) однородной в качественном отношении совокупности по какому-либо признаку. Примером могут служить группировки предприятий по проценту выполнения плана, по числу рабочих и т.д.

Значение структурных группировок заключается в том, что с их помощью могут быть выделены и изучены группы предприятий преуспевающих и отстающих; выявлены неиспользованные резервы производства, например, в области улучшения использования основных фондов, повышение производительности труда, улучшение качества продукции и т.д.

Группировка населения по возрасту, например, необходима для проведения различных расчетов, связанных с медицинским, культурным, бытовым обслуживанием населения, для вычисления специальных демографических показателей и т.д. Пример структурной группировки (табл. 2).

Таблица 2

Распределение рабочих, работающих на заводах с различной среднегодовой стоимостью ОПФ в отчетном году

Наибольшая численность рабочих приходится на группу заводов со среднегодовой стоимостью ОПФ от 2,2 до 3,4 млн. усл. ден. ед., т.е. со средней стоимостью ОПФ.

Аналитическая группировка - это группировка, которая применяется для исследования взаимосвязи между явлениями. Используя аналитические группировки, определяют факторные и результативные признаки изучаемых явлений.

Факторные - это признаки, оказывающие влияние на другие, связанные с ними признаки.

Результативные – это признаки, которые изменяются под влиянием факторных. Пример аналитической группировки (табл. 3).

Таблица 3

Распределение торговых площадей магазинов

с различными объемами товарооборота

Чем больше торговая площадь (факторный признак), тем выше объем товарооборота (результативный признак).

Комбинированные группировки – образование групп по двум и более признакам, взятым в определенном сочетании. При этом группировочные признаки принято располагать, начиная с атрибутивного, в определенной последовательности, исходя из логики взаимосвязи показателей.

Применение комбинированных группировок обусловлено многообразием экономических явлений, а также необходимостью их всестороннего изучения. Но увеличение числа группировочных признаков ограничивается уменьшением наглядности, что снижает эффективность использования статистической информации. Примером комбинированной группировки может служить разделение предприятий по формам собственности, далее на подгруппы по уровню рентабельности или по другим признакам (производительность труда, фондоотдача и т.д.).

Пример комбинированной группировки см. в теме «Статистические таблицы» (табл. 3).

Техника проведения группировки

1. Определяется группировочный признак или основание группировки.

Для группировки промышленных предприятиях отрасли в качестве группировочного признака можно выбрать:

    число рабочих на предприятии;

    число всех работающих;

    мощность энергоустановок;

    объем выпуска продукции;

    стоимость ОПФ и т.д.

Таким образом, по каждому из этих признаков, множество предприятий отрасли можно разбить на группы.

2. Определяется число интервалов группировки и их границы.

Интервалы группировки могут равные и неравные.

Равные интервалы используются, когда изменение признака внутри совокупности происходит равномерно, либо если далее планируется последующая математическая обработка сгруппированных данных.

Неравные интервалы обычно используются как прогрессивно увеличивающиеся. В экономической статистике чаще всего устанавливаются границы интервалов, основанные именно на таком принципе. Число групп в группировке выбирается в этом случае из таких предпосылок: изменчивость признака, число наблюдений, однородность групп.

Имеются данные о работе 24 предприятий одной из отраслей промышленности (табл. 4.).

Таблица 4

Номер п/п

Среднегодовая стоимость ОПФ, млн. усл. ден. ед.

Среднесписочное число работающих за отчетный период, чел.

Производство продукции за отчетный период, млн. усл. ден. ед.

Выполнение

Глядя на таблицу, трудно судить о характере распределения предприятий, например, по проценту выполнения плана, по числу работающих, по стоимости основных фондов. Трудно сказать, какие показатели наиболее характерны для предприятий данной отрасли промышленности. Поэтому имеющиеся данные надо привести в систему по интересующему нас признаку.

В качестве изучаемого признака возьмем стоимость основных производственных фондов и построим к нему ряд распределения с равными закрытыми интервалами. Величина интервала определяется по формуле:

где
,
- максимальное и минимальное значения изучаемого признака,

k - число групп.

,

где n – единиц совокупности.

х max = 7,0 млн. усл. ден. ед.;

х min = 1,0 млн. усл. ден. ед.;

k = 1+ 3,32 · lg 24 = 5,58 групп

Образуем пять групп предприятий. Тогда величина интервала равна будет равна:

i = (7,0 - 1,0) / 5 = 1,2 млн. усл. ден. ед.

Теперь образуем группы предприятий, которые отличаются друг от друга по среднегодовой стоимости основных фондов на эту величину (по табл. 4).

1,0 - 2,2 (1,0 + 1,2 = 2,2) 3

2,2 - 3,4 (2,2 + 1,2 = 3,4) 9

3,4 - 4,6 (3,4 + 1,2 = 4,6) 5

4,6 - 5,8 (4,6 + 1,2 = 5,8) 3

5,8 - 7,0 (5,8 + 1,2 = 7,0) 4

На основании этого составляем таблицу, в которой показываем распределение заводов по стоимости основных фондов и удельный вес предприятий группы в % к итогу.

Таблица 5

Группы заводов по стоимости ОПФ, млн. усл. ден. ед.

Число предприятий

Удельный вес предприятий группы в % к итогу

По данным таблицы видно, что для данной отрасли характерной является группа заводов со среднегодовой стоимостью основных фондов от 2,2 до 3,4 млн. усл. ден. ед., которая составляет 37,5 % всех предприятий, при этом более половины заводов (58,3 %) имеют стоимость основных фондов в размере от 2,2 до 4,6 млн. усл. ден. ед.

Выявим распределение предприятий данной отрасли промышленности по среднегодовой стоимости основных производственных фондов. Для этого составим рабочую таблицу.

Таблица 6

Группы предприятий по среднегодовой стоимости ОПФ, млн. усл. ден. ед.

Номер предприятия

Стоимость ОПФ, млн. усл. ден. ед.

Численность рабочих, чел.

Стоимость валовой продукции, млн. усл. ден. ед.

Итого по группе

Итого по группе

Итого по группе

Итого по группе

Итого по группе

Составим таблицу с системой показателей, куда занесем результаты группировки предприятий по среднегодовой стоимости основных производственных фондов (табл. 7).

Таблица 7

Группировка заводов по среднегодовой стоимости ОПФ

Группы предпр-й по среднегод. стоимости ОПФ, млн. усл. ден. ед.

Предприятия

Стоимость ОПФ

Численность рабочих

Стоимость валовой продукции

число пред.

в % к итогу

млн. усл. ден. ед.

в % к итогу

в % к итогу

млн. усл. ден. ед.

в % к итогу

Таким образом, в отличие от ряда распределения (табл. 5) группировка позволяет сделать конкретные и содержательные выводы. Данная группировка показывает, что наиболее крупные предприятия имеют лучшие производственные показатели: 29,2% предприятий (группы 4 и 5) имеют 45% всех основных фондов и дают 52% всего объема промышленной продукции, имея лишь 31,5% общего числа рабочих.

Приемы вторичной группировки

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой.

К этому методу прибегают в двух случаях:

1) когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов.

2) для приведения к сопоставимому виду группировок с различными интервалами.

Рассмотрим приемы вторичной группировки на примерах.

Пример 1.

Произвести укрупнение интервалов на основе данных таблицы 8:

Таблица 8

Группы магазинов по размеру товарооборота за IV квартал,

тыс. усл. ден. ед.

Число магазинов

Товарооборот за IV квартал,

тыс. усл. ден. ед.

Задачи группировок состоят в следующем:

  • выделение социально-экономических типов;
  • изучение структуры совокупности;
  • исследование связи между признаками.

В соответствии с указанными задачами различают три вида группировок:

  • типологические;
  • структурные (вариационные);
  • аналитические (факторные).

Типологическая группировка – это разделение разнородной совокупности на однокачественные группы (частные совокупности), которые отличаются типом явлений.

Структурная группировка предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку.

Аналитическая группировка является средством изучения связи между признаками.

Особенность типологической группировки состоит в том, что перечень типов, которые могут встречаться в изучаемой совокупности, предварительно устанавливается экспертным путем в соответствии с поставленной целью исследования. Например, в целях регламентации банковской деятельности контролирующие органы США делят банки по объему собственных средств на пять типов:

  • – с большим капиталом;
  • – достаточным капиталом;
  • – недостаточным капиталом;
  • – значительно недостаточным капиталом;
  • – критически недостаточным капиталом.

Банк, который переходит в более низкую категорию, не может без разрешения регулирующих органов увеличивать активы, выплачивать дивиденды держателям акций.

В России в целях изучения деловой активности банков на основе соответствующего мониторинга, проводимого Центром экономической конъюнктуры при Правительстве РФ, их делят по такому же признаку, но только на три группы: малые, средние и крупные.

Экспертным путем осуществляется и выбор признаков для разграничения выделяемых типов явлений. Так, разделение банков по размеру возможно и по другим признакам, например по объему суммарных активов.

Структурная группировка обеспечивает разграничение групп в соответствии с уровнем вариации по изучаемому признаку. Пример такой группировки представлен в табл. 2.1.

Таблица 2.1

Группировка кредитных организаций РФ по величине активов (%, к итогу")

Группа кредитных организаций по величине активов (г), млн руб.

Количество филиалов

Собственные средства

Объем вкладов физических лиц

Объем кредитов, предоставленных банкам и другим клиентам

Пример показывает, что указанные различия между типологической и структурной группировками во многом являются условными. С одной стороны, выделенные типы отражают структуру совокупности. С другой – если задать границы интервалов суммы активов, соответствующие типам банков по размеру (малые, средние, крупные), то можно будет назвать группировку типологической.

Аналитическая группировка в силу характера решаемых задач отличается тем, что при ее построении признаки делятся на факторные и результативные. Единицы совокупности группируются по факторному признаку, а затем каждая группа характеризуется средними величинами результативного признака.

Сопоставляя изменения средних значений результативного признака по группам с изменением фактора, можно сделать вывод о наличии или отсутствии связи, ее форме и направлении (линейная или нелинейная, прямая или обратная). Пример аналитической группировки представлен в табл. 2.2.

Таблица 2.2

Характеристика зависимости соотношения вложенных и израсходованных сбережений населения региона в зависимости от состава семьи

В приведенном примере средний уровень соотношения вложенных и израсходованных сбережений населения изменится от группы к группе семей; наблюдается нелинейная зависимость между показателем, характеризующим размер семьи, и средним уровнем соотношения суммы вложенных и израсходованных сбережений: в семьях большего размера это соотношение ниже.

Использование структурных группировок позволяет не только раскрыть соотношение отдельных частей изучаемой совокупности, но и через сопоставление во времени проанализировать наметившиеся в ней структурные сдвиги. В качестве сводной характеристики интенсивности изменений можно использовать интегральные показатели структурных сдвигов, в частности линейный и квадратический коэффициенты абсолютных структурных сдвигов.

Для оценки усиления или снижения интенсивности структурных сдвигов целесообразно проводить их расчет по нескольким периодам. Достаточно распространенным сводным показателем структурных сдвигов, имеющим не только нижнюю, но и верхнюю границы изменения, является индекс различий. Он колеблется от нуля до единицы. Чем ближе его величина к единице, тем значительнее степень изменений в составе анализируемой группы статей.

Формулы расчета:

1) линейный коэффициент абсолютных структурных сдвигов:

2) квадратический коэффициент абсолютных структурных сдвигов:

Примером такого использования структурной группировки могут служить данные о прогнозе изменений в экономике, предусмотренные в приложении 2 к Концепции долгосрочного социально-экономического развития Российской Федерации на период до 2020 года (табл. 2.3).

Таблица 2.3

Прогноз изменения структуры добавленной стоимости по основным секторам экономики (в ценах 2007 г.)

Сектор экономики

Удельный вес в общей сумме добавленной стоимости, %

2007 г. (d 0)

2020 г. (d 1)

Инновационный

Нефтегазовый

Сырьевой сектор

Транспорт

Оптовая и розничная торговля

Для данных, представленных в таблице, линейный коэффициент абсолютных структурных сдвигов равен 2,6 процентного пункта (п. п.); квадратичный коэффициент абсолютных структурных сдвигов равен 3,6 п. п.; индекс различий равен 0,08.

Данные, приведенные в табл. 2.3, и показатели интенсивности структурных сдвигов свидетельствуют о прогнозируемых заметных изменениях в составе добавленной стоимости по основным секторам экономики за 2007–2020 гг.

Группировка может быть произведена по одному или нескольким признакам. Если группы образуются по одному признаку, группировка называется простой.

Группировка, в которой разделение совокупности на группы производится по двум или более признакам, взятым в сочетании, называется комбинационной. В этом случае каждая группа, выделенная по одному (первому) признаку, разбивается на подгруппы по второму, а последние – на подгруппы по третьему признаку и т.д.

Одновременное использование нескольких группировочных признаков позволяет выявить качественные различия, структурные особенности и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированной группировки по ряду группировочных признаков. Однако комбинация группировочных признаков резко увеличивает число групп, отсюда при использовании комбинационных группировок предполагается достаточно большое число наблюдений.

Основанием группировки может служить как неколичественный (атрибутивный), так и количественный признак.

Атрибутивные признаки выражают свойства явления в виде их наименования. Отсюда выбор группировочного признака предопределяет иногда и количество групп. Так, при группировке населения по полу возможны только две группы, а при изучении профессионального состава рабочих может быть образовано несколько групп с учетом разных профессий.

В целом атрибутивный характер признака не снимает вопроса о числе выделяемых групп, так как при обилии атрибутивных вариантов создается чрезмерная раздробленность изучаемого явления. В результате для образования групп по таким признакам приходится объединять ряд их значений. Рекомендуется, например, объединять родственные профессии в группы, охватывающие тот или иной вид труда (токари, фрезеровщики могут быть объединены в группу станочников), либо рабочие различных профессий вспомогательного производства могут быть распределены на следующие укрупненные группы: ремонтную, технического контроля, транспортную и т.д.

Разграничение групп и подгрупп по количественным группировочным признакам, как правило, связано с образованием интервалов по этим признакам. Лишь тогда, когда дискретный признак изменяется в небольших пределах, группировка совпадает со значением признака (например, семьи – по числу членов и т.д.).

Интервалы группировки – это количественные значения признака, на основе которых исследуемые явления разбиваются на группы. Разность между верхней и нижней границами интервала составляет его величину. Интервалы бывают равными (когда их величина одинакова во всех группах) или неравными (когда их величина изменяется от одной группы к другой).

Равные интервалы применяются в тех случаях, когда изменение признака происходит в сравнительно узких границах и носит более или менее равномерный характер. Они дают возможность шире применять математические приемы анализа.

Для группировки с равными интервалами величина интервала определяется по формуле

где i – величина отдельного интервала; и – наибольшее и наименьшее значения признака в исследуемой совокупности; п – число групп.

Неравные интервалы иногда применяют как прогрессивно возрастающие или убывающие. Использование таких интервалов при изучении социально-экономических явлений обусловлено тем, что для большей их части количественное изменение размера признака имеет неодинаковое значение в высших и низших группах. Так, разница в товарообороте, составляющая 10 тыс. руб., для мелких магазинов имеет существенное значение, а для крупных – несущественное.

И наконец, интервалы группировки могут быть замкнутыми (с указанием нижней и верхней границ) и открытыми (с указанием одной из границ). Открытые интервалы применяют только для крайних групп.

Порядок выбора группировочного признака, приемы образования, смысл и значение интервалов и групп – все эти вопросы конкретизируются применительно к каждому виду группировок.

Число интервалов при типологической группировке определяется числом выделенных типов, а величина каждого из них зависит от содержания отграничиваемого с его помощью типа. При этом используют, как правило, открытые и неравные интервалы.

В аналитических и структурных группировках анализ проводится в рамках однокачественных совокупностей, отграниченных в результате типологической группировки. В связи с этим объективного единого принципа определения числа групп нет. В каждом конкретном случае необходимо принимать во внимание объем изучаемой совокупности и характер изменчивости признака. Чем значительнее совокупность единиц, чем интенсивнее меняется признак, тем больше может быть образовано групп. С целью определения границ вариации и непосредственного сопоставления изменения взаимосвязанных признаков в структурных и аналитических группировках применяют чаще всего закрытые, равные интервалы. Однако требование, связанное с обеспечением достаточной заполненности групп, приводит к необходимости использования в ряде случаев группировки но неравным интервалам.

Ориентировочно количество групп при группировке с равными интервалами можно рассчитывать по формуле, предложенной американским ученым Стерджессом:

где N – число единиц совокупности; п – число групп.

Статистические группировки, как правило, формируют на основе первичного статистического материала. Такие группировки называют первичными. Иногда для образования новых групп приходится пользоваться уже имеющимися группировками. Такие группировки называют вторичными.

Необходимость в перегруппировке данных возникает в тех случаях, когда произведенные ранее группировки не удовлетворяют целям исследования по двум основным причинам:

  • число имеющихся групп больше (или меньше), чем это требуется для характеристики типических отношений и связей;
  • первичная группировка проведена по разным группировочным признакам или разным интервалам с точки зрения сопоставимости данных, относящихся к различным периодам времени или различным территориям.

Новые группы могут быть получены следующими способами:

  • 1) перегруппировкой по величине интервалов первичной группировки;
  • 2) перегруппировкой по удельному весу отдельных групп в общем их итоге.

Для достижения единообразия в обработке статистических данных на практике часто используют классификации.

Классификация рассматривается как разновидность типологической группировки. Она представляет собой систематизированные распределения явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. Примерами могут служить ОКВЭД, классификация секторов экономики и экономических активов в системе национальных счетов и др.

Классификация является своеобразным стандартом, установленным на определенный промежуток времени. В основе классификации, как правило, лежит атрибутивный признак, который может иметь множество разновидностей. Они дополняются и конкретизируются в номенклатуре. Под номенклатурой понимается стандартный перечень объектов и групп, входящих в определенную классификацию.

Четко разделить группировки и классификации довольно трудно, поскольку они выполняют однотипные функции. Классификации рассчитаны на длительное применение, однако с течением времени их пересматривают и корректируют.

В отличие от классификации группировки производят для целей данного конкретного исследования, рассмотрения в нем какого-либо отдельного вопроса. Например, при разработке концепции жизненного цикла домохозяйства американскими маркетологами использовались следующие границы возраста: молодость – до 35 лет; средний возраст – 35–64 года; старший возраст – 65 лет и старше.

В отечественной практике для анализа поведенческой модели различных групп населения на потребительском рынке согласно методике регулярных опросов потребительского поведения населения в России, которые проводятся Росстатом ежеквартально, используются другие возрастные границы: молодость – 16–29 лет; средний возраст – от 30–49 лет; старший возраст – 50 лет и старше.

В настоящее время с целью группировки объектов, характеризующихся большим количеством признаков, широко используются методы многомерной группировки, или методы многомерной классификации.

По существу, здесь сохраняется реализуемый при типологической группировке принцип сходства и различия единиц совокупности. Сходство – это однородность единиц в группах, различие – это их существенное расхождение по группам. Иными словами, во-первых, в один класс объединяются объекты, сходные между собой в некотором отношении, а во-вторых, степень сходства объектов, принадлежащих к одному классу, должна быть больше, чем степень сходства объектов, относящихся к разным классам. В типологической группировке понятия сходства и степени сходства не формализованы, а в процедурах многомерной классификации они формализованы и выражаются рядом функциональных соотношений.

В случае многомерной классификации при распределении единиц па однородные группы одновременно используются все группировочные признаки, т.е. реализуется политетический подход к образованию групп.

Объекты объединяются в один класс в соответствии с выбранным типом мер их сходства (коэффициенты связи, показатели расстояния, коэффициенты подобия). Например, данный метод статистического анализа приобретает особое значение в связи с введением системы управления предприятиями и организациями, обеспечивающей своевременное изменение параметров их деятельности в условиях нестабильности внешней среды, для адаптации к запросам конъюнктуры рынка. Сложность решения такого рода задач заключается в том, что в этом случае необходимо проводить анализ не изолированно, а в сравнении с другими субъектами хозяйственной деятельности.

Переход к широкому использованию методов многомерной классификации связан с накоплением достаточно большого объема систематизированной информации. В связи с этим неслучайно сферой активного приложения метода многомерной классификации стал финансовый сектор. Отчетность институциональных единиц этого сектора, прежде всего банков, в силу специфики их деятельности как финансовых посредников формируется с учетом

потребностей различных категорий внешних пользователей, например классификация коммерческих банков по уровню их деловой активности, ресурсообеспеченности, кредитоориентированности, инвестиционной активности, финансовой устойчивости.

Простейшим вариантом многомерной классификации является группировка на основе многомерной средней. Многомерной средней называется средняя величина нескольких признаков для одной единицы совокупности. В силу несопоставимости абсолютных значений разных признаков многомерная средняя вычисляется из относительных величин, рассчитанных по этим признакам. Формула многомерной средней следующая:

где i – номер единицы совокупности; j – номер признака; – многомерная средняя для i -й единицы совокупности; т – число признаков; – значение признака для i -й единицы; – среднее значение признака , рассчитанное по всей совокупности единиц.

Пример группировки на основе многомерной средней представлен в табл. 2.4.

Таблица 2.4

Группировка банков по показателям эффективности управления активными и пассивными операциями

Доходность активов (x 1)

Маржа прибыли, т.е. отношение прибыли к доходам 2)

Средние значения

Рассчитанные многомерные средние позволяют сравнить банки и сделать вывод, что два банка имеют примерно одинаковый уровень эффективности управления активами и пассивами, один банк – средний уровень, два банка отстают от остальных и имеют примерно одинаковую величину Р, (0,58 и 0,50).