Средняя арифметическая взвешенная способом моментов. Основные свойства средней величины. Взаимосвязь между индексами

«Способ моментов» применяется в рядах с равными интервалами на основе свойств средней арифметической. Средняя арифметическая исчисляется по формуле

где i – размер интервала;

m 1 – момент первого порядка (средняя арифметическая из новых упрощенных вариант
;
– новые упрощенные варианты;f – частота);

А – постоянное число (лучше всего взять его равным варианте, у которой наибольшая частота).

Определим среднее значение признака «способом моментов» на следующем примере.

Пример 5 . Имеются следующие данные о распределении магазинов облпотребсоюза по торговой площади (табл. 14).

Таблица 14

Следует определить среднюю площадь магазинов, применив «способ моментов».

Решение

Данные распределения магазинов по торговой площади представлены в виде интервального ряда распределения с равными интервалами (i = 20 м 2), следовательно, расчет средней площади магазина можно провести по формуле
, применив «способ моментов».

Первый и последний интервалы даны открытыми, т. е. не имеют границ нижней и верхней соответственно. Для определения среднего значения в них границы интервалов следует закрыть. Для первой группы с размером площади до 40 м 2 условно считаем, что интервал также равен 20 м 2 , затем вычитаем 20 м 2 из 40 м 2 и находим условную нижнюю границу первого интервала (20 – 40). Условную верхнюю границу последнего интервала определяем аналогично (100 – 120).

Расчеты следует проводить в табл. 15.

Таблица 15

Группировка мага- зинов по торговой площади, м 2 (х )

Удельный вес магазинов, % (f )

Середина интервала (х )

х А

Наибольшая частота f равна 40, следовательно, в качестве постоянной величины А принимаем 70.

Определяем момент первого порядка:
.

Среднее значение признака равно:

+ 70 = = 68 м 2 .

Следовательно, средняя площадь магазина составляет 68 м 2 .

5.3. Структурные средние

В качестве структурных средних чаще всего используют показатели моды и медианы. Мода (Мо ) – наиболее часто повторяющееся значение признака. Медиана (Ме ) – величина признака, которая делит упорядоченный ряд на две равные по численности части.

Если расчет моды и медианы проводится в дискретном ряду, то он опирается на их понятия. В интервальном ряду распределения для расчета моды и медианы применяют следующие формулы.

Мода рассчитывается по формуле

где х Мо – нижнее значение модального интервала;

i Мо – размер модального интервала;

f Мо – частота модального интервала;

f Мо –1 – частота, предшествующая модальной частоте;

f Мо +1 – частота, последующая за модальной частотой.

Модальному интервалу соответствует наибольшая (модальная) частота. Медиана рассчитывается по формуле

,

где х Ме – нижнее значение медианного интервала;

i Ме – размер медианного интервала;

f – сумма частот;

S Ме –1 – сумма частот, предшествующих медианной частоте;

f Ме – медианная частота.

Медианному интервалу соответствует медианная частота. Таким интервалом будет интервал, сумма накопленных частот которого равна или превышает половину суммы всех частот.

Рассмотрим определение моды и медианы на следующих примерах.

Пример 6 . В результате статистического обследования области получены следующие данные по распределению семей по числу детей (табл. 16).

Таблица 16

Следует определить моду и медиану.

Решение

В дискретных рядах модой является варианта с наибольшей частотой. Наибольшая частота – 34, следовательно мода равна 2.

Для вычисления медианы определим сумму частот ряда (f = 100), затем рассчитаем полусумму
.

Так как сумма накопленных частот 5 + 32 + 34 = 71 превышает полусумму (71 > 50), то варианта, имеющая значение 2 и соответствующая этой накопленной сумме частот, и есть медиана.

Пример 7 . В результате статистического обследования получены следующие данные распределения продавцов магазинов облпотребсоюза по возрасту (табл. 17).

Таблица 17

Необходимо определить моду и медиану.

Решение

В интервальных рядах мода и медиана определяются по вышеприведенным формулам.

Сначала определим модальный интервал, он соответствует наибольшей частоте. Так как наибольшая частота равна 35 и является модальной, то интервал 30–40 является модальным интервалом. Затем подставим данные в следующую формулу:

Определим медианный интервал. Полусумма частот равна 50
. Накапливая частоты, определим интересующий интервал. Так как сумма накопленных частот 6 + 24 + 35 = 65 превышает полусумму (65 > 50), значит 35 является медианной частотой, а интервал 30–40 является медианным интервалом.

Затем подставим данные в формулу

Таким образом, мода равна 35,5 лет (больше всего продавцов в возрасте 35,5 лет), медиана – 35,7 лет (50 % продавцов достигли возраста 35,7 лет).

В процессе вычисления средней арифметической и использования ее в анализе социально-экономических процессов может оказаться полезным знание ряда ее математических свойств, которые мы приведем без развернутых доказательств.

Свойство 1. Средняя арифметическая постоянной величины равна этой постоянной: при

Свойство 2. Алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической равна нулю: для несгруппированных данных и для рядов распределения.

Это свойство означает, что сумма положительных отклонений равна сумме отрицательных отклонений, т.е. все отклонения, обусловленные случайными причинами взаимно погашаются.

Свойство 3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической есть число минимальное: для несгруппировочных данных и для рядов распределения. Это свойство означает, что сумма квадратов отклонений индивидуальных значений признака от средней арифметической всегда меньше суммы отклонений вариантов признака от любого другого значения, даже мало отличающегося от средней.

Второе и третье свойство средней арифметической применяются для проверки правильности расчета средней величины; при изучении закономерностей изменения уровней ряда динамики; для нахождения параметров уравнения регрессии при изучении корреляционной связи между признаками.

Все три первых свойства выражают сущностные черты средней как статистической категории.

Следующие свойства средней рассматриваются как вычислительные, поскольку они имеют некоторое прикладное значение.

Свойство 4. Если все веса (частоты) разделить на какое-либо постоянное число d, то средняя арифметическая не изменится, поскольку это сокращение в равной степени коснется и числителя и знаменателя формулы расчета средней.

Из этого свойства вытекают два важных следствия.

Следствие 1. Если все веса равны между собой, то вычисление средней арифметической взвешенной можно заменить вычислением средней арифметической простой.

Следствие 2. Абсолютные значения частот (весов) можно заменять их удельными весами.

Свойство 5. Если все варианты разделить или умножить на какое-либо постоянное число d, то средняя арифметическая уменьшиться или увеличиться в d раз.

Свойство 6. Если все варианты уменьшить или увеличить на постоянной число A, то и со средней произойдут аналогичные изменения.

Прикладные свойства средней арифметической можно проиллюстрировать, применив способ расчета средней от условного начала (способ моментов).

Средняя арифметическая способом моментов вычисляется по формуле:

где А – середина какого-либо интервала (предпочтение отдается центральному);



d – величина равновеликого интервала, или наибольший кратный делитель интервалов;

m 1 – момент первого порядка.

Момент первого порядка определяется следующим образом:

.

Технику применения этого способа расчета проиллюстрируем по данным предшествующего примера.

Таблица 5.6

Стаж работы, лет Число рабочих Середина интервала x
до 5 2,5 -10 -2 -28
5-10 7,5 -5 -1 -22
10-15 12,5
15-20 17,5 +5 +1 +25
20 и выше 22,5 +10 +2 +22
Итого Х Х Х -3

Как видно из расчетов, приведенных в табл. 5.6 из всех вариантов вычитается одно из их значений 12,5, которое приравнивается нулю и служит условным началом отсчета. В результате деления разностей на величину интервала – 5 получают новые варианты.

Согласно итогу табл. 5.6 имеем: .

Результат вычислений по способу моментов аналогичен результату, который был получен применением основного способа расчета по средней арифметической взвешенной.

ЦЕЛЬ ЗАНЯТИЯ: Овладеть основами вариационной статистики, навыками вычисления и оценки достоверности средних величин

МЕТОДИКА ПРОВЕДЕНИЯ ЗАНЯТИЯ: Студенты самостоятельно готовятся к практическому занятию по рекомендованной литературе и выполняют индивидуальное домашнее задание. Преподаватель в течение 10 минут проверяет правильность выполнения домашнего задания и указывает на допущенные ошибки, проверяет степень подготовки с использованием тестирования и устного опроса. Затем студенты самостоятельно вычисляют средние величины и оценивают их достоверность. В конце занятия преподаватель проверяет самостоятельную работу студентов.

КОНТРОЛЬНЫЕ ВОПРОСЫ:

1. Что представляет собой вариационный ряд, какие виды вариационных рядов выделяют в статистике, каковы элементы вариационного ряда.

2. Что такое средние величины, возможности их использования в медицине и практической деятельности врача.

3. Виды средних величин: мода, медиана, средняя арифметическая

4. Методика вычисления средней арифметической и параметров, характеризующих среднюю.

5. Какие математические законы позволяют теоретически обосновать достоверность статистических данных.

6. Как определить среднюю ошибку средней величины.

7. Что понимается под доверительной границей производных величин.

8. Оценка достоверности различий средних величин при помощи доверительного коэффициента t.

9. Оценка критерия достоверности при больших и малых выборках.

В медико-социальных исследованиях наряду с абсолютными и относительными широко используются средние величины. Средняя величина – это совокупная обобщающая характеристика количественных признаков, она обычно обозначается буквой М или Х. Средние величины существенно отличаются от статистических коэффициентов:

1. Коэффициенты характеризуют признак, встречающийся только у некоторой части статистического коллектива, так называемый альтернативный признак, который может иметь место или не иметь место (рождение, смерть, заболевание, инвалидность).

Средние величины охватывают признаки, присущие всем членам коллектива, но в разной степени (вес, рост, дни лечения в больнице).

2. Коэффициенты применяются для измерения качественных признаков. Средние величины - для варьирующих количественных признаков.

Применение средних величин в медико-социальных исследованиях широко используется при изучении физического развития. Кроме того, средние величины применяются:

1. Для характеристики организации работы лечебно-профилактических учреждений и оценки их деятельности:

А) в поликлинике: показатели нагрузки врачей, посещаемость поликлиники, среднее число посещений на 1-м году жизни, среднее число детей на участке, среднее число посещений при определенном заболевании и т. д.;

Б) в стационаре: среднее число дней работы койки в году; средняя длительность лечения при определенных заболеваниях и т. д.;

В) в органах санэпиднадзора: средняя площадь (или кубатура) на 1 человека, средние нормы питания (белки, жиры, углеводы, витамины, минеральные соли, калории) в дневном рационе возрастных групп у детей и взрослых и т. д.

2. Для определения медико-физиологических показателей организма в норме и патологии в клинических и экспериментальных исследованиях.

3. В специальных демографических и медико-социальных исследованиях.

Для расчета средней величины необходимо построить вариационный ряд - т. е. ряд числовых измерений определенного признака, отличающихся по своей величине.

Вариационные ряды бывают следующих видов:

А) ранжированный, неранжированный;

Б) сгруппированный, несгруппированный;

В) прерывный, непрерывный.

Ранжированный ряд - упорядоченный ряд; варианты располагаются последовательно по нарастанию или убыванию числовых значений.

Неранжированный ряд - варианты располагаются бессистемно.

Прерывный (дискретный) ряд - варианты выражены в виде целых (дискретных) чисел (окна в избе).

Непрерывный ряд – варианты могут быть выражены дробными числами.

Несгруппированный ряд – каждому значению варианты соответствует определенное число частот.

Сгруппированный ряд (интервальный) – варианты соединены в группы, объединяющие их по величине в пределах определенного интервала.

В статистике принято выделять следующие виды средних величин: мода (Мо), медиана (Ме) и средняя арифметическая (М). Мода – величина варьирующего признака, наиболее часто встречающаяся в совокупности. В вариационном ряду это варианта, имеющая наибольшую частоту встречаемости. Обычно мода является величиной довольно близкой к средней арифметической, совпадает с ней при полной симметрии распределения. Медиана – варианта, делящая вариационный ряд на две равные половины. При нечетном числе наблюдений медианой является варианта, имеющая в вариационном ряду порядковый номер (n + 1): 2. Средняя арифметическая величина (М) – в отличие от моды и медианы опирается на все произведенные наблюдения, поэтому является важной характеристикой для всего распределения.

В зависимости от вида вариационного ряда используется тот или иной способ расчета средней. Средняя арифметическая для простого ряда, где каждая варианта встречается один раз, вычисляется по формуле: М =

Знак суммы, V –отдельные значения вариант, n –число наблюдений. Средняя арифметическая взвешенная определяется по формуле: М=

Знак суммы, V –отдельные значения вариант, n –число наблюдений, р – частота встречаемости вариант. Одним из наиболее простых и достаточно точных способов расчета средней арифметической является способ моментов, основанный на том, что алгебраическая сумма отклонений каждой варианты вариационного ряда от средней арифметической равна нулю. М= А + i

Где А – условно принятая средняя или мода, а- отклонение каждой варианты от условно принятой средней, р –частота встречаемости вариант, n –число наблюдений, i – интервал или расстояние между соседними вариантами. Основные свойства средней величины: 1) имеет абстрактный характер, так как является обобщающей величиной: в ней стираются случайные колебания; 2) занимает срединное положение в ряду (в строго симметричном ряду); 3) сумма отклонений всех вариант от средней величины равна нулю. Данное свойство средней величины используется для проверки правильности расчета средней. Она оценивается по уровню колеблемости вариационного ряда. Критериями такой оценки могут служить: амплитуда (разница между крайними вариантами); среднее квадратическое отклонение, показывающее, как отличаются варианты от рассчитанной средней величины; коэффициент вариации.

Среднеквадратическое отклонение (

) наиболее точно характеризует степень разнообразия варьирующего признака, без чего нельзя достаточно полно охарактеризовать явление. Для простого вариационного ряда (р =1) среднеквадратическое отклонение расчитывается по формуле

Для взвешенного вариационного ряда по формуле:

Где d = V – M - отклонение каждой варианты от средней арифметической. При числе наблюдений меньше 30 в знаменателе этих формул берется не n, а n – 1 (так называемое в статистике число степеней свободы). При числе наблюдений более 30 уменьшение знаменателя на единицу не имеет практического значения, т.к. существенно не сказывается на конечном результате. Значительно упрощает вычисления расчет среднего квадратического отклонения по способу моментов.

где, величина

называется моментом первой степени, а

Моментом второй степени.

Степень разнообразия (колеблемости) признака в вариационном ряду можно оценить по коэффициенту вариации (отношение среднего квадратического отклонения к средней величине, умноженное на 100%); при вариации менее 10% отмечается слабое разнообразие, при вариации 10-20% - среднее, а при вариации более 20% - сильное разнообразие признака. Если нет возможности сравнить вариационный ряд с другими, то используют правило трех сигм. Если к средней прибавить одну сигму, то этой вычисленной средней соответствует 68,3%, при двух сигмах - 95,4%, при трех сигмах - 99,7% от всех признаков. В медицине с величиной М ± 1? связано понятие нормы; отклонения от средней (в любую сторону) больше, чем на 1?, но меньше чем на 2?, считаются субнормальными (выше или ниже нормы), а при отклонении от средней больше чем на 2?, варианты считаются значительно отличающимися от нормы (патология).

Мерой точности и достоверности результатов выборочных статистических величин являются средние ошибки представительности (репрезентативности). Средняя ошибка средней арифметической – m (отношение среднего квадратического отклонения к квадратному корню из общего числа наблюдений - объектов). m =

Мерой достоверности среднего показателя наряду с его ошибкой являются, доверительные границы и достоверность разности между двумя средними величинами.

ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ:

ЗАДАНИЕ №1. Определить моду и медиану вариационного ряда. На основе приведенных данных вычислите: среднюю арифметическую по способу моментов, среднее квадратическое отклонение, коэффициент вариации, среднюю ошибку средней арифметической

Задача 1.

Вычислите среднюю длительность пребывания больного в хирургическом отделении стационара

Задача 2.

Вычислите среднюю длительность временной нетрудоспособности при гипертонической болезни II стадии (гипертонический криз)

Вычислите среднюю частоту пульса в группе здоровых мужчин в возрасте 22 года после умеренной физической нагрузки

Задача 4.

Вычислите среднюю жилую площадь, приходящуюся на одного человека в семьях с низким уровнем достатка

Задача 5.

Вычислите средний вес у девочек 12 лет, воспитывающихся в интернате

Задача 6.

Вычислите максимальную мышечную силу правой кисти у 15-летних юношей, регулярно посещающих спортивные секции

Задача 7.

Вычислите средний рост 17-летних девушек, обучающихся в общеобразовательной школе.

Задача 8.

Вычислите среднее число пациентов принятых участковым терапевтом за один рабочий день

Задача 9.

Вычислите среднее число детей в дагестанской семье

Задача 10.

Вычислите среднее число пораженных кариесом зубов у 18 летних студенток медицинской академии (индекс КПУ)

Задача 11.

Вычислите среднее число детей первого года жизни, проживающих на одном педиатрическом участке

Задача 12.

Вычислить среднее число пропущенных занятий по дисциплине «Общественное здоровье и здравоохранение» студентами 4 курса лечебного факультета в весеннем семестре

Задача 13.

Вычислите средний рост призывников в Ставропольском крае

Задача 14.

Вычислите среднее число пациентов принятых хирургом в поликлинике за один рабочий день

ЗАДАНИЕ №2. Для средних величин, вычисленных в предыдущем задании определите доверительные границы с вероятностью безошибочного прогноза 95%.

Ю.П. Лисицын. Общественное здоровье и здравоохранение. Учебник для вузов. М., 2002.

Ю.П. Лисицын. Социальная гигиена (медицина) и организация здравоохранения. Казань, 1999. –с. 288-289.

В.К. Юрьев, Г.И. Куценко. Общественное здоровье и здравоохранение. С.-П., 2000. –с. 191-199.

А.Ф. Серенко, В.В. Ермаков. Социальная гигиена и организация здравоохранения. М., 1984. –с.124-146.

Общественное здоровье и здравоохранение. Под ред. В.А. Миняева, Н.И. Вишнякова. М. «МЕДпресс-информ», 2002. –с. 97-107.

Руководство по социальной гигиене и организации здравоохранения. Под ред. Ю.П. Лисицына. М., 1987.

Зайцев В.М., Лифляндский В.Г., Маринкин В.И. Прикладная медицинская статистика. С.-П. «Фолиант», 2003.

Методы вычисления средней арифметической (средней арифметической простой и взвешенной, по способу моментов)

Определяем средние величины:

Мода (Мо) =11, т.к. данная варианта встречается в вариационном ряду наиболее часто (р=6).

Медиана (Ме) - порядковый номер варианты занимающей срединное положение = 23, это место в вариационном ряду занимает варианта равная 11. Средняя арифметическая (М) позволяет наиболее полно охарактеризовать средний уровень изучаемого признака. Для вычисления средней арифметической используется два способа: среднеарифметический способ и способ моментов.

Если частота встречаемости каждой варианты в вариационном ряду равна 1, то рассчитывают среднюю арифметическую простую, используя среднеарифметический способ: М = .

Если частота встречаемости вариант в вариационном ряду отличается от 1, то рассчитывают среднюю арифметическую взвешенную, по среднеарифметическому способу:

По способу моментов: А - условная средняя,

М = A + =11 += 10.4 d=V-A, A=Mo=11

Если число вариант в вариационном ряду более 30, то строится сгруппированный ряд. Построение сгруппированного ряда:

1) определение Vmin и Vmax Vmin=3, Vmax=20;

2) определение количества групп (по таблице);

3) расчет интервала между группами i = 3;

4) определение начала и конца групп;

5) определение частоты вариант каждой группы (таблица 2).

Таблица 2

Методика построения сгруппированного ряда

Длительность

лечения в днях

n=45 p=480 p=30 2 p=766

Преимущество сгруппированного вариационного ряда заключается в том, что исследователь работает не с каждой вариантой, а только с вариантами, являющимися средними для каждой группы. Это позволяет в значительной степени облегчить расчеты средней.

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Данную особенность статистической совокупности характеризует одно из групповых свойств генеральной совокупности - разнообразие признака . Например, возьмем группу мальчиков 12 лет и измерим их рост. После проведенных расчетов средний уровень данного признака составит 153 см. Но средняя характеризует общую меру изучаемого признака. Среди мальчиков данного возраста есть мальчики, рост которых составляет 165 см или 141 см. Чем больше мальчиков будут иметь рост отличный от 153 см, тем больше будет разнообразие этого признака в статистической совокупности.

Статистика позволяет охарактеризовать данное свойство следующим критериями:

лимит (lim),

амплитуда (Amp),

среднеквадратическое отклонение (у),

коэффициент вариации (Сv).

Лимит (lim) определяется крайними значениями вариант в вариационном ряду:

lim=V min /V max

Амплитуда (Amp) - разность крайних вариант:

Amp=V max -V min

Данные величины учитывают только разнообразие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Поэтому данными критериями можно пользоваться для приближенной характеристики разнообразия, особенно при малом числе наблюдений (n<30).

вариационный ряд медицинская статистика

М ср - рассчитанная при помощи метода моментов = 61,6 кг

Средняя арифметическая величина обладает тремя свой­ствами.

1. Средняя занимает серединное положение в вариационном ряду . В строго симметричном ряду: М = М 0 =М е.

2. Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных, она вскрывает то типичное, что характерно для всей совокуп­ности . К средней обращаются всякий раз, когда надо исклю­чить случайное влияние от­дельных факторов, выявить об­щие черты, существующие за­кономерности, получить полное и глубокое представление о наиболее общих и характерных особенностях всей группы.

3. Сумма отклоне­ний всех вариант от средней равна нулю : S (V-M)= 0 . Это происходит потому, что средняя величина превышает размеры одних вариант и мень­ше размеров других вариант.

Иначе говоря, истинное отклонение вариант от истинной средней (d =v-М) может быть положительной и отрицательной величи­ной, поэтому сумма S всех "+"d и "-"d равна нулю.

Данное свойство средней используется при проверке правильности расчетов М. Если сумма отклонений вариант от средней равна нулю, то можно сделать вывод, что средняя вычислена правильно. На этом свойстве основан способ моментов для определения М. Ведь если условная средняя А будет равна истинной М, то сумма отклонений вариант от условной средней будет равна нулю.

Роль средних величин в биологии чрезвычайно велика. С одной стороны их используют для характеристики явлений в целом, с другой - они необходимы для оценки отдельных величин. При сравнении отдельных величин со средними получают ценные харак­теристики для каждой из них. Использование средних величин требует строгого соблюдения принципа однородности совокупности. Нарушение этого принципа искажает представление о реальных процессах.

Вычисление средних из неоднородной в социально-экономическом отношении совокупности делает их фик­тивными, искаженными. Следовательно, для того чтобы правильно использовать средние величины, надо быть уверенным в том, что они характеризуют однородные статистические совокупности.

ХАРАКТЕРИСТИКА РАЗНООБРАЗИЯ ПРИЗНАКА В

СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Напри­мер, в группе детей, однородной по возрасту, полу и месту житель­ства, рост каждого ребенка отличается от роста сверстников. То же можно сказать о числе посещений, сделанных отдельными лицами в поликлинику, об уровне белка крови у каждого больного ревматизмом, об уровне артериального давления у отдельных лиц, больных гипертонической болезнью и т. п. В этом проявляется разнообразие, колеблемость признака в изучаемой совокупности. Вариабельность демонстративно можно представить на примере роста в группах подростков.



Статистика позволяет охарактеризовать это специальными крите­риями, определяющими уровень разнообразия каждого признака в той или иной группе. К таким критериям относятся лимит (lim), амплитуда ряда (Am), среднее квадратическое отклонение (s) и коффициент вариации (C v). Так как каждый из этих крите­риев имеет свое самостоятельное значение, то следует остановиться на них отдельно.

Лимит - опреде­ляется крайними значе­ниями вариант в вариа­ционном ряду

Амплитуда (Am) - разность край­них вариант

Лимит и амплитуда - дают определен­ную информацию о степени разнообразия роста в каждой группе. Однако как лимит, так и амплитуда ряда обладает одним существенным недостатком. Они учитывают только разно­образие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Дело в том, что разнообразие проявляется не столько в крайних вариантах, сколько при анализе всей внутренней структуры группы. Поэтому этими критериями можно пользоваться для при­ближенной характеристики разнообразия, особенно при малом чис­ле наблюдений (n<30).

Наиболее полную характеристику разноо­бразию признака в совокупности дает так называемое среднее квадратическое отклоне­ние , обозначаемое греческой буквой "сигма" - s.

Существует два способа расчета среднего квадратического отклонения : среднеарифметический и способ моментов .

При сред­неарифметическом способе расчета применяют формулу, где d - истинное отклонение вариант от истинной средней (V-M).

Формула используется при небольшом числе наблюдений (n<30), когда в вариационном ряду все частоты р= 1.

При р > 1 используют формулу такого вида:

При наличии вычислительной техники эту формулу приме­няют и при большом количестве наблюдений.

Эта формула предназначена для определения "сигмы" по способу моментов:


где: a - условное отклонение от условной средней (V-A ); p - частота встречаемости для варианты; n - число вариант; i - величина интервала между группами.

Этот способ применяется в тех случаях, когда нет вычислитель­ной техники, а вариационный ряд громоздкий как за счет большого числа наблюдений, так и за счет вариант, выраженных многознач­ными числами. При числе наблюдений, равном 30 и менее, в момен­те второй степени п заменяют за (п -1).

Как видно из формулы среднего квадратичного отклонения (4), в знаменателе стоит (п -1), т.е. при числе наблюдений, равном или меньшем 30 (n£30), необходимо в знаменатель формулы брать (п -1). Если при определении средней арифметической М учиты­вают все элементы ряда, то, рассчитывая а, надо брать не все случаи, а на единицу меньше (п-1).

При большом числе наблюдений (n>30) в знаменатель формулы берут п, так как единица не изменяет результаты расчета и поэтому автоматически опускается.

Следует обратить внимание на то, что среднее квадратическое отклонение - именованная величина , поэтому оно должно иметь обозначение, общее для вариант и средней арифметической вели­чины (размерность – кг, см. км и др).

Расчет среднего квадратического отклонения по способу момен­тов производится после расчета средней величины.

Существует еще один критерий, характеризующий уровень раз­нообразия величин признака в совокупности, - коэффициент ва­риации .

Коэффициент вариации (Сv) - является относительной мерой разнообразия, так как исчисляется как процентное отноше­ние среднего квадратического отклонения (а) к средней арифме­тической величине (М). Формула коэффициента вариации такова:

Для ориентировочной оценки степени разнообразия признака пользуются следующими градациями коэффициента вариации. Если коэффициент составляет более 20%, то отмечают сильное разно­образие; при 20-10% - среднее, и если коэффициент менее 10%, то считают, что разнообразие слабое.

Коэффициент вариации применяют при сравнении степени раз­нообразия признаков, имеющих различия в величине признаков или неодинаковую их размерность. Допустим, необходимо сравнить степень разнообразия массы тела у новорожденных и 5-летних детей. Понятно, что у новорожденных "сигма" всегда будет меньше, чем у семилетних детей, так как меньше их индивидуальная масса. Среднее квадратическое отклонение будет меньше там, где меньше величина самого признака. В этом случае для определения различия в степени разнообразия необходимо ориентироваться не на среднее квадратическое отклонение, а на относительную меру разнообразия - коэффициент вариации Сv.

Большое значение коэффициент вариации также имеет для оцен­ки и сопоставления степени разнообразия нескольких признаков с разной размерностью. По среднему квадратическому отклонению нельзя еще судить о различии в сте­пени разнообразия указанных признаков. Для этого необходимо использовать коэффициент вариации – Сv.

Среднее квадратическое отклонение связано со структурой ряда распределения признака. Схематич­но это можно изобразить следующим образом.

Теорией статистики доказано, что при нормальном распределе­нии в пределах М±s находится 68% всех случаев, в пределах М±2s - 95,5% всех случаев, а в пределах М±3s - 99,7% всех случаев, составляющих совокупность. Таким образом, М±3s охва­тывает почти весь вариационный ряд.

Это теоретическое положение статистики о закономерностях структуры ряда имеет огромное значение для практического при­менения среднего квадратического отклонения. Можно восполь­зоваться этим правилом для выяснения - вопроса о типичности средней величины. Если 95% всех вариант находятся в пределах М±2s, то средняя - является характерной для данного ряда и не требуется увеличивать число наблюдений в совокупности. Для опре­деления типичности средней сравнивается фактическое распреде­ление с теоретическим, путем расчета сигмальных отклонений.

Практическое значение среднего квадратического отклонения заключается также в том, что зная М и s , можно построить необходимые вариационные ряды для практического использования. Сигму (s ) также используют для сравнения степени разнообразия однород­ных признаков, например при сравнении колебаний (вариабель­ности) роста детей в городе и селе местности. Зная сигму (s ), можно рассчитать коэффициент вариации (Сv), необходимой для сравнения степени разнообразия признаков, выраженных в различных единицах измерения (сантиметрах, килограммах и др.). Это позволяет выявить более устойчивые (постоянные) и менее устойчивые признаки в совокупности.

Сравнивая коэффициенты вариации (C v), можно сделать выводы о том, что является наиболее устойчивым признаком в совокупности признаков. Среднее квадратическое отклонение (s) используется также для оценки отдельных признаков у одного объекта. Стандартное отклонение указывает, на сколько сигм (s ) от средней (М) отклоняются индивидуальные измерения.

Среднее квадратическое отклонение (s) может быть исполь­зовано в биологии и экологии при разработке проблем нормы и патологии.

Наконец, среднее квадратическое отклонение является важным компонентом формулы т м - сред­ней ошибки средней арифметической (ошибки ре­презентативности):

где т м - средняя ошибка средней арифметической величины (ошибка репрезентативности), п - число наблюдений.

Репрезентативность. Важнейшие теоретические основы репрезентативности были освещены выше в разделе, посвященном выборочной и генеральной совокупности. Репрезентативность означает представительность в выборочной совокупности всех учитываемых признаков (пол, возраст, профессия, стаж и др.) единиц наблюдения, составляющих генеральную совокупность. Достигается эта репрезентативность выборочной совокупности по отношению к генеральной с помощью специальных методов отбора, которые излагаются ниже.

Оценка достоверности результатов исследования базируется на теоретических основах репрезентативности.

ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

Под достоверностью статистических показа­телей следует понимать степень их соответствия отображаемой ими действительности. Достоверными результатами считаются те, которые не искажают и правильно отражают объективную реальность.

Оценить достоверность результатов исследования означает определить, с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность.

В большинстве исследований исследователю приходится, как правило, иметь дело с частью изучаемого явления, а выводы по результатам такого исследования переносить на все явление в целом - на генеральную совокупность.

Таким образом, оценка достоверности необходима для того, чтобы по части явления должно было бы судить о явлении в целом, о его закономерностях.

Оценка достоверности результатов исследования предусматривает определение:

1) ошибок репрезентативности (средних ошибок средних арифметических и относительных величин) - т ;

2) доверительных границ средних (или относительных) величин;

3) достоверности разности средних (или относительных) величин
(по критерию
t );

4) достоверности различия сравниваемых групп по критерию c 2 .

1. Определение средней ошибки средней (или относительной) величины (ошибки репре­зентативности) - т.

Ошибка репрезентативности (m ) является важнейшей стати­стической величиной, необходимой для оценки достоверности ре­зультатов исследования. Эта ошибка возникает в тех случаях, когда требуется по части охарактеризовать явление в целом. Эти ошибки неизбежны. Они проистекают из сущности выбороч­ного исследования; генеральная совокупность может быть охарак­теризована по выборочной совокупности только с некоторой по­грешностью, измеряемой ошибкой репрезентативности.

Ошибки репрезентативности нельзя смешивать с обычным пред­ставлением об ошибках: методических, точности измерения, ариф­метических и др.

По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генераль­ной совокупности.

Этот единственный вид ошибок, учитываемых статистическими методами, которые не могут быть устранены, если не осуществлен переход на сплошное изучение. Ошибки репрезентативности можно свести к достаточно малой величине, т. е. к величине допустимой погрешности. Делается это путем привлечения в выборку достаточ­ного количества наблюдений (п).

Каждая средняя величина - М (средняя длительность лечения, средний рост, средняя масса тела, средний уровень белка крови и др.), а также каждая относительная величина - Р (уровень ле­тальности, заболеваемости и др.) должны быть представлены со своей средней ошибкой - т. Так, средняя арифметическая вели­чина выборочной совокупности (М) имеет ошибку репрезентатив­ности, которая называется средней ошибкой средней арифметической (m м) и определяется по формуле:

Как видно из этой формулы, величина средней ошибки средней арифметической прямо пропорциональна степени разнообразия признака и обратно пропорциональна корню квадратному из числа наблюдений. Следовательно, уменьшение величины этой ошибки при определении степени разнообразия (s ) возможно путем увели­чения числа наблюдений.

На этом принципе основан метод определения достаточного числа наблюдений для выборочного исследования.

Относительные величины (Р), полученные при выборочном исследовании, также имеют свою ошибку репрезентативности, которая называется средней ошибкой относительной величины и обозначается m р

Для определения средней ошибки относительной величины (Р) используется следующая формула:

где Р - относительная величина. Если показатель выражен в про­центах, то q=100-P, если Р- в промиллях, то q=1000-P, если Р- в продецимиллях, то q= 10000-Р и т.д.; п - число наблю­дений. При числе наблюдений менее 30 в знаменатель следует взять (п – 1 ).

Каждая средняя арифметическая или относительная величина, полученная на выборочной совокупности, должна быть представ­лена со своей средней ошибкой. Это дает возможность" рассчи­тать доверительные границы средних и относительных величин, а также определить достоверность разности сравниваемых пока­зателей (результатов исследования).