Медиана в медицинской статистике. «Статистические исследования: сбор и группировка статистических данных». Как найти медиану ряда

Медиана (Me) – значение признака, приходящееся на середину ранжированного ряда, т.е. делящее ряд распределения на две равные части.

а) для ряда одиночных значений:

Если нечетное кол-во вариант, то серединное значение в ранжированном ряду

Если четное , то сред.арифмет. из 2х смежных серединных значений в ранжиров. ряду

б) В дискретном ряду распределения определяется номер медианы по формуле:

Номер медианы показывает то значение показателя, которое и является медианой.

в) В интервальном ряду распределения медиана рассчитывается по следующей формуле:

x - нижняя граница медианного интервала;

i - величина интервала;

f - численность медианного интервала;

S - сумма накопленных частот интервалов, предшествующих медианному.

31. Мода и ее практическое значение

Мода (Mo) – величина признака, наиболее часто встречающаяся в совокупности, т.е. имеющая наибольшую численность в ряду распределения.

а) В дискретном ряду распределения мода определяется визуально.

б) В интервальном ряду распределения визуально можно определить только интервал, в котором заключена мода, который называется модальным интервалом(тот, который имеет наибольшую частоту).

Мода будет равна:

x - нижняя граница модального интервала;

i - величина интервала;

f - численность модального интервала;

Если все значения вариационного ряда имеют одинаковую частоту, то говорят, что этот вариационный ряд не имеет моды. Если две не соседних варианты имеют одинаковую доминирующую частоту, то такой вариационный ряд называют бимодальным ; если таких вариант больше двух, то ряд – полимодальный .

32. Показатели вариации и способы их расчета

Вариации – колеблемость, многообразие, изменяемость величины признака у единиц совокупности.

Показатели вариации делятся на абсолютные и относительные.

К абсолютным показателям относятся размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение. К относительным – коэффициенты осцилляции, коэффициенты вариации и относительное линейное отклонение.

Размах вариации – простейший показатель, разность между максимальным и минимальным значениями признака.

Недостатком является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

Среднее линейное отклонение отражает все колебания варьирующего признака и представляет собой среднюю арифметическую из абсолютных значений отклонений вариант от средней величины, т.к. сумма отклонений значений признака от средней равно 0, то все отклонения берутся по модулю.

Простая
Взвешенная

Дисперсия – средний квадрат отклонений значений признака от их средней величины.

Простая:
Взвешенная:

Среднее квадратическое отклонение . Оно определяется как квадратный корень из дисперсии и имеет ту же размерность, что и изучаемый признак.

Простая:
Взвешенная:
.

Относительные показатели

В силу того, что исследователь не располагает данными об объеме продаж в каждом обменном пункте, расчет средней арифметической с целью определения средней цены за доллар нецелесообразен.

Медиана ряда чисел

Однако можно определить то значение признака, которое носит название медиана (Ме). Медиана

в нашем примере

Номер медианы: №Ме = ;

Мода

Таблица 3.6.

f — сумма частот ряда;

S накопительные частоты

12_

_

S — накопленные частоты.

На рис. 3.2. Изображена гистограмма ряда распределения банков по размеру прибыли (по данным табл. 3.6.).

х — размер прибыли, млн. руб.,

f — число банков.

"МЕДИАНА УПОРЯДОЧЕННОГО РЯДА"

Текстовая HTML-версия публикации


Конспект урока алгебры в 7 классе

Тема урока: «МЕДИАНА УПОРЯДОЧЕННОГО РЯДА».

учитель Озёрной школы филиал МКОУ Бурковская СОШ Ерёменко Татьяна Алексеевна
Цели:
понятие медианы как статистической характеристики упорядоченного ряда; формировать умение находить медиану для упорядоченных рядов с четным и нечетным числом членов; формировать умение интерпретировать значения медианы в зависимости от практической ситуации, закрепление понятия среднего арифметического набора чисел. Развивать навыки самостоятельной работы. Формировать интерес к математике.
Ход урока

Устная работа.
Даны ряды: 1) 4; 1; 8; 5; 1; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; 4; 6; 7,3; 6. Найдите: а) наибольшее и наименьшее значения каждого ряда; б) размах каждого ряда; в) моду каждого ряда.
II. Объяснение нового материала.
Работа по учебнику. 1. Рассматрим задачу с п. 10 учебника. Что означает упорядоченный ряд? Подчеркну, что перед нахождением медианы нужно всегда упорядочить ряд данных. 2.На доске знакомимся с правилами нахождения медианы для рядов с четным и нечетным числом членов:
Медианой

упорядоченного

ряда
чисел
с

нечетным

числом

членов

называется число, записанное посередине, а
медианой

упорядоченного ряда
чисел
с четным числом членов
называется среднее арифметическое двух чисел, записанных посредине.
Медианой

произвольного

ряда
называется медиана 1 3 1 7 5 4 соответствующего упорядоченного ряда.
Отмечу, что показатели- среднее арифметическое, мода и медиана по

разному

характеризуют

данные,

полученные

результате

наблюдений.

III. Формирование умений и навыков.
1-я группа. Упражнения на применение формул нахождения медианы упорядоченного и неупорядоченного ряда. 1.
№ 186.
Решение: а) Число членов ряда п = 9; медиана Ме = 41; б) п = 7, ряд упорядочен, Ме = 207; в) п = 6, ряд упорядочен, Ме = = 21; г) п = 8, ряд упорядочен, Ме = = 2,9. Ответ: а) 41; б) 207; в) 21; г) 2,9. Учащиеся комментируют способ нахождения медианы. 2. Найдите среднее арифметическое и медиану ряда чисел: а) 27, 29, 23, 31, 21, 34; в) ; 1. б) 56, 58, 64, 66, 62, 74. Решение: Для нахождения медианы необходимо каждый ряд упорядочить: а) 21, 23, 27, 29, 31, 34. п = 6; X = = 27,5; Ме = = 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + б) 56, 58, 62, 64, 66, 74.

Как найти медиану в статистике

п = 6; X = 63,3; Ме = = 63; в) ; 1. п = 5; X = : 5 = 3: 5 = 0,6; Ме = . 3.
№ 188
(устно). Ответ: да; б) нет; в) нет; г) да. 4. Зная, что в упорядоченном ряду содержится т чисел, где т – нечетное число, укажите номер члена, являющегося медианой, если т равно: а) 5; б) 17; в) 47; г) 201. Ответ: а) 3; б) 9; в) 24; г) 101. 2-я группа. Практические задачи на нахождение медианы соответствующего ряда и интерпретацию полученного результата. 1.
№ 189.
Решение: Число членов ряда п = 12. Для нахождения медианы ряд нужно упорядочить: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Медиана ряда Ме = = 176. Выработка за месяц была больше медианы у следующих членов артели: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125 ; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 22 xx + + = 1) Квитко; 4) Бобков; 2) Баранов; 5) Рылов; 3) Антонов; 6) Астафьев. Ответ: 176. 2.
№ 192.
Решение: Упорядочим ряд данных: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; число членов ряда п = 20. Размах A = x max – x min = 42 – 30 = 12. Мода Мо = 32 (это значение встречается 6 раз – чаще других). Медиана Ме = = 35. В данном случае размах показывает наибольший разброс времени на обработку детали; мода показывает наиболее типическое значение времени обработки; медиана – время обработки, которое не превысили половина токарей. Ответ: 12; 32; 35.
IV. Итог урока.
– Что называется медианой ряда чисел? – Может ли медиана ряда чисел не совпадать ни с одним из чисел ряда? – Какое число является медианой упорядоченного ряда, содержащего 2п чисел? 2п – 1 чисел? – Как найти медиану неупорядоченного ряда?
Домашнее задание:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

В раздел основное общее образование

Мода и медиана

К средним величинам относят также моду и медиану.

Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней (арифметической, гармонической и др.) невозможен или нецелесообразен.

Например, выборочное обследование в г. Омске 12 коммерческих пунктов обмена валюты позволило зафиксировать различные цены за доллар при его продаже (данные на 10 октября 1995г. при биржевом курсе доллара -4493руб).

В силу того, что исследователь не располагает данными об объеме продаж в каждом обменном пункте, расчет средней арифметической с целью определения средней цены за доллар нецелесообразен. Однако можно определить то значение признака, которое носит название медиана (Ме). Медиана лежит в середине ранжированного ряда и делит его пополам.

Расчет медианы по несгруппированным данным производится следующим образом:

а) расположим индивидуальные значения признака в возрастающем порядке:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

б) определим порядковый номер медианы по формуле:

в нашем примере это означает, что медиана в данном случае расположена между шестым и седьмым значениями признака в ранжированном ряду, так как ряд имеет четное число индивидуальных значений. Таким образом, Ме равна средней арифметической из соседних значений: 4550, 4560.

в) рассмотрим порядок вычисления медианы в случае нечетного числа индивидуальных значений.

Допустим, мы наблюдаем не 12, а 11 пунктов обмена валюты, тогда ранжированный ряд будет выглядеть следующим образом (отбрасываем 12-й пункт):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Номер медианы: №Ме = ;

на шестом месте стоит = 4560, который и является медианой: Ме=4560. По обе стороны от нее находится одинаковое число пунктов.

Мода — это наиболее часто встречающееся значение признака у единиц данной совокупности. Она соответствует определенному значению признака.

В нашем случае модальной ценой за доллар можно назвать 4560 руб.: это значение повторяется 4 раза, чаще, чем все другие.

На практике моду и медиану находят, как правило, по сгруппированным данным. В результате группировки был получен ряд распределения банков по величине полученной прибыли за год (табл. 3.6.).

Таблица 3.6.

Группировка банков по величине полученной прибыли за год

Для определения медианы надо подсчитать сумму накопительных частот. Наращивание итого продолжается до получения накопительной суммы частот, превышающей половину суммы частот. В нашем примере сумма накопленных частот (12), превышающая половину всех значений (20:2). Этому значению соответствует медианный интервал, который содержит медиану (5,5 — 6,4). Определим ее значение по формуле:

где начальное значение интервала, содержащего медиану;

— величина медианного интервала;

f — сумма частот ряда;

— сумма накопительных частот, предшествующих медианному интервалу;

— частота медианного интервала.

Таким образом, 50% банков имеют прибыль 6,1 млн. руб., а 50% банков — более 6,1 млн. руб.

Наибольшая частота соответствует также интервалу 5,5 — 6,4, т.е. мода должна находиться в этом интервале. Ее величину определим по формуле:

где — начальное значение интервала, содержащего моду;

— величина модального интервала;

— частота модального интервала;

— частота интервала, предшествующего модальному;

— частота интервала, следующего за модальным.

Приведенная формула моды может быть использована в вариационных рядах с равными интервалами.

Таким образом, в данной совокупности наиболее часто встречается размер прибыли 6,10 млн. руб.

Медиану и моду можно определить графически. Медиана определяется по кумуляте (рис. 3.1.). Для ее построения надо рассчитать накопительные частоты и частости. Накопительные частоты показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение, и определяется последовательным суммированием частот интервалов. При построении кумулятыы интервального ряда распределения нижней границе первого интервала соответствует частота, равная нулю, а верхней границе — вся частота данного интервала. Верхней границе второго интервала соответствует накопительная частота, равная сумме частот первых двух интервалов, и т.д.

Построим кумулятивную кривую по данным табл. 6 о распределении банков по размеру прибыли.

S накопительные частоты

12_

_

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 Х прибыль

Рис. 3.1. Кумулята ряда распределения банков по размеру прибыли:

х — размер прибыли, млн. руб.,

S — накопленные частоты.

Для определения медианы высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.

Мода определяется по гистограмме распределения. Гистограмма строится так:

на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строятся прямоугольники, площади которых пропорциональны частотам (или частостям) интервала.

Медиана в статистике

3.2. Изображена гистограмма ряда распределения банков по размеру прибыли (по данным табл. 3.6.).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 Х

Рис. 3.2. Распределение коммерческих банков по размеру прибыли:

х — размер прибыли, млн. руб.,

f — число банков.

Для определения моды правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника — с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Медиана (статистика)

Медиана (статистика) , в математической статистике — число, характеризующее выборку (например, набор чисел). Если все элементы выборки различны, то медиана — это такое число выборки, что ровно половина из элементов выборки больше него, а другая половина меньше него. В более общем случае медиану можно найти, упорядочив элементы выборки по возрастанию или убыванию и взяв средний элемент. Например, выборка {11, 9, 3, 5, 5} после упорядочивания превращается в {3, 5, 5, 9, 11} и её медианой является число 5. Если в выборке чётное число элементов, медиана может быть не определена однозначно: для числовых данных чаще всего используют полусумму двух соседних значений (то есть медиану набора {1, 3, 5, 7} принимают равной 4).

Другими словами, медианой в статистике называется значение, которое делит ряд пополам таким образом, что по обе стороны от нее (вниз или вверх) расположено одинаковое число единиц данной совокупности.

Задача №1. Расчёт средней арифметической, модального и медианного значения

Из-за этого свойства данный показатель имеет еще несколько названий: 50-й перцентиль или квантиль 0,5.

  • Среднее значение
  • Медиана
  • Мода

Медиана (статистика)

Медиана (статистика) , в математической статистике — число, характеризующее выборку (например, набор чисел). Если все элементы выборки различны, то медиана — это такое число выборки, что ровно половина из элементов выборки больше него, а другая половина меньше него. В более общем случае медиану можно найти, упорядочив элементы выборки по возрастанию или убыванию и взяв средний элемент. Например, выборка {11, 9, 3, 5, 5} после упорядочивания превращается в {3, 5, 5, 9, 11} и её медианой является число 5.

5.5 Мода и медиана. Их вычисление в дискретных и интервальных вариационных рядах

Если в выборке чётное число элементов, медиана может быть не определена однозначно: для числовых данных чаще всего используют полусумму двух соседних значений (то есть медиану набора {1, 3, 5, 7} принимают равной 4).

Другими словами, медианой в статистике называется значение, которое делит ряд пополам таким образом, что по обе стороны от нее (вниз или вверх) расположено одинаковое число единиц данной совокупности. Из-за этого свойства данный показатель имеет еще несколько названий: 50-й перцентиль или квантиль 0,5.

Медиану используют вместо средней арифметической, когда крайние варианты ранжированного ряда (наименьшая и наибольшая) по сравнению с остальными оказываются чрезмерно большими или чрезмерно малыми.

Функция МЕДИАНА измеряет центральную тенденцию, которая является центром множества чисел в статистическом распределении. Существует три наиболее распространенных способа определения центральной тенденции:

  • Среднее значение — среднее арифметическое, которое вычисляется сложением множества чисел с последующим делением полученной суммы на их количество.
    Например, средним значением для чисел 2, 3, 3, 5, 7 и 10 будет 5, которое является результатом деления их суммы, равной 30, на их количество, равное 6.
  • Медиана — число, которое является серединой множества чисел: половина чисел имеют значения большие, чем медиана, а половина чисел — меньшие.
    Например, медианой для чисел 2, 3, 3, 5, 7 и 10 будет 4.
  • Мода — число, наиболее часто встречающееся в данном множестве чисел.
    Например, модой для чисел 2, 3, 3, 5, 7 и 10 будет 3.

Урок алгебры в 7 классе.

Тема «Медиана как статистическая характеристика».

Учитель Егорова Н.И.

Цель урока: сформировать у учащихся представление о медиане набора чисел и умение вычислять ее для несложных числовых наборов, закрепление понятия среднего арифметического набора чисел.

Тип урока: объяснение нового материала.

Ход урока

1. Организационный момент.

Сообщить тему урока и сформулировать его цели.

2. Актуализация прежних знаний.

Вопросы учащимся:

Что называется средним арифметическим набора чисел?

Где располагается среднее арифметическое внутри набора чисел?

Что характеризует среднее арифметическое набора чисел?

Где часто применяется среднее арифметическое набора чисел?

Устные задачи:

Найти среднее арифметическое набора чисел:

Проверка домашнего задания.

Учебник: №169, №172.

3. Изучение нового материала.

На предыдущем уроке мы познакомились с такой статистической характеристикой как среднее арифметическое набора чисел. Сегодня мы посвятим урок еще одной статистической характеристике – медиане.

Не только среднее арифметическое показывает, где на числовой прямой располагаются числа какого-либо набора и где их центр. Другим показателем является медиана.

Медианой набора чисел называется такое число, которое разделяет набор на две равные по численности части. Вместо “медиана” можно было бы сказать “середина”.

Сначала на примерах разберем, как найти медиану, а затем дадим строгое определение.

Рассмотрим следующий устный пример с применением проектора

В конце учебного года 11 учеников 7-го класса сдали норматив по бегу на 100 метров. Были зафиксированы следующие результаты:

После того как ребята пробежали дистанцию, к преподавателю подошел Петя и спросил, какой у него результат.

“Самый средний результат: 16,9 секунды”, – ответил учитель

“Почему?” – удивился Петя. – Ведь среднее арифметическое всех результатов – примерно 18,3 секунды, а я пробежал на секунду с лишним лучше. И вообще, результат Кати (18,4) гораздо ближе к среднему, чем мой”.

“Твой результат средний, так как пять человек пробежали лучше, чем ты, и пять – хуже. То есть ты как раз посередине”, – сказал учитель.

Записать алгоритм нахождения медианы набора чисел:

Упорядочить числовой набор (составить ранжированный ряд).

Одновременно зачеркиваем “самое большое” и “самое маленькое” числа данного набора чисел до тех пор, пока не останется одно число или два числа.

Если осталось одно число, то оно и есть медиана.

Если осталось два числа, то медианой будет среднее арифметическое двух оставшихся чисел.

Предложить учащимся самостоятельно сформулировать определение медианы набора чисел, затем прочитать в учебнике определение медианы (стр. 40), далее решить № 186(а,б), № 187(а) учебника (стр.41).

Замечание:

Обратить внимание учащихся на важное обстоятельство: медиана практически не чувствительна к значительным отклонениям отдельных крайних значений наборов чисел. В статистике это свойство называется устойчивостью. Устойчивость статистического показателя – очень важное свойство, оно страхует нас от случайных ошибок и отдельных недостоверных данных.

4. Закрепление изученного материала.

Решение задач.

Обозначим х-среднее арифметическое, Ме-медиана.

Набор чисел: 1,3,5,7,9.

х=(1+3+5+7+9):5=25:5=5,

Набор чисел: 1,3,5,7,14.

х=(1+3+5+7+14):5=30:5=6.

а) Набор чисел: 3,4,11,17,21

б) Набор чисел: 17,18,19,25,28

в) Набор чисел:25, 25, 27, 28, 29, 40, 50

Вывод: медиана набора чисел, состоящего из нечетного числа членов равна числу, стоящему посередине.

а) Набор чисел:2, 4, 8, 9.

Ме = (4+8):2=12:2=6

б) Набор чисел:1,3,5,7,8,9.

Ме = (5+7):2=12:2=6

Медиана набора чисел, содержащего четное число членов равна полусумме двух чисел, стоящих посередине.

Ученик получил в течении четверти следующие оценки по алгебре:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Найдите средний балл и медиану этого набора.

Найдем средний балл, то есть среднее арифметическое:

х= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Найдем медиану этого набора чисел:

Упорядочим набор чисел: 2,4,4,4,5,5,5,5,5,5

Всего 10 чисел, чтобы найти медиану надо взять два средних числа и найти их полусумму.

Ме = (5+5):2 = 5

Вопрос к учащимся: Если бы вы были учителем, какую бы вы поставили оценку за четверть этому ученику? Ответ обоснуйте.

Президент компании получает зарплату 300000 руб. три его заместителя получают по 150000 руб., сорок служащих – по 50000 руб. и зарплата уборщицы составляет 10000 руб. Найдите среднее арифметическое и медиану зарплат в компании. Какую из этих характеристик выгоднее использовать президенту в рекламных целях?

х = (300000+3·150000+40·50000+10000):(1+3+40+1) = 2760000:45=61333,33 (руб.)

№ 6. Устно.

А) Сколько чисел в наборе, если его медианой служит ее девятый член?

Б) Сколько чисел в наборе, если его медианой служит среднее арифметическое 7-го и 8-го членов?

В) В наборе из семи чисел наибольшее число увеличили на 14. Изменится ли при этом и как среднее арифметическое и медиана?

Г) Каждое из чисел набора увеличили на 3. Что произойдет со средним арифметическим и медианой?

Конфеты в магазине продают на вес. Чтобы узнать, сколько конфет содержится в одном килограмме, Маша решила найти вес одной конфеты. Она взвесила несколько конфет и получила следующие результаты:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Для оценки веса одной конфеты пригодны обе характеристики, т.к. они не сильно отличаются друг от друга.

Итак, для характеристики статистической информации используют среднее арифметическое и медиану. Во многих случаях какая-то из характеристик может не иметь никакого содержательного смысла (например, имея сведения о времени дорожно-транспортных происшествий, вряд ли имеет смысл говорить о среднем арифметическом этих данных).

Домашнее задание:пункт 10, № 186(в,г), № 190.

5. Итоги урока. Рефлексия.

  1. «Статистические исследования: сбор и группировка статистических данных»

    Урок

    темы , предлагаемые для седьмого класса . ТЕМАТИЧЕСКОЕ ПЛАНИРОВАНИЕ. § 1. Статистические характеристики . П 1. Среднее арифметическое, размах и мода 1ч. П 2. Медиана как статистическая характеристика

  2. Рабочая программа учебного курса «алгебра» в 7 классе (базовый уровень) пояснительная записка

    Рабочая программа

    … п.10 Медиана как статистическая характеристика 23 п.9 Среднее арифметическое, размах и мода 24 Контрольная работа № 2 по теме

  3. Рабочая программа. Математика. 5 класс с. Канаши. 2011г

    Рабочая программа

    … уравнений. Среднее арифметическое, размах и мода. Медиана как статистическая характеристика . Цель – систематизировать и обобщить сведения о … и навыков, полученных на уроках по данным темам (курс алгебры 10 класса ). 11 класс (4 часа в неделю …

  4. Приказ №51 от «30» август 2012 г. Рабочая программа по алгебре 7 класс

    Рабочая программа

    … учебным материалом Медиана как статистическая характеристика Знать определение среднего арифметического, размаха, моды и медианы как статистической характеристики Фронтальная и индивидуальная …

  5. Рабочая программа по математике 7 класс ii ступень базовый уровень (1)

    Рабочая программа

    Как найти медиану ряда

    же, как в 6 классе . Изучение темы завершается ознакомлением учащихся с про­стейшими статистическими характеристиками : средним … М. : Издательский дом «Генжер», 2009. 3. Жохов, В. И. Уроки алгебры в 7 классе : кн. для учителя / В. И. Жохов …

Другие похожие документы..

Для вычисления медианы в MS EXCEL существует специальная функция МЕДИАНА() . В этой статье дадим определение медианы и научимся вычислять ее для выборки и для заданного закона распределения случайной величины.

Начнем с медианы для выборок (т.е. для фиксированного набора значений).

Медиана выборки

Медиана (median) – это число, которое является серединой множества чисел: половина чисел множества больше, чем медиана , а половина чисел меньше, чем медиана .

Для вычисления медианы необходимо сначала (значения в выборке ). Например, медианой для выборки (2; 3; 3; 4 ; 5; 7; 10) будет 4. Т.к. всего в выборке 7 значений, три из них меньше, чем 4 (т.е. 2; 3; 3), а три значения больше (т.е. 5; 7; 10).

Если множество содержит четное количество чисел, то вычисляется для двух чисел, находящихся в середине множества. Например, медианой для выборки (2; 3; 3 ; 6 ; 7; 10) будет 4,5, т.к. (3+6)/2=4,5.

Для определения медианы в MS EXCEL существует одноименная функция МЕДИАНА() , английский вариант MEDIAN().

Медиана не обязательно совпадает со . Совпадение имеет место только в том случае, если значения в выборке распределены симметрично относительно среднего . Например, для выборки (1; 2; 3 ; 4 ; 5; 6) медиана и среднее равны 3,5.

Если известна Функция распределения F(х) или функция плотности вероятности p (х) , то медиану можно найти из уравнения:

Например, решив аналитическим способом это уравнение для Логнормального распределения lnN(μ; σ 2), получим, что медиана вычисляется по формуле =EXP(μ). При μ=0, медиана равна 1.

Обратите внимание на точку Функции распределения , для которой F (х)=0,5 (см. картинку выше). Абсцисса этой точкиравна1. Это и есть значение медианы, что естественно совпадает с ранее вычисленным значением по формуле em.

В MS EXCEL медиану для логнормального распределения LnN(0;1) можно вычислить по формуле =ЛОГНОРМ.ОБР(0,5;0;1) .

Примечание : Напомним, что интеграл от по всей области задания случайной величины равен единице.

Поэтому, линия медианы (х=Медиана) делит площадь под графиком функции плотности вероятности на две равные части.

Зарплат в различных отраслях экономики, температуру и уровень осадков на одной и той же территории за сопоставимые периоды времени, урожайность выращиваемых культур в разных географических регионах и т. д. Впрочем, средняя является отнюдь не единственным обобщающим показателем - в ряде случае для более точной оценки подходит такая величина как медиана. В статистике она широко применяется в качестве вспомогательной описательной характеристики распределения какого-либо признака в отдельно взятой совокупности. Давайте разберемся, чем она отличается от средней, а также чем вызвана необходимость ее использования.

Медиана в статистике: определение и свойства

Представьте себе следующую ситуацию: на фирме вместе с директором работают 10 человек. Простые работники получают по 1000 грн., а их руководитель, который, к тому же, является собственником, - 10000 грн. Если вычислить среднее арифметическое, то получится, что в среднем зарплата на данном предприятии равна 1900 грн. Будет ли справедливым данное утверждение? Или возьмем такой пример, в одной и той же больничной палате находится девять человек с температурой 36,6 °С, и один человек, у которого она равна 41 °С. Арифметическое среднее в этом случае равно: (36,6*9+41)/10 = 37,04 °С. Но это вовсе не означает, что каждый из присутствующих болен. Все это наталкивает на мысль, что одной средней часто бывает недостаточно, и именно поэтому в дополнение к ней используется медиана. В статистике этим показателем называют вариант, который расположен ровно посередине упорядоченного вариационного ряда. Если посчитать ее для наших примеров, то получится соответственно 1000 грн. и 36,6 °С. Другими словами, медианой в статистике называется значение, которое делит ряд пополам таким образом, что по обе стороны от нее (вниз или вверх) расположено одинаковое число единиц данной совокупности. Из-за этого свойства данный показатель имеет еще несколько названий: 50-й перцентиль или квантиль 0,5.

Как найти медиану в статистике

Способ расчета данной величины во многом зависит от того, какой тип вариационного ряда мы имеем: дискретный или интервальный. В первом случае, медиана в статистике находится довольно просто. Все, что нужно сделать, это найти сумму частот, разделить ее на 2 и затем прибавить к результату ½. Лучше всего будет пояснить принцип расчета на следующем примере. Предположим, у нас есть сгруппированные данные по рождаемости, и требуется выяснить, чему равна медиана.

Номер группы семей по кол-ву детей

Кол-во семей

Проведя нехитрые подсчеты, получим, что искомый показатель равен: 195/2 + ½ = варианта. Для того чтобы выяснить, что это означает, следует последовательно накапливать частоты, начиная с наименьшей варианты. Итак, сумма первых двух строк дает нам 30. Ясно, что здесь 98 варианты нет. Но если прибавить к результату частоту третьей варианты (70), то получится сумма, равная 100. В ней как раз и находится 98-я варианта, а значит медианой будет семья, у которой есть двое детей.

Что же касается интервального ряда, то здесь обычно используют следующую формулу:

М е = Х Ме + i Ме * (∑f/2 - S Me-1)/f Ме, в которой:

  • Х Ме - первое значение медианного интервала;
  • ∑f - численность ряда (сумма его частот);
  • i Ме - величина медианного диапазона;
  • f Ме - частота медианного диапазона;
  • S Ме-1 - сумма кумулятивных частот в диапазонах, предшествующих медианному.

Опять же, без примера здесь разобраться довольно сложно. Предположим, есть данные по величине

Зарплата, тыс. руб.

Накопленные частоты

Чтобы воспользоваться вышеприведенной формулой, вначале нам нужно определить медианный интервал. В качестве такого диапазона выбирают тот, накопленная частота которого превышает половину всей суммы частот или равна ей. Итак, разделив 510 на 2, получаем, что этому критерию соответствует интервал со значением зарплаты от 250000 руб. до 300000 руб. Теперь можно подставлять все данные в формулу:

М е = Х Ме + i Ме * (∑f/2 - S Ме-1)/f Ме = 250 + 50 * (510/2 - 170) / 115 = 286,96 тыс. руб.

Надеемся, наша статья оказалась полезной, и теперь вы имеете ясное представление о том, что такое медиана в статистике и как ее следует рассчитывать.

4. Мода. Медиана. Генеральная и выборочная средняя

Мода на экране, медиана в треугольнике, а средние – это температура по больнице и в палате. Продолжаем наш практический курс занимательной статистики (Занятие 1) изучением центральных характеристик статистической совокупности , названия которых вы видите в заголовке. И начнём мы с его конца, поскольку о средних величинах речь зашла практически с первых же абзацев темы. Для подготовленных читателей оглавление :

  • Генеральная и выборочная средняя – вычисление по первичным данным и для сформированного дискретного вариационного ряда;
  • Мода – определение и нахождение для дискретного случая;
  • Медиана – общее определение, как найти медиану;
  • Средняя, мода и медиана интервального вариационного ряда – вычисление по первичным данным и по готовому ряду. Формулы моды и медианы,
  • Квартили, децили, перцентили – коротко о главном.

ну а «чайникам» лучше ознакомиться с материалом по порядку:

Итак, пусть исследуется некоторая генеральная совокупность объёма , а именно её числовая характеристика , не важно, дискретная или непрерывная (Занятия 2, 3 ).

Генеральной средней называется среднее арифметическое всех значений этой совокупности:

Если среди чисел есть одинаковые (что характерно для дискретного ряда ) , то формулу можно записать в более компактном виде:
, где
варианта повторяется раз;
варианта – раз;
варианта – раз;

варианта – раз.

Живой пример вычисления генеральной средней встретился в Примере 2 , но чтобы не занудничать, я даже не буду напоминать его содержание.

Далее. Как мы помним, обработка всей генеральной совокупности часто затруднена либо невозможна, и поэтому из неё организуют представительную выборку объема , и на основании исследования этой выборки делают вывод обо всей совокупности.

Выборочной средней называется среднее арифметическое всех значений выборки:

и при наличии одинаковых вариант формула запишется компактнее:
– как сумма произведений вариант на соответствующие частоты .

Выборочная средняя позволяет достаточно точно оценить истинное значение , чего вполне достаточно для многих исследований. При этом, чем больше выборка, тем точнее будет эта оценка.

Практику начнём, а точнее продолжим, с дискретного вариационного ряда и знакомого условия:

Пример 8

По результатам выборочного исследования рабочих цеха были установлены их квалификационные разряды: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3.

Как решать задачу? Если нам даны первичные данные (исходные необработанные значения), то их можно тупо просуммировать и разделить результат на объём выборки:
– среднестатистический квалификационный разряд рабочих цеха.

Но во многих задачах требуется составить вариационный ряд (см. Пример 4 ) :

– или же этот ряд предложен изначально (что бывает чаще). И тогда, мы, конечно, используем «цивилизованную» формулу:

Мода . Мода дискретного вариационного ряда – это варианта с максимальной частотой. В данном случае . Моду легко отыскать по таблице, и ещё легче на полигоне частот – это абсцисса самой высокой точки:


Иногда таковых значений несколько (с одинаковой максимальной частотой), и тогда модой считают каждое из них.

Если все или почти все варианты различны (что характерно для интервального ряда ), то модальное значение определяется несколько другим способом, о котором во 2-й части урока.

Медиана . Медиана вариационного ряда* – это значение, которая делит его на две равные части (по количеству вариант).

Но теперь нам нужно найти среднюю, моду и медиану.

Решение : чтобы найти среднюю по первичным данным, лучше всего просуммировать все варианты и разделить полученный результат на объём совокупности:
ден. ед.

Эти подсчёты, кстати, займут не так много времени и при использовании оффлайн калькулятора. Но если есть Эксель, то, конечно, забиваем в любую свободную ячейку =СУММ(, выделяем мышкой все числа, закрываем скобку ) , ставим знак деления / , вводим число 30 и жмём Enter . Готово.

Что касается моды, то её оценка по исходным данным, становится непригодна. Хоть мы и видим среди чисел одинаковые, но среди них запросто может найтись пять так шесть-семь вариант с одинаковой максимальной частотой, например, частотой 2. Кроме того, цены могут быть округлёнными. Поэтому модальное значение рассчитывается по сформированному интервальному ряду (о чём чуть позже) .

Чего не скажешь о медиане: забиваем в Эксель =МЕДИАНА(, выделяем мышью все числа, закрываем скобку ) и жмём Enter : . Причём, здесь даже ничего не нужно сортировать.

Но в Примере 6 была проведена сортировка по возрастанию (вспоминаем и сортируем – ссылка выше) , и это хорошая возможность повторить формальный алгоритм отыскания медианы. Делим объём выборки пополам:

И поскольку она состоит из чётного количества вариант, то медиана равна среднему арифметическому 15-й и 16-й варианты упорядоченного (!) вариационного ряда:

ден. ед.

Ситуация вторая . Когда дан готовый интервальный ряд (типичная учебная задача).

Продолжаем анализировать тот же пример с ботинками, где по исходным данным был составлен ИВР . Для вычисления средней потребуются середины интервалов:

– чтобы воспользоваться знакомой формулой дискретного случая:

– отличный результат! Расхождение с более точным значением (), вычисленным по первичным данным, составляет всего 0,04.

По сути дела, здесь мы приблизили интервальный ряд дискретным, и это приближение оказалось весьма эффективным. Впрочем, особой выгоды тут нет, т.к. при современном программном обеспечении не составляет труда вычислить точное значение даже по очень большому массиву первичных данных. Но это при условии, что они нам известны:)

С другими центральными показателями всё занятнее.

Чтобы найти моду, нужно найти модальный интервал (с максимальной частотой) – в данной задаче это интервал с частотой 11, и воспользоваться следующей страшненькой формулой:
, где:

– нижняя граница модального интервала;
– длина модального интервала;
– частота модального интервала;
– частота предыдущего интервала;
– частота следующего интервала.

Таким образом:
ден. ед. – как видите, «модная» цена на ботинки заметно отличается от средней арифметической .

Не вдаваясь в геометрию формулы, просто приведу гистограмму относительных частот и отмечу :


откуда хорошо видно, что мода смещена относительно центра модального интервала в сторону левого интервала с бОльшей частотой. Логично.

Справочно разберу редкие случаи:

– если модальный интервал крайний, то либо ;

– если обнаружатся 2 модальных интервала, которые находятся рядом, например, и , то рассматриваем модальный интервал , при этом близлежащие интервалы (слева и справа) по возможности тоже укрупняем в 2 раза.

– если между модальными интервалами есть расстояние, то применяем формулу к каждому интервалу, получая тем самым 2 или бОльшее количество мод.

Вот такой вот депеш мод:)

И медиана. Если дан готовый интервальный ряд, то медиана рассчитывается чуть по менее страшной формуле, но сначала нудно (описка по Фрейду:)) найти медианный интервал – это интервал, содержащий варианту (либо 2 варианты), которая делит вариационный ряд на две равные части.

Выше я рассказал, как определить медиану, ориентируясь на относительные накопленные частоты , здесь же сподручнее рассчитать «обычные» накопленные частоты . Вычислительный алгоритм точно такой же – первое значение сносим слева (красная стрелка) , и каждое следующее получается как сумма предыдущего с текущей частотой из левого столбца (зелёные обозначения в качестве примера) :

Всем понятен смысл чисел в правом столбце? – это количество вариант, которые успели «накопиться» на всех «пройденных» интервалах, включая текущий.

Поскольку у нас чётное количество вариант (30 штук), то медианным будет тот интервал, который содержит 30/2 = 15-ю и 16-ю варианту. И ориентируясь по накопленным частотам, легко прийти к выводу, что эти варианты содержатся в интервале .

Формула медианы:
, где:
– объём статистической совокупности;
– нижняя граница медианного интервала;
– длина медианного интервала;
частота медианного интервала;
накопленная частота предыдущего интервала.

Таким образом:
ден. ед. – заметим, что медианное значение, наоборот, оказалось смещено правее, т.к. по правую руку находится значительное количество вариант:


И справочно особые случаи.