Методы статистической обработки экспериментальных данных. Параметрические и непараметрические процедуры статистического анализа данных. Возможности и ограничения параметрических критериев

Критерий t-Стьюдента для независимых и
зависимых выборок.
Критерий F-Фишера.
Критерий U-Манна-Уитни.
Критерий T-Вилкоксона и др.

Статистические критерии – это
ПРАВИЛО, обеспечивающее принятие
истинной и отклонение ложной гипотезы с
высокой вероятностью.
Статистические критерии – это МЕТОД
расчета определенного числа.
Статистические критерии – это ЧИСЛО.

Параметрические критерии – это
критерии, включающие в формулу расчета
параметры распределения (среднее и
дисперсии).
Непараметрические критерии – это
критерии, не включающие в формулу
расчета параметров распределения и
основанные на оперировании частотами
или рангами.

Позволяют прямо оценить различия в средних,
полученных в двух выборках (t-критерий
Стьюдента)
Позволяют прямо оценить различия в дисперсиях
(критерий F-Фишера)
Позволяют выявить тенденции изменения признака
при переходе от условия к условию (дисперсионный
однофакторный анализ)
Позволяют оценить взаимодействие двух и более
факторов и их влияние на изменение признака
(двухфакторный дисперсионный анализ)

Возможности и ограничения параметрических критериев

Экспериментальные данные должны отвечать двум, а
иногда трем, условиям:
а) значения признака измерены по интервальной
шкале;
б) распределение признака является нормальным;
в) в дисперсионном анализе должно соблюдаться
требование равенства дисперсий в ячейке комплекса.
Если перечисленные условия выполняются, то
параметрические критерии оказываются более
мощными, чем непараметрические.

Позволяют оценить лишь средние тенденции, например,
ответить на вопрос, чаще ли в выборке А встречаются
более высокие, а в выборке Б – более низкие значения
признака (критерии Розенбаума, Манна-Уитни,
угловое преобразование Фишера и др.).
Позволяют оценить лишь различия в диапазонах
вариативности признака (критерий угловое
преобразование Фишера).
Позволяют выявить тенденции изменения признака при
переходе от условия к условию при любом
распределении признака (критерии тенденций
Пейджа, Джонкира).

Возможности и ограничения непараметрических критериев

Отсутствует возможность оценить взаимодействие
двух и более факторов.
Экспериментальные данные могут НЕ ОТВЕЧАТЬ
ни одному из условий параметрической статистики:
а) значения признака могут быть представлены в
любой шкале, начиная от шкалы наименований;
б) распределение признака может быть любым и
совпадение его с каким-либо теоретическим законом
распределения необязательно и не нуждается в
проверке;
в) требование равенства дисперсий отсутствует.

Статистический критерий имеет эмпирическое и
критическое значение.
Эмпирическое значение критерия – это число, полученное
по правилу расчета критерия.
Критическое значение критерия – это число, которое
определено для данного критерия при заданных переменных
(например, количества человек в выборке), выделяющее
зону значимости и незначимости для признака. См.
Таблицы критических значений критерия.
По соотношению эмпирического и критического значений
критерия выявляется уровень статистической значимости и
делается вывод о том, подтверждается или опровергается
нулевая гипотеза.

Правило принятия статистического вывода

1) на основе полученных экспериментальных
данных вычислить эмпирическое значение
критерия Кэмп
2) по соответствующим критерию таблицам
найти критические значения К1кр и К2кр, которые
отвечают уровням значимости в 5% и 1%
3) записать критическое значение в виде:
К1кр для p ≤ 0 05 и К2кр для p ≤ 0 01

10. 4) расположить эмпирическое значение критерия Кэмп и критические значения К1кр и К2кр на оси значимости (ось абсцисс Ох

декартовой системы координат, на
которой выделено три зоны: левая (незначимости),
средняя (неопределенности, р ≤ 0,05), правая
(значимости, р ≤ 0,01)

11. Правило принятия статистического вывода

5) сформулировать принятие решения:
если Кэмп находится в зоне незначимости, то
принимается гипотеза Н0 об отсутствии различий;
если Кэмп находится в зоне неопределенности, то
есть вероятность принятия ложного решения
(необходимо увеличить выборку или воспользоваться
другим критерием);
если Кэмп находится в зоне значимости, то гипотеза
об отсутствии различий Н0 отклоняется и
принимается гипотеза Н1 о наличии различий

12. Правило признания значимости различий

В большинстве случаев для признания различий
значимыми ЭМПИРИЧЕСКОЕ (полученное)
ЗНАЧЕНИЕ КРИТЕРИЯ должно ПРЕВЫШАТЬ
КРИТИЧЕСКОЕ (табличное) в соответствии с
числом степеней свободы для двух независимых
выборок df = (n1 + n2) – 2, для двух зависимых
выборок df = (n1 + n2) – 1 или объемом выборки
(n).
Исключение: критерий U-Манна-Уитни, критерий
G-знаков, критерий T-Вилкоксона, в которых нужно
придерживаться противоположного правила.

13. Зависимые и независимые выборки

Зависимые выборки – это те выборки, в
которых каждому респонденту одной выборки
поставлен в соответствие по определенному
признаку респондент другой выборки.
Независимые выборки – это те выборки, в
которых вероятность отбора любого
респондента одной выборки не зависит от
отбора любого из респондентов другой
выборки.

14. Выбор критерия для сравнения двух выборок

Соответствие
распределений
нормальному закону
(параметрический)
Несоответствие
распределения(й)
нормальному закону
(непараметрический)
Независимые
выборки
t – критерий
Стьюдента
для
независимых
выборок
U-критерий
Манна-Уитни;
Зависимые
выборки
t – критерий
Стьюдента для
зависимых
выборок
Критерий
серий
Критерий знаков
Т-критерий
Вилкоксона;

15. Критерий t-Стьюдента для независимых выборок


генеральных совокупностей из которых извлечены
независимые выборки, отличаются друг от друга.
Исходные предположения:
1.
Одна выборка извлекается из одной генеральной
совокупности, другая – из другой (значения
измеренных признаков гипотетически не должны
коррелировать между собой).
2.
В обеих выборках распределение приблизительно
соответствует нормальному закону.
3.
Дисперсии признаков в двух выборках примерно
одинаковы.

16. Критерий t-Стьюдента для независимых выборок

Структура исходных данных: изучаемый
признак(и) измерен у респондентов, каждый
из которых принадлежит к одной из
сравниваемых выборок.
Ограничения:
1. Распределения существенно не отличаются
от нормального закона в обеих выборках.
2. При разной численности выборок дисперсии
статистически достоверно не различаются
(проверяется по критерию F-Фишера или по
критерию Ливена).

17. Формула для подсчетов

где,
– среднее значение первой выборки
– среднее значение второй выборки
стандартное отклонение по первой выборке
– стандартное отклонение по второй выборке

18. Критерий t-Стьюдента для зависимых выборок

Проверяет гипотезу о том, что средние значения двух
генеральных совокупностей, их которых извлечены
сравниваемые зависимые выборки, отличаются друг от
друга.
Исходные предположения:
1.
Каждому представителю одной выборки поставлен в
соответствие представитель другой выборки.
2.
Данные двух выборок положительно коррелируют.
3.
Распределение в обеих выборках соответствует
нормальному закону.
Структура исходных данных: имеется по два значения
изучаемого признака(ов).

19. Критерий F-Фишера

Применяется для проверки гипотезы о равенстве
дисперсий двух выборок. Его относят к критериям
рассеяния.
*Имеет смысл перед использованием критерия t-Стьюдента
предварительно проверить гипотезу о равенстве дисперсий.
Если она верна, то для сравнения средних можно
воспользоваться критерием t-Стьюдента (гипотезы о равенстве
средних значений в двух выборках).
Критерий Фишера основан на дополнительных
предположениях о независимости и нормальности
выборок данных. Перед его применением
рекомендуется выполнить проверку нормальности
распределения признака.

20. Критерий F-Фишера

В регрессионном анализе критерий Фишера
позволяет оценивать значимость линейных
регрессионных моделей.
В частности, он используется в шаговой
регрессии для проверки целесообразности
включения или исключения независимых
переменных (признаков) в регрессионную модель.
В дисперсионном анализе критерий Фишера
позволяет оценивать значимость факторов и их
взаимодействия.

21. U-критерий Манна-Уитни для независимых выборок

Показывает насколько совпадают (пересекаются) два ряда
значений измеренного признака (ов).
Условия для применения:
1.
Распределение хотя бы в одной выборке отличается от
нормального вида.
2.
Небольшой объем выборки (больше 100 человек –
используют параметрические критерии, меньше 10
человек – непараметрические, но результаты
считаются предварительными).
3.
Нет гомогенности дисперсий при сравнении средних
значений.

22. Т-критерий Вилкоксона для зависимых выборок

В основе лежит упорядочивание величин
разностей (сдвигов) значений признака в
каждой паре его измерений.
Идея критерия заключается в подсчете
вероятности получения минимальной из
положительных и отрицательных
разностей при условии, что распределение
положительных или отрицательных
разностей равновероятно и равно

23. Н-критерий Крускала-Уоллиса для 3 и более независимых выборок

Применяется для оценки различий по степени
выраженности анализируемого признака
одновременно между тремя, четырьмя и
более выборками.
Позволяет выявить степень изменения
признака в выборках, не указывая на
направление этих изменений.

24. Н-критерий Крускала-Уоллиса

Условия для применения:
1. Измерение должно быть проведено в шкале
порядка, интервалов или отношений.
2. Выборки должны быть независимыми.
3. Допускается разное число респондентов в
сопоставляемых выборках.
4. При сопоставлении трех выборок допускается,
чтобы в одной из них было n=3, а в двух других
n=2. Но в этом случае различия могут быть
зафиксированы только на уровне средней
значимости.

25. Критерий Фишера φ* (фи) (Угловое преобразование Фишера)

Критерий φ (фи) предназначен для
сопоставления двух рядов выборочных
значений по частоте встречаемости какоголибо признака.
Этот критерий можно применять на любых
выборках – зависимых и независимых. А
также можно оценивать частоту
встречаемости признака и количественной,
и качественной переменной.

26. Критерий Фишера φ*

Условия для применения:
1. Измерение может быть проведено в любой
шкале.
2. Характеристики выборок могут быть любыми.
3. Нижняя граница – в одной из выборок может
быть только 2 наблюдения, при этом во второй
должно быть не менее 30 наблюдений. Верхняя
граница не определена.
4. При малых объемах выборок, нижние границы
выборок должны содержать не менее 5
наблюдений каждая.

27. Классификация задач и методов их решения

Задачи
Условия
Методы
1. Выявление
а) 2 выборки
Q - критерий Розенбаума;
различий в уровне испытуемых
U - критерий Манна-Уитни;
исследуемого
φ* - критерий (угловое
признака
преобразование Фишера)
б) 3 и более выбоS - критерий тенденций Джонкира;
рок испытуемых
Н - критерий Крускала-Уоллиса.
2. Оценка сдвига а) 2 замера на одной
Т - критерий Вилкоксона;
значений
и той же выборке
G - критерий знаков;
исследуемого
испытуемых
φ* - критерий (угловое
признака
преобразование Фишера).
б) 3 и более замеров
χл2 - критерий Фридмана;
на одной и той же
L - критерий тенденций Пейджа.
выборке испытуемых

28. Классификация задач и методов их решения

Задачи
3. Выявление
различий в
распределении
4.Выявление
степени
согласованности
изменений
Условия
Методы
а) при сопоставлении
эмпирического
признака распределе
ния с теоретическим
χ2 - критерий Пирсона;

m - биномиальный критерий
б) при сопоставлении
двух эмпирических
распределений
χ2 - критерий Пирсона;
λ - критерий КолмогороваСмирнова;
φ* - критерий (угловое
преобразование Фишера).
rs - коэффициент ранговой
корреляции Спирмена.
rs - коэффициент ранговой
корреляции Спирмена
а) двух признаков
б) двух иерархий или
профилей

29. Классификация задач и методов их решения

Задачи
Условия
5. Анализ
а) под влиянием
изменений
одного фактора
признака под
влиянием
контролируемых
условий
б) под влиянием
двух факторов
одновременно
Методы
S - критерий тенденций
Джонкира;
L - критерий тенденций Пейджа;
однофакторный дисперсионный
анализ Фишера.
Двухфакторный дисперсионный
анализ Фишера.

Основные методы математической статистики - оценка параметров распределения, проверка статистических гипотез, дисперсионный анализ - применяются в предположении, что распределение генеральной совокупности известно. В частности, t - критерий для сравнения средних двух генеральных совокупностей и однофакторный дисперсионный анализ для сравнения средних нескольких совокупностей пригодны только в случае нормального распределения последних. Однако нередко встречаются данные, для которых эти предположения не выполняются. Например, результаты социологических опросов обычно имеют форму ответов типа "да" или "нет" и представляются в виде таблиц, содержащих частоты положительных и отрицательных ответов. Традиционные методы математической статистики не могут использоваться для обработки таких данных. В этих случаях обращаются к непараметрическим методам, т.е. методам, не зависящим от распределения генеральной совокупности.

Непараметрические методы применяются для качественных данных, представленных в номинальной шкале, данных, измеряемых в порядковой шкале (т.е. представленных в виде рангов), а также количественных данных в том случае, когда распределение генеральной совокупности нельзя определить, так как выборка мала, либо когда распределение не следует

нормальному закону и параметрические методы не применимы.

В пакете STATISTICA непараметрические

Рис .4.1. Стартовая панель модуля Nonpametrics/Distrib

процедуры выполняются в модуле

Nonpametrics/Distrib. Стартовая панель модуля приведена на рис.4.1.

Опишем последовательно соответствующие методы

и приведем примеры выполнения процедур.

В модуле Nonpametrics/Distrib содержится большое количество процедур. При решении конкретной задачи необходимо выбрать определенный метод. Помощь в таком выборе может оказать следующая классификация непараметрических методов, используемых для проверки гипотезы о том, что анализируемые данные - это выборки из однородных генеральных совокупностей. Заметим, что понятие однородности генеральных совокупностей понимается достаточно широко: это могут быть генеральные совокупности, имеющие одну и ту же

4) меры статистической зависимости: ранговый коэффициент корреляции Спирмена, коэффициент корреляции τ Кендалла.

2. Исходные данные: k независимых выборок объемами

n 1 ,n 2 , …,n k .

1) однофакторный дисперсионный анализ Краскела

Уоллиса.

2) медианный критерий.

3. Исходные данные: две связанные выборки объемами n .

Проверяемая гипотеза H 0 : выборки принадлежат однородным генеральным совокупностям.

1) критерий знаков;

2) критерий Вилкоксона.

4. Исходные данные: k связанных выборок объемамиn .

Проверяемая гипотеза H 0 : выборки принадлежат однородным генеральным совокупностям.

1) однофакторный анализ Фридмана;

2) меры связи - коэффициент конкордации Кендалла.

5. Связанные выборки, измеряемые в номинальной шкале.

5а) Исходные данные: две связанные выборки объемов n переменных X иY , каждая из которых

принимает

значения

Метод: критерий Макнимара.

5б) Исходные данные: две связанные выборки объемов n переменных X 1 ,X 2 , ...,X k , каждая из которых принимает два значения.

Проверяемая гипотеза H 0 : эффект воздействия отсутствует.

Метод : критерий Кокрена.

6. Независимые выборки, измеряемые в номинальной шкале.

6а) Исходные данные: выборки двух случайных переменных

X и Y , каждая из которых принимает два значения.

Проверяемая гипотеза H 0 :X иY независимы.Метод: анализ таблицы сопряженности2× 2

(точный критерий Фишера, критерий χ 2 ).

6б) Исходные данные: выборки k случайных переменных, каждая из которых принимаетr значений.

Проверяемая гипотеза H 0 : выборки получены из одной генеральной совокупности.

Метод: анализ таблицы сопряженностиk × r (критерийχ 2 ). Анализ таких таблиц проводится в

4.1. Таблицы сопряженности 2 × 2, статистикиχ 2 , φ, критерий Макнимара, точный критерий Фишера (2× 2 Tables

Xi/Vi/Phi, McNemar, Fisher exact)

В таблице сопряженности 2× 2 записываются частоты для двух случайных переменныхX иY , каждая из которых принимает два значения: 0 и 1, "да" и "нет" и т.д.

Пример 4.1. Чтобы определить отношение телезрителей разного пола к телевизионной передаче опросили 60 человек: 35 мужчин и 25 женщин. Оказалось, что 25 мужчин одобряют, а 10 - не одобряют передачу. В то же время 16 женщин высказывают свое отрицательное отношение к передаче, а 9 - положительное.

Выяснить, зависит ли отношение к передаче от пола телезрителей.

Решение. Данные можно записать в виде таблицы сопряженности2× 2 :

Отношение к передаче

Формально задача состоит в определении независимости двух рассматриваемых признаков X (пол) иY (отношение к передаче) или в проверке нулевой гипотезыH 0 : отношение к передаче не зависит

от пола при альтернативной гипотезе Н 1 : отношение к

передаче зависит от пола.

Эквивалентная формулировка такова. Рассмотрим две выборки: 35 мужчин и 25 женщин. Проверяется нулевая гипотеза H 0 : доля мужчин, одобряющих передачу (р 1 ), равна доле женщин, одобряющих

передачу (р 2 ), при альтернативной гипотезеН 1 : доли

мужчин и женщин, одобряющих передачу не равны. Нулевая гипотеза есть гипотеза о равенстве параметров р 1 ир 2 двух генеральных совокупностей, имеющих

биноминальное распределение.

Для проверки гипотезы H 0 применяется критерий Фишера , позволяющий рассчитать точные значения вероятностей наблюдаемых результатов и результатов с более крайними распределениями (см. , с. 345). Односторонние (one-tailed ) и двусторонние (twotailed ) уровни значимости p для критерия Фишера ( Fisher exact p ) вычисляются и приводятся в таблице результатов выполнения процедуры для таблицы сопряженности 2× 2.

При объеме выборки n ³ 30 менее трудоемкой процедурой являетсякритерий χ 2 . Чтобы пояснить

необходимые расчеты, запишем таблицу сопряженности 2× 2 в следующем виде:

Отношение к передаче

n 11= a

n1* = a+ b

n 21= c

n2* = c+ d

n = a+ c

n = b+ d

n = a+ b+ c+ d

столбцам

В рассматриваемом примере эта таблица имеет вид:

Отношение к передаче

столбцам

Статистика критерия c 2

использует разности между

наблюдаемыми частотами a ,b ,c ,d и ожидаемыми частотамиa 0 , b 0 , c 0 , d 0 , вычисляемыми при условии, что гипотезаH 0 верна:

a 0 =(a + b ) (a + c ) =35 × 34 »19,83; n 60

b 0 = (a+ b) n (b+ d) = 35 60 × 26 » 15,17;

c 0 = (c + d ) (a + c ) = 25 × 34 » 14,17; n60

d 0 = (c+ d) n (b+ d) = 25 60 × 26 » 10,83.

Выборочное значение статистики c в 2 вычисляется по формуле:

(a - a

(b - b

(c - c

(d - d

n(ad - bc) 2

(a+ b)(c+ d)(a+ c)(b+ d)

При n → ∞ статистикаc в 2 имеет распределениеc 2 с одной степенью свободы. Если ожидаемые частоты≤ 5 , то выборочное значение статистикиc в 2 вычисляют с поправкой Йетса на непрерывность:

c2 =(

a - a0

0,5) 2

b - b0

0,5) 2

c - c0

0,5) 2

d - d0

0,5)

nç ad- bc-

(a+ b) (c+ d) (a+ c)(b+ d)

Гипотеза H 0 принимается на уровне значимостиα ,

если c 2 < c 2

(1 ) , гдеc 2

Квантиль распределения c 2

с одной степенью свободы порядка 1 – α.

выборочное

значение

c в 2 = 7,45,

с поправкой

Йетса c в 2 = 6,08 .

c 0,95 2 (1) = 3,84

(проверьте,

используя

статистический

калькулятор!) и c в 2 < 3,84 , то гипотезаH 0 отклоняется: на

значимости

отношение к передаче зависит от пола.

Эти же результаты получим, введя данные в соответствующую процедуру пакета STATISTICA. Таблица результатов приведена на рис.4.2.

Рис .4.2. Результаты процедуры2× 2 Tables…

Р -значения для статистикиχ 2 , статистикиχ 2 ,

скорректированной по Йетсу, и точного критерия Фишера для двусторонней проверки соответственно равны 0,0063; 0,0137 и 0,0087. Таким образом, на уровне значимости α = 0,05 гипотеза H 0 отклоняется. В таблице результатов приводится мера связи между переменными

X и Y - коэффициент фи- квадрат (средний коэффициент сопряженности):

ϕ2 =χ в 2 = 0,124. n

Значение ϕ 2 изменяется от 0 (между переменными

нет зависимости) до 1 (между переменными имеется абсолютная зависимость, т.е. все частоты расположены на диагонали таблицы 2× 2 ).

Критерий значимости изменений Макнимара

применяется, если исходные данные - две связанные выборки. Над одним и тем же объектом или индивидуумом проводятся два наблюдения: одно до, другое после некоторого воздействия (приема лекарства, обучения, рекламной компании и т.д.).

2.1. Основные понятия

Параметрические методы обработки экспериментальных данных опираются на основополагающий факт, в соответствии с которым свойства результатов экспериментальных исследований, рассматриваемых как случайные объекты, описываются некоторым законом распределения. При этом предполагается, что анализ экспериментальных данных позволяет с достаточной степенью точности определить вид и конкретную форму закона распределения или значения его параметров, если нет необходимости в использовании самого закона. Такая информация даёт возможность в полном объёме использовать методы теории вероятностей для решения задач обработки.

Так как действительный закон распределения и значения его параметров неизвестны, то параметрические методы оперируют с их приближениями – статистическими законами распределения и оценками параметров распределения.

Статистическим законом распределения случайной величины называется закон распределения данной величины, установленный с помощью статистических методов обработки данных.

Статистический закон распределения может быть определён в виде статистической функции распределения , статистической плотности распределения или статистического ряда распределения P * (x i ), .

Статистическими оценками параметров закона распределения случайной величины называются приближённые значения данных параметров (статистики), полученные с помощью статистических методов обработки данных.

В дальнейшем статистические оценки для краткости называются просто оценками.

Если некоторый закон распределения характеризуется параметрами a 1 , a 2 ,…, a m , то их оценки будем обозначать в виде , ,…,. Наиболее распространёнными видами параметров законов распределения при обработке экспериментальных данных являются математическое ожидание , дисперсия или среднее квадратическое отклонение , а для системы случайных величин – корреляционный момент или коэффициент корреляции . Иногда используются центральные моменты третьего и четвёртого порядков. Соответственно при обработке данных используются их статистические аналоги – оценки математического ожидания, корреляционного момента и т.д.

Таким образом, если имеется совокупность экспериментальных данных x 1 , x 2 ,…, x n , то и статистический закон распределения, например функция , и оценки его параметров представляют собой некоторые функции этих данных:

, . (2.1.2)

Вид статистик y и f j определяет качество оценок и . В связи с этим возникает ряд проблем, основной из которых является проблема определения условий, при которых оценки (2.1.1) и (2.1.2) могут с требуемой достоверностью представлять теоретические законы распределения и их параметры. Эти условия формируются предельными теоремами теории вероятностей. Именно они служат тем фундаментом параметрических методов обработки экспериментальных данных, на основе которого могут быть получены подходящие оценки законов и параметров распределения наблюдаемых характеристик.

Вторая проблема состоит в выборе достаточной статистики , т.е. такой статистики, которая позволяет в конкретных условиях получать оценки заданного качества. Так как на основе результатов наблюдений x 1 , x 2 ,…, x n может быть образован большой спектр статистик (2.1.1) и (2.1.2), данная проблема сводится к выбору из них оптимальной в определённом смысле статистики. Решение проблемы осуществляется методами теории статистических решений.

Как видно из рис.1.1, к проблеме принятия решений при обработке экспериментальных данных сводится не только задача выбора достаточной статистики. Большинство задач обработки данных в разной степени может быть отнесено к задачам принятия решений. В связи с этим фундаментом параметрических методов обработки служат также принципы принятия статистических решений, на основе которых сформированы критерии принятия оптимальных в определённом смысле решений. Особую роль среди данных принципов играет принцип максимального правдоподобия и вытекающий из него для случая нормального закона распределения метод наименьших квадратов.

В настоящей брошюре рассматриваются вопросы параметрической обработки экспериментальных данных.

2.2. Предельные теоремы теории вероятностей

Использование параметрических методов обработки данных предполагает выявление условий, определяющих справедливость априорных предположений о виде закона распределения исследуемой случайной величины и свойствах его параметров. Эти условия формулируются в виде предельных теорем теории вероятностей. Ниже излагаются содержание и сущность теорем без доказательства, а также некоторые рекомендации по их практическому применению.

Параметрические методы оценивания

Применение параметрических методов предполагает априор­ное знание теоретического закона распределения исследуемой ве­личины или его определение по эмпирическим данным, что обусловливает необходимость проверки согласованности ЭД и выбранного теоретического закона. Параметрическая оценка по цензурированным выборкам основывается на традиционных методах математической статистики (максимального правдоподобия, моментов, квантилей), методах линейных оценок и ряде других.

Обработка многократно цензурированных выборок ме­тодом максимального правдоподобия допускается при следующих условиях:

6 < N <10, 10 < = N <20, 20 < = N <50, 50 < = N <100, r /N > = 0,5; r / N > = 0,3; r / N > = 0,2; r / N >= 0,1.

Когда эти ограничения не выполняются, можно вычислять только нижнюю доверительную границу параметров распределения.

Оценки, получаемые по методу максимального правдоподобия, при относительно нежестких ограничениях асимптотически эффективны, не смещены и распределены асимптотически нормально. Если непрерывная переменная с функцией плотности f (x , t ) цензурирована в точках а и b (a <b ), то функция плотности распреде­ления при цензурировании определяется как

Функция правдоподобия при N наблюдениях

.

Если переменная дважды цензурирована в фиксированных точках a и b , так, что не наблюдаются k 1 наименьших и k 2 наибольших элементов выборки, то функция правдоподобия

где k 1 и k 2 являются случайными величинами.

При цензурировании с постоянными величинами k =r 1 и k 2=r 2 функция правдоподобия равна

где v1=x r 1+1, v2 =x N - r 2

Решение уравнения правдоподобия при различных схемах цензурирования является достаточно сложной задачей. В явном виде такие решения можно получить только для однопараметрических законов распределения. Известны уравне­ния для нахождения параметров типовых законов распределения показателей надежности по цензурированным слева выборкам.

Экспоненциальное распределение . Точечные оценки параметра распределения l при различных планах наблюдения:

где Ф(х ) – функция нормального распределения, f (x ) – функция плотности нормального распределения.

Система уравнений (8.7) допускает только численное решение. При таком решении уравнений в качестве начальных приближений неизвестных параметров обычно берут оценки математического ожидания и среднеквадратического отклонения, вычисленные по объединенной выборке.

Логарифмически нормальное распределение . Оценки параметров вычисляют по формулам для нормального закона распределения с заменой значений наработок их натуральными логарифмами.

Р аспределение Вейбулла . Оценки параметров d и b для плана [NUz ] вычисляются на основе системы уравнений

где t m = t r для плана [NUr ], t m = Т для плана [ NUT ].

Системы уравнений (8.8) – (8.9) не имеют аналитического решения и требуют применения численных методов: вначале находится корень первого уравнения (оценка параметра b), затем прямой подстановкой значение оценки параметра d. Для двухпараметрического распределения Вейбулла большие (b>4) или малые (b<0,5) значения параметра свидетельствуют о том, что ЭД не подчиняются этому закону или отношение r /N мало. В таких случаях следует применить непараметрические методы оценивания или перейти к трехпараметрическому закону распределения Вейбулла.

Трудности применения метода максимального правдопо­добия обусловливают разработку других методов. Метод моментов обычно приводит к простым вычислительным процедурам, позволяет получить асимптотически эффективные, несмещенные и нормально распределенные оценки, но требует учета типа цензурирования и применим при относительно большом объеме выборки (не менее 30). Использование метода квантилей для оценок параметров законов распределений менее критично к типу цензурирования. Высокая точность оценок достигается оптимальным подбором квантилей, хотя такой подбор не всегда удается осуществить.

Метод линейных оценок применяют при небольшом объеме выборки, он обеспечивает высокую эффективность, состоятельность и несмещенность оценок параметров распределения. Этот метод основан на нахождении линейной функции от порядковых статистик (упорядоченных элементов выборки), которая была бы несмещенной оценкой искомого параметра. Применение связано с необходимос­тью использования специальных видов распределений, что вызывает определенные неудобства и затрудняет автоматизацию расчетов.

Рассмотренная выше общая стратегия оценки статистических гипотез в первую очередь определяет применение так называемых параметрических методов математической статистики.

Параметрические методы основаны на некоторых, как правило, вполне вероятных предположениях о характере распределения случайной величины. Обычно параметрические методы, используемые в анализе экспериментальных данных, основаны на предположении нормальности распределения этих данных. Следствием такого предположения является необходимость оценки исследуемых параметров распределения. Так, в случае рассматриваемого далее t -теста Стьюдента такими оцениваемыми параметрами являются математическое ожидание и дисперсия. В ряде случаев делаются дополнительные предположения по поводу того, как параметры, характеризующие распределение случайной величины в разных выборках, соотносятся между собой. Так, в тесте Стьюдента, который часто используют для сравнения средних значений (математического ожидания) двух рядов данных на предмет их однородности или неоднородности, дополнительно делается предположение об однородности дисперсий распределения случайных величин в двух генеральных совокупностях, из которых эти данные были извлечены.

Достоинством методов параметрического анализа данных является тот факт, что они обладают достаточно высокой мощностью. Под мощностью теста имеют в виду его способность избегать ошибки второго рода, или β-ошибки. Чем меньше оказывается β-ошибка, тем выше мощность теста. Иными словами, мощность теста = 1 – β.

Высокая мощность параметрических тестов, или критериев, обусловлена тем, что данные методы требуют, чтобы имеющиеся данные были описаны в метрической шкале . Как известно, к метрическим шкалам относят интервальную шкалу и шкалу отношений, которую иногда еще называют абсолютной шкалой. Интервальная шкала позволяет исследователю выяснить не только отношения равенства или неравенства элементов выборки (как это позволяет сделать шкала наименований ) и не только отношения порядка (как это позволяет сделать шкала порядка ), но также и оценивать эквивалентность интервалов. Абсолютная шкала вдобавок к этому позволяет оценивать эквивалентность отношений между элементами множества, полученными в ходе измерения. Именно поэтому метрические шкалы относят к сильным измерительным шкалам. Благодаря этой силе параметрические методы позволяют более точно выразить различия в распределении случайной величины при условии истинности пулевых или альтернативных гипотез.

Следует также отметить, что в целом параметрические методы статистики более разработаны в теории математической статистики и поэтому применяются значительно шире. Практически любой экспериментальный результат может быть оценен с помощью какого-либо из этих методов. Именно такие методы и рассматриваются преимущественно в учебниках и руководствах по статистическому анализу данных.

В то же время трудности, связанные с использованием методов параметрического анализа в статистике, состоят в том, что в ряде случаев априорные предположения о характере распределения исследуемых случайных величин могут оказаться неверными. И эти случаи весьма характерны именно для психологических исследований в тех или иных ситуациях.

Так, если сравнивать две выборки с помощью t -теста Стьюдента, можно обнаружить, что распределение наших данных отличается от нормального, а дисперсии в двух выборках значительно разнятся. В этом случае использование параметрического теста Стьюдента может до некоторой степени исказить выводы, которые хочет сделать исследователь. Такая опасность увеличивается, если значения вычисленной статистики оказываются близкими к граничным значениям квантилей, которые используются для принятия или отвержения гипотез. В большинстве случаев, однако, как, например, в случае использования t -теста, некоторые отклонения от теоретически заданных предположений оказываются некритичными для надежного статистического вывода. В других случаях такие отклонения могут создавать серьезную угрозу такому выводу. Тогда исследователи могут разрабатывать специальные процедуры, которые могут скорректировать процедуру принятия решения по поводу истинности статистических гипотез. Назначение этих процедур состоит в том, чтобы обойти или смягчить слишком жесткие требования параметрических моделей используемой статистики.

Один из вариантов таких действий исследователя, когда он обнаруживает, что полученные им данные по своим параметрам отличаются от того, что задано в структурной модели используемого параметрического теста, может состоять в том, чтобы попытаться преобразовать эти данные к нужному виду. Например, как отмечалось в гл. 1, измеряя время реакции, можно избежать высокого значения асимметрии его распределения, если использовать для анализа логарифмы получаемых значений, а не сами значения времени реакции.

Другой вариант действий состоит в отказе от использования каких-либо априорно заданных предположений о характере распределения случайной величины в генеральной совокупности. А это означает отказ от параметрических методов математической статистики в пользу непараметрических.

Непараметрическими называют методы математической статистики, при которых не выдвигаются какие-либо априорные предположения о характере распределения исследуемых данных и не предполагается каких-либо допущений о соотношении параметров распределения анализируемых величин. В этом заключается главное достоинство этих методов.

В полной мере преимущество непараметрической статистики раскрывается тогда, когда результаты, полученные в эксперименте, оказываются представленными в более слабой неметрической шкале , представляя собой результаты ранжирования. Такая шкала называется шкалой порядка. Конечно, в ряде случаев исследователь может преобразовать эти данные к более сильной интервальной шкале, используя процедуры нормализации данных, но, как правило, оптимальным вариантом в этой ситуации является применение именно непараметрических тестов, специально созданных для статистического анализа.

Как правило, тесты непараметрической статистики предполагают оценивание имеющихся соотношений ранговых сумм в двух или более выборках, и на основании этого формулируется вывод о соотношении этих выборок. Примерами таких тестов являются критерий знаков, критерий знаковых рангов Уилкоксона, а также U-критерий Манна Уитни, которые используются в качестве аналога параметрического t -теста Стьюдента.

В то же время, если результаты измерения оказываются представленными в более сильной шкале, использование непараметрической статистики означает отказ от части информации, содержащейся в данных. Следствием этого является опасность возрастания ошибки второго рода, свойственной этим методам.

Таким образом, методы непараметрической статистики оказываются более консервативными по сравнению с методами параметрической статистики. Их использование грозит в большей мере ошибкой второго рода, т.е. ситуацией, когда исследователь, например, не может обнаружить отличия двух выборок, когда такие отличия на самом деле имеют место. Иными словами, такие методы оказываются менее мощными по сравнению с параметрическими методами. Поэтому использование параметрической статистики в анализе экспериментальных данных, отличающихся от простого ранжирования, как правило, является предпочтительным.