Главная > База знаний > Большая советская энциклопедия > СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ

СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ

СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ система
приёмов в математической статистике, предназначенных для проверки
соответствия опытных данных нек-рой статистической гипотезе.
Процедуры
С. п. г. позволяют принимать или отвергать статистические гипотезы, возникающие
при обработке или интерпретации результатов измерений во многих практически
важных разделах пауки и производства, связанных с экспериментом. Правило,
по к-рому принимается или отклоняется данная гипотеза, паз. статистическим
критерием. Построение критерия определяется выбором подходящей функции
T
от
результатов наблюдений, к-рая служит мерой расхождения между опытными и
гипотетическими значениями. Эта функция, являющаяся случайной величиной,
наз. статистикой критерия, при этом предполагается, что распределение вероятностей
T
может
быть вычислено при допущении, что проверяемая гипотеза верна. По распределению
статистики T находится значение
То, такое, что если гипотеза
верна, то вероятность неравенства
T > Травна$\alpha$,
где$\alpha$ - заранее заданный
значимости
уровень.
Если в конкретном случае обнаружится, что T > Tто
гипотеза отвергается, тогда как появление значения
T <=Tне
противоречит гипотезе.


Пусть, напр., требуется проверить гипотезу
о том, что независимые результаты наблюдений х$\iota$,...,х$\eta$подчиняются
нормальном
распределению
со средним значением а = а и известной
дисперсией$\sigma$2.
При этом предположении среднее арифметическое х = (х+ хрезультатов наблюдений распределено нормально со
средним а = адисперсией ($\sigma$2/n,
а
величина корень n( х-араспределена нормально с
параметрами (0,1). Полагая T = корень n (| х - а| ) /$\sigma$, можно
найти связь между Т
по таблицам нормального распределения. Напр., при гипотезе а = а
событие T > 1,96 имеет вероятность$\alpha$
= 0,05. Правило, рекомендующее считать, что гипотеза а = аневерна,
если T > 1,96, будет приводить к ложному отбрасыванию этой гипотезы
в среднем в 5 случаях из 100, в к-рых она верна. Если же
T <=
1,96, то это ещё не означает, что гипотеза подтверждается, т. к. указанное
неравенство с большой вероятностью может выполняться при
а, близких
к аСледовательно, при использовании предложенного
критерия можно лишь утверждать, что результаты наблюдений не противоречат
гипотезе а = аПри выборе статистики
T всегда
явно или неявно учитывают гипотезы, конкурирующие с гипотезой
а = аНапр.,
если заранее известно, что a >= ат. е. отклонение
гипотезы а = авлечёт принятие гипотезы а > ато
вместо T следует взять T
Если дисперсия$\sigma$2
неизвестна, то вместо данного критерия для проверки гипотезы а = аможно
воспользоваться т. н. критерием Стьюдента, основанным на статистике


корень n(х-а к-рая
включает несмещённую оценку дисперсии

2432-3.jpg


и подчинена Стьюдента распределению
с п -
1 степенями свободы (подобную задачу см. в ст.
Математическая
статистика,
табл. 1a). Такого рода критерии наз. критериями согласия
и используются как для проверки гипотез о параметрах распределения, так
и гипотез о самих распределениях (см. Непараметрические методы).


При решении вопроса о принятии или отклонении
к.-л. гипотезы H
с помощью любого критерия, основанного
на результатах наблюдения, могут быть допущены ошибки двух типов. Ошибка
"первого рода" совершается тогда, когда отвергается верная гипотеза HОшибка
"второго рода" совершается в том случае, когда гипотеза На
принимается,
а на самом деле верна не она, а к.-л. альтернативная гипотеза
H. Естественно
требовать, чтобы критерий для проверки данной гипотезы приводил возможно
реже к ошибочным решениям. Обычная процедура построения наилучшего критерия
для простой гипотезы заключается в выборе среди всех критериев с заданным
уровнем значимости$\alpha$
(вероятность ошибки первого рода) такого, к-рый приводил бы к наименьшей
вероятности ошибки второго рода (или, что то же самое, к наибольшей вероятности
отклонения гипотезы, когда она неверна). Последняя вероятность (дополняющая
до единицу вероятность ошибки второго рода) наз. мощностью критерия. В
случае, когда альтернативная гипотеза H простая, наилучшим будет
критерий, к-рый имеет наибольшую мощность среди всех других критериев с
заданным уровнем значимости а (наиболее мощный критерий). Если альтернативная
гипотеза H сложная, напр, зависит от параметра, то мощность критерия
будет функцией, определённой на классе простых альтернатив, составляющих
H,
т.
е. будет функцией параметра. Критерий, имеющий наибольшую мощность при
каждой альтернативной гипотезе из класса H, наз. равномерно наиболее
мощным, однако следует отметить, что такой критерий существует лишь в немногих
спец. ситуациях. В задаче проверки гипотезы о среднем значении нормальной
совокупности а = а против альтернативной гипотезы а
> а равномерно наиболее мощный критерий существует, тогда
как при проверке той же гипотезы против альтернативы a <> аего
нет. Поэтому часто ограничиваются поиском равномерно наиболее мощных критериев
в тех или иных спец. классах (инвариантных, несмещённых критериев и т.
п.).


Теория С. п. г. позволяет с единой точки
зрения трактовать выдвигаемые практикой различные задачи математич. статистики
(оценка различия между средними значениями, проверка гипотезы постоянства
дисперсии, проверка гипотезы независимости, проверка гипотез о распределениях
и т. п.). Идеи последовательного анализа, применённые к С. п. г.,
указывают на возможность связать решение о принятии или отклонении гипотезы
с результатами последовательно проводимых наблюдений (в этом случае число
наблюдений, на основе к-рых по определённому правилу принимается решение,
не фиксируется заранее, а определяется в ходе эксперимента) (см. также
Статистические
решения).



Лит.: Крамер Г., Математические
методы статистики, пер. с англ.,2 изд., M., 1975; Л е м а и Э., Проверка
статистических гипотез, пер. с англ., M., 1964.

А. В. Прохоров.




А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я