Главная > Математика > Последовательный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

1.3.3. Принципы выбора критической области.

Принципы, которыми следует руководствоваться для правильного выбора критической области, были сформулированы Нейманом и Пирсоном. Эти принципы имеют фундаментальное значение в теории проверки статистических гипотез. В настоящем разделе будет кратко изложена основная идея теории Неймана-Пирсона.

Особый теоретический интерес представляет простой случай, когда в распределение рассматриваемой случайной величины х входит единственный неизвестный параметр который может принимать лишь два значения: Основную идею теории Неймана — Пирсона можно пояснить даже на этом простом примере. Поэтому в данном и в следующем разделах ограничимся случаем единственного неизвестного параметра распределения 0, который может принимать только два значения

Пусть означает распределение случайной величины х при любой величине параметра Обозначим через распределение а через распределение Предположим, что нам требуется проверить гипотезу о том, что Будем называть эту гипотезу нулевой и обозначать ее через Гипотезу о том, что будем называть конкурирующей и обозначать ее через Таким образом, перед нами стоит задача проверки гипотезы относительно конкурирующей гипотезы на основе выборки из независимых наблюдений х.

В качестве основы для выбора из множества возможных критических областей той критической области, которая

соответствует данной конкретной задаче, Нейман и Пирсон предложили следующие соображения. Принимая или отклоняя гипотезу можем допустить ошибки двух родов. Мы допускаем ошибку первого рода, если отклоняем гипотезу в то время как она истинна, и допускаем ошибку второго рода, если принимаем гипотезу в то время как истинна конкурирующая гипотеза Вероятности ошибок первого и второго рода однозначно определяются выбором критической области Действительно, вероятность ошибки первого рода равна вероятности попадания наблюденной выборки в критическую область вычисленной при гипотезе а вероятность ошибки второго рода равна вероятности непопадания наблюденной выборки в критическую область вычисленной при гипотезе Для любой заданной критической области будем обозначать через а вероятность ошибки первого рода и через вероятность ошибки второго рода. Вероятности допускают следующую важную практическую интерпретацию. Предположим, что мы получили большое количество выборок объема Обозначим количество таких выборок через и будем считать, что для каждой из этих выборок мы отвергаем гипотезу если выборка попадает в область и принимаем гипотезу если выборка не попадает в область Таким образом, мы делаем выводов о принятии или отклонении гипотезы Некоторые из этих заключений будут, вообще говоря, ложными. Если гипотеза истинна, а велико, то с вероятностью, близкой к единице (т. е. практически достоверно), можно считать, что доля ложных заключений (т. е. количество ложных заключений, деленное на будет примерно равна а. Если истинна гипотеза то с вероятностью, близкой к единице, можно считать, что доля ложных заключений будет примерно равна Таким образом, можем сказать, что при большом количестве выборок доля ложных заключений равна а, если верна гипотеза и равна если верна гипотеза

Ясно, что если некоторой критической области соответствуют меньшие величины то такая область для нас предпочтительнее. Соответствующий выбор критической области позволяет сделать как угодно малой либо а, либо однако оказывается невозможным при фиксированном т. е. при фиксированном объеме выборки, сделать как угодно малыми одновременно и Для иллюстрации сказанного рассмотрим следующие два предельных случая.

1) Область пустая, т. е. мы всегда принимаем гипотезу независимо от исхода испытания. В этом случае

2) Область представляет собой множество всех возможных выборок, т. е. мы всегда отвергаем гипотезу В этом случае

Если по каким-либо причинам мы решим рассматривать только те критические области для которых вероятность а равна заданной величине, то выбор какой-то определенной области из областей указанного класса должен основываться на следующем принципе, выдвинутом Нейманом и Пирсоном: ограничивая наш выбор областями для которых вероятность а равна заданной величине, мы должны выбрать ту область из этого множества, для которой вероятность минимальна. При этом величина а называется уровнем критической области, а величина мощностью критической области. Критическая область, имеющая наибольшую мощность среди всех областей одинакового уровня, называется наиболее мощной областью. Поскольку выбор минимального это то же самое, что и максимализация величины то принцип Неймана — Пирсона, касающийся выбора критической области можно сформулировать следующим образом: ограничивая наш выбор областями фиксированного уровня а, мы должны выбрать в качестве критической наиболее мощную область этого уровня.

Если при фиксированном объеме выборки будем использовать наиболее мощную критическую область, то вероятность будет однозначной функцией а, которую обозначим через Следовательно, задавая количество наблюдений, на которых основана проверка, мы можем выбрать произвольно одну из величин а или Теория Неймана — Пирсона оставляет вопрос об этом выборе открытым. Вообще говоря, ясно, что если а мало, то велико, и, наоборот, если велико а, то будет, вообще говоря, малым. Выбор величины а (или в каждом частном случае сильно зависит от того, насколько важны для нас ошибки первого и второго рода. Предположим, например, что убыток, вызываемый ошибкой первого рода, составляет один доллар, а потери, вызываемые ошибкой второго рода, равны одному центу. Тогда, очевидно, мы предпочитаем иметь малую вероятность а и большую вероятность В, а не наоборот.

Нейман и Пирсон показали, что область, состоящая из всех выборок для которых удовлетворяется неравенство

является наиболее мощной критической областью для проверки гипотезы относительно гипотезы Постоянная величина в правой части неравенства выбирается из условия, чтобы критическая область имела определенный уровень а. Обстоятельства, в силу которых критическая область, определяемая неравенством (1.7), является наиболее мощной областью для данной проверки, можно изложить следующим образом. Будем для простоты считать, что распределения вероятностей х при гипотезах дискретны, т. е. означает вероятность получения выборки, совпадающей с наблюденной. Построение критической области, определяемой неравенством (1.7), можно начать с выборки для которой отношение максимально. Затем в эту область включается также выборка

для которой отношение максимально среди всех выборок, оставшихся после извлечения из множества всех возможных выборок выборки Вообще после того как в критическую область включено выборок в эту область включается также выборка которая имеет максимальное среди всех оставшихся выборок отношение Этот процесс продолжается до тех пор, пока уровень критической области не достигнет заданной величины а. Поскольку на любой стадии этого процесса последняя выборка, включенная в критическую область, имеет наибольшее отношение вероятностей осуществления при гипотезах по отношению к любой другой выборке, еще не вошедшей в состав области, то очевидно, что

вероятностная мера критической области при справедливости гипотезы мощность критической области, больше или равна мощности любой другой области того же уровня.

Проиллюстрируем принцип выбора критической области на следующем простом и хорошо известном примере. Пусть гипотеза о том, что случайная величина х распределена по нормальному закону со средним значением и с единичной дисперсией. Будем считать, что задана также и имеется гипотеза Их о том, что величина х распределена по нормальному закону со средним значением и единичной дисперсией. Предположим При проверке гипотезы относительно конкурирующей гипотезы мы должны определить отношение Так как

и

то неравенство (1.7) можно переписать в виде

Беря логарифм от обеих частей неравенства, получим

Следовательно,

Неравенство (1.9) можно записать в виде

Выберем теперь величину такой, чтобы критическая область, определяемая неравенством (1.10), соответствовала уровню Так как при гипотезе случайная величина распределена по нормальному закону с нулевым средним значением и дисперсией, равной то по таблице нормального распределения получим, что Таким образом, наиболее мощная область уровня 0,05 является совокупностью всех выборок, для которых выполняется неравенство

Полученный результат хорошо известен. Задолго до того, как Нейман и Пирсон развили свою теорию проверки статистических гипотез, на практике при проверке гипотезы относительно гипотезы уже использовалась критическая область (1.11). Замечательным свойством области, определяемой этим неравенством, является то, что она не зависит от конкурирующей величины так как при выводе этого неравенства использовалось только условие, что Следовательно, критерий, определяемый областью (1.11), является наиболее мощным по отношению ко всем т. е. является равномерно наиболее мощным критерием в случае, когда конкурирующее значение параметра превышает величину

<< Предыдущий параграф Следующий параграф >>
Оглавление