Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Выбор размера критерия

22.29 До сих пор в нашем изложении мы предполагали, что размер критерия а каким-то образом выбран и фиксирован. Все наши результаты сохраняют силу при любом выборе а. Теперь мы рассмотрим вопрос о том, как определять а.

Во-первых, естественно потребовать, чтобы а было «мало», в соответствии с некоторым приемлемым критерием, и, действительно, обычно используют одно из общепринятых значений а, таких, как 0,05, 0,01 или 0,001. Однако не следует заходить слишком далеко в этом направлении. Мы можем задать только две из величин даже при проверке простой гипотезы против простой альтернативы Если фиксировано, то, вообще говоря, мы можем уменьшить вероятность ошибки первого рода а, только увеличивая вероятность ошибки второго рода Другими словами, уменьшение размера критерия вызывает уменьшение мощности.

Выражение (22.18) для мощности НКО одностороннего критерия для среднего значения нормального распределения в примере 22.3 хорошо иллюстрирует этот факт. Мы видим, что при в силу следовательно, мощность (22.18) также стремится к нулю.

Таким образом, при фиксированном объеме выборки мы должны соизмерять размер и мощность критерия. Если практический риск, связанный с ошибкой первого рода, велик, в то время как риск, связанный с ошибкой второго рода, мал, то при фиксированном следует уменьшить а за счет увеличения

Если, однако, объем выборки находится в нашем распоряжении, то мы можем, как в примере 22.13, взять такое достаточно большое чтобы уменьшить до заданных уровней. Эти уровни еще надо определить, однако до тех пор, пока мы не имеем дополнительной информации в форме стоимостей (в денежных или других единицах) двух типов ошибок и стоимостей проведения наблюдений, мы не сможем получить «оптимальной» комбинации для данной задачи. Можно лишь заметить, что независимо от способа определения а полученные в этой главе результаты остаются в силе.

22.30 Вопрос, рассмотренный в 22.29, связан с другим, который кладется иногда в основу критики теории проверки гипотез.

Предположим, что мы применяем критерий с фиксированным , а очень велико. Любой разумный критерий будет иметь мощность, близкую к единице, обнаруживая любые отклонения от проверяемой гипотезы. Приведем теперь довод, сформулированный Берксоном (1938): «Никто в

действительности не считает, что какая-либо гипотеза выполняется точно: мы просто строим абстрактную модель реальных событий, которая в какой-то мере обязательно отклоняется от истины. Однако, как мы видим, огромная выборка почти наверняка (т. е. с вероятностью, стремящейся к 1 при неограниченном возрастании отвергает гипотезу при любом заданном размере а. Зачем тогда вообще пытаться проверять гипотезу при малых выборках, которые приводят к еще менее надежному заключению, чем большие выборки?»

Этот парадокс в действительности связан с двумя моментами. Прежде всего, если фиксировано и нас интересует не точное, а лишь приближенное выполнение проверяемой гипотезы, то это обстоятельство можно было бы учесть, сделав нашу альтернативную гипотезу достаточно удаленной от проверяемой гипотезы, чтобы отличие между ними представляло практический интерес. Само по себе это увеличило бы мощность критерия. Но если мы не желаем отвергать проверяемую гипотезу на основании небольших отклонений от нее, то следует предпочесть критерий с низкой мощностью против малых отклонений, а это означает малое а при соответственно высоком т. е. малой мощности.

Однако основным моментом парадокса является рассуждение, связанное с увеличением объема выборки. Проверяемая гипотеза будет отвергнута с вероятностью, близкой к 1, только если мы будем сохранять а фиксированным. Нет никаких причин, чтобы поступать таким образом: мы можем определить а любым способом, каким мы пожелаем, и в свете рассуждений пункта 22.29 разумно использовать выигрыш в чувствительности, получающийся при увеличении для уменьшения как так и а. Лишь привычка фиксировать а на определенном принятом уровне приводит к парадоксу. Если допустить уменьшение а при возрастании то уже нельзя быть уверенным, что очень малые отклонения от Но приведут к тому, что будет отвергнута: теперь это будет зависеть от того, с какой скоростью убывает а.

22.31 Парадокс, обратный парадоксу пункта 22.30, может возникнуть при малых выборках. Так же как при больших негибкое использование общепринятых значений а. может привести к слишком высокой мощности, так и при малых фиксированных использование таких значений а может привести к очень низкой мощности, возможно, слишком низкой. Положение может быть исправлено с помощью увеличения а, которое повлечет уменьшение

Статистик всегда должен убедиться в том, что в условиях его задачи он не слишком увеличил чувствительность в одном направлении за счет другого.

Пример 22.14

Э. Пирсон (обсуждение работы Линдли вычислил несколько значений функции мощности (22.56) двустороннего критерия для нормального среднего, которые мы воспроизводим для иллюстрации наших рассуждений.

Таблица 22.1 (см. скан) Функция мощности, вычисленная по формуле (22.56). Значения в первой строке таблицы дают размеры критериев

Из таблицы видно, что при объеме выборки 100 уменьшение а от 0,050 до 0,019 и 0,0056 вызывает последовательное уменьшение мощности критерия для каждого значения Действительно, для мощность падает ниже значения, соответствующего Наоборот, при уменьшении объема выборки от 20 до 10 увеличение а до 0,072 и 0,111 увеличивает мощность, хотя только в случае она превосходит мощность при

УПРАЖНЕНИЯ

(см. скан)

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление