Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ГЛАВА 25. СРАВНЕНИЕ КРИТЕРИЕВ

25.1 В главах 22—24 мы занимались отысканием «оптимальных критериев», т. е. критериев, обладающих в данной ситуации «наилучшими» свойствами, где под «наилучшими» понимаются такие желательные свойства, как РНМ, РНМН и др. До сих пор мы не рассматривали вопроса о сравнении, в конкретной ситуации, двух или более критериев с целью оценки их относительной эффективности.

Исследование этого вопроса необходимо для оценивания потери эффективности, возникающей при использовании критерия, отличного от оптимального. Может случиться, например, что РНМ критерий имеет незначительно большую мощность, чем какой-либо другой критерий, который, возможно, много проще с точки зрения вычисления. В такой ситуации вполне естественно для стандартной проверки гипотезы использовать менее эффективный критерий. Но прежде чем принять такое решение, мы должны сделать какое-то количественное сравнение между критериями.

Аналогичная проблема обсуждалась в 17.29 в теории оценивания, где была получена мера эффективности оценки. Читатель, возможно, спросит, как случилось, что в теории оценивания вопрос измерения эффективности обсуждался сразу же по введении понятия эффективности, а здесь вопрос измерения эффективности критерия отнесен в конец общего обсуждения теории критериев. Ответ частично состоит в том, что понятие эффективности критерия оказывается значительно более сложным, чем понятие эффективности оценки, и требует поэтому более развернутого изложения.

Основная причина, однако, заключается в том, что мы попросту следуем историческому развитию этого вопроса: необходимость измерения эффективности критериев возникла только тогда, когда (начиная примерно с 1935 г.) внимание статистиков было обращено на простые с точки зрения вычислений критерии (они будут обсуждаться в главах 31 и 32). Даже идея состоятельности критерия, с которой мы встретились в 24.17, была развита Вальдом и Волфовицем (1940) только почти через двадцать

лет после первого определения Фишером (1921а) состоятельной оценки. Лишь когда «неэффективные» критерии стали представлять практический интерес, возникла необходимость исследования более слабых свойств критериев.

Сравнение функций мощности

25.2 При проверке данной гипотезы против данной альтернативы, когда объем выборки фиксирован, простейший путь сравнения двух критериев состоит в непосредственном исследовании их функции мощности. Если объем выборки находится в нашем распоряжении (например, мы планируем серию наблюдений), то естественно искать определение эффективности критерия в такой же форме, как для эффективности оценки в 17.19. Пусть некоторому «эффективному» критерию (т.е. наиболее мощному в рассматриваемом классе) размера а необходимо наблюдений для достижения определенной мощности против данной альтернативы, а другому критерию того же размера а требуется для этого наблюдений. Тогда можно определить относительную эффективность второго критерия для достижения указанной мощности против заданной альтернативы как Введенная мера представляет собой, как и в случае оценивания, величину, обратную к отношению требуемых объемов выборок. Заметим, что наше определение относительной эффективности не является асимптотическим и не содержит никаких ограничений на выборочные распределения сравниваемых статистик критериев. Таким путем можно сравнивать любые два критерия, потому что функции мощности критериев, для которых вычисляется относительная эффективность, полностью учитывают распределения статистик критериев (функции мощности содержат в себе всю информацию, относящуюся к сравнению).

Асимптотические сравнения

25.3 Понятие относительной эффективности дает исчерпывающую информацию, но оказывается неудобным для применения. Подобно функции мощности, на которой оно основано, это понятие представляет собой функцию трех аргументов — размера критерия а, «расстояния» (в терминах некоторого параметра между проверяемой гипотезой и альтернативой, а также объема выборки требуемого для эффективного критерия. Если даже ограничиться несколькими типичными значениями то для сравнения критериев с помощью этой меры требуется таблица с двумя входами. Было бы значительно удобнее, если бы мы смогли найти некую единую результирующую меру эффективности. Понятно, что можно надеяться достичь этого, лишь имея

дело с некоторым предельным процессом. Таким образом, мы вернулись к необходимости ограничиться асимптотическими результатами.

25.4 Другой подход, который напрашивается сам собой, состоит в том, чтобы устремить объем выборки к бесконечности, как в 17.29, и взять отношение мощностей критериев в качестве меры эффективности критерия. Если мы попытаемся воспользоваться этим подходом, то немедленно столкнемся с трудностью. Действительно, когда рассматриваются два состоятельных против данного класса альтернативных гипотез критерия размера а (а мы всегда будем иметь дело только с таким случаем), то функция мощности каждого из них по определению стремится к 1 с возрастанием объема выборки. Отсюда следует, что если мы сравниваем критерий против некоторого фиксированного альтернативного значения параметра то определенная таким образом эффективность всегда будет стремиться к 1 при возрастании объема выборки. Приведенная мера эффективности оказывается, следовательно, совершенно бесполезной.

Вообще, легко видеть, что асимптотическое по рассмотрение функций мощности состоятельных критериев имеет ограниченное значение. Например, Вальд (1941) определил асимптотически наиболее мощный критерий как критерий, у которого функция мощности не может быть улучшена, когда объем выборки стремится к бесконечности, т. е. который является асимптотически РНМ критерием. Следующий пример, принадлежащий Леадану (1949), показывает, что один асимптотически РНМ критерий может быть (даже асимптотически) явно хуже, чем другой такой же критерий.

Пример 25.1

Рассмотрим вновь задачу проверки гипотезы о среднем нормальной совокупности с известной дисперсией, равной 1, обсуждавшуюся в примерах 22.1 и 22.2. Мы хотим проверить гипотезу против односторонней альтернативы В 22.17 мы видели, что РНМ критерий для против задается критической областью а в примере 22.3 было показано, что его функция мощности равна

где и фиксированное значение определяет, как в (22.16), размер критерия а.

Построим теперь двусторонний критерий уровня а, отклоняющий гипотезу когда

где значения , (зависящие от могут быть выбраны произвольно, лишь бы только откуда следует, что превосходят Согласно (23.48) функция мощности второго критерия равна

а из положительности вытекает, что

Так как первый критерий является РНМ, то, вычитая (25.3) из (25.1), получаем

Легко видеть, что разность между при фиксированной величине будет максимальной, когда симметричны относительно нуля, т. е. когда Отсюда следует, что

Учитывая (25.5), имеем из (25.4)

Таким образом, если для каждого выбрать так, чтобы

то левая часть (25.6) будет стремиться к нулю, и, значит будет стремиться к нулю равномерно по А. Следовательно, такой двусторонний критерий является также асимптотически РНМ критерием.

Рассмотрим теперь для этих критериев отношение ошибок второго рода. Из (25.1) и (25.2) имеем

Когда числитель и знаменатель в стремятся к нулю. По правилу Лопиталя (обозначая штрихом дифференцирование по и буквой нормальную находим

Из (25.7) следует, что о вместе с и, и поэтому второе слагаемое в правой части (25.9) стремится к нулю. Кроме того, из (25.7) следует, что первое слагаемое в правой части (25.9) будет стремиться к бесконечности, если предел

равен бесконечности. Согласно (25.7) первое слагаемое в экспоненте в правой части (25.10) стремится к нулю. Если положить

то соотношение (25.7) будет выполняться, а (25.10) будет иметь своим пределом по бесконечность. Таким образом, отношение ошибок второго рода (25.8) стремится к бесконечности вместе с хотя оба критерия являются асимптотически РНМ. Отсюда видно, что это асимптотическое свойство критериев оказывается не очень избирательным.

<< Предыдущий параграф Следующий параграф >>
Оглавление