Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Выбор k в критерии с равными вероятностями

30.28 Манном и Вальдом (1942) был получен следующий результат относительно выбора Пусть для проверки простой гипотезы (30.1) с непрерывной по выборке объема применяется критерий равновероятными классами. Обозначим минимум мощности критерия против класса альтернативных ф. р.

Для данных и А функция достигает максимального значения, скажем при некотором Выберем так, чтобы значение равнялось заданному для определенности принимается Оптимальным считается число классов число k, доставляющее максимум функции при таком для которого этот максимум равен 1/2. Пусть стандартная нормальная решение уравнения Теорема Манна и Вальда утверждает, что при

Доказательство проводится по следующей схеме. Можно считать, что при (равномерное распределение на (0, 1)), а все альтернативные распределения также сосредоточены на (см. 30.36). Если наблюдениям соответствует то имеет приближенно нецентральное -распределение с степенями свободы и параметром нецентральности

(см. (30.62)), где При этом (см. (24.19))

Оптимальное должно возрастать с ростом и тогда статистика асимптотически нормальна с параметрами (30.65). Поэтому мощность критерия равна приближенно

Нетрудно проверить, что таким образом, для нахождения нужно найти ф. р. из , которой соответствует наименьшее Рассмотрим эквивалентную задачу: при фиксированном X найти для которой Поскольку X определяется только значениями рассмотрим сначала

Пусть для простоты к четно. Тогда (30.67) достигает максимума при условиях

когда равны, скажем, при и равны при Согласно в дальнейшем для определенности будем считать, что Это означает, что разность с ростом возрастает линейно при до значения и затем линейно убывает до нуля при Теперь, не меняя значений можно добиться наибольшего отклонения от х, если положить при

Тогда достигается при и равен Отсюда находим, что и

Для нахождения нужно максимизировать по 6 аргумент функции в (30.68); это асимптотически эквивалентно максимизации его числителя. Дифференцируя по 6, получаем

Кроме того, условие дает

Из (30.69) и (30.70), пренебрегая различием между 6 и 6—1, получаем (30.63). При произвольном можно аналогичным образом получить из (30.68) и (30.69), что

Следует заметить, что результат Манна и Вальда получен из условия максимизации мощности против самых неблагоприятных альтернатив при заданном расхождении функций распределения. Если же иметь ввиду только достаточно «гладкие»

альтернативы, то оптимальное число будет значительно меньше. Качественно это можно объяснить следующим образом. Пусть распределения при задаются плотностями и соответственно, причем .

Тогда (как и в 30.27) где есть класс-интервал. Параметр нецентральности (30.62) будем обозначать По неравенству Коши — Буняковского имеем

и, следовательно, Предполагая последний интеграл конечным, нетрудно показать, что если и все Пусть мощность критерия классами, когда параметр нецентральности равен -Когда невелико, нормальная аппроксимация, дающая (30.67), недействительна, но характер поведения остается тем же: возрастает по и убывает по Поэтому будучи ограничена сверху функцией достигает максимума при некотором к, зависящем от скорости приближения (и не зависящем от Эта скорость определяется гладкостью функции и при достаточно гладких альтернативах максимум может достигаться при небольших Ниже приводятся данные из примеров 30.3, 30.4, дополненные результатами вычислений для и 5, которые показывают, что оптимальное значение в этом случае равно 3 (или ввиду возможных погрешностей вычислений и -аппроксимации при

(см. скан)

Эти данные показывают также быстрое приближение поскольку здесь (нарушение неравенства в данном случае объясняется ошибками округления при вычислениях в примере 30.4). По-видимому, этот пример представляет крайний случай малости оптимального но он показывает, что для представляющих обычно

интерес альтернатив теорема Манна и Вальда дает сильно завышенное значение k.

30.29 Мы заключаем, что к в случае равных вероятностей следует увеличивать пропорционально и что к должно быть меньше, когда нас интересует область большой мощности (когда велико), чем когда нас интересует область малых значений мощности.

Формула (30.63) приводит к значениям к, гораздо большим, чем применяемые обычно. При увеличении в раз к удваивается. Когда при при эти значения близки к наименьшим значениям при которых вообще допустима нормальная аппроксимация, применяемая в наших рассуждениях (а также у Манна и Вальда). В этом случае Манн и Вальд рекомендуют использовать (30.63), когда при и когда при Можно видеть, что гипотетическая ожидаемая частота каждого класса, равная возрастает, как и равна примерно 6 и 8 соответственно, когда

Уилльямс (1950) сообщает, что оптимальное значение Манна и Вальда может быть уменьшено вдвое без серьезной потери мощности в точке 0,50. Но следует помнить, что пик должны быть достаточно большими, чтобы (30.63) давало хорошие результаты. Пример 30.4 иллюстрирует это положение, которое подтверждается также вычислениями, проделанными Хэмдэном (1963) для критериев среднего значения в нормальном распределении.

Пример 30.4

Рассмотрим снова задачу примера 30.3. Мы получили там для мощности значение, близкое к 0,8. Из таблицы нормального распределения При формула (30.72) дает для оптимального значения к вблизи этой точки значение

При это дает приблизительно

Предположим теперь, что мы пользуемся таблицами Biometrika Tables для построения группировки по 15 классам с

вероятностями приближенно равными между собой настолько, насколько это удобно. Мы находим:

(см. скан)

Здесь и таблица Патнайка дает мощность 0,64 при 14 степенях свободы. Снова увеличилось, но мощность уменьшилась из-за увеличения Мы не получили здесь оптимума. При большом (и, следовательно, большом увеличение не подавило бы таким образом эффект увеличения .

30.30 Мы не должны брать слишком большим, поскольку мультиномиальное распределение не может хорошо аппроксимироваться многомерным нормальным, когда очень малы. Грубое правило, которым обычно пользуются, состоит в том, что ожидаемые частоты должны быть не меньше 5. Для этого правила, по-видимому, нет общих теоретических оснований, и относительно него стоит сделать следующие два замечания. Если распределение при унимодально и обычным образом используются классы одинакового размера, то малые ожидаемые частоты возникают только на «хвостах». Кокрэн (1952, 1954) рекомендует принять гибкий подход; он проверил, что для одной или двух ожидаемых частот допустимо уменьшение до 1 и даже ниже, если имеет по крайней мере 6 степеней свободы, без ущерба для критерия с или 0,01.

В случае равных вероятностей все ожидаемые частоты будут равны. Слэктер (1966) показал, что даже для равных ожидаемых частот, меньших единицы, аппроксимация остается хорошей. Процедура Манна — Вальда из 30.29 ведет к ожидаемым частотам, всегда большим, чем 5, при Интересно отметить, что в примерах 30.3, 30.4 применение этого ограничения исключило бы процедуру с 15 классами и была бы приемлема более мощная процедура с 8 классами, при которой ожидаемые частоты имеют значения от 5 до 7.

Гёфдинг (1965) показал, что если при проверке простой гипотезы Но (случай сложной гипотезы менее ясен) к остается фиксированным, тогда

как подходящим образом при то критерий отношения правдоподобия будет более мощным, чем -критерий. Этот результат не выполняется, если возрастает с например, как в (30.72) в случае равных вероятностей.

Отметим, что асимптотический характер теории распределения не является недостатком в практических применениях, поскольку мы обычно не занимаемся проверкой согласия, не имея большой выборки.

<< Предыдущий параграф Следующий параграф >>
Оглавление