Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Формулировка альтернативных гипотез

30.40 Выбор порядка системы альтернатив (и числа параметров, которыми выражается отклонение от должен быть сделан до построения критерия. Ясно, что мы не хотим иметь больше параметров, чем требуется для интересующих нас альтернатив, так как они будут «разжижать» критерий. К сожалению, при проверке согласия часто не имеют в виду достаточно определенных альтернатив. Это очень реальная трудность, которую можно сравнить с выбором числа классов в -критерии. В последнем случае мы нашли, что этот выбор может производиться в зависимости лишь от объема выборки и размера критерия; для нашей нынешней же ситуации еще не имеется достаточно ясного руководства.

30.41 В первой из серии статей Бартона (1953, 1955, 1956), на работах которого базируются следующие разделы, рассматривалась несколько иная общая система альтернатив. Вместо (30.76) он определяет

где, как и прежде, Константа теперь не нужна, так как

поскольку ортогональны. Однако теперь надо обеспечить, чтобы (30.84) было неотрицательно на интервале и это накладывает ограничение на возможные значения Таким образом, например, при выражение для

даваемое (30.75), показывает, что мы должны ограничить 9] условием

Теперь, если мы положим то получим множество альтернатив, приближающихся к при Более того, при мы имеем

так что асимптотическое распределение при альтернативах (30.76) будет применимо для (30.84) с Для того чтобы получить асимптотическое нецентральное -распределение статистики в котором параметр нецентральности равен теперь нам пришлось заставить стремиться к при Это в точности то же самое, что мы делали в 30.27, чтобы получить соответствующий результат для критерия

30.42 Если мы имеем в виду конкретное альтернативное распределение мы можем представить его через распределение класса (30.84) следующим образом. Выберем параметры в (30.84) так, чтобы минимизировать интеграл

Дифференцируя по находим необходимые условия минимума

и, пользуясь ортогональностью получаем отсюда

Пользуясь еще раз ортогональностью, получаем минимальное значение (30.86) равным, как в обычной теории наименьших квадратов,

Величина неотрицательна по определению. Рассматриваемая как функция от она не возрастает, и так как от зависит только то при Следовательно, при подборе модели (30.84) для мы должны основываться на степени приближения параметра к своей верхней границе Этот интеграл выражен в терминах величины, полученной в результате вероятностного интегрального преобразования, и часто бывает удобнее оценивать его в терминах альтернативного распределения первоначальной величины х. Назовем его Мы имеем тогда, поскольку

Пример 30.5

Рассмотрим нормальное распределение

. Пользуясь (30.89), имеем

Таким образом, мы должны сравнивать с

Из

Вследствие того, что четных являются четными функциями (см. также четна относительно значения 1/2 при нашей симметричной альтернативе, мы имеем

При нечетных мы должны вычислять отдельно каждый член. Пользуясь (30.75), находим

и

средняя разность Джини (см. упражнение 2.9), равная в нормальном случае (см. 10.14), так что

Таким образом, при малом отклонении параметра величина изменится на если мы применяем критерий мы видим из формулы (30.90), что будет лишь немногим меньше ее правой части, и потеря эффективности при проверке отклонения среднего от нуля в нормальном распределении будет мала. Это легко подтвердить следующим образом. Согласно имеет асимптотически нецентральное распределение с 1 степенью свободы и параметром нецентральности эквивалентным нормированному нормальному отклонению Наилучший критерий, основанный на выборке, использует нормальное отклонение Множитель

мало влияет на мощность при больших выборках.

Преимущество критериев продемонстрированное здесь, состоит в том, что при заданной альтернативе мы можем выбирать так, чтобы получить более высокую мощность, чем с критерием

30.43 Начиная с 30.37, мы ограничивались простой гипотезой и негруппированными наблюдениями. Теперь мы перейдем к обсуждению группировки данных в критериях очень нужно для практики ввиду необходимости производить вероятностное интегральное преобразование над каждым наблюдением) и распространения критериев на сложные гипотезы, что, может быть, еще более важно. Эти вопросы составляют основное содержание второй и третьей работ Бартона (1953, 1955, 1956). Замечателен тот факт, что, как только произведено группирование, обнаруживается близкая взаимосвязь между критериями и критерием

Предположим, что область значений варианты х разбита на классов, и пусть — медиана по величине группы, считая снизу. Очевидным аналогом (30.73) тогда служит

где как и раньше, — гипотетические вероятности. Мы заменяем все одного класса значением и пишем, как раньше Нам теперь требуется набор ортогональных полиномов которые будут играть ту же роль для группированных данных, что и нормированные полиномы Лежандра для негруппированных. Ввиду того, что альтернативная гипотеза может быть теперь сформулирована в терминах переменной х как

мы после группировки по классам получаем выражение для вероятностей при альтернативе через гипотетические вероятности:

Естественно поэтому задать соотношениями

Тогда (30.80) (с заменой на вследствие (30.91) принимает вид

что ввиду (30.93) равно

Здесь суммируются квадраты взвешенных сумм величин с весами Вследствие свойства ортогональности (30.94) мы имеем

или, ввиду (30.8), в точности

30.44 Так же как совпадает вследствие (30.95) с критерии низших порядков как мы теперь увидим, являются компонентами или разбиениями т. е. определенного вида функциями от асимптотически нормированных нормальных величин

которые мы теперь рассмотрим. Если обозначить

и последним столбцом матрицы взять

то получим тождественно

а если выбрать остальные элементы матрицы так, чтобы она была ортогональна, т. е.

то также будут асимптотически нормированными нормальными величинами и, вследствие ортогональности, асимптотически независимыми. Поэтому сумма квадратов любых из будет распределена так же, как степенями свободы, и не будет зависеть от любой суммы, основанной на других Мы вернемся к задачам, связанным с разбиениями в определенном контексте главы 33.

С этой точки зрения достоинство критериев с группированными данными состоит в подборе подходящих функций от для получения критерия с наибольшей мощностью; они выделяют важнейшие компоненты

30.45 Имея в виду замечания в 30.44, мы не будем удивлены тем, что при переходе к сложным гипотезам теория группированных критериев близко напоминает теорию критерия которая уже обсуждалась в Как показал Бартон (см. Ватсон (1959)), переносятся все принципиальные результаты: если используются мультиномиальные МП-оценки, то число степеней свободы уменьшается на количество оцениваемых параметров; если способ группирования определяется по наблюдениям, то это не вносит изменений (при условиях регулярности) в асимптотические распределения.

Главная проблема при применении критериев к сложным гипотезам — это выбор Как мы отмечали в случае простой гипотезы, при проверке согласия часто не имеют в виду определенной альтернативы, — в противном случае лучше было бы применить по возможности более специфический критерий. Ввиду того, что большие выборки часто используются при проверке согласия, так что группирование наблюдений является практической необходимостью, совпадение группированного критерия с критерием означает, что помимо задач о разбиениях, общих для обоих типов критериев, между этими критериями нет конкуренции.

<< Предыдущий параграф Следующий параграф >>
Оглавление