Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Общая линейная гипотеза и ее каноническая форма

24.25 Теперь мы в состоянии рассмотреть задачу проверки гипотез для общей линейной модели из главы 19. Как и в (19.8), положим

где некоррелированы, имеют нулевые средние и одинаковые дисперсии Не будем пока делать дальнейших предположений о виде их распределений.

Предположим, что матрица невырождена (если это не так, то, как и в ее можно сделать невырожденный с помощью пополнения).

Пусть мы хотим проверить гипотезу

где известные -матрица и -вектор. Гипотеза (24.86) накладывает ограничений, которые будем считать функционально независимыми, так что ранг матрицы А равен Гипотеза будет просто отрицанием Когда матрица невырождена и гипотеза (24.86) эквивалентна Если А состоит из первых строк -матрицы X, то гипотеза имеет особенно простой смысл: это гипотеза о средних значениях первых из величин . Рассмотрим -вектор

где С — матрица а -оценка наименьших квадратов (НК-оценка) для 0, полученная в (19.12). Тогда из (24.87) и (24.85) имеем

так что

а матрица рассеяния вектора как и в 19.6, равна

Выберем теперь С так, чтобы компоненты вектора z были некоррелированы, т. е. чтобы

В силу (24.89) для этого нужно, чтобы

или, в случае невырожденной матрицы чтобы

Равенство (24.90) является условием некоррелированности величин из (24.90), (24.87) и (24.88) следует, что

24.26 Положим теперь

где есть -матрица из (24.86), некоторая -матрица и F есть -матрица, удовлетворяющая уравнению

Поскольку ранг матрицы А равен то можно выбрать так, чтобы -матрица была невырожденной и, таким образом, матрица С имела бы ранг Тогда ранг матрицы СС тоже равен следовательно, она невырождена, как это требовалось выше, в (24.90).

Из (24.88) находим

Следовательно, средние значения первых величин совпадают с левой частью (24.86); поэтому проверка гипотезы эквивалентна проверке

— сложной гипотезы, накладывающей ограничений на параметры. Так как согласно (24.92) последние значений равны нулю, то параметров отличны от нуля, так что всего вместе с имеется параметров.

24.27 Таким образом, мы привели задачу к следующему виду. Дано множество из взаимно некоррелированных величин с равными дисперсиями причем величин имеют нулевые средние, а у остальных средние отличны от нуля. Гипотеза состоит в том, что из этих величин имеют заданные средние. Это так называемая каноническая форма общей линейной гипотезы.

Чтобы двигаться дальше, нам нужно сделать предположения о распределении ошибок в линейной модели (24.85). Будем считать, что каждая из величин распределена нормально, а вследствие их некоррелированности они независимы. Величины

являясь линейными функциями от них и будучи некоррелированными, также независимы и нормально распределены. Следовательно, из их совместного распределения находим ФП

где индексы у векторов указывают их размерность. Наша гипотеза есть

представляет собой ее отрицание.

В примере 23.14 мы видели, что если имеется только одно ограничение то существует РНМН критерий для гипотезы Но против Это очевидно также из того факта, то в данном случае проверяется гипотеза о среднем одномерной нормальной совокупности с неизвестной дисперсией: РНМН критерием для этой гипотезы (как видно из примера 23.14) служит обычный -критерий Стьюдента с равными «хвостами».

Колоджейчик (1935), которому принадлежат первые общие результаты о линейных гипотезах, доказал отсутствие РНМ критерия в ситуации с более чем одним ограничением и показал, что имеется пара подобных односторонних РНМ критериев, когда это односторонние -критерии Стьюдента (см. упражнение 23.7). Только что было указано на существование двустороннего -критерия Стьюдента, являющегося РНМН в случае но критическая область этого критерия зависит от того, о каком из проверяется гипотеза. Таким образом, при нет общей РНМН критической области.

Так как нельзя найти «оптимального» в каком-либо смысле критерия, то мы обратимся к методу ОП, позволяющему получить интуитивно разумный критерий.

24.28 Вывод статистики ОП достаточно прост. Безусловный максимум выражения (24.95) определяется с помощью решения системы уравнений

Это дает МП-оценки

откуда

Итак, находим безусловный максимум ФП

Когда выполняется гипотеза (24.96), имеем МП-оценки для мешающих параметров

откуда

так что условный максимум ФП равен

Из соотношений (24.97) и (24.98) находим статистику

где

Заметим, что значения являются минимумами по функции при гипотезах соответственно. Согласно (24.91) это то же самое, что минимумы функции

относительно 0. Тождество по

легко проверить непосредственно. При этом слагаемое справа

не зависит от в. Минимизация функции по эквивалентна, таким образом, минимизации функции Но процесс минимизации 5 относительно есть в точности способ, с помощью которого мы пришли к оценкам наименьших квадратов в 19.4. Следовательно, для получения в соотношении (24.100) мы минимизируем функцию в исходной модели при гипотезах соответственно.

Поскольку есть монотонно убывающая функция от то критерий ОП эквивалентен тому, чтобы отвергать гипотезу когда значение велико. Если разделить числитель и знаменатель величины на то при гипотезе превращается в отношение суммы квадратов независимых нормальных величин к независимой сумме квадратов таких же величин, т. е. является отношением двух независимых -величин с степенями свободы. Итак, когда выполняется гипотеза статистика распределена, как дисперсионное отношение с степенями свободы (см. 16.15), и критерий ОП формулируется в терминах величины причем критическая область образована ее большими значениями.

Многие стандартные статистические критерии могут быть сведены к критериям для линейных гипотез, и мы часто будем встречаться с ними в последующих главах.

Пример 24.8

Как специальный, особенно важный, случай рассмотрим гипотезу

где - есть -подвектор вектора в (24.85). Мы можем, следовательно, переписать соотношение (24.85) в виде

где матрицы порядка () соответственно. Тогда гипотеза эквивалентна предположению, что

Согласно 24.28 мы ищем минимумы функции Так как и при Но и при оцениваются все параметры некоторой линейной модели, то можно воспользоваться результатом из 19.9. Мы получаем, что минимум при гипотезе равен

тогда как при он равен

где Статистика

распределена, как дисперсионное отношение с степенями свободы, и критическая область для образована процентами наибольших значений величины

24.29 В 24.28 мы видели, что критерий ОП основан на статистике (24.100), которую можно переписать в виде

Независимо от того, верна гипотеза Но или нет, знаменатель величины имеет -распределение с степенями свободы. Когда Но выполняется, то, как мы видели, числитель является также -величиной с степенями свободы. Если же не выполняется, то последнее утверждение неверно. В действительности числитель будет всегда нецентральной -величиной (см. 24.4) с степенями свободы и параметром нецентральности

где истинное среднее величины Только когда имеет место гипотеза равно нулю, и получается центральное -распределение, как в 24.28. Так как для нахождения мощности критерия ОП нам требуется распределение величины (или эквивалентной ей величины когда Но не выполнена, то мы приходим к необходимости изучения отношения нецентральной -величины к центральной.

<< Предыдущий параграф Следующий параграф >>
Оглавление