Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Проверка гипотез о корреляционных отношениях и о линейности регрессии

26.23 В 26.21 мы видели, что равенство указывает на то, что для регрессии нельзя найти лучшей кривой, чем прямая линия, а следовательно, положительное значение величины является индикатором нелинейности регрессии. Теперь, когда определены выборочные корреляционные отношения естественно задать вопрос: можно ли с помощью статистики построить критерий для проверки линейности регрессии х по При этом мы получим также критерий для проверки гипотезы о том, что , и установим связь между этими критериями и критерием для гипотезы приведенным в (26.37). Эти задачи впервые были решены Р. А. Фишером. Согласно (26.49) в правой части тождества

все члены положительны. Так как

то (26.50) можно переписать в виде

Выражение (26.51) представляет собой разложение квадратичной формы от на три других таких же формы. Предположим теперь, что фиксированы, а все величины не зависят одна от другой и распределены нормально с одинаковыми дисперсиями (без потери общности будем считать их равными единице). Вопрос о средних значениях временно оставим открытым.

Если выполняется гипотеза о том, что все имеют одинаковые средние, т. е. что кривая регрессии представляет собой прямую, параллельную оси у, то левая часть (26.51), как известно, подчиняется хи-квадрат распределению с степенями свободы. Доказательство того, что ранги квадратичных форм в правой части (26.51) равны соответственно проводится непосредственно, хотя оно и громоздко. Так как эти ранги в сумме дают то из теоремы Кокрэна (15.16) вытекает, что три слагаемых справа независимы и имеют хи-квадрат распределения с такими же числами степеней свободы, каковы их ранги. Согласно 16.15 отношение любых двух из них (деленных на их ранги) подчиняется -распределению с соответствующими степенями свободы. Этот факт может быть использован двояко для проверки гипотезы .

(а) Отношение первого слагаемого, деленного на его ранг, к сумме второго и третьего, тоже деленной на ее ранг,

где индексы указывают число степеней свободы.

Как можно заметить, это эквивалентно критерию (26.37), поскольку согласно 16.15. Это утверждение было получено в 16.28 для двумерного нормального распределения. Здесь мы считаем игреки фиксированными, а распределения внутри каждого х-течения нормальными.

(б) Отношение суммы первого и второго слагаемых, деленной на ее ранг, к третьему, тоже деленному на его ранг,

Для обоих критериев большие значения статистики критерия ведут к отклонению

Критерии, основанные на (26.52) и (26.53), совершенно различны, и оба имеют силу для но (26.52), по существу,

проверяет гипотезу тогда как (26.53) — гипотезу Если альтернативная гипотеза состоит в том, что регрессия х по у линейна, то критерий (26.52) будет иметь большую мощность. Если же альтернативная гипотеза утверждает, что регрессия может быть любой формы, отличной от указанной в то (26.53), очевидно, является более мощным. На практике почти всегда используется (26.52) в форме линейного регрессионного критерия (26.20), но существуют определенные ситуации, в которых более применим критерий, основанный на (26.53). Эти критерии мы обсудим ниже, в 26.24, но сначала рассмотрим критерий линейности регрессии.

26.24 Если не все имеют одинаковые средние, то левая часть в (26.51) уже не подчиняется распределению Однако если мы перенесем первое слагаемое справа в левую часть, то получим

Поскольку

есть сумма квадратов уклонений от «подогнанной» линейной регрессии, то при гипотезе о том, что регрессия х по у строго линейна, и при нормальных, как и прежде, распределениях внутри сечений величина имеет хи-квадрат распределение степенями свободы (при определении каждого из параметров линии регрессии теряется по одной степени свободы (см. 19.9)). Ранги квадратичных форм в правой части (26.54) равны по-прежнему к). Следовательно, эти формы независимы и подчинены хи-квадрат распределениям с теми же числами степеней свободы. Таким образом, их отношение, после деления на соответствующие ранги,

Выражение (26.55) может быть использовано для проверки гипотезы Но о линейности регрессии; отвергается при больших значениях статистики критерия. Снова мы не делали никаких предположений о величинах

Итак, наши интуитивные соображения о том, что с помощью можно проверять линейность регрессии, оказались верными. Но (26.55) показывает, что статистика критерия зависит от так что одной величины недостаточно.

Все три критерия, которые мы обсуждали здесь и в предыдущем пункте, являются критериями ОП линейных гипотез

вида, рассмотренного во второй части главы 24. Например, гипотеза о том, что все величины имеют одинаковые средние, допускает две интерпретации. Можно считать, что средние лежат на прямой линии, определяемой двумя параметрами, и проверять гипотезу о том, что эта линия имеет нулевой наклон. Последняя гипотеза содержит одно ограничение на два параметра. В обозначениях пунктов так что мы получаем F-критерий с степенями свободы: это критерий (26.52). С другой стороны, можно считать, что средние значения сечений лежат на -параметрической кривой (например, на кривой, определяемой полиномом степени и проверять гипотезу о том, что все коэффициенты полинома, кроме константы, равны нулю (гипотеза содержит ограничений). Тогда мы получаем F-критерий с степенями свободы: это критерий (26.53). Наконец, если во второй формулировке проверять гипотезу о том, что все коэффициенты полинома, кроме константы и коэффициента при линейном члене, равны нулю (так что средние значения сечений лежат на прямой линии), то мы наложим ограничений и получим F-критерий с степенями свободы: это уже критерий (26.55).

Следовательно, для фиксированных значений результаты главы 24, касающиеся мощности критерия ОП, основанного на нецентральном F-распределении, применимы и к этим критериям, которые согласно 24.37 являются РНМ инвариантными критериями. Однако в двумерном нормальном случае, где не фиксированы, получающиеся распределения не будут совпадать с распределениями для фиксированных, как выше, за исключением случая справедливости проверяемой гипотезы, когда изменение является несущественным (как будет показано в 27.29). Например, распределение величины полученное из нецентрального F-распределения для (26.52), не совпадает с результатом, получаемым из (16.61) или (16.66) в случае двумерной нормальности. Следовательно, функции мощности критерия для в этих двух случаях различны, хотя один и тот же критерий применим в обоих случаях. Однако для больших результаты совпадают. В 27.29 и 27.31 мы обсудим это в более общей ситуации в связи с множественным коэффициентом корреляции есть частный случай последнего).

<< Предыдущий параграф Следующий параграф >>
Оглавление