Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Корреляционные отношения и линейность регрессии

26.21 В 26.8 обсуждался вопрос подгонки прямых к линиям регрессии, когда последние не являются строго линейными. Можно получить дальнейшие результаты о линейности регрессии. Рассмотрим вначале случай строго линейной регрессии х по у, когда выполняется (26.12). Возводя (26.12) в квадрат и беря математические ожидания относительно у, получаем

Определим теперь корреляционное отношение х по положив

что является отношением дисперсии средних значений х-сечений к дисперсии величины х. В отличие от функция очевидно, несимметрична относительно х и у. Из (26.40) следует, что величина инвариантна относительно перестановки х-сечений, поскольку не зависит от того, в каком порядке берутся значения В этом состоит ее существенное отличие от коэффициента который чувствителен к любому изменению порядка сечений.

Из (26.39) видно, что если регрессия строго линейна, то

Рассмотрим теперь общий случай, в котором регрессия может не быть строго линейной. Имеем

так как слагаемое с удвоенным произведением равно нулю:

Таким образом, из (26.40) и (26.41) вытекает, что

тогда и только тогда, когда т.е. когда каждое наблюдение лежит на кривой регрессии и, следовательно, х а у связаны строго функционально. Далее,

По неравенству Коши — Буняковского

и равенство выполняется тогда и только тогда, когда величина пропорциональна т. е. если является строго линейной функцией от у. Таким образом, согласно (26.43) и (26.44)

где равенство выполняется только в случае строго линейной регрессии х по у. Следовательно, из (26.42), (26.45) и (26.18) получаем окончательно неравенства

Можно следующим образом резюмировать наши результаты о неравенствах (26.46), приведенные в и в этом пункте:

(а) , если х и у независимы, но обратное неверно;

(б) тогда и только тогда когда имеется строгая линейная функциональная зависимость х от у;

(в) тогда и только тогда, когда имеется строгая нелинейная функциональная зависимость от

(г) тогда и только тогда, когда регрессия х по у строго линейна, но нет функциональной зависимости;

д) указывает на то, что не существует функциональной зависимости и некоторая нелинейная кривая регрессии «подходит» лучше, чем «наилучшая» прямая линия, так как из (26.20) и (26.40) следует, что т. е. средние сечений более разбросаны, чем значения, даваемые наиболее подходящей линейной регрессией. (Конечно, может не существовать лучше подходящей простой регрессионной кривой.)

Поскольку величина не учитывает порядка х-сечений, то она не является мерой ни для какого конкретного типа зависимости х от у, но значение величины служит индикатором нелинейности регрессии; важно подчеркнуть, что именно индикатором, а не мерой. Для того чтобы судить о ее значимости, нужно учитывать также и число сечений (вместе с числом наблюдений). Этот вопрос будет обсуждаться в 26.24.

26.22 В случае регрессии у по х определим аналогично предыдущему корреляционное отношение

где снова

Так как тогда и только тогда, когда имеется строгая функциональная зависимость, то равенство влечет и наоборот. Квадраты корреляционных отношений всегда превосходят но если регрессия х по у линейна, а у поде нелинейна, то мы будем иметь как это показано в следующем примере.

Пример 26.8

Рассмотрим снова ситуацию из примера 26.6. Регрессия х по там была линейной с коэффициентом регрессии 0, так что корреляция между тоже равна нулю. Мы нашли, что откуда следует равенство Поэтому корреляционное отношение х по равно 0, как и должно быть, поскольку коэффициент корреляции равен нулю и регрессия линейна.

Регрессия же по х нелинейна: в примере 26.3 было найдено, что

Следовательно,

Таким образом, корреляционное отношение по х есть что всегда (когда превосходит коэффициент корреляции между который равен нулю.

Если нужно вычислить корреляционные отношения по выборочным данным, то, подставляя выборочные дисперсии и дисперсии средних значений сечений в (26.40) и (26.41), получим выборочное корреляционное отношение х по

где среднее значение -сечения, число наблюдений в этом сечении, количество сечений. Аналогичное выражение имеет место для выборочного корреляционного отношения у по х. Как и в случае генеральных коэффициентов, имеем

Пример 26.9. Вычисление корреляционного отношения

Вычислим корреляционное отношение у по х для данных таблицы 26.1, которые теперь будем рассматривать как выборку. Вычисления приведены в таблице 26.4.

В примере 26.6 было найдено, что среднее значение у равно а дисперсия у равна 507,46. Таким образом, из (26.48) находим корреляционное отношение у по х:

Это значение ненамного превосходит квадрат коэффициента

Таблица 26.4 (см. скан)

корреляции

Рисунок 26.1 показывает, что линейная аппроксимация регрессии действительно хорошая.

<< Предыдущий параграф Следующий параграф >>
Оглавление