Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Влияние ошибок наблюдения на регрессионный анализ

29.56 Нам кажется уместным завершить эту главу кратким рассмотрением вопроса о влиянии ошибок наблюдения на результаты регрессионного анализа. Предположим, что случайные величины х и у измеряются с ошибками, так что в действительности мы наблюдаем величины

Как и раньше, предположим, что ошибки независимы между собой и независимы друг от друга. Возникает следующий вопрос. Пусть мы нашли регрессию по как она связана с регрессией у по х, которая, собственно, нас и интересует?

Из 29.28 следует, что смешанные семиинварианты совпадают с соответствующими семиинвариантами х и у. В частности, Однако коэффициенты регрессии зависят также от дисперсий, которые не остаются неизменными. Уравнение линейной регрессии

заменяется уравнением

Поскольку то влияние ошибок выражается в уменьшении наклона линии регрессии. Кроме того, уменьшается корреляция между по сравнению с корреляцией между х и у.

29.57 Влияние ошибок, однако, не исчерпывается уменьшением указанных коэффициентов. Предположим, что истинная регрессия у по х в точности линейна и ошибки однородны (см. 28.7). Следует ли отсюда, что регрессия по тоже в точности линейна? В общем случае ответ оказывается отрицательным, и только при некоторых довольно сильных условиях линейность сохраняется. Мы докажем одну изящно формулируемую теорему Линдли (1947): для сохранения линейности регрессии необходимо и достаточно, чтобы п. ф. с. случайной величины х была кратна п. ф. с. ошибки Более точно, между должно выполняться соотношение

В 28.7 было показано, что необходимым и достаточным условием точной линейности регрессии у по х вида с однородными ошибками служит возможность следующего представления совместной плотности х и у:

где -маргинальное распределение х, или эквивалентное условие в терминах

Мы знаем (28.5), что если — совместная и и регрессия по точная линейная регрессия вида то

Однако если независимы между собой и, кроме того, не зависят от х и у, то выполняется соотношение

Подставляя (29.143) и (29.141) в (29.142), получаем

Приравнивая коэффициенты при в (29.144), находим

Интегрируя (29.145) и учитывая, что приходим к (29.139).

Из (29.144) также получаем

где обозначают соответствующие средние. В частности, если имеют нулевые средние, то

Этим завершается доказательство необходимости (29.139). Доказательство достаточности не вызывает затруднений.

29.58 Если предположить, что и ошибки в регрессии по однородны, то можно получить гораздо более сильный результат (Кендалл, 1951, 1952). Действительно, в этом случае для выполняется как (29.143), так и (29.141). Ставя штрихи в (29.141), получим

Подставляя из (29.141) в (29.148), получаем

Полагая в и вычитая полученное уравнение из (29.149), находим

Придавая семиинвариантам верхние индексы из (29.150). получаем

Рассмотрим теперь член порядка скажем порядка Приравнивая коэффициенты, имеем

Второе и третье соотношения могут выполняться, только если или и обращаются в нуль. Отсюда следует, что обращаются в нуль все семиинварианты третьего порядка и, аналогично, семиинварианты более высоких порядков. Обратное также верно. Таким образом, точная линейная регрессия с однородными ошибками превращается в точную линейную регрессию с однородными ошибками тогда и только тогда, когда распределены нормально.

29.59 Имеются также другие теоремы, относящиеся к этому вопросу. По-видимому, первый результат был получен Аллен (1938), которая при довольно ограничительных предположениях доказала, что если

то нормальность является необходимым и достаточным условием для точной линейности регрессии по для всех I из замкнутого интервала. Некоторые из ее условий были ослаблены Фикс (1949а), которая требовала только конечности средних и конечности дисперсии х или Результаты Фикс

были затем обобщены Лахой (1956) на случай зависимых ошибок и 8.

Линдли (1947) доказал результат более общий, чем (29.139) (см. упражнения 29.12, 29.14). Результат 29.58 также может быть обобщен на случай нескольких переменных (см. упражнение 29.13).

УПРАЖНЕНИЯ

(см. скан)

(см. скан)

(см. скан)

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление