Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Влияние ошибок наблюдения на регрессионный анализ

29.56 Нам кажется уместным завершить эту главу кратким рассмотрением вопроса о влиянии ошибок наблюдения на результаты регрессионного анализа. Предположим, что случайные величины измеряются с ошибками, так что в действительности мы наблюдаем величины

Как и раньше, предположим, что ошибки независимы между собой и независимы друг от друга. Возникает следующий вопрос. Пусть мы нашли регрессию по как она связана с регрессией у по х, которая, собственно, нас и интересует?

Из 29.28 следует, что смешанные семиинварианты совпадают с соответствующими семиинвариантами х и у. В частности, Однако коэффициенты регрессий зависят также от дисперсий, которые не остаются неизменными. Уравнение линейной регрессии

заменяется уравнением

Поскольку то влияние ошибок выражается в уменьшении наклона линии регрессии. Кроме того, уменьшается корреляция между по сравнению с корреляцией между х и у.

29.57 Влияние ошибок, однако, не исчерпывается уменьшением указанных коэффициентов. Предположим, что истинная регрессия у по х в точности линейна и ошибки однородны (см. 28.7). Следует ли отсюда, что регрессия по тоже в точности линейна? В общем случае ответ оказывается отрицательным, и только при некоторых довольно сильных условиях линейность сохраняется. Мы докажем одну изящно формулируемую теорему Линдли (1947): для сохранения линейности регрессии необходимо и достаточно, чтобы п. ф. с. случайной величины х была кратна п. ф. с. ошибки Более точно, между должно выполняться соотношение

В 28.7 было показано, что необходимым и достаточным условием точной линейности регрессии у по х вида с однородными ошибками служит возможность следующего представления совместной плотности х и у.

Полагая получаем

где контролируемые значения фиксированы. Допустим, что для одного и того же набора значений наблюдения повторяются. Обозначим соответствующее математическое ожидание. Суммируя (29.137) по всем наблюдениям, получаем

Беря затем математические ожидания, находим

Аналогично, умножая (29.137) на и суммируя, получаем систему уравнений

и т. д. Эти уравнения могут быть разрешены относительно величин

Интересно, что, хотя идентифицируемы, не являются таковыми, если не известна дисперсия или ее оценка. По-видимому, единственный способ обойти эту трудность состоит в повторении эксперимента при том же наборе значений Более полное изложение этого вопроса содержится в статьях Гири (1953) и Шеффе (1958).

29.55 Иногда нелинейное соотношение с помощью преобразования можно свести к линейному. Рассмотрим, например, функциональное соотношение

Здесь, очевидно, следует воспользоваться логарифмическим преобразованием. Однако эта процедура может иметь и нежелательные свойства. Так, если ошибки нормально распределены и гомоскедастичны, то ошибки преобразованных величин уже не будут обладать этими свойствами. Поэтому в данном случае, как, впрочем, и в любом другом, следует попытаться получить возможно больше априорной информации относительно ошибок наблюдений, а когда ошибки значительны и распределение их неизвестно, надо использовать методы оценивания, в которых число предположений о природе ошибок минимально.

<< Предыдущий параграф Следующий параграф >>
Оглавление