Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Доверительные интервалы для последующего значения величины у: интервалы предсказания

28.23 Предположим, что регрессионная модель подогнана. Тогда результаты из 28.22 могут быть применены для получения доверительного интервала, содержащего последующее значение величины у. Если заданные значения регрессоров, при которых должно наблюдаться то соотношение (28.86) дает нам, как и прежде, несмещенную оценку математического ожидания

Поскольку имеет дисперсию то дисперсия увеличивается на эту величину по. сравнению с (28.87), т.е.

Подставляя вместо находим оценку выборочной дисперсии и таким образом получаем статистику Стьюдента

, на основе которой строятся искомые доверительные интервалы.

Аналогично, если должно быть сделано последующих наблюдений над у при том же самом то соотношения (28.89) — (28.91) имеют место для оценки среднего значения у к, которое должно наблюдаться, с очевидной заменой единицы в фигурных скобках (28.90) и (28.91) на так как дополнительная дисперсия равна теперь

Доверительные интервалы для последующих значений, рассмотренные в этом пункте, иногда называются интервалами предсказания. Но мы должны помнить, что эти «предсказания» опираются на предположение, что линейная модель, подогнанная по предшествующим наблюдениям, справедлива также и при последующих наблюдениях, т. е. что в модели не происходит структурных изменений.

Пример 28.4

Для простого случая

в примерах 19.3 и 19.6 мы видели, что

и

Здесь есть двухкомпонентный вектор и мы можем строить доверительные интервалы для используя соотношения (28.84), (28.88) и (28.91). В каждом случае мы имеем статистику Стьюдента с степенями свободы.

(а) Заметим, что анализ является ортогональным тогда и только тогда, когда ; поэтому для получения ортогональности здесь достаточно изменить начало отсчета переменной х. Аналогично, дисперсии оценок (диагональные элементы их дисперсионной матрицы) минимальны, если принимает максимально возможное значение. Ортогональность и минимальность выборочных дисперсий будут, следовательно, обеспечены, если выбрать так, что (предполагая четным)

где константа а — наибольшая из возможных. Это соответствует следующему интуитивно очевидному факту: если мы уверены

в том, что зависимость у от х линейна с постоянной дисперсией, то эффективнее всего «закреплять» прямую в концевых точках. Однако если бы зависимость была не линейной, то, производя все наблюдения только при двух значениях х, мы не могли бы этого обнаружить, и поэтому полезно распределить значения х более равномерно по интервалу. Всегда хорошо иметь возможность в процессе анализа проверять структурные предположения нашей модели.

(б) Доверительный интервал для согласно (28.88) есть

Если рассматривать это как функцию от то видно, что (28.93) определяет две ветви гиперболы, диаметром которой служит подогнанная регрессия Доверительный интервал имеет, очевидно, наименьшую длину, когда равно наблюденному среднему х, и его длина возрастает при возрастании —

Рис. 28.2. Расположение гиперболических доверительных границ (28.93) для математического ожидания у при простой линейной регрессии.

Последнее подтверждает интуитивное представление о том, что наиболее точно мы можем оценивать вблизи «центра» наблюденных значений величины х. Рис. 28.2 иллюстрирует расположение доверительных границ (28.93).

Робинсон (1964) приводит МП-оценки и доверительные интервалы для абсциссы пересечения двух полиномиальных регрессий, а также библиографию относящихся сюда работ.

28.24 Доверительные границы для математического ожидания величины у, рассмотренные в примере и в более общем

виде в 28.22, относятся к величине у, соответствующей конкретному значению На рис. 28.2 каждый конкретный доверительный интервал представляет собой отрезок вертикальной прямой, проходящей через который заключен между ветвями гиперболы. Предположим теперь, что нам требуется доверительная область для всей регрессионной прямой, т. е. область на плоскости (или, в общем случае, в пространстве (х, у)), такая, что с вероятностью истинная прямая регрессии содержится в Мы видим, что данная задача совершенно отличается от только что рассмотренной. Теперь ищется не интервал, а доверительная область, которая покрывает всю прямую, а не одну точку на прямой. Эта задача в простейшем случае была решена впервые в замечательной работе Уоркинга и Хотеллинга (1929). В нашем изложении мы будем следовать Хоулу (1951).

<< Предыдущий параграф Следующий параграф >>
Оглавление