Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Доверительная область для регрессионной прямой

28.25 Рассмотрим вначале простой случай примера 28.4 и предположим, что известна. Эти ограничения мы ослабим в Для удобства будем измерять от их среднего значения, так что При этом анализ, как отмечалось в примере становится ортогональным. Коэффициенты и в этом случае независимы и нормально распределены, а из матрицы рассеяния получаем, что Таким образом,

— независимые нормированные нормальные величины.

Пусть -однозначная четная функция от пусть уравнение

определяет семейство замкнутых кривых на плоскости таких, что (а) с убыванием новая кривая содержится внутри кривой, соответствующей большему значению величины каждая точка, лежащая внутри кривой, принадлежит некоторой другой кривой. Предположим, что неявной зависимости (28.95) между соответствует явная зависимость или

Предположим, далее, что существует для всех и является монотонно убывающей функцией от принимающей все действительные значения.

28.26 Из (28.94) видно, что при любом заданном множестве наблюдений, на основании которых подогнана регрессия, истинной регрессионной прямой

будут соответствовать значения такие, что

Подставляя (28.96) в (28.98), находим два семейства регрессионных прямых, зависящих от параметра

где каждое семейство соответствует определенному знаку в (28.96). Найдем теперь огибающие этих семейств.

Дифференцируя (28.99) по и приравнивая производную нулю, получаем

Подставляя (28.100) в (28.99), находим требуемые огибающие

где функции от следует заменить функциями от х согласно (28.100). При ограничениях на сформулированных после две огибающие в (28.101) существуют для всех х, являются однозначными функциями и, кроме того, все прямые каждого семейства лежат только по одну сторону от соответствующей огибающей. Действительно, кривая, отвечающая верхнему знаку в (28.101), всегда лежит выше кривой, отвечающей нижнему знаку в (28.101), а все прямые обоих семейств (28.99) расположены между ними.

28.27 Любая пара значений для которой

будет соответствовать регрессионной прямой, лежащей между двумя огибающими (28.101), потому что при любом фиксированном значение уменьшается и, следовательно, функция от входящая в постоянный член в (28.99), уменьшается по "абсолютной величине, тогда как коэффициент при х не изменяется. Таким образом, если удовлетворяют (28.102), то истинная регрессионная линия лежит между двумя огибающими

(28.101), Выберем теперь так, чтобы непрерывная случайная величина удовлетворяла условию

Тогда (28.102) выполняется с вероятностью и область между парой огибающих (28.101) является доверительной областью для истинной прямой регрессии с коэффициентом доверия .

28.28 Теперь мы должны рассмотреть вопрос о выборе функции такой, чтобы при фиксированном значении доверительная область была в некотором смысле возможно меньшей. Нельзя просто минимизировать площадь области так как она всегда бесконечна. Поэтому мы введем весовую функцию и будем выбирать так, чтобы минимизировать интеграл

где нижняя и верхняя огибающие (28.101) соответственно, являющиеся границами Можно переписать (28.104) в виде

где математические ожидания взяты относительно

Очевидно, оптимальная область найденная с помощью минимизации, будет зависеть от выбранной весовой функции. Полагая рассмотрим нормальную весовую функцию

которая особенно удобна, если значения х, считающиеся здесь фиксированными, в действительности выбраны из нормальной совокупности, например, если х и у имеют двумерное нормальное распределение. Подставляя (28.101) и (28.106) в (28.105), получаем

Поскольку убывает, из (28.100) имеем

так что, преобразуя интегралы в (28.107) к переменной находим

где интегрирования производятся по всей области, изменения о. Учитывая четность функции оба интеграла нужно брать только по положительным Подстановка (28.109) в (28.107) дает

Эту величину предстоит минимизировать при условии (28.103), которое вследствие независимости, нормальности и симметрии распределений, эквивалентно условию

Напомним, что мы требуем от функции чтобы она была монотонно убывающей по и принимала все действительные значения.

28.29 Переходя непосредственно к минимизации интеграла I, выберем общий вид для Здесь «естественно» выбрать семейство эллипсов, которые запишем в форме

Теперь мы должны минимизировать (28.110) по переменной а при условии (28.111). Поскольку из (28.112)

то для выбора а нам надо минимизировать (опуская константу) величину

при условии

Дифференцируя (28.114) по а и заменяя в этой производной значением, получаемым посредством дифференцирования (28.115), находим после некоторых упрощений

Для нахождения минимума полагаем решаем уравнение относительно а и затем определяем

Хоул (1951) проделал это для и нашел, что эллипс (28.112) имеет полуоси 2,62 и 2,32, мало отличающиеся друг от друга. Если вместо эллипса взять круг, т. е. в (28.112) положить то его радиус оказывается равным 2,45 при Хоул показал, что в этом случае значение отличается от минимального не более чем на один процент.

28.30 Выбор круга в качестве соответствует первоначальному решению данной задачи Уоркингом и Хотеллингом (1929). Они получили указанное решение, заметив просто, что так как в (28.94) являются независимыми нормированными нормальными величинами, то величина имеет -распределение с 2 степенями свободы, а есть -процентная точка, получаемая из таблиц -распределения. Подставляя (28.112) и (28.113) с в (28.101), находим границы доверительной области

Учитывая (28.100), перепишем (28.117) в виде

где содержимое фигурных скобок равно

Сравнивая (28.118) с доверительными границами (28.93) для полученными в примере 28.4 (где нужно положить как сделано здесь), мы видим, что с точностью до замены на на значение получаемое из -распределения, выражения имеют один и тот же вид. Таким образом, доверительные границы (28.118) выглядят так же, как доверительные границы (28.93), изображенные на рис. 28.2 и представляющие собой гиперболу с подгоняемой прямой в качестве диаметра. Как можно было ожидать, при заданном а ветви гиперболы (28.118) быстрее расходятся в стороны, чем их аналоги в (28.93). Это происходит потому, что здесь мы устанавливаем область для целой прямой, тогда как прежде искали границы, заключающие единственное значение на прямой. Например, при (при бесконечном числе степеней свободы, соответствующем известной в то время как для -распределения с двумя степенями свободы откуда, извлекая квадратный корень, получаем значение приведенное в конце 28.29.

28.31 Если неизвестна, то требуется небольшая модификация рассуждений из 28.25-30. Определим величину

так что есть отношение суммы квадратов остатков от подогнанной регрессии к истинной дисперсии ошибки. Она имеет (см. 28.21) -распределение с степенями свободы. Из (28.84) и (28.119) следует, что каждая из статистик

и

подчинена распределению Стьюдента с степенями свободы. Если мы теперь вновь проведем рассуждения из 28.25-30, подставляя вместо то обнаружим, что распределение величины не зависит от параметров Решение задачи о минимизации взвешенной площади из 28.28-29 становится теперь трудным, и мы перейдем прямо к классическому решению, приведенному в 28.30.

Будем непосредственно использовать рассуждения Хотеллинга и Уоркинга. Поскольку согласно распределены независимо друг от друга как -величины с 1, 1 и

степенями свободы соответственно, то отношение имеет -распределение с степенями свободы. Таким образом, если в 28.30 заменить на и положить равным удовоенной -продентной точке этого F-распределения, то из (28.118) мы получим требуемую доверительную область. Как и в 28.30, обнаруживаем, что границы области всегда расходятся в стороны быстрее, чем границы для .

28.32 Нетрудно обобщить наши результаты на случай более чем одного регрессора, и набросок такого обобщения сделан Хоулом (1951). Обобщая результат из 28.31 на регрессоров, находим, что величина имеет распределение дисперсионного отношения с

Для полиномиальной регрессии Гафариан (1964) приводит метод получения доверительных областей над любым подмножеством области определения регрессии. В случае прямой линии у него приложены подробные таблицы для области с постоянной шириной.

УПРАЖНЕНИЯ

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление