Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Стьюдентизация

20.31 В примере 20.1 мы рассматривали упрощенную задачу оценки среднего по выборке из нормальной совокупности с известной дисперсией. Предположим теперь, что нам требуется определить доверительные границы для среднего по выборке из совокупности

где параметр а неизвестен.

Рассмотрим величину где выборочная дисперсия. Как известно, она имеет распределение Стьюдента

(см. пример 11.8). При заданном а мы можем теперь найти такие, что

откуда получаем соотношение , которое эквивалентно соотношению

Следовательно, мы можем сказать, что лежит в интервале от до с коэффициентом доверия , при этом интервал не зависит ни от ни от а. На самом деле, вследствие симметрии распределения Стьюдента, но это побочное обстоятельство, несущественное для рассуждений.

Заметим, что выражение (20.66) (как и линейно относительно статистики доверительными линиями в этом случае, как на рис. 20.1, будут параллельные прямые. Различие состоит в том, что при известном а расстояние по вертикали между доверительными линиями является фиксированной функцией от при неизвестном же параметре это расстояние есть случайная величина, поскольку оно зависит Таким образом, здесь мы не можем фиксировать длину доверительного интервала заранее, до получения наблюдений.

20.32 Доверительные интервалы в данном случае удалось построить благодаря тому, что мы нашли статистику z, зависящую только от оцениваемого параметра, распределение

которой не содержит а. Таким путем часто можно устранить масштабный параметр, однако получаемое распределение не всегда легко вычислимо. Если, например, мы имеем статистику степени относительно переменных, то величина имеет нулевую степень и ее распределение не зависит от масштабного параметра. Когда статистика таким путем преобразована к виду, не зависящему от масштабного параметра, говорят о «стьюден-тизации», поскольку «Стьюдент» (Госсет) первым понял значение этого процесса.

20.33 Интересно рассмотреть связь между стьюдентизованной статистикой для среднего и доверительными зонами, основанными на достаточных статистиках, в случае нормального распределения. Совместное распределение среднего и дисперсии в выборке из нормальной совокупности есть (пример 11.7)

совместно достаточны (пример 17.17). В выборочном пространстве области, где х постоянно, образуют гиперплоскости, а области с постоянной гиперсферы. Если мы фиксируем то выборочная точка лежит на -мерной гиперсфере (пример 11.7). Выберем на этой гиперсфере область, содержащую -часть от площади гиперсферы. Тогда доверительная зона А будет получена объединением таких областей при всех

Рис. 20.8. Доверительные интервалы, основанные на -статистике Стыодента для (см. текст).

Одной из таких областей является «ломтик» выборочного пространства, полученный поворотом гиперплоскости, проходящей через начало координат и точку на угол (а не на потому что полуоборот этой плоскости покрывает все пространство).

На рис. 20,8 проиллюстрирован случай

Для любого заданного ось вращения пересекает гиперплоскость в точке а гиперконусы в пространстве представляют собой плоские области, заключенные между двумя прямыми (на рисунке

заштриховано). Множество областей А получается с помощью такого поворота плоскости вокруг прямой при котором на любой плоскости образуется угол с каждой стороны от прямой

Граничные плоскости задаются уравнениями

где или, после небольших преобразований,

Тогда для мы получаем интервал

Но это и есть границы, получаемые из распределения Стьюдента для Действительно, выборочное стандартное отклонение равно и

откуда

20.34 Следующий пример иллюстрирует использование «стыодентизации» при построении доверительных интервалов, а также результаты, к которым она может привести.

Пример 20.7. Доверительные интервалы для отношения средних двух нормальных величин

Пусть величины х, у имеют совместно нормальное распределение со средними и неизвестными дисперсиями и ковариацией. Предположим, что достаточно велико для того, чтобы область изменения х была существенно положительной.

Найдем доверительный интервал для отношения основанный на статистике Имеем

Величина сама распределена нормально, и в выборке объема среднее распределено тоже нормально с дисперсией Следовательно (см. 16.10), отношение

имеет -распределение Стьюдента с степенями свободы, если для членов в знаменателе используются оценки вида

Этот результат принадлежит Филлеру (1940). По таблицам, обычным путем, можно найти критические значения для величины и вопрос состоит лишь в том, можно ли, используя (20.69), указать соответствующие границы для 0. В данном случае не имеется одномерной достаточной статистики для параметра Наше уравнение содержит пять достаточных статистик (два средних, выборочные дисперсии и ковариация), которые в определенной степени являются зависимыми. Можно ожидать, что некоторые трудности, с которыми мы сталкивались в возникнут и здесь. Так оно и есть.

Рассмотрим, как изменяются и при заданных значениях пяти Статистик. Имеем

Уравнение (20.70) является уравнением третьего порядка относительно и Если откладывать 8 как ординату, как абсциссу, то получим график, аналогичный приведенному на рис. 20.9 (последний, как легко видеть, не изображает доверительных линий).

Максимальное значение (скажем, получится из (20.70), когда

Обозначим это значение через А. Минимальное значение достигается при Прямая является асимптотой.

Для или оба значения совпадают. Когда они являются мнимыми. Если то они действительны и различны. При изменении от до больший корень монотонно возрастает (или убывает) от наблюденного значения до А. Меньший корень убывает (или возрастает) от уходит в бесконечность в асимптоте, вновь появляется с противоположным знаком с другой стороны асимптоты и монотонно приближается к А, снова сливаясь там с другим корнем. Границы для 0, соответствующие данному критическому значению указаны на рис. 20.9 (получено из работы Филлера, 1954). Для конкретных значений мы можем утверждать, что параметр лежит внутри действительного интервала при коэффициенте доверия, определяющем величину принадлежащую интервалу от до что он лежит в интервале, бесконечном в отрицательном направлении, при и можем утверждать только, что он лежит где-то в интервале от до для

Рис. 20.9. Доверительные интервалы, основанные на (20.71) (см. текст).

<< Предыдущий параграф Следующий параграф >>
Оглавление