Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Точные доверительные интервалы, основанные на распределении Стьюдента

21.15 Если мы хотим построить для параметра точный доверительный интервал, основанный на распределении Стьюдента, то достаточно найти линейную и квадратичную функции от наблюдений соответственно, такие, что для любых значений

(I) независимы,

(III) имеет -распределение с

Тогда величина

подчиняется распределению Стьюдента с Сейчас мы докажем замечательный результат, принадлежащий Шеффе (1944), о том, что не существует статистики вида (21.22), являющейся симметричной функцией от наблюдений каждой выборки. Иначе говоря, не может быть инвариантной относительно перестановки элементов первой выборки

между собой и элементов второй выборки между собой.

21.16 Предположим, что статистика симметрична в указанном смысле. Тогда мы должны иметь

где коэффициенты являются постоянными, не зависящими от параметров. Из (21.22) вытекает, что

а из (21.23), что

Выражения (21.24) и (21.25) являются тождествами относительно следовательно,

поэтому

Из (21.26) и (21.23) получаем

и, следовательно,

Поскольку отношение имеет -распределение с то

откуда, используя (21.28), находим

тогда как из (21.23) вытекает, что

Приравнивая (21.29) и (21.30), находим выражения для постоянных Используя их в (21.23), получаем

Соотношения (21.27) и (21.31) переводят (21.22) в (21.21). Далее, независимые -случайные величины, а линейная функция двух таких случайных величин может сама иметь -распределение лишь в том случае, если она является их суммой. Таким образом, из (21.31) следует, что тогда только будет иметь -распределение, когда

или

При заданных последнее имеет место только для специальных значений Так как мы требуем, чтобы наше утверждение было справедливо для всех значений то мы пришли к противоречию. Итак, не может быть симметричной функцией в указанном смысле.

21.17 Поскольку мы не можем найти симметричную функцию желаемого вида, имеющую распределение Стьюдента, то обратимся теперь к другим функциям. Рассмотрим (21.22) в случае, когда

одинаково распределенные нормальные величины с

Напомним, что мы считаем Теперь (21.22) превращается в величину

которая имеет распределение Стыоденга с Предположим, что в терминах исходных наблюдений

Величины являясь линейными функциями от нормальных случайных величин (см. 15.4), имеют многомерное нормальное

распределение. Для выполнения соотношений (21.34) необходимо и достаточно, чтобы

Таким образом, из (21.36) и (21.37) следует

21.18 Центральный доверительный интервал, полученный на основе статистики (21.35) при коэффициенте доверия , есть

где является соответствующим критическим значением при Согласно (21.39) средняя длина интервала равна

где последний множитель в правой части можно найти, пользуясь тем, что величина имеет -распределение с а именно:

Для получения наименьшей средней длины в (21.40) мы должны минимизировать или, что эквивалентно, минимизировать в (21.38) при условии (21.37). Эту задачу можно представить геометрически следующим образом. Рассматривается пространство размерности причем каждому индексу соответствует координатная ось. Тогда уравнение определяет гиперплоскость, определяет -мерную гиперсферу, и они пересекаются по -мерной гиперсфере. Требуется найти векторов, выходящих из начала координат, концы которых лежат на этой -мерной гиперсфере и которые (чтобы удовлетворить последнему из условий взаимно ортогональны, таким образом, чтобы минимизировать радиус -мерной гиперсферы. Это можно сделать, взяв искомые векторы совпадающими с координатными

осями, и тогда Но если то предложенную процедуру молено улучшить. Ниже будет показано, что мы можем, сохраняя ортогональность векторов, расположить их симметрично относительно прямой, составляющей равные углы с координатными осями, и тогда величина уменьшается от 1 до своего минимального значения, равного

21.19 Перепишем условия (21.37) в векторной форме:

где есть вектор-строка матрицы — вектор-строка, состоящая из единиц.

Если векторов удовлетворяют соотношениям (21.42), то можно присоединить к ним векторов, удовлетворяющих второму условию (21.42) (нормировка и ортогональность), так, чтобы получить базис -мерного пространства. Выразим и как линейную функцию от векторов

где скалярные величины. Теперь, используя (21.42) и (21.43), получаем

Таким образом,

Поскольку и есть вектор-строка единиц, то

Отсюда, учитывая (21.42), имеем

Используя (21.44), из (21.45) находим

или

Следовательно,

что и требовалось доказать.

21.20 Знак равенства в (21.46) имеет место, когда для Тогда вектор и целиком лежит в пространстве, натянутом на первые с-векторов. Из (21.44) видно, что эти векторы расположены симметрично вокруг него. Очевидно, существует бесконечное число способов определения получаемых вращением набора из векторов. Шеффе (1943а) предложил особенно привлекательное решение:

Легко проверить, что коэффициенты в (21.47) удовлетворяют условиям (21.37) с Подстановка (21.47) в (21.36) дает

Учитывая это, из (21.33) имеем

где

Таким образом, из (21.35) и (21.48) — (21.50) получаем, что статистика

имеет распределение Стьюдента с используя ее, можно найти доверительные границы для

21.21 Замечательно, что нам удалось точно решить задачу нахождения доверительного интервала, отказавшись только от естественного на вид требования симметрии. Свойство (21.51) имеет место для любого подмножества объема случайно выбранного из случайных величин, принадлежащих второй выборке. Подобно тому как в 20.22 мы прибегали к рандомизации для того, чтобы преодолеть трудности при определении точных доверительных интервалов для дискретной величины, так и здесь мы нашли, что одной лишь рандомизации достаточно, чтобы

устранить мешающий параметр Но роль рандомизации не следует преувеличивать. Числитель в (21.51) содержит полностью выборочные средние обеих выборок, и только знаменатель изменяется в зависимости от случайного выбора подмножества по второй выборке. Интуитивно оценить, как много эффективности теряется при использовании этой процедуры, невозможно. Поэтому мы исследуем длину получаемых доверительных интервалов.

21.22 Из (21.38) и (21.46) для оптимального решения (21.48) имеем

Подставляя (21.52) в (21.40) и используя (21.41), находим для средней длины доверительного интервала

Сравним теперь этот интервал I с интервалом полученным из (21.19) при условии, что известно. Его средняя длина равна

где последний множитель вычисляется с помощью -распределения с и равен

Из (21.53) — (21.55) получаем отношение средних значений интервалов:

Когда при фиксированном каждый из трех сомножителей в (21.56) стремится к 1 и, следовательно, отношение средних длин интервалов тоже стремится к единице, что интуитивно понятно. Если мало, то первые два сомножителя больше 1, а последний — меньше. Следующая таблица дает точные значения величины (21.56) для и нескольких объемов выборок.

Значения (из Шеффе, 1943а)

(см. скан)

Очевидно, что I является очень эффективным интервалом даже для выборок умеренных объемов. Его средняя длина превосходит среднюю длину не более чем на 11% при и не более чем на при Заметим, что мы сравнивали его с интервалом, основанным на знании 9. Принимая это во внимание, мы вполне можем сказать, что I действительно обладает очень хорошими качествами: рандомизация не внесла больших потерь эффективности.

В дополнение к приведенному мы рассмотрим приближенные доверительно-интервальные решения задачи о двух средних.

<< Предыдущий параграф Следующий параграф >>
Оглавление