Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Кратчайшие множества доверительных интервалов

20.16 В примере 20.1 мы видели, что при некоторых условиях существует более одного множества доверительных интервалов. Нам необходимо понять, можно ли некоторое частное множество считать лучше других в каком-нибудь подходящем смысле. Аналогичная проблема возникала при оценивании, где в общем случае имеется много различных оценок для параметра, но иногда можйо найти одну (как, например, с минимальной дисперсией), которая лучше всех остальных.

В примере 20.1 проблема имела несколько специализированную форму. Мы нашли, что для интервалов, основанных на значении х, имеется бесконечное число множеств интервалов, каждое из которых соответствует способу выбора (подчиненных условию Среди них, очевидно, центральные интервалы являются кратчайшими, так как интервал данной длины содержит наибольшую долю нормального распределения, если его середина совпадает со средним значением. Разумно было бы сказать, что центральные интервалы являются наилучшими среди интервалов, определяемых с помощью х.

Но из этого не следует, что они являются кратчайшими среди всех возможных интервалов или даже что кратчайшее множество существует. В общем случае для двух множеств интервалов интервалы из могут быть короче, чем интервалы из для одних выборок и длиннее для других.

20.17 Поэтому мы будем рассматривать множества интервалов, которые являются кратчайшими в среднем. Это значит, что если

то мы хотим минимизировать где интеграл берется по всем иксам и равен, следовательно,

Докажем сейчас теорему, принадлежащую Уилксу которая очень сходна с результатом из 18.16 о том, что оценки максимального правдоподобия в пределе имеют минимальную дисперсию. Теорема эта говорит, что для больших выборок в определенном классе интервалов метод, приведенный в 20.10, дает кратчайшие в среднем интервалы.

Пусть -статистика с нулевым средним значением и пусть сумма таких статистик подчиняется центральной предельной теореме. Это значит, что

имеет в пределе нормальное распределение со средним нуль и единичной дисперсией. Величина из (20.8) является величиной типа Покажем вначале, что абсолютная величина средней скорости изменения относительно при каждом фиксированном больше, чем для любой исключая тривиальный Полагая имеем

Следовательно,

Далее, согласно а по (20.26)

Поэтому (20.46) преобразуется следующим образом:

Аналогично, используя равенство из (20.45) получаем

Поскольку то, дифференцируя под знаком интеграла, находим

откуда

Следовательно, из (20.47) -(20.49)

Используя неравенство Коши-Буняковского, видим, что множитель в фигурных скобках в (20.50) положителен, если только не равно константе, умноженной на (тогда он обращается в нуль). Исключая этот случай, имеем

Это наш предварительный результат. Если теперь определить из соотношения

то доверительные границы для 0, скажем полученные с помощью, удовлетворяют уравнению которое можно записать в виде Аналогично, границы, полученные с помощью скажем и удовлетворяют уравнению

которое перепишем в виде Из разложения в ряд Тейлора в окрестности истинного значения параметра получаем

где значения в окрестности , сходящиеся по вероятности к при возрастании Полагая в (20.52), находим, что Следовательно,

Производные в (20.53) будут сходиться по вероятности к их математическим ожиданиям. Таким образом, из (20.51) и (20.53) для больших имеем

так что доверительные границы ближе в среднем, чем любые другие границы получаемые с помощью статистик вида

20.18 Результат пункта 20.17 иллюстрирует тесную связь между теорией доверительных интервалов и теорией точечного оценивания, изложенной в главе 17. В 17.15-17 было показано, что МГД для оценки параметра равна и может быть достигнута лишь оценкой, являющейся линейной функцией от Естественно ожидать, что интервальная оценка параметра основанная на будет обладать соответствующим свойством, а именно будет в среднем кратчайшей. Мы только что видели, что для больших выборок это действительно так.

20.19 Нейман предложил использовать термин «кратчайшие доверительные интервалы» для множеств интервалов, определенных совершенно иным путем. Поскольку понятно, что такие интервалы не обязательно являются кратчайшими в смысле минимальной длины, даже в среднем, мы будем называть их «наиболее селективными», чтобы избежать путаницы в терминологии.

Рассмотрим множество интервалов с элементами удовлетворяющими условию

где обозначает, что интервал «содержит» 0, т. е. что Пусть некоторое другое множество с элементами такими, что

Для нас приемлемо каждое из этих множеств, так как в обоих случаях интервал содержит с вероятностью .

Если теперь для любого мы при всяком значении 0, отличном от истинного значения параметра, имеем

то множество интервалов будем называть наиболее селективным.

20.20 Идеи, лежащие в основе этого определения, будут разъяснены в главах 22 и 23, где рассматривается теория проверки гипотез. Забегая вперед, укажем, что смысл наиболее селективных интервалов состоит в том, они покрывают истинное значение параметра с фиксированной вероятностью , другие же значения параметра — с минимально возможной вероятностью. Относительно можно сказать, что утверждение верно для них в части случаев. Наиболее селективное множество выделяется тем, что оно покрывает ложные

значения параметра менее часто, чем их покрывают другие множества.

Различие между этим подходом и подходом, ведущим к кратчайшим интервалам, состоит в том, что последний имеет дело только с физической длиной доверительных интервалов, тогда как при первом минимизируют частоту, с которой покрываются альтернативные значения параметра Один нацелен на локализацию истинного значения параметра с наибольшей гарантией от ошибки, другой принимает в расчет желание исключить из интервала как можно больше "ложных значений 0, так чтобы ошибка принятия неверного значения была минимальной. Оказывается, что «селективный» подход математически проще, поэтому ему было уделено гораздо больше внимания. Относительно связи между двумя подходами см. ниже упражнения 20.17, 20.18. Мадански (1962) приводит пример, который выясняет различие между ними. Хартер (1964) обсуждает другие критерии для интервалов, предпочитая критерий, основанный на среднеквадра-тическом уклонении доверительных границ от истинного значения параметра.

Нейман показал, что наиболее селективные множества обычно не существуют (например, если распределение непрерывно), и предложил две альтернативные системы:

(а) наиболее селективные односторонние системы (по Нейману «кратчайшие односторонние» множества), подчиняющиеся (20.56) только для значений которые всегда положительны или всегда отрицательны;

(б) селективные несмещенные системы (по Нейману «короткие несмещенные» множества), удовлетворяющие условию

Эти определения также представляют собой перевод некоторых идей из теории проверки гипотез на язык доверительных интервалов, и можно отложить их рассмотрение до главы 23. Поэтому в настоящей главе мы не будем проводить систематического изучения «оптимальных» доверительных интервалов.

<< Предыдущий параграф Следующий параграф >>
Оглавление