Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ГЛАВА 21. ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ: ФИДУЦИАЛЬНЫЕ ИНТЕРВАЛЫ

21.1 В начале этой главы сделаем небольшое замечание о терминологии. Задачи интервального оценивания (в его точном смысле) начали привлекать внимание статистиков примерно в 1925-1930 гг. Подход, основанный на доверительных интервалах, которые были определены в предыдущей главе, и подход, основанный на фидуциальных интервалах, к изложению которых мы переходим, были предложены соответственно Дж. Нейманом и Р. А. Фишером. Так как оба подхода давали, казалось, одинаковые результаты, то вначале было естественное убеждение, что оба эти метода выражают одно и то же, но в разных терминах. Как следствие этого, в ранней литературе часто употреблялось название «фидуциальные» интервалы в смысле наших «доверительных» и (менее часто) «доверительные» интервалы в некотором смысле, более близком к «фидуциальному» методу рассуждений.

Хотя путаница с названиями никогда не была до конца прояснена, сейчас общепризнано, что фидуциальные интервалы отличаются по своей природе от доверительных. Но сторонники этих подходов, как нам кажется, не всегда с полной ясностью указывают, в чем состоит различие; также не всегда они используют термин «фидуциальный» в строгом соответствии с тем значением, в котором его употреблял Фишер, первым предложивший его. Мы изложим основные, на наш взгляд, идеи фидуциального подхода, но читатель, обращающийся к первоисточникам, должен иметь в виду, что он может встретить упомянутое несовпадение в терминологии.

21.2 Для того чтобы понять основные идеи, обратимся к примеру. Рассмотрим выборку объема из нормальной совокупности с неизвестным средним и единичной дисперсией. Достаточной статистикой для является выборочное среднее х, которое имеет распределение

Выражение (21.1) есть распределение различных значений х при фиксированном неизвестном Теперь предположим, что

мы имеем единственную выборку объема с выборочным средним Согласно (17.68) функция правдоподобия этой выборки будет зависеть от только через распределение как достаточная статистика для и поэтому последнее может быть взято в качестве функции правдоподобия. Итак,

Если мы готовы, возможно несколько интуитивно, измерять функцией правдоподобия (21.2) степень нашего доверия к конкретному значению то окончательно можно написать

Последнее распределение будем называть фидуциальным распределением параметра Интеграл от выражения (21.3) по прямой равен 1, так что нормирующей константы здесь не требуется.

21.3 Фидуциальное распределение не является частотным распределением в том смысле, в каком использовалось это выражение до сих пор. Это новое понятие, выражающее интенсивность нашей веры в различные возможные значения параметра. Нередко бывает, что недифференциальные элементы, как в случае (21.3) и (21.1), совпадают, но это обстоятельство несущественно.

Фидуциальное распределение не является также распределением вероятностей в смысле частотной теории вероятностей. Его можно рассматривать как распределение вероятностей в смысле степеней убежденности; ниже будет рассмотрена связь с интервальным оцениванием, основанным на использовании теоремы Байеса. Фидуциальное распределение можно также рассматривать как новое понятие, дающее формальное выражение некоторым интуитивным идеям относительно величины нашего доверия к различным значениям параметра

21.4 Фидуциальное распределение может быть теперь использовано для определения интервалов, внутри которых заключено Выберем числа, скажем 0,02275 и 0,97725, и будем рассматривать их как критические в том смысле, что при любом приемлемом значении наблюденному значению х должна соответствовать (кумулятивная) вероятность не меньшая, чем 0,02275, и не большая, чем 0,97725. Так как этим значениям соответствуют уклонения от среднего значения нормальной совокупности, и то имеем

что эквивалентно

Случилось так, что мы получили то же самое неравенство, к которому нас привел в примере 20.1 центральный доверительный интервал, основанный на распределении (21.1). Существенно заметить, что этот вывод достигается другим ходом рассуждений. Доверительный подход говорит, что если мы утверждаем (21.4), то будем правы в 95,45% случаев при многократных выборках. При фидуциальном подходе утверждение (21.4) эквивалентно тому, что (в некотором смысле, не имеющем точного определения) мы на 95,45% уверены в том, что окажемся правы в данном конкретном случае. Такое же смещение акцента нам встречалось при рассмотрении самой функции правдоподобия: функция может рассматриваться или как элементарная вероятность, когда параметр 8 фиксирован, а х меняется, или как величина правдоподобия, когда х фиксировано, а 9 меняется.

Так же и здесь мы можем делать вывод о параметре 8, считая его константой и строя содержащие его интервалы, которые являются случайными величинами, либо считая фиксированными наблюдения и строя интервалы, основанные на некоторой неопределяемой степени доверия к значениям параметра, порождающего эти наблюдения.

21.5 Существует еще одно существенное различие между этими двумя методами. В предыдущей главе мы видели, что в доверительной теории возможны различные множества доверительных интервалов для одного и того же параметра, основанные на различных статистиках (хотя мы, естественно, различаем эти множества и выбираем наиболее короткие или наиболее селективные интервалы). Ничего подобного нет в фидуциальной теории (даже в смысле выбора центральных или нецентральных интервалов для одного и того же распределения, когда используются оба его хвоста). Мы должны использовать всю информацию о параметре, которая содержится в функции правдоподобия. Отсюда следует, что если пределы для параметра 8 определяются единственной статистикой то она должна быть достаточной для 0. (К этому же заключению мы пришли с точки зрения наиболее селективных интервалов в 20.30.)

Как указывалось в 17.38, всегда существует система совместно достаточных статистик для одного неизвестного параметра, а именно сами наблюдений. Но эта тавтология малоутешительна, так как трудно использовать даже достаточные системы, состоящие из двух статистик, а более широкие системы практически бесполезны. Вопрос о том, как строить интервал для

одного параметра, когда не существует одномерной достаточной статистики, фидуциальная теория по большей части обходит молчанием.

21.6 Пусть непрерывная плотность, — функция распределения статистики являющейся достаточной для параметра . Рассмотрим поведение функции при изменении , когда фиксировано некоторое значение, Предположим, что нам заранее известен интервал изменения параметра , в частности это может быть интервал Выберем некоторую критическую вероятность (аналог коэффициента доверия), и пусть — значение параметра такое, что .

Предположим теперь, что при любом функция является монотонно невозрастающей в интервале изменения параметра Тогда при всех значение плотности вероятности в точке не меньше, чем а при меньше. В этом случае мы выбираем интервал в качестве фидуциального интервала. Он содержит в себе все те значения параметра, при которых плотность вероятности больше или равна .

21.7 Если нам требуется фидуциальный интервал вида то мы должны найти такие два значения параметра , что если при , лежащем между этими значениями, больше, чем или а при , лежащем вне этого интервала, меньше этой величины, то интервал вновь содержит те значения параметра, при которых функция плотности не меньше, чем значения плотности в критических точках.

Если распределение статистики симметрично, то по обе стороны интервала остаются одинаковые по площади хвосты. При несимметричном распределении эти хвосты должны в сумме содержать вероятность а, но вероятности хвостов не равны между собой. Равными должны быть значения плотности в концах интервала. Подобные вопросы уже обсуждались нами в связи с центральными доверительными интервалами в 20.7.

21.8 При таком условии, если мы увеличим фидуциальный интервал с каждой стороны на величину то значение функции распределения в концевой точке уменьшается на Следовательно, для фидуциального распределения мы имеем

Эта формула, однако, требует, чтобы была неубывающей функцией от в нижнем конце интервала и невозрастающей в верхнем.

Пример 21.1

Рассмотрим вновь нормальное распределение из (21.1). Для любого фиксированного при изменении от через до плотность вероятности возрастает монотонно от нуля до максимума в и затем убывает монотонно до нуля. Таким образом, значение плотности для любого в интервале от до больше, чем ее значения в точках или Следовательно, в качестве фидуциального интервала мы можем взять интервал для любого подходящего значения В (21.4) мы выбрали равным

Пример 21.2

В качестве примера несимметричного выборочного распределения рассмотрим распределение

Если известно, то является достаточной статистикой для (см. упражнение 17.1), и легко видеть, что ее выборочное распределение есть

где . В данном случае параметр 6 может изменяться только от до При этом функция в (21.7) при фиксированном монотонно возрастает от до максимума и затем убывает вновь до 0, представляя собой в действительности обращенное распределение типа III. Таким образом, если мы определим так, чтобы значения функции в этих точках совпадали, а интеграл от распределения (21.7) в этих пределах равнялся заданному значению то фидуциальным интервалом будет

Выражение (21.7) можно записать в виде

и, следовательно,

Отсюда

Таким образом, фидуциальное распределение для есть

Интеграл от этого выражения в пределах от до равен единице.

Сравнивая (21.7) с (21.10), замечаем, что мы заменили не на а на Можно сказать несколько иначе, что мы заменили на Полезно рассмотреть, почему это так происходит, и повторить в специфической форме рассуждения из 21.8.

Мы определяем наш фидуциальный интервал, используя вероятность Глядя на (21.9), мы видим, что это есть интеграл, верхний предел которого, с точностью до постоянной, равен Поэтому при дифференцировании по подинтегральная функция умножается на в то время как при дифференцировании по она умножается на Таким образом, согласно (21.5) тогда как Приравнивая левые и правые части этих выражений, получаем

21.9 Попытка обобщить нашу теорию на случай нескольких параметров приводит к трудностям. Дело в том, что практических задач в этой области так мало, что любая общая теория повисает в воздухе из-за недостатка иллюстрирующих ее примеров. Поэтому мы рассмотрим лишь два важных стандартных случая: оценку среднего в нормальной выборке при неизвестной дисперсии и оценку разности двух средних по выборкам из двух нормальных совокупностей с неравными дисперсиями.

<< Предыдущий параграф Следующий параграф >>
Оглавление