Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ГЛАВА 20. ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ: ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ

20.1 В предыдущих трех главах мы имели дело с методами получения оценок для одного или нескольких неизвестных параметров; эти методы давали нам функции от выборочных значений, определявшие для любой заданной выборки единственное значение оценки. Мы, конечно, отдавали себе отчет в том, что значение оценки в каждом конкретном случае может отличаться от значения параметра и что, следовательно, при этом остается еще известная доля неопределенности. Величина этой неопределенности выражалась с помощью выборочной дисперсии статистики. Из интуитивных соображений, которыми мы пользовались до сих пор, можно было бы сказать, что, возможно, параметр лежит в интервале очень возможно, что он лежит в интервале и так далее. Короче говоря, что мы, по существу, могли бы сделать — это установить для интервал вместо отдельной точки, хотя одна точка этого интервала, а именно и рассматривалась бы как «наилучшая» оценка для .

20.2 В настоящей главе мы поближе изучим эту процедуру и взглянем на проблему оценивания с другой точки зрения. Оставим теперь попытки оценить с помощью функции, которая для конкретной выборки давала бы единственное значение оценки. Вместо этого мы рассмотрим, как задать промежуток, в котором лежит . В дальнейшем будет изучаться три метода, из которых два подобны, но не идентичны. Первый известен как метод доверительных интервалов и основан только на частотной теории вероятностей, не выражая более никакого нового принципа. Второй метод, который будем называть методом фидуциальных интервалов, требует нечто не входящее в частотную теорию. Третий основан на теореме Байеса и на одной из форм постулата Байеса (8.4). В настоящей главе мы постараемся изложить основные идеи и методы оценивания с помощью доверительных интервалов, принадлежащие Нейману, чей мемуар 1937 г. следует выделить особо (см. Нейман (1937b)). В 21-й главе мы будем иметь дело с соответствующими аспектами фидуциальных интервалов и байесовского оценивания.

Доверительные утверждения

20.3 Рассмотрим сначала распределение, зависящее от одного неизвестного параметра и предположим, что нам дана случайная выборка объема из этого распределения. Пусть функция, зависящая от иксов и от 0, выборочное распределение которой не зависит от 6 (примеры, приводимые ниже, покажут, что по крайней мере для некоторых случаев такую функцию можно найти). Тогда по заданной вероятности 1—а можно найти такое значение что

и это выполняется для любого значения 0. В вероятностных обозначениях мы имеем тогда

Может случиться, что неравенство можно записать в форме или где некоторая функция, зависящая от и иксов, но не зависящая от 0. Например, если то мы имеем следовательно, Если можно переписать это неравенство таким образом, то согласно (20.1)

В более общем случае, когда распределение z может и зависеть от 0, предположим, что можно найти статистику зависящую от и от иксов и не зависящую от 0, такую, что (20.2) выполняется для всех 0. Тогда, пользуясь этим равенством, мы можем делать определенные утверждения о параметре

20.4 Заметим прежде всего, что мы не утверждаем, что не превосходит константы с вероятностью 1 — а. Это утверждение (в частотной теории вероятностей) можно связывать только с изменением параметра в генеральной совокупности значений 0, но в общем случае мы не знаем, меняется ли вообще. Если параметр есть просто неизвестная константа, то вероятность того, что равна либо нулю, либо единице. Мы не знаем, какое из этих значений правильное, а знаем лишь, что одно из них верно.

По этой причине посмотрим на задачу иначе. Значение не случайно, но статистика является случайной величиной и изменяется от выборки к выборке. Следовательно, если мы утверждаем, что в каждом предложенном для решения случае, то мы в конечном счете будем правы в части

случаев. Утверждение о вероятности того, что меньше или равно некоторого заданного значения, не имеет смысла, кроме тривиального, упомянутого выше. Утверждение же о том, что статистика больше или равна (при любом 0), оказывается верным с определенной вероятностью. Следовательно, приняв за правило для любых выборочных значений утверждать, что выполнено неравенство мы гарантированы, что будем правы «в среднем» в части случаев.

Эта идея является основной в теории доверительных интервалов, к изложению которой мы переходим, и читатель должен убедиться в том, что он уловил ее. Подчеркнем, в частности, что доверительное утверждение выполняется, каково бы ни было значение параметра нас интересует не повторный выбор из одной и той же совокупности, а просто повторный выбор.

20.5 Для упрощения изложения мы рассматривали только одну величину и утверждение о том, что На практике, однако, разыскиваются обычно две величины такие, что для всех

и делается утверждение, что лежит в интервале от который называется доверительным интервалом для 0. Величины называются нижней и верхней доверительными границами соответственно. Они зависят только от и выборочных значений. Для любой фиксированной величины совокупность доверительных интервалов для различных выборок определяет область, внутри которой, по утверждению, лежит значение параметра Эта область называется доверительной полосой. Ниже будет дано графическое представление этого понятия. Величина называется коэффициентом доверия.

Пример 20.1

Пусть нам дана выборка объема из нормальной совокупности с известной дисперсией (без потери общности положим ее равной единице)

Распределение выборочного среднего х есть

Из таблиц нормального интеграла известно, что вероятность положительного отклонения от среднего не более чем на два стандартных отклонения равна 0,97725. Следовательно, имеем

что эквивалентно соотношению

Таким образом, если мы утверждаем, что больше или равно то мы будем правы в среднем примерно в 97,725% случаев.

Аналогично имеем

Отсюда, объединяя оба результата, получаем

Следовательно, если мы утверждаем, что лежит в интервале то будем правы в среднем примерно в 95,45% случаев.

Обратно, если задан коэффициент доверия, то мы можем легко найти с помощью таблиц нормального интеграла отклонение такое, что

Например, если то Утверждая в этом случае, что лежит в интервале мы имеем 4 шанса против 1 быть правыми.

Читатель, для которого этот подход нов, возможно спросит, не есть ли это окольный метод использования стандартной ошибки для установления пределов изменения оценки среднего. В некотором отношении это так. Действительно, приведенный пример показывает, что использование стандартной ошибки для среднего в нормальной выборке может быть логически оправдано без привлечения новых методов, отличных от уже имеющихся в теории вероятностей. В частности, мы не использовали постулат Байеса (8.4).

Отметим интересный момент в нашем примере, заключающийся в том, что нижняя и верхняя доверительные границы, полученные выше, равно отстоят от среднего х. Это не является необходимым, и легко видеть, что мы можем получить любое число альтернативных границ для того же коэффициента доверия 1 — а. Предположим, например, что и

выберем два числа подчиненных условию

скажем, Из таблиц нормального интеграла имеем

и, следовательно,

Таким образом, с тем же коэффициентом доверия можно утверждать, что лежит в интервале от до или в интервале от до . В каждом случае мы будем правы в среднем примерно в 95,45% случаев.

Заметим, что в первом случае интервал имеет длину в то время как во втором случае его длина равна -При прочих равных условиях нам следует выбрать первые границы, так как они заключают параметр в более узкий интервал. Ниже мы рассмотрим этот вопрос более детально. Не всегда случается, что имеется бесконечное число возможных доверительных интервалов или что выбор между ними может быть сделан на столь же понятных основаниях, как в этом примере.

Графическое представление

20.6 В ряде простых случаев, включая пример 20.1, доверительные границы могут быть представлены в удобной графической форме. Возьмем две ортогональные оси: относящуюся к наблюденному значению отвечающую (рис. 20.1). Две изображенные прямые линии описываются уравнениями

Следовательно, для любой точки между линиями имеем

Поэтому, если для любого наблюденного значения х мы найдем соответствующие ему две ординаты на прямых, то получим две доверительных границы. Вертикальный интервал между границами есть доверительный интервал (показан на рисунке для а вся зона между прямыми образует доверительную полосу. Мы можем называть эти две прямые нижней и верхней доверительными линиями соответственно.

Графическое изображение сделано для случая примера 20.1. При разных значениях будут получаться различные

линии, все параллельные прямой и приближающиеся одна к другой с ростом Для всевозможных их можно нанести на один рисунок, и полученная диаграмма оказывается полезной в практической работе для нахождения доверительных границ.

С другой стороны, можно изменять коэффициент доверия (в нашем примере он равен 0,9545). Тогда на одной и той же диаграмме, относящейся к некоторому фиксированному значению мы можем нанести ряд пар доверительных линий, каждая из которых соответствует некоторому выбранному значению . В этом случае, конечно, линии удаляются одна от другой с ростом . Во многих практических ситуациях нас интересует изменение доверительного интервала в зависимости от , и мы можем одновременно для некоторого набора значений а сделать утверждения вида (20.3), каждое из которых в среднем будет справедливо в соответствующей доле случаев. Эта процедура может быть доведена до своей крайней формы, когда одновременно рассматривается вся совокупность значений в промежутке (0,1). Так порождается «доверительное распределение» параметра — термин, принадлежащий Д. Коксу (см., например, 1958b): одновременно мы имеем бесконечную последовательность доверительных утверждений, причем с ростом величины каждое последующее утверждение содержится в предыдущем.

Рис. 20.1. Доверительные границы в примере 20.1 для

<< Предыдущий параграф Следующий параграф >>
Оглавление