Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Центральные и нецентральные интервалы

20.7 В примере 20.1 выборочное распределение, на котором основывались доверительные интервалы, было симметричным, поэтому, беря одинаковые отклонения от среднего, мы получали одинаковые значения для

В общем случае, беря одинаковые отклонения, такого результата получить нельзя, но можно выбирать произвольно при условии, что

Если взяты одинаковыми, то интервал будем называть центральным. Тогда

В противном случае интервалы будем называть нецентральными. Следует заметить, что центральность в этом смысле не означает, что доверительные границы равно отстоят от выборочной статистики, если только ее выборочное распределение не симметрично.

20.8 При отсутствии других соображений обычно используют центральные интервалы, но при некоторых обстоятельствах нецентральные интервалы оказываются более подходящими. Предположим, например, что в медицинском препарате оценивается содержание вещества, которое в больших дозах ядовито. Тогда ошибаться мы можем только в безопасную сторону, а в данном случае более опасным является превышение истинного значения над оцененным. Поэтому было бы желательно взять равным нулю:

для того, чтобы быть уверенным в том, что не превосходит Но если наша статистика распределена на бесконечном интервале, то только при равном бесконечности, и поэтому мы должны довольствоваться величиной очень близкой к нулю.

Если же, например, оценивается доля жизнеспособных семян в выборке из материала, поступающего на продажу, то важнее точность нижней границы, чем верхней: с точки зрения фермера недостаток всхожести более серьезен, чем избыток. При таких обстоятельствах следует взять по возможности малым для того, чтобы быть как можно более уверенным относительно наименьшего значения доли жизнеспособных семян. Ситуация такого рода часто возникает при установлении качества изготовленного продукта; продавец желает гарантировать минимальный стандарт и значительно менее озабочен тем, чтобы его продукт превосходил ожидание.

20.9 Следует заметить, что при определенных обстоятельствах достаточно знать, что Тогда, утверждая, что лежит в интервале от до мы не ошибемся по крайней мере в части случаев. Например, математические

трудности при установлении точных доверительных границ для заданного или теоретические трудности при дискретном распределении могут заставить нас довольствоваться этим неравенством вместо равенства (20.3).

Пример 20.2

Найти доверительный интервал для вероятности «успеха» при выборке по качественному признаку.

В выборке объема распределение числа успехов определяется членами биномиального разложения где . Найдем доверительные границы для случая и при коэффициенте доверия 0,95.

Прежде всего нам нужна биномиальная функция распределения. Данная ниже таблица содержит ее значения для определенных вплоть до (для больших со распределения получаются из симметрии). Для точного построения доверительной полосы нам нужна более детальная информация, которую можно получить из подробных таблиц биномиального распределения, указанных в 5.7. Приводимая же здесь таблица будет служить лишь для иллюстрации.

Окончательные цифры могут иметь ошибку в одну две единицы последнего знака вследствие ошибок округления, но при степени точности, рассматриваемой здесь, это не должно нас беспокоить.

(см. скан)

Заметим вначале, что варианта дискретна. С другой стороны, мы собираемся рассматривать любые значения со в интервале от до 1. При заданном нельзя в общем случае найти границы для такие, чтобы было равно в точности 0,95, но мы будем брать в качестве относительную частоту, которая дает коэффициент доверия, не меньший 0,95. Будем рассматривать только центральные интервалы. Таким образом, для заданного со нужно найти и такие, чтобы

и чтобы неравенства для вероятности были как можно ближе к равенству.

Рис. 20.2. Доверительные границы для биномиального параметра.

Рассмотрим диаграмму, представленную на рис. 20.2. Для любого заданного из таблицы можно найти значения такие, чтобы Заметим, что при определении функция распределения дает вероятность получения доли успехов, меньшей или равной Следовательно, дополнение функции распределения до единицы дает вероятность получения доли успехов, строго большей, чем Например, на горизонтали, проходящей через , мы имеем найденные из нашей таблицы; при имеем Полученные точки лежат на ступенчатых линиях. Например, когда наибольшее значение такое, что есть 0,1. С возрастанием до 0,4 величина возрастает до 0,20. Где-то между 0,3 и 0,4 находится значение со такое, что равна в точности 0,975. Если бы мы табулировали вероятности при более мелких интервалах между значениями , то ступенчатые кривые несколько изменились бы, и в пределе, если вычислить значения со такие, что в точности мы получили бы точки, лежащие внутри приведенных ступенчатых кривых. Эти точки на рис. 20.2 соединены пунктирными линиями.

Зона между ступенчатыми линиями является доверительной полосой. Для любого вероятность ошибиться, утверждая, что

лежит внутри полосы, не превосходит 0,05. Через наблюденное значение на оси абсцисс проведем вертикаль, точки ее пересечения с соответствующими линиями, дающими определяют величины Чуть ниже мы покажем, что они представляют собой искомые границы.

Ниже (20.22) мы рассмотрим более сложный метод обращения с дискретностью.

Стоит заметить, что точки на кривых рис. 20.2 строились следующим образом: для выбранной ординаты находились соответствующие абсциссы Диаграмма строилась, так сказать, по горизонтали. Однако при ее применении она читается по вертикали, т.е. для наблюденной абсциссы мы считываем с нее две величины и утверждаем, что Поучительно пронаблюдать, как это изменение точки зрения может быть оправдано без обращения к постулату Байеса.

Рассматривая диаграмму по горизонтали, мы видим, что для любого заданного наблюдение попадает в доверительную полосу с вероятностью . Тогда и только тогда, когда наблюдение находится внутри полосы, истинное значение со будет содержаться между Следовательно, последнее событие имеет вероятность , каково бы ни было истинное значение

<< Предыдущий параграф Следующий параграф >>
Оглавление