Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Поправки на смещение

17.10 Если имеется состоятельная, но смещенная оценка и желательно исключить смещение, то можно вычислить математическое ожидание оценки и попытаться найти нужную поправку, подобно тому как было сделано в примере 17.3. Однако это математическое ожидание иногда бывает довольно сложной функцией параметра который нужно оценить, и тогда не очень понятно, какова должна быть поправка. Остроумный метод, позволяющий преодолевать эту трудность в широком клас случаев, предложил Кэнуй (1956).

Пусть (смещенная) оценка вычисленная на основе наблюдений, является функцией выборочных -статистик (глава 12). Пусть, кроме того, существуют все семиинварианты генеральной совокупности (тогда, как известно, будут несмещенными оценками для Разложение в ряд Тейлора относительно дает

(производные взяты в точках Беря затем математические ожидания от обеих частей равенства (17.8) и учитывая тот факт, что моменты -статистик являются степенными рядами по степеням мы получим

Отметим, что, даже если не будет функцией -статистик, (17.9) может иногда выполняться (см. упражнение 17.13). Пусть теперь обозначает статистику, полученную осреднением статистик вычисленных для всех подмножеств из наблюдений. Если рассмотреть новую статистику

то из (17.9) немедленно будет следовать

Последнее выражение показывает, что смещение имеет порядок Аналогичные вычисления показывают, что статистика

будет уже иметь смещение порядка Таким образом, предложенный метод позволяет исключать смещение с любой желаемой точностью.

В упражнении 17.18 требуется показать, что точностью до членов порядка т. е. исключение смещения первого порядка не увеличивает дисперсии. Это, однако, может быть неверно для поправок более высокого порядка.

В статье Миллера (1964) рассматривается вопрос об асимптотической нормальности статистики и об оценивании ее дисперсии.

Пример 17.4

Найти несмещенную оценку для где параметр биномиального распределения

Интуитивной оценкой будет

поскольку несмещенная оценка для Э. Статистика может принимать только два значения:

в соответствии с тем, что исключено из выборки: «успех» или «неудача». Следовательно,

поэтому (17.10) примет вид

Полученная оценка оказывается точной несмещенной оценкой для

17.11 Вообще может существовать более одной состоятельной оценки параметра, даже если ограничиться только несмещенными оценками. Рассмотрим еще раз задачу оценивания среднего нормальной совокупности с дисперсией Выборочное среднее является состоятельной и несмещенной оценкой. Покажем, что то же самое верно и для медианы.

Из соображений симметрии следует, что медиана является несмещенной оценкой генерального среднего, которое, конечно, совпадает с медианой генеральной совокупности. Для больших распределение медианы стремится к нормальному распределению (см. 14.12):

( ордината медианы генеральной совокупности, равная в нашем случае). Из (17.13) видно, что дисперсия выборочной медианы равна и стремится к нулю при больших Следовательно, выборочная медиана состоятельна.

17.12 Мы должны, таким образом, продолжать поиски критериев, позволяющих осуществлять выбор среди различных состоятельных оценок. Один такой критерий возникает естественным образом при рассмотрении дисперсий оценок. Дело в том, что чем меньше дисперсия оценки, тем большая доля ее распределения сосредоточена вблизи 9. Во всяком случае, это верно для распределений типа нормального. Несмещенная состоятельная оценка с меньшей дисперсией будет, следовательно, в среднем меньше отклоняться от истинного значения, чем оценка с большей дисперсией. Поэтому разумно считать ее более предпочтительной.

Для среднего и медианы нормальных выборок имеем из (17.3)

(при любых и из 17.11

(при больших ). Поскольку то среднее является более эффективной оценкой, чем медиана, по крайней мере для больших Следующие данные могут быть получены с помощью таблицы XXIII из сборника Tables for Statisticians and Biometricians, Part II:

Таким образом, мы видим, что дисперсия выборочного среднего всегда меньше дисперсии выборочной медианы при оценивании среднего значения нормального распределения.

Пример 17.5

Мы уже знаем (см. 17.6), что выборочное среднее не является состоятельной оценкой медианы распределения Коши

В то же время, поскольку ордината медианы равна дает для дисперсии в случае больших выборок

и медиана, очевидно, является состоятельной оценкой. Хотя в данном случае прямое сравнение со средним невозможно, так как дисперсия последнего не существует, тем не менее ясно, что медиана предпочтительней выборочного среднего в качестве оценки для 0. Таким образом, ситуация здесь противоположна той, которая была в случае нормального распределения. Это факт особенно интересен, если принять во внимание сходство данных распределений.

Питмэн дает следующее определение. Оценка называется «более близкой» к 0, чем оценка и, если Однако, как он подчеркивает, этот привлекательный критерий не обладает свойством транзитивности. См. также Гири (1944) и Джонсон (1950).

<< Предыдущий параграф Следующий параграф >>
Оглавление