Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Оценивание по методу минимума хи-квадрат

19.25 Возвращаясь к ситуации, рассмотренной в 19.23, назовем статистику оценкой по методу минимума хи-квадрат

(МХК-оценкой), если она получена минимизацией по 0! выражения

где я — функции от Минимизация (19.91) приводит к уравнению

Корень (19.92), рассматриваемого как уравнение относительно будет МХК-оценкой для Очевидно, можно, обобщая (19.92), получить систему из уравнений, которые надо решить совместно, чтобы найти МХК-оценки для

Процедура нахождения МХК-оценок совершенно аналогична процедуре нахождения МП-оценок, рассмотренной в главе 18. Более того, (асимптотические) свойства МХК- и МП-оценок очень похожи. Действительно, с вероятностью 1 имеется единственный состоятельный корень уравнений МХК и этот корень соответствует абсолютному минимуму (нижней грани) (19.91). Для простейшего случая доказательство этого факта дано

19.26 Видоизмененная форма МХК-оценок получается, если минимизировать

вместо (19.91). В (19.93) предполагается, что не обращаются в нуль. Чтобы минимизировать (19.93), надо решить относительно уравнение

Такая модификация МХК-оценок, как показал Нейман (1949), также является НАН-оценкой.

19.27 Поскольку методы МП, МХК и видоизмененный метод МХК имеют одинаковые асимптотические свойства, то при выборе между ними в любом конкретном случае надо исходить либо из удобства вычислений, либо из выборочных свойств при малых выборках, либо из того и другого. Что касается вычислительных удобств, то в общем случае об этом можно сказать немногое. Иногда труднее решать уравнения МП, а иногда —

уравнения МХК. Но если мы имеем дело с непрерывным распределением, то для применения метода МХК необходимо сгруппировать наблюдения. Кажется, однако, нежелательным производить группировку, нужную лишь для оценивания и бесполезную в других отношениях. Кроме того, иногда трудно, особенно в случае непрерывных распределений, выразить в терминах оцениваемых параметров. Наше мнение, следовательно, состоит в том, что имеющая в настоящее время место тенденция к оцениванию по методу МП в достаточно широком классе случаев оправдана с точки зрения вычислений. Следующий пример иллюстрирует вычислительную процедуру метода МХК в относительно простом случае.

Пример 19.11

Рассмотрим оценивание параметра распределения Пуассона по одной выборке из наблюдений. Мы знаем (примеры 17.8, 17.15), что выборочное среднее х есть достаточная МГД-оценка для , а из 18.5 следует, что х есть также МП-оценка.

МХК-оценка для , однако, не равна х, что иллюстрирует тот факт, что метод МХК. не обязательно приводит к одномерной достаточной статистике, если последняя существует. Теоретические вероятности в данном случае равны

откуда

Уравнения минимизации (19.92) можно, следовательно, опуская множитель записать в виде

Для решения этого уравнения относительно мы используем итерационный метод, подобный тому, который был использован для нахождения МП-оценки в 18.21. Разложим левую часть (19.95) в ряд Тейлора, как функцию от в точке х (выборочное среднее), рассматриваемой как начальное значение. С точностью до первого порядка получаем

где использовано обозначение Приравнивая (19.96) к нулю и учитывая (19.95), находим

Используя (19.97), мы получаем улучшенное значение и затем повторяем этот процесс столько раз, сколько нужно.

В качестве численного примера мы используем данные Уайтекера (1914) о числе смертей женщин в возрасте старше 85 лет. Эти данные составлены из ежедневных сообщений газеты «Тайме» в 1910-1912 гг. и охватывают период в 1096 дней. Соответствующее распределение приведено в первых двух столбцах таблицы. Среднее число смертей равно Это и есть значение МП-оценки, которое мы возьмем в качестве начального приближения для МХК-оценки. Третий столбец дает ожидаемые частоты пуассоновского распределения с параметром х. В оставшихся пяти столбцах приведены вычисления, относящиеся к (19.97).

(см. скан)

В результате мы получаем из (19.97) улучшенное значение:

К. Смит (1916) получил значение 1,196903, используя большее число итераций.

Смит приводит также детали вычислительной процедуры для оценивания параметров непрерывного распределения, которая в этом случае значительно более трудоемка.

19.28 Вторым критерием для выбора между МП- и МХК-оценками служат свойства, относящиеся к малым выборкам, которые в большей степени пригодны для общего исследования, чем вычислительные аспекты. С. Р. Рао (1961, 1962а) ввел понятие эффективности второго порядка и показал, что в мультиномиальной модели пункта 18.19 при условиях регулярности среди всех НАН-оценок только МП-оценки являются оптимальными в смысле эффективности второго порядка. Берксон (1955, 1956) осуществил выборочные эксперименты, которые показали, что в ситуациях, возникающих в биологических испытаниях, использование МП-оценки иногда приводит к трудности, связанной с тем, что МП-оценка обращается в бесконечность, тогда как некоторая другая НАН-оценка имеет меньшую среднеквадратичную ошибку. При чтении этих статей следует, однако, обратиться также к статье Силверстоуна (1957), который указывает на содержащиеся в них ошибки.

УПРАЖНЕНИЯ

(см. скан)

(см. скан)

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление