Главная > Математика > Линейная и нелинейная регрессии
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.4. Оценки Хюбера, Андрюса и Рамсея

Каждой -оценке в случае оценивания параметра положения соответствуют две оценки: минимизирующая сумму (5.5) и минимизирующая сумму (5.2). Введение параметра масштаба о в случае -оценок не играет роли: обе оценки совпадают. Однако в других случаях это не так.

Для того чтобы полученные -оценки были робастными, необходимо, чтобы на интервале, содержащем 0, т. е. на интервале функция была близка к параболе (пропорциональна квадрату аргумента), а вне интервала скорость роста заметно снижалась и зависимость от х становилась меньше. Так, в функции Хюбера (5.3) на интервале совпадает с квадратичной функцией (скорость роста пропорциональна аргументу), а вне этого интервала — равна линейной функции (скорость роста постоянна). Значение с, т. е. то значение аргумента, при котором происходит уменьшение скорости роста исследователю неизвестно и его тоже приходится каким-либо образок оценивать. Если исследователь имеет представление о возможных отклонениях, то в качестве с можно выбрать критическое значение «нормального» отклонения, начиная с которого вклад в минимизируемую сумму должен измеряться не квадратичной, а менее чувствительной функцией. Если же априорное значение о возможных отклонениях отсутствует, то имеет смысл воспользоваться робастной оценкой с привлечением параметра масштаба о. Тогда отклонения измеряются в стандартных единицах. Используя о, можно, нагример, предложить следующее правило определения с. Пусть в функции с — значение аргумента, при котором квадратичность переходит в функцию меньшего роста. Полагаем с оценка о. Предложенное правило нагоминает известное правило «трех сигм».

Итак, пусть непрерывная, кусочно дифференцируемая, симметричная относительно нуля, возрастающая на функция, -оценкой назовем вектор, обращающий сумму

в минимум, где а — параметр масштаба, также подлежащий оцениванию. По сути дела, (5.11) определяет целый класс оценок; каждая оценка зависит от выбора функции Обозначим производную функцию Вместо минимизаций суммы (5.11) можно искать решение уравнений

Для оценивания о выберем простейшую статистику: равно медиане

При минимизации (5.11) в принципе можно воспользоваться общими методами минимизаций функций многих переменных (градиентный метод, метод Ньютона и др.). Однако нетрудно обобщить известный нам итеративный МНК и на более общий случай (5.12). Если же для функции подходы Флетчера — Гранта — Хеблена и Мудрова — Кушко совпадают, то для произвольной функции они приведут, вообще говоря, к разным итерационным процессам.

Итеративный МНК Флетчера — Гранта — Хеблена, Преобразуем уравнения (5.12) следующим образом:

где веса равны:

Итерации производятся так же, как в итеративном МНК.

Метод вариационно-взвешенных квадратических приближений Мудрова-Кушко. Функция (5.11) сводится к сумме квадратов отклонений:

Ясно, что в общем случае веса будут отличны друг от друга, что приведет и к разным итерационным процессам. Однако и в том и в другом случаях мы должны получить одинаковые пределы для оценок параметров. Легко проверить, что для

Рассмотрим робастные оценки ММП, обращающие сумму (5.11) в минимум для разных

Оценка Хюбера (5.3). Правило «трех сигм» предлагает с взять равным 3. Использование итеративного МНК Флетчера — Гранта — Хеблена для регрессии-примера не привело к оценке, процесс оказался расходящимся. С другой стороны, метод Мудрова — Кушко (вернее, его обобщение) сошелся уже на второй итерации. Полученные оценки мало отличаются от оценок МНК. Вектор оценок равен (0,395; 0,228; 3,75; — 17,12). Оценка параметра масштаба равна 1,33.

Оценка Андрюса [73]. Автор обобщает -оценку, введенную им для оценивания параметра положения на случай

регрессии. В качестве Андрюс предлагает следующую функцию (рис. 5.4):

Идея заключается в том, что на интервале функция близка к квадратичной, на интервалах скорость роста функции (5.15) уменьшается. Для вклад отклонений не зависит от их величины и равен Используя правило «трех сигм», найдем значение с. Робастные свойства функции (5.15) проявляются для значений причем в точках вторая производная (5.15) обращается в нуль. Таким образом, полагаем откуда Использование метода Мудрова — Кушко после пяти итераций в регрессии-примере привело к оценке (0,398; 0,212; 3,71; — 16,1), которая также незначительно отличается от оценки МНК.

Рис. 5.4. Функция Андрюса для

Оценка Рамсея [173] основана на функции

Легко показать, что при функция Рамсея переходит в квадратичную. Для малых значений функция (5.16) близка к функции При имеет асимптоту, равную Найдем значение у, используя правило «трех сигм». Для этого найдем вторую производную функции Рамсея и приравняем ее к нулю: откуда точки перегиба функции (5.16). Полагаем откуда После восьми итераций по методу Мудрова — Кушко для регрессии-примера была получена следующая оценка параметров: (0,404; 0,159; Все три функции привели к параметрам, мало отличающимся от оценок МНК. Это говорит о том, что в регрессии-примере нет ярко выраженных выбросов, поэтому оценка МНК вполне приемлема.

<< Предыдущий параграф Следующий параграф >>
Оглавление