Главная > Математика > Линейная и нелинейная регрессии
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.9. Сравнение оценок методом статистических испытаний

Рассмотрим результаты исследования, проведенного Дж. Вебстером, Р. Гунстом и Р. Мазоном [117], по выявлению предпочтительной оценки из 5 оценок: МНК, оценки метода главных компонент, ридж-оценки, редуцированной оценки и оценки Хокинса. Сравнение проводилось на основе метода статистических испытаний (метода Монте-Карло). При этом варьировались три характеристики: 1) ориентация неизвестного вектора по отношению к характеристическим векторам матрицы плана относительная длина вектора т. е. степень мультиколлинеарности. Во всех расчетах значение было равно Матрица выбиралась двумя способами: в первом способе столбцы матрицы были почти ортогональны (отсутствие, мультиколлинеарности), во втором — первый столбец представлял собой с небольшими отклонениями линейную комбинацию второго, третьего и четвертого (наличие мультиколлинеарности). Длина «истинного» вектора во всех расчетах была равна 1, при этом принимало четыре значения, так что . Вектор принимал три значения: косинус угла между поэтому был равен 0; 0,5 и 1 соответственно. Таким образом, имелось варианта. Для каждого варианта проводилось 100 испытаний, на основе которых вычислялась средняя сумма квадратов ошибок, деленная на т. е. В ридж-оценке значение выбиралось равным представителем редуцированной оценки была выбрана оценка Джеймса-Стейна. В «почти ортогональной» модели для оценки метода главных компонент считалось в случае мультиколлинеарности т. е. равно нулю.

Очевидно, в почти ортогональной модели оценка МНК совпадает с оценкой главных компонент и оценкой Хокинса. Во всех вариантах наилучшей оценкой в «почти ортогональной» модели оказалась ридж-оценка. Наиболее заметное преимущество эта оценка (по сравнению с оценками

имела в случае небольших значений для предельного все оценки привели приблизительно к одной и той же ССКО. Оценка Джеймса-Стейна была немного хуже ридж-оценки, но опять же намного лучше оценок для Полученный результат можно было предсказать из теоретических соображений: для ортогональных моделей оценка Джеймса-Стейна имеет ССКО меньшую, чем оценка МНК, для всех Ридж-оценка есть частный случай редуцированной оценки.

В случае мультиколлинеарности положение несколько изменилось. Во-первых, оценка Хокинса во всех расчетах имела сходные свойства с оценкой метода главных компонент, поэтому будем говорить только о последней. Во-вторых, оценка Джеймса-Стейна была лишь немногим лучше оценки МНК во всех ситуациях. Оценка метода главных компонент и оценка Хокинса имели наименьшую ССКО в случае В то же время в наихудшем для них варианте отношение их ССКО к ССКО оценки МНК было приблизительно равно 40.

Ридж-оценка давала не такое низкое значение ССКО для как оценки зато для экстремальной ситуации этой оценки была не намного выше оценки МНК. Это позволяет сделать вывод: предпочтительнее пользоваться ридж-оценкой если мультиколлинеарности нет, ее ССКО практически совпадает с ССКО оценки МНК, в случае мультиколлинеарности, исключая экстремальные ситуации, она значительно лучше оценки МНК. Есть еще одно обстоятельство, которое заставляет смотреть на предпочтение оценок в случае с определенной осторожностью. Известно, что в приведенном эксперименте существовала только одна приближенная линейная зависимость поэтому значение было известно. На практике неизвестно, сколько зависимостей существует между столбцами матрицы Допуская ошибки в определении мы тем самым можем резко повысить ССКО для оценки метода главных компонент и оценки Хокинса. К тому же авторы исследования использовали не лучший вариант выбора (см. параграф 6.5).

Р. Гунст, Дж. Вебстер и Р. Мазон [117] сравнили также эффективность оценивания отдельных параметров. В качестве первого параметра был выбран — параметр при переменной, которая «завязана» в мультиколлинеарность, и

при переменной, которая не «завязана» в мультиколлинеарность. Сравнение проводилось по величине

одна из пяти рассматриваемых оценок. Оказалось, что при оценивании ситуация остается такой же, как и при использовании в качестве критерия ССКО. При оценивании все пять методов мало отличаются друг от друга. Полученный вывод весьма ценен: задаваясь целью хорошо оценить параметры, «завязанные» в мультиколлинеарность, мы тем самым оцениванием остальные параметры не хуже, чем методом наименьших квадратов.

Можно прийти к выводу, что наиболее предпочтительна ридж-оценка.

Исследование, проведенное в [134], специально посвящено сравнению оценки МНК и ридж-оценок. Авторы рассмотрели три регрессии. Значения в них были соответственно равны 13 и 4, 13 и 10, 50 и 17. В экспериментах варьировались значения Для первых двух регрессий было рассмотрено 342 варианта, для третьей — 180. Для каждого варианта моделировались случайные отклонения распределенные по нормальному закону Значение в ридж-оценке вычислялось по формуле Выводы, к которым пришли авторы, сводятся к следующему:

1) ридж-оценка была лучше оценки МНК в более чем 50% всех вариантов;

2) число вариантов, в которых ридж-оценка лучше оценки МНК, увеличивалось с ростом

3) процент предпочтения ридж-оценки увеличивался также при увеличении разброса спектра матрицы т. е. при усилении мультиколлинеарности;

4) процент предпочтения ридж-оценки возрастал также с ростом величины

Выявлением эффективных оценок методом Монте-Карло занимались А. Демпстер, Шатзофф и Вермут [94]. В первой группе проведенных ими экспериментов мультиколлинеарность отсутствовала (32 варианта), во второй группе — мультиколлинеарность присутствовала (128 вариантов). Было исследовано 57 методов оценивания: ридж-оценки, оценки метода главных компонент, редуцированные оценки, оценки метода автоматического отсева

переменных и многие другие. В качестве критерия выбиралась средняя сумма квадратов ошибок. Не вдаваясь в подробности проведения экспериментов, сразу перейдем к основным выводам, полученным в ходе исследования:

1) обычный МНК в некоторых случаях оказался хуже тривиальной оценки, когда все координаты считались равными нулю. МНК занял одно из последних мест;

2) наиболее эффективной оказалась ридж-оценка;

3) редуцированные оценки, представителем которых была модифицированная оценка Джеймса-Стейна, также зарекомендовали себя относительно хорошо.

Как видим, авторы исследований по сравнению эффективностей методов оценок параметров регрессий в условиях мультиколлинеарности, рассмотренных в этой главе, приходят к общему выводу: ридж-оценка является одной из наиболее эффективных.

При применении ридж-оценок сталкиваются с трудностью выбора параметра регуляризации Как правило, наиболее аргументированные методы выбора этого параметра приводят к тому, что он становится стохастическим, поэтому аналитическое исследование статистических свойств оценки затруднительно. Метод Монте-Карло оказывает здесь неоценимую услугу.

<< Предыдущий параграф Следующий параграф >>
Оглавление