Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Метод смешанных семиинвариантов Гири

29.28 Рассмотрим сначала метод, предложенный Гири (1942b, 1943) для модели структурной зависимости, но который применим также и в случае функциональной зависимости.

Запишем линейное структурное соотношение в симметричной форме:

Величины наблюдаются с ошибками так что в действительности мы наблюдаем величины Предполагается, что ошибки не зависят от и друг от друга. Рассмотрим совместную производящую функцию семиинвариантов случайных величин Она равна сумме ошибок Смешанные семиинварианты последних, согласно примеру 12.7, равны нулю. Следовательно, смешанные семиинварианты двух систем случайных величин совпадают. Обозначая семиинварианты и семиинварианты и записывая порядки семиинвариантов в скобках, получаем

при условии, что по крайней мере два из больше нуля. Таким образом, смешанные семиинварианты х, могут быть оценены путем оценивания соответствующих смешанных семиинвариантов

29.29 Совместная х. ф. случайных величин измеренных относительно их истинных средних, равна

где Дифференцируя (29.82) по каждому из и используя (29.80), получаем

Отсюда для находим

Поскольку по определению

то в силу (29.84) для всех имеем

Соотношения (29.85) в силу (29.81) выполняются также для смешанных моментов наблюдаемых величин если по крайней мере два аргумента каждого семиинварианта больше нуля, т. е. если два или более Приведенные рассуждения сохраняют силу и в случае функциональной зависимости. Случайная величина над которой было произведено наблюдений, тогда заменяется набором из фиксированных значений Если эти значения рассматривать как конечную совокупность, которая извлечена без остатка, то ход рассуждений не меняется.

29.30 К сожалению, метод оценивания с помощью (29.85) (с заменой смешанных семиинвариантов их оценками) совершенно непригоден в случае, когда имеют совместное нормальное распределение, т. е. в наиболее важном для практики случае. Действительно, суммарный порядок каждого семиинварианта в (29.85) равен так как два или более Однако, как было показано в 15.3, все семиинварианты порядка

в случае нормального распределения равны нулю. Таким образом, в данной ситуации уравнения (29.85) оказываются бесполезными. Это неудивительно, так как мы, имея здесь дело со случаем неидентифицируемости, рассмотренным ранее в 29.9, не сделали никаких дополнительных предположений, чтобы обеспечить идентифицируемость.

Даже в случае распределений, отличных от нормального, остается неясным, какие из соотношений (29.85) выбрать для оценивания коэффициентов Нам нужно только уравнений, но мы можем выбрать их бесконечным числом способов (в предположении, что все семиинварианты существуют). Естественно использовать уравнения наиболее низкого порядка, беря самые малые так как тогда оценки смешанных семиинвариантов в (29.85) будут иметь меньшие выборочные флуктуации (см. Однако при этом следует соблюдать осторожность, даже в простейшем двумерном случае, который мы сейчас рассмотрим подробнее.

29.31 Рассмотрим случай характеризуемый соотношением (29.13), которое мы запишем в виде и которое представляет собой частный случай (29.80) при (за начало отсчета приняты средние приводит к соотношениям

или, если

Последнее соотношение выполняется при любых следовательно, как замечено в 29.30, бесполезно в случае нормального распределения. Однако даже если распределены не по нормальному маргинальные распределения могут оказаться симметричными, и тогда все нечетные смешанные моменты и, следовательно, смешанные семиинварианты будут равны нулю. Таким образом, даже при отсутствии нормальности мы должны позаботиться о том, чтобы сумма была четной. Приведем соотношения наиболее низкого порядка, которые обычно оказываются полезными:

В этих соотношениях используются семиинварианты которые нужно оценить по наблюдениям.

Остается нерешенным вопрос о том, какое из соотношений (29.87) или их комбинацию использовать при решении конкретной задачи. Мадански (1959) предлагает находить линейную

комбинацию, имеющую минимальную дисперсию. Однако для этого требуются чрезвычайно громоздкие выкладки, и решение не всегда возможно, если нет дополнительных предположений о распределении

Даже если симметрия отсутствует, исходное распределение может оказаться таким, что смешанные семиинварианты в знаменателе (29.87) будут равны или близки к нулю. В этом случае оценка будет иметь сильные выборочные флуктуации.

Пример 29.3

Рассмотрим данные примера 29.1 с новой точки зрения. Имеем

где Используя (3.81), находим оценки семиинвариантов:

Подставляя эти оценки в уравнение (29.86), получаем оценку для

Второе уравнение (29.87) дает более близкое к истине значение:

Может показаться более предпочтительным вместо семиинвариантов в этих уравнениях использовать -статистики. Поскольку мы имеем дело с центральными моментами, то в соответствии с 13.2 получаем

Отсюда видно, что использование -статистик вместо выборочных семиинвариантов не меняет значения оценки (29.88). Что касается оценки (29.89), то она теперь равна

Следует напомнить, что эти данные были в действительности порождены нормальными случайными величинами, так что неудивительно, что оценка (29.88) далека от истинного значения (МП-оценка в примере 29.1 была равна 1,99). Это полностью согласуется с замечаниями, сделанными в 29.30-31, так как, по существу, мы оцениваем здесь отношение двух нулевых величин.

Отметим, что оценка (29.89) оказалась немного ближе к МП-оценке, чем более точная на первый взгляд оценка (29.90). «Уточнение» это, однако, только кажущееся, так как хотя -статистики являются несмещенными оценками для семиинвариантов, в данном случае оценивается отношение семиинвариантов, так что смещены обе оценки. Оценка (29.89) вычисляется несколько проще.

Читатель может прозерить, что если использовать первое из уравнений (29.87), то мы получим откуда найдем оценку которая очень близка к (29.89).

В случае больших выборок из нормального распределения ни одна из рассмотренных оценок не будет надежной.

29.32 Резюмируя, можно сказать, что метод оценивания с помощью смешанных семиинвариантов, хотя и не требует дополнительных предположений, оказывается легко уязвимым, причем с несколько неожиданной стороны. Оценкой служит отношение семиинвариантов, и если семиинвариант в знаменателе равен нулю или близок к нему, то оценка может иметь сильные выборочные флуктуации, которые не только не исчезают при возрастании объема выборки, а, наоборот, могут увеличиться.

<< Предыдущий параграф Следующий параграф >>
Оглавление