Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Устойчивость стандартных процедур «нормальной теории»

31.2 Начавшись с ранних экспериментальных исследований, в первую очередь Э. Пирсона, изучение устойчивости продолжалось теоретическими исследованиями, среди которых работы Бартлетта (1935а), Гири (1936, 1947) и Гейена (1949—1951), по существу, имеют аналогичную форму. Предполагается, что наблюдения получены из генеральных совокупностей, определяемых разложениями Грама — Шарлье или Эджворта, и поправочные члены к нормальной теории получаются в виде функций от нормированных старших семиинвариантов, в частности Эти результаты могут быть, в общем, выражены утверждением, что критерии, касающиеся генеральных средних (т. е. -критерии Стьюдента для среднего значения нормального распределения и для разности средних двух нормальных распределений с одинаковыми дисперсиями), довольно нечувствительны к отклонениям от нормальности, а критерии, касающиеся дисперсий (т. е. -критерий для дисперсии нормального распределения, F-критерий для отношения дисперсий двух нормальных распределений и модифицированный критерий отношения правдоподобия для равенства нескольких дисперсий в примерах 24.4, 24.6), очень чувствительны к таким отклонениям. Критерии для средних устойчивы; в сравнении с ними критерии для дисперсий следует считать неустойчивыми. У нас нет здесь места для подробного вывода этих результатов, но их легко объяснить в общих словах.

31.3 Ключевым моментом при выводе распределения -статистики Стьюдента является независимость ее числителя и знаменателя, которая выполняется точно только для нормальных исходных распределений. Если мы производим выборку из генеральной совокупности, отличной от нормальной, то центральная предельная теорема тем не менее дает нам, что выборочное среднее и несмещенная оценка дисперсии будут распределены асимптотически нормально. Более того, мы знаем из правила 10 для выборочных семиинвариантов -статистик в 12.14, что

Так как

то для асимптотической корреляции между мы имеем из (31.1)

Если генеральная совокупность симметрична, то в (31.3) равны нулю, и, следовательно, асимптотически независимы, так что нормальная теория будет справедлива для достаточно больших Если то (31.3) будет меньше, когда велико, но останется не равным нулю. Ситуацию, однако, спасает тот факт, что точное -распределение Стьюдента само приближается к нормальному при так же как и, по центральной предельной теореме, распределение статистики

поскольку сходится по вероятности к Оба предельных распределения совпадают.

Таким образом, каково бы ни было исходное распределение, статистика (31.4) асимптотически нормальна, и, следовательно, в пределе справедлива нормальная теория. Если исходное распределение симметрично, мы можем ожидать более быстрой сходимости к распределению, даваемому нормальной теорией -распределение Стьюдента). Это на самом деле и есть результат, подтверждаемый подробными исследованиями: для малых выборок нормальная теория менее устойчива по отношению к отклонениям асимметрии, чем к отклонениям эксцесса.

31.4 Аналогично обстоит дело для двухвыборочной -статистики Стьюдента. Если две выборки получены из одной и той же генеральной совокупности, отличной от нормальной, а мы применяем нормальную статистику

то ковариация между и членом в квадратных скобках в знаменателе, который обозначим дается формулой

тогда как соответствующие дисперсии равны

Корреляция, следовательно, равна асимптотически

Снова, если асимптотическая нормальность влечет асимптотическую независимость. Мы также видим, что равно нулю, если Во всяком случае, когда становятся большими, центральная предельная теорема приводит к асимптотической нормальности выражения (31.5) и, следовательно, к согласию с -распределением Стьюдента.

И опять это в точности совпадает с результатами, полученными Бартлеттом (1935а) и Гейеном (1949—1951): если объемы выборок равны, то даже асимметрия исходного распределения вызывает малое отклонение от нормальной теории. Если исходное распределение симметрично, то критерий будет устойчив даже при неодинаковых объемах выборок.

31.5 Для -критериев Стьюдента изучались также влияния более сложных отклонений от нормальности. Хюрениус (1950) рассматривал выборку из составного нормального распределения; другие шведскне авторы, наиболее поздним из которых является Закриссон (1959), дающий ссылки на более ранние работы, таюке рассматривали различные формы генеральных совокупностей, составленных из нормальных подсовокупностей. Роббинс (1948) нашел распределение когда наблюдения получены из нормальных распределений, отличающихся только средними. Для двухвыборочного критерия Гири (1947) и Гейен (1949—1951) рассматривают случай, когда две выборки могут происходить из различных генеральных совокупностей.

31.6 Когда мы переходим к критериям для дисперсий, картина становится совсем иной. Ключевым пунктом нормальной теории во всех критериях для дисперсий является тот факт, что отношение распределено как степенями свободы. Если мы рассмотрим выборочные семиинварианты величины то из (12.35) мы видим, что

тогда как из (12.36)

и аналогично для старших моментов из (12.37) — (12.39). Из этих выражений становится ясно, что распределение зависит

от всех нормированных семиинвариантных отношений и что члены, содержащие эти отношения, имеют тот же порядок по что и постоянные члены нормальной теории. Эти дополнительные члены пропадают тогда и только тогда, когда все высшие семиинварианты равны нулю, т. е. когда распределение наблюдений нормально. В противном случае (31.7) показывает, что, хотя z распределено асимптотически нормально, распределение z не будет асимптотически приближаться -распределению, даваемому нормальной теорией. Здесь центральная предельная теорема не спасает нас, так как распределение z стремится к нормальному распределению, отличному от того, которого мы хотим.

31.7 Поскольку фигурирует в (31.7), а нет, следует ожидать, что отклонение от нормального эксцесса будет оказывать большее влияние на распределение, и именно в этом состоит результат, полученный после детальных выкладок Гейеном (1949—1951) для критериев и отношения дисперсий. Бокс (1953) нашел, что расхождения с нормальной теорией увеличиваются, когда число сравниваемых дисперсий возрастает, и его рассуждения достаточно просты, чтобы воспроизвести их здесь.

Предположим, что выборок объемов извлечены из генеральных совокупностей, имеющих одну и ту же дисперсию и один и тот же коэффициент эксцесса

Из (31.7) мы тогда имеем асимптотически для любой из выборок

где несмещенная оценка для По центральной предельной теореме асимптотически нормальна со средним и дисперсией (31.8) и, следовательно, распределена так, как если бы она была получена из нормальной генеральной совокупности и основана на наблюдениях вместо Таким образом, воздействие на модифицированный критерий ОП для сравнения нормальных дисперсий, приведенный в (24.44), состоит в том, что а не само распределено асимптотически как степенями свободы.

Влияние этой поправки на распределение, даваемое нормальной теорией, может быть чрезвычайно сильным. В следующей таблице мы приводим некоторые результаты вычислений Бокса (1953).

Истинная вероятность превышения критического уровня, даваемого асимптотической нормальной теорией для

(см. скан)

Как видно из таблицы, отклонение от значения 0,05, соответствующего нормальной теории, возрастает с ростом и с ростом при любом фиксированном

31.8 Хотя результат 31.7 имеет асимптотический характер, Бокс (1953) показал, что аналогичные расхождения происходят и при малых выборках. Поразительное отсутствие устойчивости дисперсионного критерия заставило его рассматривать статистику I из (24.44) как статистику критерия для эксцесса, и он нашел, что чувствительность этого критерия имеет тот же порядок, что и у общеупотребительных критериев, указанных в 30.63.

31.9 Наконец, мы кратко упомянем, что Гейен (1949—1951) рассмотрел устойчивость выборочного коэффициента корреляции и фишеровского z-преобразования к отклонениям от двумерной нормальности. Когда теоретический коэффициент корреляции в частности, когда случайные величины независимы, распределение устойчиво даже при столь малом объеме выборки, как 11; но при больших значениях отклонения от нормальной теории становятся заметными. Когда исходное распределение отлично от нормального, z-преобразоваиие остается асимптотически нормальным, но скорость сходимости уменьшается. На среднее и дисперсию с точностью до порядка не влияет асимметрия исходных маргинальных распределений, но влияние отклонений от нормального эксцесса может быть заметным; в частности, дисперсия z чувствительна к форме исходного распределения даже при больших выборках, хотя математическое ожидание z медленно приближается к своему нормальному значению, когда растет.

Хотеллинг (1961) применяет совершенно иной подход к задачам устойчивости и приводит полезный библиографический список.

Хубер (1964) проводит общее исследование устойчивости оценок параметра сдвига; см. также Бикел (1965) и Гастверт (1966).

<< Предыдущий параграф Следующий параграф >>
Оглавление