Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Выбор классов для критерия «хи-квадрат»

30.20 Вся асимптотическая теория критерия которая обсуждалась до сих пор, справедлива при любом определении классов, в которые группируются наблюдения, если только они определяются безотносительно к результатам наблюдений. Выделенное условие существенно, так как мы не предусматривали возможности того, чтобы границы классов сами были случайными величинами. Однако обычной практикой является определение границ классов, а иногда даже выбор по рассмотрении общей картины, даваемой наблюдениями. Мы должны, следовательно, обсудить способы образования классов и затем рассмотреть, насколько это влияет на развитую нами теорию.

Мы рассмотрим сначала определение границ классов, оставляя вопрос о выборе на более позднее время. Если сама задача обусловливает дискретный характер данных (как в примере 30.1, где было четыре естественных группы) или если мы имеем выборку наблюдений из дискретного распределения, то задача о границах классов возникает только в том смысле, что мы можем решить (чтобы уменьшить или чтобы улучшить точность асимптотического распределения как мы увидим ниже в 30.30) объединить некоторые из теоретических частот в дискретных точках. Действительно, если дискретное распределение имеет бесконечную область, как, например, пуассоновское, мы вынуждены, если не должно быть бесконечным, производить объединение некоторых классов с чрезвычайно малыми, в большинстве, теоретическими частотами. Но проблема границ классов наиболее остро возникает, только когда мы имеем выборку из непрерывного распределения. В этом случае нет никаких теоретических частот. Если мы предположим, что каким-то образом определено заранее, то как определять границы классов?

На практике решение обычно диктуется арифметическим удобством: классы берутся покрывающими равные отрезки из

менения варианты, за исключением крайних, где область изменения варианты бесконечна. Размер класса грубо определяется дисперсией распределения, тогда как положение распределения помогает определить, где должен быть центральный класс. Таким образом, если нам нужно было бы образовать 10 классов для выборки, проверяемой на нормальность, мы могли бы грубо оценить (возможно, на глаз) выборочные среднее х и стандартное отклонением и взять в качестве границ классов Тогда получились бы классы

30.21 Хотя это и не очень точно определенная процедура, ясно, что она делает границы классов случайными величинами, и заранее не очевидно, что статистика вычисленная для классов, образованных таким способом, имеет то же асимптотическое распределение, что и в случае, когда классы фиксированы наперед. Однако интуиция подсказывает, что, поскольку асимптотическая теория справедлива для любой совокупности из фиксированных классов, она должна быть справедлива и когда границы классов определяются по выборке. То, что это утверждение выполняется при определении границ классов регулярными оценками неизвестных параметров, было показано для случая нормального распределения Ватсоном (1957b) и для общего случая непрерывных распределений Роем (1956) и Ватсоном (1958, 1959).

Таким образом, мы можем пренебречь случайностью границ интервалов, коль скоро дело касается асимптотического распределения при гипотезе Конечно, это повлияет на распределения при малых выборках, но о точных размерах этого влияния еще ничего не известно. (Распределения при малых выборках в случае фиксированных границ мы обсуждаем ниже, в 30.30).

<< Предыдущий параграф Следующий параграф >>
Оглавление