Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Влияние дискретности: поправки на непрерывность и совпадения

31.80 В ряде случаев как в этой главе, так и в других мы приближали дискретные распределения (в теперешнем контексте — перестановочные распределения статистик критериев) их непрерывными предельными формами. Это приближение часто,

хотя и не всегда (см. Плэкетт (1964) и 33.27 ниже) может быть улучшено применением поправки на непрерывность, которая сводится к следующему простому правилу: когда последовательные дискретные вероятности в точном распределении связаны с точками то вероятность в точке считается относящейся к интервалу Таким образом, когда мы хотим найти значение ф. р. в точке с помощью непрерывной аппроксимации, мы в действительности ищем ее значение в точке

31.81 Имеется еще один вопрос, связанный с непрерывностью, который мы должны обсудить здесь. Наши гипотезы относились к наблюдениям из непрерывных ф. р., и это означает, что для любой пары наблюдений вероятность их точного совпадения равна нулю и что мы, следовательно, можем пренебречь этой возможностью. Поэтому мы на протяжении этой главы предполагали, что наблюдения могут быть упорядочены без совпадений, так что ранговые статистики были определены однозначно. Однако на практике наблюдения всегда округляются до нескольких значащих цифр, и поэтому совпадения будут иногда появляться. Аналогично, если истинные функции распределения наблюдений на самом деле не непрерывны, а приближенно представлены как непрерывные ф. р., будут появляться совпадения. Как преодолеть эту трудность получения ранжировки при наличии совпадений?

В литературе обсуждались два метода обращения с совпадениями. Первый состоит в том, чтобы упорядочить совпавшие наблюдения случайным образом. Его достоинством является простота, он не требует новой теории, но при этом мы, очевидно, жертвуем информацией, содержащейся в наблюдениях, и можно ожидать, что он будет менее эффективен, чем второй метод, состоящий в том, что каждому из группы совпавших наблюдений приписывается средний ранг этой группы. Достоинства обоих методов исследовались довольно мало, но Путтер (1955) показал, что критерий Вилкоксона при случайном разделении совпадений имеет меньшую АОЭ, чем когда придаются средние ранги. Крускал и Уоллис (1952, 1953) и Крускал (1952) обсуждают совпадения в -критерии.

До появления дальнейшей информации метод среднего ранга кажется более общеупотребительным. К сожалению, при этом методе пропадает отмечавшееся нами свойство ранговых критериев, что их точные распределения могут быть табулированы раз и навсегда. Потому что если используется метод среднего ранга для разделения совпадений, то на сумму множества рангов это не влияет, но, скажем, их дисперсия изменяется. Перестановочное распределение при малых объемах выборок теперь

зависит от количества и размеров наблюденных совпадений, и это затрудняет табулирование. Кендалл (1962) дает подробные описания и указания относительно необходимых поправок для ранговых коэффициентов корреляции и близких к ним статистик (включая статистику Вилкоксона); другие обсуждения поправок были упомянуты выше.

31.82 Наконец, мы видели в 31.56 и 31.62 и увидим снова в 32.9 и 32.13, что если распределение наблюдений дискретно, то методы, основанные на предположении непрерывности, оказываются консервативными.

УПРАЖНЕНИЯ

(см. скан)

(см. скан)

(см. скан)

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление