Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ГЛАВА 33. КАТЕГОРИЗОВАННЫЕ ДАННЫЕ

33.1 Большая часть этой книги была посвящена анализу наблюдений, представленных в виде числовых значений. Однако в главе 31 для проверки гипотез были использованы также ранговые статистики. Последние могут быть получены как из числовых значений наблюдений, так и из рангов, если измерения получить трудно или даже невозможно. В настоящей главе рассматриваются категоризованные данные, т. е. данные, представленные в виде частот наблюдений, попавших в некоторые категории или классы. Мы, правда, уже имели дело с задачами группировки значений варианты в классы, например, в связи с вычислением моментов. Однако эта группировка производилась лишь для удобства вычислений, и, во всяком случае, мы в основном имели дело с одномерными задачами. Сейчас же мы будем специально заниматься вопросами, касающимися статистических связей (зависимости или взаимозависимости) между двумя или более «переменными», выраженными в категоризованной форме. Мы поставили слово «переменные» в кавычки, поскольку оно здесь понимается в самом общем смысле.

Категоризованная «переменная» может представлять собой просто подходящую классификацию числовой переменной по группам. С такой ситуацией мы уже знакомы. С другой стороны, такая переменная может вообще не выражаться в терминах какой-либо исходной числовой переменной. Например, можно классифицировать людей (а) по их росту, (б) по цвету волос, (в) по любимым киноактерам. В этом случае (а) будет категоризацией числовой переменной, чего нельзя сказать и (в). В свою очередь, (б) отличается от (в) тем, что цвет волос может быть в принципе представлен на шкале, упорядоченной в соответствии с пигментацией (от светлого к темному), тогда как в случае (в) это невозможно. Конечно, можно предложить различные виды классификации киноактеров, однако, по существу, киноактеры никак не упорядочены. Классификация, или категоризация, (б) является упорядоченной, неупорядоченной. В качестве крайнего случая неупорядоченной классификации можно рассмотреть классификацию, заключающуюся

просто в различении нескольких выборок (которые мы хотим сравнивать по некоторой другой переменной).

33.2 Следует иметь в виду, что иногда две изучаемые переменные могут быть одной и той же переменной, наблюдаемой в двух разных ситуациях (например, до и после некоторого события) или в двух связанных между собой выборках (например, отец и сын, муж и жена и т. д.). В таких случаях мы будем говорить об однородных категоризациях. Разумеется, однородные категоризации могут принадлежать к любому из типов (а), (б) или (в) пункта 33.1.

<< Предыдущий параграф Следующий параграф >>
Оглавление