Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Связь в таблицах 2X2

33.3 Исторически очень большая часть литературы по категоризованным переменным была посвящена задачам проверки наличия и измерения взаимозависимости между двумя такими переменными. Мы полностью оставляем в стороне задачу оценивания взаимозависимости в случае, когда переменные — случайные величины, вид распределений которых известен или предполагается известным. В случае двумерного нормального распределения эта задача была рассмотрена в 26.27-33. Другими словами, мы ограничиваемся непараметрическими задачами.

33.4 Рассмотрим вначале генеральную совокупность, в которой классификация произведена на основании наличия или отсутствия некоторого признака А. Простейшая задача о взаимозависимости возникает, когда имеется два признака А и В. Если а обозначает отсутствие отсутствие В, то количества попаданий в четыре возможные подгруппы могут быть в очевидных обозначениях представлены таблицей

(см. скан)

Эта таблица (иногда называемая четырехклеточной таблицей) часто будет записываться в уже встречавшейся нам форме (26.58):

Если между не существует никакой связи, т. е. если обладание признаком А не связано с обладанием признаком В, то доля индивидов с признаком А среди индивидов, обладающих признаком В, должна быть равна доле индивидов с признаком А среди индивидов, не обладающих признаком В. Таким образом, по определению признаки независимы в данной совокупности из наблюдений, если

Из (33.3), кроме того, получаем

Соотношение (33.3) может быть также переписано в виде равенства

Если теперь для какой-либо таблицы выполнено неравенство

означающее, что доля А среди В больше, чем среди то называются положительно связанными или просто связанными. В случае выполнения противоположного неравенства

мы будем говорить, что отрицательно связаны.

Пример 33.1

В следующей таблице (Гринвуд и Юл, 1915, Proc. Roy. Soc. Medicine, 8, 113) приведены 818 случаев, классифицированных по двум признакам: наличию прививки против холеры (признак А) и отсутствию заболевания (признак В).

(см. скан)

Если бы признаки были независимы, то частота класса (включающего имеющих прививку и незаболевших) была бы равна Наблюденная частота больше этой величины. Следовательно, вакцинация положительно связана с отсутствием заболевания.

<< Предыдущий параграф Следующий параграф >>
Оглавление