Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Меры связи

33.5 Если ставить вопрос о выражении степени связи двух признаков одним коэффициентом, то естественно потребовать, чтобы были известны границы изменения этого коэффициента и чтобы он принимал среднее или нижнее значение интервала изменения в случае, когда признаки не связаны («независимы»). Изменением положения и масштаба любой такой коэффициент можно заставить изменяться в интервале тогда случай независимости будет соответствовать нулевому значению коэффициента. Это удобно тем, что свойства определяемого коэффициента оказываются согласованными со свойствами обычного коэффициента корреляции (см. 26.9). В некоторых случаях, однако, более предпочтительным является интервал (0, 1); тогда нулевое значение соответствует случаю независимости.

Другим желательным свойством меры связи было бы ее возрастание при переходе от отрицательной связи к положительной. Рассмотрим разность между наблюденной частотой и частотой, полученной в предположении «независимости», для клетки

Для постоянных маргинальных частот, очевидно, разность между наблюденной и «независимой» частотами в любой клетке

равна тем самым однозначно определяет отклонение от независимости. Поэтому естественно потребовать, чтобы наш коэффициент возрастал с возрастанием

33.6 Следуя Юлу (1900, 1912), мы определим коэффициент связи равенством

Этот коэффициент равен нулю, если признаки независимы, т. е. если и может принимать значение только когда т. е. в случае полной связанности (либо все А одновременно являются В, либо все В одновременно являются А), а значение —1, только когда т. е. в случае полной отрицательной связанности. Кроме того, возрастает с возрастанием Действительно, вводя обозначение получаем

откуда

Поскольку произвольная также отрицательна, то положительна. предложил, кроме того, так называемый коэффициент коллигации

Но нетрудно показать, что

так что мы, по-видимому, ничего не выиграем, используя У. Легко видеть, что коэффициент коллигации удовлетворяет всем нашим условиям.

Третий коэффициент, к которому мы вернемся позднее в 33.17, определяется формулой

Очевидно, что он равен нулю, когда и возрастает с возрастанием Если то мы получаем

что

Так как ни одна из частот не может быть отрицательной, то это уравнение имеет решение только в случае, когда по крайней мере два из чисел равны нулю. Случай, когда равны нулю частоты из одной строки или из одного столбца, является вырожденным. Остается, следовательно, рассмотреть случай и случай первом из них во втором два числа служат для V границами.)

33.7 Можно заметить, что, в то время как только при обращении в нуль двух частот в таблице принимают значение единица при обращении в нуль одной частоты. Здесь возникает вопрос об определении полной связи. Будем говорить, что связь между полная, если все являются одновременно В, несмотря на то что не все В являются одновременно А. Если все немые люди глухи, то это означает, что существует полная связь между немотой и глухотой, хотя есть много глухих людей, которые не являются немыми. Коэффициент V равен 1 только тогда, когда все А являются одновременно В и все В являются одновременно А, — условие, которое можно, если угодно, рассматривать как определение абсолютной связи.

Следует обратить внимание на то, что статистическая связь отличается от связи в обычном смысле. В повседневной речи мы говорим, что связаны, если они достаточно часто встречаются вместе, а в статистике они считаются связанными только в том случае, если встречается относительно чаще среди В, чем среди Если 90% курящих страдают плохим пищеварением, то мы не можем сказать, что курение и плохое пищеварение связаны, пока не будет показано, что среди некурящих страдают плохим пищеварением менее чем 90%.

<< Предыдущий параграф Следующий параграф >>
Оглавление