Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Вероятностная интерпретация мер связи

33.11 Теория рассмотренных нами в 33.5-10 мер связи, начавшая развиваться после 1900 г., старалась описать силу связи одним исчерпывающим коэффициентом. Однако, как мы уже видели в 26.10 на примере коэффициента корреляции, не всегда бывает разумно предполагать, что связь может быть адекватно описана одним коэффициентом. Гудмэн и Крускал (1954, 1959), подробно изложившие историю развития мер связи и составившие очень полную библиографию, привели веские аргументы в пользу выбора меры, допускающей интерпретацию в терминах решаемой задачи. Они рассматривают в основном политомические таблицы, т. е. таблицы с двумя или более классами по строкам и по столбцам. Мы вернемся к этому позже, в 33.35 и 33.40, когда будем рассматривать политомию. Сейчас, однако, отметим, что при некоторых условиях коэффициентам определенным для таблицы 2X2, можно дать операционную интерпретацию.

33.12 Рассмотрим случайный выбор двух индивидов из совокупности индивидов, классифицированных в соответствии с таблицей (33.1), так что каждый индивид попадает в одну из четырех категорий таблицы. Пусть для

Определим вероятности

Тогда коэффициент

равен вероятности того, что из двух индивидов, выбранных из популяции, один принадлежит к категории а другой — к категории минус вероятность того, что один из индивидов принадлежит к категории а другой — к Используя обозначения (33.2), легко показать, что

было определено в (33.9)). Таким образом, имеет прямой вероятностный смысл, указанный выше.

33.13 Аналогичным образом рассмотрим случайный выбор одного индивида из популяции и предположим, что требуется (не зная ничего априори) угадать, обладает индивид признаком А или Мы получим наилучшую оценку, если предположим, что индивид принадлежит к группе, имеющей большую из частот (а) в (33.1); вероятность того, что наша оценка правильна, будет согласно (33.2) равна

Аналогично, если надо угадать, обладаёт индивид признаком В или то мы выберем группу, имеющую большую из частот и вероятность успеха при этом будет равна

Таким образом, если нам надо в половине случаев угадать категорию а в другой половине случаев категорию В, то вероятность успеха будет равна а вероятность ошибки

Допустим теперь, что мы знаем категорию В индивида и нам надо угадать категорию Наилучшая оценка получится, если мы выберем наибольшую по численности категорию в соответствующем столбце таблицы. Вероятность успеха будет тогда равна или для соответствующих столбцов.

Поскольку эти столбцы будут появляться в случайной выборке

с вероятностями соответственно, то вероятность, правильного оценивания категории А при заданной категории В будет равна

Аналогично, вероятность правильного оценивания категории В при заданной категории А равна

Если, как и в рассмотренном выше случае отсутствия информации, нам надо угадывать категории попеременно, то вероятность успеха будет равна среднему из (33.25) и (33.26), а вероятность ошибки будет равна

33.14 Теперь, используя (33.24) и (33.27), мы введем коэффициент

характеризующий относительное уменьшение вероятности ошибки, вызванное знанием одной категории при предсказывании другой. Очевидно, это так что

Юл (1912) считал, что значение «разумной» меры связи не должно меняться, если каждую строку и каждый столбец таблицы отдельно умножить на произвольные положительные константы. Используя этот принцип инвариантности, умножим строки и столбцы таблицы (33.2) на следующие константы:

Отбрасывая общий для всех частот множитель, преобразуем таблицу (33.2) к виду

После некоторых очевидных преобразований можно показать, что любой коэффициент связи, удовлетворяющий принципу инвариантности, должен зависеть только от «перекрестного отношения» Меры из (33.9), (33.10) удовлетворяют, очевидно, этому условию, а мера V из (33.12) не удовлетворяет. Эдварде (1963) выводит это условие из других предположений.

Принцип инвариантности Юла позволяет нам связать из (33.28) с Допустим пока, что выполняется неравенство . В соответствии с (33.28) мы получаем для преобразованной таблицы (33.30)

Но так как

Выражение (33.31) совпадает с определением в (33.10), однако приняв, что мы произвольно выбрали знак Таким образом, вообще

что придает вероятностный смысл величине У.

<< Предыдущий параграф Следующий параграф >>
Оглавление