Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Методы, использующие заранее заданные системы меток

33.41 Возвращаясь к общему рассмотрению таблиц мы рассмотрим возможность введения метрики для категорий таблицы. Приписывая числовые метки категориям каждой переменной, мы сведем задачу измерения зависимости и взаимозависимости к анализу обычной (группированной) двумерной таблицы, подробно изученной в главе 26. Так мы сможем обычным способом вычислить коэффициенты корреляции и регрессии. Трудность заключается в выборе подходящей системы меток. Мы уже обсуждали этот вопрос с точки зрения ранговых критериев в где было показано, что для различных систем «условных чисел» (т. е. «меток» в принятой терминологии) получаются различные критерии. В рассматриваемом случае трудности возрастают, так как строится мера, а не просто критерий независимости.

Простейшая система меток использует наборы натуральных чисел с для категорий, соответствующих строкам и столбцам. Можно использовать также наборы нормальных меток рассмотренные в 31.39. Пример 33.9 иллюстрирует эти процедуры.

Пример 33.9

Вычислим для данных примера 33.8 коэффициенты корреляции, используя системы меток пункта 33.41. При использовании натуральных чисел мы припишем метки 1, 2, 3, 4 категориям от «высшей» к «низшей» для левого глаза и

аналогично (поскольку таблица оказывается здесь квадратной) для правого глаза Мы получаем

Таким образом, коэффициент корреляции для системы меток, использующей натуральные числа, равен

Полученный результат не очень отличается от значений ранговых мер найденных в примере 33.8, чего, впрочем, следовало ожидать, принимая во внимание, что система меток, использующая натуральные числа, тесно связана, как мы видели в главе 31, с коэффициентами ранговой корреляции.

Предположим теперь, что мы используем нормальные метки

полученные из Biometrika Tables (таблица 28). Находим

откуда получаем коэффициент корреляции для нормальных меток

То же самое значение, с точностью до двух десятичных знаков, было получено при использовании натуральных чисел. Принимая во внимание значительное усложнение вычислений, связанное с нормальными метками, вряд ли стоит прибегать к ним, по крайней мере при таком малом числе категорий, как 4.

33.42 Если уж вводить нормальную метрику в таблице то разумнее было бы приписать категориям числовые значения, которые соответствовали бы наблюденным частотам при выборе из нормального распределения. Так, в примере 33.9 следовало бы вычислить «точки разбиения» стандартного нормального распределения, соответствующие частотам и взять в качестве меток категории для левого глаза средние четырех частей нормального распределения.

В данный момент мы не будем проводить вычислений, однако ясно, что полученные метки будут отличаться от грубых нормальных меток, использованных в примере 33.9. Мы вернемся к этой системе меток в 33.50 ниже.

На этом мы прекращаем изучение методов, в которых используются заранее выбранные системы меток, так как ясно, что, добавляя «информацию» к таблице таким путем, мы делаем некоторые предположения о распределениях, что может привести к ошибкам в случае неправильности этих предположений. Вообще же этого следовало бы избегать, предпочитая использование ранговых методов, рассмотренных в 33.36-40. Иэйтс (1948) первым предложил систему меток с натуральными числами пункта 33.41, а Э. Уилльямс (1952) дал общий обзор методов, использующих метки.

<< Предыдущий параграф Следующий параграф >>
Оглавление