Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Внутриклассовая корреляция

26.25 Иногда возникают задачи, главным образом в биологических исследованиях, в которых требуется найти корреляцию между членами одного или большего числа семейств. Пусть, например, исследуется корреляция между ростами

братьев. Тогда перед нами встает вопрос: какая переменная является первой и какая — второй? В простейшем случае мы можем располагать некоторым числом семейств, каждое из которых содержит двух братьев. Наша корреляционная таблица имеет две переменные, обе обозначают рост, но при ее составлении мы должны решить, какой брат относится к какой переменной. Один из способов заключается в том, чтобы с первой переменной связывать либо старшего брата, либо более высокого; но этот способ дал бы нам корреляцию между старшими и младшими братьями или между более высокими и теми, что ниже, а не корреляцию между братьями вообще, которая нам требуется.

Решение задачи состоит в том, чтобы помещать в таблицу обе возможные пары, т. е. пары, получаемые, если каждого из братьев считать первым. Если семейство или, в более общем случае, класс содержит членов, то в таблице будет записей, так как каждый член будет браться первым совместно с каждым отличным от него, членом, который берется вторым.

При классах с членами корреляционная таблица будет иметь записей.

Таблица 26.5 (см. скан)

В качестве простой иллюстрации рассмотрим пять семейств, содержащих по три брата, роста которых (в дюймах) есть соответственно: 69, 70, 72; 70, 71, 72; 71, 72, 72; 68, 70, 70; 71, 72, 73. В таблице будет 30 записей (ем. таблицу 26.5).

Здесь, к примеру, пара 69, 70 из первого семейства вошла в таблицу как (69, 70) и (70, 69), а пара 72, 72 из третьего семейства — дважды как (72, 72).

Очевидно, что таблица симметрична относительно главной диагонали, как и должно быть. Обычным способом можно вычислить коэффициент корреляции, Находим и, следовательно,

Такой коэффициент корреляции называется внутриклассовым коэффициентом корреляции. Его можно находить следующим более прямым способом.

Предположим, что имеется классов со значениями . В корреляционной таблице каждый член класса будет появляться — 1 раз (вместе с каждым другим элементом его класса). Таким образом, среднее значение каждой переменной равно

а дисперсия

Соответственно ковариация равна

где среднее значение класса. Следовательно, для коэффициента корреляции получаем выражение

Если для всех то (26.56) преобразуется к виду

где дисперсия средних значений по классам, равная

Для того чтобы отличать внутриклассовый коэффициент от обычного коэффициента корреляции будем обозначать его а соответствующее выборочное значение

Пример 26.10

Используя (26.57), найдем внутриклассовый коэффициент для данных таблицы 26.5. Выберем начало координат в точке 70 дюймов. Тогда значения переменных равны —1, 0, 2; 0, 1, 2; 1, 2, 2; —2, 0, 0; I, 2, 3. Следовательно, . Средние значения по семействам, равны

а их отклонения от равны

Таким образом,

Следовательно, согласно (26.57)

Этот результат был уже получен непосредственно в 26.25.

26.26 При интерпретации внутриклассового коэффициента корреляции необходима осторожность. Из (26.57) видно, что не может быть меньше, чем однако он может достигать

значения когда . Таким образом, он является асимметричным коэффициентом в том смысле, что его отрицательное значение как мера отклонения от независимости не равнозначно соответствующему положительному значению.

Фактически внутриклассовый коэффициент со многих точек зрения удобнее рассматривать как величину, связанную простым линейным преобразованием с отношением дисперсий между классами и внутри классов в дисперсионном анализе. При таком подходе для случая, когда все семейства имеют одинаковые объемы , Фишер (1921с) вывел распределение выборочного внутриклассового коэффициента Он нашел, что если то, как и в случае коэффициента преобразование

дает статистику распределение которой близко к нормальному со средним и дисперсией, не зависящей от Для необходимо более сложное преобразование. Результаты Фишера приведены в упражнении 26.14.

<< Предыдущий параграф Следующий параграф >>
Оглавление