Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Тетрахорическая корреляция

26.27 Рассмотрим теперь оценивание коэффициента в двумерной нормальной совокупности, когда данные известны не во всех подробностях. Возьмем прежде всего крайний случай, иллюстрируемый таблицей 26.6. Она основана на распределении коров по возрасту и удойности, приведенном в таблице 1.24 упражнения 1.6. Предположим, что вместо той таблицы нам была бы дана только

Таблица 26.6 (см. скан) Распределение коров по возрасту и удойности

Это крайне сокращенный вариант первоначальной таблицы, Предположим, что исходное распределение является двумерным нормальным. Как оценить из этой таблицы? В общем

случае задача состоит в оценке для таблицы с частотами

В (26.58) мы всегда будем в качестве брать такую частоту, чтобы никакая из отвечающих ей маргинальных частот не содержала медианного значения варианты.

Если эта таблица получена с помощью двойной дихотомии двумерного нормального распределения

то можно иайти такое что

Полагая имеем

и, следовательно, можно определить из таблиц одномерной нормальной функции распределения. Аналогично, существует такое что

По нашему соглашению о расположении данных в таблице никогда не бывают отрицательными.

Подогнав таким способом одномерные нормальные распределения к маргинальным частотам таблицы, мы должны теперь для нахождения решить уравнение

Подинтегральное выражение в (26.62) является нормированным, потому что выбирались как нормированные отклонения. Разложим подинтегральную функцию по степеням Характеристическая функция распределения имеет вид

Таким образом, используя двумерную форму теоремы обращения (4.17), находим из (26.62)

Коэффициент при представляет собой произведение двух интегралов, из которых первый есть

а второй есть Согласно 6.18 интеграл в фигурных скобках в (26.64) равен

где

Согласно (6.21)

Следовательно, двойной интеграл в (26.64) имеет вид

Подставляя в (26.63) из (26.65) выражения для получаем ряд

Переписывая его в терминах тетрахорических функций, определенных в (6.44), находим

26.28 Формально (26.67) представляет собой разрешимое относительно уравнение, но на практике его решение с помощью последовательных приближений может оказаться очень громоздким. (Ряд (26.67) всегда сходится, хотя иногда и медленно.) Проще находить интерполяцией по таблицам, содер: жащим значение интеграла в зависимости от при различных значениях h и k (Tables for Statisticians and Biometricians, Vol. 2).

Оценку для полученную таким путем по выборке объема называют тетрахорическим коэффициентом Мы будем обозначать ее

Пример 26.11

Для данных таблицы 26.6 находим, что нормальное отклонение, соответствующее есть и, аналогично, для находим Имеем также для значение

С помощью таблиц при разных значениях находим следующие значения величины

(см. скан)

Для с помощью линейной интерполяции получаем приближенно . В таблице мы поменяли местами столбцы; учитывая это, имеем Следовательно, мы получили (Для таблицы 1.24 коэффициент корреляции

26.29 Тетрахорический коэффициент используется главным образом психологами, у которых данные часто представляют собой таблицы 2X2. Для тетрахорического коэффициента в точной форме неизвестны выборочное распределение и даже его стандартная ошибка. Но Карл Пирсон (1913) нашел асимптотическое выражение стандартной ошибки. Существуют, однако, более простые способы вычислений, основанные на номограммах (Хейес (1946), Гамильтон (1948), Дженкинс (1955)) и таблицах для стандартной ошибки в приближенной форме (Гилфорд и Лайонс (1942)., Хейес (1943); Гохеен и Каврук (1948)). По-видимому неизвестно, при каких объёмах выборок

можно безбоязненно пользоваться такими стандартными ошибками.

Обобщение на полихорическое оценивание в с таблицах см. ниже, в 33.35.

<< Предыдущий параграф Следующий параграф >>
Оглавление