Главная > Математика > Ранговые корреляции
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ГЛАВА 10. ДОКАЗАТЕЛЬСТВО РЕЗУЛЬТАТОВ ГЛАВЫ 9

Корреляция между рангами и значениями признака

10.1. Пусть выборок каждая объемом единиц отобраны из непрерывной совокупности со средней и дисперсией . В каждой выборке наблюдения ранжированы. Наименьшей величине присваивается ранг Оценим теперь для совокупности, состоящей из наблюдений, ковариацию значений признака и рангов и дисперсии значений признака и рангов

Если наименьшая величина в выборке есть то имеем:

Если стремится к бесконечности, то

следовательно,

Распределение скажем в выборках, состоящих из единиц, из совокупности с функцией распределения задается как

Таким образом,

Однако сумма в квадратных скобках есть разложение бинома следовательно, равна единице. Отсюда

Предположим, что эти моменты существуют. Аналогично находим:

Отсюда на основе (10.4) и (10.5) получим:

Таким образом, искомый коэффициент корреляции определяем как

Если теперь предположить, что стремится к бесконечности, то получим:

так, что

10.2. Рассмотрим теперь частные случаи.

Если выражение в квадратных скобках в (10.13) обозначить как то имеем:

Интегрирование по частям дает

В действительности величина А является коэффициентом рассеяния, известным под названием средняя разность Джини [58; 1; 2.21]. Это неотрицательная величина. Затем получим формулу Стюарта

10.3. Для равномерного распределения

имеем

и, следовательно,

Этого и следовало ожидать для распределения, в котором появление любой из случайных величин равновероятно.

10.4. Рассмотрим нормальное распределение. Без потери общности результатов можно предположить, что оно имеет дисперсию, равную единице, и нулевую среднюю. Тогда мы имеем:

и

Следовательно,

10.5. Для распределения

имеем:

откуда, используя формулу

находим:

Этот результат приведен в 9.6. Для (наименьшее значение, представляющее интерес для статистики); ; для ; для

Конкордация

10.6. Теперь мы покажем, что и -выборочные характеристики конкордации частот — являются несмещенными оценками генеральных величин и Это, вообще говоря, очевидно исходя из некоторых соображений, используемых в теории вероятностей, однако возможно, что простое доказательство не помешает.

Припишем любой паре членов совокупности некоторую переменную, которая равна 1, если наблюдается конкордация типа 1, и нулю, если ее нет. Математическое ожидание является тогда математическим ожиданием значения этой переменной для любой данной пары, поскольку математическое ожидание суммы есть сумма математических ожиданий даже тогда, когда слагаемые являются зависимыми величинами. Однако математическое ожидание этой переменной равно откуда и следует искомый результат. Такой путь доказательства применим также и к

Пусть функция распределения х, у будет Функция распределения только или у пусть будет и соответственно.

Теперь для любого фиксированного значения вероятность того, что есть следовательно, вероятность того, что при данном есть Для того чтобы получить вероятности того, что для любых двух пар

если интегрируем соответствующие функции по

Теперь мы можем опустить подстрочный индекс Кроме того,

и, следовательно,

интегрирование производится по всему диапазону значений х и у. Опираясь на аналогичные аргументы, находим:

10.8. Рассмотрим случай, когда переменные полностью связаны линейным отношением. Совместное распределение х и у становится одномерным и без потери общности можно предположить, что это распределение будет равномерным в диапазоне от до 1. Тогда приводится к распределению одной переменной, скажем, и

В случае независимости переменных следовательно, варьирует от до 1. Поскольку рассматриваемая величина является вероятностью, она и не может лежать вне этого диапазона. Для находим в случае полной линейной зависимости:

если эта зависимость отрицательная, то

Эти величины представляют собой крайние значения, и легко видеть (ср. с. 31-32),что не может лежать вне интервала . Соответственно коэффициент находится в пределах

10.9. Из (10.25) следует, что ковариация накопленных сумм частот х и у есть

а дисперсия составит величину: Отсюда следует, что корреляция накопленных частот равна:

Эту величину мы и определили выше как

10.10. Теперь выведем выражения для средних и дисперсий в случае нормального распределения.

Пусть равно если положительно, если равно нулю, и наконец, —1, если отрицательно. Распространим этот результат для действительных значений следующим образом:

Интеграл здесь следует понимать как главную компоненту выражения, иначе говоря,

Выражение (10.27) эквивалентно действительному интегралу

Из определения главной компоненты становится ясно, что, если то этот интеграл обращается в нуль в силу симметрии подынтегрального выражения. По-видимому, наикратчайший путь получения выражения (10.27) заключается в рассмотрении комплексного интеграла

Если 1 положительна, мы берем этот интеграл по контуру, состоящему из отрезка на действительной оси с концами малой полуокружности радиуса лежащей выше оси, отрезка на действительной оси с концами и большой полуокружности радиуса лежащей выше оси. Этот интеграл обращается в нуль, так как подынтегральное

выражение не имеет «полюсов» внутри контура. Интеграл вдоль действительной оси стремится к

Интеграл по большой полуокружности стремится к нулю при стремящемся к бесконечности. Интеграл по малой полуокружности является на самом деле просто интегралом от по этой полуокружности, пройденной по часовой стрелке, и равен . Таким образом,

откуда следует результат (10.27) для Если мы рассматриваем интеграл, в котором берется с другим знаком.

10.11. Рассмотрим теперь нормальную совокупность переменных х, у, коэффициент корреляции которых равен Запишем для них:

Без потери общности можно предположить, что случайные величины измерены как отклонения от нулевой средней, их дисперсии равны единице. Если мы возьмем пары значений, скажем, то можно использовать оценку, базирующуюся на измерении разности между При построении коэффициента будем исходить из того, что такая оценка определяется знаком при или при соответствующем положительном численном значении этой разности. Распределение пар независимых значений характеризуется следующим выражением:

Положим:

Распределение тогда примет вид:

Следовательно, также нормально распределены и имеют корреляцию не зависимую от Опуская подстрочные значки, получим:

10.12. Если есть выборочное значение математическое ожидание суммы членов, каждый из которых может быть записан как то

Это выражение, в соответствии с (10.27), примет вид:

Выражение в квадратных скобках есть характеристическая функция оно равно:

Отсюда

Таким образом,

Следовательно, простое интегрирование по учитывая, что обращается в нуль, когда дает

Этот результат и приведен в (9.11).

10.13. Для того чтобы найти дисперсию во всех возможных выборках, нам необходимо определить

где суммирование производится по всем значениям Можно написать:

Здесь возможны три случая:

1) если то этот член равен +1 и математическое ожидание каждого слагаемого равно

2) если , то математическое ожидание этого произведения в силу (10.36) сводится к

3) если только или только то получим тот тип, который может быть оценен при рассмотрении случая Для удобства будем использовать единственный общий знак. Пусть

куда теперь, опуская введем Таким образом,

Для интегрирования но x и у мы можем воспользоваться известными свойствами характеристических функций или интегрировать непосредственно. Находим:

и, следовательно,

Если мы продифференцируем в (10.38) по и используем соотношение (10.40), то получим выражение

В силу симметрии относительно это выражение может быть сведено к

Произведем интегрирование в первой части относительно Получаем:

Оставшаяся часть интегрирования может быть выполнена способом, который привел к оцениванию (10.33).

Аналогичным путем может быть исчислен второй интеграл в (10.41). Окончательно

Когда Вновь обращаясь к интегрированию, находим, что:

Имеется случаев типа случаев типа II и случаев типа III. Таким образом,

После вычитания квадрата и небольших преобразований находим:

Этот результат приведен в (9.13).

10.14. Указанную формулу можно аппроксимировать следующим образом. Если

то

Однако

и, следовательно,

Таким образом,

поэтому

где определены в 9.11. Кроме того,

Применяя этот результат в (10.45), находим:

как это показано в (9.18).

10.15. Остальные нужные нам результаты выводятся таким же методом, каким выводились и однако здесь вычисления становятся более громоздкими.

Рассмотрим прежде всего Как и в (2.35), имеем:

Мы уже определили, что

Для оценивания рассмотрим случай, когда Таким же способом, что и в 10.11, находим

Это выражение аналогично интегралу, приводившемуся в 10.12, только здесь вместо стоит и поэтому мы получаем — Отсюда находим, что

10.16. Оценивание осуществляется тем же способом. Однако в первом случае мы сталкиваемся с интегралом эллиптического вида. Следует разложить полученную функцию в ряд по степеням Это приводит к уравнениям (9.30) и (9.31). Подробности можно найти в [53] и [16].

Библиография

См. список литературы к гл. 9. В [53] рассматривается взаимосвязь между ранговыми коэффициентами и исходными параметрами для генеральных совокупностей, не являющихся нормальными и представленными в виде рядов Грема-Шарлье. В [98] приводятся третьи и четвертые моменты относительно и найден метод их оценивания для нормального случая.

В [27] получены некоторые важные формулы для асимптотической дисперсии . В [15] выведены некоторые точные выражения, которые были табулированы в [28].

<< Предыдущий параграф Следующий параграф >>