Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Вычисление коэффициентов

27.20 Там, где имеются только три или четыре случайных величины, мы можем вычислять частные корреляции и регрессии, исходя непосредственно из коэффициентов нулевого порядка, пользуясь соответствующими формулами из числа полученных выше. Если же присутствует большое число переменных, то удобно систематизировать арифметику в форме определителей. Действительно, нам нужно вычислить все миноры корреляционной матрицы С, и затем, подставляя их в формулы (27.6), (27.19) и (27.26), мы получим коэффициенты корреляции и регрессии, а также дисперсии остатков (или ошибок) всех порядков. Ныне электронные вычислительные машины становятся широко доступными и можно избежать утомительных ручных вычислений.

Для малых полезны таблицы таких величин, как Полезны также тригонометрические таблицы. Например, при заданном можно найти следовательно, и так далее.

The Kelley Statistical Tables (Harvard U. P., 1948) содержит значения для

Два следующих примера представляют как интерпретационный, так и вычислительный интерес.

Пример 27.1

Исследуя для некоторой области Англии влияние погоды на урожаи, Хукер (1907) нашел следующие средние, стандартные отклонения и корреляции между урожаем сена в центнерах на весенним количеством осадков в дюймах

и накопленной за весну температурой выше по данным за 20 лет:

Основной интерес здесь представляет вопрос о влиянии погоды на величину урожаев, и поэтому мы рассмотрим только регрессию относительно двух других случайных величин. Из корреляций нулевого порядка выясняется, что урожай и осадки имеют положительную корреляцию, а урожай и накопленная весенняя температура — отрицательную. Как же интерпретировать последний результат? Может быть, высокая температура неблагоприятно влияет на урожайность или, возможно, отрицательная корреляция является следствием того, что высокая температура влечет уменьшение количества дождей, так что польза тепла более чем устраняется вредным воздействием засухи?

Для того чтобы пролить некоторый свет на этот вопрос, вычислим частные корреляции. Из (27.5) находим

Аналогично,

Далее нам потребуются регрессии и дисперсии ошибок. Имеем

Это соотношение, однако, содержит величины которые самостоятельного интереса не представляют. Их вычисления можно избежать, если заметить, что из (27.33) следуют равенства

так что

Стандартные отклонения представляют некоторый интерес и могут быть вычислены по (27.33). Получаем

- два выражения, дающие возможность взаимной проверки. Из первого имеем

Аналогично,

Таким образом,

Совершенно так же находим

Уравнение регрессии относительно представляется тогда в виде

Это уравнение показывает, что при увеличении количества осадков урожай возрастает и что при увеличении температуры урожай также возрастает, когда прочие факторы постоянны. Оно дает нам возможность изолировать воздействие осадков от воздействия температуры и изучать каждое из них по отдель-. ности. Положительность коэффициента означает, что существует положительная связь между урожаем и температурой, когда влияние осадков устранено. Частные корреляции говорят то же самое. Несмотря на отрицательность коэффициент положителен (хотя и мал) и указывает на то, что отрицательное значение является следствием сложного воздействия фактора осадков.

В предыдущих вычислениях не использовались определители, но при желании их можно применить. Определитель (27.2) есть

что при подстановке, например, в (27.34) дает полученный ранее результат

Пример 27.2

В исследованиях преступности в 16 больших городах США Огберн (1935) нашел корреляцию между степенью преступности измеряемой числом известных преступлений на тысячу жителей, и церковным членством измеряемым числом членов церкви старше 13 лет на 100 человек населения старше 13 лет. Она оказалась равной —0,14. Очевидный вывод состоит в том, что религиозность удерживает от преступления. Рассмотрим это более внимательно.

Пусть процент мужского населения, процент мужчин иностранного происхождения среди всего населения, число детей до пятилетнего возраста на 1000 замужних женщин в возрасте от 15 до 44 лет. Огберн вычислил значения

С помощью этих и других приведенных в его работе данных можно показать, что регрессия величины относительно остальных четырех переменных имеет вид

а некоторые из частных корреляций равны

Из уравнения регрессии замечаем теперь, что при фиксированных остальных факторах величины положительно связаны, т. е. церковное членство находится в положительной связи с преступностью. Что же маскирует этот эффект, давая отрицательную корреляцию в коэффициенте нулевого порядка

Заметим, прежде всего, что если устранить влияние величины процента иностранцев, то корреляция между преступностью и церковным членством будет близка к нулю. Эта же корреляция положительна, когда устранено воздействие числа маленьких детей. Если зафиксировать сразу то корреляция вновь положительна. Из уравнения регрессии в действительности выясняется, что высокий процент иностранцев и большая доля детей отрицательно связаны со степенью преступности. Оба эти фактора положительно коррелированы с церковным членством (иностранные иммигранты являются в основном католиками и более многодетны). Во всей

совокупности эти корреляции покрывают положительную связь преступности с церковным членством. Кажущаяся отрицательная связь церковного членства с преступностью, видимо, обусловлена большим уважением к закону среди иностранных иммигрантов и тем фактом, что они более ревностные церковники.

Более полное обсуждение задачи читатель может найти в работе Огберна.

<< Предыдущий параграф Следующий параграф >>
Оглавление