Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Отсеивание переменных в исследовательской работе

27.27 В новых областях исследования предварительное изучение связей между величинами часто начинается с вычисления всевозможных корреляций нулевого порядка, образующих корреляционную матрицу С. Если нас интересует лишь «предсказание» значения одной величины, по другим, то заманчиво было бы вычислить вначале только корреляции между и остальными величинами и отбросить те величины, с которыми корреляции равны нулю или очень малы. Это, возможно, позволило бы уменьшить число величин до поддающегося обработке количества. Следующий этап состоял бы в вычислении корреляционной матрицы оставшихся величин и множественных корреляций между и комбинациями из остальных величин.

К сожалению, эта процедура может привести к серьезному заблуждению. Совершенно верно, что множество корреляций нулевого порядка полностью определяет всю совокупность частных корреляций. Но малость коэффициентов нулевого порядка между и другими величинами не гарантирует малости коэффициентов более высокого порядка, и это так, даже если пренебрегать выборочными рассмотрениями. Поскольку согласно (27.62) множественная корреляция должна быть не меньше наибольшей из корреляций любого порядка, то с помощью описанной выше процедуры «отсеивания» мы, может быть, отбрасываем ценную информацию.

Рассмотрим снова (27.5):

Если либо равны нулю, то и если то Но могут оба быть очень малыми, тогда как может быть очень велик. Действительно, предположим, что Тогда (27.67) превращается в

Если очень мал, а очень велик, то (27.68) может быть также очень большим. Рассмотрим конкретный пример. Пусть

Тогда (27.68) имеет вид Аналогичный результат пот лучится, если положить так как при этом не изменится.

Теперь можно сделать как угодно малым, скажем равным Тогда

Поскольку согласно (27.62) множественная корреляция то в этом случае находим, что

В силу является точной линейной функцией от вопреки значениям коэффициентов нулевого порядка в (27.69). Очевидно, было бы неразумно на основании только коэффициентов нулевого порядка отбрасывать в задаче предсказания

В геометрических терминах легко понять, что здесь произошло. Вектор ортогонален к и почти ортогонален (при угле , близком к Но все три вектора лежат в одной и той же плоскости, в которой образуют между собой либо угол (тогда близок к 1), либо угол тогда близок к

Мы рассмотрели простой пример, но то же самое рассуждение применимо к большему числу переменных, где имеется больше места для появления связей указанного сорта. Значение зависит от всех частных корреляций.

К счастью для человеческого нетерпения, жизнь обычно оказывается менее сложной, чем она могла бы быть, и мы обычно избегаем наихудших возможных последствий упрощенного выбора независимых переменных. Обыкновенно, даже в новых областях, у нас имеется достаточно предварительных знаний, помогающих избежать наиболее вопиющих оплошностей, но логическая трудность остается.

<< Предыдущий параграф Следующий параграф >>
Оглавление