Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ГЛАВА 29. ФУНКЦИОНАЛЬНАЯ И СТРУКТУРНАЯ ЗАВИСИМОСТЬ

Функциональная зависимость между математическими переменными

29.1 В естественных, а отчасти и в социальных науках довольно привычны модели, в которых некоторые математические (не случайные) переменные функционально связаны. Хорошо известным примером является закон Бойля, утверждающий, что при постоянной температуре давление и объем V заданного количества газа связаны уравнением

Соотношение (29.1) может, однако, не выполняться, когда газ находится в состоянии, близком к сжижению, а также, возможно, при некоторых других Если изучается связь между объемом и давлением при так называемом адиабатическом расширении, когда недостаточно времени для теплообмена с окружающей средой, то вместо (29.1) приходится использовать соотношение

где константа, которую, возможно, надо оценить. Более того, в некоторых случаях желательно принимать в расчет также температуру что приводит к следующему обобщению (29.1):

В общем случае мы имеем переменных связанных между собой с помощью функциональных соотношений

в которые входят I параметров Обычно требуется оценить исходя из наблюдений, а иногда также определить форму функциональной зависимости Последняя задача чаще всего возникает в ситуациях, когда вид не удается определить полностью ни из теоретических соображений, ни из

предшествующего опыта. Если бы значения X наблюдались без ошибок, то вообще не возникло бы никакой статистической проблемы: мы имели бы набор значений, удовлетворяющих (29.3), и оставалось бы только решить эту систему, что является чисто математической задачей. Однако обычно на наши измерения влияют ошибки эксперимента или наблюдений. Мы наблюдаем не «истинное» значение X, а значение, отличающееся от него на некоторую случайную величину. Таким образом, задача заключается в оценивании параметров возможно, в определении вида зависимости исходя из данных, которые, по крайней мере частично, являются выборками из распределений ошибок. В этом случае статистический характер проблемы не подлежит сомнению.

29.2 На наш взгляд, при изложении данного предмета, в котором в прошлом было немало путаницы, чрезвычайно важно придерживаться ясной терминологии и обозначений. В этой главе мы будем обозначать математические переменные большими латинскими буквами. Как обычно, параметры будут обозначаться малыми греческими буквами (особенно часто буквами а случайные величины — малыми латинскими буквами или, в случае оценок максимального правдоподобия, буквой, обозначающей параметр, с крышечкой наверху, например: а. Случайные ошибки будут обозначаться другими малыми греческими буквами, чаще всего буквами а наблюдаемые случайные величины, соответствующие ненаблюдаемым переменным, — «соответствующими» греческими буквами, например, 1 будет соответствовать Единственным источником путаницы в нашей системе обозначений может быть то, что греческие буквы выполняют сразу три роли (параметры, ошибки, наблюдаемые величины), однако для разных целей нами используются разные группы букв, причем соблюдается следующее простое правило: любая греческая буква, «соответствующая» большой латинской букве, обозначает наблюдаемую случайную величину, соответствующую этой математической переменной, тогда как все остальные греческие буквы обозначают ненаблюдаемые величины (параметры или ошибки).

29.3 Начнем с самого простого случая. Пусть две математические переменные связаны линейным соотношением

и требуется оценить параметры Мы не можем наблюдать значения но можем наблюдать значения случайных величин определенных следующим образом:

Индексы в (29.5) существенны: наблюдения распределены около «истинного» значения в соответствии с распределением «ошибки», которое может зависеть от Например, ошибки могут быть больше для больших значений X, что может быть выражено увеличением дисперсии, соответствующей ошибке случайной величины.

В рассматриваемом простейшем случае будет, однако, предполагаться, что распределены одинаково, в частности имеют одно и то же среднее (которое без потери общности можно считать равным нулю) и дисперсию для всех Аналогичные предположения считаются выполненными для Предпола гается также, что ошибки некоррелированы между собой и друг с другом. Пока мы не будем предполагать нормально распределенными. Итак, наша модель описывается соотношениями (29.4) и (29.5), в которых

Относительно средних предполагается фактически их равенство между собой, и их можно положить равными нулю, включая средние ошибок поскольку ясно, что не имеется возможности отделить от

Учитывая (29.6), можно, не вызывая неоднозначного понимания, записать рассматриваемую модель в виде

29.4 На первый взгляд оценивание параметров в (29.4) кажется задачей, похожей на задачу регрессионного анализа, и это сходство часто было источником недоразумений. В регрессионных задачах мы, однако, интересуемся зависимостью среднего значения (которое равно от переменной X, не подверженной ошибкам; в этом случае ошибка тождественно равна нулю и, следовательно, Таким образом, регрессионная модель есть частный случай рассматриваемой. Кроме того (хотя это уже относится не к формальной постановке задачи а к ее происхождению), случайные изменения зависимой переменной,

в регрессионном анализе не обязательно связаны только с ошибкой измерений. Они могут полностью или частично порождаться самой структурой связи между переменными. Так, между весом тела и ростом существует внутренняя связь, совсем не зависящая от ошибок измерений.

Легко убедиться, что наличие ошибок как в X, так и в У ставит проблемы, совершенно отличные от тех, которые возникают в задачах регрессионного анализа. Подставляя из (29.7) в (29.4), мы получаем соотношение

которое не совпадает с обычной постановкой задачи в регрессионном анализе, так как случайная величина коррелирована с ошибкой Действительно, из (29.6) и (29.7) получаем

(29.9) обращается в нуль либо при что совпадает с регрессионной ситуацией, либо в тривиальном случае

Уравнение (29.8) называется структурным соотношением между наблюдаемыми случайными величинами Это структурное соотношение порождается функциональным соотношением между математическими переменными

29.5 В регрессионном анализе можно было выбирать значения независимой переменной X произвольно, например, через равные промежутки в области ее изменения. Однако эти значения могли быть получены и в результате случайного выбора, т. е. пар наблюдений могли быть случайно выбраны из двумерного распределения с целью изучения регрессии одной чайной величины по другой. (Эти варианты регрессионных моделей уже рассматривались в 26.24, 27.29.) В данной модели значения X также могут быть получены либо в результате некоторого случайного процесса, либо путем целенаправленных измерений в выбранных точках, однако в любом случае X останется ненаблюдаемой величиной вследствие ошибок измерений. Теперь мы переходим к изучению ситуации, когда являются случайными величинами, так что функциональное соотношение (29.4) превращается в структурное соотношение между ненаблюдаемыми величинами.

<< Предыдущий параграф Следующий параграф >>
Оглавление