Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Криволинейные зависимости

29.50 До сих пор рассматривались только линейные соотношения между переменными. Обобщение полученных методов на случай криволинейной зависимости не проходит так же непосредственно, как в теории регрессии, а отдельные задачи до сих пор не решены. Мы изложим здесь некоторые относящиеся

к этому вопросу результаты, в основном принадлежащие Гири (1942b, 1943, 1949, 1953).

Можно понять, какого рода трудности здесь возникают, если рассмотреть квадратичную функциональную зависимость

При тех же предположениях относительно ошибок что и в линейном случае, и при дополнительном упрощении, что отношение их дисперсий и известно (без ограничения общности мы будем считать его равным 1), получим в случае нормально распределенных ошибок следующее выражение для функции правдоподобия:

Дифференцирование (29.121) дает

Суммируя и используя (29.123) и (29.124), находим аналогично (29.42), что для значений измеренных относительно выборочного среднего, выполняется соотношение

Если мы будем измерять значения также относительно их среднего, то из (29.123) -(29.125) и (29.127) получим

Система (29.128) характерна для регрессионного анализа, однако здесь значения X ненаблюдаемы. Для получения

МП-оценок нам надо решить систему из уравнений (29.122) и (29.128) относительно неизвестных Оценка для получается затем из (29.126). На практике нам придется, вероятно, решать эту систему итерационными методами.

Усложнение задачи очевидно и с геометрической точки зрения. В соответствии с (29.121) требуется найти такую кривую второго порядка, чтобы сумма квадратов кратчайших расстояний от всех точек до этой кривой была минимальной. Отрезки, соединяющие точки с ближайшими точками кривой, не будут параллельными и даже могут определяться неоднозначно. Хотя численное решение может быть найдено, его трудно охарактеризовать наглядно.

29.51 Можно обобщить метод оценивания коэффициентов с помощью смешанных семиинвариантов. Рассмотрим кубическое структурное соотношение

От предположения нормальности ошибок мы отказываемся. Совместная имеет вид

где Учитывая (29.129), получаем

Полагая и используя соотношения

находим из (29.130)

Разлагая в степенной ряд и приравнивая нулю коэффициенты в (29.132), получаем систему уравнений для определения см,

Эти уравнения линейны относительно но в общем случае нелинейны относительно семиинвариантов. В силу (29.81) смешанные семиинварианты х и у совпадают с соответствующими семиинвариантами Если х и у распределены нормально, то метод становится неприменимым, как и в 29.30.

29.52 При использовании изложенного метода возникают некоторые новые затруднения. Мы проиллюстрируем их на примере оценивания в случае квадратичной зависимости в (29.129)). Имеем

Не теряя общности, можно положить что эквивалентно выбору в качестве начала отсчета среднего значения х, за оценку которого берется среднее значение Из (29.132) получаем

Приравнивая нулю постоянный коэффициент в (29.133), находим

Параметр входит только в это уравнение. Оно поэтому пригодно только для оценивания причем для этого требуется оценить не только но и семиинвариант зависящий от дисперсии ошибки. Далее получаем, приравнивая нулю следующие коэффициенты:

В первое из уравнений (29.135) входит семиинвариант который дальше не встречается. Поэтому это уравнение непригодно для оценки параметров Из (29.135) ясно, что коэффициент при любой степени , скажем при содержит семиинвариант который не появляется ни в каком другом уравнении. Все эти уравнения поэтому бесполезны для

оценивания параметров если не предполагать, что ошибки распределены нормально (и, следовательно, имеют равные нулю семиинварианты порядка выше второго). В последнем случае семиинварианты Иго и смешанные семиинварианты могут быть оценены по выборке, что даст возможность использовать уравнения типа третьего в (29.135). В этом случае находятся из третьего уравнения и уравнения, полученного в результате исключения из второго и четвертого уравнений в (29.135).

Если не предполагать нормальности ошибок, то нужны дальнейшие уравнения. Для последующих коэффициентов из (29.133) имеем:

Два первых уравнения в (29.136) содержат, кроме смешанных семиинвариантов, также семиинварианты Исключая последние с помощью второго и четвертого уравнений (29.135), получаем систему для нахождения Оценивая затем мы сможем найти из Некоторые из исключаемых членов могут быть нелинейными, что может привести к получению более чем одной системы оценок.

29.53 Метод двух групп, изложенный в 29.63, очевидно, обобщается на случай полиномов порядка, если удается разбить наблюдения на групп, порядок следования которых по совпадает с порядком следования по х. В качестве решения берется полином, проходящий через центры тяжести этих групп. Метод Тейла (29.42) также легко обобщить. Разделив наблюдения на групп и беря по одной точке из каждой группы, мы сможем провести парабол, которые надо затем осреднить. Однако это не так просто, как кажется. Дело в том, что не обязательно лучшей оценкой истинной параболы будет парабола полученная путем усреднения коэффициентов. Можно еще указать некоторые эвристические способы усреднения, такие, как метол, наименьших квадратов в направлении оси у или графическое изображение всех кривых и выбор из них той, которая, как кажется, лучше остальных представляет среднее положение на рассматриваемом участке.

29.54 При обобщении метода контролируемых переменных на нелинейный случай появляются некоторые особенности. Так, если линейный случай сводится к регрессионному анализу, то в нелинейном случае этого не удается сделать. Рассмотрим кубическую функциональную зависимость

Полагая получаем

где контролируемые значения фиксированы. Допустим, что для одного и того же набора значений наблюдения повторяются. Обозначим соответствующее математическое ожидание. Суммируя (29.137) по всем наблюдениям, получаем

Беря затем математические ожидания, находим

Аналогично, умножая (29.137) на и суммируя, получаем систему уравнений

и т. д. Эти уравнения могут быть разрешены относительно величин

Интересно, что, хотя идентифицируемы, не являются таковыми, если не известна дисперсия или ее оценка. По-видимому, единственный способ обойти эту трудность состоит в повторении эксперимента при том же наборе значений Более полное изложение этого вопроса содержится в статьях Гири (1953) и Шеффе (1958).

29.55 Иногда нелинейное соотношение с помощью преобразования можно свести к линейному. Рассмотрим, например, функциональное соотношение

Здесь, очевидно, следует воспользоваться логарифмическим преобразованием. Однако эта процедура может иметь и нежелательные свойства. Так, если ошибки нормально распределены и гомоскедастичны, то ошибки преобразованных величин уже не будут обладать этими свойствами. Поэтому в данном случае, как, впрочем, и в любом другом, следует попытаться получить возможно больше априорной информации относительно ошибок наблюдений, а когда ошибки значительны и распределение их неизвестно, надо использовать методы оценивания, в которых число предположений о природе ошибок минимально.

<< Предыдущий параграф Следующий параграф >>
Оглавление