Главная > Разное > Информационная теория идентификации
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 4.2. Понятие оптимальности на классе

При неполной априорной информации о помехах плотность распределения их неизвестна и поэтому определить оптимальную функцию потерь невозможно. А это значит, что невозможно сформировать абсолютно оптимальные алгоритмы идентификации. Предположим теперь, что нам известен лишь класс распределений помех V, характеризующий имеющийся уровень априорной информации относительно истинной плотности распределения Возникает вопрос: как определить оптимальную функцию потерь в этих условиях? Для ответа на этот вопрос введем понятие оптимальной функции потерь на классе распределений

Рассмотрим АМКО при произвольной функции потерь (2.4.7)

Функцию потерь без ограничения общности удобно представить в виде

где некоторая плотность, удовлетворяющая условиям (4.1.1), (4,1,2). В этом случае

Подставляя из (4.2.3) в (4.2.1) и обозначая для простоты через получим выражение АМКО

Введем обозначения

Назовем квазифишеровскими информациями 1-го и 2-го рода соответственно. Тогда АМКО представится в виде

При что соответствует выбору оптимальной функции потерь квазифишеровские информации 1-го и 2-го рода становятся равными фишеровской информации

и из (4.2.6) следует уже знакомое нам выражение АМКО для оптимальной функции потерь

В каждом классе распределений V таких «оптимальных» функций потерь бесконечное множество. Наша задача — выбрать среди них такую, которая с определенной точки зрения была бы оптимальной на рассматриваемом классе -Назовем функцию потерь

опшылаьмой на классе V, если для любой плотности распределения помех удовлетворяет матричному неравенству

Выясним смысл этого неравенства, для чего воспользуемся неравенством (2.5.4), определяющим оптимальную функцию потерь. В принятых здесь обозначениях оно запишется в виде

В частности, при

Но в силу неравенства (4.2.10)

Отсюда следует, что

т. е.

Таким образом, представляет собой плотность распределения из класса V, для которой достигает максимума. Эту плотность распределения уместно назвать наименее благоприятной плотностью распределения. Оптимальная на классе функция потерь (4.2.9) представляет собой оптимальную функцию потерь для наименее благоприятной плотности распределения из заданного класса.

Оптимальная на классе функция потерь (4.2.9), как видно из (4.2.10), гарантирует не превосходящую т. е. Принимая во внимание, что АМКО представляет собой симметрические положительно определенные матрицы, матричное неравенство (4.2.10) можно записать относительно обратных АМКО

и знчит

Разумеется, предложенное определение (4.2.10), (4.2.15) или (4.2.16), (4.2.17) оптимальной на классе функции потерь (4.2.9) будет иметь смысл лишь тогда, когда, матричные неравенства (4.2.16) и, значит, (4.2.10) будут действительно иметь место для и всех принадлежащих заданному классу Покажем, что если решение задачи (4.2.17) существует, то оно удовлетворяет неравенству (4.2.16), а следовательно, и неравенству (4.2.10).

Вспоминая, что в общем случае для динамического объекта нормированная информационная матрица имеет вид (см.

представим обратные и (4.2.6) в форме

и

Пусть плотность распределения принадлежит классу распределений тогда и плотность распределения

будет также принадлежать классу V при Напомним, что все интересующие нас классы распределений выпуклы. Подставляя вместо в (4.2.19), получим

где теперь

и

Поскольку

то условие минимума запишется в виде

Дифференцируя по А и полагая затем получим после несложных преобразований

Рассмотрим теперь при Производя замену получим

где теперь

а по-прежнему определяется выражением (4.2.24). Дифференцируя (4.2.28) по А и полагая затем получим после преобразований

Сопоставляя (4.2.31), заключаем, что поэтому необходимые условия минимума по совпадают. Если бы функционалы были выпуклыми на классе V, то можно было бы сделать вывод, что они достигают минимума при одной и той же плотности распределения Но выпуклость этих функционалов можно обеспечить, если рассмотреть их на произвольном однопараметрическом подклассе Произведя минимизацию сначала на подклассе при произвольном допустимом значении а, а затем по параметру получим, что эти функционалы достигают минимума одновременно.

Отсюда и следует справедливость матричного неравенства (4.2.16). Таким образом, мы обосновали понятие оптимальности на классе.

<< Предыдущий параграф Следующий параграф >>
Оглавление