Главная > Разное > Последовательные методы в распознавании образов и обучении машин
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.4. Непараметрические последовательные классификаторы образов

Предполагается известным, что выборки входных образов классификатора принадлежат двум различным классам непараметрических распределений, каждый из которых представляет некоторый класс образов. Задача состоит в отыскании непараметрического построения последовательного классификатора образов, который для пары заранее заданных вероятностей ошибок определял бы принадлежность неизвестного образа к одному из

двух классов при наименьшем среднем числе измерений признаков. Очевидно, предположение о непараметрических статистиках и требование оптимальной остановки наводят на мысль, что решение можно получить, рассматривая процедуру классификации как последовательное испытание двух выборок в непараметрическом варианте [14].

Предположим, что имеется несколько классифицированных выборок образов из каждого класса. Как будет видно в следующей главе, эти выборки с известной классификацией называются обучающими замерами (наблюдениями) или обучающими выборками. Обозначим эти выборки по замеров двумя множествами векторов признаков принадлежащими соответственно к классам и Входной (распознаваемый) образ представим вектором признаков компоненты которого последовательно измеряются классификатором. Для определения, к какому классу принадлежит входной образ, достаточно решить, взята ли выборка из распределения, к которому принадлежит Поскольку в случае двоичной классификации отнесение образа к одному классу означает его исключение из другого класса (раз решение уже принято), то классификатору достаточно решить, происходят ли и (или, наоборот, из одного и того же распределения. Более того, если множество содержит обучающие выборки, являющиеся представителями класса образов , то процесс классификации сводится к задаче последовательного испытания двух выборок, в которой классификатор производит испытание гипотезы

и альтернативы

где распределение вероятностей величин из есть распределение вероятностей величин у, из У. Из сказанного в § 5.3 следует, что простое применение последовательного критерия отношения вероятностей, основанное на последовательных рангах объединенных замеров, приведет к решению либо о принятии,

либо о непринятии гипотезы Но, что соответствует выбору класса образов или

Для иллюстрации описанной выше процедуры классификации неизвестных образов рассмотрим следующий числовой пример. Допустим, имеются две выборки образов взятые из различных рукописных начертаний букв Каждая выборка образа представлена -мерным вектором (см. § 2.3), компоненты которого последовательно измеряются классификатором. Например,

Объединенная выборка замера имеет вид

Будем считать, что вектор X есть обучающая выборка, взятая из класса образов Задача состоит в проверке, происходит ли вектор выборки из того же класса распределения, что и X, используя как можно меньше измерений. Положим в альтернативе Лемана против гипотезы Но и пусть где вероятность принятия гипотезы когда в действительности верна гипотеза Тогда останавливающие границы (пороги) в п. к. о. в. Вальда приближенно равны

Из (5.10) и (5.11) или (5.12) и (5.13) с помощью последовательных рангов объединенных замеров непосредственно вычисляются последовательные отношения вероятностей:

Поскольку классификатор решает принять гипотезу (отвергнуть ) на измерении объединенной выборки (т. е. на замере выборки неизвестного образа). В результате неизвестный образ считается принадлежащим классу

<< Предыдущий параграф Следующий параграф >>
Оглавление