Главная > Разное > Последовательные методы в распознавании образов и обучении машин
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.3. Задача о последовательном испытании двух выборок

В качестве основной модели непараметрического построения системы последовательной классификации в этом параграфе описывается задача последовательного испытания двух выборок. Допустим, что при последовательных измерениях имеется два вектора замеров

каждый из которых представляет собой выборку из ансамбля случайных величин с некоторым распределением вероятностей. Задача состоит в проверке гипотезы о том, что оба эти распределения одинаковы, против альтернативной гипотезы о том, что они различны. При этом должно использоваться как можно меньшее число измерений. Допустим, что последовательные замеры независимые случайные величины, и испытываются: гипотеза

и альтернатива

в предположении, что функция распределения -функция распределения Для использования п. к. о. в. Вальда, основанного на последовательных рангах, расставим замеры в таком порядке, чтобы они чередовались: Обозначим объединенные замеры на шаге вектором

где Пусть есть вектор последовательных рангов для а

представляет собой последовательное отношение вероятностей на шаге процесса. Если верна гипотеза Но, то для произвольного вектора из имеем следовательно, молено вычислить учитывая, что каждый полученный вектор соответствует взаимно однозначным образом определенному порядку объединенных замеров Таким образом, достаточно вычислить

где когда есть когда есть у. В случае альтернатив Лемана имеем

против

Из (5.5) и (5.7) для четных получим

где

При этом последовательное отношение вероятностей на шаге

и

После измерения переходит в Используя последовательный ранг для

наблюдения, можно переписать (5.10) и (5.11) так, чтобы получить

Для завершения непараметрической процедуры в. достаточно иметь только пару останавливающих границ, с которыми сравниваются последовательные отношения вероятностей. Как было указано раньше, пересечение любой из границ приведет к окончательному решению.

Заметим, что в процессе образования последовательного отношения вероятностей от шага к шагу необходимо лишь знать последовательный ранг замера и вектор определенный из (5.9). Если имеет величину то замер лежит между наименьшими замерами предшествующих измерений. Таким путем формируется новый вектор содержащий элементов, где если замер есть если у. Последовательное отношение вероятностей получается тогда из (5.12) или (5.13) с использованием

Таким образом, непараметрическая процедура в. сводится к следующим шагам:

Шаг 1. Получить последовательный ранг замера.

Шаг 2. Образовать вектор из

Шаг 3. Вычислить последовательное отношение вероятностей по формуле (5.12) или (5.13) и сравнить с останавливающими границами.

Следует отметить, что описанная выше процедура не требует переопределения рангов всех предыдущих замеров для вычисления последовательных отношений

вероятностей. Действительно, последовательный ранг каждого замера (а следовательно, и вектор будучи раз определенным, остается неизменным в дальнейших расчетах. Таким образом, окончательная процедура существенно упрощается и, как следовало ожидать, более естественно согласуется с последовательно получаемыми замерами признаков, последовательные ранги которых должны определяться только в момент их поступления.

В практических применениях возникает естественный вопрос относительно обоснованности принятия альтернатив Лемана для обнаружения значительных отклонений от гипотезы. Хотя использование предложенных альтернатив объясняется главным образом простотой построения полезной процедуры испытаний, тем не менее во многих задачах классификации они оказываются справедливыми по следующим причинам.

(1) В случаях, когда пригодны непараметрические методы, обычно отсутствует точное знание альтернатив. Желательно было бы знать, могут ли эти альтернативы представлять существенные отклонения от гипотезы, чтобы с их помощью можно было изучить способность различных критериев обнаруживать такие отклонения. Установлено, что альтернативы Лемана отражают типичные отклонения, обычно преобладающие во многих распределениях вероятностей, описывающих различные классы образов. Иллюстрирующий пример, приведенный в работе Лемана [12], воспроизведен на рис. 5.1, где изображены графики трех альтернатив Лемана вместе с кривой функции плотности гауссова распределения

(2) Хотя другие типы альтернатив также вполне пригодны в непараметрических статистиках, например или все же они описывают альтернативы с подобными отклонениями, не давая новую меру различия между гипотезой и альтернативами. Кроме того, вычисление последовательного отношения вероятностей при таких альтернативах будет более сложным, чем при альтернативах Лемана, так как распределение рангов будет зависеть не только от а (или но и от

В следующих параграфах будут рассмотрены вопросы применения модели последовательного испытания двух выборок к построению пепараметрической системы классификации. Далее построенный классификатор анализируется в отношении критерия качества.

Рис. 5.1. Нормализованная функция плотности гауссова распределения и альтернативы Лемана.

Кроме того, будет найдено правило выбора подходящей альтернативы Лемана, когда статистики образов совершенно неизвестны, так что это, по-видимому, необычное предположение может найти свое толкование и предназначение в практических применениях.

<< Предыдущий параграф Следующий параграф >>
Оглавление