Главная > Разное > Методы статистического последовательного анализа и их радиотехнические приложения
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ВВЕДЕНИЕ

1. Статистический последовательный анализ является методом статистического исследования случайного процесса по наблюдениям, на основании которых необходимо принять одну из возможных гипотез о его характере.

Особенность последовательного анализа состоит в многоэтапности статистического эксперимента для выбора между гипотезами. При этом решение о прекращении или продолжении эксперимента на данном этапе зависит от его случайного хода на предыдущих этапах в отличие от классических статистических экспериментов, где число этапов заранее назначается.

Такое более гибкое по сравнению с классическим построение последовательного эксперимента приводит к уменьшению среднего числа этапов, необходимого для вынесения столь же надежного, как и в классическом случае, решения.

Последовательный анализ возник в 1942-1944 гг. в связи с поисками более эффективных, чем классические, методов статистического приемочного контроля массовой продукции промышленности. Создателем последовательного анализа является американский статистик А. Вальд [1]. Созданный им метод явился естественным развитием классической теории Неймана и Пирсона выбора между гипотезами при отказе от заранее назначаемого объема выборки. Так же, как и в их теории, для него не обязательно знание априорных вероятностей гипотез. Обе процедуры (классическая и последовательная) основаны на одной и той же статистике (функции наблюдений) - логарифме коэффициента правдоподобия. А. Вальд показал [1], что в ряде случаев применение последовательной процедуры приводит в среднем к 50%-ной экономии числа наблюдений по сравнению с классической процедурой. Это

обстоятельство послужило первоначальным практическим основанием для развития теории последовательного анализа.

2. Развитие современной математической статистики, обогащенной в значительной мере идеями А. Вальда, вылилось в теорию решений [2], смыкающуюся с теорией игр [3]. Эти новые направления требуют наличия априорных вероятностей гипотез (минимаксное решение по существу не избавляет от требования существования неизвестных априорных вероятностей).

Кроме того, необходимы априорные знания цен решений и испытаний (для составления среднего риска). Новейшая статистическая теория в основном направлена на оптимизацию решений, действий, стратегий.

При этом объектом статистического анализа остается ,по-прежнему выборка в старом классическом смысле.

Вместе с тем области практических приложений статистики, в которых возникают априорные трудности (отсутствие априорных вероятностей гипотез и неопределенность в назначении цен), достаточно обширны. Часто в этих же областях старое классическое определение выборки не отражает сложных статистических объектов анализа, например потоков информации, связанных с понятиями теории массового обслуживания (см. Доп. И). Теория решений [2, 3] не адекватна такого рода практическим областям, и для их исследования часто приходится возвращаться к более ранним статистическим теориям. Практические области, рассматриваемые в данной книге, относятся как раз к такого рода областям, где более адекватными оказываются классические и последовательные методы.

Отметим, что последовательный анализ близок по идеям к более поздней общей теории динамического программирования [5]. В математическом плане отдельные его результаты могут быть получены на основе теории случайных блужданий [4]. Важное значение для развития последовательного анализа имели исследования Л. Н. Колмогорова, Ю. В. Прохорова |[44], а также более поздние работы [38, 43].

Последовательный анализ является составной частью общей теории решений [2, 3].

3. В последние годы в связи с широким проникновением методов математической статистики в новые области

техники определенное Место среди этих методов занимают и методы последовательного анализа.

Эти области все время расширяются и в настоящее время охватывают следующие разделы:

1) В двухальтернативных ситуациях (выбор между двумя решениями):

а) контроль качества продукции и материалов,

б) испытание приборов и систем на надежность,

в) поиск неисправностей в сложных системах,

г) обнаружение сигналов при наличии шумов.

2. В многоальтернативных ситуациях (выбор между более чем двумя решениями):

а) многосортная классификация выборочных данных (изделий) из одной генеральной совокупности (партии),

б) сравнительный анализ выборочных данных (изделий) из нескольких генеральных совокупностей (партий),

в) многоканальное обнаружение сигналов при наличии шумов.

3. В сложных кибернетических системах:

а) процедуры поиска при наличии помех,

б) информационные системы с обратной связью,

в) кибернетические устройства для различения информационных потоков и др.

Во всех этих практических областях эффективность последовательной процедуры по сравнению с классической может быть использована для существенного уменьшения длительности статистического анализа, что приводит или к уменьшению энергетических затрат или к уменьшению требуемого объема памяти кибернетических устройств.

Специфика новых приложений стимулировала развитие метода последовательного анализа для случая неравноценности ошибок первого и второго рода и для случая близких гипотез (слабый сигнал), многоканальных ситуаций и др.

Следует также отметить, что метод последовательного анализа является далеко еще не завершенной статистической теорией. По сути дела, достаточно полно исследована лишь двухальтернативная ситуация при наличии однородной независимой выборки. Лишь для этого случая строго доказана оптимальность процедуры

последовательного анализа, основанной на коэффициенте правдоподобия (29].

К нерешенным до сих пор проблемам относятся отыскание оптимальных последовательных усеченных процедур, развитие последовательного анализа неоднородных зависимых выборок, отыскание оптимальных многоальтернативных последовательных процедур в различных сложных ситуациях и др.

Необходимо также отметить, что реализация последовательных процедур связана с большими техническими трудностями, чем реализация соответствующих классических процедур.

4. После появления монографии А. Вальда появился ряд работ, развивающих метод последовательного анализа в математическом плане и использующих его результаты для решения практических задач. В последнем случае эти работы связаны, в основном, с задачами обнаружения сигналов на фоне шумов.

Однако такого рода работ гораздо меньше, чем монографий [16, 19, 21, 24] и работ, посвященных главным образом классическим методам обнаружения и воспроизведения сигналов при наличии шумов.

Монография по последовательному анализу А. Вальда переведена на русский язык. Это обстоятельство существенно облегчило авторам написание книги, так как они не ставили своей задачей писать сводную монографию по последовательному анализу и его приложениям.

5. Однако нам казалось целесообразным систематизировать собственные результаты в этом направлении, а также комментарии и ссылки на результаты других авторов.

Основной текст книги разбит на 7 глав. В них сосредоточен материал, охватывающий математические вопросы метода последовательного анализа (гл. 1, 2, 3) и его приложений (гл. 4, 5, 6, 7).

В четырех дополнениях рассмотрены: родственные последовательному анализу серийные процедуры (Доп. I), а также связанные с ним задачи различения информационных потоков (Доп. II) и задачи теории поисков при наличии помех (Доп. III); дискуссия о связи рассмотренных в книге вопросов с теорией информации помещена в Доп. IV,

Материал, содержащий математические тонкости и громоздкие выкладки для облегчения чтения основного текста книги, помещен в приложении 1. В приложении 2 приводятся таблицы -квантилей распределения Вальда, аппроксимирующие распределение числа испытаний последовательной процедуры. Охарактеризуем кратко содержание основного текста книги и дополнений.

В гл. 1 сначала кратко излагаются известные основные принципы оптимального выбора между двумя гипотезами, установленные Нейманом и Пирсоном [28] и Вальдом [1], а также найденные ими соответствующие оптимальные процедуры (§ 1.2). В § 1.3 приводятся известные соотношения между основными параметрами задачи выбора между двумя гипотезами, преобразованные к формг, удобной для дальнейших исследований. В § 1.4 рассмотрен случай несимметричных порогов последовательной процедуры. Этот случай является следствием важной для практики ситуации неравноценности ошибок первого и второго рода. При этом происходит ряд известных упрощений общих соотношений последовательного анализа [1], кроме того, удается вывести формулу для дисперсии числа испытаний в последовательной процедуре. Эта формула существенно используется в последующем изложении.

В § 1.5 рассмотрен случай близких гипотез. В этом важном для практики случае существенно упрощаются общие соотношения, которые приводятся к простым расчетным формулам. Удается провести рассмотрения основных характеристик классической и последовательной процедур в окрестностях гипотетических значений параметра (1.5.2, 1.5.3).

Доказывается универсальный характер распределения Вальда (1.5.4). В § 1.6 изучается эффективность последовательной процедуры по сравнению с классической по необходимому числу испытаний. Здесь показано, что в несимметричном случае границ эта эффективность может быть существенно увеличена. В § 1.7 приводятся в основном известные результаты, связанные с усечением последовательной процедуры и группировкой выборочных данных. В § 1.8 рассматриваются многомерные обобщения задачи выбора между двумя гипотезами и комментируются вопросы, связанные с некоторыми условностями в выборе гипотетических значений

параметра. Прямыми методами вычисляются характеристики длительности последовательной процедуры. Указана возможность использования методов теории случайных блужданий. Общие результаты, полученные в гл. 1, используются в последующих главах.

Гл. 2 посвящена изложению теории оптимальной дискретизации непрерывных выборочных значений, и для широких классов плотностей показано, что потери от оптимальной дискретизации невелики (§ 2.2). В § 2.3 общая теория используется для конкретных распределений, наиболее часто встречающихся на практике.

В гл. 3 рассмотрен последовательный анализ многоальтернативной ситуации, как обобщение двухальтернативной процедуры (§ 3.3). Приводятся оценки длительности сложных последовательных процедур (§ 3.4), а также используются уравнения многомерных процессов случайных блужданий для изучения сложных последовательных процедур (§ 3.7).

В гл. 4 излагаются применения последовательного анализа для решения задач обнаружения сигналов при наличии шумов.

В § 4.2 рассматривается последовательное решение задачи простого обнаружения в одноканальных системах для сигналов когерентного вида, сигналов с флюктуирующими составляющими, сигналов в форме некогерентного пакета и других. В § 4.3 рассматривается задача обнаружения сигналов, подвергшихся бинарной дискретизации.

В § 4.4 приводятся данные о средней длительности последовательных процедур обнаружения, а также вероятностей правильного обнаружения. Наряду с оптимальными алгоритмами в ряде случаев кратко обсуждаются подоптимальные алгоритмы. В § 4.5-4.7 приведены результаты, связанные со сложным обнаружением в многоканальных системах. Решения задач, рассмотренных в гл. 4, используются в дальнейшем.

Гл. 5 посвящена применениям последовательных процедур при передаче информации в системах с управляющей обратной связью. В § 5.2 и 5.3 рассматривается передача по каналу с обратной связью в бинарном и многозначном случаях соответственно. В § 5.4 описан метод поиска с «пробными шагами управляемой длительности». Этот метод позволяет обеспечить

экстремальный поиск решения (поведения) в самонастраивающихся системах при наличии помех. Метод управляемых пробных шагов используется для систем автоматической настройки (§ 5.5) и систем радиообнаружения (§ 5.6). В § 5.7 рассматривается управление длительностью пробных шагов по группированным данным. Некоторые дополнительные примеры, связанные с поисковыми процедурами, обсуждаются в Доп. III.

Гл. 6 содержит описание экспериментальных устройств и методов экспериментального изучения характеристик последовательных процедур. Рассматриваются также некоторые алгоритмы, используемые при исследовании процедур последовательного типа на универсальных вычислительных машинах,

В гл. 7 показано, как использовать повышенную эффективность последовательного анализа при неравноценных ошибках первого и второго рода для соответствующих ситуаций приемочного и предупредительного контроля (§ 7.4). В § 7.5 описаны последовательные процедуры испытания на надежность.

В дополнениях рассмотрены процедуры, родственные последовательной (Доп. I), а также более общие процедуры, включающие последовательную как составной элемент (Доп. II, III, IV).

Здесь устанавливаются связи задачи двухальтернативного выбора с теорией серий (Доп. I). Показано, как последовательный анализ в сочетании с методами теории массового обслуживания позволяет строить эффективные процедуры кибернетического различения информационных потоков (Доп. II).

Приводятся экстремальные постановки задач теории поиска при наличии помех, и излагается ряд специальных решений этих задач для случаев, имеющих практический интерес (Доп. III). В Доп. IV рассматривается задача надежного различения большого числа сигналов при наличии шумов, которая сводится к задаче экспоненциально растущего (с объемом выборки) числа двухальтернативных выборов, что позволяет дать статистическое истолкование основных понятий теории информации.

К ряду новых результатов, частично опубликованных авторами ранее, а частично приведенные в тексте впервые, относятся: для случая несимметричных порогов вывод дисперсии числа испытаний и установление

теорефически неограниченной эффективности последовательной процедуры по сравнению с классической, для случая близких гипотез доказательство универсального характера распределения Вальда и указание способов оптимальной дискретизации для широкого класса плотностей вероятностей; определение порогов и оценка длительности последовательных процедур в многоканальных ситуациях; развитие метода поиска с пробными шагами управляемой длительности при наличии помех.

Результаты, приведенные в дополнениях, являются новыми.

6. Для книги характерно дискретное рассмотрение реально непрерывных процессов. Незначительные потери, связанные с таким переходом, компенсируются возможностями использования универсальных машин дискретного счета. Дискретные рассмотрения характерны для современного этапа развития техники. Они восходят к известной теореме В. А. Котельникова о дискретном «представлении непрерывных по времени сигналов с ограниченным спектром. Применение бинарной дискретизации по амплитуде оправдано удобствами машинной обработки.

В книге принят термин коэффициент правдоподобия, используемый в технической литературе, вместо соответствующего термина «отношение правдоподобия». Коэффициент правдоподобия для одного выборочного значения называется элементарным, а для некоторой части выборки — парциальным. Величина, дополняющая оперативную характеристику до единицы, в главах, связанных с приложениями, называется характеристикой правильного обнаружения, как это сейчас принято в технической литературе.

В синонимах статистика и обработка, процедура и алгоритм первые носят математическую, а вторые техническую окраску. Ряд терминов, относящихся к одним и тем же статистическим понятиям, комментируется в соответствующих местах.

Излагаемый материал не может служить учебным пособием по последовательному анализу, так как предполагает предварительные сведения по математической статистике и теории обнаружения сигналов на фоне шумов.

Математический аппарат, используемый в книге, не

выходит за рамки теории вероятностей и математического анализа.

Литература, приведенная в конце книги, не претендует на полноту. В ней учтено большинство отечественных публикаций, в монографиях [3, 16] и специально изданной библиографии [99] приведена достаточно полная библиография иностранных работ но рассматриваемым вопросам.

В книге содержится ряд фактов, известных в литературе, в том числе результаты, ранее опубликованные авторами, на что имеются соответствующие ссылки. Результаты без ссылок, приведенные в различных разделах книги, получены автором, написавшим эти разделы.

А. Е. Башариновым написаны главы 3, 4, 5, 6 и дополнения 1,111.

Б. С. Флейшманом написаны главы 1, 2, 7, дополнения II, IV и приложение 1.

Введение написано совместно обоими авторами.

Авторы выражают глубокую благодарность член-корр. АН СССР Кобзареву Ю. Б. и инж. Тысляцкому Г. С. за ряд ценных советов при написании книги, а также рецензентам д-ру физ. мат. наук Монину А. С. и канд. техн. наук Зубакову В. Д. за существенные замечания и полезную дискуссию.

Авторы благодарны сотрудникам Института радиотехники и электроники АН СССР Гуськовой В. Д. и Малиной 3. Н. за участие в расчетах таблиц, приведенных в приложении 2.

<< Предыдущий параграф Следующий параграф >>
Оглавление