Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ГЛАВА 34. ПОСЛЕДОВАТЕЛЬНЫЕ МЕТОДЫ

Последовательные процедуры

34.1 В предыдущих главах, рассматривая задачи, связанные с выборками, мы обычно предполагали объем выборки фиксированным. Это могло происходить по разным причинам: или мы выбирали заранее; или вообще не могли выбирать например, когда нам представлены результаты законченного эксперимента; или это могло быть обусловлено тем, что объем выборки определялся некоторым другим критерием, например, если было решено проводить наблюдения в течение данного промежутка времени. Мы делали наши выводы, оставаясь в области, где постоянно. Например, находя стандартную ошибку некоторой оценки, мы делаем вероятностные утверждения, относящиеся к множеству выборок объема Можно было бы сказать, что наши формулы являются условными относительно Ясно, что если определяется некоторым способом, не связанным со значениями наблюдений, то такая трактовка справедлива.

34.2 Иногда, однако, объем выборки представляет собой случайную величину, зависящую от значений наблюдений. С одним из таких простейших случаев мы уже сталкивались в примере 9.13 (том 1, стр. 313). Предположим, что мы последовательно выбираем людей, чтобы определить относительное число имеющих редкую группу крови. Вместо выбора, скажем, 1000 индивидуумов и подсчета числа представителей с этой группой крови, мы можем предпочесть продолжать выбор до появления 20 таких случаев. Мы увидим позже, почему эта процедура может быть предпочтительней, а на данном этапе примем на веру, что она заслуживает рассмотрения. Производя выборки по такой схеме, мы, несомненно, нашли бы, что число требуемое для достижения фиксированного числа успехов, скажем 20, заметно колеблется. Оно должно быть не меньше 20, но может быть и бесконечным (хотя вероятность бесконечного продолжения выборки равна нулю, так что почти наверное мы должнь? рано или поздно остановиться).

34.3 Процедуры, подобные этой, называются последовательными. Их типичной особенностью является выборочная схема, устанавливающая правило, по которому мы решаем на каждом этапе, прекратить или продолжать выбор. В нашем примере правило было очень простым: если испытание дало неблагоприятный исход, то. продолжаем выбор; если достигнут успех, то также продолжаем выбор, за исключением случая, когда в предыдущих испытаниях достигнуто 19 успехов: тогда выбор прекращается. Решение в любой момент, вообще говоря, зависит от наблюдений, сделанных до этого момента. Таким образом, для последовательности значений объем выборки, при котором мы прекращаем выбор, зависит от иксов. Именно этот факт является характерной особенностью последовательного анализа.

Последовательные методы начали развиваться во время второй мировой войны в основном Вальдом (работа которого полностью изложена в его книге, Вальд (1947)) в США и одновременно Барнардом (1946) в Англии.

34.4 Обычная ситуация, когда мы фиксируем объем выборки заранее, может рассматриваться как очень специальный случай последовательной схемы. В этом случае выборочная процедура такова: продолжать выбор до получения членов независимо от того, какие наблюдаются значения. Однако это настолько вырожденный специальный случай, что в нем фактически теряется суть последовательного метода.

Если процедура останавливается с вероятностью единица, то схему называют замкнутой. Если же существует ненулевая вероятность того, что выбор может продолжаться неограниченно, то схема называется открытой. В этой главе мы не будем серьезно рассматривать открытые схемы. Они имеют, очевидно, меньшее практическое значение по сравнению с замкнутыми схемами, и их обычно приходится редуцировать к замкнутым схемам, устанавливая верхний предел для объема выборки. Такое усечение часто делает трудным точное определение их свойств.

В литературе по этому вопросу не всегда единообразно используются термины. «Замкнутые» иногда означает «усеченные», так говорят применительно к схемам, в которых определенное правило замыкания устанавливает верхний предел объема выборки. Соответственно «открытые» иногда означает «неусеченные».

Пример 34.1

В качестве примера довольно простой последовательной схемы рассмотрим выбор из (большой) популяции с долей успехов Мы будем продолжать выбор до получения успехов.

после чего остановимся. Вряд ли нужно доказывать, что такая схема замкнута. Вероятность того, что в бесконечной последовательности не появится успехов, равна нулю.

Вероятность успехов в первых испытаниях совместно с успехом в испытании (см. 5.14-15) равна

где Это есть распределение объема выборки Производящая функция частот для (с началом в нуле) дается выражением

Отсюда получаем производящую функцию семиинвариантов:

Разлагая это выражение до члена находим

Таким образом, среднее значение объема выборки равно Из этого не следует, что является несмещенной оценкой для В действительности такая несмещенная оценка дается выражением

потому что

Дисперсия этой оценки в сжатой форме не выражается. В самом деле,

Полагая и находим

Отсюда, вычитая имеем

Можно получить несмещенную оценку для в простой и замкнутой форме. Тем же путем, каким мы пришли к (34.6), показывается, что

Следовательно,

Таким образом,

Заметим, что для больших это выражение асимптотически совпадает с соответствующим результатом для выборок фиксированного объема

Оценка коэффициента вариации величины для данного отрицательно-биномиального распределения имеет вид

и для малых она приближенно равна Таким образом, для последовательного процесса относительная выборочная вариация величины приближенно постоянна.

Эта последовательная схема, часто называемая обратным биномиальным выбором, впервые обсуждалась Холдейном (1945) и Финни (1949b). Найт (1965) сделал эту теорию единой для биномиального, пуассоновского, гипергеометрического и экспоненциального распределений.

34.5 Выборка по качественному признаку занимает такое большое место в последовательном анализе, что, прежде чем переходить к более общим рассмотрениям, мы обсудим полезный графический метод представления процесса выбора.

Рис. 34.1.

Возьмем координатную сетку, как на рис. 34.1, и будем откладывать число неудач на оси абсцисс, а число успехов — на оси ординат.

Последовательный выбор может быть представлен на этой сетке траекторией, выходящей из начала координат, причем сдвиг вправо на один шаг соответствует неудаче Я, а один шаг вверх отвечает успеху У. Например, траектория изображает последовательность На этой диаграмме правило остановки эквивалентно некоторому барьеру. Например, линия задается уравнением таким образом, соответствует случаю выборки фиксированного объема Линия соответствует следовательно, определяет правило остановки такого типа, как рассмотренное в примере 34.1, с Траектория изображающая выборку объема 15, является тогда одной из траекторий, которая заканчивается в Если X представляет собой точку с координатами , то число различных траекторий, соединяющих , равно числу способов, которыми х может быть выбрано из Вероятность достижения точки X есть вероятность осуществления х успехов и у неудач, а именно

Пример 34.2. Разорение игрока

Одна из старейших задач теории вероятностей относится к последовательным процессам. Рассмотрим двух игроков и серию игр, в каждой из которых А выигрывает с вероятностью и В — с вероятностью . Проигравший в каждой игре платит победителю рубль. Если А начинает с а рублями, а рублями, то каковы вероятности их разорения (игрок считается разорившимся, когда он проигрывает свой последний рубль)?

Серии последовательных игр, подобные этой, могут быть представлены на графике, аналогичном рис. 34.1. Мы можем считать успехом победу игрока А в одной игре. Игра продолжается до тех пор, пока и имеют деньги, и прекращается, когда А имеет (т. е. В проиграл всю свою начальную сумму) или когда В имеет а рублей (А проиграл свою начальную сумму). Поэтому границами, определяющими выборочную схему, являются линии

Рис. 34.2.

Рисунок 34.2 служит иллюстрацией для случая Линий наклонены под 45° к осям и проходят через точки с координатами соответственно. Для любойточки между этими линиями меньше, чем 3, и меньше, чем 5. На линии и если траектория достегает, этой линии, то В, проиграв на три игры больше, чем А, разоряется; аналогично, когда траектория достигает то разоряется игрок А. Таким образом, последовательная схема выглядит так: если точка лежит между линиями, выбор продолжается; если достигнута линия то

выбор прекращается и разоряется игрок при достижении границы следует остановка и разорение игрока А.

Легко получить интересующие нас вероятности. Пусть их есть вероятность того, что, нмея х рублей, игрок А разорится. Рассматривая следующую игру, выводим уравнение

с граничными условиями

Обшее решение уравнения (34.11) есть

где корни квадратного уравнения

а именно:

Предположим, что Тогда, используя (34.12), находим решение

Если же (о — 1/2, то решение имеет вид

В частности, в начале игры, когда , при

34.6 Подобные ситуации можно, очевидно, обобщать многими способами и, в частности, можно устанавливать различного типа границы. При этом замкнутая схема — это, по существу, такая схема, для которой достоверно, что граница будет достигнута.

Пусть, например, схема задается так: если проигрывает А, то он платит один рубль, если же проигрывает В, то он платит рублей. Траектория на рис. 34.2, соответствующая такой схеме, состоит тогда из шагов единичной длины, параллельных оси абсцисс, и шагов длины к, параллельных оси ординат. Этот пример дает нам возможность выделить момент, который постоянно вносит трудность в математическую сторону последовательных схем: траектории могут не заканчиваться точно на границе, а пересекать ее. Например, для такой

траекторией является ломаная на рис. 34.2. После двух успехов и пяти неудач мы приходим в точку Следующий успех приведет нас в точку X, попадая в которую мы пересекаем границу в точке . Конечно, мы останавливаемся на том при котором граница достигается или пересекается. Существенный момент данного примера заключается в том, что точная вероятность достижения границы в точке равна нулю. Фактически эта точка недостижима. Позднее мы увидим, что из-за такого отсутствия непрерывности иногда бывает трудно установить точные и краткие утверждения об интересующих нас вероятностях. Мы будем называть такие ситуации «граничными эффектами». В большинстве практически случаев ими можно пренебрегать.

<< Предыдущий параграф Следующий параграф >>
Оглавление