Главная > Математика > Метод парных сравнений
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.2. ПОДХОДЯЩИЙ РАЗМЕР ЭКСПЕРИМЕНТА

В этой книге часто предполагалось и будет предполагаться в этом параграфе, что линейная модель (§ 1.3) применима. Теоретическое ранжирование объектов можно выполнить в соответствии с их «ценностями». Мы поставим в соответствие объекту А ценность так что

и обозначим очки объекта Следует заметить, что теоретическая величина (не следует путать ее с так как в практической ситуации мы не знаем, какой объект надо обозначить Для удобства записи мы будем в этом и следующем разделах опускать скобки индексов для и обозначать вероятность предпочтения

Постановка задачи

Во многих экспериментах по сравнению объектов (или обработок) основной интерес состоит в выделении лучшего объекта. Для сбалансированного эксперимента естественно называть лучшим объект

с наибольшим числом очков, но это может привести к неверным результатам из-за случайных колебаний. Однако если строго больше, чем и если число повторений достаточно велико, то будет иметь наибольшую сумму с вероятностью близкой к 1 настолько, насколько это желательно. Мы сейчас рассмотрим один из методов определения такого

Возможная процедура такова:

а) находим соответствующее заданным и набору вероятностей предпочтения

б) производим эксперимент и объявляем лучшим объект с наибольшей суммой очков; если есть равных наибольших сумм, то случайным образом один из этих объектов объявляем лучшим.

Шаг б) прямолинеен, правило выбора довольно наивно, что упрощает дальнейшее обсуждение. Однако с а) необходимо еще поработать. Так, для и фиксированных, зависит от и мы уточним в духе общего подхода, развитого Бехгофером [6]. Мы предположим, что имеет вероятность предпочтения с любым другим объектом и что оставшиеся объектов равноценны. Это предположение, частный случай линейной модели, попросту означает, что главный объект известен и кажется разумным принять это за основу при определении числа повторений эксперимента. Так как есть полная аналогия с упрощением Бехгофера, то оказывается, что и в данном случае выбор и не обязательно соответствует наименее желательному варианту. Значения даются в табл. 4 приложения, дальнейшие обсуждения приводятся ниже.

Выбранную модель можно сформулировать так:

Точная теория распределения

Из (2.4.3) и (2.4.4) совместное распределение очков для модели (6.2.1) можно записать так:

Предположим, что очков одинаковы и соответствующие объекты занимают первое место. Число перестановок очков равно часть перестановок должна иметь наибольшую сумму очков на последнем месте, что соответствует При рандомизации на шаге б) соответствующий вклад в вероятность правильного выбора будет равен

и независим от Поэтому получается суммированием (6.2.3) по всем которые максимальны, и по всем другим возможным значениям очков, и его можно выразить как

где с — наименьшее целое число, большее или равное Например, если превращается в

где — частота размещения равная и Впрочем, для этого простого случая очевидно, что

Главный член всегда

Случай был предметом особого внимания Мостеллер а [109] в контексте «Мировых серий», где две команды, финалисты чемпионата по бейсболу, играли на большинство в серии из 7 игр. Ясно, что возможность окончания серий до того, как все игры будут сыграны, не изменяет вероятности того, что лучшая команда выиграет. С другой стороны, нет достаточно удовлетворительного способа оценки вероятности того, что заданная команда выигрывает в определенном матче, хотя доля побед более или менее годна для этого. Здесь мы имеем обобщение выбора из обратного биномиального распределения с серией, оканчивающейся в случае, когда либо либо достигают . Подходящая несмещенная оценка [54] есть или в соответствии с тем, выиграла ли данная команда или ее противник. Различные практические сложности, не вполне понятные для неамериканцев, обсуждаются у Мостеллера. См также упражнение 6.1.

Комментарии к табл. 4 приложения. Для эксперимента, включающего объектов с вероятностями предпочтений, удовлетворяющими (6.2.1), таблица дает наименьшее число повторений которое гарантирует, что высшая сумма очков в эксперименте размера будет относиться к наилучшему объекту хотя бы с предварительно назначенной вероятностью При создании таблицы точная теория использовалась для комбинаций не превышающих . В другом месте будет описано асимптотическое приближение, полученное из асимптотической теории § 2.4 (см. [139]). Сравнение точных и асимптотических значений указывает на хорошее согласие для больших объемов эксперимента.

(кликните для просмотра скана)

Если модель (6.2.1) окажется менее подходящей, то полученное из таблицы, будет обеспечивать правильный выбор с вероятностью пока

Это не необходимо, что довольно очевидно из рис. 6.1 которые показывают, как возрастает в функции от для когда верна модель (6.2.1). Например, возьмем и предположим, что первые пять объектов, рассматриваемые сами по себе, удовлетворяют модели (6.2.1) с Пополнение набора объектов добавлением к пяти объектам пятнадцати не имеет значения, поскольку вероятность их предпочтения по отношению к первым пяти объектам равна нулю. Условия (6.2.5) очевидным образом удовлетворяются в этом расширенном случае. Теперь для рис. 6.1 А показывает, что больше для чем для если Следовательно, для этого интервала в случае расширенного опыта то же значение что и при будет менее благоприятно, чем при Нет, конечно, гарантии, что это самый неблагоприятный случай. На самом деле соображения такого рода указывают, что возможны трудности в общем случае при определении наименее благоприятной конфигурации и исключении ее в дальнейшем из практической ситуации. Так, таблицей 4 приложения можно спокойно пользоваться как справочником по определению подходящего только если верна модель (6.2.1). Однако верность этой модели имеет большое значение сама по себе, так как она соответствует ситуации единичного «выскочки».

Может быть интересна перефразировка приведенного выше примера на языке турниров. Если игрок имеет вероятность выигрыша у любого соперника причем все соперники одинаково сильны, он имеет больше шансов выиграть в простом круговом турнире против 19 соперников, чем в малом турнире против четырех из них. (См. также [84].)

<< Предыдущий параграф Следующий параграф >>
Оглавление