Главная > Математика > Линейная и нелинейная регрессии
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

1.9. Общие принципы проверки статистических гипотез и построения доверительных интервалов

Допустим, распределение -мерной случайной величины у зависит от некоторого (может быть многомерного) неизвестного параметра а, который принадлежит априори

заданному множеству Далее, задано разбиение множества В на два подмножества Выдвигаем гипотезу которую мы впоследствии будем проверять: истинное значение параметра а принадлежит множеству Если состоит из одной точки, гипотезу называют простой. Каждый раз, когда значение случайной величины у известно (т. е. имеется выборка), мы должны определенно ответить, верна наша гипотеза или нет. Таким образом, выборочное пространство разбивается в свою очередь на два подмножества Если у попадает в то гипотезу принимаем, если отвергаем. При этом мы можем совершить ошибку двух родов: 1) гипотеза верна, а мы ее отвергаем, 2) гипотеза неверна, а мы ее принимаем.

Ошибки могут иметь разные последствия. Например, если гипотеза состоит в наличии у пациента некоторой тяжелой болезни, то ошибка 2) не так существенна, как 1). Одновременно свести обе ошибки к минимуму невозможно. Целесообразно поступить следующим образом. Зададим верхнюю границу К максимальной ошибки первого рода и при этом условии будем минимизировать ошибку второго рода; называют уровнем значимости. Как же подсчитать ошибку, совершаемую нами для каждого Разумеется, в такой постановке ответить на такой вопрос невозможно. Однако мы можем подсчитать вероятность совершения ошибок первого и второго родов. Вероятность ошибки первого рода:

где а — истинное значение параметра, принадлежащее (гипотеза на самом деле верна). Вероятность ошибки второго рода:

где а (гипотеза на самом деле неверна). Минимизация предыдущего выражения эквивалентна максимизации вероятности отвергнуть гипотезу, когда она на самом деле неверна, т. е.

Множество называют критической областью критерия, или критическим множеством. Функцию

называют функцией мощности. Таким образом, критерий проверки гипотезы полностью определяется подмножеством выборочного пространства Множество разумеется, не должно зависеть от неизвестного параметра а.

Пример. Рассмотрим пример из параграфа 1.4. Допустим, мы хотим проверить простую гипотезу В наших обозначениях Допустим, мы задались некоторым уровнем значимости X (как правило, выбирают или В качестве критического множества рассмотрим множество где некоторое фиксированное число, зависящее от Найдем функцию мощности предложенного критерия

Заметим, что поэтому

В точке функция мощности имеет минимум. Это очевидно, так как если истинное значение близко к нулю, то мы легко можем совершить ошибку второго рода (т. е. принять гипотезу тогда как Вероятность ошибки первого рода равна:

Обозначим функцню распределения статистики при через тогда Для заданного является решением уравнения (рис. 1.12). Значение находится из таблиц нормального распределения.

Естественный путь сравнения различных Критериев — сравнение их функций мощности. Чем выше функция мощности, тем лучше критерий. Однако здесь возникает та же проблема, что и при сравнении функций риска (см. параграф 1.4). Функции мощности могут оказаться несравнимыми, но оптимальные критерии все же могут существовать. Их функция мощности в каждой точке а имеет большее значение, чем у других критериев с фиксированным уровнем значимости.

Рис. 1.12. Функция распределения средней и зависимость от

Такие критерии в математической статистике называют равномерно наиболее мощными РИМ).

Желаемым и естественным свойством критерия является следующее: вероятность принятия гипотезы, когда она неверна, меньше вероятности принятия гипотезы, когда она верна. В наших обозначениях для любых а Такие критерии называются несмещенными. РНМ несмещенный критерий соответствует эффективной несмещенной оценке в теории оценивания.

Существует общий способ построения критериев проверки статистических гипотез. Он аналогичен методу максимального правдоподобия в статистическом оценивании и называется критерием отношения правдоподобия. Суть его заключается в следующем. Пусть плотность распределения у равна т. е. зависит от неизвестного вектора

параметров а Для каждого у найдем и (считаем, что максимум достигается).

В качестве критического множества при проверке гипотезы выбираем

где фиксированное число, зависящее от , которое в свою очередь задает верхнюю границу вероятности совершения ошибки первого рода для всех а -Статистика называется статистикой критерия отношения правдоподобия. В случае простой случайной выборки, т. е. когда независимы и одинаково распределены, известны асимптотические оптимальные статистические свойства критерия отношения правдоподобия [63].

Продолжение примера. Применим критерий отношения правдоподобия для проверки гипотезы Функция плотности у равна:

далее

Последнее выражение следует из того, что минимальное значение достигается при Критическим множеством будет:

Как видим, это множество совпадает с найденным ранее. Значение находится, как и раньше, из решения уравнения

Перейдем к построению доверительных интервалов. Пусть распределение случайного вектора известно с точностью до Оценим а с помощью доверительного интервала или в общем случае с помощью доверительного множества. Доверительное множество каждый раз зависит от наблюдения у, т. е. является его функцией. Обозначим его через Важно, с какой вероятностью доверительное множество накрывает истинный параметр. Аналогично проверке гипотез можно ввести коэффициент доверия доверительного множества. является доверительным множеством с коэффициентом доверия не менее если для каждого а

Слева записана вероятность того, что накроет а. Эта вероятность вычисляется при условии, что истинное значение параметра также равно а.

Вероятность ошибки, т. е. вероятность того, что доверительное множество не накроет истинное значение параметра, равна:

Таким образом, можно трактовать как максимальную вероятность ошибки накрытия.

Можно ввести понятие несмещенности доверительного множества, аналогичное несмещенности статистического критерия. Допустим, а — истинное значение параметра, Мы же ошибочно предполагаем, что именно является истинным, и поэтому наше доверительное множество направлено на оценивание параметра Вероятность такого (ошибочного) оценивания равна Естественно считать, что эта вероятность будет меньше, чем если бы мы не делали ошибки и тогда вероятность накрытия равна (по условию (1.50)). Говорим, что является несмещенным доверительным множеством, если для любых имеем

Теперь дадим определение наиболее точного доверительного множества. Представим себе ситуацию, когда истинное значение параметра а нам неизвестно и мы ошибочно оцениваем вместо Пусть имеются два метода доверительного оценивания, т. е. два доверительных множества и будет точнее если накрывает ошибочное значение реже, чем

В частном случае, когда естественно вместо произвольных доверительных множеств рассматривать доверительные интервалы. Такой интервал будет характеризоваться парой статистик причем Для любых у. Вероятность накрытия равна:

Задача доверительного оценивания теснейшим образом связана с проверкой простой гипотезы. Будем проверять простую гипотезу где фиксированное значение из В. Допустим, имеется некоторый критерий проверки этой гипотезы. Область принятия гипотезы обозначим или Предположим, что критерий имеет уровень значимости X, причем для всех а На основе построим доверительное множество для оценивания которое обозначим Положим тогда и только тогда, когда ; другими словами,

Как объяснить выбор Множество есть множество тех возможных наблюдений у, которые «скорее всего» получаются, если в качестве неизвестного параметра выступает параметр Поэтому множество всех параметров, которые «порождают» это множество будет «близко расположенным» к и будет хорошей доверительной оценкой этого параметра. Легко убедиться в том, что если критерий имеет уровень значимости X, то построенное доверительное множество имеет коэффициент доверия

Основная связь между проверкой гипотез и доверительным оцениванием выражается в виде следующей теоремы, доказательство которой весьма просто.

Теорема 1.14. Пусть имеется РИМ несмещенный критерий проверки простой статистической гипотезы с уровнем значимости Тогда доверительное множество является несмещенным, имеет коэффициент доверия и является равномерно наиболее точным (РНТ), т. е. эффективным. Обратно, РНТ несмещенные доверительные множества приводят к РИМ несмещенным критериям.

Сформулированная теорема предлагает нам большие возможности в построении доверительных множеств. Задачи построения гипотез и доверительного оценивания можно считать эквивалентными.

Пример. Несколько обобщим предыдущий пример. Предположим, мы хотим проверить простую гипотезу Н: истинное значение равно Легко проверить, что область принятия гипотезы будет

Тогда

Значение как и раньше, является решением уравнения Множество имеет коэффициент доверия Можно показать, что критерий (1.54) является несмещенным РНМ. Отсюда вытекает, что доверительный интервал для оценивания где является несмещенным РНТ.

Упражнения 1.9

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление