Главная > Разное > Статистические выводы и связи, Т.2
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ГЛАВА 17. ОЦЕНИВАНИЕ

Постановка задачи

17.1 В предшествующих главах нам в ряде случаев приходилось сталкиваться с задачей оценивания параметров генеральной совокупности по выборочным данным. Однако до сих пор обсуждение такого рода вопросов проводилось, по существу, на интуитивном уровне. Так, в теории больших выборок мы брали в качестве оценок среднего и моментов генеральной совокупности выборочное среднее и выборочные моменты, считая эти оценки вполне удовлетворительными.

Теперь мы приступаем к более детальному изучению этого предмета. В настоящей главе будут рассмотрены различные критерии, которым должна удовлетворять «хорошая» оценка, и изучен вопрос о существовании «наилучших» (в приемлемом смысле этого слова) оценок. Несколько следующих глав будут посвящены методам получения оценок с требуемыми свойствами.

17-2 Очевидно, что если выборка не случайна, а получена каким-то целенаправленным способом, относительно которого ничего определенного не известно, то о генеральной совокупности можно сказать очень немногое. Кое-какие выводы тривиального характера, конечно, возможны. Например, если мы берем десять реп из кучи в 100 реп и находим, что их общий вес равен десяти фунтам, то ясно, что средний вес одной репы в куче не меньше одной десятой фунта. Однако информация такого рода вряд ли может представлять ценность. Что касается оценивания на основе пристрастных выборок, то оно принадлежит скорее области субъективных суждений, нежели области точных и объективных понятий. Поэтому мы ограничимся только случайными выборками. Общая задача, в ее простейшей постановке, будет заключаться в оценивании параметра генеральной совокупности на основе информации, даваемой выборкой. Мы начнем с задачи оценивания одного параметра. Случай нескольких параметров будет рассмотрен позже.

17.3 Выясним прежде всего, что понимается под словом «оценивание». Предположим, что мы знаем, с точностью до значения неизвестного параметра распределение генеральной совокупности. Пусть, кроме того, дана выборка из наблюдений Требуется определить, используя эти наблюдения, число, которое можно было бы взять в качестве значения 0, или интервал, о котором можно было бы утверждать, что он содержит это значение.

Будем называть статистикой любую функцию, зависящую только от наблюдений. Так как наблюдения являются случайными величинами, то статистики будут тоже случайными величинами. Поэтому, если какая-то из них используется для оценивания параметра 9, то для отдельных выборок могут получиться значения, сильно отличающиеся от истинного. Отсюда ясно, что нельзя найти оценку, которая принимала бы значения, близкие к 9, для всех возможных выборок. Мы должны ограничиться такой процедурой оценивания, которая давала бы хорошие результаты «в среднем» при многократном ее использовании или имела бы «большую вероятность успеха». Другими словами, надо иметь в виду, что методы оценивания порождают распределения значений оценок, и сравнивать их достоинства, исходя из свойств этих распределений.

17.4 Мы достигнем большей ясности, если будем различать правило оценивания (которое назовем оценочной функцией или просто оценкой) и значения, к которым это правило приводит в конкретных случаях. Различие между ними такое же, как между функцией определенной на некотором множестве значений переменной х, и отдельным значением, скажем которое эта функция принимает при фиксированном значении х, равном а. Наша задача заключается в нахождении оценок, а не их частных значений. Мы не будем отвергать оценку, если она даст плохие результаты для отдельных выборок (в том смысле, что ее значения будут существенно отличаться от истинного значения), но мы ее отвергнем, если она будет давать плохие результаты очень часто, т. е. если распределение значений оценки будет сильно расходиться с истинным значением 9. Вообще, качество оценки будет определяться целиком на основании ее выборочного распределения.

17.5 В теории больших выборок мы часто брали в качестве оценки для 9 статистику вычисляемую по выборке точно таким же путем, каким 9 вычислялось по генеральной совокупности. Например, выборочное среднее считалось оценкой для генерального среднего. Попробуем обосновать эту процедуру.

Рассмотрим случай генеральной совокупности вида

В качестве оценки генерального среднего 9 возьмем выборочное среднее

Распределение имеет вид (пример 11.12)

т. е. распределено нормально со средним и дисперсией

Отметим две особенности этого распределения: (а) его среднее, а также мода и медиана равны истинному значению ; (б) при возрастании рассеяние значений относительно становится меньше, и вероятность того, что данное значение отличается более чем на некоторую фиксированную величину от , уменьшается. Можно сказать, что точность оценки увеличивается с ростом

17.6 Вообще, нетрудно понять, что выражение «точность, увеличивающаяся с ростом имеет определенный смысл в том случае, когда дисперсия выборочного распределения убывает с убыванием а центральное значение либо совпадает с , либо отличается от него на величину, которая также убывает с убыванием Большинство оценок, с которыми обычно имеют дело, принадлежит к этому типу. Но есть и исключения. Рассмотрим, например, выборку из генеральной совокупности, имеющей распределение Коши:

Если мы возьмем в качестве оценки для выборочное среднее то распределение будет иметь вид

(см. пример 11.1). В этом случае распределение совпадает с распределением одного наблюдения и точность не увеличивается с ростом

<< Предыдущий параграф Следующий параграф >>
Оглавление