Мои Конспекты
Главная | Обратная связь


Автомобили
Астрономия
Биология
География
Дом и сад
Другие языки
Другое
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Металлургия
Механика
Образование
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Туризм
Физика
Философия
Финансы
Химия
Черчение
Экология
Экономика
Электроника

Центральная предельная теорема для одинаково распределенных слагаемых



Различные формы центральной предельной теоремы отличаются между собой условиями, накладываемыми на распределения образующих сумму случайных слагаемых. Здесь мы сформулируем и докажем одну из самых простых форм центральной предельной теоремы, относящуюся к случаю одинаково распределенных слагаемых.

Теорема. Если - независимые случайные величины, имеющие один и тот же закон распределения с математическим ожиданием и дисперсией , то при неограниченном увеличении закон распределения суммы

(13.8.1)

неограниченно приближается к нормальному.

Доказательство.

Проведем доказательство для случая непрерывных случайных величин (для прерывных оно будет аналогичным).

Согласно второму свойству характеристических функций, доказанному в предыдущем , характеристическая функция величины представляет собой произведение характеристических функций слагаемых. Случайные величины имеют один и тот же закон распределения с плотностью и, следовательно, одну и ту же характеристическую функцию

. (13.8.2)

Следовательно, характеристическая функция случайной величины будет

. (13.8.3)

Исследуем более подробно функцию . Представим ее в окрестности точки по формуле Маклорена с тремя членами:

, (13.8.4)

где при .

Найдем величины , , . Полагая в формуле (13.8.2) имеем:

. (13.8.5)

Продифференцируем (13.8.2) по :

. (13.8.6)

Полагая в (13.8.6) , получим:

. (13.8.7)

Очевидно, не ограничивая общности, можно положить (для этого достаточно перенести начало отсчета в точку ). Тогда

.

Продифференцируем (13.8.6) еще раз:

,

отсюда

. (13.8.8)

При интеграл в выражении (13.8.8) есть не что иное, как дисперсия величины с плотностью , следовательно

. (13.8.9)

Подставляя в (13.8.4) , и , получим:

. (13.8.10)

Обратимся к случайной величине . Мы хотим доказать, что ее закон распределения при увеличении приближается к нормальному. Для этого перейдем от величины к другой («нормированной») случайной величине

. (13.8.11)

Эта величина удобна тем, что ее дисперсия не зависит от и равна единице при любом . В этом нетрудно убедиться, рассматривая величину как линейную функцию независимых случайных величин , каждая из которых имеет дисперсию . Если мы докажем, что закон распределения величины приближается к нормальному, то, очевидно, это будет справедливо и для величины , связанной с линейной зависимостью (13.8.11).

Вместо того чтобы доказывать, что закон распределения величины при увеличении приближается к нормальному, покажем, что ее характеристическая функция приближается к характеристической функции нормального закона.

Найдем характеристическую функцию величины . Из соотношения (13.8.11), согласно первому свойству характеристических функций (13.7.8), получим

, (13.8.12)

где - характеристическая функция случайной величины .

Из формул (13.8.12) и (13.8.3) получим

(13.8.13)

или, пользуясь формулой (13.8.10),

. (13.8.14)

Прологарифмируем выражение (13.8.14):

.

Введем обозначение

. (13.8.15)

Тогда

. (13.8.16)

Будем неограниченно увеличивать . При этом величина , согласно формуле (13.8.15), стремится к нулю. При значительном ее можно считать весьма малой. Разложим, в ряд и ограничимся одним членом разложения (остальные при станут пренебрежимо малыми):

.

Тогда получим

.

По определению функция стремится к нулю при ; следовательно,

и

,

откуда

. (13.8.17)

Это есть не что иное, как характеристическая функция нормального закона с параметрами , (см. пример 2, 13.7).

Таким образом, доказано, что при увеличении характеристическая функция случайной величины неограниченно приближается к характеристической функции нормального закона; отсюда заключаем что и закон распределения величины (а значит и величины ) неограниченно приближается к нормальному закону. Теорема доказана.

Мы доказали центральную предельную теорему для частного, но важного случая одинаково распределенных слагаемых. Однако в достаточно широком классе условий она справедлива и для неодинаково распределенных слагаемых. Например, А. М. Ляпунов доказал центральную предельную теорему для следующих условий:

, (13.8.18)

где - третий абсолютный центральный момент величины :

.

- дисперсия величины .

Наиболее общим (необходимым и достаточным) условием справедливости центральной предельной теоремы является условие Линдеберга: при любом

,

где - математическое ожидание, - плотность распределения случайной величины , .

 

Под статистической гипотезой понимают всякое высказывание о генеральной совокупности (случайной величине), проверяемое по выборке (по результатам наблюдений).

Не располагая сведениями о всей генеральной совокупности, высказанную гипотезу сопоставляют по определенным правилам, с выборочными сведениями и делают вывод о том, можно принять гипотезу или нет.

Процедура сопоставления высказанной гипотезы с выборочными данными называется проверкой гипотезы.

Рассмотрим этапы проверки гипотезы и используемые при этом понятия.

Этап 1. Располагая выборочными данными и руководствуясь конкретными условиями рассматриваемой задачи, формулируют гипотезу Но, которую называют основной или нулевой, и гипотезу Н1конкурирующую с гипотезой Н0. Термин «конкурирующая» означает, что являются противоположными следующие два события:

по выборке будет принято решение о справедливости для генеральной совокупности гипотезы Н0;

по выборке будет принято решение о справедливости для генеральной совокупности гипотезы Н1.

Гипотезу H1 называют также альтернативной. Например, если нулевая гипотеза такова: математическое ожидание равно 5,- то альтернативная гипотеза может быть следующей: математическое ожидание меньше 5, что записывается следующим образом:

Этап 2. Задаются вероятностью a , которую называют уровнем значимости. Поясним ее смысл.

Решение о том, можно ли считать высказывание Н0 справедливым для генеральной совокупности, принимается по выборочным данным, т. е. по ограниченному ряду наблюдений, следовательно, это решение может быть ошибочным. При этом может иметь место ошибка двух родов:

отвергают гипотезу Но, или, иначе, принимают альтернативную гипотезу H1, тогда как на самом деле гипотеза Н0 верна; это ошибка первого рода;

принимают гипотезу Н0 , тогда как на самом деле высказывание Но неверно, т. е. верной является гипотеза Н1 это ошибка второго рода.

Так вот уровень значимости a—это вероятность ошибки первого рода, т. е.

вероятность того, что будет принята гипотеза Н1 , если на самом деле в генеральной совокупности верна гипотеза Но. Вероятность a задается заранее малым числом, используют некоторые стандартные значения: 0,05; 0,01; 0,005; 0,001. Например, a=0,05 означает следующее: если гипотезу Но проверять по каждой из 100 выборок одинакового объема, то в среднем в 5 случаях из 100 мы совершим ошибку первого рода.

Вероятность ошибки второго рода обозначают b, т. е.

—вероятность того, что будет принята гипотеза Но, если на самом деле верна гипотеза Н1.

Этап 3. Находят величину j такую, что:

ее значения зависят от выборочных данных, т. е. для которой справедливо равенство

- ее значения позволяют судить о «расхождении выборки с гипотезой Н0»;

- и которая, будучи величиной случайной в силу случайности выборки, подчиняется при выполнении гипотезы Но некоторому известному закону распределения.

Величину j называют критерием.

Этап 4. Далее рассуждают так. Так как значения критерия позволяют судить о «расхождении выборки с гипотезой Но», то из области допустимых значений критерия j следует выделить подобласть wтаких значений, которые свидетельствовали бы о существенном расхождении выборки с гипотезой Но и, следовательно, о невозможности принять гипотезу Но.

Подобласть w называют критической областью.

Допустим, что критическая область выделена. Тогда руководствуются следующим правилом: если вычисленное по выборке значение критерия j попадает в критическую область, то гипотеза Но отвергается и принимается гипотеза Н1. При этом следует понимать, что такое решение может оказаться ошибочным:

на самом деле гипотеза Но может быть справедливой. Таким образом, ориентируясь на критическую область, можно совершить ошибку первого рода, вероятность которой задана заранее и равна a. Отсюда вытекает следующее требование к критической области w:

вероятность того, что критерий j примет значениеизкритической области w , должна быть равна заданному числу a, т. е.

Но критическая область данным равенством определяется неоднозначно. Действительно, представив себе график функции плотности fj (х) критерия j , нетрудно понять, что наоси абсцисс существует бесчисленное множество областей-интервалов таких, что площади построенных на них криволинейных трапеций равны a. Поэтому кроме требования

выдвигается следующее требование: критическая область w должна быть расположена так, чтобы при заданной вероятности a ошибки первого рода вероятность b ошибки второго рода была минимальной.

Возможны три вида расположения критической области (в зависимости от вида нулевой и альтернативной гипотез, вида и распределения критерия j):

правосторонняя критическая область (рис.а) , где критическая точка

определяется из условия:

левосторонняя критическая область(рис.б) , где критическая точка

определяется из условия :

двусторонняя критическая область (рис.в), где критические точки

,

называемые двусторонними, определяются из условий

И называются двусторонними критическими точками.

Этап 5. В формулу критерия

вместо Х1, Хг, …, Хп подставляют конкретные числа, полученные в результате п наблюдений, и подсчитывают числовое значение jчис критерия.

Если jчис попадает в критическую область w, то гипотеза Но отвергается и принимается гипотеза Н1.

Если jчис не попадает в критическую область, гипотеза Но не отвергается.