МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ
Кафедра 804 "Теория вероятности и математическая статистика"
КУРСОВАЯ РАБОТА
по курсу
"Математическая статистика"
Выполнил:
студент группы 08-304
Принял:
профессор каф. 804
Кан Ю. С.
Дата: Оценка: Подпись: |
2003 г.
Задание 1.
Дан случайный вектор , где , k = 15.
Методом Монте-Карло найти вероятность .
Метод статистических испытаний (метод Монте-Карло) заключается в моделировании требуемой случайной величины с помощью выборки большого объема. При этом вероятность попадания рассматриваемой случайной величины в заданную область Q определяется, исходя из соотношения:
,
где n – объем выборки, m – количество реализаций случайной величины, попавших в область Q.
Для того чтобы смоделировать нормальный случайный вектор с ковариационной матрицей K, задается линейное преобразование, переводящее стандартный нормальный случайный вектор в рассматриваемый случайный вектор с матрицей K.
Чтобы найти матрицу преобразования , приводим квадратичную форму к сумме квадратов:
, где
,
.
Таким образом, моделируя вектор из трех некоррелированных стандартных нормальных случайных величин, с помощью преобразования получаем гауссовский вектор с ковариационной матрицей K.
Вектор моделируется с помощью датчика случайных чисел. Для каждой полученной реализации случайного вектора выполняется проверка на попадание в заданный шар. Итоговая вероятность рассчитывается как отношение количества реализаций, попавших в шар, к объему выборки.
На рис. 1а и 1б показаны результаты статистического испытания при объеме выборки n = 10000, k = 15 и k = 1.
Рис. 1а (n = 10000, k = 15) |
Рис. 2б (n = 10000, k = 1) |
Задание 2.
Имеются 50 опытов наблюдения X и Y:
,
где .
Оценить параметры a и b методом наименьших квадратов.
Решение 1:
Для нахождения оценок и применим метод максимального правдоподобия.
,
Составляем функцию правдоподобия:
,
где n – объем выборки (n = 50).
Получаем логарифмическую функцию правдоподобия:
.
Задача максимизации сводится к минимизации суммы квадратов:
Распишем сумму квадратов:
.
Введем новые обозначения:
С учетом новых обозначений получаем:
J(a,b) = a2 + nb2 + 2 ab – 2 a – 2 b +
Берем частные производные:
2 a + 2 b – 2,
2nb + 2 a – 2.
Решаем систему:
a + b = , | |
nb + a = . |
Получаем:
,
.
Решение 2:
Оценки параметров можно получить, решая так называемую нормальную систему уравнений:
,
где , ,
Получаем:
т.е. то же самое в виде системы:
nb + a = . | |
a + b = , |
Как видно, это та же система, что и в решении 1.
Таким образом, с учетом данных, полученных в опытах по наблюдению за X и Y, получаем значения коэффициентов:
= 121.415720807951,
= 75.462893127151,
= 472.393613346561,
= 293.720213200493,
= 1838.39078890617.
Получив значения коэффициентов, получаем значения оценки параметров:
a = 3.86747517626168,
b = 0.0373869460469762.
На рис. 2 представлена прямая .
Рис. 2. Результаты оценки параметров. |
Задание 2а.
Построить доверительные интервалы уровня 0.95 для параметров a и b.
Основная МНК-теорема:
Пусть в условия предыдущей задачи
,
.
Тогда
,
.
Следствие:
,
,
где - (i, i)-й элемент матрицы , - квантиль уровня для распределения Стьюдента с степенями свободы.
С учетом условия задачи () и всего вышесказанного, получаем следующее:
Матрица ,
соответственно,
0.322795848743494
0.132930005519663
0.662505924471855
2.011
Итого – доверительные интервалы уровня 0.95:
для a : ( 3.84191262236633 , 3.89303773015703 )
для b: ( -0,0246869720909494 , 0,0994608641849019 )
Задание 3.
Рассматривая как выборку, построить гистограмму (10 интервалов одинаковой длины). Пользуясь критерием и полученной гистограммой, проверить гипотезу о нормальном законе распределения с уровнем значения 0.01 случайной величины .
Минимальное и максимальное выборочные значения равны –0.2083122 и 0.2076246, соответственно. Разобьем получившийся промежуток на 10 интервалов одинаковой длины. В таблице 1 представлены характеристики получившегося разбиения.
№ | Левый конец | Правый конец | Кол-во элементов выборки, попавших в интервал |
1 | -2,2233607326425400 | -1,7794225005712100 | 2 |
2 | -1,7794225005712100 | -1,3354842684998800 | 2 |
3 | -1,3354842684998800 | -0,8915460364285440 | 5 |
4 | -0,8915460364285440 | -0,4476078043572120 | 9 |
5 | -0,4476078043572120 | -0,0036695722858795 | 8 |
6 | -0,0036695722858795 | 0,4402686597854530 | 8 |
7 | 0,4402686597854530 | 0,8842068918567850 | 7 |
8 | 0,8842068918567850 | 1,3281451239281200 | 3 |
9 | 1,3281451239281200 | 1,7720833559994500 | 4 |
10 | 1,7720833559994500 | 2,2160215880707800 | 2 |
Таблица 1. Данные для гистограммы.
Рис. 3. Гистограмма. |
Прежде чем проверять гипотезу о нормальном законе распределения случайной величины , оценим параметры закона распределения в предположении, что распределение гауссовское. Из условия предыдущей задачи
Значит, мат. ожидание равно нулю, а дисперсия оценивается выборочной дисперсией:
Подставляя выборочные данные, получаем: 0.00878
Таким образом, выдвигаемая гипотеза:
Для каждого интервала вычисляем вероятность, а также частоту попадания выборочных точек. Полученные результаты представлены в таблице 2.
№ (k) | Вероятность попадания в k-интервал: | Частота попадания выборочных точек в k-интервал , | ||
1 | 0,0131 | 0,0376 | 0,0245 | 0,04 |
2 | 0,0376 | 0,0909 | 0,0533 | 0,04 |
3 | 0,0909 | 0,1865 | 0,0956 | 0,10 |
4 | 0,1865 | 0,3273 | 0,1408 | 0,18 |
5 | 0,3273 | 0,4986 | 0,1713 | 0,16 |
6 | 0,4986 | 0,6700 | 0,1714 | 0,16 |
7 | 0,6700 | 0,8119 | 0,1419 | 0,14 |
8 | 0,8119 | 0,9079 | 0,0960 | 0,06 |
9 | 0,9079 | 0,9618 | 0,0539 | 0,08 |
10 | 0,9618 | 0,9864 | 0,0246 | 0,04 |
Таблица 2. Вероятностные и частотные характеристики.
На основании полученных результатов вычисляем статистику:
3.077
Если гипотеза верна, то статистика
Используя закон распределения , находим критическое значение для заданного уровня p = 0.01:
0.99
Из таблицы распределения получаем: 20.8
, значит гипотеза принимается.