Рассмотрим данные скорости легкового автомобиля на участке дороги, полученные с панели прибора автомобиля. Все множество моментов времени движения с определенной скоростью представляет собой генеральную совокупность. Количество моментов движения на участке дороги достаточно велико, поэтому для изучения возьмем случайным образом часть моментов в объеме 30 штук. Отобранная часть будет представлять выборочную совокупность.
Рассмотрим признак Х – скорость (км/ч), а признак Y – ход (л/100км). Определим вид распределения генеральной совокупности с помощью критерия Пирсона (критерия согласия ꭓ-квадрат).
Для достижения цели выполним ряд дополнительных рассуждений, позволяющих выдвинуть предположение о виде распределения.
По выборке получено следующее эмпирическое распределение для признака X:
xi |
10 |
15 |
20 |
30 |
34 |
39 |
40 |
41 |
49 |
52 |
57 |
60 |
66 |
69 |
72 |
ni |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
xi |
77 |
80 |
85 |
88 |
89 |
97 |
100 |
109 |
120 |
129 |
134 |
140 |
145 |
152 |
160 |
ni |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
Перейдем к соответствующему интервальному вариационному ряду. Для этого по формуле Стерджесса найдем количество интервалов:
.
Получим .
Так как наибольшая скорость равна 160 км/ч, а наименьшая – 10 км/ч, то вся выборка попадет в промежуток (10; 160).
Величина интервала вычисляется по формуле
.
За начало первого интервала примем x0 =xmin = 10 км/ч, а конец первого интервала– х1 =xmin+ h = 160 км/ч . Получим последовательность интервалов: [10; 35), [35; 60), …, [135; 160].
Таким образом, интервальное распределение будет иметь вид:
[xi ; xi+1) |
[10; 35) |
[35; 60) |
[60; 85) |
[85; 110) |
[110; 135) |
[135; 160] |
ni |
5 |
6 |
6 |
6 |
3 |
4 |
Геометрическим представлением интервального распределения является гистограмма частот (рис.).
Рисунок. Гистограмма частот признака X
Вид гистограммы частот напоминает график плотности функции нормального распределения непрерывной случайной величины Х [1]. Поэтому есть основания предполагать, что распределение генеральной совокупности также имеет нормальное распределение.
Эмпирическое распределение для признака Y:
yi |
2,2 |
2,6 |
3,0 |
3,6 |
3,8 |
4,0 |
4,1 |
4,2 |
5,2 |
5,4 |
6,0 |
6,5 |
7,0 |
7,2 |
7,5 |
ni |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
yi |
8,0 |
8,3 |
8,4 |
8,6 |
8,9 |
9,1 |
9,7 |
10,4 |
11,8 |
12,8 |
13,6 |
13,8 |
15,8 |
17,3 |
ni |
1 |
1 |
1 |
1 |
2 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
Перейдем к соответствующему интервальному вариационному ряду. Для этого по формуле Стерджесса найдем количество интервалов: .
Получим .
Так как наибольший расход равен 17,3 л/100км, а наименьший – 2,2 л/100км, то вся выборка попадет в промежуток (2,2; 17,3).
Величина интервала вычисляется по формуле
.
Сделать правильный вывод о виде распределения нам поможет критерий Пирсона (критерий согласия χ-квадрат). Данный критерий позволит ответить на вопрос о том, является ли различия между выборочным и теоретическим распределениями столь незначительными, что они могут быть приписаны лишь случайным факторам [2]. Проверку по критерию Пирсона проведем для признака X, отвечающего за скорость автомобиля.
Введем гипотезы:
H0: генеральная совокупность имеет нормальное распределение.
H1: генеральная совокупность не распределена по нормальному закону.
Выберем уровень значимости α=0,05.
Выберем статистику .
Вычислим точечные оценки параметров нормального распределения.
Признак X:
Для этого определим середину каждого интервала в интервальном распределении.
xi |
22,5 |
47,5 |
72,5 |
97,5 |
122,5 |
147,5 |
ni |
5 |
6 |
6 |
6 |
3 |
4 |
Среднее значение скорости для выборочных данных:
(км/ч);
выборочная дисперсия:
((км/ч)2).
Тогда исправленное выборочное среднее квадратическое отклонение:
или (км/ч).
Далее заполним следующую таблицу:
интервал |
эмпирическая частота |
теоретическая частота |
||||
-∞; 35 |
5 |
0,1401 |
4,686 |
0,314 |
0,098596 |
0,0210405 |
35; 60 |
6 |
0,1791 |
5,322 |
0,678 |
0,459684 |
0,086374 |
60; 85 |
6 |
0,2365 |
6,78 |
-0,780 |
0,6084 |
0,0897 |
85; 110 |
6 |
0,2177 |
6,231 |
-0,231 |
0,053361 |
0,0086 |
110; 135 |
3 |
0,1397 |
4,179 |
0,019 |
0,000361 |
0,00005171 |
135; +∞ |
4 |
0,0869 |
2,802 |
|||
30 |
1 |
30 |
0,20576621 |
Искомые вероятности попадания значений признака Х в i-й интервал определим по формуле .
Используя таблицы значений функции Лапласа, находим:
;
;
;
;
;
.
В ходе заполнения таблицы мы объединили некоторые теоретические частоты, чтобы их суммарная частота была больше или равна 5. Соответствующие им теоретические частоты также нужно объединить.
Тогда =0,20576621 (см. последний столбец таблицы).
6) Определим критическое значение критерия Пирсона по заданному уровню значимости α =0,05 и числу степеней свободы ν =5-2-1=2, то есть или (0,05;2)=6 по таблице «Критические точки распределения Пирсона ».
Так как , то нет оснований отвергнуть нулевую гипотезу, то есть гипотеза о нормальном распределении скорости согласуется с опытными данными при уровне значимости α =0,05 [2].
Таким образом, на примере скорости автомобиля авторы работы рассмотрели алгоритм проверки гипотезы о нормальном распределении по критерию Пирсона.
Составим доверительный интервал для истинной скорости легкового автомобиля на участке дороги:
, где
Следовательно, скорость легкового автомобиля на участке дороги для всей генеральной совокупности будет принимать значение из промежутка (63,859; 94,461) км/ч.
Список литературы
Агишева Д. К., Матвеева Т.А., Светличная В.Б., Зотова С.А. Методические указания, контрольные работы по дисциплине «Теория вероятностей и математическая статистика» [Электронный ресурс]: методические указания / Д. К. Агишева,Т. А. Матвеева, В. Б. Светличная, С. А. Зотова // Сборник «Методические указания». Выпуск 4. – Электрон. текстовые дан.– Волжский: ВПИ (филиал) ВолгГТУ, 2012.
Демин С.Е., Демина Е.Л. Математическая статистика : учеб.-метод. пособие / авт.-сост. : С. Е. Демин, Е. Л. Демина ; М-во образования и науки РФ ; ФГАОУ ВО «УрФУ им. первого Президента России Б.Н.Ельцина», Нижнетагил. технол. ин-т (фил.). — Нижний Тагил : НТИ (филиал) УрФУ, 2016. — 284 с.