Рассмотрим данные скорости легкового автомобиля на участке дороги, полученные с панели прибора автомобиля. Все множество моментов времени движения с определенной скоростью представляет собой генеральную совокупность. Количество моментов движения на участке дороги достаточно велико, поэтому для изучения возьмем случайным образом часть моментов в объеме 30 штук. Отобранная часть будет представлять выборочную совокупность.
Рассмотрим признак Х – скорость (км/ч), а признак Y – ход (л/100км). Определим вид распределения генеральной совокупности с помощью критерия Пирсона (критерия согласия ꭓ-квадрат).
Для достижения цели выполним ряд дополнительных рассуждений, позволяющих выдвинуть предположение о виде распределения.
По выборке получено следующее эмпирическое распределение для признака X:
| 
 xi  | 
 10  | 
 15  | 
 20  | 
 30  | 
 34  | 
 39  | 
 40  | 
 41  | 
 49  | 
 52  | 
 57  | 
 60  | 
 66  | 
 69  | 
 72  | 
| 
 ni  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
| 
 xi  | 
 77  | 
 80  | 
 85  | 
 88  | 
 89  | 
 97  | 
 100  | 
 109  | 
 120  | 
 129  | 
 134  | 
 140  | 
 145  | 
 152  | 
 160  | 
| 
 ni  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
Перейдем к соответствующему интервальному вариационному ряду. Для этого по формуле Стерджесса найдем количество интервалов:
.
Получим .
Так как наибольшая скорость равна 160 км/ч, а наименьшая – 10 км/ч, то вся выборка попадет в промежуток (10; 160).
Величина интервала вычисляется по формуле
.
За начало первого интервала примем x0 =xmin = 10 км/ч, а конец первого интервала– х1 =xmin+ h = 160 км/ч . Получим последовательность интервалов: [10; 35), [35; 60), …, [135; 160].
Таким образом, интервальное распределение будет иметь вид:
| 
 [xi ; xi+1)  | 
 [10; 35)  | 
 [35; 60)  | 
 [60; 85)  | 
 [85; 110)  | 
 [110; 135)  | 
 [135; 160]  | 
| 
 ni  | 
 5  | 
 6  | 
 6  | 
 6  | 
 3  | 
 4  | 
Геометрическим представлением интервального распределения является гистограмма частот (рис.).
Рисунок. Гистограмма частот признака X
Вид гистограммы частот напоминает график плотности функции нормального распределения непрерывной случайной величины Х [1]. Поэтому есть основания предполагать, что распределение генеральной совокупности также имеет нормальное распределение.
Эмпирическое распределение для признака Y:
| 
 yi  | 
 2,2  | 
 2,6  | 
 3,0  | 
 3,6  | 
 3,8  | 
 4,0  | 
 4,1  | 
 4,2  | 
 5,2  | 
 5,4  | 
 6,0  | 
 6,5  | 
 7,0  | 
 7,2  | 
 7,5  | 
| 
 ni  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
| 
 yi  | 
 8,0  | 
 8,3  | 
 8,4  | 
 8,6  | 
 8,9  | 
 9,1  | 
 9,7  | 
 10,4  | 
 11,8  | 
 12,8  | 
 13,6  | 
 13,8  | 
 15,8  | 
 17,3  | 
| 
 ni  | 
 1  | 
 1  | 
 1  | 
 1  | 
 2  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
 1  | 
Перейдем к соответствующему интервальному вариационному ряду. Для этого по формуле Стерджесса найдем количество интервалов: .
Получим .
Так как наибольший расход равен 17,3 л/100км, а наименьший – 2,2 л/100км, то вся выборка попадет в промежуток (2,2; 17,3).
Величина интервала вычисляется по формуле
.
Сделать правильный вывод о виде распределения нам поможет критерий Пирсона (критерий согласия χ-квадрат). Данный критерий позволит ответить на вопрос о том, является ли различия между выборочным и теоретическим распределениями столь незначительными, что они могут быть приписаны лишь случайным факторам [2]. Проверку по критерию Пирсона проведем для признака X, отвечающего за скорость автомобиля.
Введем гипотезы:
H0: генеральная совокупность имеет нормальное распределение.
H1: генеральная совокупность не распределена по нормальному закону.
Выберем уровень значимости α=0,05.
Выберем статистику .
Вычислим точечные оценки параметров нормального распределения.
Признак X:
Для этого определим середину каждого интервала в интервальном распределении.
| 
 xi  | 
 22,5  | 
 47,5  | 
 72,5  | 
 97,5  | 
 122,5  | 
 147,5  | 
| 
 ni  | 
 5  | 
 6  | 
 6  | 
 6  | 
 3  | 
 4  | 
Среднее значение скорости для выборочных данных:
(км/ч);
выборочная дисперсия:
((км/ч)2).
Тогда исправленное выборочное среднее квадратическое отклонение:
или (км/ч).
Далее заполним следующую таблицу:
| 
 интервал  | 
 эмпирическая частота  | 
 теоретическая частота  | 
||||
| 
 -∞; 35  | 
 5  | 
 0,1401  | 
 4,686  | 
 0,314  | 
 0,098596  | 
 0,0210405  | 
| 
 35; 60  | 
 6  | 
 0,1791  | 
 5,322  | 
 0,678  | 
 0,459684  | 
 0,086374  | 
| 
 60; 85  | 
 6  | 
 0,2365  | 
 6,78  | 
 -0,780  | 
 0,6084  | 
 0,0897  | 
| 
 85; 110  | 
 6  | 
 0,2177  | 
 6,231  | 
 -0,231  | 
 0,053361  | 
 0,0086  | 
| 
 110; 135  | 
 3  | 
 0,1397  | 
 4,179  | 
 0,019  | 
 0,000361  | 
 0,00005171  | 
| 
 135; +∞  | 
 4  | 
 0,0869  | 
 2,802  | 
|||
| 
 30  | 
 1  | 
 30  | 
 0,20576621  | 
Искомые вероятности попадания значений признака Х в i-й интервал определим по формуле .
Используя таблицы значений функции Лапласа, находим:
;
;
;
;
;
.
В ходе заполнения таблицы мы объединили некоторые теоретические частоты, чтобы их суммарная частота была больше или равна 5. Соответствующие им теоретические частоты также нужно объединить.
Тогда =0,20576621 (см. последний столбец таблицы).
6) Определим критическое значение критерия Пирсона по заданному уровню значимости α =0,05 и числу степеней свободы ν =5-2-1=2, то есть или (0,05;2)=6 по таблице «Критические точки распределения Пирсона ».
Так как , то нет оснований отвергнуть нулевую гипотезу, то есть гипотеза о нормальном распределении скорости согласуется с опытными данными при уровне значимости α =0,05 [2].
Таким образом, на примере скорости автомобиля авторы работы рассмотрели алгоритм проверки гипотезы о нормальном распределении по критерию Пирсона.
Составим доверительный интервал для истинной скорости легкового автомобиля на участке дороги:
, где
Следовательно, скорость легкового автомобиля на участке дороги для всей генеральной совокупности будет принимать значение из промежутка (63,859; 94,461) км/ч.
Список литературы
Агишева Д. К., Матвеева Т.А., Светличная В.Б., Зотова С.А. Методические указания, контрольные работы по дисциплине «Теория вероятностей и математическая статистика» [Электронный ресурс]: методические указания / Д. К. Агишева,Т. А. Матвеева, В. Б. Светличная, С. А. Зотова // Сборник «Методические указания». Выпуск 4. – Электрон. текстовые дан.– Волжский: ВПИ (филиал) ВолгГТУ, 2012.
Демин С.Е., Демина Е.Л. Математическая статистика : учеб.-метод. пособие / авт.-сост. : С. Е. Демин, Е. Л. Демина ; М-во образования и науки РФ ; ФГАОУ ВО «УрФУ им. первого Президента России Б.Н.Ельцина», Нижнетагил. технол. ин-т (фил.). — Нижний Тагил : НТИ (филиал) УрФУ, 2016. — 284 с.