Рассмотрим данные роста студентов, обучающихся в Уральском государственном лесотехническом университете. Все множество студентов представляет собой генеральную совокупность. Количество студентов достаточно велико, поэтому для исследования возьмем случайным образом часть студентов в объеме 30 человек, которая называется выборочной совокупностью. Пустьизучаемый признак Х – рост студента (см). Определим вид распределения генеральной совокупности с помощью критерия Пирсона (критерия согласия ꭓ-квадрат).
Прежде выполним ряд дополнительных рассуждений, позволяющих выдвинуть предположение о виде распределения.
По выборке получено следующее эмпирическое распределение:
xi |
162 |
166 |
168 |
170 |
171 |
172 |
173 |
174 |
175 |
176 |
179 |
180 |
182 |
186 |
ni |
1 |
2 |
1 |
2 |
2 |
2 |
1 |
2 |
3 |
4 |
5 |
2 |
1 |
2 |
Перейдем к соответствующему интервальному вариационному ряду. Для этого по формуле Стерджесса найдем количество интервалов: .
Получим .
Так как наибольший рост равен 186 см, а наименьший – 162 см, то вся выборка попадет в промежуток (162; 186).
Величина интервала вычисляется по формуле
.
За начало первого интервала примем x0 =xmin = 162 см, а конец первого интервала– х1 =xmin+ h = 166 см. Получим последовательность интервалов: [162; 166), [166; 170), …, [182; 186]. Таким образом, интервальное распределение будет иметь вид:
[xi ; xi+1) |
[162; 166) |
[166; 170) |
[170; 174) |
[174; 178) |
[178; 182) |
[182; 186] |
ni |
1 |
3 |
7 |
9 |
7 |
3 |
Геометрическим представлением интервального распределения является гистограмма частот.
Рисунок. Гистограмма частот
Вид гистограммы частот напоминает график плотности функции нормального распределения непрерывной случайной величины Х [1]. Поэтому есть основания предполагать, что распределение генеральной совокупности также имеет нормальное распределение.
Сделать правильный вывод о виде распределения нам поможет критерий Пирсона (критерий согласия ꭓ-квадрат). Данный критерий позволит ответить на вопрос о том, является ли различия между выборочным и теоретическим распределениями столь незначительными, что они могут быть приписаны лишь случайным факторам [2].
Введем гипотезы:
H0: генеральная совокупность имеет нормальное распределение.
H1: генеральная совокупность не распределена по нормальному закону.
Выберем уровень значимости α=0,05.
Выберем статистику .
Вычислим точечные оценки параметров нормального распределения.
Для этого определим середину каждого интервала в интервальном распределении.
xi |
164 |
168 |
172 |
176 |
182 |
186 |
ni |
1 |
3 |
7 |
9 |
7 |
3 |
(см) – средний рост студентов выборочной совокупности;
выборочная дисперсия:
(см2).
Тогда исправленное выборочное среднее квадратическое отклонение:
или (см).
Далее заполним следующую таблицу:
интервал |
эмпирическая частота |
теоретическая частота |
||||
-∞; 166 |
1 |
0,01425 |
0,4275 |
1,637 |
2,6798 |
0,2862 |
166; 170 |
3 |
0,07585 |
2,2755 |
|||
170; 174 |
7 |
0,222 |
6,66 |
|||
174; 178 |
9 |
0,3285 |
9,855 |
-0,855 |
0,7310 |
0,0742 |
178; 182 |
7 |
0,2443 |
7,329 |
-0,329 |
0,1082 |
0,0148 |
182; +∞ |
3 |
0,1131 |
3,393 |
-0,393 |
0,1544 |
0,0455 |
30 |
0,998 |
29,94 |
0,4207 |
Искомые вероятности попадания значений признака Х в i-й интервал определим по формуле .
Используя таблицы значений функции Лапласа, находим:
;
;
;
;
;
.
В ходе заполнения таблицы мы объединили некоторые теоретические частоты, чтобы их суммарная частота была больше или равна 5. Соответствующие им теоретические частоты также нужно объединить.
Тогда =0,4207 (см. последний столбец таблицы).
6) Определим критическое значение критерия Пирсона по заданному уровню значимости α =0,005 и числу степеней свободы ν=4-3=1, то есть или
(0,05; 1)=3,8 по таблице «Критические точки распределения Пирсона ».
Так как , то нет оснований отвергнуть нулевую гипотезу, то есть гипотеза о нормальном распределении роста студентов согласуется с опытными данными при уровне значимости α =0,005.
Таким образом, нами был рассмотрен алгоритм проверки гипотезы о нормальном распределении на примере роста студентов по критерию Пирсона
Библиографический список
Агишева Д. К., Матвеева Т.А., Светличная В.Б., Зотова С.А. Методические указания, контрольные работы по дисциплине «Теория вероятностей и математическая статистика» [Электронный ресурс]: методические указания / Д. К. Агишева,Т. А. Матвеева, В. Б. Светличная, С. А. Зотова // Сборник «Методические указания». Выпуск 4. – Электрон. текстовые дан.– Волжский: ВПИ (филиал) ВолгГТУ, 2012.
Демин С.Е., Демина Е.Л. Математическая статистика : учеб.-метод. пособие / авт.-сост. : С. Е. Демин, Е. Л. Демина ; М-во образования и науки РФ ; ФГАОУ ВО «УрФУ им. первого Президента России Б.Н.Ельцина», Нижнетагил. технол. ин-т (фил.). — Нижний Тагил : НТИ (филиал) УрФУ, 2016. — 284 с.