Цель работы: овладеть навыками составления дискретных и интервальных вариационных рядов выборки.
Задание. Пусть исследуется технологический процесс производства бензина ректификационной колонной. Замеряется выход одной фракции готового продукта ‒ бензина марки АИ‒95. Измерения проводят с интервалом в один час. Получена выборка (см. табл. 1) из следующих 20 значений xi (i=1,2...,n, объем выборки n=20 ):
Таблица 1. Выход бензина АИ-95(%)
12.2 |
12.3 |
12.9 |
13.0 |
13.2 |
11.8 |
11.9 |
11.3 |
11.5 |
10.8 |
11.1 |
12.0 |
12.1 |
12.1 |
11.6 |
12.0 |
11.9 |
12.5 |
12.6 |
12.5 |
Требуется:
1. По данной выборке построить гистограмму, полигон частот и эмпирическую функцию распределения.
2. Найти числовые характеристики выборки.
Для графического представления полученной выборки необходимо:
1. Найти максимальное и минимальное значение выборки xmax и xmin
2. Вычислить размах варьирования исследуемого признака R по формуле
R= xmax ‒ xmin .
3. Далее следует группировка выборки. При этом интервал варьирования
[xmax, xmin] разбивается на N интервалов группировки одинаковой длины Δ, а затем подсчитывается число попаданий признака в j-й интервал группировки
ГОСТ 11.006-74 «По правилам согласования опытного распределения с теоретическим» рекомендует следующие значения N в зависимости от объема выборки n:
при n=200 N=18÷20;
при n=400 N=25÷30;
при n=1000 N=35÷40.
Некоторые авторы рекомендуют пользоваться следующими эмпирическими формулами:
При этом каждый интервал группировки Δi=(ai, bi) характеризуется своим правым и левым концом, числом ni ‒ попаданием признака в этот интервал. Иногда интервал характеризуют не границами, а его средним значением.
Проведем необходимые вычисления для нашей выборки.
1.Найдем максимальное и минимальное значения:
xmax =13.2, xmin=10.8 .
2. Вычислим размах варьирования признака:
R= xmax ‒ xmin = 13.2 ‒ 10.8 = 2.4.
3. Найдем число интервалов группировки N по эмпирической формуле:
Разобьем интервал варьирования R на 5 интервалов группировки равной длины. Длину интервала Δ найдем по формуле:
Дальнейшие вычисления удобно представить в табл.2.
Таблица 2. Интервалы группировки и их характеристики
Nj |
Интервал группировки Δj |
Кол-во попаданий в интервал |
Частота nj |
Плотности частот nj /Δ |
Относительные частоты nj/n |
1 |
10,75-11,25 |
││ |
2 |
4 |
2/20 |
2 |
11,25-11,75 |
│││ |
3 |
6 |
3/20 |
3 |
11,75-12,25 |
│││││ │││ |
8 |
16 |
8/20 |
4 |
12,25-12,75 |
││││ |
4 |
8 |
4/20 |
5 |
12,75-13,25 |
│││ |
3 |
6 |
3/20 |
∑ |
20 |
|
1 |
Чтобы значение исследуемого признака не попадало на границы интервала группировки, примем минимальное значение признака не 10,8, а 10,75 и от этого значения начнем строить интервалы группировки длиной Δ=0,5 (см. второй столбец табл. 1. 2.).
По данным таблицы строится ступенчатая фигура, которая называется гистограммой. При этом по оси x откладывается интервалы группировки, а по оси y ‒ величины nj/nΔ .
Чтобы значение исследуемого признака не попадало на границы интервала группировки, примем минимальное значение признака не 10,8, а 10,75 и от этого значения начнем строить интервалы группировки длиной Δ = 0,5 (см. второй столбец табл. 1.2).
По данным таблицы строится ступенчатая фигура, которая называется гистограммой. При этом по оси х откладываются интервалы группировки, а по оси y - величины nj/n.∆ . В Mathcad для построения гистограммы используют встроенную функцию hist(⌂,⌂), которая имеет два аргумента. Первый из них - вектор-столбец интервалов группировки, второй - вектор-столбец значений выборки. Кроме гистограммы строят полигон частот и эмпирическую функцию распределения. После этого находят числовые характеристики выборки.
Mathcad-документ лабораторной работы имеет вид, представленный на рис. 3.