ОЦЕНКА ДОСТОВЕРНОСТИ РАЗЛИЧИЯ МЕЖДУ НЕСКОЛЬКИМИ ВЫБОРКАМИ МЕТОДОМ ДИСПЕРСИОННОГО АНАЛИЗА - Студенческий научный форум

IX Международная студенческая научная конференция Студенческий научный форум - 2017

ОЦЕНКА ДОСТОВЕРНОСТИ РАЗЛИЧИЯ МЕЖДУ НЕСКОЛЬКИМИ ВЫБОРКАМИ МЕТОДОМ ДИСПЕРСИОННОГО АНАЛИЗА

Зудина М.Д. 1, Кондратьева Т.Н. 2
1Донской государственный технический университет, г. Ростов-на-Дону. Россия
2Донской государственный технический университет, г. Ростов-на-Дону, Россия
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Бывают случаи, когда появляется необходимость оценки достоверности различий между двумя и более выборками (группами наблюдений). Для этого пользуются методами дисперсионного анализа, предназначенного для исследования задач о том, действует ли один или несколько независимых факторов, имеющих несколько градаций, на изучаемую случайную величину.

При этом в одно-, двух- и многофакторном анализе, факторы, которые влияют на результат, принято считать известными, то есть вопрос только в том, чтобы выяснить существенность влияния или оценить его. Дисперсионный анализ можно применять, если допустимо предполагать в группах независимость распределений наблюдений, а также то, что выборочные группы соответствуют нормально распределённым генеральным совокупностям.

В данной статье рассмотрим простейший случай однофакторного дисперсионного анализа. Основная задача – это сравнение дисперсии, обусловленной случайными причинами, с той дисперсией, которая вызвана наличием исследуемого фактора. Если их различие значимо, то считается, что этот фактор оказывает значимое статистически влияние на исследуемую нами переменную. Значимость этих различий можно проверить с помощью критерия Фишера.

Внутригрупповая дисперсия характеризует влияние, которое оказывает случайная составляющая, а межгрупповая – влияние, оказываемое изучаемым

фактором. Внутригрупповую дисперсию можно рассчитать по формуле:

, межгрупповую: ,

где М — общее среднее, , m — количество групп, п — количество элементов в группе.

Для проведения однофакторного дисперсионного анализа в МS Ехсеl необходимо:

1. занести в таблицу данные, так чтобы в каждом из столбцов были данные, которые соответствуют одному значению исследуемого фактора, а сами столбцы расположились в порядке убывания или возрастания величины самого исследуемого фактора;

2. в ленте Данные выполнить команду Анализ данных, в диалоговом окне выбрать Однофакторный дисперсионный анализ в списке Инструменты анализа;

4. в диалоговом окне задать Входной интервал, для чего нужно ввести ссылку на диапазон, который содержит все столбцы анализируемых данных;

5. в разделе Группировка установить По столбцам;

6. задать Выходной диапазон, для чего нужно ввести ссылку на те ячейки, в которые поместятся результаты анализа.

После выполнения этих действий в выходном диапазоне появятся результаты дисперсионного анализа: дисперсии, средние, критерий Фишера и др. показатели.

Для интерпретации результатов, определяют влияние исследуемого фактора по величине значимости, которое принимает критерий Фишера. Она находится в таблице Дисперсионный анализ на пересечении столбца Р -значение и строки Между группами. Если < 0,05, значит, критерий Фишера значим, и можно считать доказанным влияние исследуемого фактора.

Для того, чтобы провести двухфакторный дисперсионный анализ в пакете анализа есть процедура Двухфакторный дисперсионный анализ (с повторениями и без повторений).

Рассмотрим пример. Пусть необходимо выяснить, каково влияние на степень заполняемости гостиниц расстояния от центра города. Пусть есть З уровня расстояний от центра города: 1) до З км, 2) от З до 5 км и З) свыше 5 км. Данные по заполняемости заданы в таблице 1.

Расстояние

Заполняемость

До 3 км

92 98 89 97 90 94

От 3 до 5 км

90 86 84 91 83 82

Свыше 5 км

87 79 74 85 73 77

Таблица 1

1) Данные вводим в таблицу Excel: в столбец А — заполняемость тех гостиниц, которые ближе всего к центру города, в столбец В — тех гостиниц, которые находятся на расстоянии от 3 до 5 км и свыше 5 км (диапазон А1:С6).

2) Выполняем в ленте Данные команду Анализ данных, в списке Инструменты анализа выбираем Однофакторный дисперсионный анализ.

3) Задаем Входной интервал А1:С6.

4) В разделе Группировка устанавливаем По столбцам

5) В качестве выходного диапазона указываем ячейку Е1.

После применения дисперсионного анализа получаем следующие результаты: при + пересечении Между группами и Р – значение мы видим величину 0,0002684 < 0,05, значит, критерий Фишера является значимым. Следовательно, влияние фактора расстояния от центра города на заполнение гостиниц статистически доказана.

Список литературы

  1. Карасёва Л. А. Статистика // Всемирная история экономической мысли: В 6 томах / Гл. ред. В. Н. Черковец. — М.: Мысль, 1987.— Т.I. От зарождения экономической мысли до первых теоретических систем политической жизни. — С. 484-494. — 606 с. — 20 000 экз. — ISBN 5-244-00038-1.

  2. Миклашевский И. Н. Статистика теоретическая // Энциклопедический словарь Брокгауза и Ефрона : в 86 т. (82 т. и 4 доп.). — СПб., 1890—1907.

  3. Норман Дрейпер, Гарри Смит. Прикладной регрессионный анализ. Множественная регрессия = Applied Regression Analysis. — 3-е изд. —М.: «Диалектика», 2007. — С. 912. — ISBN 0-471-17082-8.

  4. Орлов А. И. Прикладная статистика. Учебник. — М.: Экзамен, 2006. — 671 с.

Просмотров работы: 544