При этом в одно-, двух- и многофакторном анализе, факторы, которые влияют на результат, принято считать известными, то есть вопрос только в том, чтобы выяснить существенность влияния или оценить его. Дисперсионный анализ можно применять, если допустимо предполагать в группах независимость распределений наблюдений, а также то, что выборочные группы соответствуют нормально распределённым генеральным совокупностям.
В данной статье рассмотрим простейший случай однофакторного дисперсионного анализа. Основная задача – это сравнение дисперсии, обусловленной случайными причинами, с той дисперсией, которая вызвана наличием исследуемого фактора. Если их различие значимо, то считается, что этот фактор оказывает значимое статистически влияние на исследуемую нами переменную. Значимость этих различий можно проверить с помощью критерия Фишера.
Внутригрупповая дисперсия характеризует влияние, которое оказывает случайная составляющая, а межгрупповая – влияние, оказываемое изучаемым
фактором. Внутригрупповую дисперсию можно рассчитать по формуле:
, межгрупповую: ,
где М — общее среднее, , m — количество групп, п — количество элементов в группе.
Для проведения однофакторного дисперсионного анализа в МS Ехсеl необходимо:
1. занести в таблицу данные, так чтобы в каждом из столбцов были данные, которые соответствуют одному значению исследуемого фактора, а сами столбцы расположились в порядке убывания или возрастания величины самого исследуемого фактора;
2. в ленте Данные выполнить команду Анализ данных, в диалоговом окне выбрать Однофакторный дисперсионный анализ в списке Инструменты анализа;
4. в диалоговом окне задать Входной интервал, для чего нужно ввести ссылку на диапазон, который содержит все столбцы анализируемых данных;
5. в разделе Группировка установить По столбцам;
6. задать Выходной диапазон, для чего нужно ввести ссылку на те ячейки, в которые поместятся результаты анализа.
После выполнения этих действий в выходном диапазоне появятся результаты дисперсионного анализа: дисперсии, средние, критерий Фишера и др. показатели.
Для интерпретации результатов, определяют влияние исследуемого фактора по величине значимости, которое принимает критерий Фишера. Она находится в таблице Дисперсионный анализ на пересечении столбца Р -значение и строки Между группами. Если < 0,05, значит, критерий Фишера значим, и можно считать доказанным влияние исследуемого фактора.
Для того, чтобы провести двухфакторный дисперсионный анализ в пакете анализа есть процедура Двухфакторный дисперсионный анализ (с повторениями и без повторений).
Рассмотрим пример. Пусть необходимо выяснить, каково влияние на степень заполняемости гостиниц расстояния от центра города. Пусть есть З уровня расстояний от центра города: 1) до З км, 2) от З до 5 км и З) свыше 5 км. Данные по заполняемости заданы в таблице 1.
Расстояние |
Заполняемость |
До 3 км |
92 98 89 97 90 94 |
От 3 до 5 км |
90 86 84 91 83 82 |
Свыше 5 км |
87 79 74 85 73 77 |
1) Данные вводим в таблицу Excel: в столбец А — заполняемость тех гостиниц, которые ближе всего к центру города, в столбец В — тех гостиниц, которые находятся на расстоянии от 3 до 5 км и свыше 5 км (диапазон А1:С6).
2) Выполняем в ленте Данные команду Анализ данных, в списке Инструменты анализа выбираем Однофакторный дисперсионный анализ.
3) Задаем Входной интервал А1:С6.
4) В разделе Группировка устанавливаем По столбцам
5) В качестве выходного диапазона указываем ячейку Е1.
После применения дисперсионного анализа получаем следующие результаты: при + пересечении Между группами и Р – значение мы видим величину 0,0002684 < 0,05, значит, критерий Фишера является значимым. Следовательно, влияние фактора расстояния от центра города на заполнение гостиниц статистически доказана.
Список литературы
Карасёва Л. А. Статистика // Всемирная история экономической мысли: В 6 томах / Гл. ред. В. Н. Черковец. — М.: Мысль, 1987.— Т.I. От зарождения экономической мысли до первых теоретических систем политической жизни. — С. 484-494. — 606 с. — 20 000 экз. — ISBN 5-244-00038-1.
Миклашевский И. Н. Статистика теоретическая // Энциклопедический словарь Брокгауза и Ефрона : в 86 т. (82 т. и 4 доп.). — СПб., 1890—1907.
Норман Дрейпер, Гарри Смит. Прикладной регрессионный анализ. Множественная регрессия = Applied Regression Analysis. — 3-е изд. —М.: «Диалектика», 2007. — С. 912. — ISBN 0-471-17082-8.
Орлов А. И. Прикладная статистика. Учебник. — М.: Экзамен, 2006. — 671 с.