ОПИСАНИЕ ПЕРЕМЕННЫХ
В качестве результативного признака возьмем Y – объем продаж бытовой техники за период 2010-2014 года [4], а факторными признаками, оказывающими влияние на результативный являются: X1– доходы россиян за этот период [1]; X2– индексы физического объема розничной продажи товаров; X3- индексы потребительских цен [2], а также X4 – уровень бедности [3]. Выбранные факторы проверим на тесноту связи, используя корреляционный анализ, чтобы использовать их для дальнейшего прогнозирования. Первым этапом анализа будет проведение корреляционного анализа.
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Для этого воспользуемся встроенными инструментами для анализа - составим таблицу парных коэффициентов корреляции. Парные коэффициенты корреляции используются для измерения тесноты связи между двумя переменными без учета их взаимодействия с другими переменными. В MS Excel расчёт парных коэффициентов корреляции осуществляется с помощью подключенного пакета анализа.
Теперь необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу [5] H0: ρ=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле: и построим матрицу наблюдаемых значений t-статистик для всех коэффициентовrij (таблица 2).
Таблица 1. Матрица парных коэффициентов корреляции Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α=0,05 и числа степеней свободы ν=n-2, tкрит.= 2,7764 (находим в таблице http://natalymath.ru/krit_student.html_
Таблица 2. Матрица наблюдаемыx значений t-статистик |
Итак, корреляционный анализ дает нам следующие результаты: при анализе парной корреляции мы ищем связь между показателями, связь между результирующим и факторными признаками есть – значит, мы правильно выбрали показатели. Однако, в таблице 1 желтым цветом показаны показатели, которые коррелируют между собой (связь между показателями явная) – а это значит, что мы выявили мультиколинеарность. Связь присутствует не только между результатом и факторами, но и между самими факторами. [6]
По критерию Стьюдента следует, что значимыми являются все факторы, однако на результирующую влияет Х3 и это подтверждается тем фактом, что 87,1 % доли её дисперсии обусловлены изменениями переменной Х3, включённая в рассматриваемую модель, а, соответственно только 12.9 % дисперсии обусловлены влиянием других, не включённых в корреляционную модель остаточных факторов, на У также влияет Х4 и это подтверждается тем фактом, что 61,1 % доли её дисперсии обусловлены изменениями переменной Х4.
Итак, полученные результаты корреляционного анализа, показавшие, что показатель имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования – построению регрессионной модели, которую и будем использовать для прогнозирования.
РЕГРЕССИОННЫЙ АНАЛИЗ
Будем использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты.
Построение и оценка регрессионной модели осуществляется в MS Excel с помощью модуля регрессии пакета анализа данных. После заполнения всех предложенных форм, приступаем к анализу. [7]
В модель включены все факторные признаки. Результаты регрессионного анализа выдаются в следующем виде (показаны на рисунке 3 и 4).
Регрессионная статистика |
|
Множественный R |
0,989265 |
R-квадрат |
0,978645 |
Нормированный R-квадрат |
0,97088 |
Стандартная ошибка |
33,12469 |
Наблюдения |
16 |
Дисперсионный анализ |
|
Df |
|
Регрессия |
4 |
Остаток |
11 |
Таблица 3. Вывод итогов №1 регрессионного анализа в MSExcel
Итого |
4 |
Коэффициенты |
|
Y-пересечение |
46,40993 |
Переменная X 1 |
0,026915 |
Переменная X 2 |
201,1712 |
Переменная X 3 |
37,34317 |
Переменная X 4 |
-22,5581 |
Таблица 4. Вывод итогов регрессионного анализа в MSExcel
Оценка уравнения регрессии имеет вид:
У= 46.41+0,0.27*Х1+201.17*Х2+37.34*Х3-22.55*Х4
Итак, после проведённого регрессионного анализа перейдём к интерпретации результатов.
Величина R2 характеризует долю общей дисперсии зависимой переменной, обусловленную воздействием объясняющих переменных. [8] Таким образом, около 97.8 % вариации (Y) объясняется вариацией факторов, Таким образом, можно сделать вывод, что модель достаточно адекватно отражает исследуемый процесс. На диаграмме показано совпадение прогнозируемого и фактического значений.
Диаграмма 1. Отклонения расчетного значения Y от фактического
ЗАКЛЮЧЕНИЕ
Был проведен анализ рынка бытовой техники для прогнозирования ситуации на 2015 год, с помощью корреляционного и регрессионного анализа с применением пакета прикладных программ Microsoft Excel. Объектом данного исследования является анализ рынка бытовой техники. Для проведения данного исследования были использованы данные с официального сайта Федеральной службы государственной статистики – сайт располагает полной информацией до 2014 года.
Выбранные факторы были проверены на тесноту связи, используя корреляционный анализ. Первым этапом анализа будет проведение корреляционного анализа. Полученные результаты корреляционного анализа, показавшие, что показатель имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования – построению регрессионной модели, которую и будем использовать для прогнозирования.
Около 97,8% вариации (Y) объясняется вариацией факторов, Таким образом, можно сделать вывод, что модель достаточно адекватно отражает исследуемый процесс.
Проанализировав, можно увидеть, что распределение остатков очень близко к истинному тренду, также видим динамику данных. В целом тренд можно охарактеризовать как линейный. Однако, следует отметить, что мы исследуем показатель, на который оказывают влияния множество экономических, демографических и политических факторов, для анализа мы выбрали 4 фактора и построили модель, которую можно использовать для прогнозирования.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
http://www.gks.ru/free_doc/new_site/population/urov/urov_11g.htm
http://www.gks.ru/free_doc/new_site/prices/potr/tab-potr1.htm
http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/poverty/#
http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/enterprise/retail/#
Гмурман В. Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. — 10-е издание, стереотипное. — Москва: Высшая школа, 2004. — 479 с. — ISBN 5-06-004214-6.
Елисеева И. И., Юзбашев М. М. Общая теория статистики: Учебник / Под ред. И. И. Елисеевой. — 4-е издание, переработанное и дополненное. — Москва: Финансы и Статистика, 2002. — 480 с. — ISBN 5-279-01956-9.
Захаров С. И., Холмская А. Г. Повышение эффективности обработки сигналов вибрации и шума при испытаниях механизмов // Вестник машиностроения : журнал. —М.: Машиностроение, 2001. — № 10. — С. 31—32. — ISSN 0042-4633.
Радченко Станислав Григорьевич. Устойчивые методы оценивания статистических моделей: Монография. — К.: ПП «Санспарель», 2005. — С. 504. — ISBN 966-96574-0-7, УДК: 519.237.5:515.126.2, ББК 22.172+22.152.