ВЛИЯНИЕ ЦЕН НА РУЛОННУЮ СТАЛЬ И КОКСУЮЩИЙСЯ УГОЛЬ НА КОТИРОВКИ АКЦИЙ ПАО СЕВЕРСТАЛЬ - Студенческий научный форум

XIII Международная студенческая научная конференция Студенческий научный форум - 2021

ВЛИЯНИЕ ЦЕН НА РУЛОННУЮ СТАЛЬ И КОКСУЮЩИЙСЯ УГОЛЬ НА КОТИРОВКИ АКЦИЙ ПАО СЕВЕРСТАЛЬ

Дибиров И.А. 1
1Финансовый Университет при Правительстве РФ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

На сегодняшний день, в эпоху стремительной диджитализации и падающих процентных ставок, торговля на фондовом рынке становится все более популярным местом заработка и получения пассивного дохода среди обычного населения. В связи с этим, очень важно понимать, какие факторы влияют на динамику стоимости тех или иных ценных бумаг, а также уметь строить базовые прогнозы относительно их роста или падения.

В качестве объекта исследования данной работы были выбраны обыкновенные акции ПАО «Северсталь», одного из крупнейших игроков металлургической и горнодобывающей отрасли как в России (на 2019 год Северсталь производила около 20% совокупного объема металлопроката в России), так и в мире [2]. Такое положение компании делает ценные бумаги Северстали одними из наиболее привлекательных на российском рынке, что обуславливает актуальность данной работы.

Целью данной статьи является построение модели зависимости стоимости акций ПАО «Северсталь» от ряда факторов с целью успешного прогнозирования показателя в будущие периоды.

В качестве задач работы можно выделить:

Построить оптимальную спецификацию модели для оценивания стоимости ценных бумаг ПАО «Северсталь» по ряду факторов;

Оценить качество и адекватность полученной модели;

Сделать выводы об экономической интерпретации результатов данного исследования.

Формирование набора потенциальных факторов, влияющих на котировки акций ПАО «Северсталь»

Для формирования изначального расширенного набора потенциальных факторов была проанализирована деятельность Северстали, ее особенности, а также особенности фондового рынка.

Как уже было сказано, основной деятельностью компании является производство рулонной стали (металлопроката), а также различных изделий из стали. При этом в компании функционирует дивизион «Северсталь Ресурс», относящийся к горнодобывающей отрасли [2]. На основе этой информации были предварительно отобраны следующие факторы:

цена фьючерса на рулонную сталь;

цена фьючерса на арматуру (steel rebar);

цена фьючерса на металлолом (steel scrap);

цена фьючерса на коксующийся уголь (продажи концентрата коксующегося угля и энергетического угля составляют порядка 25% от совокупных продаж подразделения «Северсталь Ресурс» - в 2019 году было продано 4,7 млн тонн угля).

При этом стоит отметить, что был упущен такой потенциально значимый фактор, как стоимость железорудного окатыша, продажи которого в 2019 году составили около 47% выручки ресурсного подразделения Северстали. Это произошло ввиду отсутствия рыночных котировок стоимости данного материала, а, следовательно, и доступного набора данных.

Во время подбора факторов была учтена и географическая составляющая операционной деятельности Северстали. С учетом того, что в 1 квартале 2020 года доля экспорта в продажах компании составила 45% (с планируемым увеличением до 48-49% во 2 квартале), в качестве потенциального фактора был выбран курс доллара США к рублю.

В конце концов, было принято во внимание и влияние динамики отрасли на котировки акций компаний путем включения отраслевого индекса металлургической и горнодобывающей промышленности MOEXMM в набор потенциальных факторов.

Отбор регрессоров и построение спецификации модели

Следующим шагом в работе послужил сбор рыночной информации по значениям перечисленных выше факторов за период с января 2015 года по ноябрь 2020 года с интервалом в один месяц, а также поиск динамики стоимости акций ПАО «Северсталь» на Московской бирже за указанный период. В качестве информационных ресурсов использовался официальный сайт Московской Биржи, ресурс Investing.com, а также база данных Thomson Reuters. В результате была собрана информация о 71 наблюдении.

Далее для отбора наиболее значимых и актуальных регрессоров была построена корреляционная матрица по исходному набору данных при помощи пакета «Анализ данных» в Microsoft Excel (таблица 1):

Таблица 1.

Корреляционная матрица потенциальных регрессоров для модели стоимости акций ПАО «Северсталь» [1,3,4, расчеты автора]

 

Severstal

MOEXMM

Steel

Coal

Scrap

Rebar

USD

Severstal

1

           

MOEXMM

0,757855

1

         

Steel

0,773251

0,350584

1

       

Coal

0,917152

0,819765

0,612059

1

     

Scrap

0,610916

0,253592

0,778717

0,518412

1

   

Rebar

0,558189

0,174042

0,773951

0,442679

0,969738

1

 

USD

0,179447

0,489685

-0,11724

0,116053

-0,43427

-0,46726

1

По результатам корреляционного анализа удалось определить, что лишь три из перечисленных факторов имеют сильную связь с эндогенной переменно (значение коэффициента корреляции со стоимостью акций Северстали больше 0,7) – стоимость фьючерса на рулонную, стоимость фьючерса на коксующийся уголь и значение индекса MOEXMM. При этом двое из потенциальных регрессоров имеют сильную корреляцию между собой, что при их одновременном включении в модели спровоцировало бы мультиколлинеарность. Таким образом, было принято решение использовать цену фьючерса на рулонную сталь и цену фьючерса на коксующийся уголь в качестве регрессоров в спецификации модели для объяснения стоимости акции ПАО «Северсталь».

Стоит отметить, что наибольшей объясняющей способностью обладает такой фактор, как цена фьючерса на коксующийся уголь, что не удивительно, учитывая подавляющую долю металлургии в операционной деятельности предприятия.

Для построения уравнения спецификации была выбрана обычная линейная регрессия, так как данный тип функции регрессии наиболее прост в применении и интерпретации, что соответствует целям построения модели:

,

где

– стоимость акции ПАО «Северсталь» в период времени t,

– цена фьючерса на рулонную сталь в период времени t,

– цена фьючерса на коксующийся уголь в период времени t,

– свободный член,

– коэффициенты при регрессорах,

– случайный остаток в период времени t.

В качестве контрольной (тестовой) выборки было выбрано 5% от совокупного набора данных, а именно, 4 наблюдения: t = 14, 25, 41, 64. Таким образом, обучающая выборка составила 68 наблюдений.

Для оценки параметров выбранной модели по обучающей выборке был применен метод наименьших квадратов (МНК) с использованием функции ЛИНЕЙН в MS Excel:

Проверка спецификации на наличие ошибок 1, 2 и 4 рода

1. Проверка на ошибочный вид типа регрессионной функции.

После составления уравнения спецификации необходимо проверить насколько удачно был подобран тип регрессионной функции для рассматриваемой взаимосвязи. Последствиями появления такой ошибки может послужить получение смещенных оценок коэффициентов регрессоров, а, следовательно, неадекватных оценок зависимой переменной. Диагностика ошибки осуществляется по 3 критериям:

1) Проверка соответствия диаграммы рассеивания по обучающей выборке графику зависимости (рис.1,2):

Рис. 1. Диаграмма рассеивания стоимости акции ПАО Северсталь (ось Y), цены фьючерса на рулонную сталь (ось Х) [1,3,4, расчеты автора]

Рис. 2. Диаграмма рассеивания стоимости акции ПАО Северсталь (ось Y) и цены фьючерса на коксующийся уголь (ось Х) [1,3,4, расчеты автора]

На графиках пунктирными линиями представлены наиболее оптимальные линии тренда для рассматриваемых зависимостей. Красным показана экспоненциальная линия тренда, синим – линейная. Как мы видим, в первом случае, согласно коэффициенту детерминации R2,линейный тренд более точно описывает зависимость, чем экспоненциальный, поэтому на основании таких результатов мы не можем точно утверждать о неоптимальности используемого типа регрессионной функции.

2) Длительное постоянство знака случайных остатков в наборе данных, упорядоченном по возрастанию значений суммы объясняющих факторов:

В приложении 3 представлены уравнения наблюдений, упорядоченные относительно суммы регрессоров. Как мы видим, постоянства знаков случайных остатков не наблюдается, значит данный симптом мы можем отклонить.

3) Существенное отличие в соответствующих значениях оценок коэффициентов модели, полученных по двум одинаковым частям набора данных с максимально отличными значениями суммы регрессоров:

Для проверки данного признака была проведена МНК-оценка двух половин упорядоченного набора данных из п.2 (первые и последние 34 уравнения наблюдений). Оценка была произведена при помощи функции ЛИНЕЙН в Excel, а ее результаты представлены в таблице 2:

Таблица 2.

МНК-оценка регрессионных коэффициентов для двух половин упорядоченной выборки [расчеты автора]

Первая половина выборки (n’1)

a2

a1 

 a0

0,33574494

0,148154

381,0834

Вторая половина выборки (n’2)

a2

a1 

 a0

0,48395312

0,350205

104,5077

Как можно заметить, оценки регрессионных коэффициентов по двум половинам упорядоченных уравнений наблюдений действительно довольно значительно отличаются. Однако явное отсутствие положительной диагностики первых двух симптомов ошибки первого рода позволяет нам сделать вывод о приемлемости линейного вида спецификации для данной модели.

2. Включение в спецификацию модели незначимого регрессора.

Для диагностики данной ошибки необходимо проверить справедливость гипотезы Н0: ai = 0 при помощи сравнения модуля отношения МНК-оценки i-го параметра к его стандартной ошибке с t-критерием Стьюдента, который определяется по формуле СТЬЮДЕНТ.ОБР.ПХ (при уровне значимости в 5% и степенью свободы n-(k+1) = 67 – 3 = 64). Если неравенство выполняется, то гипотеза Н0 принимается по отношению к рассматриваемому регрессору.

В нашем случае величина составила 1,9977, а значения дробей для каждого из трех коэффициентов приведены в таблице 3:

Таблица 3.

Оценка значимости регрессоров модели [расчеты автора]

 

9,981356

 

6,905714

 

14,7158

Как мы видим, неравенство не выполняется во всех трех случаях, значит ошибка второго рода в модели отсутствует.

3. Непостоянство параметров регрессионной модели (наличие структурных сдвигов).

Диагностика данной ошибки проводилась на основе предположения о том, что начало пандемии COVID-19 могло вызвать серьезные структурные сдвиги как в российской экономике, так и на фондовом рынке. Таким образом набор данных был поделен на 2 части (период до марта 2020 года и после) и на основании МНК-оценок этих частей выборки был рассчитан Z-критерий Чоу:

Полученное значение Z для модели оказалось равным 2,476, что меньше F-критического, рассчитанного по формуле F.ОБР.ПХ в Excel на уровне значимости 5% и при степенях свободы k = 3 и n – 2*(k + 1) = 61. Таким образом, согласно тесту Чоу, мы можем отклонить гипотезу о наличии структурных сдвигов в нашей модели.

Проверка качества спецификации

Следующим шагом стала проверка качества модели при помощи коэффициента детерминации R2, а также оценка его статистической значимости с использованием F-теста. Для нахождения величины коэффициента детерминации применялась следующая формула:

Для нашей оцененной модели данный показатель составил 0,9076, что говорит о наличии сильной взаимосвязи между регрессорами и зависимой переменной. Однако, так как в спецификации присутствует более одного регрессора, для оценки качества спецификации следует использовать скорректированный коэффициент детерминации, который учитывает значимость дополнительных объясняющих переменных:

Величина скорректированного коэффициента р-квадрат для анализируемой модели составила 0,90471, что также демонстрирует сильную взаимосвязь между экзогенными и эндогенной переменными. Для проверки скорректированного коэффициента детерминации на статистическую значимость была проведена процедура F-теста в Excel:

Рассчитано F-стат по формуле:

= 735,81

Рассчитано F-крит по формуле F.ОБР.ПХ на уровне значимости 5% и со степенями свободы k = 2 и nk = 65. Полученное значение составило 3,138.

Таким образом Fкрит<Fстат, что говорит о статистической значимости скорректированного коэффициента детерминации (при уровне значимости в 5%) и качественности модели.

Проверка соблюдения предпосылок теоремы Гаусса-Маркова

1. Проверка гипотезы о нулевом математическом ожидании случайных остатков.

Для принятия данной гипотезы необходимо, чтобы следующее неравенство было справедливым:

Значение t-критического было найдено в Excel с использованием формулы T.ОБР при вероятности 95% и числу степеней свободы n – (k+1) = 64 и составило 1,669. Среднее значение случайных остатков по оцененной модели составило 4,92077E-14 при стандартной ошибке 43,722. Таким образом левая часть неравенства оказалась равной 9,28079E-15, что значительно меньше tкр и говорит о нулевом математическом ожидании случайных остатков.

2. Проверка гипотезы о гомоскедастичности случайных остатков.

Гипотеза о гомоскедастичности случайных остатков (постоянстве их дисперсии) была проверена при помощи выполнения теста Голдфельда-Квандта (GQ). Для проведения данного теста выборка, упорядоченная по возрастанию суммы регрессоров, была разделена на 3 равные части (n’1 = n’3 = 22, n’2 = 23) так, что n’>(k + 1). Далее были осуществлены МНК-оценки первой и третьей подвыборки при помощи функции ЛИНЕЙН и определено значение дроби GQ:

Значение Fкр (=F.ОБР.ПХ) при значениях степеней свободы n’ – (k+1) = 19 составило 2,168, что больше обеих дробей, а значит гипотеза о гомоскедастичности случайных остатков принимается на уровне значимости 5%.

3. Проверка гипотезы об отсутствии автокорреляции случайных остатков.

На данном этапе использовался тест Дарбина-Уотсона по диагностике автокорреляции первого порядка. Данный тест также применяется для диагностики ошибки спецификации третьего порядка.

Для проведения теста вычислим величину дроби DW по следующей формуле:

Критические значения по таблице Дарбина-Уотсона на уровне значимости 5%, n = 65 и k = 2 составили: dU = 1,66 и dL = 1,54. Таким образом, полученное значение DW попадает в промежуток M1 (от 0 до dL), что говорит о наличии обратной связи между соседними случайными остатками и, следовательно о наличии автокорреляции. Данный факт свидетельствует о возможном отсутствии значимого регрессора в модели.

Устранение автокорреляции было произведено по алгоритму Хилдрета-Лу. При помощи функции «Поиск решения» в Excel было найдено значение коэффициента корреляции p в диапазоне от 0 до 1, при котором сумма квадратов случайного шума минимальна в следующей модифицированной модели:

или

В результате было получено значение p, равное 0,5867, а оцененная спецификация приняла следующий вид:

Величина критерия DW для исправленной модели составила 2,01986, что принадлежит промежутку M3 и говорит об отсутствии автокорреляции первого порядка между случайными остатками.

Проверка адекватности модели при помощи интервальной оценки

В конце работы для определения адекватности модели, а также ее прогностической способности была проведена процедура интервального оценивания первоначальной спецификации (для получения релевантных прогнозов). Для проверки адекватности необходимо установить попадут ли значения тестовой выборки в интервал ( где , а .

Величина рассчитывается по формуле , где представляет собой соответствующий элемент матрицы . Таким образом, при помощи применения матричных функций в Excel, а также применения формулы СТЬЮДЕНТ.ОБР.2Х, была получена следующая интервальная оценка тестовой выборки при tкр = 1,9977:

Таблица 4.

Интервальная оценка контролирующей выборки, [1,3,4, расчеты автора]Xt

Y0t

xt

zt

 

q0

     

Y0tпринадлежит?

64

889,6

468

1300

893,0988

0,083597

45,51316

802,1758

984,0218

Да

41

1022,8

879

1273

1024,295

0,075397

45,34063

933,7165

1114,873

Да

25

950

635

1253

933,3033

0,021746

44,19514

845,0134

1021,593

Да

14

630

402

594,5

613,8631

0,068731

45,19989

523,566

704,1603

Да

По результатам проведенной интервальной оценки можно сделать вывод, что анализируемая модель адекватна на уровне значимости 5%.

Выводы

Подводя итог по проделанной работе, следует отметить, что между стоимостью акций Северстали, ценой фьючерса на рулонную сталь и ценой фьючерса на коксующийся уголь существует регрессионная зависимость. Данный факт имеет экономическую обоснованность, ведь производство металлопроката и добыча угля играют огромную роль в операционной деятельности Северстали.

В процессе исследования было определено высокое качество модели на основе коэффициента детерминации (при установленной его статистической значимости), а также ее адекватность, подтвержденная интервальной оценкой. Основываясь на этой информации, можно сделать вывод, что игроки фондового рынка могут основываться в своих инвестиционных решениях по ценным бумагам Северстали на представленных факторах.

В дополнение стоит отметить, что в модели была обнаружена автокорреляция, устранение которой портит интерпретируемость модели. Данный факт говорит о потенциально неучтенном регрессоре, что оставляет пространство для будущих исследований.

Список использованных источников

Официальный сайт Мосбиржи // [электронный ресурс] // URL: https://www.moex.com (дата обращения: 19.12.2020).

Официальный сайт ПАО «Северсталь» // [электронный ресурс] // URL: https://www.severstal.com/rus/about/ (дата обращения: 19.12.2020).

Официальный сайт MFD.ru // [электронный ресурс] // URL: https://mfd.ru/export/#Alias=false&Period=9&timeframeValue=1&timeframeDatePart=day&StartDate=01.07.2015&EndDate=01.12.2020&SaveFormat=0&SaveMode=0&FieldSeparator=%253b&DecimalSeparator=%2C&DateFormat=dd'%2F'MM'%2F'yy&TimeFormat=HHmmss&AddHeader=true&RecordFormat=3&Fill=false (дата обращения: 19.12.2020).

Официальный сайт Investing.com // [электронный ресурс] // URL: https://ru.investing.com/ (дата обращения: 19.12.2020).

Приложения

Приложение 1. Потенциальные регрессоры для модели

Приложение 2. Исходные данные

Приложение 3. Ранжированные уравнения спецификаций

Просмотров работы: 14