Компьютерное моделирование и прогнозирование успеваемости первого курса - Студенческий научный форум

XI Международная студенческая научная конференция Студенческий научный форум - 2019

Компьютерное моделирование и прогнозирование успеваемости первого курса

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Прогнозирование академической успеваемости студентов (college academic prediction [3]) – это процедура прогнозирования успеваемости или неуспеваемости конкретной личности в процессе обучения на основе информации, доступной на момент поступления в вуз. Для прогнозирования используются разнообразные комбинации оценок (ЕГЭ, интеллектуальные тесты, тесты достижений и др.). Прогнозирование успеваемости важны для анализа эффективности процедуры отбора студентов в высшие учебные заведения, которая не может считаться эффективной, если она не в состоянии обеспечить выбор наиболее предрасположенных к данной профессии абитуриентов. В связи с этим поиск методов прикладной статистики для выявления наиболее информативных показателей успешности обучения студентов на первом курсе является актуальной задачей.

Единый государственный экзамен (ЕГЭ) – это форма государственной итоговой аттестации по образовательным программам среднего общего образования. Единый государственный экзамен проводится по четырнадцати предметам. При проведении ЕГЭ используется стобалльная система оценки. По каждому предмету ЕГЭ установлено минимальное количество баллов, преодоление которого подтверждает освоение образовательной программы среднего общего образования. На основе баллов ЕГЭ происходит поступление в высшее учебное заведение.

В высших учебных заведениях используется балльно-рейтинговая системы оценки успеваемости студентов. Как правило, каждый вуз разрабатывает детальную методику формирования итоговой оценки успеваемости студентов. Анализ систем оценивания различных вузов показывает, что чаще всего трудоемкость каждой учебной дисциплины составляет 100 баллов, а оценка успеваемости студентов включает текущую успеваемость студентов, самостоятельную работу, контрольную или зачетную работу.

Прогнозирование – область статистики и теории вероятности, в которой используются методы нейронных сетей, генетические алгоритмы, метод опорных векторов, CART (дерево классификации и регрессии), экстраполяция временных рядов, регрессионный анализ, авторегрессия, метод максимального правдоподобия. Перечисленные современные методы увеличивают глубину прогноза за счет выявления скрытых закономерностей исследуемой области.

Для прогнозирования успеваемости студентов наиболее часто используются методы, основанные на регрессионных моделях, методы кластерного анализа и методы, основанные на дискриминантных моделях.

Например, с помощью многофакторной линейной регрессионной модели можно обнаружить связь между успеваемостью студентов по определенным дисциплинам и уровнем их преподавания.

Для проведения кластерного анализа необходимо сначала разбить исследуемые объекты по определенному набору признаков, например, уровень начальной подготовки студента, сформированные знания и навыки, статус в группе и др. Для каждого кластера определяются эталонные значения параметров как усредненные данные по каждой типологической группе студентов. Эталонные значения будут использованы в качестве центров будущих кластеров, вокруг которых группируются наиболее близкие объекты по значениям выбранных параметров.

При использовании дискриминантных моделей для прогнозирования сначала необходимо выделить факторы, влияющие на успеваемость и выполнить классификацию студентов на их основе. Также определяются факторы, которые влияют на улучшение качества образования. Разделение множества исследуемых объектов на подмножества позволяет осуществить классификацию новых объектов, однако формальный характер дискриминантных методов нередко приводит к ошибкам, вызванным, в первую очередь нелогичным поведением некоторых студентов.

Статистический метод дискриминантного анализа используется для определения переменных, которые дискриминируют, т.е. различают две или более группы. Как правило, дискриминантный анализ используется для классификации и прогнозирования, когда зависимая переменная принимает дискретные значения (например, зачет – не зачет). Используя дискриминантную формулу

(1)

где – независимые переменные (факторы – баллы ЕГЭ, результаты тестирования, материальное положение, состояние здоровья и др.), – дискриминантные коэффициенты (веса переменных). Расчет весов производится на основе техники дискриминантного анализа. После определения влияющих факторов и определения дискриминантных коэффициентов, производиться расчет рейтинга для каждого студента, который в заключение сравнивается с некоторым пороговым значением, выбираемым таким образом, чтобы минимизировать ошибку классификации не в ту группу.

Метод прогнозирования на основе нейронных сетей(нейросетевые модели) характеризуется высокой точностью, но и вместе с тем очень высокой трудоемкостью и очень низким быстродействием, поэтому пользуется средней популярностью. Нейронная сеть – это огромный распределенный параллельный процессор, состоящий из элементарных единиц обработки информации, накапливающих экспериментальные знания и предоставляющих их для последующей обработки [3, с.32]. Информация поступает в сеть из внешнего мира и используется в процессе обучения нейронной сети; для накопления знаний применяются синоптические веса – связи между искусственными нейронами. Для решения задачи аппроксимации функции можно использовать многослойную нейронную сеть. При проектировании сети необходимо определить количество слоев и количество элементов (нейронов) в каждом слое. Выбор архитектуры нейронной сети зависит от сложности задачи и основывается на опыте разработчика.

Нейросетевая технология позволяет учитывать влияние на успеваемость студентов множества факторов: место жительства, школа, оценки по определенным предметам, баллы ЕГЭ, профессии родителей, доход семьи. Для прогнозирования используются, как правило, многослойные нейронные сети прямого распространения. Для обучения сети используется метод обратного распространения ошибки. По словам авторов, нейросетевая технология прогнозирует успеваемость будущего студента с вероятностью около 90 % [4]. Наиболее распространенными методами прогнозирования успеваемости является вычисление коэффициента корреляции результатов ЕГЭ и последующей успеваемости в вузе [1, 2]. Результаты ЕГЭ достаточно надежно характеризуют уровень знаний студента в начале учебы в вузе. В то же время, этот метод не лишен недостатков. При использовании результатов ЕГЭ не учитывается, что студент будет обучаться в условиях, которые существенно отличаются от школьных: иное распределение по видам обучения, упор на самостоятельную работу, наукоемкие дисциплины. Как отмечают сами авторы, «для выводов об устойчивости качественных результатов необходимо опираться на данные о нескольких группах студентов, поступивших на идентичную программу в разные годы» [1, с.68].

Используется также модель прогнозирования успеваемости студента первого курса в форме задачи оптимизации, в которой требуется найти:

(2)

где Rc – ожидаемый прогнозируемый рейтинг в баллах; n – количество дисциплин; bi - семестровая оценка в баллах для i-той дисциплины, bi, минbibi, мах – прямые ограничения на допустимые значения успеваемости в баллах по каждой учебной дисциплине.

Вычисления на основе модели (2) демонстрируют возможности вычисления кластеров с различными семестровыми оценками для получения единого значения прогнозируемого рейтинга. Результаты вычислений предоставляют возможности распределения усилий в процессе обучения.

Описание метода. Предлагается модель оценки прогнозируемых значений оценок в баллах для текущего и семестрового контроля. Сумма этих оценок дает значение семестровой оценки в баллах для конкретной учебной дисциплины. Если в качестве прогнозируемой оценки дисциплины использовать значение, полученное в процессе моделирования по формуле (2), то можно предложить модель оценивания в баллах для оценок поточного и семестрового контроля в форме задачи оптимизации:

(3)

выбрать значение, полученное по моделированию по формуле (2), то можно предложить модель оценивания в баллах для оценок текущего и семестрового контроля в форме задачи оптимизации, требуется найти:

(4)

здесь – прогнозируемое значение семестровой оценки в баллах для отдельной дисциплины, выбранное на основе модели (2); n- количество дисциплин; Pi - оценка в баллах текущего контроля для i-той дисциплины; Еi – оценка в баллах экзаменационного контроля для i-той дисциплины; bi, мин ≤ bi ≤ bi, мах – прямые ограничения на допустимые значения оценки в баллах для текущего и экзаменационного контроля для каждой дисциплины.

Моделирование на основе (3) сможет показать, как нужно выполнять задачи текущего и семестрового контроля, чтобы достигнуть прогнозируемой оценки за семестр, рассчитанной на основе (2). Полученные данные можно использовать для составления методических рекомендаций по распределению усилий при обучении по разным предметам.

В результате анализа рассмотренных выше методов прогнозирования, мы пришли к выводу, что их перечень достаточно широк. Выбрать однозначно наилучший метод невозможно, поскольку ни один из них не лишен недостатков. Тем не менее, в нашей работе мы будем использовать метод дискриминантного анализа, так как он универсален, позволяет акцентировать внимание на ключевых характеристиках успеваемости студентов, достаточно легок в использовании. Также используем метод оптимизации для распределения усилий в процессе обучения.

Список литературы

Польдин О.В. Прогнозирование успеваемости в вузе по результатам ЕГЭ // Прикладная эконометрика. – 2011. – № 1(21). – С. 56 – 69.

Харламова И.Ю. Прогнозирование успеваемости студентов первого курса по результатам сдачи единого государственного экзамена // Базис. – 2017. – № 1(1). – С. 57 – 59.

Хайкин С. Нейронные сети: полный курс, 2-е изд.: Пер. с англ. – М. : ООО «И.Д. Вильямс», 2016. – 1104 с.

Ясинский И.Ф. Опыт прогнозирования успеваемости студентов при помощи нейросетевой технологии // Вестник ИГЭУ. – 2007. – № 4. – С. 1 – 4.

Просмотров работы: 81