АНАЛИЗ ПРОБЛЕМЫ КОМБИНИРОВАННОГО АГРЕГИРОВАННОГО РАНЖИРОВАНИЯ ДАННЫХ (НА ПРИМЕРЕ УЧЕБНЫХ ЗАВЕДЕНИЙ) - Студенческий научный форум

XIV Международная студенческая научная конференция Студенческий научный форум - 2022

АНАЛИЗ ПРОБЛЕМЫ КОМБИНИРОВАННОГО АГРЕГИРОВАННОГО РАНЖИРОВАНИЯ ДАННЫХ (НА ПРИМЕРЕ УЧЕБНЫХ ЗАВЕДЕНИЙ)

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

В сегодняшнем мире рейтинги внедрены во все сферы деятельности человека. Они используются при выдаче кредитов, в учебных заведениях, подборках и т.д.

Одним из основных факторов конкурентного успеха университета является его репутация на национальном и международном образовательных рынках. В этом процессе рейтинги играют значительную роль: попадая в мировой или национальный рейтинг на ведущие места, университет повышает свою привлекательность не только для абитуриентов, но также для работодателей, инвесторов и государства [1,3]. Расположение университета в рейтинге способствует нахождению новых иностранных партнеров. Это могут быть совместные научные исследования, обмен студентами и т.д. Помимо этого, абитуриенты при поступление зачастую ориентируются по популярности учебного заведения. По статистике [1,2] абитуриент предпочитает университет, который располагается в народных и международных рейтингах.

В результате, большое количество специалистов заняты сбором информации для рейтингов, делая его регулярно. При этом сбор информации отнимает большое количество времени, которое могло быть потрачено на аналитику. Также не исключен человеческий фактор, из-за которого в собранных данных могут быть ошибки [2].

Для определения процессов автоматизации описанной выше задачи с применением компьютерной техники, были проанализированы информационные потоки в рассматриваемой системе и разработана инфологическая модель, которая представлена структурно-функциональной диаграммой «КАК ЕСТЬ» в нотации IDEF0 [3].

В процессе сбора и оценки участвуют только сотрудники и программное обеспечение. В роли сотрудников может быть сам аналитик и его помощники. В качестве применяемых программных средств были выбраны такие программы, как офисный пакет Microsoft Office и браузер Mozilla. Они будут пользоваться критериями оценки учебных заведений, лицензиями, нормативными актами и положениями. В качестве входных данных выступают рейтинги учебных заведений, параметры отбора данных, а также шаблон для заполнения данными. На выходе должен получиться агрегированный ранжированный рейтинг и аналитический отчет. На рисунке 1 показана декомпозиция контекстной диаграммы.

Рисунок 1 – Декомпозиция «Сбор и оценка рейтингов учебных заведений»

В отборе учебных заведений в рейтингах происходит сбор и скачивание нужной информации об учебных заведениях. В качестве входных данных выступают параметры отбора данных и рейтинги учебных заведений, а использует критерии оценки учебных заведений. На выходе получается пакет данных, который используется в процессе «Перенос данных из рейтингов в шаблон», где происходит перенос найденных данных в таблицу для дальнейшего использования в процессе «Агрегированное ранжирование данных», после чего ранжированные данные попадают в процесс «Формирование итоговой таблицы» из который получается ранжированный рейтинг и аналитический отчет. На рисунке 2 показана декомпозиция процесса «Отбор учебных заведений».

Рисунок 2 – Декомпозиция «Отбор учебных заведений в рейтингах»

В нем происходит 3 основных процесса, а также уточнение данных. В процессе «Выбрать список учебных заведений» происходит выборка учебных заведений (например, международные вузы). Далее полученный список используется в отборе данных, после чего происходит скачивание данных и формируется пакет данных.

В результате анализа было принято решение о разработке автоматизированной информационной системы, которая позволит комплексно ранжировать агрегированные рейтинги. Для корректной работы информационной системы необходимо решить ряд проблем:

в рейтингах более 1000 учебных заведений, что затрудняет ручной сбор данных;

также в рейтингах один и тот же ВУЗ может называться по-разному (например, Lomonosov Moscow State University может называться как Moscow State University). Необходимо предусмотреть нечеткий поиск при парсинге данных;

часть данных в некоторых рейтингах может отсутствовать (например, страна);

данные об учебном заведение в определенных рейтингах могут отсутствовать;

необходимо ранжировать уже ранее подготовленные данные.

Таким образом, в статье были проанализированы основные проблемы, возникающие при ранжировании агрегированных данных на примере учебных заведений и обоснована необходимость в автоматизации данного процесса, с описанием проблем, которые должны быть учтены при ее разработке.

Использованные источники

Московкин, В.М. К оценке региональной университетской конкурентоспособности [Текст] //Научный результат. Сер. Экономические исследования. - Том 4, №1.2019. С. 35-53.

Работа над ошибками. «Человеческий фактор» в условиях труда [Электронный ресурс] – URL: https://ssk.ua/blog/rabota-nad-oshibkami-chelovecheskij-faktor-v-usloviyah-sklad-500 (дата обращения 12.01.2022)

Методика оценивания рейтинга THE [Электронный ресурс] – URL: indicator.ru (дата обращения 12.01.2022)

Просмотров работы: 7