СРАВНИТЕЛЬНЫЙ АНАЛИЗ ИНСТРУМЕНТОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ - Студенческий научный форум

XV Международная студенческая научная конференция Студенческий научный форум - 2023

СРАВНИТЕЛЬНЫЙ АНАЛИЗ ИНСТРУМЕНТОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ

Мигулина Д.С. 1, Петина М.А. 1
1Белгородский государственный национальный исследовательский университет
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Так как объем данных постоянно продолжает расти, то это приводит к тому, что задачи анализа становятся все сложнее. Для решения задач, которые делятся на общие и частные, необходим постоянный поиск новых, нестандартных и доступных знаний для анализа.

Важнейшим инструментом поиска таких знаний является глубокий и всесторонний анализ данных, описывающих процессы и явления, протекающие в аналитических системах, с использованием современных информационных технологий. В данный момент Data Mining является самым многообещающих направлением информационных технологий [2].

Для эффективной организации поиска знаний, необходимых для поддержки принятия решений в аналитических системах, наиболее эффективным подходом является реализация комплексных DM-проектов с глубокой интеграцией аналитических инструментов в рабочие процессы. Используемые для этих целей системы интеллектуального анализа должны удовлетворять следующим требованиям:

поддержка экспорта/импорта данных. Поддержка выгрузки/загрузки данных из разных исходных областей. Объединение данных в хранилище данных;

поддержка технологии «клиент — сервер» для обработки данных на удаленных серверах;

поддержка/создание различных отчетов;

поддержка различных алгоритмов и методов интеллектуальной обработки данных (методы математической статистики, алгоритмы бизнес-анализа, машинное обучение и т. д.).

«дружественный», удобный графический интерфейс, который будет пригоден для целого сектора пользователей.

поддержка мощных средств визуализации данных. Система должна содержать широкий набор визуализаторов исходных данных, промежуточных и конечных результатов, а также структуру построенных моделей.

Под данные требования подходят следующие группы инструментов Data Mining [5]:

инструменты DM (DMFT — Data Mining Field Tools) — данные инструменты направлены на особую прикладную область.

инструменты для бизнес-аналитики (DMBT — Data Mining Business Tools) – не ориентированы на работу с задачами Data Mining, но поддерживают методы интеллектуальной обработки данных (например, алгоритмы кластеризации, классификации для бизнес анализа).

инструменты DM (RDMT — Research Data Mining Tools) — данные инструменты используются для разработки новых экспериментальных алгоритмов и методов интеллектуальной разработки данных.

математические пакеты (DMMP — Data Mining Mat Package) — данные пакеты не были ориентированы для Data Mining, но они содержат огромное количество алгоритмов и методов, которые позволяют осуществлять функции интеллектуального анализа данных [1].

инструменты DM (SDMT — Specialties Data Mining Tools) — данные инструменты используются для определенных видов или методов интеллектуальной обработки данных.

интеграционные пакеты (IDMT- Integration Data Mining Tool) — наборы алгоритмов, образующих либо отдельные программные средства, либо пакеты расширения.

«наборы» интеллектуальной обработки данных (DMST — Data Mining Suite Tools) — поддерживают целый спектр алгоритмов и методов интеллектуальной обработки данных. Ориентированы на работу с различными данными (многомерные данные, структурированные данные и неструктурированные данные).

По полученным результатам был произведен сравнительный анализ инструментов интеллектуальной обработки данных для реализации аналитических DM-проектов. Для выбора наиболее оптимального инструментального средства использовалась система поддержки принятия решений (СППР) «Решение». Иерархическая модель, построенная в СППР представлена на рисунке 1.

Рисунок 1 – Иерархия задачи выбора

На рисунке 2 представлена матрица парных сравнений критериев.

Рисунок 2 – Матрица парных сравнений

На рисунке 3 представлено сравнение решений по критерию «Поддержка экспорта/импорта данных».

Рисунок 3- Матрица сравнений «Поддержка экспорта/импорта данных»

Сравнение решений по критерию «Визуализация данных» представлено на рисунке 4.

Рисунок 4 – Матрица сравнений «Визуализация данных»

Далее на рисунке 5 представлена матрица сравнений по критерию «Поддержка различных алгоритмов»

Рисунок 5 – Матрица сравнений «Поддержка различных алгоритмов»

Матрица парных сравнений по критерию «Поддержка/создание отчетов» представлена на рисунке 6

Рисунок 6 – Матрица парных сравнений «Поддержка/создание отчетов»

Далее на рисунке представлены парные сравнению по «Гибкий интерфейс пользователя» (Рисунок 7)

Рисунок 7 – Матрица сравнений «Гибкий интерфейс пользователя»

На рисунке 8 представлены результаты сравнения инструментов интеллектуальной обработки данных.

Рисунок 8 – Полученные результаты

По полученным расчетам следует, что для комплексной реализации аналитических проектов нужно использовать инструменты Data Mining Suit Tools, так как DMST дают возможность использовать полный набор средств интеллектуального анализа данных. Они организуют эффективный поиск знаний в базах данных, поддерживают технологию «клиент-сервер», которая позволят проводить эффективный поиск знаний в базах данных (в локальных, удаленных). К минусам можно отнести высокую стоимость данных инструментов.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

Web Mining: основные понятия [Электронный ресурс] – URL: https://basegroup.ru/community/articles/basic-conceptions

Бинг Л. Интеллектуальный анализ данных в Интернете: изучение гиперссылок, содержимого и данных об использовании [Текст] / Спрингер, 2011. — 642 с.

Извлечение значимых ключевых объектов веб-сайта: подход к семантическому веб анализу [Электронный ресурс] – URL: https://www.dii.uchile.cl/wp-content/uploads/2014/06/Extracting-signi%EF%AC%81cant-Website-Key-Objects-A-Semantic-Web.pdf

Косала Р., Исследование веб-майнинга: обзор [Текст] / Р. Косала, Х. Блокил – АКМ СИГКДД, 2000. — 2-3 с.

Методы интеллектуального анализа данных [Электронный ресурс] – URL: http://www.interface.ru/home.asp?artId=35152

Просмотров работы: 83