В этом докладе я хотел бы рассмотреть интеллектуальный анализ данных и его классификацию по задачам, а также практическое применение.
Начнём с того, что же является интеллектуальным анализом данных? Под данным термином подразумевают исследование и обнаружение компьютером (как по средствам различных алгоритмов, так и по средствам искусственного интеллекта) в сырых данных скрытых сведений, которые ранее пользователю были не доступны.
Рассмотрим свойства обнаруживаемых сведений:
-сведения должны быть новые, ранее неизвестные;
-сведения должны быть оригинальными (не банальными);
-сведения должны быть полезны и применимы также на практике;
-сведения должны быть понятны человеку.
Для представления полученных сведений в интеллектуальном анализе служат модели. Модели, в свою очередь, зависят от методов их создания.
Теперь рассмотрим, какие задачи интеллектуального анализа имеют место быть:
-классификация – определение класса объекта по его характеристикам;
-регрессия – позволяет определить по уже известным характеристикам объекта значение некоторого его параметра;
-поиск ассоциативных правил - нахождение частых зависимостей между событиями или объектами;
-кластеризация – поиск независимых групп и их характеристик во всех анализируемых сведениях.
Вышеупомянутые задачи, по назначению, могут быть разделены на предсказательные и описательные.
Решение предсказательных задач происходит в две стадии:
1) на основании набора данных с известными результатами строится модель;
2) ранее полученная модель используется для предсказания результатов на основании новых наборов данных.
Описательные задачи направлены на улучшение понимания анализируемых данных.
Также задачи интеллектуального анализа, по способу решения задач, можно разделить на обучение с учителем и обучение без него.
В случае обучения с учителем решение происходит в две стадии:
1) с помощью какого-либо интеллектуального анализа строится модель анализируемых данных – классификатор;
2) классификатор подвергается некоторому обучению.
Обучение без учителя объединяет задачи, выявляющие описательные модели.
Интеллектуальный анализ данных на практике может быть применим в следующих областях:
-интернет-технологии;
-торговля;
-промышленное производство;
-медицина;
-банковское дело;
-страховой бизнес и другие.