Таблица 1. Хронология развития пакетов анализа данных
Годы |
Основные пакеты анализа данных |
Типы ЭВМ |
Операционные системы |
1970-1985 |
SSP, BMDP, SAS, SPSS, различные библиотеки |
EC, CM |
|
1985-1995 |
Statgraphics, STATA, SPSS, SAS, Systat |
IBM PC |
DOS |
1995-2000 |
Statgraphics, STATA, SPSS, SAS, |
Pentium |
Windows |
В России получили широкое распространение следующие зарубежные пакеты: STATGRAPHICS, SYSTAT, SAS, ВМDР, SPSS, Statistica.
Из отечественных разработок стоит отметить следующие: STADIA, ЭВРИСТА, СТАТЭксперт, МЕЗОЗАВР, САНИ.
На сайте Kaggle.com размещаются заказы на анализ данных. Ниже на рисунке 1 приводится статистика программных средств, которые будут использоваться исполнителями при выполнении заказов [2].
Рисунок 1- Статистика программных средств
Пакеты для обработки данных разделяют на следующие категории:
1. Специализированные пакеты. К ним относят пакеты, содержащие методы из одного - двух разделов статистики или методы, используемые в конкретной предметной области.
2. Пакеты общего назначения, также их называют универсальными. Благодаря широкому диапазону статистических методов и доступному интерфейсу они являются наиболее удобными для пользователя.
3. Профессиональные пакеты предназначены для обработки больших объемов данных, в них встроены узкоспециализированные методы анализа.
Кратко рассмотрим основные характеристики пакетов STATISTICA и SPSS Statistics.
STATISTICA - программный пакет для статистического анализа от компании StatSoft, реализующий функции анализа, управления, добычи, визуализации данных с привлечением статистических методов. Одним из существенных преимуществ STATISTICA является большое количество литературы по работе с инструментами программы. Наличие очень мощного модуля для нейросетевого моделирования сделало пакет популярным среди людей с технологическим образованием. В последней версии программы появилась возможность параллельной обработки нескольких подгрупп данных [3].
SPSS Statistics- это полнофункциональная статистическая система, предназначенная для решения исследовательских и бизнес-задач при помощи анализа данных. Имеющиеся специфические методы, нацеленные исключительно на маркетинговые и социологические исследования (например, Conjoint analysis) делают данный пакет более популярным среди людей с социально-экономическим образованием [4]. По мнению некоторых специалистов, SPSS занимает ведущее положение среди программ, предназначенных для статистической обработки информации.
Современный уровень развития информационных технологий предоставляет пользователям широкий выбор доступных статистических пакетов, удовлетворяющих разнообразные потребности.
Список литературы
1. Румянцева Е.Л. Информационные технологии: Учеб. пособие / Под ред. прф. Л.Г. Гагариной. – М.: ИД «ФОРУМ»: ИНФРА-М, 2007.
2. Home of Data Science & Machine Learning - Kaggle.com
3. Statsoft - http://statsoft.ru/products/STATISTICA_Base/
4. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. М.: ACT, НТ Пресс, 2004.