Выполнение запросов над потоками данных является технологией, обеспечивающей обработку быстро поступающих данных и производящей результаты с незначительными задержками. Данная технология возникла в кругах пользователей баз данных, в силу этого она имеет ряд свойств, которые сделали популярными реляционные системы базы данных (РБД). В системах баз данных сначала данные поступают в базу данных и сохраняются на дисках, а потом уже пользователи применяют к этим сохраненным данным запросы [1]. В систему обработки запросов над потоковыми данными запросы поступают раньше, чем данные. Данные проходят через несколько постоянно выполняемых запросов, и преобразованные данные поступают в приложения. Можно сказать, что в реляционных СУБД данные обрабатываются в состоянии покоя, а в системах обработки запросов над потоковыми данными – на лету.
В реляционных базах данных основным примитивом являются таблицы. В системах обработки запросов над потоковыми данными соответствующими примитивами являются потоки. Как и у таблицы, у потока имеется некоторый тип записи, но записи не хранятся, а поступают в потоке. В потоковой системе записи естественным образом упорядочены, и у каждой записи имеется временная метка, показывающая, когда эта запись была создана.
В реальном времени существует служба Azure Stream Analyticsя, которая обеспечивает быстрое развертывание и внедрение бюджетных аналитических решений для анализа данных с устройств, датчиков, из инфраструктуры и приложений в реальном времени. Эта служба открывает целый ряд возможностей, в том числе варианты контроля оборудования через Интернет (IoT),такие как удаленное управление и мониторинг в реальном времени или получение данных от различных устройств, например мобильных телефонов или подключенных к сети автомобилей.
Сегодня по сети передается огромное количество данных на высоких скоростях. Организации, которые могут обрабатывать эту потоковую передачу данных и предпринимать в ее отношении различные действия в режиме реального времени, могут существенно повысить свою эффективность и опередить конкурентов. Сценарии аналитики потока в режиме реального времени можно найти во всех следующих отраслях: персонализированный анализ фондового рынка в режиме реального времени и оповещения от компаний, которые предоставляют финансовые услуги; выявление мошенничества в режиме реального времени; службы защиты данных и личной информации; надежный сбор и анализ данных, поступающих от датчиков и приводов, вмонтированных в физические объекты («Интернет вещей», или IoT); потоковая аналитика переходов на сайтах и приложения для управления отношениями с клиентами (CRM), отправляющие сигналы при падении уровня обслуживания клиента в течение определенного промежутка времени. Компании ищут наиболее гибкий, надежный и экономичный способ осуществления такого потокового анализа данных для событий в режиме реального времени для успешной деятельности в современном высококонкурентном мире.
Список литературы
Хомоненко А.Д., Цыганков В.М., Мальцев М.Г. Базы данных. Учебник для вузов. Издательство: «Корона-принт» 2004 г.