КВАЛИФИКАЦИЯ БАЗ ДАННЫХ - Студенческий научный форум

IX Международная студенческая научная конференция Студенческий научный форум - 2017

КВАЛИФИКАЦИЯ БАЗ ДАННЫХ

Архипов А.Ю. 1
1Балаковский инженерно-технологический институт – филиал федерального государственного автономного образовательного учреждения высшего образования «Национальный исследовательский ядерный университет «МИФИ»
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
ВВЕДЕНИЕ

В современном мире очень сложно представить себе компьютерные технологии без применения баз данных. База данных – это совокупность самостоятельных материалов, систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

С каждым годом алгоритмы усложняются, практически невозможно выполнить те или иные сложные технологии вручную. Необходимо хранить большинство информации, подвергать её обработке. Для этого нужны перспективные компьютерные технологии.

Программисту (или просто обычному пользователю ПК) в данном случае нужна СУБД – система управления базами данных. Она – важный инструмент, который используют в разных областях: в образовании, в осуществлении научных исследований. Кроме того, база данных является хранилищем данных для совместного использования, поэтому её удобно использовать.

  1. КЛАССИФИКАЦИЯ ПО МОДЕЛИ ДАННЫХ

Разделяют несколько моделей данных, среди которых:

  • Иерархическая

  • Объектная и объектно-ориентированная

  • Объектно-реляционная

  • Реляционная

  • Сетевая

  1.  
    1. Иерархическая

Иерархическая модель данных — это модель данных, где используется представление базы данных в виде древовидной (иерархической) структуры, состоящей из объектов (данных) различных уровней.

Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект более близкий к корню) к потомку (объект более низкого уровня), при этом возможна ситуация, когда объект-предок не имеет потомков или имеет их несколько, тогда как у объекта-потомка обязательно только один предок. Объекты, имеющие общего предка, называются близнецами (в программировании применительно к структуре данных дерево устоялось название братья).

Структурная часть иерархической модели.

Основными информационными единицами в иерархической модели данных являются сегмент и поле. Поле данных определяется как наименьшая неделимая единица данных, доступная пользователю. Для сегмента определяются тип сегмента и экземпляр сегмента. Экземпляр сегмента образуется из конкретных значений полей данных. Тип сегмента — это поименованная совокупность входящих в него типов полей данных.

Как и сетевая, иерархическая модель данных базируется на графовой форме построения данных, и на концептуальном уровне она является просто частным случаем сетевой модели данных. В иерархической модели данных вершине графа соответствует тип сегмента или просто сегмент, а дугам — типы связей предок — потомок. В иерархических структуpax сегмент — потомок должен иметь в точности одного предка.

Иерархическая модель представляет собой связный неориентированный граф древовидной структуры, объединяющий сегменты. Иерархическая БД состоит из упорядоченного набора деревьев.

Управляющая часть иерархической модели.

В рамках иерархической модели выделяют языковые средства описания данных (ЯОД) и средства манипулирования данными (ЯМД). Каждая физическая база описывается набором операторов, обусловливающих как её логическую структуру, так и структуру хранения БД. При этом способ доступа устанавливает способ организации взаимосвязи физических записей.

Определены следующие способы доступа:

  • иерархически последовательный;

  • иерархически индексно-последовательный;

  • иерархически прямой;

  • иерархически индексно-прямой;

  • индексный.

  1.  
    1. Объектная и объектно-ориентированная

Объектные базы данных являются системой управления базами данных, в которых информация представлена в виде объектов, используется в объектно-ориентированном программировании. Объектные базы данных отличаются от реляционных баз данных, являющихся таблично-ориентированными. Объектно-реляционные базы данных являются гибридом обоих подходов.

Технические особенности.

Большинство объектных баз данных также предлагают какой-либо язык запросов, позволяющий производить поиск по объектам, используя декларативный подход к программированию. Именно в области языков объектных запросов и интеграции запросов и навигационных интерфейсов найдены самые большие различия между продуктами. С попыткой стандартизации языков объектных запросов выступили ODMG с Object Query Language, OQL.

Доступ к данным может быть произведён быстрее, так как зачастую нет необходимости в присоединении таблиц (как в табличной реализации реляционной базы данных). Это потому, что объект может быть получен непосредственно, без поиска, используя указатели.

Еще одна область различия между продуктами заключается в том, как определена схема базы данных. Общей характеристикой, однако, является то, что язык программирования и схема базы данных используют одни те же определения типов.

Многие объектные базы данных, например, Gemstone или VOSS, предлагают поддержку управления версиями. Объект можно рассматривать как набор всех его версий. Кроме того, версии объекта можно рассматривать как объекты. Некоторые объектные базы данных также предоставляют систематическую поддержку триггеров и ограничений, которые являются основой всех баз данных.

Эффективность такой базы данных также значительно улучшается в областях, которые требуют огромных объемов данных в одном месте. Например, банковское учреждение может получить информацию об учетной записи пользователя и предоставить ему эффективно работать с обширной информацией, такой как операции, информация об учетной записи и т.д. The Big O Notation для такой парадигмы базы данных имеет значительное повышение эффективности [1].

Объектно-ориентированная база данных (ООБД) — база данных, в которой данные моделируются в виде объектов, их атрибутов, методов и классов.

Характеристики.

Объектно-ориентированные базы данных обычно рекомендованы для тех случаев, когда требуется высокопроизводительная обработка данных, имеющих сложную структуру.

В манифесте ООБД предлагаются обязательные характеристики, которым должна отвечать любая ООБД. Их выбор основан на 2 критериях: система должна быть объектно-ориентированной и представлять собой базу данных.

Обязательные характеристики:

  1. Поддержка сложных объектов. В системе должна быть предусмотрена возможность создания составных объектов за счет применения конструкторов составных объектов. Необходимо, чтобы конструкторы объектов были ортогональны, то есть любой конструктор можно было применять к любому объекту.

  2. Поддержка индивидуальности объектов. Все объекты должны иметь уникальный идентификатор, который не зависит от значений их атрибутов.

  3. Поддержка инкапсуляции. Корректная инкапсуляция достигается за счет того, что программисты обладают правом доступа только к спецификации интерфейса методов, а данные и реализация методов скрыты внутри объектов.

  4. Поддержка типов и классов. Требуется, чтобы в ООБД поддерживалась хотя бы одна концепция различия между типами и классами. (Термин «тип» более соответствует понятию абстрактного типа данных. В языках программирования переменная объявляется с указанием её типа. Компилятор может использовать эту информацию для проверки выполняемых с переменной операций на совместимость с её типом, что позволяет гарантировать корректность программного обеспечения. С другой стороны класс является неким шаблоном для создания объектов и предоставляет методы, которые могут применяться к этим объектам. Таким образом, понятие «класс» в большей степени относится ко времени исполнения, чем ко времени компиляции.)

  5. Поддержка наследования типов и классов от их предков. Подтип, или подкласс, должен наследовать атрибуты и методы от его супертипа, или суперкласса, соответственно.

  6. Перегрузка в сочетании с полным связыванием. Методы должны применяться к объектам разных типов. Реализация метода должна зависеть от типа объектов, к которым данный метод применяется. Для обеспечения этой функциональности связывание имен методов в системе не должно выполняться до времени выполнения программы.

  7. Вычислительная полнота. Язык манипулирования данными должен быть языком программирования общего назначения.

  8. Набор типов данных должен быть расширяемым. Пользователь должен иметь средства создания новых типов данных на основе набора предопределенных системных типов. Более того, между способами использования системных и пользовательских типов данных не должно быть никаких различий [2].

  1.  
    1. Объектно-реляционная

Объектно-реляционная СУБД (ОРСУБД) - реляционная СУБД (РСУБД), поддерживающая некоторые технологии, реализующие объектно-ориентированный подход: объекты, классы и наследование реализованы в структуре баз данных и языке запросов.

Достоинства.

Основными преимуществами расширенной реляционной модели являются повторное и совместное использование компонентов. Например, в приложении может понадобиться использование данных пространственного типа, представляющие собой точки, линии, и многоугольники, со связанными с ними функциями, которые вычисляют расстояние между точками, расстояние между точкой и линией, проверяют наличие точки в многоугольнике и т.д. При правильном проектировании с учетом новых возможностей подобный подход позволяет организациям воспользоваться достоинствами новых расширений эволюционным путем без утраты преимуществ, получаемых от использования компонентов и функций уже существующей базы данных.

Недостатки.

Очевидным недостатком подхода с использованием ОРСУБД являются сложность и связанные с ней повышенные расходы. Простора и ясность, присущая реляционной модели, утрачивается при использовании подобных типов расширения. Некоторые считают, что расширения РСУБД предназначены для незначительного количества приложений, причем в последних не может быть достигнута оптимальная производительность при использовании имеющейся реляционной технологии. И многие другие, вплоть до терминологии.

  1.  
    1. Реляционная

Реляционная модель данных (РМД) — логическая модель данных, прикладная теория построения баз данных, которая является приложением к задачам обработки данных таких разделов математики, как теория множеств и логика первого порядка.

На реляционной модели данных строятся реляционные базы данных.

Реляционная модель данных включает следующие компоненты:

  • Структурный аспект (составляющая) — данные в базе данных представляют собой набор отношений.

  • Аспект (составляющая) целостности — отношения (таблицы) отвечают определенным условиям целостности. РМД поддерживает декларативные ограничения целостности уровня домена (типа данных), уровня отношения и уровня базы данных.

  • Аспект (составляющая) обработки (манипулирования) — РМД поддерживает операторы манипулирования отношениями (реляционная алгебра, реляционное исчисление).

Термин «реляционный» означает, что теория основана на математическом понятии отношение (relation). В качестве неформального синонима термину «отношение» часто встречается слово таблица. Необходимо помнить, что «таблица» есть понятие нестрогое и неформальное и часто означает не «отношение» как абстрактное понятие, а визуальное представление отношения на бумаге или экране. Некорректное и нестрогое использование термина «таблица» вместо термина «отношение» нередко приводит к недопониманию. Наиболее частая ошибка состоит в рассуждениях о том, что РМД имеет дело с «плоскими», или «двумерными» таблицами, тогда как таковыми могут быть только визуальные представления таблиц. Отношения же являются абстракциями и не могут быть ни «плоскими», ни «неплоскими» [3].

  1.  
    1. Сетевая

Сетевая модель данных — логическая модель данных, являющаяся расширением иерархического подхода, строгая математическая теория, описывающая структурный аспект, аспект целостности и аспект обработки данных в сетевых базах данных.

Достоинства.

Достоинством сетевой модели данных является возможность эффективной реализации по показателям затрат памяти и оперативности.

Недостатки.

Недостатком сетевой модели данных являются высокая сложность и жесткость схемы БД, построенной на её основе. Поскольку логика процедуры выборки данных зависит от физической организации этих данных, то эта модель не является полностью независимой от приложения. Другими словами, если необходимо изменить структуру данных, то нужно изменить и приложение [4].

  1. КЛАССИФИКАЦИЯ ПО СОДЕРЖИМОМУ
    1. Мультимедийная

Мультимедийная база данных представляет собой совокупность взаимосвязанных мультимедийных данных, которые включают в себя один или более первичных средств массовой информации, таких как:

  • Текст;

  • Графика: эскизы и иллюстрации, чертежи, 3D объекты;

  • Изображения: цветные и черно-белые картинки, фотографии, карты;

  • Анимированные объекты: анимированные изображения или графические объекты;

  • Видео: последовательность изображений (кадров), как правило, записей событий реальной жизни (запись производится с помощью видеоаппаратуры);

  • Аудио: звуковые технологии (запись производится с помощью звукозаписывающей аппаратуры);

  • Комплексные мультимедиа: сочетание двух или более из указанных выше типов данных.

  • Мультимедийная база данных содержит один или несколько типов мультимедийных данных. Эти типы данных широко подразделяются на три класса:

  • Статические СМИ - не зависимы от времени, постоянны, не интерактивны, например изображения или графический объект.

  • Динамические СМИ - зависят от времени, движущихся, интерактивные, например аудио-, видео и анимация.

  • Многомерные (трёхмерные (3D), четырёхмерные (4D)) СМИ - 3D игры, изображения, видео. Например, виртуальная реальность, 5D- , 7D- фильмы.

Особенности.

  • Отсутствие структуры: мультимедийные данные часто являются неструктурированными, поэтому их трудно найти в документе или извлекать с помощью приложения, управляющего клиентскими базами.

  • Временный и пространственный: различные типы мультимедийных данных имеют различные требования. Пространственные данные сами по себе являются трудными для анализа, и для создания эффективных пространственно-временных систем необходимы специальные алгоритмы.

  • Большой объем данных: обычно, мультимедиа занимают достаточно много места, (например видео), следовательно, мультимедийные данные часто требуют большего по объему запоминающего устройства, что не всегда удобно. Как уже упоминалось, мультимедийные данные состоят из текста, изображений, графики, видео, аудио. Существует подавляющее количество форматов для представления различных типов данных. Такими форматами являются TIFF,BMP, PPT, IVUE, FPX, JPEG, MPEG, AVI, MID, WAV, DOC, GIF, PNG, EPS. Из-за ограничения на преобразование из одного формата в другой, использование данных в определенном формате будет также ограничено. Помимо того, что разные объекты мультимедиа с разными форматами весят так же по-разному. Так, изображение jpeg размером 1024 на 800 пикселей с глубиной цвета в 24 бита без сжатия занимает при хранении более 3 Мбайт. Десятиминутная последовательность изображений (кадров) avi, записанная с частотой 30 кадров в секунду и имеющая также размер 1024 на 800 и глубину цвета 24 бита, займет около 38000 Мбайт [5].

  • Логистика: нестандартные носители могут осложнить обработку. Например, мультимедийное приложение баз данных требует использования алгоритмов сжатия.

  • Перегрузка информацией: обилие различных данных могут запутать и загрузить пользователя и базу данных лишней, возможно, ненужной информацией. Особенно чревато это для мультимедийного представления данных, так как очень часто пользователь перегружает базы данных изображениями, различными кнопками.

2.2 Клиентская

Клиентская база - это база данных, содержащая сведения обо всех клиентах компании, когда-либо совершавших с ней сделки. Кроме того, иногда к клиентской базе относят и сведения о потенциальных клиентах компании. Пять целей составления клиентской базы данных:
  • Сохранение и преемственность информации, которую решает данная база, это страховка от потери клиентов при увольнении менеджера по продажам или торгового представителя, а также быстрое вхождение в курс дела новых сотрудников[6].

  • Оценка перспективы. Данная БД ответит на вопрос о том, какой процент дистрибьюции имеется на рынке, какая доля клиентов лояльна, а какая еще не знает о Вашем предложении.

  • Аналитическая. Данная БД предполагает более глубокое представление информации о клиентах. Структура предприятия, персоналии, личные предпочтения, корзина покупки, периодичность заказа, сезонность и так далее. Вы получите возможность проводить различного рода анализ своих клиентов и строить прогнозы.

  • Маркетинговая. Если Ваша цель адресное воздействие на своих потенциальных клиентов и соответствующая экономия бюджета. Данная цель решается за счет:

а) правильного сегментирования своих клиентов,

б) глубокого изучения потребностей каждого сегмента,

в) подготовки индивидуального предложения для каждого сегмента

г) проведение адресного воздействия.

  • Оценка смежных сегментов с целью расширения бизнеса. Клиенты редко интересуются чем-то узкоспециальным, а чаще имеют разносторонний спрос. Попытка сбора информации об интересах своих клиентов (дополнительных потребностей) позволяет осуществлять попутные продажи, или даже организовывать дополнительные направления бизнеса[7].

ЗАКЛЮЧЕНИЕ

В данной работе были описаны основные классификации баз данных, их особенности, достоинства, недостатки, характеристики.

Итог.

Классификация СУБД:

  • по выполняемым функциям СУБД подразделяются на операционные и информационные;

  • по сфере применения СУБД подразделяются на универсальные и проблемно-ориентированные;

  • по используемому языку общения СУБД подразделяются на замкнутые, имеющие собственные самостоятельные языки общения пользователей с базами данных, и открытые, в которых для общения с базой данных используется язык программирования, расширенный операторами языка манипулирования данными;

  • по числу поддерживаемых уровней моделей данных СУБД подразделяются на одно-, двух-, трехуровневые системы;

  • по способу установления связей между данными различают реляционные, иерархические и сетевые базы данных;

  • по способу организации хранения данных и выполнения функций обработки базы данных подразделяются на централизованные и распределенные.

СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ

  1. Базы даных: Учеб. для вузов / Под ред. А. Д. Хомоненко. СПб.: КОРОНА принт, 2000. 416 с.

  2. Глушаков С.В., Ломотько Д.В. «Базы данных», изд. «Фолио», Харьков, 2000г.

  3. Гончаров A. Microsoft Access 7.0 в примерах. СПб.: М., 1997. 256с.

  4. Кошелев, В.Е. Базы данных в ACCESS 2007: Эффективное использование / В.Е. Кошелев. - М.: Бином-Пресс, 2009. - 592 c.

  5. Кузин, А.В. Базы данных: Учебное пособие для студ. высш. учеб. заведений / А.В. Кузин, С.В. Левонисова. - М.: ИЦ Академия, 2012. - 320 c

  6. Пирогов, В.Ю. Информационные системы и базы данных: организация и проектирование: Учебное пособие / В.Ю. Пирогов. - СПб.: БХВ-Петербург, 2009. - 528 c

  7. Советов, Б.Я. Базы данных: теория и практика: Учебник для бакалавров / Б.Я. Советов, В.В. Цехановский, В.Д. Чертовской. - М.: Юрайт, 2013. - 463 c.

Просмотров работы: 1020