Проектирование базы данных, реализующей концептуальную модель какой-либо предметной области, следует начинать с рассмотрения самого процесса проектирования и его отличия от построения модели, т.е. моделирования.
Проектирование, как известно, представляет собой составление первичного описания, которое позволяет создавать ещё не существующий объект для определённых заданных условий. С латинского языка слово «projectus» переводится как «брошенный вперёд», что очень наглядно отражает суть данного понятия: в отличие от моделирования, проектирование всегда описывает еще не существующий объект, тогда как в моделировании могут учитываться релевантные характеристики уже имеющегося объекта окружающей действительности.
Проектирование часто рассматривается инженерами как часть их профессиональной деятельности, имеющая ряд особенностей. Они, закономерно, отражают содержание этого процесса.
Выделяют следующие особенности:
Итерационную, когда объект проектирования рассматривается в идеальном, знаковом контексте и пока его физически не существует, возможно неограниченное количество итераций в процессе его доработки, исправления и уточнения. При этом с каждым новым витком описание становится более точным и исчерпывающим.
Коллективный характер, что подразумевает привлечение специалистов из нескольких направлений. При этом желательна их совместная работа в режиме реального времени.
Типизации и унификации, которым подвергаются как проектные решения, так и средства проектирования.
Многовариантностью решений и методов, обусловленную жёсткой конкуренцией в условиях глобализации. Стоит подчеркнуть, что отдельные методы имеют ограничения по условиям применения и по степени точности в обеспечении процессов. Именно этим объясняется необходимость использования различных (в том числе и информационных) технологий и процессов.
В общем случае методика составления тезауруса включает три основных этапа: отбор информационных источников; выделение ключевых слов; формирование списка дескрипторов.
Проектирование базы данных, реализующей концептуальную модель предметной области «Avionics» предваряется построением модели предметной области.
Используя нотацию UML, в ходе настоящего исследования была построена диаграмма концептуальных классов предметной области «Авионика» (рисунок 1). Как видно, в процессе концептуального моделирования были выделены 5 классов, которые содержали в себе подклассы концептов, описывающих содержание предметной области «Авионика». Названия классов не уникальны для исследуемой предметной области, однако они позволяют охватить все лексические единицы, описывающие анализируемую предметную область.
Рисунок 1. Диаграмма концептуальных классов предметной области «Авионика».
На следующем этапе концептуального моделирования было детализировано содержание каждого класса. Пример конкретизации классов «Equipment» и «Functions» показан на рисунке 2. Показаны состав каждого класса, включая подклассы (например, подклассами класса Equipment являются communication equipment, location equipment, navigation equipment, weapons guidance equipment), и взаимосвязи между ними и другими объектами класса, а также составляющими другого класса – «Functions».
Рисунок 2. Пример конкретизации классов «Equipment» и «Functions».
Как известно, основными этапами работы при составлении тезауруса являются:
1. Обработка корпуса текстов данной предметной области с целью идентификации ключевых терминов.
2. Выделение ключевых понятий изучаемой предметной области и изучение связей между дескрипторами тезауруса.
3. Определение иерархических отношений и отношений синонимии между дескрипторами тезауруса.
4. Построение ассоциативных связей между дескрипторами тезауруса в рамках конкретной предметной области [1].
Набор дескрипторов должен удовлетворять следующим требованиям: возможностью описывать темы абсолютного большинства текстов предметной области; множество дескрипторов не должно включать совокупности близких терминов, для чего формируются классы условной эквивалентности; дескриптор должен быть сформулирован однозначно, его подразумеваемое в рамках тезауруса значение должно быть понятно пользователю.
Первый этап обычно требует совместной работы и экспертной оценки различными специалистами (как инженерами, так и лингвистами). При этом необходимо, чтобы выборка была достаточно репрезентативна и отражала современное состояние исследуемой предметной области. Поэтому анализу подлежат как тексты научной, учебной и справочной литературы по специальности, так и статьи из периодических изданий, в том числе и электронных. Нами было проанализировано более 500 контекстов. В качестве источниковой базы послужили учебное пособие [2], словарь [3], материалы статей, опубликованных в журналах New Defence Order за 2019-2020 годы, а также материалы, находящиеся в свободном доступе на сайте https://www.airforce-technology.com/.
При составлении учебного терминологического словаря тезаурусного типа с итоговым объемом в 400 лексических единиц было проанализировано 150 англоязычных текстов со средним объемом 1 000 словоупотреблений. В качестве критериев, определяющих включение в словник лексических единиц, вслед за автором работы [4, с. 96], нами были приняты: важность (семантическая ценность) термина, употребительность (частотность), тематическая принадлежность, системность, терминообразовательная способность, полнота охвата лексики описываемой терминологии, синхронность (временной фактор), нормативность и сочетаемость. Необходимо отметить, что в терминоведении в отношении терминологического статуса несубстантивных частей речи (глаголов, прилагательных, наречий и т.п.) не существует единого мнения. Однако данный класс лексики играет большую роль в коммуникации специалистов, что позволяет считать несубстантивную лексику полноправным объектом терминографии [5]. Употребляясь исключительно в определенной сфере общения, они отобраны узким кругом специалистов для обозначения определенных действий, характеристик объекта, способов действия, что позволяет им не задумываться над способом выражения мысли, например: to adjust (настраивать), to fluctuate (колебаться), to pitch (совершать движение тангажа), to propagate (распространять(ся)), to bounce (отражаться), to track (отслеживать цель), superimposed (наложенный сверху на шкалу). Кроме того, соблюдение норм употребления данного класса лексики, а также правильное понимание ее при восприятии представляют одну из трудностей для военных специалистов, что обусловливает необходимость включения ее в учебный терминологический словарь. Поскольку целью учебного терминологического словаря является описание определенного «подъязыка», т.е. тематически ограниченной совокупности специальных и общих языковых средств, используемых в определенной сфере человеческой деятельности, в учебный терминологический словарь могут и должны включаться лексические средства общего языка, характерные для описываемой области (например, to distribute (распределять), to ensure (обеспечивать), to consider (считать)).
Второй этап наиболее трудоёмкий, так как изучение и описание связей между дескрипторами не только занимает много времени, но и требует тщательной проработки и глубоких знаний в предметной области. На этом этапе возможно участие специалистов из смежных областей знаний. В нашем случае в работе участвовали преподаватели кафедры иностранных языков, курсанты и преподаватели факультета авиационного радиоэлектронного оборудования ВУНЦ ВВС «ВВА» (г. Воронеж).
Отбор дефиниций при составлении словаря тезаурусного типа по авионике осуществлялся путем сравнения дефиниций в различных источниках, сопоставления англо- и русскоязычных дефиниций. В целом анализ показал, что дефиниции в русскоязычных и англоязычных источниках очень схожи, выделяются в основном одинаковые родовые понятия и отличительные признаки. При отборе дефиниции отбиралась та, которая в наибольшей степени отражала существенные признаки описываемого понятия. Как показал анализ дефиниций терминов в качестве основного отличительного признака в более чем 70% случаев называется функция / назначение определяемого объекта.
Так как одно из назначений тезауруса – автоматическая обработка текстов в рамках информационно-поисковых приложений, для реализации соответствующих функций необходимо осуществление логического вывода, при котором информационная система, встретив вхождение некоторого понятия в тексте, делает многошаговые проходы по отношениям. Первый тип отношений – родовидовое отношение ниже-выше, представляет собой отношение класс-подкласс. Второй тип отношений – отношение часть-целое. Используется не только для описания физических частей, но и для других внутренних сущностей понятия, таких как свойства или роли для ситуаций.
Было установлено, что наиболее частотными в предметной области «Авионика» являются родовидовые отношения, а также отношения синонимии.
Третий этап, как правило, не представляет трудности, так как отношения синонимии достаточно полно отражены в существующих лексикографических источниках. Сложности могут возникать лишь с новейшими терминами, которые еще не зафиксированы в традиционных словарях и справочниках. Здесь потребуется знание предметной области военным специалистом, его развитые аналитические способности и умения работать с контекстом.
При построении ассоциативных отношений между дескрипторами необходимо учитывать особенности дальнейшей технической реализации разрабатываемого словаря. В нашем случае в качестве средства технической реализации был выбран аутлайнер TiddlyWiki.
Интерфейс учебного терминологического словаря, реализованного с помощью данного аутлайнера, показан на рисунках 3 и 4. Каждой терминологической группе и входящим в неё терминам соответствовал отдельный тидлер –вики-страница с толкованием, описанием и указанием на тип отношений. Взаимосвязи между тидлерами осуществлялись с помощью гипертекстовых связей. При этом тидлеры были связаны в классы согласно концептуальной модели, описанной выше.
Рисунок 3. Интерфейс учебного терминологического словаря, включенного в состав ДИС, предназначенной для профессионально-личностного саморазвития курсантов, обучающихся по специальности «Техническая эксплуатация транспортного радио оборудования».
Рисунок 4. Внешний вид экрана словаря с описанием словарной статьи «Радиоэлектронное оборудование».
Итак, нами был проанализирован корпус англоязычных текстов, относящихся к предметной области «Авионика», что позволило выявить совокупность дескрипторов, разделённые на следующие классы: навигация и навигационные приборы, измеряемые параметры, шкалы и единицы измерения, приборы, действия с приборами, функции авиационного радиоэлектронного оборудования. Установив ассоциативные отношения между дескрипторами, мы составили учебный терминологический тезаурус, который был включён в состав дидактической информационной среды кафедры иностранных языков. Он применяется на занятиях по дисциплине «Иностранный язык» (английский), а также обеспечивает развитие и расширение профессионального тезауруса будущих инженеров в области бортового радиоэлектронного оборудования в процессе освоения других дисциплин по данной специальности. В настоящее время ведется работа по включению тезауруса в состав базы данных «Avionics» для регистрации в Реестре баз данных Российской Федерации.
Литература
Киргинцева Н.С., Олех Б.С., Мартыненко А.О. Учебный терминологический тезаурус как компонент ресурсной составляющей дидактической информационной среды (на примере предметной области «Бортовое авиационное оборудование). Актуальные проблемы теории, методологии и практики научной деятельности: сб. ст. Междунар. НПК (25 июня 2020 г., г. Омск, РФ). Уфа: Аэтерна, 2020. 318 с. С. 216 – 218.
Киргинцева Н.С., Поталуй В.В., Похващева М.С., Ширшикова Е.А. Английский язык. Авиационное и радоэлектронное оборудование. Воронеж: ВУНЦ ВВС «ВВА», 2015. 115 с.
Англо-русский словарь терминов по радиоэлектронной борьбе./ М.С. Тясто, С.Н. Туливетров, А.С. Николаев. Ростов-на-Дону, 2012. 228 с.
Гринев-Гриневич С. В. Введение в терминографию: как просто и легко составить словарь : учеб. пособие. 3-е изд., доп. М. : Книжный дом «ЛИБРОКОМ», 2009. с. 62-63.
Маткина И.В. Структурная классификация терминологических словарей// Очерки научно-технической лексикографии: Сб. ст./ Под ред. А.С. Герда. СПб: Изд-во С.-Петерб. ун-та, 2002. С. 128-146.