Computer Lexicography - Студенческий научный форум

XIII Международная студенческая научная конференция Студенческий научный форум - 2021

Computer Lexicography

Filatova Anastasia Igorevna 1
1Владимирский государственный университет им. А.Г. и Н.Г. Столетовых
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Компьютерная лексикография – прикладная научная дисциплина в языкознании, изучающая методы использования компьютерной техники для составления словарей.

Внутри этого направления выделяется два аспекта:

1) перевод в машинную форму словарей, ранее опубликованных;

2) создание новых компьютерных словарей.

Что касается перевода словарей в машинную форму, то это не простой перевод бумажных словарей в компьютерный формат, но решение многих проблем старых словарей. Старые словари имеют ряд проблем. Например, чем больше словарь, чем полнее и доказательнее описание лексических значений, тем сложнее им пользоваться. Поэтому стало выпускаться много массовых изданий, довольно примитивных, но относительно удобных. Еще одна проблема бумажных словарей это то, что они быстро теряют свою актуальность.

Компьютерные словари — это неизбежно актуальные словари. Компьютерная реализация бумажных словарей позволит преодолеть эти и другие недостатки. Поэтому компьютерная лексикография – новый стимул как для развития теоретической лингвистики, так и для решения многих проблем прикладного характера.

Примером перевода бумажных словарей может служить «Словарь русского языка» С.И. Ожегова и Н.Ю. Шведовой. Эта база создана в Институте русского языка РАН в 1990 г., с тех пор она постоянно пополняется, и на ее основе издаются обновленные версии.

В России одним из первых словарей, хотя вышедший и в традиционной форме, но составленный с помощью электронно-вычислительных машин, был «Русский семантический словарь» (1983 г.), созданный Ю.Н. Карауловым, В.И. Молчановым и др. В нем представлено 1600 тем-понятий, охватывающих все сферы жизни. В словарной статье слова группируются вокруг некоторой идеи, смысл которого они раскрывают. В отличие от обычного идеографического словаря «Русский семантический словарь» содержит дополнительную информацию о лексической семантике, в том числе сведения о семантических множителях каждой единицы, их количестве, весе в дефиниции. Имеющаяся в системе база данных дает 195 возможность получить информацию о лексическом окружении любой единицы словника. Фактически, это вход в систему «от слова к слову». Следовательно, данный словарь давал пользователю необычайные для того времени возможности и открыл путь словарям нового типа – компьютерным.

Компьютерный словарь – это один или несколько словарных файлов, индексы доступа к ним, описания структуры этого словаря и система программ, обеспечивающих создание словаря и обращение к нему за справками в диалоговом режиме или посредством других программ, например, через лексикографический процессор.

На базе различных университетов Европы и Америки создаются машинные фонды, которые берут на себя функцию хранения текстов. Такой фонд создан и в Институте русского языка РАН. Сейчас там есть на магнитных носителях следующие тексты: романы М.Ю. Лермонтова «Герой нашего времени», Ф.И. Достоевского «Бесы», М.М. Булгакова «Мастер и Маргарита», «Белая гвардия», «Театральный роман», несколько томов произведений И. А. Бунина и ряд других текстов. Во всех этих текстах можно искать на компьютере нужное слово или выражение, что существенно облегчает сбор материала для словарной статьи. В будущем пополнение машинных фондов может проводиться самими исследователями, которые посылают свои тексты в фонд по окончании работы.

References:

1. Маслова В.А. Современные направления в лингвистике. М.: Академия, 2008. 272 с.

2. Актуальные проблемы современной лингвистики: Учебное пособие // Сост. Л.Н. Чурилина. М.: Флинта: Наука, 2016. 416 с.

3. https://pandia.ru

4. https://studfiles.net

Просмотров работы: 23