Систематические модели перевода - Студенческий научный форум

XI Международная студенческая научная конференция Студенческий научный форум - 2019

Систематические модели перевода

Бадеев В.А. 1
1БГУ им.Петровского
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

В настоящее время большинство систем перевода основаны на морфологическом и синтаксическом анализе языка. Модель семантического перевода включает в себя изучение семантических языков, сравнение элементов контента, анализ его структуры, выбор базовых единиц или компонентов.По мере добавления семантических модулей количество неточностей перевода значительно уменьшается.

Рассмотрим различные семантические модели, которые будут обсуждаться ниже Это приложение сделано по замыслу пошаговое RPG , то есть каждый уровень идет отдельной кнопкой . Первый уровень сложности легкой, а последующие уровни усложняются . С каждым прошедшим уровнем будет показано часть сюжетной линии главного героя , который пытается спасти красную шапочки. А так же, этому приложению присуще все характеристики, что и приложениям выше.В итоге мы видим что все программы работают по похожему принципу. Приложение служит для разгадывания японских кроссвордов. В целях развлечения.1.2 Обоснование выбора инструментария разработки компьютерной игрыВыбор инструментария программного обеспечения в первую очередь обуславливается операционной системой (ОС) в которой предполагается его использование. Эксплуатация компьютерной игры «Японские кроссворды» будет происходить в операционных системах семейства «Windows». Учитывая это, игра должна обладать сложным развитым графическим интерфейсом, содержащим общепринятый для данной ОС набор элементов управления и доступа к функциям игры, хотя и при необходимости видоизмененный с учетом специфики интерфейсов компьютерный вид.Наиболее подходящим для реализации указанных выше требований к разрабатываемому программному обеспечению является среда разработки Borland C++ Builder, поддерживающая компонентно-ориентированный подход к разработке программных систем, инструмент быстрой разработки приложений (RAD).Среда C++ Builde объединяет в себе комплекс объектных библиотек (STL, VCL, CLX, MFC и др.), компилятор, отладчик, редактор кода и многие другие режимы. Разработка программного обеспечения в данной среде осуществляется на языке программирования С++.В С++ Builder есть огромное кол-во компонентов в визуальных библиотеках , с помощью которых удобно и просто работать с программой. Например, Стандартные компоненты (MainMenu, PopupMenu),графические компоненты (PaintBox, Image, ImageList, Shape и т.д), оригинальные компоненты (StringGrid, Edit, Label, Memo).C++ Builder предоставляет программисту широкие возможности повторного использования кода не только за счет наличия библиотеки компонентов, но и за счет поддержки стандарта «ActiveX», что позволяет встраивать в приложения «ActiveX» – компоненты как сторонних производителей, так и созданные собственноручно с помощью самого C++Builder.Немаловажным фактором, влияющим на популярность этих продуктов, является их открытость, заключающаяся в возможности создания с их помощью не только дополнительных компонентов и элементов «ActiveX», улучшающих функциональность приложении, но и различных экспертов, редакторов свойств компонентов, улучшающих функциональность самой среды разработки.А так же, в C++Builder есть замечательная возможность подать готовое приложение пользователю одним файлом, файл с разрешением *.exe, чтоб это сделать нужно зайти во вкладку Project -> Options -> Compiler кнопку Release, а затем ОК . Таким образов вы получите полноценное приложение. А так же существует Compiler ->Fulldebag , которое позволяет запускать приложение только в рамках самого C++Builder.Следует отметить, что эффективность разработки и отладки приложений достигается не только за счет использования удобных средств визуального проектирования форм (сейчас это не редкость), но и за счет, во-первых, высокой производительности самих компиляторов «Borland» и, во-вторых, так называемой инкрементной компиляции и компоновки исполняемого модуля (когда перекомпиляции и перекомпоновке подвергаются только те модули, в которые были внесены изменения).1.3 Среда разработки С++ Builder. Структура и возможности компонентовКласс не имеет физической сущности, его ближайшей аналогией является объявление структуры. Память выделяется только тогда, когда класс используется для создания объекта. Этот процесс также называется созданием экземпляра класса (class instance).Любой объект языка C++ имеет одинаковые атрибуты и функциональность с другими объектами того же класса. За создание своих классов и поведение объектов этих классов полную ответственность несет сам программист. Работая в некоторой среде, программист получает доступ к обширным библиотекам стандартных классов (например, к Библиотеке Визуальных Компонент C++Builder).Метод записи имеет единственный параметр того же типа, что и свойство, и не возвращает значения. По соглашению, название функции образуется из слова "Set", за которым следует имя свойства. Например, метод записи свойства MaxLength имеет имя SetMaxLength и тип void. Метод записи свойства присвоит значение своего параметра соответствующему члену данных.C++ Builder – это программный продукт, интегрированная среда программирования, выпущенная недавно компанией Borland для быстрой разработки программного обеспечения.Данный программный продукт основан на технологии визуального проектирования. Его суть заключается в том, что среда разработки берет на себя большую часть работы по генерации кода программы, оставляя программисту работу по конструированию диалоговых окон и написанию функций обработки событий. Производительность программиста при использовании таких систем существенно увеличивается. BorlandC++ Builder позволяет создавать приложения на языке С++с использованием среды разработки и библиотеки компонентов Delphi.C++ Builder объединяет в себе комплекс объектных библиотек, компилятор, отладчик, редактор кода и многие другие компоненты. Цикл разработки похож на Delphi. Большинство компонентов, разработанных в Delphi можно использовать и в C++ Builder без изменений, обратное утверждение неверно. В C++ Builder интегрирована Палитра компонент, которая разделена вкладками на несколько функциональных групп. По сути, интегрированная среда разработки сочетает в себе: Главное окно IDE, Редактор форм, Инспектор объектов, Администратор проекта и полностью интегрированные Редактор кода и Отладчик – инструменты быстрой разработки программных приложений, обеспечивающих полный контроль над кодом и ресурсами.

WASP модель

Arabic модель смысл

Модель семантической структуры

1 модель WASP

В настоящее время исследования по пониманию естественных языков сосредоточены главным образом на поверхностном семантическом анализе, таком как определение семантической роли и устранение неопределенности, двусмысленности.       Эта модель рассматривает более амбициозную работу семантического анализа, конструирование формального, совершенно символического выражения значения предложения.

Большинство исследований семантического анализа было сосредоточено на относительно простой области, такой как «Air Information Services».

Разработанный алгоритм выполняет семантический анализ на основе представления естественного языка с показателем важности.  Хотя предполагается, что существует уникальная грамматика не контекстных семантических представлений, алгоритм не требует предварительного знания синтаксиса языка .

Разработанный алгоритм называется WASP(Word Alignment-based Semantic Parsing).Давайте начнем с примера, иллюстрирующего модель семантического анализа WASP .  Пожалуйста, подумайте о проблеме определения семантического представления предложений.       Чтобы решить эту проблему, сначала проанализируйте синтаксическую структуру предложений.  Кроме того, смысл предложения достигается за счет объединения стоимости его подразделения . Этот процесс может быть формализован как анализ.

Согласно теории компилятор синтаксического анализа и генерации кода объединены в одной фазе семантического анализа, как набор пар строк, в каждой паре которых одна строка является предложением естественного языка, а другая – его семантическим представлением. Бесконтекстная синхронная грамматика используется для определения окончательного перевода.   

Другими словами, семантическое представление - это заключение с наиболее вероятным результатом.  Предполагая, что каждое слово в естественном языке связано с более чем одним значением, правило преобразования начинает снизу вверх.  Разработанный метод, как и многие модели перевода, требует более простой модели на основе соответствия для получения словаря фраз.  Эта модель, семантический анализ задачи с целью перевода естественного языка на формальный язык, показывает , что идея компиляции и теории машинного перевода (слово модели) вполне можно использовать.

Основным преимуществом этого алгоритма является то, что он может быть интегрирован с современными методами статистического машинного перевода.  Проблема репрезентативного выражения значения предложений символически также была решена .

2 систематическая модель для арабского языка

При переводе арабского текста на арабский язык жестов большинство исследований было сосредоточено на переводе слов без учета значения переведенной фразы.  Чтобы решить эту проблему, предыдущая работа в этой области была дополнена модулем дополнительного значения.  Предлагаемая система перевода ограничена областью права .

Модель является онтологией.  Текущая онтология очень важна для получения общего понимания различных областей и знаний о том, как знания структурированы и соотнесены.  Онтологии могут быть классифицированы по двум характеристикам от числа и типа или предметов, концептуализацию или концептуальные структуры.  Первый атрибут можно разделить на три категории : Терминология онтология. Он должен представлять термины, используемые для представления знания в определенной области, например в словарях Второй атрибут: информационная онтология, предназначенная для записи и структурирования баз данных в домене . Третий атрибут : моделирование онтологии знаний направлено на концептуализацию знаний .

Информация онтологии можно разделить на две  категории :Онтология приложения, предназначена для моделирования знаний, необходимых для конкретного приложения, а онтология предметной области представляет знания, относящиеся к конкретной области .

Эта область состоит из набора иерархических классов.  Кроме того, предлагается набор свойств для сравнения классов и примеров с другими классами. То есть это семя и синоним .

В качестве входных данных модуль семантического анализа получает выходные данные из предыдущего процесса перевода, извлекает каждое слово в онтологии целевой области и получает код движения.  Если слово не имеет такой же жест, замените его одним из синонимов с этим жестом в базе данных.  Если слово не имеет подходящего жеста для предметной онтологии, слово записывается и отображается в виде пунктирной линии .

3 модели семантической структуры

Семантическая модель - это системный блок, предназначенный для перевода устной или письменной речи с ограниченным количеством утверждений и семантики .

Интерлингва  (язык-посредник) - используется для представления семантической структуры.  Гнератор строк слов в сочетании с языком постпроцессора генерирует строки слов на целевом языке.  В настоящее время семантические инверторы и генераторы цепочки слов работают только с вероятностными тестовыми базами и пробными базами знаний .

Система перевода подходит для рамки термина , который был ограничен без каких - либо придаточных предложений, состоит из трех основных компонентов.

При написании письменного текста частота неправильных преобразований слов в семантической структуре составляет всего 0,2 .  Многие ошибки вызваны неизвестными словами .

Тесты проводились по предметным областям в семантической структуре 307 «Графический редактор» .Переведенным на 4 разных языка (немецкий, английский, французский и словенский) 

Преимущества этой системы: компонент реализации многоязычной системы перевода, наличие формализованной модели.  Одним из главных преимуществ является то, что семантический блок учитывается синтаксисом и морфологической информации.

Основным недостатком является то, что использование стохастических моделей может привести к ошибкам и неточностям .

Обсуждаемая система не полностью решает проблему описания сущности соответствия содержания оригинала содержанию перевода.  Поскольку предметное поле и семантическая модель арабского языка обрабатывают только предметное поле, его нельзя рассматривать как целую языковую модель.  Наиболее перспективной моделью является семантическая модель.  Зависит от использования Интерлингва - (Это обеспечивает список более широких языков для перевода).  В этой статье мы рассмотрели модель семантического перевода и выяснили их достоинства и недостатки.

Просмотров работы: 14