ЭЛЕКТРОННЫЕ СЛОВАРИ И ИХ ПРИМЕНИМОСТЬ ДЛЯ ТРАДИЦИОННОГО МАШИННОГО ПЕРЕВОДА - Студенческий научный форум

V Международная студенческая научная конференция Студенческий научный форум - 2013

ЭЛЕКТРОННЫЕ СЛОВАРИ И ИХ ПРИМЕНИМОСТЬ ДЛЯ ТРАДИЦИОННОГО МАШИННОГО ПЕРЕВОДА

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Цель статьи – определить основные недостатки, возникающие в условиях применения электронных словарей для традиционного машинного перевода текстов.

В настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации. В этой связи компьютерные словари являются очень удобным подручным средством в целях экономии времени и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас имеются программы-переводчики, которые могут производить более или менее адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей.

Системный анализ переводческой практики и понятийной сферы современного переводоведения позволяет построить единую типологию переводов, обобщающую различные стороны подготовки, выполнения, презентации и функционирования перевода и соотнесенную с другими основными компонентами переводческой деятельности. Свои классификации видов перевода представили такие лингвисты как И. С. Алексеева, Л. С. Бархударов А. Паршин, Т. А. Казакова, Я. И. Рецкер.

Первые ЭВМ появились в 1947 году. Тогда же и возникла мысль использовать их для перевода. Именно тогда стали задаваться вопросом: а нельзя ли создать какую-либо совершенную систему перевода, которая охватывала бы такие случаи, которые встречаются при практическом переводе иностранного текста? Нельзя ли разработать такие словари и такие правила перевода, которые бы учитывали все особенности построения данного предложения и позволяли бы однозначно установить смысл входящих в него слов и их взаимоотношение в тексте? нельзя ли разработать правила автоматического перевода, которые позволяли бы при пунктуальном их соблюдении выполнять перевод с помощью человека, не знающего языка? Оказывается, это можно сделать. А если это возможно, то появляется надежда и на выполнение перевода совершенно автоматическим путем, без всякого участия человека, при помощи машин с программным управлением, подобных тем, которые автоматически выполняют сложнейшие вычисления [Панов 1958, с. 6].

Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической машины - механического прототипа электронных цифровых вычислительных машин, появившихся через 100 лет. Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у воплощения аналитической машины, которую ему так и не удалось построить [Кулагина, Мельчук 1971, с. 4].

Первые коммерческие продукты машинного перевода, нашедшие практическое использование, появились в середине 80-х годов. Они были реализованы на персональных компьютерах и являлись системами прямого перевода, возможности которых базировались на огромных (по сравнению с первыми системами) словарях, а не на умении анализировать и синтезировать тексты.

Существуют два принципиально разных подхода к построению алгоритмов машинного перевода: основанный на правилах (rule-based) и статистический, или основанный на статистике (statistical-based). Первый подход является традиционным и используется большинством разработчиков систем машинного перевода (ПРОМТ в России, SYSTRAN во Франции, Linguatec в Германии и др.) Ко второму типу относится популярный сервис Переводчик Google, а также новый сервис от ABBYY [Режим доступа: http://ru.wikipedia.org/wiki/].

В результате проведенного мной исследования выяснились недостатки в адекватном переводе текстов при помощи электронных словарей. Наиболее целесообразным представилось использование системы PROMT, поскольку она является самой последней на данный момент версией ряда продуктов PROMT и объективно лучшей из доступных. Оказалось, что словарь-переводчик PROMT не соблюдает правил грамматики и лексики, а также не учитывает художественные приемы. Чаще всего данный словарь выбирает лишь одно из значений многозначного слова, которое может не соответствовать контексту. Если же слово в составе словаря отсутствует, то попросту не переводит его.

А теперь посмотрим на примере. Возьмем в качестве примера отрывок рассказа О. Генри «Комната на чердаке». Таквыглядитотрывокрассказанаязыкеоригинала:

TheSkylightRoom.

First Mrs. Parker would show you the double parlours. You would not dare to interrupt her description of their advantages and of the merits of the gentleman who had occupied them for eight years. Then you would manage to stammer forth the confession that you were neither a doctor nor a dentist. Mrs. Parker's manner of receiving the admission was such that you could never afterward entertain the

same feeling toward your parents, who had neglected to train you up in one of the professions that fitted Mrs. Parker's parlours.

Next you ascended one flight of stairs and looked at the second- floor-back at $8. Convinced by her second-floor manner that it was worth the $12 that Mr. Toosenberry always paid for it until he left to take charge of his brother's orange plantation in Florida near Palm Beach, where Mrs. McIntyre always spent the winters that had the double front room with private bath, you managed to babble that you wanted something still cheaper. Nevermore would Mrs. Parker be cicerone of yours.

В подтверждение положений о недостаточности правильности организации программного обеспечения в целях выполнения адекватного перевода, рассмотрим перевод данного отрывка, выполненный В. Маянц :

Сначала миссис Паркер показывает вам квартиру с кабинетом и приемной. Не смея прервать ее, вы долго слушаете описание преимуществ этой квартиры и достоинств джентльмена, который жил в ней целых восемь лет. Наконец, вы набираетесь мужества и, запинаясь, признаетесь миссис Паркер, что вы не доктор и не зубной врач. Ваше признание она воспринимает так, что в душе у вас остается горькая обида на своих родителей, которые не позаботились дать вам в руки профессию, соответствующую кабинету и приемной миссис Паркер.

Затем вы поднимаетесь на один пролет выше, чтобы во втором этаже взглянуть на квартиру за восемь долларов, окнами во двор. Тон, каким миссис Паркер беседует на втором этаже, убеждает вас, что комнатки по-настоящему стоят все двенадцать долларов, как и платил мистер Тузенберри, пока не уехал во Флориду управлять апельсиновой плантацией своего брата где-то около Палм Бич, где, между прочим, проводит каждую зиму миссис Мак-Интайр, та, что живет в комнатах окнами на улицу и с отдельной ванной, - и вы в конце концов набираетесь духу пробормотать, что хотелось бы что-нибудь еще подешевле. Миссис Паркер больше не водит вас по этажам.

Далее представлен перевод данного текста системой автоматического перевода семейства PROMT:

Первая г-жа Паркер показала бы Вам двойные комнаты. Вы не смели бы прерывать ее описание их преимуществ и достоинств джентльмена, который занимал их в течение восьми лет. Тогда Вам удалось бы запинаться дальше признаваясь, что Вы не были ни доктором, ни дантистом. Манера г-жи Паркер получения входной платы была такова, что Вы никогда не могли позже испытывать то же самое чувство к своим родителям, которые забыли обучать Вас в одной из профессий, которые соответствовали комнатам г-жи Паркер.

Затем Вы поднялись на один лестничный пролет и смотрели на второе - пол назад в 8$. Убежденный ее поведением на втором этаже, что это стоило 12$, которые г-н Тузенберри всегда платил за него, пока он не уехал, чтобы взять на себя ответственность за оранжевую плантацию его брата во Флориде около Палм-Бич, где г-жа Макинтайр всегда проводила зимы, у которых была двойная гостиная с ванной комнатой, Вам удалось пролепетать, что Вы хотели бы что-то еще более дешевле. Больше не будет г-жа Паркер вашим гидом [Режим доступа: http//www.translate.ru].

В ходе анализа двух переводов была выявлена

  • лексическая ошибка, допущенная в переводе системой PROMT:

– «firstMrsParker» PROMT переводит как «первая г-жа Паркер». Эта ошибка вызвана тем, что словарь выбрал лишь одно из значений многозначного слова «first», хотя оно может принимать следующие значения: «раньше», «ранее», «сначала», «прежде всего», «впервые», «скорее», «предпочтительно» [Режим доступа: lingvopro.abbyyonline.com/ru]. Следовательно, «firstMrsParker» нужно перевести как «сначала г-жа Паркер»;

  • грамматические ошибки:

– неправильный порядок слов в предложении, например: «Больше не будет г-жа Паркер вашим гидом». Известно, что В п о в е с т в о в а т е л ь н ы х предложениях подлежащее обычно предшествует сказуемому, например: Провода тянулись от дерева к дереву… (Ажаев) [Розенталь 1997, с. 215]. Поэтому правильно предложение будет построено так: «Госпожа Паркер больше не будет вашим гидом»;

– неправильно образованная форма сравнительной степени прилагательного: «более дешевле». Не соответствует нормам литературного языка соединение в одной конструкции простой и сложной формы сравнительной степени типа «более интереснее» [Розенталь 1997, с. 184]. Правильный вариант: «дешевле» или «подешевле».

Для большей демонстрации правильности заявленных положений, рассмотрим в качестве второго примера перевод логической задачи:

You are given 12 identical-looking coins, one of which is counterfeit and weighs slightly more or less (you don't know which) than the others. You are given a beam balance which lets you put the same number of coins on each side and observe which side (if either) is heavier. How can you identify the counterfeit and tell whether it is heavy or light, in 3 weighings?

Перевод, сделанный человеком:

У вас есть 12 одинаковых по виду монет, одна из которых - фальшивая и весит немного больше или меньше, чем остальные. Имеются рычажные весы, на чаши которых вы можете класть равное число монет и смотреть, какая из чаш перевесила (или весы остались в равновесии). Как за 3 взвешивания определить фальшивую монету и узнать, легче она или тяжелее остальных?

Перевод текста системой автоматического перевода семейства PROMT:

Вам дают 12 идентично-выглядящих монет, одна из которых - подделка и весит немного более или менее, чем другие. Вам дают баланс луча, который позволяет Вам помещать то же самое число монет на каждой стороне и наблюдать, какая сторона (если любой) тяжелее. Как Вы можете идентифицировать подделку и сказать, тяжело или легко, в 3 взвешиваниях? [Режим доступа: http//www.translate.ru].

Лексические ошибки, допущенные при переводе электронным словарем:

– «баланс луча». Эта ошибка вызвана, как легко понять, отсутствием в словаре словосочетания «beambalance», означающего «рычажные весы». Очевидно, что варианты перевода слов (данные в фигурных скобках) - вторые значения соответственных слов во входном языке. Таким образом, отбирая, исходя из контекста, наиболее вероятные значения слов, программа PROMT иногда затрудняется выдать однозначный вариант, оставляя, таким образом, право выбора за редактором-переводчиком. Нужно отметить, что в обоих случаях двоякого толкования слова программой в данном тексте, в качестве наиболее вероятных были выбраны именно правильные значения;

– смущает фраза «если любой», употребленная в тексте в скобках. Во-первых, очевидно, что грамматически текст данный в скобках никак программой не связывается с текстом за скобками - отсюда и разница в роде: сущ. сторона - ж.р. ед. ч.; и мест.любой - м.р. ед. ч. Во-вторых, вероятно фраза "ifany" представляет собой одно единое семантическое целое - в своем роде клише официального стиля. Доказательством тому служит присутствие выражения "ifany" в словаре ABBYLingvo7.0 в качестве отдельной словарной статьи: ifany - если это имеет место

Atthestartofeverymonth I havetosendhimanaccountofmyearnings, ifany. — В начале каждого месяца я должен посылать ему отчет о моих заработках, если таковые имелись.

Грамматические ошибки:

– общеизвестно, что в английские существительные утратили грамматическую категорию рода. Поэтому почти все они согласуются с местоимением 3 лица ед. числа "it" - среднего рода [Кобрина 2006, с. 253] В русском же языке категория рода у существительных присутствует и в 3-м лице ед. числе они согласуются с тремя разными местоимениями в зависимости от грамматического рода [Розенталь 1997, с. 153]. Так вот, система PROMT, синтезируя текст на выходном языке не учитывает возможность согласования существительного и местоимения, его заменяющего в роде. Примеромможетслужитьпоследнеепредложениетекста: "Howcanyouidentifythecounterfeitandtellwhetheritisheavyorlight, in 3 weighings?".Переведено оно следующим образом: "Как Вы можете идентифицировать подделку и сказать, тяжело ли это или легко, в 3 взвешиваниях?" Перевод слов "It" и "counterfeit" не согласуются в роде: подделка - женского рода, это - среднего рода; более того - не видя связи между двумя этими словами, программа-переводчик вместо личного местоимения подставляет указательное.

Стилистических, пунктуационных и орфографических ошибок в ходле анализа переводов не выявлено.

Язык – это живая структура, которая не поддается полной алгоритмизации и посредством алгоритмов проблему машинного перевода не решить. Машина не чувствует текст, она лишь переводит его с помощью различных алгоритмов и правил. На уровне простых предложений и в рамках строго определенной тематики машинный перевод в принципе возможен, но не более. До уровня полной автоматизации перевода человечество еще не дошло. Причиной этому является, вероятно, недостаточный уровень развития наук, затронутых в создании подобных систем. Слишком сложно сказать, как человек переводит – а тем более сложно смоделировать этот процесс с помощью компьютерной программы. Тем более сложно сделать это, если учесть, что человек мыслит образами, а научить этому компьютер - невозможно в принципе (по крайней мере, на настоящем уровне развития ЭВМ) [Марчук 1983, с. 168].

Таким образом, говоря о наиболее перспективных путях развития систем автоматизации перевода, следует, вероятно, сосредоточиться на том, что выполнимо на данный момент, то есть на создании более эффективных электронных словарей с как можно более эффективным механизмом поиска и индексации, с как можно более интегрированной системой словарных статей. Если же брать во внимание развитие систем машинного перевода, то наиболее перспективным направлением здесь окажется совершенствование подсистем грамматического анализа и синтеза, а также увеличение объема контекстуального охвата текста и совершенствование семантических цепочек с целью более точного подбора значений слов.

Список литературы.

1.Кулагина О. С., Мельчук И. А. Автоматический перевод / Кулагина О. С., Мельчук И. А. – М.: Прогресс, 1971. – 308 с.

2.Марчук Ю. Н. Проблемы машинного перевода / Пиотровский Р. Г. – М.:Наука, 1983. – 233 с.

3.Машинный перевод //URL: http://ru.wikipedia.org/wiki/

4.Панов Д. Ю. Автоматический перевод / Панов Д. Ю. – М.: Издательство Академии Наук СССР,1958. – 90 с.

5.Розенталь Д. Э. Справочник по правописанию и стилистике / Д.Э. Розенталь. – М.: Комплект, 1997. – 384 с.

6.ABBYLingvo.Pro Online Dictionary// URL: http://www.lingvo.ru/

7.Free Online Translator and dictionary// URL: http://www.translate.ru/

Просмотров работы: 2315