ПЛЮСЫ И МИНУСЫ МАШИННОГО ПЕРЕВОДА - Студенческий научный форум

XIV Международная студенческая научная конференция Студенческий научный форум - 2022

ПЛЮСЫ И МИНУСЫ МАШИННОГО ПЕРЕВОДА

Распопов А.Д. 1, Лисов П.Б. 1
1ВУНЦ ВВС «ВВА им. проф. Н.Е. Жуковского и Ю.А. Гагарина» (г. Воронеж)
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

В современном обществе происходит стремительное развитие международных отношений, поэтому у многих специалистов в различных областях деятельности появляется необходимость перевода текста, документов и деловых писем с одного языка на другой. Люди, которые не владеют необходимым иностранным языком в достаточной мере прибегают к помощи систем машинного перевода (различных программ для перевода текста). В данной статье рассматриваются проблемы, которые возникают в ходе использования машинного перевода, включая в себя историю развития таких систем, типы систем машинного перевода по степени автоматизации, преимущества, и недостатки данного способа перевода, а также приведен сопоставительный анализ двух вариантов перевода отрывка текста разными программами.

Машинный перевод (МП) как термин понимается как минимум в двух смыслах. В узком смысле это означает процесс перевода некоторого текста с одного естественного языка на другой, реализуемый компьютерной программой полностью или почти полностью. Процесс заключается в том, что на вход машины подается текст, словесная часть которого не сопровождается никакими дополнительными указаниями, а на выходе получается текст на другом языке, являющийся переводом входного, причем преобразование входного текста в выходной происходит без вмешательства человека [1, 8].

Если же рассматривать этот термин в широком смысле, то это область научных исследований, находящаяся на стыке лингвистики, математики, кибернетики, и имеющая целью построение систем, реализующих машинный перевод в узком смысле.

Началом использования и активной реализации МП является «Джорджтаунский эксперимент», который состоялся 7 января 1954 года в Нью-Йорке, в штаб-квартире корпорации IBM. Во время данного эксперимента было переведено более 60 фраз с русского языка на английский, это стало невероятным толчком в истории развития машинного перевода. Использование машинного перевода в Интернете началось с «Systran», одной из старейших компаний по машинному переводу, которая предлагала бесплатный перевод небольших текстов (1996 г.). Уже в 2007 году была создана программа машинного перевода Моисей, которая представляла собой механизм статистического машинного перевода с исходного языка на целевой язык [1, 12]. Также в 2008 году в Японии появилась служба перевода текста или SMS уже для мобильных телефонов), а в следующем году был создан и мобильный телефон со встроенной функцией преобразования речи с одного языка на английский, японский и китайский языки. В последние годы технологии машинного перевода претерпели значительные положительные изменения благодаря исследованиям компании «Google» по нейронному машинному переводу, которые прогнозируют оптимистичное будущее этой отрасли. 

Существует несколько типов машинного перевода по степени автоматизации: полностью автоматический; автоматизированный машинный перевод при участии человека (с пред-, интер- или постредактированием); перевод, осуществляемый человеком, с использованием компьютера (например, с использованием электронных словарей) [2, 24].

Преимуществами машинного перевода является скорость, использование МП существенно сокращает время, затрачиваемое для перевода того или иного слова, предложения или текста. Также значительным плюсом является большое количество бесплатных интернет-ресурсов, которые предоставляют услуги МП, в то время как в специальных бюро переводов приходится платить значительные суммы за перевод. Так как доскональный анализ текста и высококачественный перевод нужен не всегда, иногда требуется только уловить краткую суть текста, в этом случае идеальный вариант – воспользоваться бесплатными услугами компьютерных программ-переводчиков. Третьим преимуществом МП является полная конфиденциальность, когда нужно перевести какое-либо важное письмо или документ. Еще одним, но не менее важным, является тот факт, что МП универсален, он способен перевести слова, предложения, тексты на разные темы, хотя чаще всего профессиональные переводчики специализируются на конкретных узконаправленных темах.

Но какой бы развитой сфера технологий ни была, до сих пор существуют некоторые проблемы, которые встречаются при использовании МП. Одной из главных лингвистических проблем, возникающих при переводе текстов с одного языка на другой, является проблема многозначности лексических единиц. Такое явление носит название полисемия (от греч. polysemos – многозначный) – наличие у языковой единицы более одного значения. Эта проблема, возникающая в ходе МП, активно решается, к примеру, с помощью использования контекстологических словарей, в которых для каждого многозначного слова указывается его приоритетный переводной эквивалент, специфичный для рассматриваемой предметной области. Но в целом проблема неоднозначности может быть решена только интерактивным путем, поскольку одно слово может иметь два и более значения, что значительно усложняет работу и потенциально может ухудшить качество перевода текста [3,15].

Также наиболее частой является проблема особенности структурного и лексического различия языков, а также существование грамматических конструкций, состоящих из нескольких слов. Так, к примеру, существует проблема перевода фразеологических сочетаний, идиом, которые изобилуют во всех языках. Решение этой проблемы следущее: при разработке той или иной системы МП необходимо изначально закладывать значение таких словосочетаний, и обрабатываться они должны как одно слово.

На данном этапе развития МП невозможно «подстановочным» способом решить все проблемы для получения качественного машинного перевода, также не всегда удается корректно произвести необходимые переводческие трансформации, которыми пользуются профессиональные переводчики. Но все же в наши дни МП решает некоторые задачи, с помощью систем машинного интеллекта мы можем понять общий смысл необходимого текста, выделить главную мысль и производить с ним какие-либо действия.

Однако, создание качественных переводов художественных текстов без участия профессиональных переводчиков до сих пор невозможно. Потому что человек анализирует иностранный текст более подробно, способен передать эмоциональный фон художественного произведения, отразить переживания персонажей, вкладывая в перевод собственное понимание написанного, улавливая все особенности языка оригинала, а также языка перевода.

До сих пор нерешенной остается задача создания такой компьютерной программы, которая бы смогла перевести исходный текст с учетом всех тонкостей, чтобы после не было необходимости дорабатывать полученный текст перевода вручную. Необходимо совершенствование подсистем грамматического анализа и синтеза в направлении развития систем машинного перевода.

Насколько качественно программы выполняют перевод научно-популярных и технических текстов? В данной работе мы проведем сопоставительный анализ качества двух варианта перевода отрывка текста, выполненные с помощью программ «Google – переводчик» и «Yandex – переводчик».

Отрывок текста взят из открытого источника “Wikipedia” [4].

The Type 45 destroyers are primarily designed for anti-air warfare with the capability to defend against targets such as fighter aircraft and drones as well as highly maneuverable sea skimming anti-ship missiles travelling at supersonic speeds. The Royal Navy describes the destroyers' mission as being "to shield the Fleet from air attack". The Type 45 destroyer is equipped with the Sea Viper (PAAMS) air-defense system utilizing the SAMPSON active electronically scanned array multi-function radar and the S1850M long-range radar. PAAMS is able to track over 2,000 targets and simultaneously control and coordinate multiple missiles in the air at once, allowing a large number of tracks to be intercepted and destroyed at any given time. This makes it particularly difficult to swamp PAAMS during a saturation attack, even if the attacking elements are supersonic. The US Naval War College has suggested that the SAMPSON radar is capable of tracking 1,000 objects the size of a cricket ball travelling at three times the speed of sound (Mach 3), emphasizing the system's capabilities against high performance stealth targets.”

Первый вариант перевода выполнен с помощью программы «Yandex – переводчик»:

«Эсминцы типа 45 в первую очередь предназначены для противовоздушной обороны с возможностью защиты от таких целей, как истребители и беспилотные летательные аппараты, а также от высокоманевренных морских противокорабельных ракет, движущихся со сверхзвуковой скоростью. Королевский военно-морской флот описывает миссию эсминцев как "защиту флота от воздушного нападения".

Эсминец типа 45 оснащен системой противовоздушной обороны Sea Viper (PAAMS), использующей многофункциональный радар SAMPSON с активной решеткой электронного сканирования и радар дальнего действия S1850M. PAAMS способен отслеживать более 2000 целей и одновременно контролировать и координировать несколько ракет в воздухе одновременно, позволяя в любой момент перехватывать и уничтожать большое количество следов. Это делает особенно трудным затопление ПААМ во время атаки насыщения, даже если атакующие элементы являются сверхзвуковыми. Военно-морской военный колледж США предположил, что радар SAMPSON способен отслеживать 1000 объектов размером с крикетный мяч, движущихся со скоростью, в три раза превышающей скорость звука (3 Маха), подчеркивая возможности системы против высокопроизводительных целей-невидимок.»

Второй вариант перевода выполнен с помощью программы «Google – переводчик»:

«Эсминцы Тип 45 в первую очередь предназначены для ведения противовоздушной борьбы с возможностью защиты от таких целей, как истребители и беспилотные летательные аппараты, а также от высокоманевренных противокорабельных ракет, скользящих по морю, летящих на сверхзвуковых скоростях. Королевский флот описывает миссию эсминцев как «защитить флот от воздушного нападения». Эсминец Type 45 оснащен системой противовоздушной обороны Sea Viper (PAAMS), использующей многофункциональную РЛС SAMPSON с активной антенной решеткой и РЛС дальнего действия S1850M. PAAMS может отслеживать более 2000 целей и одновременно управлять и координировать действия нескольких ракет в воздухе, что позволяет перехватить и уничтожить большое количество траекторий в любой момент времени. Это делает особенно трудным подавление PAAMS во время атаки насыщения, даже если атакующие элементы являются сверхзвуковыми. Военно-морской колледж США предположил, что радар SAMPSON способен отслеживать 1000 объектов размером с мяч для крикета, движущихся со скоростью, в три раза превышающей скорость звука (3 Маха), что подчеркивает возможности системы против высокоэффективных невидимых целей».

Анализируя полученные варианты перевода можно сделать вывод, что обе программы выполнили перевод достаточно адекватно, с небольшим количеством неточностей, не влияющих на общее понимание смысла текста.

Например, в переводе, сделанном программой «Yandex–переводчик», дважды употреблено слов «одновременно», в первой части «PAAMS» оставлено без перевода, как имя собственное, а далее дается перевод «ПААМ», что нельзя считать адекватной передачи аббревиатуры на русский язык. Далее следует обратить внимание на перевод конца предложения: «и уничтожать большое количество следов», где имеет место неверный выбор варианта перевода слова “tracks”. В данном контексте его следует переводить как «целей» или «траекторий движения целей». Следующая неточность: «во время атаки насыщения», правильный вариант: «атаки со сплошным поражением» или «массированном ударе». Еще один неверный выбор значения словосочетания: «высокопроизводительных целей-невидимок», следует перевести как «высокоскоростных и маневренных целей-невидимок».

Очевидно, что в варианте перевода, выполненном с помощью программы «Google – переводчик» неточностей (выделены жирным шрифтом) меньше, однако они тоже имеют место. Например: «уничтожить большое количество траекторий», вместо «целей»; аналогичная сделанной «Yandex-переводчиком» ошибка: «атаки насыщения»; а вариант перевода: «высокоэффективных невидимых целей» можно считать более удачным, но, все-таки, недостаточно точным.

Данный анализ результатов работы двух программ-переводчиков позволяет сделать вывод об их достаточно высокой эффективности и адекватности, однако, следует отметить тот факт, что необходимость в проверке и правке машинных переводов человеком-специалистом остается актуальной, ибо в них имеют место искажения смысла и некоторые неточности.

В итоге хотелось бы отметить, что системы машинного перевода являются необходимым помощником в работе с иностранным текстом, главной задачей которого является перевод. К сожалению, письменный машинный перевод является слишком прямым, не учитывающим тонкостей языка, но это ставит задачу для разработчиков, которые улучшают эти системы уже более полувека. И также следует сказать, что это инструмент, который позволяет ускорить и упростить очень трудоемкий процесс перевода, но его эффективность зависит от правильного использования и качественной обработки полученного материала.

ЛИТЕРАТУРА

Кулагина О.С. О современном состоянии машинного перевода // Математические вопросы кибернетики. Вып. 3. М., 1991.

Марчук Ю.Н. Компьютерная лингвистика: учебное пособие. М., 2007.

https://fsc.bsu.by/wp-content/uploads/2015/12/Mashinny-j-perevod-konspekt-lektsij.pdf

https://en.wikipedia.org

Просмотров работы: 911