История и главные проблемы машинного перевода - Студенческий научный форум

XIV Международная студенческая научная конференция Студенческий научный форум - 2022

История и главные проблемы машинного перевода

Насильников Е.В. 1
1Владимирский государственный университет
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Перевод какого-либо текста представляется нам некоторой алгоритмической операцией, требующей следования грамматическим структурам языка оригинала и языка перевода. Во все времена вплоть до 20 века переводом занимались только люди, имеющие образование или непосредственный опыт общения на двух и более языках, а серьезная теория перевода появилась только с возникновением лингвистики как научной дисциплины. Оказалось, что алгоритмы перевода могут быть исследованы научными методами и приведены в состояние полноценной системы [1]. История машинного обучения началась примерно в то же время и в 20 веке две дисциплины нашли «общий язык» и смогли применить, казалось бы, сугубо математический подход к естественному языку. Всемирно известный Джорджтаунский эксперимент состоялся 7 января 1954 года в Нью-Йорке, в штаб-квартире корпорации IBM. В ходе эксперимента был продемонстрирован полностью автоматический перевод более 60 предложений с русского языка на английский. Машина «знала» только 6 грамматических правил и 250 слов. Уже тогда такой машинный перевод подвергся критике, ведь он не решал проблемы государственного масштаба: обучение языку, подготовка переводчиков, полноценная помощь при переводе [3]. Финансирование этого проекта уменьшилось в 10 раз.

Даже в настоящее время сложно сказать, является ли машинный перевод решением описанных выше проблем или нет. Из начинаний 20 века развились несколько разных подходов к построению алгоритмов машинного перевода: основанный на правилах, статистический, или основанный на статистике, и нейронный машинный. Первый подход является традиционным и используется большинством разработчиков систем машинного перевода (пример: система ПРОМТ). Ко второму типу относятся популярные у обычных пользователей сервисы по типу «Яндекс.Переводчик», «Переводчик Google». Большинство современных систем являются гибридными —они сочетают правила, статистику и нейронные сети. Однако, несмотря на большое количество разработанных инструментов, мы до сих пор не можем напрямую ответить на вопросы о «компетентности машины». Мысленный эксперимент «Китайская комната», в котором предлагается поставить «знак равно» между искусственным интеллектом и сознанием человека, уже достаточно долго заводит в тупик многие рассуждения в этой области [2], ведь он показывает, как парадоксально ожидать от искусственного интеллекта именно «интеллекта».

Этот эксперимент, с того момента, как он был предложен американским лингвистом и философом Джоном Сёрлем, является одним из самых дискутируемых в области когнитивистики. Есть исследователи, которые даже называют когнитивистику «исследовательским проектом по опровержению «Китайской комнаты». Всего за 4 года (2010-2014) было выпущено более 750 статей в научных журналах, где обсуждается этот мысленный эксперимент. Предлагаются самые разные варианты разрешения этого парадокса, но единогласного решения по вопросу «Китайской комнаты» научное сообщество предложить, увы, не может.

Одним словом, проблемы машинного перевода спустя столько лет после Джорджтаунского эксперимента находятся вовсе не в области выявления алгоритмов. Оказалось, что сама структура языка, отношения синтаксиса и семантики мешают людям понять собственные алгоритмы, которые постоянно применяются в речи. Лингвистические проблемы не решаются в сфере машинного перевода и, тем более, практика машинного перевода не показывает «горизонта» дальше, чем известная нам лингвистическая теория. Эти выводы довольно пессимистичны. Однако даже на фоне таких недостатков машинного перевода, нужно осознавать, что, в конце концов, любая система перевода способна на перевод как таковой, а его качество и пригодность всегда будут оцениваться человеком. Если переводческие Интернет-сервисы используются людьми для коммуникации, то их недостатки легко сглаживаются в социальной обстановке. Любой инструмент, упрощающий коммуникацию, заслуживает исследовательского внимания и, возможно, в будущем перед нами встанут новые проблемы машинного перевода, но уже прагматического, а не строго теоретического толка.

Список литературы:

Нелюбин Л. Л. Наука о переводе (история и теория с древнейших времен до наших дней). — М.: Флинта: МПСИ, 2006. — 416 с.

Searle, J. Chinese Room Argument; The MIT Encyclopedia of the Cognitive Sciences. MIT Press, 2001. С. 115-116. 

https://www.nap.edu/read/9547/chapter/1

Просмотров работы: 26