Технология работы с иноязычном текстом с использованием программ машинного перевода

Среди многочисленных сложных проблем, которые изучает современное языкознание, важное место занимает изучение лингвистических аспектов межъязыковой речевой деятельности, которую называют "переводом" или "переводческой деятельностью".

В 1790 г. в книге А. Тайтлера «Принципы перевода» основные требования к переводу были сформулированы следующим образом:

  • перевод должен полностью передавать идеи оригинала;
  • стиль и манера изложения перевода должны быть такими же, как в оригинале;
  • перевод должен читаться так же легко, как и оригинальные произведения [Паршин А. Теория и практика перевода].

Однако, выполнение указанных требований к тексту перевода часто связано с преодолением разного рода объективно существующих трудностей. Данная работа посвящена изучению тех из них, с которыми мы можем столкнуться при машинном переводе.

Машинный перевод или автоматический перевод(АП), – это интенсивно развивающаяся область научных исследований, экспериментальных разработок и уже функционирующих систем машинного перевода (СМП), в которых основная часть процесса перевода с одного естественного языка (ЕЯ1) на другой (ЕЯ2) выполняется компьютером [Леонтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы].

Современный машинный, или автоматический перевод, осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.

В настоящее время пользователю предоставляется множество систем машинного перевода, дающих достаточно грубый перевод, но тем не менее позволяющих преодолевать языковой барьер. П.Н. Хроменков исследовал наиболее известные из них, доступные пользователям, и показал, что с точки зрения теории практически все они так или иначе реализуют подход, который можно назвать «моделью переводных соответствий» в данной языковой паре [Хроменков 2005].

Довольно часто современные системы машинного перевода дают некоторый полупродукт, который далее редактируется человеком-редактором или переводчиком также с использованием компьютерных средств в виде автоматических словарей или так называемой «переводческой памяти» (translation memory). Во многих статьях описываются системы автоматизированного перевода со всякого рода вспомогательными средствами. Такое взаимодействие человека с информационными технологиями позволяет, в первую очередь, обеспечить быстрое выполнение переводов, что весьма существенно в информационную эпоху, и кроме того, дает перевод достаточно высокого, во всяком случае приемлемого для заказчика, качества [Федоров А.В. Основы общей теории перевода].

Интенсивность работ по машинному переводу в разные периоды времени была различной. Нынешний этап характеризуется некоторым спадом интереса к проблеме по сравнению, например, с 60-ми годами XX века. Но актуальность автоматизации перевода продолжает оставаться высокой вследствие того, что перевод с одного языка на другой единственный эффективный способ преодоления языковых барьеров, поскольку другие (внедрение и использование универсального языка типа эсперанто, изучение иностранных языков основным составом коммуникантов и пр.) неэффективны и не могут заменить перевода; растут и расширяются возможности современной компьютерной информационной технологии, поэтому всегда появляется соблазн поручить машине какую-нибудь интересную интеллектуальную задачу; спрос на переводы в мире увеличивается в абсолютных и относительных пропорциях соответственно тому, как все больше естественных языков приобщаются к мировой цивилизации и вступают в коммуникативную информационную сферу. Высока также и научная привлекательность проблемы машинного перевода.

Действующие системы машинного перевода ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения [http: // files. school-collection. edu. ru/].

Современный машинный перевод следует отличать от использования компьютеров в помощь человеку-переводчику. В последнем случае имеется в виду автоматический словарь, помогающий человеку быстрее подбирать нужный переводной эквивалент. Хотя и в том, и в другом случае компьютер работает вместе с человеком (переводчиком или редактором), в содержание термина «машинный перевод» входит представление о том, что главную, бóльшую часть работы по переводу и отысканию переводных эквивалентов и переводных соответствий машина берет на себя, оставляя человеку лишь контроль и исправление ошибок, в то время как компьютерный словарь в помощь человеку – это чисто вспомогательное средство для быстрого нахождения переводных соответствий; при этом, однако, в такого рода словарях в ограниченной степени могут быть реализованы и некоторые функции, присущие системам машинного перевода [Хроменков П.Н. Анализ и оценка эффективности современных систем машинного перевода].

Общеизвестно, что хороший перевод текста – это не только творческая, но и достаточно трудоемкая работа. Причем даже самый хороший перевод, как правило, нуждается в редакторской правке. Что касается творческой части, то в обозримом будущем в соревновании компьютер человек всегда победит "живой" переводчик. Однако для решения проблем, обусловленных трудоемкостью процесса перевода, системы МП могут оказаться хорошим подспорьем. Для того чтобы это лучше понять, перечислим достоинства программ машинного перевода.

Во-первых, они имеют высокую скорость обработки материала, позволяющую за несколько секунд получить перевод многостраничного текста. Это позволяет быстро понять смысл текста, а если система настроена на перевод текстов этой тематики, требуется минимальная редакторская правка. Во-вторых, их стоимость невысока. В случае с системой машинного перевода, нужно заплатить деньги только один раз – при покупке программы. Доступ к услуге также является немаловажным фактором, который многие критики систем МП не принимают в расчет. Программа переводчик всегда под рукой, а обращаться в переводческое бюро во многих случаях связано с дополнительными затратами времени и сил. Системе МП также обеспечивает конфиденциальность. Помимо этого, чрезвычайно привлекательной для пользователей программ МП является их универсальность. Любой переводчик всегда имеет специализацию, т.е. переводит тексты по той теме, которой он хорошо владеет. Когда переводчик художественной литературы берется за перевод, например, технических текстов, недочетов избежать невозможно. Система МП выгодно отличается тем, что она абсолютно универсальна. Нужно только грамотно подключить специализированный словарь по соответствующей тематике. Следует учесть и еще одно преимущество систем МП пополнение их специализированных словарей новейшими терминами значительно опережает аналогичные словари полиграфического исполнения. В ряде случаев также рекомендуется вести свой собственный словарь новых терминов или новых значений. В этом случае необходимое качество перевода гарантированно [Марчук Ю.Н. Проблемы машинного перевода. М., 1983].

Все преимущества систем МП наиболее ярко проявляются в Интернете, онлайн. Более того, в большинстве случаев переводить информацию в Интернете можно только с помощью программ переводчиков. Именно эта потребность обусловила огромный рост интереса к системам МП сейчас в мире. Только благодаря онлайновым системам МП появилась возможность просматривать иностранные сайты, не затрудняясь с их переводом. Кроме того, здесь действуют все вышеперечисленные достоинства систем МП перевод текстов по любой тематике производится быстро и конфиденциально.

Однако вместо того, что бы попытаться использовать те преимущества, которые предоставляет МП, некоторые люди пытаются довести задачу до абсурда, например, пытаясь перевести поговорки, песни или стихотворения, т.е. именно то, для чего системы МП не предназначены. Безусловно, как и у каждой системы, у машинного перевода имеются и недостатки. В его основе – систематические правила, и поэтому иногда при таком переводе невозможно избежать неточностей. При использовании МП не всегда получаются переводы идеального качества, но для получения основного содержания или создания первичного наброска перевода он может оказаться очень выгодным и экономным. При машинном переводе следует учитывать, что если перевод начинается через систему машинного перевода и отменяете процесс перевода, чтобы вернуться к содержанию на языке оригинала, такое действие может увеличить процент ошибок и сделает варианты перевода крайне неадекватными, хотя иногда это полезно для получения общего смысла. Машина не способна воспринять и понять все тонкости языка, следуя определенным запрограммированным правилам она выдает дословный перевод.

Результаты, получаемые системами машинного перевода, принято оценивать по следующим параметрам:

  • характеристикам программного обеспечения (оцениваются надежность системы, удобство использования, скорость работы, возможность обновлений, эффективность и т.п.);
  • характеристикам пользователя и задачам перевода (оцениваются задачи системы, назначение перевода, особенности пользователя, автора и текста);
  • особенностям системы МП (оценивается стратегия построения системы, лингвистические ресурсы и т.п.);
  • специфике выходного текста (оценивается точность, целостность, стиль, и т.п.). [Беляева Л.Н. Теория и практика перевода].

Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре при заданном направлении перевода (с одного конкретного языка на другой) [http: // files. school-collection.edu.ru/]. Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода:

На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например, дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, синтаксических функций словоформ в данном тексте и пр.), производимое в рамках входного языка; разрешение омографии (конверсионной омонимии словоформ – скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом); лексический анализ и перевод лексем. Обычно на этом этапе однозначные слова отделяются от многозначных (имеющих более одного переводного эквивалента в выходном языке), после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие/ отсутствие контекстных определителей значения [http: // study-english.info/]. Затем следует окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа при том, что в оригинале может быть и единственное число). После этого происходит синтез выходных словоформ и предложения в целом на выходном языке.

Основная особенность современных систем перевода состоит в их реализации в виде набора не жестко связанных модулей. Такая модульность позволяет организовать систему МП в форме совокупности уже готовых модулей и избежать дублирования данных. Кроме того, такой подход делает возможным поэтапное решение проблем анализа и синтеза текста в рамках машинного перевода.

Переходя к характеристике интерпретация текста, необходимо ответить, что какие бы пары языков ни использовались в качестве исходного и переводного, в таких языках нет полного тождества: Слову ИЯ, как правило, соответствует несколько слов ПЯ; один тип предложения ИЯ может быть передан несколькими синтаксическими структурами ПЯ. Поэтому лингвистически точный перевод текстов невозможен в принципе. Возможна лишь правильная интерпретация текста на исходном языке средствами переводного языка. При этом переводчик должен уметь передать объективный смысл всего произведения, сводя к минимуму свое субъективное отношение к описываемому в тексте [Леонтьева Н.Н.].

Опыт разработки систем машинного перевода показал, что задача создания полностью автоматизированных систем, обеспечивающих высококачественный перевод, не требующего дальнейшего постредактирования, является недостижимым идеалом. Поэтому при создании практической системы машинного перевода следует учитывать реальные потребности пользователей систем и возможности моделирования речемыслительного процесса.

Итак, компьютер пока во многом не может заменить переводчика. Стоит ли тогда вообще применять системы машинного перевода? Конечно, стоит. Если компьютер используется для перевода литературных текстов, то получается черновой вариант текста, так называемый подстрочник, который превращается в произведение искусства человеком, слабо владеющим языком оригинала, но являющимся хорошим литературным редактором. Если же речь идет о переводе технических текстов, то здесь при правильном выборе словаря по специальности, в рамках которой написан текст, получается вполне удовлетворительный результат, иногда не требующий последующего вмешательства.

Перспективы развития машинного перевода связаны с дальнейшей разработкой и углублением теории и практики перевода, как машинного, так и «человеческого». Для развития теории важны результаты сопоставительного языкознания, общей теории перевода, теории закономерных соответствий, способов представления знаний, оптимизации и совершенствования лингвистических алгоритмов. Новые и более эффективные словари с необходимой словарной информацией, строгие теории терминологизации лексики, теория и практика работы с подъязыками помогут повысить качество перевода лексических единиц. Формальные грамматики, ориентированные на перевод, дадут возможность оптимизировать алгоритмы нахождения переводных соответствий в данной коммуникативной ситуации, которая может быть описана в рамках соответствующих прикладных теорий представления знаний. Наконец, новые возможности программирования и вычислительной техники также будут вносить свой вклад в совершенствование и дальнейшее развитие теории и практики машинного перевода.

 

ЛИТЕРАТУРА
  1. Паршин А. Теория и практика перевода: Учебное пособие. М., 2004.
  2. Федоров А.В. Основы общей теории перевода (лингвистические проблемы). Учеб. пособие. СПб.: Филологический факультет СПбГУ; М.: ООО «Издательский Дом «ФИЛОЛОГИЯ ТРИ», 2002.
  3. http://files.school-collection.edu.ru/
  4. Хроменков П.Н. Анализ и оценка эффективности современных систем машинного перевода: дисс. ... кандидата филологических наук : 10.02.21. М., 2000.
  5. Марчук Ю.Н. Проблемы машинного перевода. М., 1983.
  6. http://study-english.info/
  7. Леонтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы. Учеб. пособие для студ. лингв. фак. вузов: Издательский центр «Академия» 2006.
  8. Беляева Л.Н Теория и практика перевода: Учебное пособие. СПб., 2007.
Год: 2016
Категория: Филология