Письменный перевод

Не привязан к какой-либо из моде­лей - выбор собственно перевода или интерпретации смысла зависит от жанра переводимого текста и совпадения речевой оформленности смысла. Не направлен на конкретно­го пользователя. При письменном переводе учитываются все факто­ры, определяющие выбор эквива­лента.

Ну вот, теперь мы знаем или нам кажется, что знаем, как переводит человек. Самое время посмотреть, как это делает автомат. Этому и посвящена следующая глава.

Автоматический перевод, или Когда же неутомимый железный конь придет на смену слабосильной

переводческой лошадке?

Заменит ли переводчика переводящий автомат? Как ра­ботает "электронный переводчик"? В чем различие ме­жду "электронным" и "живым" переводчиком? Как мо­жет помочь переводчику-профессионалу переводящий автомат?

На вопрос, вынесенный в заголовок этой главы, можно с полным основанием ответить: "Не скоро. Не скоро пере­водящий автомат заменит переводчика. Если вообще за­менит". Пока что даже самый совершенный автомат пере-

водчика заменить не может. Ведь речь идет о творчестве, а в том, что перевод - занятие творческое, думаю, никого из читателей убеждать не надо.

Другое дело, что переводящий автомат сможет дейст­вительно помочь в рутинной переводческой работе. Его можно использовать для перевода списков, таблиц и тому подобных грамматически не связанных текстов, которые переводить надо, хотя и ужасно неинтересно.

Кроме того, "электронный переводчик" может оказать­ся полезным специалисту в какой-либо области, который язык знает недостаточно хорошо, но тем не менее перево­дит тексты в своей области. Правда, здесь есть высокая ве­роятность того, что переводящий автомат тоже "не очень силен" в этом языке, и к его подсказкам следует отнестись с большой осторожностью.

Огромное преимущество автомата, в том числе и пере­водящего, перед человеком заключается не в более высо­ком уровне решения задач, а в работоспособности - он не устает, не хочет спать, не просит есгь и не бастует.

В частности, по этой причине, я и решил рассказать об автоматическом переводе: о том, как он выполняется ав­томатом, и о том, стоит ли практическому переводчику использовать переводящий автомат в своей работе.

Идея автоматизации перевода возникла почти одно­временно с компьютерами. Уже в 1949 г., через пять лет после запуска в эксплуатацию в США первого достаточно мощного компьютера, математик У.Вивер обратился к ученым с призывом использовать компьютер для перево­да.

Идея Вивера была с энтузиазмом подхвачена многими математиками и лингвистами, и вскоре появились первые модели и системы автоматического, или, как принято го­ворить, машинного перевода.

Первые модели машинного перевода базировались на принципе перекодирования текста на одном языке в текст на другом: грамматика в традиционном понимании в них отсутствовала полностью. Позднее стали разрабатываться

более сложные системы, включающие грамматику, семан­тику и даже экстралингвистическую (фоновую) информа­цию35.

Об основных типах систем машинного перевода мы по­говорим позже, а сейчас давайте посмотрим, на каких принципах основывается работа переводящего автомата.

Как вам уже известно, язык можно представить в виде символьного кода, с помощью которого записываются мыслительные представления о вещах реального мира (концепты).

Мы уже говорили раньше также и о том, что, например, концепт дерева соответствует в русском языке цепочке символов ДЕРЕВО, а в английском последовательности символов TREE.

Тогда, очевидно, можно сказать, что разные цепочки символов, т.е. слова разных языков (например, ДЕРЕВО и TREE), соответствуют одному и тому же концепту (напри­мер, концепту дерева).

В таком случае, если слово одного языка, А, равно кон­цепту, С, и слово другого языка, В, тоже равно этому кон­цепту, С, то по принципу транзитивности, если А=С и В=С, то А=В.

Иными словами, элементы разных языков можно при­равнять на основе их соответствия одному и тому же значению.

На этом принципе и основана работа переводящего автомата - слова разных языков приравниваются друг другу на основе общности значения.

Для создания переводящего автомата соответствия ме­жду словами разных языков закладываются в программу компьютера, и задача такого примитивного автомата дос­таточно проста - для поступающих на вход слов одного

языка он находит соответствие в другом языке и так слово за словом переводит текст.

Однако, как вам тоже должно быть известно, общее значение в разных языках могут иметь не только отдель­ные слова, но и словосочетания, поэтому простейший пе­реводящий автомат ищет соответствия не только для от­дельных слов, но и для словосочетаний, выполняя так на­зываемый пословно-пооборотный перевод.

Кроме того, соответствие слов разных языков друг дру­гу не является однозначным, т.е. одному слову языка А может соответствовать несколько слов языка В и наобо­рот. Следовательно, в переводящем автомате необходимо предусмотреть программу выбора правильного эквивален­та.

Такие программы обычно основываются на двух прин­ципах:

1. На принципе выбора эквивалента по синтаксической модели входного текста, чаще всего по синтаксической модели предложения. Таким образом, например, авто­мат может различить эквиваленты глагола "to book" и существительного "book" (соответственно, "резервиро­вать" и "книга").

2. На принципе выбора эквивалента по семантической мо­дели. По разным семантическим моделям автомат, на­пример, может различать такие эквиваленты слова "solution" как "решение" и "раствор". Обе модели обычно применяют в комплексе. И сами модели, и процедуры выбора эквивалентов довольно сложны. Мы кратко и в общих чертах рассмотрим их ни­же.

В некоторых более сложных системах в дополнение к этим двум принципам выбора эквивалента применяют также и принцип выбора на основе внелингвистической (фоновой) информации. Модели для выбора эквивален­тов, работающие по этому принципу, еще сложнее: их от­носят к разряду моделей искусственного интеллекта.

В зависимости от сложности выбора правильного зна-

чения слов и, соответственно, правильного переводного эквивалента модели и системы машинного перевода мож­но разделить на три уровня.

К первому, низшему уровню относятся простейшие модели пословно-пооборотного перевода, в которых вы­бор эквивалентов не производится и на выход системы перевода поступают все переводные эквиваленты, имею­щиеся в словаре.

Системы второго уровня, к которым относятся почти все так называемые "электронные переводчики", имею­щиеся на современном рынке программного обеспечения, используют ту или иную комбинацию синтаксических и семантических моделей для выбора правильного эквива­лента и преобразования структуры входного текста в структуру текста перевода.

Наконец, модели третьего уровня в дополнение к грамматике и семантике применяют для синтеза текста перевода также и фоновые знания. Надо сказать, что мо­дели и системы этого уровня до сих пор находятся на ста­дии эксперимента.

Для того чтобы яснее представить себе возможности систем разного уровня и качество перевода, которое вы можете получить с их помощью, давайте проведем анало­гию между действиями автомата и человека.

Системы низшего уровня можно сравнить с челове­ком, который, пользуясь словарем и таблицей словоизме­нения (списком правил и форм спряжения и склонения), переводит текст на совершенно незнакомом ему языке,

Система действует так же, как действуем в этом случае мы. Берет первое слово, смотрит, есть ли оно в словаре в таком виде. Если есть, выписывает все его переводы, если нет, то ищет в таблице словоизменения форму слова, об­наруженную в тексте, определяет соответствующую сло­варную форму и выписывает все переводы. Затем берет следующее слово и т.д.


Перейти на страницу:
Изменить размер шрифта: