Письменный перевод
Не привязан к какой-либо из моделей - выбор собственно перевода или интерпретации смысла зависит от жанра переводимого текста и совпадения речевой оформленности смысла. Не направлен на конкретного пользователя. При письменном переводе учитываются все факторы, определяющие выбор эквивалента.
Ну вот, теперь мы знаем или нам кажется, что знаем, как переводит человек. Самое время посмотреть, как это делает автомат. Этому и посвящена следующая глава.
Автоматический перевод, или Когда же неутомимый железный конь придет на смену слабосильной
переводческой лошадке?
Заменит ли переводчика переводящий автомат? Как работает "электронный переводчик"? В чем различие между "электронным" и "живым" переводчиком? Как может помочь переводчику-профессионалу переводящий автомат?
На вопрос, вынесенный в заголовок этой главы, можно с полным основанием ответить: "Не скоро. Не скоро переводящий автомат заменит переводчика. Если вообще заменит". Пока что даже самый совершенный автомат пере-
водчика заменить не может. Ведь речь идет о творчестве, а в том, что перевод - занятие творческое, думаю, никого из читателей убеждать не надо.
Другое дело, что переводящий автомат сможет действительно помочь в рутинной переводческой работе. Его можно использовать для перевода списков, таблиц и тому подобных грамматически не связанных текстов, которые переводить надо, хотя и ужасно неинтересно.
Кроме того, "электронный переводчик" может оказаться полезным специалисту в какой-либо области, который язык знает недостаточно хорошо, но тем не менее переводит тексты в своей области. Правда, здесь есть высокая вероятность того, что переводящий автомат тоже "не очень силен" в этом языке, и к его подсказкам следует отнестись с большой осторожностью.
Огромное преимущество автомата, в том числе и переводящего, перед человеком заключается не в более высоком уровне решения задач, а в работоспособности - он не устает, не хочет спать, не просит есгь и не бастует.
В частности, по этой причине, я и решил рассказать об автоматическом переводе: о том, как он выполняется автоматом, и о том, стоит ли практическому переводчику использовать переводящий автомат в своей работе.
Идея автоматизации перевода возникла почти одновременно с компьютерами. Уже в 1949 г., через пять лет после запуска в эксплуатацию в США первого достаточно мощного компьютера, математик У.Вивер обратился к ученым с призывом использовать компьютер для перевода.
Идея Вивера была с энтузиазмом подхвачена многими математиками и лингвистами, и вскоре появились первые модели и системы автоматического, или, как принято говорить, машинного перевода.
Первые модели машинного перевода базировались на принципе перекодирования текста на одном языке в текст на другом: грамматика в традиционном понимании в них отсутствовала полностью. Позднее стали разрабатываться
более сложные системы, включающие грамматику, семантику и даже экстралингвистическую (фоновую) информацию35.
Об основных типах систем машинного перевода мы поговорим позже, а сейчас давайте посмотрим, на каких принципах основывается работа переводящего автомата.
Как вам уже известно, язык можно представить в виде символьного кода, с помощью которого записываются мыслительные представления о вещах реального мира (концепты).
Мы уже говорили раньше также и о том, что, например, концепт дерева соответствует в русском языке цепочке символов ДЕРЕВО, а в английском последовательности символов TREE.
Тогда, очевидно, можно сказать, что разные цепочки символов, т.е. слова разных языков (например, ДЕРЕВО и TREE), соответствуют одному и тому же концепту (например, концепту дерева).
В таком случае, если слово одного языка, А, равно концепту, С, и слово другого языка, В, тоже равно этому концепту, С, то по принципу транзитивности, если А=С и В=С, то А=В.
Иными словами, элементы разных языков можно приравнять на основе их соответствия одному и тому же значению.
На этом принципе и основана работа переводящего автомата - слова разных языков приравниваются друг другу на основе общности значения.
Для создания переводящего автомата соответствия между словами разных языков закладываются в программу компьютера, и задача такого примитивного автомата достаточно проста - для поступающих на вход слов одного
языка он находит соответствие в другом языке и так слово за словом переводит текст.
Однако, как вам тоже должно быть известно, общее значение в разных языках могут иметь не только отдельные слова, но и словосочетания, поэтому простейший переводящий автомат ищет соответствия не только для отдельных слов, но и для словосочетаний, выполняя так называемый пословно-пооборотный перевод.
Кроме того, соответствие слов разных языков друг другу не является однозначным, т.е. одному слову языка А может соответствовать несколько слов языка В и наоборот. Следовательно, в переводящем автомате необходимо предусмотреть программу выбора правильного эквивалента.
Такие программы обычно основываются на двух принципах:
1. На принципе выбора эквивалента по синтаксической модели входного текста, чаще всего по синтаксической модели предложения. Таким образом, например, автомат может различить эквиваленты глагола "to book" и существительного "book" (соответственно, "резервировать" и "книга").
2. На принципе выбора эквивалента по семантической модели. По разным семантическим моделям автомат, например, может различать такие эквиваленты слова "solution" как "решение" и "раствор". Обе модели обычно применяют в комплексе. И сами модели, и процедуры выбора эквивалентов довольно сложны. Мы кратко и в общих чертах рассмотрим их ниже.
В некоторых более сложных системах в дополнение к этим двум принципам выбора эквивалента применяют также и принцип выбора на основе внелингвистической (фоновой) информации. Модели для выбора эквивалентов, работающие по этому принципу, еще сложнее: их относят к разряду моделей искусственного интеллекта.
В зависимости от сложности выбора правильного зна-
чения слов и, соответственно, правильного переводного эквивалента модели и системы машинного перевода можно разделить на три уровня.
К первому, низшему уровню относятся простейшие модели пословно-пооборотного перевода, в которых выбор эквивалентов не производится и на выход системы перевода поступают все переводные эквиваленты, имеющиеся в словаре.
Системы второго уровня, к которым относятся почти все так называемые "электронные переводчики", имеющиеся на современном рынке программного обеспечения, используют ту или иную комбинацию синтаксических и семантических моделей для выбора правильного эквивалента и преобразования структуры входного текста в структуру текста перевода.
Наконец, модели третьего уровня в дополнение к грамматике и семантике применяют для синтеза текста перевода также и фоновые знания. Надо сказать, что модели и системы этого уровня до сих пор находятся на стадии эксперимента.
Для того чтобы яснее представить себе возможности систем разного уровня и качество перевода, которое вы можете получить с их помощью, давайте проведем аналогию между действиями автомата и человека.
Системы низшего уровня можно сравнить с человеком, который, пользуясь словарем и таблицей словоизменения (списком правил и форм спряжения и склонения), переводит текст на совершенно незнакомом ему языке,
Система действует так же, как действуем в этом случае мы. Берет первое слово, смотрит, есть ли оно в словаре в таком виде. Если есть, выписывает все его переводы, если нет, то ищет в таблице словоизменения форму слова, обнаруженную в тексте, определяет соответствующую словарную форму и выписывает все переводы. Затем берет следующее слово и т.д.