Рекомендации по подготовке исходного текста для перевода.

Разумеется, повышение качества машинного перевода — это в первую очередь задача его разработчиков. Однако и пользователь, со своей стороны, тоже может приложить некоторые усилия для достижения приемлемого результата — в первую очередь потому, что качество машинного перевода непосредственно зависит от качества поставляемого пользователем исходного текста.

Приведенные ниже рекомендации, конечно, не решат всех проблем машинного перевода, но помогут отвоевать несколько очков в противостоянии компьютера и естественного языка.

  1. Избегайте опечаток и орфографических ошибок! Машинный переводчик не умеет исправлять ошибки и распознавать неправильно написанные слова (здесь могут оказаться полезными специальные программы проверки орфографии).
  2. Помните про знаки препинания! Пропущенный или, наоборот, избыточный знак препинания может помешать электронному переводчику правильно понять синтаксическую структуру предложения. Знаки конца параграфа (¶) автоматически удаляются программой и строки склеиваются в одну. Поэтому обязательно ставьте точку (.) в конце предложений.
  3. Правильно расставляйте знаки диакритики! Замечание: как правило, электронный переводчик не воспринимает слова с русской буквой ё, а также слова с ударениями.
  4. Соблюдайте регистр букв! Маленькая буква в слове вполне может стать большой (например, в начале предложения, в заголовке), и это учитывается при разработке систем МП. Большая же буква, напротив, маленькой становится редко, причем в большинстве случаев это связано с образованием нового слова, например, при переходе собственного имени в разряд имен нарицательных — плюшкин, тартюф, ксерокс...). Если Интернет принято писать с большой буквы, то нет смысла сетовать (как это делает один авторов сообщений в гостевой книге сервера www.translate.ru) на то, что "в вашем словаре даже слово интернет отсутствует". К тому же, существуют языки, где первая большая буква в слове принципиально меняет принадлежность этого слова к той или иной части речи. Примером является, безусловно, немецкий язык, в котором существительные пишутся с большой буквы как в начале, так и в середине предложения. Сравните переводы: "wie funktioniert das ?bersetzen mit dem "clipboard"?" - "как это функционирует переводят с "clipboard"?" Или "Wie funktioniert das ?bersetzen mit dem "clipboard"?" - "Как функционирует перевод с "clipboard"?
  5. Старайтесь использовать простые синтаксические конструкции с прямым порядком слов. Например, на первом месте должно идти подлежащее или его группа (я, ты, он, мой кот, мой начальник, сын моей подруги). На втором месте сказуемое, выраженное глаголом (хочу, знаю, люблю). Дальше идут обстоятельства, выраженные разными частями речи. Существует целый ряд рекомендаций, как сделать текст на естественном языке более "удобоваримым" для машины: http://alemeln.narod.ru/progper2.html http://www.innovativeeducation.com/lhs/tips.asp
  6. Старайтесь избегать пропуска служебных слов (даже если это разрешено грамматикой). Приведем один пример. Английское предложение: "Your e-mail address is the address other people use to send e-mail messages to you" переведем на русский язык и получим не совсем понятный текст: "Ваш адрес электронной почты — адрес другое использование людей, чтобы послать почтовые сообщения Вам." Теперь восстановим одно-единственное пропущенное слово — союз that: "Your e-mail address is the address that other people use to send e-mail messages to you" — и получим вполне корректный вариант: "Ваш адрес электронной почты — адрес, который другие люди используют, чтобы послать почтовые сообщения Вам."
  7. Используйте только общепринятые сокращения! Неправильный перевод сокращения — это только половина проблемы. Дело в том, что даже одно непереведенное слово может помещать электронному переводчику правильно проанализировать синтаксическую структуру предложения (а аббревиатуры участвуют в синтаксических связях наряду с обычными словами). Неприятные последствия может иметь тот факт, что некоторые аббревиатуры совпадают по написанию с часто используемыми словами. Например, ПО (программное обеспечение) пишется так же, как русский предлог по (регистр букв в данном случае не играет роли, так как ничто не запрещает нам написать предлог по большими буквами, например, в составе заголовка). Поэтому, увы, вполне закономерно выглядит перевод фразы "Я часто использую это ПО" как "I frequently use it ON." С другой стороны, если не полениться и написать "Я часто использую это программное обеспечение" мы получим в переводе "I frequently use this software."
  8. Избегайте жаргонных выражений! Речь идет, разумеется, не о жаргоне представителей криминального мира (хотя можно предположить, что пользователи систем МП есть и среди них). Законопослушные носители языка тоже нередко используют в ходе неформального общения некоторые слова, выражения и конструкции, которые не согласуются с литературной нормой ("Люди, решите траблу! Не могу зарегить мыло!" ). Одна сторона проблемы состоит в том, что такого рода слова появляются в речи быстрее, чем их успевают фиксировать словари. Другая сторона — в том, что не всегда целесообразно добавлять неологизмы в словарь — как в случае со словом мыло, которое для большинства пользователей систем МП все-таки связано с обозначением хозяйственного продукта.