Системы МП становятся все совершеннее, но тем не менее практически всегда требуется последующая обработка (редактирование if you will) полученного перевода.

В моем тексте (скажу сразу он был довольно большой ок. 100 стр.) много раз встречалось английское словосочетание Inner Mongolian, которое было переведено как Внутренняя Монгольская, Внутренние Монгольские и т.п. вместо внутреннемонгольская, внутреннемонгольские и т.д.

Каким образом можно все это исправить не затрачивая часы своего драгоценного времени?

Ответ один — регулярные выражения (Regular Expressions), известные в Ворде как подстановочные знаки.

Вот какое подстановочное выражение я использовал, чтобы заменить все возможные неверные словоформы на верные.

Найти: ([Вв]нутренн)[а-яё]@> [Мм](онгольск)

Заменить на: \1ем\2

Комментарий: [Вв] — ищем либо заглавную, либо прописную букву “в”

нутренн — ищем именно такую последовательность. Если нужно найти слова полностью набранные заглавными буквами пишем [Нн][Уу][Тт][Рр][Ее][Нн][Нн]

Скобки означают, что часть внутри скобок остается в неизменном виде и на нее имеется ссылка в поле заменить в виде \{цифра}, т.е. \1 означает, что на этом месте воспроизводится та часть поля Найти, кторая заключена в первые скобки. \2 — во вторые скобки.

[а-яё]@> — при помощи последовательности [а-яё] мы ищем любую букву алфавита, а @ говорит компьютеру, что искомых символов может быть 1 или больше 1.

> — конец слова. Таким образом, мы говорим, что нам нужно найти любое кол-во букв алфавита в любой последовательности после предыдущей части, т.е. “Внутренн” или “внутренн”. Итак мы можем найти такие словоформы как Внутренняя, внутреннии, внутреннего и т.д. и т.п.

Затем идет пробел, не забывайте про него.

Во втором слове все уже наверно и так понятно. Суффикс -ск нужно обязательно включить, чтобы отсечь существительное Монголия.

Вот так мы сэкономили наше время и получили нужный результат (200 слов!) за пару секунд. А ручная замена могла бы отнять по меньшей мере 1200 сек., если на одно слово нужно в среднем 6 сек. Выходит что мы потратили бы целых 20 мин., на самом деле времени будет потрачено больше, прибавьте еще сюда психическую усталость от выполнения однообразной механической работы.

Мой вам совет, друзья, изучайте регулярные выражения. А ведь текст мог быть больше, например 100 стр. ))