Переводчики и словари
Часто используемый термин «машинный перевод» только запутывает пользователей компьютеров, вызывая у них завышенные ожидания: стоит, якобы, ввести текст, запустить программу-переводчик - и тут же получится приемлемый текст на другом языке. Между тем, задача автоматического (или машинного) перевода с одного языка на другой , поставленная еще в 1946 году, к настоящему времени далеко еще не решена. Пользователю предлагаются программы, которые могут оказать серьезную помощь при переводе , осуществляемом человеком, но, естественно, он не может получить от них собственно «литературный» перевод.
Еще несколько лет назад программами-переводчиками можно было пользоваться только нервно сжав зубы (чтобы не расхохотаться), а результаты приходилось подвергать долгой правке. Можно привести массу забавных примеров из их «трудов» (чего стоят прогремевшие пару лет назад «гуртовщики мыши»), однако, как известно, закон Мура не дает прогрессу стоять на месте, и с увеличением быстродействия процессоров и ростом объема оперативной памяти постепенно повышается и качество машинного перевода.
Рынок предлагает пользователям два вида лингвистических программ (если не рассматривать широкий спектр обучающих продуктов) - программы перевода текстов с одного языка на другой и электронные словари.
«Электронные помощники» для переводчиков
Часто используемый термин «машинный перевод» только запутывает пользователей компьютеров, вызывая у них завышенные ожидания: стоит, якобы, ввести текст, запустить программу-переводчик - и тут же получится приемлемый текст на другом языке. Между тем, задача автоматического (или машинного) перевода с одного языка на другой, поставленная еще в 1946 году, к настоящему времени далеко еще не решена. Пользователю предлагаются программы, которые могут оказать серьезную помощь при переводе, осуществляемом человеком, но, естественно, он не может получить от них собственно «литературный» перевод. Качество таких программ определяется набором функциональных возможностей: задание различных шаблонов и выбор вариантов переводов, а также сервис работы со словарями.
Рассмотрим несколько наиболее известных программных продуктов, которые можно приобрести на российском рынке.
TRADOS. Многомодульная система компании TRADOS, эксклюзивный дистрибьютор - компания ПРОМТ. Это система автоматизации труда переводчиков, основанная на так называемой TM-технологии (Translation Memory). Основная идея TM-технологии заключается в том, что выполненные пользователями переводы сохраняются в базе знаний в виде исходного фрагмента текста и его перевода. Накопленные фрагменты текстов на двух языках могут быть использованы для последующих переводов документов сходной тематики. После начальной установки системы база данных пуста, а в процессе работы в нее заносятся те образцы перевода, которые считаются приемлемыми. Получается большое хранилище моделей переводов, создаваемое отдельным пользователем или их группой, выполняющей один проект (переводчики, сотрудники фирмы). Технология показала себя как очень эффективная и в настоящее время активно используется за рубежом в среде профессиональных переводчиков. Отметим, что данная система может оказаться полезной не только профессионалам, но и для организации работ в офисе любой компании, работающей с многоязычными документами. Рискну также высказать предположение, что на базе такой системы можно попытаться построить интересные учебные базы знаний.
PROMT XT. Линейка продуктов компании ПРОМТ, выпущенная в этом году, представляет собой серьезное продвижение на пути создания универсальных офисных средств для перевода текстов. Линейка содержит три основных продукта - PROMT XT Office, PROMT Internet XT и PROMT XT Standard, которые отличаются друг от друга набором функциональных возможностей. Эти электронные переводчики поддерживают три двусторонние языковые пары с русским языком (английский, немецкий и французский) и две односторонние пары (перевод на русский с итальянского и испанского).
PROMT XT - очень «серьезная» многофункциональная среда, позволяющая, при грамотной работе, получать хорошие результаты в обработке многоязычных документов самых различных форматов. Перечислим некоторые достижения компании ПРОМТ, наиболее полно реализованные в PROMT XT Office.
Прежде всего, хочется отметить большие возможности, предоставляемые лингвистическим редактором PROMT, позволяющим просматривать возможные варианты перевода, подключать различные словари, определять, какой именно перевод и из какого словаря был взят для данного слова или словосочетания.
В систему также включены развитые возможности работы со словарями, включая создание пользовательских словарей. Очень интересная и важная функция - определение «алгоритмов перевода», которые задают правила и шаблоны для перевода определенных конструкций языка.
Наиболее революционное новшество, предлагаемое пользователям компанией ПРОМТ - «ассоциированная память», технология, аналогичная описанной выше TM-технологии в системе TRADOS. Реализованный здесь механизм позволяет запоминать и использовать при последующих переводах конкретные и типовые фрагменты текстов, а также варианты их переводов. Доступ к созданию такой базы знаний предоставляет колоссальные возможности для пользователей, которым приходится постоянно обрабатывать большое количество тематически или структурно близких текстов.
Отметим, что компания ПРОМТ предлагает, на базе своего лингвистического процессора, не только корпоративные решения для крупных организаций, но и двусторонний англо-русский переводчик Pocket PROMT 3.0, разработанный для карманных компьютеров с операционной системой Windows CE.
СОКРАТ- набор программ компании «Арсеналъ». В эту линейку продуктов входят системы перевода общего назначения «СОКРАТ Персональный 4.1» и «СОКРАТ Профессиональный», а также «СОКРАТ Интернет 3.0», предназначенный для перевода интернет-страниц.
Эти электронные переводчики предназначены, в первую очередь, для массового пользования. Программы имеют простой пользовательский интерфейс, ориентированный на однозначный вариант выдачи перевода исходного текста, и хорошо встраиваются в офисные приложения. Такие программные продукты удобно использовать, если пользователю нет необходимости добиваться «литературного» перевода текста, а просто нужно в оперативном режиме просмотреть текст, чтобы понять его смысл.
Компания «Арсеналъ» предлагает более десятка специализированных словарей для своих программ-переводчиков и англо-русскую систему перевода «СОКРАТ СЕ 2.1», разработанную специально для карманных компьютеров.
Электронные словари
Без словарей жить трудно. Огромному количеству людей в ходе своей профессиональной деятельности приходиться искать толкование или перевод различных иностранных слов. Электронные словари, снабженные удобной системой поиска, призваны облегчить труд как профессиональных переводчиков, так и школьников или студентов. Естественно, что пользователь хочет получать правильный перевод или толкование слова и иметь словари с большим словарным запасом, обогащенные современной лексикой.
Качество словарей, многоязычных или толковых, определяется профессионализмом их создателей. На создание словаря уходят многие годы труда лингвистов и профессиональных переводчиков. Поэтому в словарном деле большое значение имеют сохранение авторского текста и охрана авторских прав создателей словарей. Покупая словарь, вы должны быть уверены, что его содержание соответствует научным достижениям как в конкретных областях знаний, так и собственно в сфере лексикографии. В силу этих причин, главным фактором оценки предлагаемых на рынке электронных словарей следует считать качество, которое определяется, в свою очередь, авторством первоисточников, от которых происходят электронные версии словарей.
Созданием электронных словарей занимаются, в основном, фирмы-разработчики программного обеспечения. Программисты отвечают за то, чтобы создать грамотную систему индексации, которая ложится в основу системы поиска нужных пользователю слов, и предоставить удобный интерфейс. А вот само содержание словарей фирмам-разработчикам приходиться заимствовать у больших издательств, или же «сочинять» что-то свое. Этим и определяются не очевидные для рядового пользователя основные критерии качества электронных словарей.
Сейчас мы кратко опишем, на основе личных впечатлений и информации, помещенной на сайтах производителей, наиболее популярные многоязычные системы словарей, претендующие на роль продуктов для профессионального пользования. За рамками нашего краткого обзора осталось множество двуязычных обучающих изданий.
Multilex(«МультиЛекс») - продукт компании «МедиаЛингва».
Недавно было объявлено о выходе Multilex 4.0. Словари «МультиЛекс» стремятся сохранить авторство создателей их бумажных первоисточников. В качестве таковых источников, как правило, выступают словари, выпущенные в крупных издательствах некоторое количество лет назад. В «МультиЛексе» объединены два независимых взаимодополняющих словаря, образующие языковую пару. Его интерфейс содержит весьма широкий спектр настроек, очень удобен для восприятия предоставляемой информации (различные формы слов, варианты переводов, ударения, примеры использования). Особенно подкупает та деталь, что на основе базовых словарей доступен широкий спектр омонимов к искомому слову. Например, на запросы по русским словам «мыть» и «мыло» вы получите по десятку английских вариантов для каждого слова, сопровожденных описанием контекстов и ситуаций их использования. Словари «МультиЛекс» будут особенно незаменимы для учащихся самого разного возраста.
Polyglossum - продукт издательства ЭТС - «Электронные и традиционные словари». Сейчас предлагается новая версия - Polyglossum 3.2. Главной особенностью этих электронных словарей является то, что они выпускаются профессиональным словарным издательством, которое готовит и издает также большое количество бумажных словарей. Поэтому словари Polyglossum являются авторскими и «лицензионно чистыми». В издательстве словари сначала готовятся, совместно с автором, в электронном виде, а бумажный вариант создается по материалам электронного и часто выходит уже после электронного издания. Поэтому пользователям электронных словарей оперативно предоставляется наиболее современный словарный запас. Издательство ЭТС, по-видимому, является владельцем наиболее крупных в России электронных словарных баз данных.
Словари Polyglossum обладают самой простой (даже слишком аскетичной) и быстро работающей оболочкой. Причем скорость работы определяется не только простотой интерфейса, но также и хорошо продуманной оригинальной системой индексации словарных баз данных. К сожалению, в издательстве мало заботятся о комфорте молодых российских пользователей, любящих красивые интерфейсы, и ориентированы, в основном, на профессиональных западных покупателей.
«Контекст» - продукт компании «Информатик». В настоящее время продается версия «Контекст 4.0». Эта программа предоставляет относительно большой набор специализированных авторских словарей. Программная оболочка «Контекста» достаточно проста, но имеет одно ярко выраженное преимущество. После ввода слова сразу осуществляется его морфологический анализ. Такой «интеллект» программы позволяет ввести для поиска в словаре слово в любом падеже или склонении. Программа определит его основу, найдет нормальную форму и уже по ней - словарную статью.
Lingvo - продукт компании ABBYY [Software House]. Недавно выпущена новая версия Lingvo 8.0. Характерной особенностью словарей Lingvo, отличающей их от остальных издательств, является отсутствие четко выраженного авторства главных базовых словарей. На сайте компании на многих словарях стоит копирайт самой ABBYY. Учитывая, что на создание словарей у специалистов уходят многие годы, что превышает время существования самой компании, можно высказать существенные сомнения по поводу качества подобных изданий. Эти сомнения подтверждаются и сравнением объема. Например, на сайте издательства ЭТС заявлено, что их большой политехнический словарь имеет 1 миллион 200 тысяч индексируемых терминов, в то время как аналогичный словарь, представленный в Lingvo, использует, как следует из списка словарей на сайте компании, лишь 200 тысяч статей - для прямой и 125 тысяч статей - для обратной индексации.
Lingvo имеет относительно простой, но, на мой взгляд, не вполне удачный интерфейс. Разделенные окна и расположенная в нижней части формы строка ввода создают эффект «метания взгляда» по экрану и заставляют излишне напрягать зрение. Но, тем не менее, Lingvo пока остается наиболее популярным у студентов и начинающих пользователей словарем: это обусловлено, в первую очередь, его максимальной доступностью на «развалах» и в киосках.
Замечательно, что нам есть что выбрать на рынке по своему личному вкусу и для индивидуальных целей использования: от игрушки до серьезных профессиональных словарных баз данных. Лидеры здесь мне представляются очевидными: «МультиЛекс» - для общеобразовательных целей и Polyglossum - для задач переводчиков и для иной профессиональной деятельности такого рода.