Агентство переводов «ЛИНГВАКОНТАКТ»
+7 921 967-94-88
+7 812 967-94-88
Почему переводчики любят «кошек»
Почему переводчики любят «кошек»
Если вам понадобился перевод, то вы, естественно, захотите найти лучшего специалиста, который переведет вашу брошюру, сайт или сертификат, или другой необходимый документ. Так что вы начинаете искать кандидатов в Интернете, но в какой-то момент понимаете, что совсем потерялись среди таинственных и почти враждебных аббревиатур, которыми так часто пользуются переводчики и переводческие компании: XTRF, CAT, TM, CPD, QA (ну хорошо, последнее сокращение вы наверняка знаете, так как оно используется и в других сферах). Если вы уже какое-то время читаете наш блог, то вы, наверное, помните, что мы решили написать серию статей, объясняющих некоторые аббревиатуры, используемые переводчиками и переводческими компаниями. XTRF – это первое сокращение, о котором мы написали (статью можно найти здесь) и получили очень хорошие отзывы от некоторых из наших клиентов. А вот и вторая статья из этой серии.
Какие бывают cat-tools? Сравнение Across и Pairaphrase от PTSD — Дневник переводчика
CAT-средства
САТ – это аббревиатура, означающая «система автоматизированного перевода». Обычно, если человек слышит этот термин впервые, то первая ассоциация, которая приходит на ум, — это программы машинного перевода, такие как Google Translate. Но CAT-средства не имеют ничего общего с машинным переводом.
В чем разница между системами автоматизированного перевода и машинным переводом?
Практически с момента изобретения компьютера многие лелеяли идею обучить компьютеры делать переводы. Именно так и появился машинный перевод . Первые программы перевода были разработаны на основе двуязычных словарей и запрограммированных правил синтаксиса.
Но оптимизм по поводу того, что машинный перевод скоро заменит человеческий, быстро сошел на нет, потому что результаты машинного перевода трудно было назвать превосходными. Что там говорить: их и хорошими очень трудно было назвать. С тех пор были разработаны и другие решения и технологии, но результаты машинного перевода все еще далеки от совершенства.
Эти технологии могут пригодиться, если вам нужно понять общий смысл текста на другом языке. Однако нельзя полагаться на них, если вам нужен точный, грамматически и стилистически верный перевод.
Кроме того, использование Google Translate (и других подобных онлайн-программ) для перевода конфиденциальных документов ведет к нарушению конфиденциальности, ведь Google имеет право использовать ваш контент в своих целях. Это право закреплено в Положениях и условиях использования сервисов Google. Профессиональные лингвисты знают об этом. Они не используют Google Translate и другие подобные программы из-за низкого качества перевода и проблем с сохранением конфиденциальности данных.
Основы CAT: Вводный урок
Системы автоматизированного перевода – совершенно другое дело. Да, это тоже программы, но весь процесс перевода полностью контролируется человеком. Перевод по-прежнему выполняют профессионалы. А CAT-средства (или «кошки», как их в шутку называют переводчики) используются, чтобы сделать процесс перевода более эффективным, а также для улучшения качества работы переводчика.
Эти программы помогают переводчику работать с файлами различных форматов и достичь единообразия при переводе повторяющихся терминов. Так что, хоть термин «автоматизированный перевод» и звучит очень похоже на «машинный перевод», на самом деле это совершенно другая технология. Здесь стоит подчеркнуть, что не все переводчики пользуются CAT-средствами в работе, но популярность «кошек» быстро растет.
Какие CAT-средства наиболее популярны среди переводчиков?
Примерно год назад портал ProZ.com проводил исследование о CAT-средствах, используемых переводчиками. И вот результаты:
Другие популярные программы — Déjà vu, Across, SDLX, Star Transit и OmegaT (http://prozcomblog.com/2013/03/28/cat-tool-use-by-translators-what-are-they-using/ оригинал статьи)
Существуют и облачные CAT-программы , такие как Memsource, Wordfast Anywhere, XTM Cloud, Transifex и некоторые другие. Их популярность среди переводчиков возрастает все больше, потому что благодаря этим программам можно делать переводы, находясь в дороге. Кроме того, у них нет проблем с конфиденциальностью, как у Google Translate
Какими же CAT-средствами пользуемся мы?
Ответ прост: наши переводчики работают с теми программами, которые они хорошо знают. Таким образом, наше сотрудничество получается наиболее приятным и плодотворным, а наши заказчики рады превосходному результату!
Если у вас возникли вопросы об используемых нами программах, или о чем-либо другом, что имеет отношение к переводу и локализации, свяжитесь с нами! Мы всегда рады помочь!
Источник: linguacontact.com
ЧТО ТАКОЕ «CAT» И ЗАЧЕМ ЭТО НУЖНО
Любой начинающий (и не очень) переводчик, который старается на регулярной основе работать с крупными локализационными компаниями, рано или поздно сталкивается с аббревиатурой CAT.
Что же это такое и зачем нужно?
Аббревиатура САТ расшифровывается как Computer-Aided Translation — дословно «перевод с помощью компьютера». На русском чаще используют термин «автоматизированный перевод». Не стоит бояться слова «автоматизированный» — к машинному переводу, выполненному программами вроде Promt, печально известному своим ужасным качеством, оно не имеет отношения.
Чем компьютер может помочь переводчику? Есть три основных преимущества, которые использование инструментов САТ дает и отдельным переводчикам, и бюро переводов.
Экономия времени
Главное из них — экономия времени. В наиболее распространенных CAT-приложениях имеются встроенные утилиты, значительно облегчающие перевод.
В их числе — абсолютно незаменимые TM (Translation Memory; память переводов) — базы данных, в которых хранятся выполненные ранее переводы. Для удобства они вынесены в рабочую область приложения. Поиск по ТМ не только показывает перевод того или иного термина в предыдущих проектах, но и дает ссылку на то, когда и кем был предложен вариант перевода.
Для работы над проектами, в которых требуется строго следовать утвержденной заказчиком терминологии, используются глоссарии (терминологические словари), также встроенные в CAT в виде утилиты.
Помимо терминологической сверки с существующими переводами ТМ автоматически подставляет в текст повторяющиеся фрагменты, которые встречались в предыдущих проектах и занесены в базу. При этом окончательное решение о возможности использования готового перевода в каждом конкретном случае принимает человек: бывает, что контекст полностью меняется, и перевод, на 99% совпадающий с предыдущим вариантом, теряет смысловую адекватность.
Благодаря этой функции упрощается работа с крупными проектами — менеджеры, занятые организацией процесса, получают возможность точнее оценить объем предстоящей работы и реальные сроки ее выполнения и, как следствие, распределить файлы среди нескольких переводчиков и редакторов.
Повышение качества
Второе важное преимущество CAT — возможность значительно повысить качество переводов. Время, сэкономленное благодаря утилитам, можно использовать для дополнительной шлифовки текста. Снимая с переводчика часть рутинной работы, САТ позволяет сосредоточить усилия на «распутывании» особенно трудных мест и поиске наиболее элегантных решений перевода, включая игру слов.
Применение CAT принципиально облегчает работу над унификацией имен собственных и терминологии. Это означает, что доктор Ватсон из одного рассказа шерлокианы не превратится в другом в доктора Уотсона, а один и тот же термин не будет переведен по-разному в начале, середине и конце текста. Это особенно важно для объемных проектов, над которыми работает несколько переводчиков, у каждого из которых собственные представления о прекрасном.
Опора на глоссарий и базу данных ТМ — при условии, что переводчикам дана инструкция строго им следовать, — гарантированно повысит общее качество перевода, в том числе и потому, что редактор сможет уделить больше внимания стилистической отделке текста — техническую работу по проверке единообразия использованных терминов и имен собственных за него выполнит САТ.
Экономическая целесообразность
Повышение качества перевода в сочетании с сокращением времени на его выполнение экономически выгодно. С инструментами CAT вы будете переводить быстрее, а значит, сможете взять больше заказов. Автоподстановка фрагментов текста из ТМ исключает двойную оплату за одну и ту же работу. В отдельных случаях, когда в исходном тексте часто повторяются одни и те же формулировки, это дает весьма существенный экономический эффект.
Повышая качество готового перевода, вы повышаете и его рыночную стоимость, следовательно, сможете продать его заказчику дороже.
В конечном счете использование автоматизированных средств перевода позволит вам сдавать работу безупречного качества в рекордно короткие сроки, постоянно повышая свою профессиональную репутацию.
САТ поможет вам реализовать формулу успеха: Качество + Скорость работы = Отличная репутация.
Источник: www.logrusit.com
CAT-инструменты: новые технологии на службе переводчика
В современном мире переводчики почти ушли от рукописного перевода и повсеместно используют системы автоматизации (Computer-Assisted Translation tools, в народе просто «кошки»). Всё чаще работодатели хотят видеть переводчика, владеющего навыками работы с CAT-инструментами, что делает их еще более популярными и необходимыми для дальнейшей работы.
«Перевод с помощью компьютера» или «автоматизированный перевод» не следует отождествлять с машинным переводом, когда вы вводите текст на одном языке, нажимаете кнопку и получаете его перевод: автоматизированный перевод – более широкое понятие.
CAT-инструменты включают в себя различные лингвистические ресурсы, например: базы Translation Memory – базы памяти переводов, которые содержат ранее переведенные сегменты текста (словосочетания и предложения). Они создаются и пополняются на основе пар параллельных текстов. Другой важный ресурс – глоссарии, которые содержат термины и понятия, принятые в той или иной компании (либо утвержденные для определенной группы проектов).
Большинство CAT-инструментов являются настольными программами, то есть устанавливаются на один компьютер, и воспользоваться программой можно только на нём. Если вы захотите переводить на другом компьютере – нужна отдельная лицензия или еще какие-нибудь ухищрения.
Беспрекословный лидер среди программ автоматизированного перевода – SDL Trados. Также известными и распространенными настольными версиями являются: STAR Transit NXT, Deja Vu X, MemoQ. Далее приводится краткое описание данных программ.
Trados – система автоматизированного перевода, первоначально (с 1992 года) разработанная немецкой компанией Trados GmbH. Является одним из мировых лидеров в классе систем Translation Memory.
Transit NXT – программа для создания, просмотра и редактирования проектов для переводов и других связанных с переводом и локализаций операций, выпускается компанией STAR AG с 2008 года. На данный момент существует только версия для платформы Windows.
Déjà Vu / Дежа Вю – проприетарная система испанской компании Atril Language Engineering. Существуют различные версии для переводчиковфрилансеров и переводческих отделов и агентств.
Программа MemoQ была разработана в Венгрии еще в 2005 году и с тех пор постоянно обновляется. Сегодня это один из самых популярных продуктов на рынке систем (сред) автоматизированного перевода.
В мире развитых интернет-технологий и возможности удаленной работы получили широкое распространение online-версии CAT-программ. Есть несколько критериев для выбора программы: работа с различными форматами (конвертация и поддержка другими сервисами), добавление и редактирование существующих баз перевода, сохранение форматирования документов и одновременная работа нескольких переводчиков над одним проектом, например, SmartCAT, Memsource, Wordfast, MateCAT.
SmartCAT – система автоматизированного перевода, включающая память переводов, машинный перевод, управление глоссариями, функцию совместной работы переводчиков над одним документом. Система является «облачным» сервисом и не может быть установлена на компьютер. Работа с SmartCAT проводится при помощи браузера, ожидается разработка мобильного приложения. Пользовательский интерфейс доступен на русском, английском и японском языках; документация – на русском и английском.
Memsource Cloud – это полноценная переводческая среда, которая включает память переводов, а также встроенные функции машинного и ручного перевода, управления терминологией и переводческий редактор для работы в режиме онлайн и в автономном режиме.
Wordfast изначально был разработан Ивом Шамполионом (Yves Champollion) в 1999 как дешевая, простая альтернатива Trados. Wordfast Anywhere – это бесплатная веб-платформа Wordfast с пользовательским интерфейсом, повторяющим Wordfast Classic. Она запущена в мае 2010 года. MateCat был выпущен как программное обеспечение с открытым исходным кодом под Lesser General Public License (LGPL) от Free Software Foundation. Это относительно новый сервис, позволяющий переводчикамфрилансерам и студентам работать в браузере со многими форматами.
При таком разнообразии каждый переводчик выбирает для себя «кошку» по своему вкусу, исходя из конкретных задач, уже существующих навыков и средств на покупку программы. При этом бесспорным остается тот факт, что знание средств CAT-tools на сегодняшний день является не просто еще одним дополнительным требованием переводческих фирм это ключевой аспект выживания переводчиков на конкурентном рынке труда.
Источник: idaten.ru
В помощь переводчику: 10 советов по OmegaT
Фраза «перевод с помощью компьютера» у многих прочно ассоциируется с машинным переводом. Google Translate — это именно машинный перевод, компьютер переводит за вас, вы только должны подавать ему исходный текст.
CAT (Computer Aided Translation — «перевод с помощью компьютера») — подход к переводу, когда компьютер только помогает в работе, автоматизируя рутинные процессы. CAT-программы разделяют исходный текст на сегменты — строки, предложения, параграфы или абзацы. Человек переводит сегмент один за другим, а перевод сохраняется в специальную базу данных — память перевода (translation memory, TM). Если переводчику встретится похожий сегмент, программа покажет подсказку или возможный перевод. А одинаковые сегменты программа может переводить сама.
Особенно хорошо CAT помогает в переводе инструкций, юридических документов, интерфейсов программ — там, где похожие формулировки встречаются очень часто. В художественном переводе помощь будет не так очевидна, но об этом позже.
Чем больше текстов по схожей тематике вы переводите, тем больше накапливается переводов в базе данных, чаще появляются подсказки. За годы может накопиться такая база, что в новом документе половина перевода будет готова «сама по себе».
Когда перевод закончен, программа создаёт документ, идентичный оригиналу — сохраняя структуру и форматирование, но заменяя исходный текст на ваш перевод.
CAT-программы не изменяют исходный документ, поэтому необратимо испортить документ невозможно. На выходе будет полностью переведённый файл.
Какие бывают CAT-программы?
Разные. Trados, MemoQ — дорогие корпоративные комплексы, устанавливаются на компьютер. CrowdIn, Tolmach и другие — работают прямо в браузере. Как правило, всё стоит денег, либо есть ограничения по объёму проектов.
Но не всё так плохо: я уже лет восемь пользуюсь OmegaT, бесплатной программой с открытым исходным кодом, которая работает на Windows, Mac и Linux-системах и постоянно совершенствуется сообществом. Работаю в ней с китайским, английским и русским языками.
Что умеет OmegaT?
OmegaT
www.omegat.org
Freeware (GPLv3), open source
Windows, macOS, Linux
Умеет всё, что описано в первой главе — помогать переводчику в работе, и разные другие мелочи.
Форматы файлов
Языки
Любые. Практически всё, что есть в Unicode.
Для редких языков может понадобиться корректировка правил сегментирования, но всё решается.
Я не буду пересказывать инструкцию. Она полная и содержательная, и ознакомиться с ней очень важно. Дальше будут лишь основные операции с программой, которые помогут начать работу.
Установка
Скачайте дистрибутив с сайта omegat.org. Я буду использовать англоязычную версию 4.1.1 ветки Latest для Windows. Для запуска требуется Java. Если не уверены, есть ли она у вас, качайте версию с пометкой JRE. Не пугайтесь надписи Beta, программа работает более чем стабильно.
Проверка правописания
После установки программа готова к работе, но по-умолчанию не хватает проверки орфографии.
- Запускаем OmegaT
- Переходим в Options -> Preferences -> Spellchecker
- Ставим галку Automatically check the spelling of text
- Нажимаем Install new dictionary
- Выбираем язык (например, ru_RU для русского), нажимаем Install
- Жмём Close. В списке видим русский язык.
- Выходим из настроек.
Как создать проект
OmegaT работает не с отдельными файлами, а с «проектами». Проект — набор папок с определённой структурой. Чтобы перевести файл, нужно создать проект, а потом добавить туда файл.
- Запускаем OmegaT
- Project -> New, выбираем место для сохранения и имя проекта. Я рекомендую давать проектам осмысленные имена и указывать в них языковую пару. Например, Test-Project_EN-RU.
- В появившемся окне укажите языковую пару
Source Files Language — язык, с которого вы переводите; Target Files Language — язык, на который вы переводите. Указывать нужно в двух- или четырёх-буквенном коде. Например, RU — русский язык, а RU-RU и RU-BY — уточнение, что это русский из РФ и русский из Белорусии. Чтобы работала проверка правописания, код должен совпадать с кодом, указанным в настройках орфографии (если в орфографии установлен RU-RU, а в проекте будет RU, то проверка работать не будет). - Ниже отметьте галочкиEnable Sentence-level Segmenting (делить сегменты по предложениям, а не по абзацам) и Auto-propagation of Translations (подставлять переводы автоматически). Галочку Remove Tags (убирать теги) лучше снять, я объясню её работу позже.
- Нажимаем ОК.
Что это за папки?
Внутри папки проекта есть несколько под-директорий:
- dictionary — можно добавить словари в формате StarDict; функция довольно бесполезная.
- glossary — база терминов по проекту, об этом позже;
- omegat — память перевода и резервные копии проекта;
- source — папка с иходными файлами;
- target — папка, в которой будут появляться переводы;
- tm — папка для дополнительных памятей перевода, об этом позже.
а так же файл omegat.project с конфигурацией текущего проекта.
Как добавить файлы
Создав проект, вы увидите такое окно:
Нажмите Copy Files to Source Folder и выберите файлы, которые вы хотите перевести.
Файлы будут скопированы в папку source только что созданного проекта. Вы можете добавить туда файлы вручную. Просто скопируйте файлы в source через проводник.
Для примера я создал два файла — Excel и Word, на которых я буду показывать работу OmegaT.
Интерфейс
OmegaT запущена, файлы добавлены. Давайте посмотрим, как они выглядят в программе.
Вот исходный документ в Word. Здесь видны заголовок, абзацы, форматирование (жирный шрифт, ссылки, подчёркивания).
А вот как он выглядит в OmegaT:
Обратите внимание: весь текст разделён на предложения, форматирования не видно, появились какие-то теги серого цвета, а заголовок заголовок дублируется. В чём дело?
Кроме того, в правой части программы есть ещё два сектора: Fuzzy Matches и Glossary (словарь проекта).
Fuzzy Matches (нечёткие совпадения) — результаты поиска по базе данных проекта. Там будут отображаться подсказки по переводу, основанные на ваших предыдущих переводах.
Glossary (словарь проекта) — результат поиска по глоссарию, который вы составляете самостоятельно. В отличие от памяти перевода, это не готовый текст, а лишь подсказки по определённым терминам. Это мощный инструмент, который помогает сохранять единообразие в терминологии.
Как переводить
- Дважды кликните на сегмент для перевода
Под оригинальным текстом появится редактируемая текстовая строка, курсор будет в её начале, а в строке будет продублирован оригинальный текст. - Впишите свой перевод
- Нажмите Enter
При нажатии перевод сохранится, а курсор перейдёт к следующему сегменту.
Повторяйте, пока не закончите документ. В любой момент можно вернуться к предыдущему сегменту, просто дважды щёлкнув на него.
В правом нижнем углу есть удобный индикатор прогресса. Кликните на него, чтобы переключить режим просмотра.
В этой строке указано, что в текущем файле переведено 5,8% уникальных сегментов, осталось перевести ещё 1382. А суммарно в проекте переведено 63% сегментов, осталось 1756, а их общее число в проекте — 5979.
Во втором режиме на иллюстрации сказано, что в файле из 1592 уникальных сегментов переведено 146, а в проекте из 4748 уникальных сегментов переведено 2992. Всего сегментов (включая повторы) — 5979.
Цифры 14/14 в конце не относятся к счётчику проекта. Это — индикатор длины сегмента с которым вы работаете. Он говорит, что в оригинале было 14 символов, и в переводе их тоже 14. Эта функция полезна в тех случаях, когда нужно строго соблюдать длину строки, например при переводе интерфейса программ.
Нечёткие совпадения Fuzzy Matches
Самый главный инструмент любого CAT-приложения, ради этого они и существуют.
Объясню на примере:
В документе-образце первое предложение очень похоже на четвёртое. Я шёл по порядку и перевёл первое предложение. Когда же я дошёл до четвёртого, программа сразу же показала нечёткое совпадение:
Посмотрите внимательно на панель совпадений:
В верхней части отображается текст на исходном языке, который был сохранён в памяти перевода. Синим цветом выделны слова, которые присутствуют в памяти перевода, но отсутствуют в текущем предложении (с которым сравнивается совпадение), зелёным — слова, расположенные рядом с недостающими частями.
Ниже будет перевод, сохранённый в памяти. Если нажать Ctrl+R, то он скопируется в поле для перевода.
Ещё ниже указаны три числа в процентах. Они означают степень совпадения между предложением и памятью перевода. Подробнее о механизме вычислений можно прочитать в справке к OmegaT.
Автоматический перевод одинаковых сегментов
Конечно, если механизм Fuzzy Match найдёт 100% совпадение, он может вставить его самостоятельно. Для примера возьмём ещё один файл, на этот раз в Excel. Примерно в таком виде нередко приходит заказ на перевод интерфейса какого-нибудь сайта или программы.
А вот как файл выглядит в OmegaT:
Обратите внимание, что в оригинале было шесть строчек See All. Программа убрала все дубликаты, оставив лишь одну строчку. Достаточно перевести её одну, и остальные сегменты тоже переведутся.
Глоссарий
Глоссарий работает очень просто. Сначала вы добавляете в него слова (оригинал и перевод). Теперь, когда слово встретится в тексте, в окошке Glossary сразу же отобразится подсказка.
Таким образом, когда в новом предложении появился какой-то термин, вы сразу будете знать, как именно следует его переводить. Например, если при переводе интерфейса программы всегда нужно писать «Хорошо» вместо «ОК», достаточно добавить в словарь слово «ОК» с переводом «Хорошо». Добавив несколько сотен слов в проект, вы значительно облегчите себе жизнь.
Чтобы добавить слово в глоссарий, выделите его, щёлкните правой кнопкой и выберите Add Glossary Entry.
Кроме того, слова можно добавить массово в файл glossaryglossary.txt в формате «оригинал табуляция перевод» (подойдёт таблица в Excel, сохранённая в формате tab-delimited *.csv)
Как сохранить
Пункт Project -> Save означает «сохранение проекта», т.е. запись всех переводов в файл базы данных. А чтобы получить готовый файл, нужно выбрать Project -> Create translated documents.
По этой команде OmegaT создаст новый файл в папке target с тем же именем, что и оригинал, а весь текст поменяет на перевод. Если какие-то сегменты вы не перевели, то в файле на их месте будет оригинальный текст.
Продолжение
В следующей части я расскажу о том, как подключить машинный перевод, проверить текст на ошибки, как создать свою ТМ и какие не очевидные проблемы могут возникнуть в работе с программой.
Источник: blog.wtigga.com