Программы автоматизированного перевода текста это

Профессиональная работа невозможна без надежных инструментов. Перевод и локализация как область профессиональной активности в этом смысле не являются исключением. Любой переводчик сталкивается с проблемой согласованного применения терминологического глоссария в ходе длительного проекта или быстрого повторного использования ранее переведенного текста. По своей природе подобные рутинные задачи сравнительно легко (в отличие от машинного перевода) формализуются и программируются, поэтому оснащение рабочего места локализатора автоматизированными средствами является нормой в отрасли, а некоторые из таких средств по существу представляют собой отраслевые стандарты.

Большинство таких средств построены на основе концепции памяти перевода (translation memory) — простой базы данных, каждая запись которой представляет собой единицу (предложение или абзац) параллельных текстов (как правило, на двух языках). Такая база данных хранит предыдущие переводы с целью их возможного повторного использования и решения задач быстрого поиска по содержимому. Несмотря на то, что программы, оснащенные памятью перевода, называются системами автоматизированного перевода (CAT, computer-aided/assisted translation), их не следует путать с программами машинного перевода (machine translation) — память перевода ничего не переводит сама по себе, в то время как машинный перевод основан на генерации переводов по результатам грамматического разбора исходного текста.

Елена Коканова. Предредактирование текстов для машинного перевода: плюсы, минусы, альтернативы

Как правило, запись памяти перевода состоит из двух сегментов: на исходном (source) и конечном (target) языках. Если идентичный (или похожий) сегмент на исходном языке встречается в тексте, сегмент на конечном языке будет найден в памяти перевода и предложен переводчику в качестве основы для нового перевода. Автоматически найденный текст может быть задействован как есть, отредактирован или полностью отвергнут. Большинство программ используют алгоритм нечеткого соответствия (fuzzy matching), существенно улучшающий их функциональные возможности, поскольку в этом случае можно находить предложения, лишь отдаленно напоминающие искомые фразы, но тем не менее пригодные для последующего редактирования.

Преимущества от использования такого программного обеспечения поначалу могут быть неочевидны — однако по мере наполнения базы данных результаты автоматической подстановки основ для перевода будут становится все более точными и регулярными.

Архитектура автоматизированной системы и ее функциональные возможности могут различаться. Средства поиска могут работать как с целыми сегментами, так и с отдельными словами или фразами, позволяя переводчику выполнять терминологический поиск. В систему также включают отдельную программу для работы с глоссарием, содержащим утвержденные для применения в проекте термины.

Некоторые системы работают с программами машинного перевода. Основной рабочий интерфейс либо встраивается непосредственно в имеющийся текстовый процессор, такой как Word, либо представляет собой отдельный редактор. В состав системы обязательно включают фильтры для импорта-экспорта файлов различных форматов. Кроме того, многие системы, если не все, имеют средство для добавления в память перевода сегментов из как правило имеющихся у переводчика старых переведенных файлов.

Перевод документов онлайн на 100 языков. Автоматический переводчик PDF/WORD/EXCEL/PPTX/InDesign

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

Источник: studopedia.ru

ОБЩАЯ ХАРАКТЕРИСТИКА ПРОГРАММ АВТОМАТИЗИРОВАННОГО И МАШИННОГО ПЕРЕВОДА Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Худинский Марк Викторович

в статье рассматривается роль компьютерных программ в переводческой деятельности. Целью исследования является анализ использования современных автоматизированных и машинных программ перевода в профессиональной деятельности переводчика. Дана оценка эффективности применения подобных программ и направление их дальнейшего развития.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Худинский Марк Викторович

О ДИНАМИКЕ РАЗВИТИЯ ОСНОВНЫХ КОНЦЕПЦИЙ АВТОМАТИЗИРОВАННОГО ПЕРЕВОДА
Машинные системы перевода: качество и возможности использования
Память переводов в обучении переводчиков
Использование информационных технологий для оптимизации процесса перевода

Проблемы трудоустройства выпускников кафедры лингвистического образования: опыт анализа на основе анкетирования

i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

GENERAL CHARACTERISTIC OF AUTOMATIC AND MACHINE TRANSLATION PROGRAMS

the article examines the role of computer programs in translation . The aim of the research is to analyze the use of modern automatic and machine translation programs in the professional activity of a translator. An assessment of the effectiveness of the application of such programs and the direction of their further development are given

Текст научной работы на тему «ОБЩАЯ ХАРАКТЕРИСТИКА ПРОГРАММ АВТОМАТИЗИРОВАННОГО И МАШИННОГО ПЕРЕВОДА»

7. Набоков В.В. Король, дама, валет. Русский период. Собрание сочинений: в 5 томах. Т. 2. / В.В.

Набоков. — СПб.: Симпозиум, 2009. — С. 128-305.

8. Демичев А.В. Deathнейленд // Фигуры Танатоса: Искусство умирания. -СПб.: Изд-во СПбГУ, 1998. — С. 51-57.

Худинский Марк Викторович Hudinskiy Mark Viktorovich

Военный университет Министерства обороны Российской Федерации Military University of the Ministry of Defense of the Russian Federation

Читайте также:
Для чего программа supersu для Андроид

ОБЩАЯ ХАРАКТЕРИСТИКА ПРОГРАММ АВТОМАТИЗИРОВАННОГО

И МАШИННОГО ПЕРЕВОДА

GENERAL CHARACTERISTIC OF AUTOMATIC AND MACHINE

Аннотация: в статье рассматривается роль компьютерных программ в переводческой деятельности. Целью исследования является анализ использования современных автоматизированных и машинных программ перевода в профессиональной деятельности

VМеждународная научно-практическая конференция переводчика. Дана оценка эффективности применения подобных программ и направление их дальнейшего развития.

Abstract, the article examines the role of computer programs in translation. The aim of the research is to analyze the use of modern automatic and machine translation programs in the professional activity of a translator. An assessment of the effectiveness of the application of such programs and the direction of their further development are given.

Ключевые слова: автоматизированный перевод; машинный перевод; качество перевода; помощь переводчику.

Key words: automatic translation; machine translate; translation quality; assistance to the translator.

В своей профессиональной деятельности переводчик использует различные компьютерные программы. По своему применению и принципу работы они различаются на программы машинного и автоматизированного перевода.

Машинный перевод — это процесс перевода текста с одного естественного языка на другой, полностью реализуемый компьютером [1, с. 8]. На данный момент программы машинного перевода подразделяются на три категории[2, с. 139]:

Полностью автоматический перевод;

Автоматизированный машинный перевод при участии человека;

Перевод, осуществляемый человеком с использованием компьютера.

Полностью автоматический перевод осуществим только в будущем, так как до сих пор невозможно создать программные алгоритмы автоматического понимания, перевода и синтеза текстов.

Программы второй категории имеют название «Machine Translation» (машинный перевод — MT). Примером является программа «Meteo», посредством которой происходит перевод метеопрогнозов с французского языка на английский и обратно. Также системы машинного перевода фирмы PROMT для перевода и просмотра Web-страниц относятся к переводческим программам данного типа.

Программы третьей категории носят название «translation memory» (память перевода — TM). Их зачастую используют профессиональные переводчики, которые пользуются выгодой приносимой автоматизированным переводом. К подобным программам относятся специализированные словари, которые соответствуют необходимой тематике переводимого текста.

После чего пользователь вносит свои корректировки, выбирает необходимый ему вариант и система запоминает полученный перевод, который может быть использован в будущем. Также их использование позволяет исключить повторный перевод идентичных фрагментов текста, так как программа запоминает выполненный перевод и соотносит его в дальнейшем. Поэтому подобные системы особенно популярны в больших компаниях и коллективных проектах. Наиболее известными являются: Transit, Trados, Translation Manager, Eurolang Optimizer и

Программы данного типа имеют следующие общие функции:

— сопоставления, то есть использование уже переведённых материалов по одной тематике. Происходит сегментное сопоставление файлов оригинала и перевода внутри базы данных;

— работа фильтром импорта — экспорта. За счёт этого осуществляется совместимость с текстовыми процессорами и издательскими системами, то есть работа с различным ПО;

— поиск неполных или полных совпадений;

— поддержка тематических словарей;

— средства поиска фрагментов текста;

Системы машинного перевода представлены множеством программ и интернет-сервисов, которые осуществляют перевод текста с одного языка на другой без участия человека; он только редактирует полученный результат. Наиболее известными программами являются: PROMT, Google translate, Яндекс.Переводчик и др.

Отдельно стоит отметить программу перевода «Google Translate», которая работает на принципе использования статистического уникального машинного

VМеждународная научно-практическая конференция перевода текста (Statistical Machine Translation — SMT). Особенностью данной программы является метод перевода, который основан на поиске языковых соответствий, а не на анализе правил грамматики [4, с. 2]. В данном случае происходит поиск языковых соответствий между переводимым текстом и большим массивом информации сервиса, который включает в себя слова, вносимые пользователями ранее. Для примера берутся все достоверно оцененные источники, как, например, документы международных организаций. Это особенно удобно, так как документы, к примеру, Организации объединённых наций ведутся на разных языках.

В 2016 году были созданы первые системы машинного перевода, спрограммированные на основе механизма двунаправленных рекуррентных нейронных сетей[5]. Они также обучаются на основе двуязычных корпусов, но в отличии от «SMT», построены на матричных вычислениях, оперируют целыми предложениями и создают более сложные вероятностные модели. В результате, слова в предложении согласованы между собой и стоят в правильном порядке. Данный вариант перевода является наиболее перспективным в настоящее время.

Системы автоматизированного перевода — это специализированные программы и интернет-сервисы, посредством которых человек осуществляет перевод текстов с одного языка на другой. Их часто применяют для работы над художественными, юридическими и техническими тестами. Переводчик использует их в качестве инструмента и помощи, в то время, как он сам занимается переводом. К таким программам относятся:

встроенные или отдельные редакторы, которые автоматически проверяют грамматику текстов и правописание слов (Hemungway App, Microsoft Word, Grammarly и др.);

таблицы, текстовые редакторы и ПО, которые обеспечивают управление терминологией. С помощью них переводчик загружает необходимую ему информацию, а также создаёт свои собственные термины, которые запомнит программа (MultiTerm, LogiTerm, TermStar, Termex и др.);

«Инновационные аспекты развития науки и техники» ПО для осуществления менеджмента переводческих проектов, чтобы назначать и контролировать лингвистические задачи и их выполнение при работе с многочисленным персоналом (Freedcamp, Asana, MeisterTask);

системы конкорданса, используемые для поиска примеров слов и выражений в требуемом контексте (Ontos, Russian Context Optimiaer, Арион);

САТ-инструменты (Computer Aided Translation tools), которые применяют систему «памяти переводов» и включающие в себя образцы ранее переведённых предложений и текстов (Trados, DéjáVu, MemoQ, MemSource, Wordfast и др.);

корпусы текстов с использованием одного или нескольких языков и программы переводческой памяти. Они позволяют составить минимальное описание употребления слов и выражений в основных случаях употребления, а также с поправками на использование конкретной предметной темы (Корпус английского, русского, бурятского языков и др.).

Читайте также:
Рабочая программа знаю умею могу

двуязычные электронные словари (ABBYY Lingvo, Multitran, Reverso и

Автоматизированные программы при осуществлении профессионального перевода являются приоритетными. Их преимущество хорошо выражено при сравнении бумажных и электронных словарей. Во-первых, электронные словари постоянно обновляются, пополняясь лексикой даже из узкоспециализированных отраслей.

Что касается бумажных словарей, с такой же скоростью выпускать их и постоянно обновлять не представляется возможным. Во-вторых, сокращается время на поиск необходимой информации, ведь большие бумажные словари не всегда доступны. В-третьих, в отличие от бумажных словарей, которые делятся на различные тематические направления, электронные словари включают в себя весь возможный лексический ресурс используемого языка. Таким образом, в ходе перевода иностранного текста, переводчик использует сразу несколько автоматизированных программ, которые облегчают его работу. Применяются редакторы для проверки грамматики, системы конкорданса для верного перевода слова в конкретном контексте, различные CAT-инструменты для нахождения

VМеждународная научно-практическая конференция наиболее подходящего варианта и электронные словари для нахождения значения незнакомых слов.

Таким образом, программы автоматизированного и машинного перевода имеют общие используемые в ходе работы алгоритмы. На сегодняшний день значимость применения данных программ в переводческой деятельности продолжает расти. Однако, в профессиональной деятельности переводчика необходимы оба типа программ. Они занимают важное место в современной переводческой деятельности, но в конечном счёте окончательное решение при выборе наиболее оптимального варианта перевода остаётся за переводчиком, так как ни одна компьютерная программа не может избавить его от необходимости принимать самостоятельные решения.

1. Воронович В.В. Машинный перевод // Конспект лекций для студентов 5-го курса специальности «Современные иностранные языки». Минск, 2013. С. 8-11.

2. Дроздова К. А. Машинный перевод: история, классификация, методы // Филологические науки в России и за рубежом: материалы III Междунар. науч. конф. СПб, 2015. С. 139-141.

3. Машинный перевод [электронный ресурс]: исследование, проведённое А.А. Тараскином. — М. — 2017. — Режим доступа: https://www.study-english.info/article065.php (дата обращения 16.02.2021).

3. Каримова Р.Ф. Системы автоматизированного перевода и машинный перевод // Статья. Казань, 2020. С. 2-4

4. Нейросетевой перевод: рутина — машине, творчество — человеку [электронный ресурс]: исследование, проведённое компанией PROMT — М. — 2019. — Режим доступа: https://www.itweek.ru/ai/article/detail.php?ID=209160 (дата обращения 16.02.2021).

Зорькина Алина Юрьевна, Николенко Александра Алексеевна Zorkinа Alina Yur’evna, Nikolenko Alexandra Alekseevna

Ломакина Ирина Геннадьевна Lomakina Irina Gennadievna

Научный руководитель доц., канд.юрид.наук Research supervisor, Associate Professor, Candidate of Legal Sciences Сибирский государственный университет путей сообщения Siberian state transport university г. Новосибирск Novosibirsk

НЕКОТОРЫЕ ПРОБЛЕМЫ ДОГОВОРА ПЕРЕВОЗКИ ПАССАЖИРОВ

В МАРШРУТНОМ ТАКСИ

SOME PROBLEMS OF THE PASSENGER TRANSPORTATION

Источник: cyberleninka.ru

Программы автоматизированного перевода текста

Тема 2. Пакеты прикладных программ

Автоматизированный перевод
Автоматизи́рованный перево́д (АП,
англ. Computer-Aided Translation) —
перевод текстов на компьютере с
использованием компьютерных
технологий. От машинного
перевода (МП) он отличается тем,
что весь процесс перевода
осуществляется человеком,
компьютер лишь помогает ему
произвести готовый текст либо за
меньшее время, либо с лучшим
качеством.
Это изображение, автор: Неизвестный автор, лицензия: CC BY

3.

История
Одним из пионеров идеи
автоматизированного перевода
является советский учёный Пётр
Петрович Троянский, предложивший в
1933 году «машину для подбора и
печатания слов при переводе с одного
языка на другой». Машина состояла из
стола с наклонной поверхностью,
перед которым был закреплён
фотоаппарат, синхронизированный с
печатной машинкой. На поверхности
стола располагалось «глоссарное
поле» — свободно двигающаяся
пластина с напечатанными на ней
словами на трёх, четырёх и более
языках[1].

4.

История
Практическая реализация идеи
автоматизированного перевода
началась с момента появления
компьютеров: переводчики
всегда выступали против
стандартной в те годы концепции
МП, на которую было направлено
большинство исследований в
области компьютерной
лингвистики, но поддерживали
использование компьютеров для
помощи переводчикам.

5.

История
В настоящее время наиболее
распространённые способы
использования компьютеров при
письменном переводе — работа со
словарями и глоссариями, памятью
переводов (англ. Translation Memory,
TM), содержащей примеры ранее
переведённых текстов,
терминологическими базами, а также
использование так называемых
корпусов, больших коллекций текстов
на одном или нескольких языках, что
даёт сжатое описание того, как слова и
выражения реально используются в
языке в целом или в конкретной
предметной области.

6.

История
При синхронном переводе
использование средств
автоматизированного перевода
из-за его специфики ограничено.
Одним из примеров является
использование словарей,
загружаемых на КПК. Другим
примером может служить
полуавтоматическое извлечение
списков терминов при
подготовке к синхронному
переводу в узкой предметной
области[4].

7.

История
В узких предметных областях при
большом количестве исходных текстов
и устоявшейся терминологии
переводчики могут использовать и
машинный перевод, который может
обеспечить хорошее качество перевода
терминологии и устойчивых
выражений в узкой области.
Переводчик в этом случае
осуществляет постредактирование полученного текста.
Более половины текстов
внутри Еврокомиссии (главным
образом юридические тексты и
текущая корреспонденция)
переводится с использованием МП.

8.

Автоматизированный перевод
Автоматизированный перевод — это
широкое и не совсем точное понятие,
охватывающее широкий спектр
простых и сложных инструментов. Они
могут включать:
Программы для проверки
правописания, которые могут быть
встроены в текстовые редакторы или
дополнительные программы;
Программы для проверки
грамматики, которые также
встраиваются в текстовые редакторы
или дополнительные программы;

9.

Автоматизированный перевод
Программы для управления терминологией,
которые позволяют переводчикам управлять
своей собственной терминологической базой
в электронной форме. Это может быть и
простая таблица, созданная в текстовом
редакторе, и электронная таблица, и база
данных, созданная в программе FileMaker.
Для более трудоёмких (и более дорогих)
решений существует специальное
программное обеспечение, например
LogiTerm, MultiTerm, Termex, TermStar и т. п.
Словари на компакт-дисках, одноязычные
или многоязычные;
Терминологические базы данных, хранимые
на компакт-дисках или подключаемые по
Интернету, например The Open Terminology
Forum или TERMIUM

Читайте также:
Общая физическая подготовка рабочая программа вуз

10.

Автоматизированный перевод
Программы для
полнотекстового поиска (или индексаторы), которые
позволяют пользователю обращаться с запросами к
ранее переведённым текстам или разного рода
справочным документам. В индустрии переводов
известны такие индексаторы, как Naturel, ISYS Search
Software и dtSearch;
Программы конкорданса, позволяющие находить
примеры слов или выражений в употребляемом
контексте в одноязычном, двуязычном или
многоязычном корпусе, как битекст или память
переводов, например Transit NXT;
Битекст, одно из нововведений последнего времени,
это результат слияния исходного текста и его
перевода, который впоследствии может быть
проанализирован при помощи программ для
полнотекстового поиска или конкорданса;

11.

Автоматизированный перевод
Программное обеспечение для управления
проектами, которое позволяет лингвистам
структурировать сложные переводческие
проекты, передавать выполнение различных
задач разным сотрудникам и наблюдать за
процессом выполнения этих задач;
Программы управления памятью
переводов (TMM), состоящие из базы данных
сегментов текста на исходном языке и их
переводов на один или более целевых
языков, например Transit NXT;
Почти полностью автоматические системы,
напоминающие машинный перевод, но
позволяющие пользователю вносить
определённые изменения в сомнительных
случаях. Иногда такие программы называют
машинным переводом с участием человека.

12.

Автоматизированный перевод
Программное обеспечение для управления
проектами, которое позволяет лингвистам
структурировать сложные переводческие
проекты, передавать выполнение различных
задач разным сотрудникам и наблюдать за
процессом выполнения этих задач;
Программы управления памятью
переводов (TMM), состоящие из базы данных
сегментов текста на исходном языке и их
переводов на один или более целевых
языков, например Transit NXT;
Почти полностью автоматические системы,
напоминающие машинный перевод, но
позволяющие пользователю вносить
определённые изменения в сомнительных
случаях. Иногда такие программы называют
машинным переводом с участием человека.

13.

Машинный перевод
Это изображение, автор: Неизвестный автор, лицензия: CC BY
Маши́нный перево́д — процесс
перевода текстов (письменных, а
в идеале и устных) с
одного естественного языка на
другой с помощью специальной
компьютерной программы. Так
же называется направление
научных исследований,
связанных с построением
подобных систем.

14.

Формы организации взаимодействия ЭВМ и человека
при машинном переводе
С постредактированием: исходный текст перерабатывается
машиной, а человек-редактор исправляет результат.
С предредактированием: человек приспосабливает текст к
обработке машиной (устраняет возможные неоднозначные
прочтения, упрощает и размечает текст), после чего начинается
программная обработка.
С интерредактированием: человек вмешивается в работу системы
перевода, разрешая трудные случаи.
Смешанные системы (например, одновременно с пред- и
постредактированием).

15.

Формы организации взаимодействия ЭВМ и человека
при машинном переводе
С постредактированием: исходный текст перерабатывается
машиной, а человек-редактор исправляет результат.
С предредактированием: человек приспосабливает текст к
обработке машиной (устраняет возможные неоднозначные
прочтения, упрощает и размечает текст), после чего начинается
программная обработка.
С интерредактированием: человек вмешивается в работу системы
перевода, разрешая трудные случаи.
Смешанные системы (например, одновременно с пред- и
постредактированием).

16.

ПРОГРАММЫ TRANSLATION MEMORY
Translation memory (переводческая
память, накопители переводов) –
программы, позволяющие «не
переводить одно и то же два раза».
Это базы данных, которые содержат
ранее переведенные единицы
текста. Если в новом тексте
обнаруживается единица, которая
уже есть в базе, система
автоматически добавляет ее в
перевод. Такие программы
значительно экономят время
переводчика, особенно если он
работает с однотипными текстами

17.

Trados
На момент написания статьи –
одна из самых популярных
программ Translation memory.
Позволяет работать с
документами MS Word,
презентациями PowerPoint,
HTML-документами и файлами
других форматов. В Trados есть
модуль для ведения глоссариев.
Сайт: http://www.translationzone.c
om/trados.html

18.

Déjà Vu
Также один из лидеров по
популярности. Позволяет
работать с документами
практически всех популярных
форматов. Есть отдельные
версии программы для
переводчиков-фрилансеров и
для бюро переводов.
Сайт: http://www.atril.com/

19.

OmegaT.
Поддерживает большое
количество популярных
форматов, но документы в MS
Word, Excel, PowerPoint
требуется конвертировать в
другие форматы. Приятная
особенность: программа
бесплатная.
Сайт: http://www.omegat.org/

20.

Wordfast.
Программа ориентирована,
прежде всего, на
переводчиков-фрилансеров.
Предлагается несколько
версий программы, в том
числе – бесплатная, которая
доступна онлайн (Wordfast
Anywhere).
Сайт: http://www.wordfast.com/

21.

MetaTexis
Позволяет работать с
документами основных
популярных форматов.
Предлагается два варианта
программы – модуль для MS
Word и серверная программа.
Сайт: http://www.metatexis.co
m/

22.

MemoQ
Функционал схож с Традосом и
Déjà Vu, стоимость программы
(на момент написания статьи)
ниже, чем у более популярных
систем. Сайт: http://kilgray.com/

23.

Star Transit.
Предназначена для перевода и
локализации. На данный
момент совместима только с
ОС Windows.
Сайт: http://www.stargroup.net/DEU/group-transitnxt/transit.html

24.

WordFisher.
Бесплатная система Translation
Memory, созданная и
поддерживаемая
профессиональным
переводчиком.
Сайт: http://www.wordfisher.co
m/

25.

Across
Предлагается 4 различных
версии программы,
отличающихся по объему
функционала.
Сайт: http://www.across.net/us/t
ranslation-memory.aspx

26.

Catnip.
Бесплатная программа,
«наследница» программы
MT2007. Сайт: http://mt2007cat.ru/catnip/

27.

ЭЛЕКТРОННЫЕ СЛОВАРИ
Здесь мы представили только электронные словари для
автономной работы (без доступа в интернет). Онлайн-словарей
значительно больше, им будет посвящена отдельная статья. Хотя
интернет проник в самые удаленные уголки планеты, полезно
иметь хотя бы 1 словарь для работы в автономном режиме. Мы
рассмотрели словари для профессионального использования,
разговорники и словари для изучающих язык сюда не вошли.

Источник: ppt-online.org

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru