Программа переводчик это определение

Компьютерные словари. Словари необходимы для перевода текстов с одного языка на другой. Существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и т. д.), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, в которой поиск нужного слова является достаточно долгим и трудоемким процессом.

Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности. Во-первых, компьютерные словари могут являться многоязычными — давать пользователю возможность выбрать языки и направление перевода (например, англо-русский, испанско-русский и т. д.).

Во-вторых, компьютерные словари могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.).

В-третьих, компьютерные словари обеспечивают быстрый поиск словарных статей: «быстрый набор», когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.

Экранный переводчик на русский для игр, фото, документов | Ёлочка

В-четвертых, компьютерные словари могут являться мультимедийными, т. е. предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.

Системы компьютерного перевода. Процесс глобализации мира приводит к необходимости частого обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках.

В этих условиях использование традиционной технологии перевода «вручную» тормозит развитие межнациональных контактов. Перевод многостраничной документации вручную требует длительного времени и высокой оплаты труда переводчиков. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страницы необходимо осуществлять срочно, и нет времени пригласить переводчика.

Системы компьютерного перевода позволяют решить эти проблемы. Они, с одной стороны, способны переводить многостраничные документы с высокой скоростью (одна страница в секунду), с другой стороны, переводить Web-страницы «на лету», в режиме реального времени.

Системы компьютерного перевода осуществляют перевод текстов, основываясь на формальном «знании»: синтаксиса языка (правил построения предложений), правил словообразования и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке.

Современные системы компьютерного перевода позволяют достаточно качественно переводить техническую документацию, деловую переписку и другие специализированные тексты. Однако они не применимы для перевода художественных произведений, так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека.

ПРИЛОЖЕНИЕ ДЛЯ ПЕРЕВОДА СУБТИТРОВ ВИДЕО НА YOUTUBE + ОЗВУЧКА

Контрольные вопросы

    1. Какими преимуществами обладают компьютерные словари по сравнению с традиционными бумажными словарями?
    2. В каких случаях целесообразно использовать системы компьютерного перевода?

Системы оптического распознавания документов

Системы оптического распознавания символов. Системы оптического распознавания символов используются при создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат.

Сначала с помощью сканера необходимо получить изображение страницы текста в графическом формате. Далее для получения документа в текстовом формате необходимо провести распознавание текста, т. е. преобразовать элементы графического изображения в последовательность текстовых символов.

Системы оптического распознавания символов сначала определяют структуру размещения текста на странице и разбивают его на отдельные области: колонки, таблицы, изображения и т. д. Далее выделенные текстовые фрагменты графического изображения страницы разделяются на изображения отдельных символов.

Для отсканированных документов типографского качества (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений) распознавание символов проводится путем их сравнения с растровыми шаблонами.

Растровое изображение каждого символа последовательно накладывается на растровые шаблоны символов, хранящиеся в памяти системы оптического распознавания. Результатом распознавания является символ, шаблон которого it наибольшей степени совпадает с изображением (рис. 3.16).

Рис. 3.16. Распознаваемый символ «Б» накладывается на растровые шаблоны символов (А, Б, В и т. д.)

При распознавании документов с низким качеством печати (машинописный текст, факс и т. д.) используется векторный метод распознавания символов. В распознаваемом изображении символа выделяются геометрические примитивы (отрезки, окружности и др.) и сравниваются с векторными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех геометрических примитивов и их расположение больше всего соответствует распознаваемому символу (рис. 3.17).

Рис. 3.17. Распознаваемый символ «Б» накладывается на векторные шаблоны символов (А, Б, В и т. д.)

Системы оптического распознавания символов являются «самообучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов), и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.

С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.

Системы оптического распознавания форм. При заполнении документов большим количеством людей (например, при сдаче выпускником школы единого государственного экзамена (ЕГЭ)) используются бланки с пустыми полями. Данные вводятся в поля печатными буквами от руки. Затем эти данные распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.

Сложность состоит в том, что необходимо распознавать символы, написанные от руки, которые довольно сильно различаются у разных людей. Кроме того, такие системы должны уметь определять, к какому полю относится распознаваемый текст.

Читайте также:
Как узнать программу на компьютере

Контрольные вопросы

    1. В чем состоят различия в технологии распознавания текста при использовании растрового и векторного методов?

Практические работы компьютерного практикума, рекомендуемые для выполнения в процессе изучения главы

№ 8. Кодирование текстовой информации.

№ 9. Создание визитных карточек на основе шаблона.

№ 10. Установка параметров страницы документа, вставка колонтитулов и номеров страниц.

№ 11. Вставка в документ формул.

№ 12. Форматирование символов и абзацев.

№ 13. Создание и форматирование списков.

№ 14. Вставка оглавления в документ, содержащий заголовки.

№ 15. Вставка в документ таблицы, ее форматирование и заполнение данными.

№ 16. Создание гипертекстового документа.

№ 17. Перевод текста с помощью компьютерного словаря.

№ 18. Сканирование и распознавание бумажного текстового документа.

Источник: 5byte.ru

Электронные программы-переводчики: что, как, зачем?

Речь, прежде всего, идет об электронных системах, специально разработанных программных продуктах, ориентированных на вполне определенную аудиторию — специалистов, занимающихся письменным и устным переводом. Однако самое интересное заключается в том, что в большинстве своем эти вспомогательные средства — прямые потомки хорошо знакомых нам печатных словарей. Более половины электронных приложений — это, фактически, и есть самые обычные словари, только слова и их перевод перенесены с бумажного носителя на электронный.

Конечно, в отличие от бумажного словаря в электронном поиск нужных слов и выражений происходит гораздо быстрее, да и размер электронного словаря не влияет на его физический объем и вес, другими словами, сюда можно включить столько информации, сколько нужно. С другой стороны, любые электронные средства — это зависимость от заряда батареи и работоспособности электронного устройства. И здесь уже не важно, идет ли речь об электронном словаре или системе машинного перевода.

Последние, кстати, сейчас все более набирают популярность. Во-первых, потому что алгоритмы их работы уже достигли какого-то оптимального уровня, во-вторых, их стоимость сегодня практически сравнима с ценой лицензии электронного словаря и в общем-то не слишком высока. Так что, профессиональный переводчик вполне может позволить себе иметь и то, и другое, причем в нескольких экземплярах (от разных разработчиков).

Как бы то ни было, ни электронные словари, ни системы машинного перевода не настолько хороши и универсальны, чтобы иметь реальную возможность составить какую бы то ни было конкуренцию специалисту-лингвисту. Если говорить о программах, работающих со словарями общей практики, то здесь, в принципе, еще можно получить более или менее внятный перевод. Да и то, без редактуры такой перевод, конечно, использовать как готовый продукт никак нельзя. Что же касается узкоспециализированных текстов, то здесь дела обстоят еще хуже — никакая программа адекватный перевод такого текста сделать просто не в состоянии. Однако она в состоянии существенно облегчить задачу переводчика и оказать влияние на скорость и качество его работы (особенно, если речь идет о значительных по объему текстах).

Конечно, многое зависит от алгоритма работы программы, от того, насколько обширны словари, и как много выражений и лексических оборотов разработчики заложили в память своей системы. В любом случае, каждый переводчик имеет свои предпочтения и выбирает для себя такие средства и электронные словари, которые больше подходят лично ему. И хотя разработчики электронных словарей и систем машинного перевода тратят массу времени и сил на решение задачи обеспечения максимально точного перевода текста с одного языка на другой (причем некоторые из них достаточно преуспели в этом деле), есть вещи, которые решить им, по крайней мере в обозримом будущем, навряд ли удастся.

Как известно, любой перевод — это не просто передача слов или понятий с одного языка на другой, а еще и трансформация и адаптация определенных культурных и лингвистических оттенков. Ключевым здесь можно считать умение интуитивно распознавать те или иные нюансы речи и адекватно передавать их на другой язык. К сожалению, интуиция — это то, что автоматизировать или запрограммировать еще никому не удалось и едва ли удастся. Вот и получается, что несмотря на плюсы электронных систем, рассматривать их в качестве самостоятельных инструментов для осуществления письменного или устного перевода не приходится. Однако, как вспомогательные средства в ежедневной интенсивной работе они будут просто незаменимы.

Источник: www.expressperevod.ru

История машинного перевода: от гипотез Лейбница и Декарта – до мобильных приложений и облачных сервисов

Технологии машинного перевода плотно вошли в жизнь современного человека. Еще 50 лет назад, чтобы прочесть иностранную статью или перевести полученное из-за рубежа письмо, люди долго и скрупулёзно листали словари или обращались к профессиональным переводчикам.

Сегодня же, чтобы постигнуть «тайный» смысл текста на иностранном языке, достаточно воспользоваться онлайн-переводчиком или мобильным приложением. За доступностью, простотой и удобством компьютерных переводчиков стоит колоссальный труд ученых, математиков, инженеров, лингвистов.

В этой статье мы расскажем, как зарождались и развивались технологии машинного перевода с XVII века до наших дней. Предыстория: XVII век Испокон веков люди задумывались о том, как разрушить языковой барьер – создать единый язык для всех людей, найти возможность изучить все существующие языки или же разработать такую технологию, которая позволит понимать иностранные языки, не тратя время и силы на их изучение.

Читайте также:
Топ бесплатных программ для монтажа на ПК без водяного знака

Первые идеи зародились еще в XVII веке, когда Рене Декарт и Готфрид Лейбниц независимо друг от друга предлагали создать универсальный язык как новую основу для логического мышления, а также для устранения взаимного недопонимания, которое происходит из-за нелогичности языков. В 1668 году британский священник Джон Уилкинс выпустил трактат «Опыт о подлинной символике и философском языке», где представил свой подход к созданию универсального языка учёных и философов, который мог бы прийти на смену латыни.

Однако его предложение не встретило одобрения среди лингвистов. Много позже, в XIX-XX веке, ученые вернулись к разработке единого международного языка, вследствие чего было создано Эсперанто. Однако до первых попыток создания машинного перевода еще оставалось несколько десятилетий.

1930-е: система Троянского – первый шаг к машинному переводу В 30-е годы XX века ученые заговорили о разработке технологий машинного перевода. Французский ученый армянского происхождения Жорж Арцруни создал двуязычный автоматический словарь на перфоленте, а советский инженер Петр Троянский изобрел «машину для подбора и печатания слов при переводе с одного языка на другой».

Изобретение Троянского представляло собой стол с наклонной поверхностью и фотокамерой, совмещенной с печатной машинкой. Клавиши машинки позволяли кодировать морфологическую и грамматическую информацию, а ее лента подавалась синхронно с фотопленкой. На поверхности устройства была установлена подвижная пластина с напечатанными словами, называемая глоссарным полем.

Слова на глоссарном поле сопровождались переводами как минимум на три языка и располагались, подобно буквам на клавиатуре: наиболее часто используемые – ближе к центру поля. Идеи Петра Троянского долгое время оставались неизвестными даже ученым. Вновь открыты они были только в 1950-е.

1949 год: первые наработки МП на базе компьютера Концепция машинного перевода была сформулирована только в конце 1940-х годов – ее автором выступил криптограф Уоррен Уивер, директор отделения естественных наук Рокфеллерского фонда. В своем письме к коллеге Норберту Винеру он предложил рассматривать задачу перевода с одного языка на другой как новую область применения технологий декодирования.

Стоит лишь представить, что исходный текст написан на родном языке, но закодирован с помощью специальных знаков, и, чтобы понять смысл заложенной в тексте информации, достаточно взломать этот код. Письмо Уивера вызвало большой резонанс, и в 1949-м году криптограф опубликовал меморандум, в котором обосновал возможность реализации технологии машинного перевода, основанной на декодировании.

Этот документ стал важной вехой в развитии машинного перевода. В нем ученый описал концепцию interlingva, при которой процесс передачи информации осуществляется в два этапа: — исходное предложение переводится на упрощенный вариант английского (язык-посредник); — результат преобразуется в предложение на искомом языке.

1950-1960-е: Джорджтаунский эксперимент и отчет ALPAC Важным событием в развитии МП стал Джорджтаунский эксперимент, который провели 7 января 1954 года в Нью-Йорке, в штаб-квартире корпорации IBM. В рамках этого эксперимента компьютер IBM 701 впервые в мире перевел 60 предложений с русского на английский язык.

В пресс-релизе корпорации отмечалось, что девушка, не знающая русский язык, набрала русские сообщения на перфокартах, а машинный мозг «с бешеной скоростью в две с половиной строки в секунду» выдал их перевод на английский. Это сообщение общество встретило ликованием: газеты пестрили громкими заголовками, а американские власти выразили готовность финансировать дальнейшие исследования и разработки в области машинного перевода.

Эксперимент IBM дал мощный толчок развитию технологий машинного перевода, однако все проекты оказались чересчур сложными, дорогостоящими и в конечном итоге вызывающими неоднозначную оценку. В 1964 году группа ученых, входивших в образованный Пентагоном и Национальным научным фондом США Консультативный комитет по автоматической языковой обработке (Automatic Language Processing Advisory Committee, ALPAC), провела оценку технологий машинного перевода и двумя годами позже, по сути, уничтожила это направление исследований печально известным отчетом.

В результате его публикации финансирование исследований в области машинного перевода в США прекратилось примерно на двадцать лет. Возможно, еще более серьезным последствием стало то, что широкая публика и научное сообщество начали воспринимать машинный перевод как нечто нереализуемое.

Первые коммерческие разработки систем перевода В 1968-м году в Сан-Диего бывший специалист Джорджтаунского университета Питер Тома открыл первую в мире компанию, специализирующуюся на разработке программ для машинного перевода – Systran. Главной целью компании стала разработка технологий, позволяющих ускорить перевод текстов (письменных, устных) с одного естественного языка на другой – в особенности, с русского на английский.

При разработке первых переводчиков специалисты Systran использовали Rule-based Machine Translation (МП на основе правил) – подход, предполагающий работу системы МП на основе лингвистической информации об исходном языке и языке перевода. Этот подход к МП считается классическим, позднее в мире появятся и другие компании-разработчики, которые будут использовать схожий подход к решению задач перевода текста компьютером.

Первые переводчики Systran оказались очень востребованными на рынке – их приобретение стало обязательным почти для каждой международной компании. МП в СССР В Советском Союзе большое внимание технологиям МП начали уделять в 1950-х годах – после Джорджтаунского эксперимента.

В 1955-м году в Академии Наук СССР создали две исследовательские группы: одну, при Математическом Институте имени В.А. Стеклова, возглавил выдающийся советский математик, основоположник кибернетики Алексей Ляпунов, а вторую, при Институте точной механики и вычислительной техники, математик Дмитрий Панов.

Читайте также:
Как выглядит программа сап

Свои исследования группы специалистов начали с детального изучения Джорджтаунского эксперимента, а уже год спустя опубликовали результаты первых экспериментов в СССР, проведенных на компьютере БЭСМ. Еще через год в Институте точной механики и вычислительной техники представили первый советский компьютерный переводчик, включавший словарь из 2300 слов.

В это же время, в Институте прикладной математики, аспирантка Ольга Кулагина и студент филологического факультета МГУ Игорь Мельчук, под руководством Алексея Ляпунова, работали над созданием еще одного переводчика. В конце 1956 года заведующий кафедрой перевода Московского государственного педагогического института иностранных языков Виктор Розенцвейг основал Объединение по машинному переводу – неформальный центр общения лингвистов и математиков.

В 1957 году ученые, входившие в это Объединение, начали выпускать бюллетень «Машинный перевод и прикладная лингвистика». В мае 1958 года Розенцвейг организовал в Москве первую советскую конференцию по машинному переводу, в которой приняли участие 340 специалистов из 79 организаций.

На мероприятии ученые рассмотрели актуальные на тот момент проблемы, связанные с МП, в том числе – алгоритмы перевода. По итогам конференции Министерство высшего образования СССР издало приказ «О развитии научных исследований в области машинного перевода».

В 1972 году специалисты института «Информэлектро» при Министерстве электромеханической промышленности СССР под руководством Юрия Апресяна приступили к разработке системы машинного перевода – ЭТАП (Электротехнический автоматический перевод), в основу которой легла формальная модель языка «Смысл-Текст». В 1971-м году в Ленинграде, при ЛГПИ им. Герцена (ныне – РГПУ им.

Герцена), по инициативе профессора Раймонда Пиотровского, была создана Научно-исследовательская лаборатория инженерной лингвистики. Специалисты лаборатории также активно занимались разработкой технологий для автоматической обработки текста. В 1991-м году, бывшие сотрудники лаборатории под руководством Светланы Соколовой основали компанию PROMT.

1990-е – начало 2000-х: развитие компании PROMT на международном рынке В год основания компании специалисты выпустили первую в стране коммерческую систему машинного перевода, получившую название PROMT (аббревиатура «PROject Machine Translation) для MS DOS. Отличительной чертой этой системы стала возможность переводить тексты со специализированной лексикой – по компьютерной тематике.

В 1992 году компания PROMT выиграла тендер NASA на поставку систем машинного перевода с английского на русский. Эта сделка положила начало и дальнейшему сотрудничеству с космическим агентством: 13 лет спустя переводчики PROMT с комплектом специализированных словарей взяли на МКС. ПО устанавливалось на карманные и персональные компьютеры астронавтов.

В период с 1993 по 1997 год специалисты PROMT представили первую англо-русскую систему перевода для OC Windows, разработали системы перевода с немецкого, французского, итальянского, заключили соглашение с французской компанией Softissimo на разработку систем для перевода с немецкого на французский. В 1998 году Федеральное агентство по информационным технологиям и оргкомитет выставки Softtool вручили PROMT национальную награду «За вклад в развитие информационных технологий России».

В том же году компания выпустила известный многим мультимедийный переводчик Magic Gooddy с анимированным персонажем – гусем Гудди, который знал русский и английский языки и понимал некоторые команды. Переводчик, задуманный для детей, на многие годы стал любимым брендом не только школьников, но и взрослых людей.

1998 год ознаменовался еще одним масштабным проектом для компании – запуском первого онлайн-переводчика рунета Translate.Ru. В 2000 году компания PROMT предоставила системы машинного перевода для одного из наиболее крупных проектов по нормализации международных стандартов ISO и российских стандартов ГОСТ.

Этот проект реализовывался американским подрядчиком Global Management and Consulting Services по заказу Госстандарта России и финансировался Всемирным банком. 2001-2007 годы стали для PROMT периодом новых разработок и внедрений. Совместно с бельгийской компанией Image Recognition Integrated Systems (I.R.I.S.) компания выпустила уникальную ручку-сканер, сочетающую ПО для машинного перевода и ПО по распознаванию текста.

В 2006 году PROMT получил заказ на разработку англо-литовского машинного переводчика: создание бесплатного интернет-портала переводов для литовских пользователей финансировалось структурными фондами Евросоюза. Для компании PROMT работа над англо-литовской языковой парой стала первым опытом «экспорта технологии разработки» – часть работы впервые выполнялась компанией-партнером.

Машинный перевод в XXI веке В наши дни для развития машинного перевода сложились все условия: широкое распространение интернета, компьютеров, смартфонов и других гаджетов, появление облачных технологий, позволяющих хранить данные, не занимая лишнюю память устройства, а также рост контента на разных языках во всем мире. За последние полвека ученые, математики и лингвисты проделали огромную работу – ее следствием стали технологии машинного перевода, которыми мы сегодня активно пользуемся. Сейчас в нашем распоряжении и быстрые онлайн-сервисы, и сложные клиент-серверные решения для бизнеса, и мобильные переводчики, работающие как через интернет, так и в офлайн-режиме. 50 лет назад люди и подумать не могли, насколько популярными станут технологии машинного перевода в XXI веке. Какими они будут еще через 50 лет, остается только догадываться.

Подписаться на новости

Новости компании PROMT
Партнерская рассылка
Подписчики Translate,ru
Покупатели старого интернет-магазина
Пользователи PROMT 10
Пользователи PROMT 11
Пользователи PROMT 8
Пользователи PROMT 9
Пользователи PROMT Home 12
Пользователи демо-версии PROMT Home
Пользователи демо-версии PROMT Professional 10
Пользователи демо-версии PROMT Professional 11
Пользователи демо-версии PROMT Professional 12

Источник: www.promt.ru

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru