Программы оптического распознавания текста что это

Программа для распознавания текста с картинки

Распознавание текста – очень удобная возможность. Вам больше не надо перепечатывать большие объемы из книг и статей. Для учителей, студентов и научных работников такие программные приложения – настоящий подарок. Рассмотрим разные приложения и определим, какая программа для распознавания текста с картинки – лучшая.

Как это работает

Оптическое распознавание текста (OCR — Optical Character Recognition) – это возможность преобразовать текст из графического вида (фото, скан, pdf) в обычный формат. Преобразованный текст можно редактировать.
Любая растровая картинка состоит из точек. Программное обеспечение для распознавания выделяет на картинке буквы и переводит их в текст. Происходит анализ структуры документа. Выделяются текстовые блоки. Затем строятся линии, которые делятся на слова, а далее на символы. Каждый символ сравнивается с шаблонами.

После чего строятся гипотезы, что это за символ. Исходя их них, ПО анализирует разные варианты разбиения строк на слова, а слова на символы. Количество таких гипотез огромно. В конец концов программа принимает решение и выдает текст.

Распознавание текста. Перевести картинку и пдф в ворд. Лучшие методы

Обзор программного обеспечения

Условно все приложения можно разделить на три категории:

  • Платные.
  • Бесплатные.
  • Онлайн сервисы.

Рассмотрим несколько вариантов из каждого раздела.

Платные и бесплатные программы

OCR CuneiForm

Бесплатная программа для распознавания сканированного текста, которую можно скачать здесь.

Приложение было разработано в 1993 году в компании Cognitive Technologies. Одной из главных особенностей ее на тот момент была возможность опознавания смеси русского и английского языков. В 2009 году была добавлена ветка, которая позволяет распознавать смесь других языков. Программный продукт поставлялся со сканерами и МФУ от ведущих производителей: Hewlet-Pachard, Epson, Xerox и т.д. Последняя версия вышла в 2009 году.
После скачивания и установки пробуем распознать текст. Для примера возьмем эту статью.


Интерфейс программы прост, меню на русском.

Нажимаем значок папки и грузим картинку. Нажимаем кнопку распознавания.

Результат не впечатляет. Разноцветный текст не распознан.

Не смотря на заявленное использование разных словарей, английский тоже распознался плохо.

В общем, идеальное фото можно перевести в символы, но чем ниже качество исходной картинки, тем ниже оно и у результата.
Надо заметить, это единственная русифицированная программа распознавания текста при сканировании, которую удалось скачать бесплатно легальным образом. Все остальные в лучшем случае имеют пробный бесплатный период.

RiDoc

Программа для распознавания текста с фото или со сканера с бесплатным периодом в 30 дней. Скачать можно здесь.

Приложение обладает неплохим функционалом и доступным интерфейсом. Для загрузки картинки нажимаем кнопку «Открыть».

Далее кнопку «Распознать».

В итоге получаем готовый результат. Его можно открыть в Word или OpenOffice.

Вот результат.

Тоже не идеально, но намного больше, чем в предыдущем случае.
Также можно наложить водяной знак или склеить несколько картинок.

ReadIris

Платный программный продукт с пробной версией, рассчитанной на 100 страниц или 10 дней. Скачать программу для сканера для распознавания текста с официального сайта можно тут.

Разработчик – бельгийская компания IRIS, созданная в 1986 году. Основная специализация — технологии и продукты для интеллектуального распознавания документов.

Программа преобразует картинку, файл PDF или отсканированный документ в полностью редактируемый текстовый файл. Извлекает текст из ваших документов, сохраняя при этом макет исходного файла. Имеет следующие возможности:

  • конвертировать файлы Word, Excel и PowerPoint в индексированные PDF-файлы;
  • конвертация документов с помощью контекстного меню;
  • индикатор качества для импортируемых документов;
  • автоматическое обнаружение сканеров;
  • модуль коррекции перспективы.

Интерфейс программы русифицирован (указывается при установке) и достаточно прост.

Нажимаем кнопку «Из файла» и выбираем нашу картинку. Программа автоматически разделила ее на два блока.


Для распознавания нажмите кнопку «Открыть» и укажите путь для картинки. Формат указывается строкой выше.

Результат превзошел все ожидания. Даже начертание сохранилось.

Можно отправить документ по почте или в облако. Для этого следует щелкнуть по списку сверху и выбрать. По умолчанию сохраняется в файл.

Стоит эта программа около 6000 руб.

ABBYY FineReader

Самая известная и раскрученная программа. Скачать пробную версию можно здесь.

Платная стоит 6990 р. Российская разработка 1993 года, до сих пор считается одной из лучших в мире. Основные возможности:

  • Распознавание таблиц и графиков, математических формул.
  • Просмотр и навигация pdf.
  • Создание и прямое редактирование pdf.
  • Работа с цифровой подписью.
  • Сравнение документов.
  • Добавление комментариев.

Программа обладает множеством возможностей. Интерфейс русифицирован и доступен.

После нажатия кнопки «Открыть» и выбора картинки, начинается автоматическое его деление на блоки.

Для начала процесса нажмите соответствующую кнопку.

Дальше осталось выбрать, в каком формате сохранять и указать папку, в которую следует сохранить документ.

Откроем результат. Как видите, распознавание прошло идеально.

Еще раз сравним с ReadIris.

Первый вариант (Finereader) выполнен безупречно. Поэтому, пожалуй, пальму первенства отдаем этой программе. По цене они сопоставимы, так что разница в 600-700 рублей особой роли не играет.

Распознавание текста по фото онлайн

IMGonline

Онлайн сервис обработки картинок. На сайте представлены инструменты:

  • Сжатие и изменение размера картинки
  • Обрезка, кадрирование
  • Обработка встроенных метаданных
  • Эффекты
  • Улучшения
  • Определение палитры цветов картинки
  • Получение фона
  • Определение процента похожести и пр.

Удобный сайт, который дает множество возможностей обработки картинки. Интерфейс прост и понятен.

Предлагает две программы. Сравним. Загрузим файл и нажмем кнопку «ОК».

Дальше нажимаем на ссылку.

Результат не радует.

Пробуем вторую программу.

Тоже сомнительно.

Выставим дополнительный язык.

Проверяем результат.

Немного лучше, но до совершенства далеко.

img2txt

Программа для распознавания текста с фото онлайн, сканирования не допускает.

Сайт функционирует с 2014 года. Других сервисов, кроме текущего, разработчики не планируют.

Выберите файл и нажмите «Загрузить». Затем следует нажать «Начать распознавание».

Результат тоже далек от совершенства.

Сonvertio

Достаточно большой платный портал, на котором вы можете воспользоваться следующими возможностями:

  • Конвертация видео, аудио, картинок.
  • Преобразование PDF в Word, Excel, PowerPoint.
  • Разделение PDF.
  • Сжатие PDF, PNG и пр.

Принцип работы абсолютно аналогичен, но настроек больше. Картинки можно перетягивать.

Можно указать несколько языков и тип документа, куда сохраняется результат.

Незарегистрированным пользователям доступны только 10 страниц для распознавания.
После нажатия на каптчу, выберите «Преобразовать».

Нажмите скачать.

Результат превзошел все ожидания.

Оказывается, и у простых сервисов онлайн есть возможность качественного распознавания. Так что Convertio объявляется однозначным победителем в этой номинации. Но, как и любой отличный продукт, он платен.


Итак, мы рассмотрели различные инструменты распознавания текста. Выяснилось, что бесплатные могут помочь, но качество остается не на высоте. Так что, если вам постоянно требуется переводить текст из печатного вида в электронный, придется раскошелиться.

Читайте также:
Антивирусные программы что это кратко

Источник: windowstips.ru

KTNI_Kozlov_otvety / 11

Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные — последовательность кодов, использующихся для представления символов в компьютере (например, в текстовом редакторе).

Задача оптического распознавания

— Перевод документов, научных публикаций, социальной информации, исторических изданий в электронный вид.

— Накопление и хранение электронных документов.

  • 1929 году — Густав Таушек (Gustav Tauschek) получил патент на метод оптического распознавания текста в Германии;
  • 1933 год — Гендель (Paul W. Handel) получил патент на свой метод в США ;
  • 1935 год – Г. Таушек также получил патент США на свой метод;
  • 1950 год — Дэвид Х. Шепард (David H. Shepard) — построил машину, решающую задачу преобразования печатных сообщений в машинный язык для обработки компьютером.
  • 1955 год — Первая коммерческая система была установлена на «Ридерс Дайджест»
  • 1965 год — «Ридерс Дайджест» и «Ар-Си-Эй» начали сотрудничество с целью создать машину для чтения документов, использующую оптическое распознавание текста, предназначенную для оцифровки серийных номеров купонов «Ридерс Дайджест», вернувшихся из рекламных объявлений.
  • 1965 год — Почтовая служба Соединённых Штатов для сортировки почты использует машины, работающие по принципу оптического распознавания текста, созданные на основе технологий, разработанных исследователем Яковом Рабиновым.
  • 1971 год — Почта Канады использует системы оптического распознавания символов
  • 1974 год — Рэй Курцвейл создал компанию «Курцвейл Компьютер Продактс», и начал работать над развитием первой системы оптического распознавания символов, способной распознать текст, напечатанный любым шрифтом.
  • 1978 год — Компания «Курцвейл Компьютер Продактс» начала продажи коммерческой версии компьютерной программы оптического распознавания символов.
  • 1992 год – Начало продажи первой коммерчески успешной программой, распознающей кириллицу, «AutoR» российской компании «ОКРУС» (ОС DOS).
  • Конец 60-х годов – разработка и испытание шрифтонезависимого алгоритма распознования текста выпускниками МФТИ, биофизиками: Г. М. Зенкиным и А. П. Петровым

При создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному документообороту, при необходимости отредактировать полученный по факсу документ используются системы оптического распознавания символов. С помощью сканера несложно получить изображение страницы текста в графическом файле. Однако для получения документа в формате текстового файла необходимо провести распознавание текста, т. е. преобразовать элементы графического изображения в последовательности текстовых символов. -Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и т. д. -Далее выделенные текстовые фрагменты графического изображения страницы необходимо преобразовать в текст. Хорошее качество текстаРастровый метод распознавания текста Если исходный документ имеет типографское качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания решается методом сравнения с растровым шаблоном. -Сначала растровое изображение страницы разделяется на изображения отдельных символов. -Затем каждый из них последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством точек, отличных от входного изображения.

Плохое качество текстаСтруктурный метод распознавания При распознавании документов с низким качеством печати (машинописный текст, факс и т. д.) используется метод распознавания символов по наличию в них определенных структурных элементов (отрезков, колец, дуг и др.). Любой символ можно описать через набор параметров, определяющих взаимное расположение eгo элементов. Например, буква «Н» и буква «И» состоят из трех отрезков, два из которых расположены параллельно друг другу, а третий соединяет эти отрезки. Различие между буквами в величине улов, которые составляет третий отрезок с двумя другими. При распознавании структурным методом в искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех структурных элементов и их расположение больше всего соответствуют распознаваемому символу.
Программы распознавания текста Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition — OCR). Современная OCR должна уметь многое: распознавать тексты, набранные не только определенными шрифтами, но и самыми экзотическими, вплоть до рукописных. Уметь корректно работать с текстами, содержащими слова на нескольких языках, корректно распознавать таблицы. И самое главное — корректно распознавать не только четко набранные тексты, но и такие, качество которых, мягко говоря, далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей машинописной копии. Само собой, распознать текст — это еще полдела. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата — скажем, формата Microsoft Word. Наиболее распространенные системы оптического распознавания символов, например, ABBYY FineReader и CuneiForm от Cognitive, используют как растровый, так и структурный методы распознавания. Кроме того, эти системы являются «самообучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов) и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают. Существует также системы On-line распознавания текста: OnlineOCR и ABBYYFineReaderOnline (http://www.onlineocr.ru, http://finereader.abbyyonline.com) Системы оптического распознавания форм При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются различного вида бланки с полями. Рукописные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных. Сложность состоит в том, что необходимо распознавать символы, написанные от руки, а они довольно сильно различаются у разных людей. Кроме того, система должна определить, к какому полю относится распознаваемый текст. Системы распознавания рукописного текста. С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ. OCR-приложения-Это приложения, которые производят сканирование и распознавание текста, от англ. Optical Character Recognition — Оптическое распознавание символов -Это программы для перевода изображений документов в редактируемый текст, который можно затем обрабатывать в текстовых и табличных редакторах. По сравнению с ручной перепечаткой текста, такие программы дают существенный выигрыш в скорости работы, к тому же делают меньше ошибок. Еще одно достоинство — возможность сохранить иллюстрации, а они иногда не менее важны, чем текст документа. OCR CUNEIFORM -Это бесплатная программа сканирования и распознавания текста российского разработчика Cognitive Technologies. -OCR CuneiForm обеспечивает быстрое, удобное и качественное распознавание текста с сохранением исходного вида документа. Поддерживается распознавание с более 20 языков, среди них русский, украинский, английский, немецкий, французский, испанский, итальянский, португальский, шведский, финский, сербский, хорватский, польский, а также распознавание смешанного русско-английского текста. ABBYY FineReader

  • Популярная программа распознавания текста российской компании ABBYY
  • Программа производит распознавание текста с более 180 языков, для 38 из них предусмотрена встроенная проверка орфографии. Начиная с версии Professional, распознаются иврит, японский, тайский, китайский языки. Finereader открывает файлы графических форматов (TIFF, JPG, PFD, PNG и др.) в том числе DjVu – компактный формат для хранения отсканированных документов, книг.
  • Стоимость программы 3990 рублей
Читайте также:
Участник программы лояльности аэрофлот бонус или другого участника альянса skyteam что это

OmniPage

  • Популярная программа распознавания текста российской компании ABBYY
  • Программа отличается высокой скоростью и точностью распознавания. Распознаются более 120 языков с различными алфавитами: латинский, греческий алфавиты, кириллица, китайский, японский и корейский языки. Как и FineReader, OmniPage уверенно распознает документы, полученные с помощью цифровых камер с помощью технологии коррекции изображения «3D Correction».
  • Стоимость программы 6090 рублей
  • (150 евро)

Readiris

  • Программа сканирования и распознавания текста компании I.R.I.S.
  • Поддерживается распознавание текста с более 120 языков распознавания, включая русский, а также ближневосточные языки — арабский, иврит, фарси (в версии Middle-East) и японский, китайский, корейский (в версии Asian). Есть версия Readiris для Macintosh.
  • Вместе с поддержкой распознавания популярных форматов картинок, распознаются файлы PDF и DjVu.
  • Стоимость программы
  • 3845-14875 рублей (129 $-499 $)

Microsoft Office Document Imaging

  • Программа распознавания текста компании Microsoft
  • Программа Document Imaging способна работать только с двумя языками: английским и языком локализации самого MS Office. Для поддержки других языков необходимо дополнительно устанавливать пакет Multilingual User Interface (MUI). OCR настроек в программе практически нет, программа в автоматическом режиме поддерживает распознавание типа и размера шрифтов, картинок и простых таблиц.
  • Стоимость программы входит в стоимость пакета MS Office.

Источник: studfile.net

Все о Process Mining от ProcessMi

Все о технологии Process Mining — кейсы, термины, решения и аналитика. Российский и зарубежный опыт от группы экспертов ProcessMi

OCR — Оптическое распознавание символов

Оптическое распознавание символов

Оптическое распознавание символов – это особая технология, позволяющая трансформировать отсканированные файлы, PDF-документы и изображения в текстовые форматы с возможностью поиска и редактирования. Кроме того, в понятия “оптическое распознавание символов” сейчас вкладываются исследования в области Artificial intelligence, компьютерного зрения и распознавания образов.

Элементарный пример: партнер или клиент прислал вам бумажный документ (статья/брошюра/листовка/договор). Одной отсканированной версии вам будет недостаточно для изменения документа. Растровое изображение, чем и является скан, – совокупность множества цветных или черно-белых точек, не содержащая символов. Для извлечения и изменения данных необходимо специальное программное обеспечение, способное распознать и “разделить” символы, определить буквы и сформировать из них слова, правильно распределить их в предложения и абзацы. В дальнейшем это и даст возможность работать с информацией, содержащейся в исходном документе.

История

История оптического распознавания символов уходит в конец тридцатых годов прошлого века, когда немец Густав Таушек первым зарегистрировал патент на технологию оптического распознавания текста. Спустя двадцать лет, американский криптоаналитик Дэвид Шепард создал машину, которая решала подобные задачи. Впоследствии Шепард стал основателем компании, которая первая в мире выпустила собственные системы OCR. Одним из первых покупателей систем был журнал Readerʼs Digest, ставший одним из самых активных её пользователей.

Следующий виток развития OCR случился в 1974 году с созданием компании «Kurzweil Computer Products». Рэй Курцвейль, основатель, сделал акцент на развитие системы Optical Character Recognition, способной распознавать текст независимо от шрифта. Задумка заключалась в создании особой машины для незрячих людей, которая распознавала бы тексты и читала их вслух. Итоговый продукт был представлен в 1976 году, а в 1978 Курцвейль продал компанию Xerox Corporation.

В 1993 году на рынок вышел программный продукт для распознавания текста от ABBYY, получивший широкое распространение. В частности, на её основе была создана ABBYY FineReader. Технологию лицензируют крупнейшие мировые компании, среди которых EMC, Samsung и др.

Особенности и виды технологии

Источники данных могут быть разными – от сканов документов и фотографий отчетов до визиток, счетов-фактур и цифровых квитанций.

Как правило, алгоритм всех систем достаточно похож: OCR преобразует полученное изображение (скан, фото и т.д) при помощи палитры двух цветов, один из которых должен быть значительно темнее другого, поэтому чаще всего используется черно-белая гамма. Когда все страницы переведены в два цвета, начинается анализ: светлые участки документов определяются как фон, а темные – как совокупность символов, которые нужно распознать.

Существующие программы распознавания могут иметь разные методы работы, но, как правило, все они базируются на двух алгоритмах:

  • проработка материала идет по примерам;
  • анализ идет на основе прописанных правил относительно каждого знака. Программа оценивает отдельный символ с заданными параметрами начертания той или иной буквы/цифры. Например, заглавная буква “М” может обозначаться как две вертикальные линии, соединенные двумя диагоналями посередине.

На текущий момент существует несколько видов OCR-систем, которые отличаются по тонкостям, стоимости и скорости работы:

  • OCR – классическая версия функционала, рассчитанная на “перевод” и распознавание текста с отсканированных изображений;
  • ICR – определение и перевод в текстовый формат раздельных печатных символов от руки или напечатанных витиеватым шрифтом;
  • OMR – распознавание отметок (галочки, маркеры, круги, крестики);
  • IWR – распознавание в рамках контекста. В отличие от предыдущих систем, фокусирующихся на конкретных символах, IWR способны определять слова или предложения. Считается, что такой вид OCR способен распознавать наиболее подробно и наименее ошибочно все рукописные тексты.

Источник: processmi.com

Программы оптического распознавания текста что это

Выбор

Как же выбрать наиболее подходящую программу, и какие основные особенности имеет такой софт?

Отличаться он может по разным показателям – точности распознавания, способности работать с тем или иным языком, возможности сохранять исходную структуру текста и т. п.

Такой софт может распространяться платно и бесплатно, и быть реализован как онлайн (в виде особых сервисов), так и в форме предустанавливаемых программ.

Алгоритм работы заключается в том, что для каждой буквы алфавита составляется база вариантов того, как она может выглядеть на фото, выделяются и сохраняются ее основные элементы. Как только такие элементы обнаруживаются на фото, программа распознает соответствующую букву. В зависимости от того, насколько качественно и подробно была составлена такая база, зависит качество распознавания материала в итоге.

Потому важно, чтобы софт был рассчитан на работу именно с русским языком (некоторые программы могут работать с текстом, написанным сразу на двух языках, другие – нет).

Кроме того, некоторые утилиты и сервисы способны сохранять даже изначальную структуру текста (таблицы, списки), тип его оформления (отступы и т. п.) и даже шрифт.

В каких же случаях такой софт необходим?

  • При создании документов, когда имеется только распечатанный вариант;
  • При составлении рефератов, докладов и необходимости процитировать в них большой отрывок текста из книги;
  • Для редакторских работ, когда текст имеется лишь в формате фото и т. д.

На самом деле сфера использования софта очень велика, и правильно выбранный, он способен облегчить и ускорить работу с текстом.

Это наиболее качественный и многофункциональный софт в данном ТОПе. Он отличается высокой точностью распознавания и имеет целый ряд преимуществ, распространяется платно.

Читайте также:
Индивидуальная программа саморазвития педагога что это

Программа успешно работает со множеством языков, в ходе распознавания способна сохранять структуру текста и тип его форматирования.

Предназначена для профессионалов, потому, по мнению большинства пользователей, своих денет стоит.

  • Высокое качество распознавания;
  • Большое количество поддерживаемых языков;
  • Способность сохранять стиль форматирования и особенности структуры документа достаточно точно;
  • Наличие бесплатной пробной версии на 10 дней;
  • Отсутствие снижения качества работы даже при больших объемах текста (что нередко наблюдается у других программ, которые хуже и хуже распознают текст с каждой последующей загруженной фотографии, и проблема устраняется только после перезапуска).
  • Довольно значительная нагрузка на аппаратные ресурсы компьютера;
  • Платное распространение по высокой стоимости при довольно коротком пробном периоде (всего на 10 дней);
  • Замедление работы устройства при работе программы.

Отзывы о данном софте различны: «Хорошая программа, очень помогает в работе», «Не стоит своих денег – есть и бесплатные программы с таким же качеством распознавания».

OCR Cunei Form

3 года назад

Верю на слово, хотя эти программы мне теперь нафиг не нужны.
Лет 15 назад дочке на диплом сканировал тексты.
Так вот кроме Abbyy Fine Reader ничего путного не нашел.
Причем ни платные, ни бесплатные толком кириллицу распознавать не хотели.
Нет, с латинницей все было более менее. А вот с кириллицей только Abbyy Fine Reader.
Пришлось на торрентах искать и качать.

3 года назад

Кстати, уважаемые коллеги и уважаемые читатели форума данной тематики.
Хотите я Вас удивлю, не проводя даже предварительного опроса.
Особенно это касается обычных читателей, которые находятся в процессе изучения компьютерных премудростей.
Прошу в ответном комментарии поставить «1», кто понимает, зачем вообще нужны подобные программы. И «0», кто не понимает.
Не стесняйтесь. Рубите правду матку смелее.
P.S. 15 лет назад 95% обычных пользователей компьютера вообще не понимало, о чем идет речь.
P.P.S. Заодно вместе сравним.

3 года назад

Ещё со времён ХР и эффории улучьшалок , гаджетов , оптимизов и пр. красивостей , то и дело нарывался на глюки компа с сообщениями на пиндосском . А набирать текст в яндо-гугель переводчиках долго и нудно . Вот и нянькался с офлай-переводчиками и словарями , да скан-утилитами . Одно время остановился на ScreenTranslator , с возможностью сразу переводить текст с таблички сообщения или фотки , но намаялся я с её неудобо-пользованием и враньём , да ещё не все сообщения можно сканировать . Сейчас пользую исключительно удобного Abbyy Screenshot Reader — скан сразу в текст превращает и буфер обмена отправляет . Оттуда в янд-переводчик .А недавно узнал что янд-переводчик распознает текст в скрин-фотках и переводит , даже с дубоватого штатного в ПК скриншотера .

3 года назад

григорий, ну неплохо.
А качество распознавания и перевода вас устраивает? Просто я такого не пробовал.
Но, думаю это тоже на латиницу ориентировано. Ну и судя по волшебному «Screen» объемы текстов тоже небольшие? Хотя от с крина большего и не требуется.

3 года назад

Олег, За последние 10 лет Янд-переводчик стал очень качественно адаптировать англоские кракозябры в правильные русские понятки . По сравнению с ручным переводом со словарём , даже техническим , с результатом как в смешных китайских инструкциях на русском , у янда вполне понятен смысл всплывающих сообщений . А при сомнениях отдельных слов , выделив их в янде , выдаёт несколько вариантов . А то в опробованых сканер-переводчиках и оф- и онлайновых , частенько выданную галиматью никаким тусованием смысла не понять было . Мне надобности нет многостраничных переводов , потому вполне подходит этот двух-шаговый вариант , даже для десятки-строчковых текстов.

3 года назад

Делайте нормальные ссылки на ресурсы, где можно скачать программы.

3 года назад

Я наверно тоже достаточно архаичен. Abbyy Fine Reader использовал начиная с 4 версии. Ничего другого в то время более менее приличного тоже не нашел. Последнее время применял это ПО не для сканирования, а для конвертации PDF в WORD. Очень удобно. загружаешь PDF и распознаешь. как графику.

Если хорошо настроить, то почти 100% распознавание.

3 года назад

3 года назад

Спасибо. Может, и пригодятся. Лет 10 как приходится заниматься редакцией и коррекцией (причём вычитывать как жёсткую корректуру, т.е. с красным карандашом по распечатке, так и опусы в жидком виде, т.е. в окне InDesign).
В целом же отношение такое, что всего уметь невозможно, — и пускай один занимается набором и превращениями в редактируемый текст твёрдых оригиналов, фоток и скриншотов, т.е. хорошо делает техническую часть, а другой — вычиткой и правками, но тоже с профи-качеством.

3 года назад

Дмитрий! Но ведь если на работе инженер — электроник, а дома не может лампочку вкрутить, то это тоже не дело. Все это инструменты для повседневной работы и на твердую четверку их надо знать. Я не думаю что это будет плохо, когда вот горько надо в PDF внести правку какую-то, а не можешь.

3 года назад

Александр, это если (редко на практике) PDF-«изображение». А так-то для внесения изменений (исправления опечаток) и создания примечаний в обычном файле PDF/A-mode используются Adobe Acrobat и опция «доступ к рецензированию/редактированию» (не нужно распознавать и конвертировать в Word, а затем после правки опять делать PDF). Честно говоря, от коррекции распознанных-из-графики текстов (например, старую книгу сканировали в Word) всегда наотрез отказывался — слишком много «неверностей», ерунда завсегда — по внутренним полям (область к переплёту редко ложится плоско на зеркало сканера).
Что мужчина в повседневной жизни должен уметь то и другое и третье — звучит и выглядит красиво, — не спорю. А я вот на практике и «на тройку с минусом» не разбираюсь ни в автомобиле, ни в смартфоне, ни в стиральной машине, не говоря уже про «умный дом», и (как эксперт по биоразнообразию) рассуждаю так — феномен разнообразия с диапазоном (разбросом характеристик) наблюдается и тут: 80% удовлетворительно справляются с самостоятельным ремонтом-настройкой девайсов и соотв.софта, 10% разбираются как профи, 10% чайниками и останутся, и не каждому дано во всём быть успевающим. Век живи — век учись, это верно, причём «тяжело в учении» (даже если учиться любишь), а пожить в удовольствие времени осталось уже немного.
Да, и думаю, что скоро (пятилетка +/-) появятся намного более совершенные мобильные приложения для распознания графики в текст (и речь) и речи в текст с переводом. Сейчас, пока, увы, — наведёшь смартфон на уличную вывеску, а он теряется — то ли словенский язык, то ли греческий, и с мультиязычной речью также «удивляет» результатами. Китайские разработчики в этом определённо хороши.

3 года назад

P.S. Александр, «плюс» Вам за ответ мне — это раз. Второе — Ваш оборот «когда вот горько надо» так и не «распознал» (чутьём-то догадываюсь, о чём речь, но. ).

Источник: pomogaemkompu.temaretik.com

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru