Какие устройства из указанных ниже необходимы для работы с программами распознавания текста

Человечество испокон веков создавало книги и прочую письменную продукцию, надеясь на то, что потомки ее хотя бы разок прочитают. Более или менее равномерно так и происходило до середины XX века, до появления компьютеров, когда оказалось, что будущее все же за электронными книгами. Сейчас, с началом XXI века, это предположение похоже на правду – бумажными книгами интересуются все меньше, а электронные представлены в самом широком спектре. Некоторые писатели даже изначально пишут онлайн-версии книг, а только потом начинают продавать бумажные варианты. У Стивена Кинга, правда, не получилось…

Но суть не в этом. То, что уже было написано, требовалось превратить в электронный вид. Так как желающих набирать все это заново не находилось, программистам пришлось писать программы распознавания текста. Именно тогда прославилась программа FineReader, хотя были программы и до нее, и после нее тоже будут.

Идея программы проста – загоняем в сканер лист с текстом, а затем получаем ее оцифрованное изображение. Изображение поступает в программу, которая «ищет систему», выделяет символы, абзацы, таблицы и рисунки. Текстовая составляющая прогоняется через алгоритм распознавания образа и превращается в компактный код, которому придается то же оформление, что и оригиналу.

Инструменты распознавания текстов и компьютерного перевода | Информатика 7 класс #27 | Инфоурок

Интересно, как развивалась история этих алгоритмов. Сначала, в древних программах, алгоритм мог распознавать лишь те виды шрифтов, которые хранились в него в базе. Грубо говоря, это были образцы шрифта печатных машинок, типичные шрифты газет и книг. Символы определялись по ключевым точкам, методом наложения и пересечения шаблонов.

Приемы были грубоваты, и им мешало все – цвет букв, курсив и подчеркивание, искажение шрифта. Зато такие программы работали быстро, подбирая символы по принципу «похоже – не похоже». Но шрифтов стало много, и поэтому такие программы перестали справляться с работой, уступив место «интеллектуальным».

Те тоже проводили предварительные работы с изображением символа, но уже другого плана – в основном, чистили «шум», а затем пытались преобразовать графику в векторы, а векторы – в набор формул или уравнений. Особенно интересно смотрится такая подготовка в книгах Д. Кнута о программе TEX, где приведена теория сплайнов и их расчетов. Таким образом, программе становится неважно, как именно искажен шрифт – она ищет не ключевых точки, а систему и допуски на ошибку. И об ошибках – долгое время программы выдавали на вывод смешанные тексты с многочисленными ошибками, пока не появились хорошие словари, позволяющие не только определять язык текста, но и автодополняющие слова, что сделало распознавание почти стопроцентным.

23 июня 2012,
6027

Интернет-технологии, Веб-программирование, Распознавание текста

Комментировать

  1. Информация об IP
  2. Антивирусная проверка
  3. Данные из Whois
  4. Проверить заголовки
  5. Punycode конвертер
  1. Обзоры
  2. Информация о сайтах
  3. Скрипты для сайта
  4. Новости Интернета

Источник: codomaza.com

Лучшие программы для распознавания текста. Рейтинг OCR.

Сравнительный анализ программ для распознавания текста

В данной части работы, рассмотрим необходимое программное обеспечение для распознавания и перевода вышеприведенных документов из графического формата в текстовый. Безусловно, лидер программ в распознавании текста является ABBYY FineReader, но, чтобы удостовериться в этом, проведем сравнительный анализ еще нескольких программ для распознавания текста из графического файла. В результате мы сможем, во-первых, оценить рынок доступных ПО для распознавания текста, во-вторых, указать сильные и слабые стороны каждого из них.

ABBYY FineReader 12 — это профессиональное программное обеспечение, с помощью которого можно распознавать текст из графического файла и переводить его в различные редактируемые форматы. Программа точно определяет текст и структурно его переводит в нужный формат. Она позволяет не перепечатывать текст в ручную, а это, в свою очередь, сокращает затраты на обработку. Данное ПО используется в фирмах и организациях, которые постоянно работают с бумажной документацией. ABBYY FineReader конвертирует файлы из форматов PDF, TIFF, JPEG в форматы PDF, DOC, XLSX, TXT и другие. [7]

Читайте также:
Примерный учебный план по общеразвивающей программе

Начальное окно программы ABBYY FineReader 12

Рис.5 Начальное окно программы ABBYY FineReader 12

Далее проведем анализ на выявление слов с ошибками и качество обрабатываемого документа на примере 10 исполнительных листов:

Таблица 1 Данные, полученные при обработке документов программой ABBYY FineReader 12

Слов с ошибками (нет слов)

Соотношение слов без ошибок к общему количеству слов (обработано ABBYY FineReader 12)

Рис.6 Соотношение слов без ошибок к общему количеству слов (обработано ABBYY FineReader 12)

Как видим из показанной выше диаграммы, программа ABBYY FineReader 12 очень качественно обрабатывает документы, переводя их из графического формата в текстовый формат. В среднем, количество распознанных слов составляет 91,3 %. Данное программное обеспечение показало себя, как качественный продукт. Также стоит отметить, что ключевые поля, по которым в дальнейшем будут выгружаться данные из документа, были распознаны хорошо и без ошибок, а значит, основную задачу оптимизации и автоматизации возможно реализовать.

Плюсы: высокое качество распознавания текстов, широкий выбор входных и выходных форматов документов, простой и понятный пользовательский интерфейс

Минусы: данное ПО платное, не имеется открытого доступа к исходным кодам программы (используя их, можно было бы запускать программу с помощью написанного кода на С#)

FREE ONLINE OCR SERVICE — это бесплатный он-лайн сервис для распознавания текста из различных форматов. Его легко и просто использовать любому пользователю, т.к. нет необходимости загружать и устанавливать программу на компьютер. Данный продукт поддерживает множество языков для распознавания (в том числе и русский).

Форматы выходных файлов в FREE ONLINE OCR SERVICE:

Поддерживаемые форматы в FREE ONLINE OCR SERVICE

Рис. 7 Поддерживаемые форматы в FREE ONLINE OCR SERVICE

Имеется возможность перевести текст в один из трех форматов: Microsoft Word, Microsoft Excel и Text Plain. В основном, для быстрого распознавания текста этих форматов достаточно. Так как имеется необходимый в данной дипломной работе формат .txt, то сравним качество обработанного документа и вероятность некорректного перевода текста.

Таблица 2. Данные, полученные при обработке документов программой FREE ONLINE OCR SERVICE

Слов с ошибками (нет слов)

Рис.8 Соотношение слов без ошибок к общему количеству слов (обработано FREE ONLINE OCR SERVICE)

Исходя из полученных результатов, можно сделать вывод, что данный сервис имеет высокий уровень распознавания текста. В среднем, количество распознанных слов составляет 67,5 %. Данный сервис является хорошим способом быстро распознать графический файл и перевести его в текстовый формат, но для оптимизации реального бизнес-процесса данный продукт не подходит из-за узкого спектра функциональных возможностей.

Плюсы: простота в использовании, быстрый доступ с любого устройства с выходом в интернет, множество языков для распознавания.

Минусы: в отличие от загруженных программ для оптического распознавания текста, данный продукт не имеет таких широких функциональных возможностей.

CuneiForm — это программа, используемая для распознавания текста документов и дальнейшего перевода в редактируемый вид. Данный продукт бесплатный и доступный любому пользователю. В результате работы программы можно получить файл в нужном формате с отредактированным текстом.

Форматы выходных файлов в CuneiForm:

Рис.9 Поддерживаемые форматы в CuneiForm

Таблица 3. Данные, полученные при обработке документов программой OCR CuneiForm

Слов с ошибками (нет слов)

OCR CuneiForm является низкокачественным программным продуктов для распознавания оптического текста. Основную часть слов переводит в непонятный набор символов или вообще не распознает. В среднем, количество распознанных слов составляет 12,8 %. Это очень низкое качество.

Читайте также:
Как найти номер максимального элемента паскаль программа

Плюсы: данная программа бесплатная, русифицированная, имеется доступ к исходным кодам программы (используя их, можно запускать программу для анализа графического документа с помощью написанного кода на С#)

Минусы: низкое качество распознавания

Выводы после проведенного анализа:

Анализ проводился без корректировки активных полей для распознавания, т.е. программы переводили текст только в тех местах графического файла, где они его определили. Суть распознавания без корректировки в том, что мы не тратим время на выбор того или иного поля, соответственно, не затрачиваем время на обработку. В таком виде анализа возможны потери качества, но так как основная цель дипломной работы — оптимизировать бизнес-процесс, значит, будем полагаться на корректную обработку документа программой для оптического распознавания текста.

Ниже представлена диаграмма, сравнивающая количество обработанных слов различными программами:

Соотношение слов без ошибок к общему количеству слов для разных программ по распознаванию текста

Рис.10 Соотношение слов без ошибок к общему количеству слов для разных программ по распознаванию текста

Качество обработки документов (количество обработанных слов, выраженное в процентах, %)

Рис.11 Качество обработки документов (количество обработанных слов, выраженное в процентах, %)

Исходя из результатов анализа, можно сделать вывод, что программа ABBYY FineReader является наилучшим продуктом для оптического распознавания графического файла. Данная программа имеет широкий спектр возможностей и множество плюсов. Сервис FREE ONLINE OCR SERVICE также неплох для быстрого распознавания текста на картинке, но не подходит для автоматизации бизнес-процесса из-за минимального функционала. Программное обеспечение OCR CuneiForm оказалось низкокачественным продуктом и не будет использовано в качестве программы, используемой в данной дипломной работе.

Также были проанализированы программы для распознавания текстов, такие как TopOCRDemo и Capture Text, но ни одна из них в нашем случае не показала достойных результатов в качественном переводе текста из графического формата в текстовый. В данной дипломной работе будет использована программа ABBYY FineReader 12.

Источник: vuzlit.com

СИСТЕМА РАСПОЗНАВАНИЯ И ОБРАБОТКИ ТЕКСТА Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Злобин Д.С.

Рассматриваются программы распознавания и обработки текстов . Исследуется возможность обработки бумажного текста с целью ускорения процесса создания электронного документа . Предложена система объединения мобильного сканера с программой оптического распознавания символов . Практическое применение системы распознавания текста позволит быстро получить электронный документ с возможностью вносить корректировки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Злобин Д.С.

Анализ рынка современных информационных систем оптического распознавания символов (OCR)
Распознавание рукописного и печатного текста при разработке требований к программному обеспечению
Оптимизированный подбор фильтров при оптическом распознавание символьной информации
Распознавание и озвучивание текстов для обеспечения учебного процесса людей с нарушениями зрения

Автоматизированная система извлечения персональных данных сотрудников образовательных организаций
i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «СИСТЕМА РАСПОЗНАВАНИЯ И ОБРАБОТКИ ТЕКСТА»

УДК. 004.42 004.453

ИжГТУ имени М.Т. Калашникова, г. Ижевск, РФ Научный руководитель: Кучуганов А. В.

доктор технических наук, доцент ИжГТУ имени М.Т. Калашникова, г. Ижевск, РФ

СИСТЕМА РАСПОЗНАВАНИЯ И ОБРАБОТКИ ТЕКСТА

Рассматриваются программы распознавания и обработки текстов. Исследуется возможность обработки бумажного текста с целью ускорения процесса создания электронного документа. Предложена система объединения мобильного сканера с программой оптического распознавания символов. Практическое применение системы распознавания текста позволит быстро получить электронный документ с возможностью вносить корректировки.

Мобильный сканер, оптическое распознавание символов, система распознавания, обработка текста, электронный документ.

В связи со стремительным развитием информационных технологий и их повсеместным внедрением системы распознавания текста становятся крайне востребованным инструментом, а документы в бумажном формате все чаще имеют электронную копию. В сегодняшних реалиях количество и объёмы документов увеличиваются каждый день. Объем электронных документов начинает превосходить объем бумажных аналогов. Можно с уверенностью сказать, что бумажные документы не потеряют своей актуальности использования, но доминировать в области информатики всё же будет использование электронных вариантов [1].

Читайте также:
Примеры программ на языке lad

Система распознавания текста имеют высокий интерес во многих отраслях: банковская сфера, энергетика, образование, медицина. Этот список будет увеличиваться, так как везде, где есть документооборот, данная система становится необходима.

Необходимость системы обусловлена в первую очередь скоростью передачи информации. Действия по документообороту раньше могли занимать не один день, сегодня же это составит буквально несколько минут. Благодаря быстрой скорости получения и обработки информации, стало возможным внесение корректировок, что сократило ошибки, ведущие к потерям денежных средств.

Второй особенностью является хранение данных, так как вся информация, хранящаяся на бумаге, со временем становится невозможной для чтения, что означает потерю информации. Следовательно, ее нужно перевести в электронный вид. Это позволяет получить доступ к информации из любой точки мира, осуществлять обработку больших объемов информации, полученных с печатных источников в короткие промежутки времени. Все это благоприятно сказывается на развитии науки в разных направлениях.

Системы распознавания документов можно разделить на две категории:

1. Мобильные сканеры. Это категория мобильных приложений. Основной функционал заключается в фотографировании документа, далее его сохранении в формате PDF или JPEG.

2. Программы оптического распознавания символов. Данные программы уже непосредственно распознают фотографии, а после преобразовывают их в электронный документ любого формата.

Основой недостаток обоих вариантов ограниченная функциональность. Что не позволяет оперативно получить на мобильном устройстве документ в формате doc или doch из фотографии.

Мобильные сканеры работают по принципу: сфотографировал и сохранил. Для этого используется системная камера, хотя многие используют, разработанную своими силами, оснащенную дополнительными настройками. Получив фото, приложение предлагает инструменты для его редактирования — обрезание, поворот, добавление надписи и т.д. Но даже подобный функционал приложения имеется не у всех. Для смартфонов под управлением Android в магазине Google Play имеется более десятка мобильных сканеров, но ни один не имеет возможности создать электронный документ формата doc или docx [2].

Программы оптического распознавания символов, с точки зрения распознавания имеют широкий функционал:

1) извлечение текста с изображений (pdf файлов);

2) возможность переводить текст на несколько языков;

3) обработка во встроенном текстовом редакторе;

4) сжатие отсканированного текста (уменьшение размера файла);

5) встроенный словарь для проверки орфографии [3].

Имея данный функционал, они предъявляют высокие требования к системным характеристикам, что обуславливает их использование только на персональном компьютере. Получив необходимый документ, его можно только сохранить. Программы не имеют функции для отправки документа.

Предлагается система распознавания текста, полученного с мобильного устройства, его обработки в программе оптического распознавания символов, сохранения в базе банных и отправки в формате текстового документа обратно на мобильное устройство. Данная система имеет функции обоих видов категорий распознавания текста.

Система состоит из двух частей. Первая часть предусматривает приложение на мобильном устройстве, аналогичное мобильному сканеру. Вторая часть предусматривает программу на персональном компьютере, осуществляющую взаимодействие с программой оптического распознавания символов, базой данных и приложением с мобильного устройства.

Принцип работы системы следующий. Имеем бумажный текстовый документ, пользователь его фотографирует, далее указывает формат электронного документа, который хотел бы получить. Затем отправляет фотографию на персональный компьютер. Программа на персональном компьютере принимает фотографию с мобильного устройства, располагает его в базе данных. Параллельно фотография поступает в текстовый редактор, который распознает их и формирует документ, после чего документ автоматически отправляется обратно на мобильное устройство и также сохраняется в базе данных.

Несмотря на то, что практическое применение данной системы требует дальнейших доработок, уже сейчас понятно, что ее применение позволит ускорить процесс получения электронного документа из бумажной версии с возможностью внесения корректировок и дальнейшего использования в электронном или бумажном виде.

Список использованной литературы:

Источник: cyberleninka.ru

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru