Правильный алгоритм работы с программой abbyy finereader

ABBYY FineReader – это система оптического распознавания текстов (Optical Character Recognition, OCR). Она предназначена для того, чтобы быстро перевести отсканированные бумажные документы, а также PDF–файлы в удобный для дальнейшего использования электронный формат – файл Word или Excel, HTML–страничку, презентацию PowerPoint или в любой другой из поддерживаемых форматов, при этом полностью сохранив оформление документа. FineReader удовлетворяет самым высоким требованиям профессиональных пользователей благодаря большому количеству различных опций и настроек.

2 Установка и запуск

Для установки FineReader используется специальная программа установки, входящая в состав дистрибутива. Всегда производите установку, используя CD–Rom только из дистрибутива, который Вы получили при покупке.

Установка программы FineReader

Программа установки поможет Вам установить ABBYY FineReader. Перед началом установки рекомендуется закрыть все другие приложения. Чтобы установить ABBYY FineReader:

FineReader. Урок 3: Работа с более сложными документами

1. Вставьте компакт–диск в дисковод для компакт–дисков. Программа установки запустится автоматически.

2. Следуйте инструкциям программы установки. В случае если программа установки не запустилась автоматически:

1. Нажмите кнопку Пуск на Панели Задач и выберите пункт Настройка/Панель управления.

2. Дважды нажмите на значок Установка и удаление программ.

3. Выберите закладку Установка и удаление и нажмите кнопку Установить.

4. Далее следуйте инструкциям программы установки.

В процессе установки программы FineReader Вам будет предложено выбрать одну из предложенных опций установки:

_ Обычная (рекомендуется) – устанавливаются все компоненты дистрибутива, в том числе все языки распознавания, язык интерфейса (один) – выбранный при установке.

_ Установка компонентов дистрибутива по выбору – из предложенного набора компонентов, входящих в дистрибутив, Вы можете выбрать только те, которые нужны Вам (в том числе доступные языки распознавания).

Основы работы с программой FineReader

ABBYY FineReader позволяет ввести документ одним нажатием на кнопку Scan

— целенаправленность – распознавание строится как процесс выдвижения и целенаправленной проверки гипотез;

— адаптивность – способность OCR-системы к самообучению.

В соответствии с этими тремя принципами система сначала выдвигает гипотезу об объекте распознавания (символе, части символа или нескольких склеенных символах), а затем подтверждает или опровергает ее, пытаясь последовательно обнаружить все структурные элементы и связывающие их отношения. В каждом структурном элементе выделяются части, значимые для человеческого восприятия: отрезки, дуги, кольца и точки. Следуя принципу адаптивности, программа самостоятельно «настраивается», используя положительный опыт, полученный на первых уверенно распознанных символах. Целенаправленный поиск и учет контекста позволяют распознавать разорванные и искаженные изображения, делая систему устойчивой к возможным дефектам письма.

Читайте также:
Программа руки солиста это клавиатурный тренажер

FineReader. Урок 1: Интерфейс. Настройка

В результате работы в окне ABBYY FineReader появится распознанный текст, который Вы можете отредактировать и сохранить в наиболее удобном для Вас формате.

ABBYY FineReader работает со сканерами через TWAIN-интерфейс. Это единый международный стандарт, введенный в 1992 году для унификации взаимодействия устройств для ввода изображений в компьютер (например, сканера) с внешними приложениями. При этом возможно два варианта взаимодействия программы со сканерами через TWAIN-драйвер:

— через интерфейс ABBYY FineReader: в этом случае для настройки опций сканирования используется диалог программы ABBYY FineReader «Настройки сканера»;

— через интерфейс TWAIN-драйвера сканера: для настройки опций сканирования используется диалог TWAIN-драйвера сканера.

Особенности каждого из режимов.

В режиме «Использовать интерфейс TWAIN-драйвера сканера», как правило, доступна функция предварительного просмотра изображения (preview), позволяющая точно задать размеры сканируемой области, подобрать яркость, тут же контролируя результаты этих изменений. Диалог TWAIN-драйвера у каждого сканера выглядит по-своему, в большинстве случаев все надписи даются на английском языке. Вид этого окна и смысл опций описан в документации, прилагаемой к сканеру. В режиме. «Использовать интерфейс ABBYY FineReader» доступны такие опции, как возможность сканирования в цикле на сканерах без автоподатчика, сохранение опций сканирования в отдельный файл набора опций (*.fbt) и возможность использования этих опций в других пакетах.

Вы можете легко переключаться между этими режимами: на закладке Сканировать/Открыть диалога Опции (меню Сервис>Опции) установите переключатель в одно из положений: Использовать интерфейс TWAIN-драйвера сканера или Использовать интерфейс ABBYY FineReader.

— для некоторых моделей сканеров опция Использовать интерфейс ABBYY FineReader может быть по умолчанию отключена (недоступна);

— чтобы в режиме Использовать интерфейс ABBYY FineReader показывался диалог Настройки сканера, на закладке Сканировать/Открыть (Сервис>Опции) отметьте пункт «Запрашивать опции» перед началом сканирования.

Важно! Для того чтобы правильно подключить сканер, обратитесь к документации, прилагаемой к сканеру. При установке не забудьте установить необходимое программное обеспечение, поставляемое вместе со сканером (драйвер TWAIN и/или сканирующую программу).

Чтобы запустить сканирование: Нажмите кнопку «Сканировать» или в меню «Файл» выберите пункт «Сканировать изображение». Спустя некоторое время в главном окне программы ABBYY FineReader появится окно «Изображение» с «фотографией» отсканированной страницы.

Читайте также:
Программа для астрологии джйотиш самая удобная

Если вы хотите отсканировать несколько страниц, то на закладке «Сканировать/Открыть» (Сервис>Опции) отметьте пункт «Сканировать несколько страниц».

В случае если сканирование не началось сразу, показывается один из следующих диалогов:

— встроенный TWAIN-диалог сканера. Установите параметры сканирования и нажмите кнопку Scan (Final и так далее, название кнопок зависит от конкретной модели сканера);

— диалог «Настройки сканера». Установите параметры сканирования и нажмите кнопку Scan (Final и так далее, название кнопок зависит от конкретной модели сканера).

ABBYY FineReader отсканирует и распознает изображения. В главном окне программы появятся окно «Изображение» с «фотографией» отсканированной страницы и окно «Текст» с результатом распознавания. Распознанный текст вы можете передать во внешние приложения или сохранить в одном из поддерживаемых форматов.

Установка параметров сканирования.

Качество распознавания во многом зависит от того, насколько хорошее изображение получено при сканировании. Качество изображения регулируется установкой основных параметров сканирования: типа изображения, разрешения и яркости.

Основными параметрами сканирования являются:

— тип изображения – серый (256 градаций), черно-белый или цветной. Сканирование в сером является оптимальным режимом для системы распознавания. В случае сканирования в сером режиме осуществляется автоматический подбор яркости.

Черно-белый тип изображения обеспечивает более высокую скорость сканирования, но при этом теряется часть информации о буквах, что может привести к ухудшению качества распознавания документов среднего и низкого качества печати. Если вы хотите, чтобы содержащиеся в документе цветные элементы (картинки, цветные буквы и цветной фон) были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной тип изображения. В других случаях используйте серый тип изображения.

— разрешение – используйте 300 dpi для обычных текстов (размер шрифта 10 и более пунктов) и 400-600 dpi для текстов, набранных мелким шрифтом (9 и менее пунктов).

— яркость – в большинстве случаев подходит среднее значение яркости порядка 50%. Для сканирования некоторых документах в черно-белом режиме может понадобиться дополнительная настройка яркости.

Замечание. Сканирование с разрешением 400-600 dpi вместо 300 dpi или сканирование в сером или в цвете может занять существенно больше времени, чем сканирование в черно-белом режиме. На некоторых моделях сканеров сканирование с разрешением 600 dpi занимает в 4 раза больше времени, чем сканирование с разрешением 300 dpi.

Читайте также:
В каких выражениях произойдет зацикливание программы

При сканировании через TWAIN с использованием интерфейса ABBYY FineReader: на закладке Сканировать/Открыть в диалоге Опции (меню Сервис/Опции) щелкните по кнопке «Настройки сканера» и в открывшемся диалоге Настройки сканера установите нужные опции.

При сканировании через TWAIN с использованием интерфейса TWAIN-драйвера сканера для установки параметров сканирования используется диалог сканера, который открывается автоматически при нажатии на кнопку «Сканировать».

Источник: studopedia.su

Правильный алгоритм работы с программой abbyy finereader

somovakrist

September 2021 1 31 Report

Выбери правильный алгоритм работы с программой ABBYY FineReader.

1. Бумажный носитель помещается в сканер.
2. В программе отдаётся команда Сканировать.
Создаётся цифровая копия исходного документа в формате графического изображения.
3. Программа распознавания текста анализирует структуру документа, выделяя на его страницах блоки текста, таблицы, картинки и т. п. Строки разбиваются на слова, а слова — на отдельные буквы. После этого программа сравнивает найденные символы с шаблонными изображениями букв и цифр, хранящимися в её памяти. Программа рассматривает различные варианты разделения строк на слова и слов на символы. В программу встроены словари, обеспечивающие более точный анализ и распознавание, а также проверку распознанного текста. Проанализировав огромное число возможных вариантов, программа принимает окончательное решение и выдает пользователю распознанный текст.
4. Распознанный текст переносится в окно текстового редактора, в котором пользователь может редактировать и форматировать распознанный текст.

1. Бумажный носитель помещается в сканер.
2. В программе отдаётся команда Сканировать.
Создаётся цифровая копия исходного документа в формате docx.
3. Программа распознавания текста анализирует структуру документа, выделяя на его страницах блоки текста, таблицы, картинки и т. п. Строки разбиваются на слова, а слова — на отдельные буквы. После этого программа сравнивает найденные символы с шаблонными изображениями букв и цифр, хранящимися в её памяти. Программа рассматривает различные варианты разделения строк на слова и слов на символы. В программу встроены словари, обеспечивающие более точный анализ и распознавание, а также проверку распознанного текста. Проанализировав огромное число возможных вариантов, программа принимает окончательное решение и выдает пользователю распознанный текст.
4. Распознанный текст переносится в окно текстового редактора, в котором пользователь может редактировать и форматировать распознанный текст.

Источник: scholar.tips

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru