FineReader — это система оптического распознавания текстов (OCR), которая преобразует полученное с помощью сканера графическое изображение (картинку) в текст (т. е. в коды букв, «понятные» системе).
Процесс ввода текстов в компьютер осуществляется в несколько этапов: сканирование; выделение блоков на изображении; распознавание; проверка ошибок; сохранение результата распознавания (передача его в другое приложение, в буфер и т. п.).
Программа Fine Reader выпускается отечественной компанией ABBYY Software (www.bitsoft.ru). Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных двуязычных текстов.
Программа имеет ряд удобных возможностей. Она позволяет объединять сканирование и распознавание в одну операцию, работать с пакетами документов (или с многостраничными документами) и с бланками. Программу можно обучать для повышения качества распознавания неудачно напечатанных текстов или сложных шрифтов. Она позволяет редактировать распознанный текст и проверять его орфографию.
Программы распознавания текста
Fine Reader работает с разными моделями сканеров. В частности, Программа поддерживает стандарт TWAIN.
Порядок выполнения работы
1. Выполните сканирование предложенного Вам документа и сохраните его в папке «…. Группа» на Рабочем столе центрального компьютера.
2. Скопируйте папку «…. Группа» в Общую папку на центральном компьютере.
3. По локальной сети откройте эту папку на вашем компьютере. Скопируйте свой документ в свою папку.
4. Запустите программу FineReade r (Пуск – Программы)
5. В окне FineReader выполнитекоманду Файл – Открыть изображение, найдите свой документ и откройте его в окне программы FineReader.
6. Выберите язык для распознавания документа.
7. Выполните распознавание графического файла, сегментируйте текстовые блоки, таблицы и рисунки.
8. Выполните проверку отсканированного документа. Ошибки исправляйте в окне Текст или в диалоговом окне Проверка.
9. Сохраните отсканированный документ в формате Word.
10. Задайте параметры страниц документа (вкладка Разметка страницы – группа Параметры страницы): ориентация альбомная, левое поле 1,5 см, правое 1,5 см, верхнее 3см, нижнее 2 см., расстановка переносов Автоматическая. Параметры абзацев: выравнивание по ширине, отступ первой строки 1,5см, интервал перед абзацем 6пт, интервал между строчками 1,15. Для картинки используйте команду Обтекание текстом – по контуру.
11. В верхний колонтитул запишите дату и номер работы. В нижний колонтитул запишите виши фамилию, имя и группу. В готовый документ запишите тему и цель работы.
12. Выведите готовый документ на печать.
Контрольные вопросы
1. Перечислите основные элементы окна программы Fine Reader.
2. Дайте понятие сегментации изображения.
3. Как выполняется настройка операций, выполняемых программой Fine Reader?
Источник: infopedia.su
Порядок распознавания текстовых документов
Преобразование бумажного документа в электронный происходит в три этапа. Каждый из этих этапов программа FineReader может выполнять как автоматически, так и под контролем пользователя. Если все этапы проводятся автоматически, то преобразование документа происходит за один прием.
Первый этап работы – сканирование. На этом этапе обычно используют сканер. Однако изображение с листа бумаги может быть преобразовано в цифровую форму и с помощью других средств, таких, например, как цифровые фотоаппараты и цифровые видеокамеры.
Второй этап работы – сегментация текста. Дело в том, что в бумажном документе, например на странице книги или журнала, текст не всегда располагается в фиксированном порядке. Он может размещаться в нескольких колонках, содержать иллюстрации (и подписи к ним). Дополнительные врезки и данные, представленные в таблицах, также могут запутать естественный порядок текста.
Поэтому, прежде чем включать текст в документ, его разбивают на блоки, содержащие цельные фрагменты. Блоки распознают последовательно. Полученный текст включается в документ в порядке нумерации блоков.
Последний этап работы программы – непосредственно распознавание. Этот этап обычно не требует вмешательства пользователя, за исключением тех случаев, когда распознавание сопровождается «обучением».
Распознанный текст отображается в отдельном окне в виде форматированного текстового документа. Он «теряет связь» с исходным изображением и может редактироваться и форматироваться независимо от него. Программа выделяет цветом те символы, которые она сама рассматривает как неоднозначно опознанные. Это упрощает поиск ошибок. Средствами программы в полученном тексте можно также провести проверку грамматики.
Полученный текст можно сохранить в виде форматированного или неформатированного документа. Предусмотрена также возможность прямой передачи полученного текста в программы Word или Excel, а также в буфер обмена Windows.
2.3. Сканирование документа
Сканирование – это техническая операция, которую выполняет сканирующее устройство. Задача программы FineReader на этом этапе состоит в том, чтобы принять полученную информацию и отобразить значки отсканированных страниц на панели «Пакет». Так страницы готовятся к распознаванию.
Для того чтобы провести сканирование при помощи программы FineReader, необходимо запустить эту программу и включить сканер. Сканирование страницы производится по щелчку на кнопке «Сканировать» на панели инструментов «Scanhttps://kazedu.com/referat/6865/3″ target=»_blank»]kazedu.com[/mask_link]
Возможности систем распознавания текста
Файл содержит методические указания для выполнения практической работы «Возможности систем распознавания текста». Используется при узучении темы «Способы создания текстовых документов». Этапы работы: сканирование документа, передача документа по локальной сети, работа в программе Fine Reader, форматирование документа в среде MS Word.
Вы уже знаете о суперспособностях современного учителя?
Тратить минимум сил на подготовку и проведение уроков.
Быстро и объективно проверять знания учащихся.
Сделать изучение нового материала максимально понятным.
Избавить себя от подбора заданий и их проверки после уроков.
Наладить дисциплину на своих уроках.
Получить возможность работать творчески.
Просмотр содержимого документа
«Возможности систем распознавания текста »
Тема: Возможности систем распознавания текстов.
Цель. Изучить возможности и порядок работы с программой распознавания текста Fine Reader.
Оборудование: ЛВС, персональный компьютер, среда MS Word, программа FineReader.
Краткая теория
FineReader — это система оптического распознавания текстов (OCR), которая преобразует полученное с помощью сканера графическое изображение (картинку) в текст (т. е. в коды букв, «понятные» системе).
Процесс ввода текстов в компьютер осуществляется в несколько этапов: сканирование; выделение блоков на изображении; распознавание; проверка ошибок; сохранение результата распознавания (передача его в другое приложение, в буфер и т. п.).
Программа Fine Reader выпускается отечественной компанией ABBYY Software (www.bitsoft.ru). Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных двуязычных текстов.
Программа имеет ряд удобных возможностей. Она позволяет объединять сканирование и распознавание в одну операцию, работать с пакетами документов (или с многостраничными документами) и с бланками. Программу можно обучать для повышения качества распознавания неудачно напечатанных текстов или сложных шрифтов. Она позволяет редактировать распознанный текст и проверять его орфографию.
Fine Reader работает с разными моделями сканеров. В частности, Программа поддерживает стандарт TWAIN.
Порядок выполнения работы
- Выполните сканирование предложенного Вам документа и сохраните его в папке «…. Группа»на Рабочем столе центрального компьютера.
- Скопируйте папку «…. Группа»в Общую папку на центральном компьютере.
- По локальной сети откройте эту папку на вашем компьютере. Скопируйте свой документ в свою папку.
- Запустите программу FineReader (Пуск – Программы)
- В окне FineReader выполните командуФайл – Открыть изображение,найдите свой документ и откройте его в окне программы FineReader.
- Выберите язык для распознавания документа.
- Выполните распознавание графического файла, сегментируйте текстовые блоки, таблицы и рисунки.
- Выполните проверку отсканированного документа. Ошибки исправляйте в окне Текст или в диалоговом окне Проверка.
- Сохраните отсканированный документ в формате Word .
- Задайте параметры страниц документа (вкладка Разметка страницы – группа Параметры страницы): ориентация альбомная, левое поле 1,5 см, правое 1,5 см, верхнее 3см, нижнее 2 см., расстановка переносов Автоматическая. Параметры абзацев: выравнивание по ширине, отступ первой строки 1,5см, интервал перед абзацем 6пт, интервал между строчками 1,15. Для картинки используйте команду Обтекание текстом – по контуру.
- В верхний колонтитул запишите дату и номер работы. В нижний колонтитул запишите виши фамилию, имя и группу. В готовый документ запишите тему и цель работы.
- Выведите готовый документ на печать.
- Перечислите основные элементы окна программы Fine Reader.
- Дайте понятие сегментации изображения.
- Как выполняется настройка операций, выполняемых программой FineReader?
Источник: kopilkaurokov.ru