Как установить программу ocr

Содержание

Text Extractor позволяет копировать текст из любого места на экране, в том числе из изображений или видео. Это средство создано на основе средства Text Grab от Джо Финни (Joe Finney).

Способ активации

После нажатия сочетания клавиш для активации (по умолчанию: ⊞ Win + Shift + T ) на экране появится наложение. Нажмите и удерживайте основную кнопку мыши и перетащите ее, чтобы активировать выбранное. Текст будет сохранен в буфере обмена.

Отключение

Режим записи деактивируется сразу после распознавания текста в выбранной области и его копирования в буфер обмена. Вы можете выйти из режима захвата, нажав клавишу ESC в любой момент.

Настройка при попытке захвата

Удерживая нажатой клавишу SHIFT , вы измените изменение размера области захвата на перемещение области захвата. После выпуска shift вы сможете снова изменить размер.

Полученный текст может быть несовершенным, поэтому необходимо быстро провести проверку выходных данных.
Это средство использует OCR (оптическое распознавание символов) для чтения текста на экране.
Используемый по умолчанию язык будет основан на Windows параметрах клавиатуры системы > (языковые пакеты OCR доступны для установки).

Параметры

В меню «Настройки» можно настроить следующие параметры:

Поддерживаемые языки

Text Extractor распознает только языки, на которых установлен языковой пакет OCR.

Список можно получить с помощью PowerShell, выполнив следующие команды:

[Windows.Media.Ocr.OcrEngine, Windows.Foundation, ContentType = WindowsRuntime]
[Windows.Media.Ocr.OcrEngine]::AvailableRecognizerLanguages

Запрос языковых пакетов OCR

Чтобы вернуть список языковых пакетов поддержки, откройте PowerShell от имени администратора (щелкните правой кнопкой мыши, а затем выберите «Запуск от имени администратора») и введите следующую команду:

Get-WindowsCapability -Online | Where-Object

Пример выходных данных:

Name : Language.OCR~~~el-GR~0.0.1.0 State : NotPresent Name : Language.OCR~~~en-GB~0.0.1.0 State : NotPresent Name : Language.OCR~~~en-US~0.0.1.0 State : Installed Name : Language.OCR~~~es-ES~0.0.1.0 State : NotPresent Name : Language.OCR~~~es-MX~0.0.1.0 State : NotPresent

Язык и расположение сокращены, поэтому «en-US» будет «english-США» и «en-GB» будет «English-Great Britain». Если язык недоступен в выходных данных, он не поддерживается OCR.

Установка языкового пакета OCR

Следующие команды устанавливают пакет OCR для en-US:

$Capability = Get-WindowsCapability -Online | Where-Object
$Capability | Add-WindowsCapability -Online

Удаление языкового пакета OCR

Следующие команды удаляют пакет OCR для en-US:

Лучшие программы для распознавания текста. Рейтинг OCR.

$Capability = Get-WindowsCapability -Online | Where-Object
$Capability | Remove-WindowsCapability -Online

Устранение неполадок

В этом разделе перечислены возможные ошибки и решения.

«Не установлены возможные языки OCR».

Это сообщение отображается, если нет доступных языков для распознавания.

Если пакет OCR поддерживается и установлен, но по-прежнему недоступен, а системный диск X: отличается от «C:», скопируйте X:/Windows/OCR папку в C:/Windows/OCR , чтобы устранить проблему.

Источник: learn.microsoft.com

Русские Блоги

Инструкции по установке Tesseract-OCR для идентификации текста изображения (Windows 10)

1. Установка Tesseract-OCR

Сначала загрузите установочный файл Тессеракт-OCR.

2. Изменить переменные среды

2.1 После установки Тессеракта-OCR закончена, необходимо добавить его путь для установки переменной PATH среды системы.

Введите следующий интерфейс с помощью панели управления Панель системной системы Расширенные настройки:

Нажмите на переменную среды:

Выберите путь в системной переменной, нажмите кнопку Изменить, а затем добавить в папку D: Тессеракта Тессеракта-OCR на пути Путь к пути PATH по newting.

2.2 Добавить переменную Tessdata_prefix

После установки пути мы также будем создавать переменную TESSDATA_PREFIX в системной переменной, а значение переменной является дорожной мощностью D: Tesseract Tesseract-OCR. Если это не установлено, введите tesseract -list-langs, отобразит любые языковые пакеты, которые не могут быть загружены.

Нажмите кнопку Создать, задайте имя переменной и значение переменной следующим образом:

На данный момент Tesseract-OCR завершен.

3. Проверьте, если Tesseract-OCR успешно установлен

Откройте командную строку, введите tesseract -v, вернется версию Tesseract, которая в настоящее время устанавливается.

Введите Tesseract —list-langs Проверьте языковой пакет

Если все идет хорошо, Tesseract-OCR был успешно установлен и может быть использован.

Источник: russianblogs.com

Использование OCR

NAPS2 имеет возможность использовать оптическое распознавание текста (OCR), что делает текст в отсканированных документах доступным для поиска, а не просто обрабатывается как изображение.

Загрузка языков

Чтобы использовать OCR, вам сначала нужно загрузить язык, который вы хотите использовать. Когда вы нажимаете кнопку OCR в первый раз, вам автоматически будет предложено загрузить языки. Также, вы можете нажать «Получить дополнительные языки» в окне OCR.

Включение OCR

После того, как вы загрузите нужные языки, установите флажок «Создать PDF-файлы с помощью OCR» в окне OCR. PDF-файлы, которые вы создадите после этого, будут использовать OCR, что сделает ваш текст доступным для поиска.

Копирование текста

NAPS2 не сохраняет результаты оптического распознавания непосредственно в текстовые файлы. Если вы хотите получить текст отдельно от PDF, после сохранения файла, откройте его в вашей программе просмотра PDF, используйте кнопку «Выбрать все» и «Копировать», чтобы скопировать текст и вставить его туда, куда вам нужно.

Источник: naps2.ru

Сочетание клавиш для активации	Настраиваемая команда клавиатуры для включения или отключения этого модуля.
Предпочитаемый язык	Язык, используемый для OCR.