FreeOCR – программа, способная распознать отсканированный текст. Она умеет работать не только с сохраненными на жестком диске файлами, но и со сканерами, причем для начала работы необходимо только подключить устройство к компьютеру.
Возможности FreeOCR
При первом запуске FreeOCR нуждается в доступе к Интернету для скачивания полной версии установочного файла со всеми доступными словарями и базами. Русский язык интерфейса отсутствует, что не мешает использовать программу. Стандартного ленточного меню нет, разработчики заменили его большими иконками с основными действиями. Окно программы состоит из двух частей. В одной отображается отсканированный или загруженный с жесткого диска документ, требующий распознания, в другой – результат распознавания.
Программа поддерживает несколько языков: русский, французский, испанский, итальянский, немецкий и английский, причем больший упор сделан на последний. Без скачивания словарей придется выбирать язык распознавания вручную каждый раз, но скачав словари и указав путь к ним (все это делается за несколько кликов в настройках программы), можно автоматизировать работу программы.
Free ocr что это за программа
FreeOCR
Scanning OCR Software
Latest release: March 2015 v5.4
Totally free OCR software for Microsoft Windows
Import Directly from Twain scanners, PDF and popular image formats
About FreeOCR
FreeOCR is a free Optical Character Recognition Software for Windows and supports scanning from most Twain scanners and can also open most scanned PDF’s and multi page Tiff images as well as popular image file formats. FreeOCR outputs plain text and can export directly to Microsoft Word format.
Free OCR uses the latest Tesseract (v3.01) OCR engine. It includes a Windows installer and It is very simple to use and supports opening multi-page tiff documents, Adobe PDF and fax documents as well as most image types including compressed Tiff’s which the Tesseract engine on its own cannot read .It now can scan using Twain and WIA scanning drivers.
FreeOCR V4 includes Tesseract V3 which increases accuracy and has page layout analysis so more accurate results can be achieved without using the zone selection tool.
Scanning Software
As well as OCR FreeOCR can scan and save images as JPG’s and we are currently working on «Scan to PDF» capability with the option to save as searchable PDF
OCR Engine
The included Tesseract OCR PDF engine is an open source product released by Google. It was developed at Hewlett Packard Laboratories between 1985 and 1995. In 1995 it was one of the top 3 performers at the OCR accuracy contest organized by University of Nevada in Las Vegas. The Tesseract engine source code is now maintained by Google and the project can be found here: http://code.google.com/p/tesseract-ocr/
License
FreeOCR is a freeware OCR
OCR Your Receipts for Free — Read Text and Line Items from Receipts
Необходимо помнить, что как и родной английский интерфейс, она лучше всего справляется с распознанием именно английских текстов. Последняя версия поддерживает и русский язык, но в основной упор в программе сделан на распознавание английского, итальянского, немецкого, испанского, французского языков.
6 Best Free And Open Source OCR Software
Для дальнейшей автоматизации программы необходимо вручную вводить распознаваемый язык каждый раз (для этого надо дополнительно скачивать словари с языками и в настройках указывать путь к ним – в правом верхнем углу). Программа слабо справляется с текстами в которых изобилуют различные математические и другие символы. Такие тексты придется проверять потом вручную.
Преимущества FreeOCR
Безусловным плюсом FreeOCR является абсолютное отсутствие настроек (все процессы автоматизированы), что позволяет не тратить на это время. Импортируется полученная информация по умолчанию в word-документ. На панели расположены только самые необходимые кнопки.
В итоге, можно сказать, что данная программа отлично зарекомендовала себя как распознаватель именно английского текста.
FreeOCR
FreeOCR — это полностью бесплатная программа для оптического распознавания отсканированного текста в операционной системе Windows. Она поддерживает прямой импорт отсканированного текста с большинства сканеров, умеет открывать большинство многостраничных Tiff-изображений и отсканированных PDF-файлов, а также популярных форматов файлов изображений. Сохранение распознанного текста возможно как в виде простого текстового файла, так в формат Microsoft Word.
Несмотря на то, что интерфейс программы не переведен на русский язык, обилие иконок наглядно показывающих предназначение кнопок, поможет пользователям не знающим английского языка. Главное окно программы поделено на две части, в одной из которых отображается отсканированный текст, а в другой — результат распознавания. Актуальные версии программы поддерживают распознавание русского текста, однако не будем лукавить, изначально программа «заточена» на работу с английским, немецким, французским, итальянским и испанским языками.
Кстати, русский язык не входит в базовую установку программы. Для распознавания текстов на русском необходимо скачать дополнительный файл rus.traineddata, после чего в программе открыть меню Settings → Open Language Folder, скопировать файл rus.traineddata в открывшуюся папку и перезапустить программу. После этого в выпадающем списке OCR Language (языков доступных для распознавания текстов) появится русский язык (rus) .
Использование в FreeOCR новейшей версии движка распознавания Tesseract (v3.01) позволило значительно повысить точность анализа макетов страниц, что дает возможность запускать процесс распознавания без предварительного использования инструмента выделения текстовых зон.
В целом, программа очень проста в установке и использовании, а поддержка работы с многостраничными файлами в формате tiff, документами Adobe PDF и факсами, а так же большинством типов изображений, включая сжатые Tiff (которые изначально не поддерживались движком распознавания) делают её действительно универсальным инструментом. Как уже говорилось, движок может напрямую работать с большинством современных сканеров по протоколам Twain и WIA, однако сохранение отсканированных файлов возможно лишь в формат JPG. На своем официальном сайте авторы обещали включить поддержку сохранения в формат PDF, однако, учитывая, что последняя версия программы была выпущена в 2015 году, особо рассчитывать на это не приходится.
Кстати, OCR-движок Tesseract, включенный в состав программы, изначально разрабатывался в лаборатории Hewlett Packard в период с 1985 по 1995 год. На конкурсе организованном Университетом Невады в Лас-Вегасе он вошел в тройку победителей. В наше время поддержка кода движка осуществляется компанией Google, которая распространяет его под лицензией Apache V2.0. Сама же FreeOCR распространяется полностью бесплатно, вы можете применять её так как вам необходимо, включая коммерческое использование.
Похожие публикации:
- Почему веб камера показывает белый экран logitech c270
- 7 zip standalone console что это
- Bullzip pdf printer что это за программа
- Dptfpolicylpmservicehelper в автозагрузке что это
Источник: gshimki.ru
FreeOCR
FreeOCR — это программа сканирования и распознавания, включающая https: // alternativeto.
![]()
FreeOCR — это программа сканирования и распознавания, включающая Tesseract free ocr engine, также известный как графический интерфейс Tesseract. Он включает в себя установщик Windows и очень прост в использовании. FreeOCR поддерживает многостраничные TIFF, факсимильные документы, а также большинство типов изображений, включая сжатые TIFF, которые механизм Tesseract сам по себе не может прочитать. Он может работать с форматами PDF, а также совместим со сканерами TWAIN.
Бесплатный механизм распознавания текста Tesseract — это продукт с открытым исходным кодом, выпущенный Google. Он был разработан в Hewlett Packard Laboratories в период с 1985 по 1995 год. В 1995 году он был одним из трех лучших исполнителей на конкурсе OCR, организованном Университетом Невады.
Источник: progsoft.net
Бесплатный сервис www.free-ocr.com
http://www.free-ocr.com/ — бесплатный онлайн сервис для распознавания текста. Вы можете распознавать файл размером не больше 2 Мб.
Сервис может распознавать текст на многих языках, включая русский.
Сервис нормально распознаёт текст, полученный из изображений, на которых текст был напечатан на компьютере. Но со сканированными книгами дела обстоят намного хуже.

Стоит также отметить, что сервис не поддерживает разметку. Если вы будете распознавать текст с изображения, который содержит колонки или подписи, то получите весь текст вперемешку.
06 февраль 2016
Категории бесплатных программ
Представленная информация на сайте является справочной и может не соответствовать действительности, быть устаревшей или не точной. При установке любой из представленных программ уточняйте её лицензионное соглашение. Подробнее о лицензиях можно прочитать в разделе лицензий. Вы также можете найти бесплатные программы для дома, для бизнеса, Open source .
О проекте
Created by: Freeanalogs team.
Нашли ошибку или у вас есть предложение?
Источник: freeanalogs.ru