С начала 90-х годов компания Cognitive Technologies выпускала программу оптического распознавания текста CuneiForm. Кажется, это была первая такая программа, разработанная в СНГ Сама компания была основана на базе лаборатории искусственного интеллекта Института системного анализа РАН (бывший ВНИИСИ АН СССР). С течением времени приоритеты разработки менялись — сейчас, например, в приоритетах стоит система документооборота ЕВФРАТ. Есть и оптическое распознавание, за которое ныне отвечает продукт Cognitive Forms.
Старый флагман — CuneiForm — два года пребывал в замороженном состоянии, а потом вышла его Freeware-версия. В 2008 году компания открыла исходники движка и заточенного под Windows графического интерфейса. Возник сайт-проект OpenOCR (http://openocr.org) с форумом, исходниками и прочим. CognitiveForms в обращении к народу весьма толково описала своё видение текущего состояния проекта, честно указывая на минусы CuneiForm и на вещи, которые хотелось бы изменить, улучшить, переделать при помощи энтузиастов из сообщества.
Cracking Ancient Codes: Cuneiform Writing — with Irving Finkel
Поначалу всё было здорово. Новости следовали одна за другой: запущено SVN-хранилище, Bugzilla, в 2009 году Андрей Черепанов из ALT Linux разработал графический фронтэнд под Qt, а Андрей Боровский написал YAGF (тоже графический фронтэнд на Qt, да еще и с проверкой правописания). И вот сообщество активно дискутировало на форуме несколько лет — до осени 2010 года.
За это время сообщество более-менее разобра-лось с исходниками и пришло к выводу, что одних только их для успешного распознавания мало — нужны еще словари с данными или, по крайней мере, толковая документация к формату этих словарей. Документации не было, спросить не у кого: разработчики CuneiForm либо уже не работали в компании, либо оказались «малодоступны». Энтузиазм пропал. Форум стал изредка посещаться разве что для задания вопросов о том, жив ли проект и каково его текущее состояние.
Другие открытые движки оптического распознавания текста:
— Ocrad (http://www.gnu.org/s/ocrad/) — часть проекта GNU. Последний релиз — в январе этого года.
— GOCR (http://jocr.sourceforge.net/) — проект, развивающийся с 2001 года. Последний релиз состоялся в прошлом году — впрочем, программа так и выпускается, примерно раз в год.
— OCRE (http://lem.eui.upm.es/ocre.html) — актуальный проект с поддержкой русского. Распространяется под GPL. На сайте весь алгоритм работы поясняется в картинках.
— OCRopus (http://code.google.com/p/ocropus/) — распространяется под лицензией Apache, но уже долгое время без новых версий (на скриншоте выше).
— Tesseract (http://code.google.com/p/tesseract-ocr/) — Google купил эту некогда коммерческую программу и открыл её код под лицензией Apache. Активно развивается, неплохо поддерживает русский.
Основы ЦОС: 15. Корреляционная функция (ссылки на скачивание скриптов в описании)
Аналоги CuneiForm есть даже на iOS-устройствах, только вместо сканера они используют встроенную камеру! Рекомендую Вам купить айфон в Ростове-на-Дону (http://www.apple-imag.ru/catalogs/iphone/) и проверить функциональность данных приложений. Кстати, iPhone по бросовой цене сейчас продают на сайте www.apple-imag.ru!
- Просмотров: 2208
- Комментариев: 0
- 04.14
Источник: nerohelp.com
CuneiForm
CuneiForm умеет распознавать текст на 20 различных языках, из них: английский, русский, французский, украинский, немецкий, итальянский и другие. Это очень удобная программа, которая переносит текст с бумаги в электронный формат. Данная утилита может распознавать текст с журналов, газет, книг и даже информацию, напечатанную на печатной машинке. CuneiForm может переносить текст даже с копий низкого качества, а вот рукописный текст, перенести не сможет.
Процесс распознавания данных
Программа обрабатывает и распознает текст достаточно быстро. Если в документе будет присутствовать таблица, все это так же будет перенесено в электронный формат в точности как в исходном файле, даже если поля таблицы будут не четкими. Приложение имеет некоторые дополнительные функции, например: пользователь может обрабатывать как единичные документы, так и целые пакеты файлов. Для преобразования текста программа использует словари. К тому же пользователь может расширять объем словарей, это позволит свести ошибки до минимума.
Готовый документ
Для работы CuneiForm использует Word, через который можно сохранить отсканированный текст. Из этого можно сделать вывод: для использования приложения на вашем компьютере или ноутбуке обязательно должен присутствовать MicrosoftWord. Без этого не удастся сохранить отсканированный текст.
Главные возможности
- CuneiForm – полезная утилита, позволяющая переносить текст с бумажных документов в электронный формат;
- Может обрабатывать как единичные файлы, так и целые пакеты документов;
- Приложение способно распознавать текст с газет, журналов, книг и даже с копий плохого качества;
- С высокой точностью переносит текст, включая таблицы в электронный формат;
- Отсканированный текст сохраняет с помощью программы Word;
- Программа может распознавать текст на 20 различных языках;
- Не может распознавать рукописный текст;
- Пользователь может обновлять имеющиеся словари, что позволяет сократить количество ошибок;
- Работает на компьютерах и ноутбуках с операционной системой Windows различных версий;
- Распространяется на бесплатной основе.
Источник: softdroids.com
CuneiForm 12 (русская версия)
CuneiForm– это приложение для оцифровывания текстовой информации в графических документах. Утилита поддерживает большую языковую базу и широкие возможности формирования текстов. Разработчик российская компания Cognitive Technologies.
Утилита CuneiForm обладает простым и понятным интерфейсом на русском языке. Приложение абсолютно бесплатно и работает на таких операционных системах как Windows, Linux и Mac OS.
Особенности программы CuneiForm 12:
- Интерфейс на русском языке;
- Способность работы с более 20 языками мира;
- Функция распознания текста со смесью нескольких языков;
- Полное сохранение табличного формирования, даже в случае отсутствия графических границ;
- Распознание любого печатного шрифта;
- Корректное функционирование даже с печатными изданиями, сохранившимися в плохом качестве;
- Встроенный словарь для всех используемых языков;
- Способность добавлять новые слова в базу данных словаря;
- Функция пакетной обработки документов;
cuneiform.zip
Скриншот
Для полного комплекта мы рекомендуем вам также скачать Налогоплательщик ЮЛ (программа для подготовки документов перед подачей в ФНС).
Похожие программы
Microsoft Office 2010
Canon MF Toolbox 4.9
Microsoft Word 2010
Kyocera Client Tool 3.3
Scp Toolkit 1.6.238
SmarThru 4
Windows 7 Games for Windows 8 and 10 1.0
InputMapper 1.6.10
Cura 15.04.6 / 3.2.1
Unity Web Player 5.3.7
Источник: www.softslot.com