Как пользоваться программой ocr cuneiform

Сидел я последние несколько часов и занимался тем, что вручную набивал то же самое, что написано в pdf-файле (нераспознанном). Плюнул на это, поставил cuneiform и к нему графическую морду — yagf.

Внимание! В yagf есть опция «импортировать pdf». Я сдуру выбрал ее (у меня 27-страничный pdf, не думал я, что он может так раздуться), и yagf начал при помощи pdf2ppm импортировать файл. Похоже, выбрал он довольно «крутое» разрешение, т.к. после 20-й страницы yagf отожрал уже 1.6ГБ оперативки и система начала жалобно отваливаться. Т.к. у меня уже вторую неделю Octave пыхтит-считает, я решил не испытывать произвола судьбы от oom-killer’а и при помощи всяких разных клавиатурных комбинаций и top’а убил-таки эту штуку.
Позже оказалось, что yagf вполне адекватен, если картинки «попроще». Но его использовать неудобно — зачем нам лишняя сущность?
Так был рожден скриптик:

Все отлично заработало. Правда, есть одно «но»: cuneiform сохраняет данные в UTF-8, а iconv и enconv отказались конвертировать мне эти файлы в нормальную кодировку. Ничего, из этого я тоже найду выход.

распознавание текста CuneiForm

UPD: Ключик -c для iconv спас меня.

Источник: eddy-em.livejournal.com

cuneiform не могу записать изображение windows 10

Скажите, пож, вы под какой ОС ставили драйвера сканера?

У меня тоже появляются два twain-сканера Xerox WorkCenter PE16e и Xerox WorkCenter PE16e USB, но в отличие от вашего случая, ни один не хочет работать ни с одним софтом, чтобы ни делал и сколько бы не переставлял драйверы.
ОС 2003 R2.
На ХР драйверы встают нормально и сканер работает.
Кстати, файла face.ini не нашел. Это чьето ПО созадет его?

И, кстати, ставил драйвера Samsung от МФУ-близнеца. Драйвера одни и те же

Сообщения: 257
Благодарности: 3

Сообщения: 1994
Благодарности: 136

Не могу записать изображение cuneiform

На демонёнке та же проблема, но с распознаванием у него не лучшая ситуация. Просто реальной альтернативы ей я не знаю.

Решение стандартных проблем с Cuneiform 12
Описание ошибки:
Ошибка передачи данных.
Причина в особенностях работы TWAIN драйверов сканера, в CuneiForm используются 2 режима передачи memory-buffered (режим по умолчанию) и memory-native. Раньше драйвера сканера не всегда реализовали оба, или один из них был не очень стабилен. Была ситуация когда это зависело и от производителя, и от версии драйвера. Сейчас у производителей промышленных сканеров (Fujitsu, Kodak и др.) поддерживаются все режимы, а у остальных производителей видимо ситуация с режимами передачи иногда остается нестабильной.

Лекарство:
Необходимо отредактировать файл face.ini, который находится в директории windows. Находим в файле ключ TWAIN_TransferMode и делаем его равным memory-native. То есть должно быть TWAIN_TransferMode=memory-native

OCR CuneiForm как пользоваться

Проблема с установкой в Windows Vista:

Лекарство:
Проблему можно решить отредактировав файл «CuneiForm v12 Master.msi» (который распаковывается в TEMP директории после запуска setup.exe). Редактируется файл при помощи Orca (из Windows SDK ) (1,62 МБ). Открываем файл «CuneiForm v12 Master.msi» при помощи Orca, находим строчку «LaunchCondition» и удаляем имеющуюся там запись, щелкнув правой кнопкой мышки и нажав «Drop Row». Сохраняем файл. И всё отлично устанавливается и в Висте.

Проблемы работы с правами пользователя:
Не запускается с правами пользователя.
Решение:
1. Переустановить программу.
2. Необходимо дать пользователям полные права доступа к ветке HKEY_CLASSES_ROOTCuneiformFace.DocumentCLSID и на соответствующую этому CLSID ( ). (скопировать ваш CLSID из данного раздела и найти его далее в реестре)
3. В каталоге установленной программы дать пользователям права на создание файлов, а СОЗДАТЕЛЮ-ВЛАДЕЛЬЦУ на их изменение и удаление.(или просто дать полный доступ на папку данному пользователю)

Я сумел скомпилировать под Windows CuneiForm-Linux v1.0.0 http://launchpad.net/cuneiform-linux

Посредством компилятора MS VC++ 6.0.

Все подробности тут:

Подскажите, из командной строки работать умеет?

Ура! Сообщество бесплатных программ пополнилось, наконец-таки, софтиной, которая может распознавать отсканированный текст на русском языке. Может, где-то за бугром и есть бесплатные программы, которые могут распознать латиницу, но с кириллицей такого не было.

А флагман русскоязычного OCR (оптического распознавания текста) оставался платный FineReader (сейчас у компании ABBYY версия FineReader 9.0, которые наши доблестные пираты, наконец-то взломали). В славные 90-е годы у FineReader был более-менее сносный конкурент CuneiForm, но через какое-то время этот продукт от Cognitive Technologies завис на версии 2000 года. Я даже думал, что CuneiForm спекся, однако.
однако в декабре 2007 г. руководство Cognitive Technologies решилось передать CuneiForm в Open Sourse. Правда пока CuneiForm вышел под грифом Freeware, версия у продукта 12. Дистрибутив CuneiForm 12 размещён на DVD диске к февральскому номеру «Hard’n’soft».
Вчера я устанавливал этот продукт на свой комп и был расстроен, все попытки отсканировать любой текст заканчивались провалом, то есть вылазило окошко «Ошибка при передачи данных«. Ну думаю, фигня это, а не софт и думал было удалить прогу, а дистрибутив стереть с жёсткого диска.
но передумал. А сегодня ко мне пришла идея, что если невозможно отсканировать текст через CuneiForm напрямую, то можно это сделать через другую программу, то есть затем открыть изображение. Через что-же отсканировать? — подумал я. Ведь если сканировать через платные графические программы (Photoshop или ACDSee), то смысл от бесплатности CuneiForm улетучивается.
В моем арсенале бесплатных графических программ есть GIMP 2.4.2, XnView 1.92 и IrfanView 4.10. Я начал с последней и сохранил полученное изображение в формате tiff (другие, вроде bmp или jpg в данном случае не подойдут). На выходе получился файл ScanImage001 размером 412 Кб. Сразу скажу, что для испытания я использовал страницу 13 из учебника «Философия» под ред.

Читайте также:
Какая программа относится к программе автоматизированного проектирования

В.Д.Губина (М., 2004). После распознавания в полученном тексте было несколько ошибок (а где их не бывает, в том же FineReader они имеются).
Затем я отсканировал тот же текст через GIMP. Попутно отмечу, что прога по времени достаточно загружалась (ещё бы, это же не вьювер, а полноценный графический пакет). Файл Без имени на выходе оказался тяжёлым 3,37 Мб, но зато качество распознавания его в CuneiForm было чуть получше.
Чемпионом же тестирования оказался XnView, давший на выходе файл scan 1 размером 422 Кб, который CuneiForm распознал лучше остальных.
Итак, для начала неплохо. Надеюсь, что новые версии CuneiForm позволят обходиться без вспомогательных программ.
Поживём-увидим.

Поступила задача наладить автоматическое распознание текста с фотографий, т.е. пользователь при загрузке фотогографии на сервер, получает еще и распознанный с нее текст. Сказано — сделано. Было найдено хорошее бесплатное консольное решение — cuneiform. Никсовая версия лежит здесь: https://launchpad.net/cuneiform-linux.

Итак, установка. В Убунте кстати доступна версия 0.7 из репозитариев. Версия 0.9 является последней на данный момент.

Дополнительный аргумент «-DCMAKE_INSTALL_PREFIX=/your/dir» установит cuneiform в нужную директорию.
Запускать можно со следующими аргрументами:

-l
Указывает язык документа. Из возможных: eng(по умолчанию) ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul slo lav lit est tur.

-o
Сохраняет в файл.

-f
Формат полученного текста. Из поддерживаемых: text(по умолчанию), html, rtf, smarttext(plain text with TeX paragraphs), hocr(hOCR HTML format), native(Cuneiform 2000 format)

—dotmatrix
Оптимизация работы скрипта под изображение, распечатанное с помощью матричного принтера.

—fax
Оптимизация работы скрипта под изображение, распечатанное с помощью факса.

—singlecolumn
Отключает анализ страницы и подразумевает, что у нас изображение состоит из одной колонки текста.

Далее захотелось уже графический интерфейс под бытовые нужды. Есть 2 штуки на выбор — это YAGF и Cuneiform-Qt:

yagf ru

0c7c6fbe0eb355f0b6ae171bf58d1533

Как отсканировать документ на компьютер и как распознать текст.

Вопрос, как сканировать и распознать текст, был актуален всегда. Одно время казалось, что эпоха сканеров ушла. А ведь и правда, зачем, например, сканировать несколько часов, а то и дней, какую-либо книжку или доклад, если все уже давным-давно выложено в интернете в формате pdf или еще лучше в wordовском. Скачал, открыл и не паришься.

Однако последнее время, все чаще ко мне стали обращаться с вопросом, мол, «купил сканер, какой программой лучше отсканировать и распознать текст». У меня уже был урок о программе для распознавания текста со сканера. Но там был приведен пример на платной программе. И я решил поискать бесплатный аналог, и нашел.

Эта программа называется CuneiForm и скачать её можете отсюда. Перемотайте в самый низ страницы и там будут ссылки, нажмите на ту, которая подчеркнута, на рисунке ниже, красным.

После чего запустите скачанный файл. Если выскочит окно, показанное на рисунке ниже, нажмите запустить.

Установка будет обычная без всяких наворотов, я вообще просто нажимал далее и все установилось.

Дальше будут выскакивать различные советы, хотите посмотрите их, но я просто нажал закрыть. Программа на русском и, честно говоря, тут можно ничего и не объяснять, но я все-таки покажу на примере как с ней работать.

Для начала расскажу вам, что за кнопки расположены на главной панели, в программе CuneiForm.

Кнопка №1, «мастер распознования», является как бы кнопкой «все и сразу», т.е. когда вы вставляете в сканер текст и нажимаете на эту кнопку, то она сразу и сканирует, после распознает, а в конце еще и сохраняет получившийся документ. Это очень удобно, когда сканируешь большие объемы информации, например, когда нужно «отсканить» целую книжку.

Читайте также:
Как отключить разрешить следующей программе внести изменения

Кнопка №2, служит для того, чтобы просто отсканировать то что «вставлено» в сканер. Что такое сканирование – это, грубо говоря, фотографирование того что «вставлено» в сканер. В итоге вы получаете просто изображение с фотографированным текстом. Эта кнопка удобна тогда, когда вам не нужно распознавать текст.

Кнопка №3, позволяет провести разметку документа, например, если вам его нужно разделить на области.

Кнопка №4, это кнопка распознования. Ну, например эта кнопка вам нужна для того, если кто-то по почте прислал отсканированный текст и вам его надо распознать.

Кнопка №5, эта кнопка для сохранения ваших «творений».

Кнопка №6, рабочая область. Именно тут вы будите видеть то, что происходит в программе.

Кнопка №7, окно для увеличения того, что есть на рабочей области.

С программой мы познакомились, теперь пора узнать как она работает.

Как отсканировать документ на компьютер и как его распознать?

Нажмите на кнопку №1, и перед вами откроется такое окно.

Выбираем пункт «Отсканировать» и нажимаем далее.

На этом шаге задаются параметры для сканирования и формат листа сканирования. Настройте как вам надо, или если хотите, как показано на рисунке выше. Нажимаем далее.

Здесь идет настройка яркости, контраста и т.п. Это может улучшить качество сканированного документа, в случае если сам документ очень плохого качества. Если документ нормального качества, то просто нажмите далее.

Программа запустила сканер и начала сканировать документ. После окончания выдастся окно, в котором будет спрашиваться, что делать дальше.

Нажмем «Распознать прямо сейчас» и далее.

Теперь выберем язык, который был на отсканированном документе и символ, который будет отображаться вместо нераспознанных букв. Нажимаем далее.

Здесь одет выбор характеристик текста, для лучшего распознания. Программа спрашивает его вид и стиль. Выберите то, что показано на рисунке, и нажмите далее. А вообще потом чем чаще вы будете экспериментировать, тем проще будете подбирать этот самый стиль.

На данном шаге просто отметьте все галочки и нажмите далее. После чего пойдет процесс распознавания.

После того, как он закончиться, в «рабочей области» программы автоматически открывается приложение Microsoft Office Word для дальнейшего редактирования и сохранения, а в «окне увеличения» оригинал документа.

Если файл документа распознан не корректно (не все картинки или текст распознаны правильно) и вручную исправлять долго, можно подправить его благодаря специальным панелям. Для этого нужно нажать на кнопку «разметка» и откроется окно разметки.

В котором, зелёным блоком выделяются картинки, а синим текст. Изменить масштаб для удобства редактирования блоков можно на верхней панели, на рисунке выше, отмечено зелёной чертой.

Удалить не корректные блоки можно с помощью нажатия правой кнопки мышки при наведённом курсоре.

Панели для нанесения блоков (указанны на рис выше):

1. Выделить текстовый блок;
2. Выделить таблицу;
3. Выделить картинку;
4. Добавить прямоугольник к блоку;
5. Вырезать прямоугольник из блока.

После того как всё было подправлено нажать на иконку «распознавание» и окно приобретёт вид как показано на предыдущем рисунке.

Главные преимущества программы:

Вот в принципе и все. Как вы видите все на русском языке и никаких сложностей возникнуть не должно.

Источник: windorez.ru

Бесплатные программы для Windows скачать бесплатно

OCR CuneiForm для полноценного распознавания сфотографированного или сканированного текста

OCR CuneiForm сможет отсканировать и мгновенно распознать бумажную документацию по технологии Optical Character Recognition в редактируемые текстовые и табличные форматы, совместимые с Microsoft Office Word и Excel. Потом материалы лучше сохранить и редактировать в офисных пакетах, текстовых и табличных редакторах, аналогах Microsoft Word и Microsoft Excel. Программа распространяется «как есть», разработчики не несут ответственности в связи с возможными проблемами и могут отменить действие свободной лицензии для следующих версий, поэтому стоит поторопиться и последнюю версию OCR CuneiForm скачать бесплатно для Windows 10, 8.1, 8, 7, Vista, XP, Linux или Mac OS X. Экономить время с КьюниФорм разработчики предлагают по принципу: чем лучше отсканировать и распознать, тем быстрее исправить и получить готовый результат.

Применение в CuneiForm новых технологических достижений

В начале XXI века считалось, что нормально работающей альтернативы ABBYY FineReader не существует. Несмотря на существование различных программ для OCR распознавания текста, ABBYY FineReader прочно оставался в лидерах индустрии сканирования и оцифровки документов. Это продолжалось до тех пор, пока самые продвинутые пользователи не попробовали для полноценного распознавания сфотографированного или сканированного текста скачать OCR CuneiForm 12 бесплатно без регистрации и SMS и протестировать потенциал этой по-настоящему бесплатной проги для Виндовс. При этом оказалось, что возможности OCR CuneiForm не уступают ABBYY FineReader ни в чем.

OCR CuneiForm умеет мгновенно идентифицировать все стандартные символы всевозможных начертаний и шрифтового исполнения. Распознаванию поддаются книги, журналы, листовки, газетки, принт-листы, факсовые рассылки, неудачные ксероксные копии, тексты с древних пишущих машинок и прочее, исключая декоративный шрифт и рукопись.

Читайте также:
Фрагмент программы в котором тело цикла составной оператор

В программном коде CuneiForm применяется ряд уникальных инновационных технологий Optical Character Recognition, таких как: адаптивное распознавание с применением шрифтонезависимых инструкций, нейронно-аналитические сети нормализации, когнитивная аналитика альтернативных вариантов трактовки текста, спецалгоритмы для матричного принтера, некачественных результатов ксерокопирования, факсов и машинописных страниц и прочие. При необходимости использовать все это для дела всегда можно бесплатно скачать CuneiForm для Windows 10, 8.1, 8, 7, Vista, XP (32-bit или 64-bit) с этой страницы сайта programswindows.ru без регистрирования и SMS. CuneiForm способен воссоздать абсолютную копию исходника. Сохраняется форматирование и структурирование, отступы, колонтитулы, сноски, индексы, количество и размеры колонок, абзацы, расположение отдельных фрагментов текста, табличных элементов и иллюстраций, стили шрифтов и другие элементы шрифтового оформления.

Интерфейс, языки, словари и функционал ОСР КьюниФорм

Принтскрин КуниФорм

OCR CuneiForm отлично узнает и оцифровывает документацию, удобна в работе и не создает проблем начинающим пользователям, поскольку обладает удобным русскоязычным интерфейсом, имеет встроенные советы и всплывающие подсказки. Для закачки и подключения доступны популярные графические интерфейсы для КьюниФорм: YAGF, OCR Feeder, CF-Qt, Puma и прочие.

Стандартный графический интерфейс имеет все инструменты, необходимые для полноценного распознания сканированного или сфотографированного текста. Мультиязычный интерфейс на родном языке способствует ускорению понимания оператором принципов работы и расширению спектра используемых возможностей. В настройках доступно конфигурирование под распознавание символов на русском, инглише, русско-английском и еще 20-ти европейских языковых раскладках. Качество мгновенного распознавания повышается при использовании словарей, которые можно расширять, импортируя слова из словарных файлов.

Основные функциональные преимущества программы OCR CuneiForm:

  • достойное OCR распознавание и скорость работы,
  • автоподбор оптимальных настроек сканирования,
  • импорт отсканированных, сфотографированных или принятых иным путем картинок,
  • поворот, переворот, инверсия, очистка и прочее редактирование изображений,
  • несколько вариантов идентификации абзацев текста, таблиц и картинок,
  • в работу идет любой материал, исключая декор и рукопись,
  • словарная поддержка для улучшения качества,
  • сравнительная демонстрация исходников и символьных результатов,
  • OCR-совместимость со свыше двадцати языками, включая русский.

Бесплатность, множество преимуществ, скорость и отсутствие проблем в работе являются весомыми аргументами, чтобы скачать CuneiForm бесплатно на сайте programswindows.ru русскую версию. Использование высокотехнологичного программного обеспечения гарантирует высококачественные скан и распознавание документации с бумажных носителей или растровых файлов в форматы, подходящие для редактирования в соответствующих редакторах.

Немного исторических фактов

Cognitive Technologies образовалась в 1993 г. на основе главного центра ИИ ИСА Российской Академии Наук. Как итог научно-практических исследований появилась первая CuneiForm. В конце 1993 года был подписан OEM-контракт с Corel Corporation, по которому код КьюниФорм вошел в пакет Corel Draw. В дальнейшем после многих лет перерыва компания освободила проект, перестав продавать и поддерживать программу, но программа КьюниФорм настолько хороша, что сегодня отсканировать и распознать русский текст лучше и дешевле всего получится, если бесплатно скачать OCR CuneiForm русскую версию на свой компьютер.

Вскоре этот программный продукт оказался одним из наиболее востребованных средств оптического распознавания текстов и заслужил позитивные отзывы и комментарии пользователей на официальном сайте cognitiveforms в домене com, тематических сайтах и форумах, а также в социальных сетях. Сегодня CuneiForm выделяется из массы прочего Optical Character Recognition программного обеспечения достойным распознаванием некачественной документации. Среди достоинств КуниФорма отмечены качественный перевод в цифровой вид бумажной документации и растровых файлов с экспортом в мультиформатный текст и таблицы Microsoft Office Word и Excel или их аналоги.

Ошибка во взаимодействии со сканерами

Сканирование на HP, Epson, Mustek, Canon и некоторых других черевато ошибкой. Причина данной проблемы обусловлена нюансами взаимодействия TWAIN-интерфейса с оборудованием. Лечится проблема простым редактированием строки с содержимым TWAIN_TransferMode в файле C:Windowsface.ini до состояния: TWAIN_TransferMode=memory-native и перезапуском программы. Как правило, сегодня таких проблем не наблюдается, и чтобы получить из бумажного документа редактируемую электронную версию, нужно просто бесплатно скачать CuneiForm на русском языке с этой страницы сайта programswindows.ru без регистрации и СМС и использовать ее по прямому назначению. Это сбережет время и освободит от ручного набирания текста в Microsoft Word и таблиц в Microsoft Excel или аналогах этого ПО.

Последнюю версию CuneiForm 12 скачать бесплатно на русском языке

Обновление от: 06.06.2019
Последняя версия: 12.07.1206
Синонимы: cuneform, cuneifor, guneiform, cunei-form, куниформ, кьюнейформ
Операционная система: Windows XP, Vista, 7, 8, 8.1, 10 (32-бит или 64-бит)
Размер файла: 33,4 МБ
Скачать бесплатно: здесь

Бесплатные программы скачать бесплатно

Сейчас Вы находитесь на странице с названием «OCR КьюниФорм для полноценного распознавания сфотографированного или сканированного текста» сайта программы для Windows, где каждый имеет возможность легально скачать программы для компьютера с Microsoft Windows. Эта страница создана/существенно обновлена 06.06.2019. Спасибо, что посетили раздел Сканирование и OCR-распознавание.

Источник: programswindows.ru

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru