Cuneiform для чего предназначена эта программа

CuneiForm

OCR CuneiForm была разработана компанией Cognitive Technologies как коммерческий продукт в 1993 году. Система поставлялась с наиболее популярными моделями сканеров, МФУ и ПО в России и мире: Corel Draw, Hewlet-Packard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti и др. В 2008 году Cognitive Technologies открыла исходные коды OCR CuneiForm.

  • 1 Особенности
  • 2 История
  • 3 Графические интерфейсы для CuneiForm
  • 4 См. также
  • 5 Примечания
  • 6 Ссылки

Источник: wiki2.org

Freevi

Программа для распознавания текста CuneiForm, которая не дружит со сканерами

3 января 2011 Serg Написать комментарий К комментариям

Недавно занялся поиском бесплатных приложений для распознавания отсканированного текста, или как их еще называют программы OCR. Желание платить за популярного монстра ABBYY FineReader, совсем не было, но как оказалось, предлагают очень мало вариантов программ такого плана для бесплатного использования. Первый попавшийся вариант оказался FreeOCR, пожалуй, одна из самых популярных программ для Windows, но в своем нынешнем виде не дружит с русским языком. Один из читателей блога, предложил попробовать труды отечественных разработчиков CuneiForm.

распознавание текста CuneiForm

Процедура установки стандартная, перечень из нескольких стандартных вопросов, где самое запоминающееся это лицензионное соглашения и выбор папки, куда будут инсталлирована программа. Несколько секунд ожидания и все готово к работе. Ничего лишнего не устанавливается и дополнительно программные компоненты тоже не придется скачивать и устанавливать.

Запустив программу, получаем стандартный для OCR интерфейс, меню из нескольких пунктов, большие кнопки для доступа к основным функциям и основное окно разбито на две части для изображения и готового текста которые распознали.

Самая первая кнопка в панели инструментов, где нарисованная волшебная палочка, это мастер, запустив которые пройдем все этапы, начиная от сканирования и заканчивая готовым текстом пригодным для редактирования, которые заботливо будет предлагать выбрать нужные настройки. Получатся этакий полуавтоматический режим, делам только общие настройки, не вникая в нюансы.

Можно пойти по более сложному пути, пройдясь ручками по каждому пункту отдельно, зато сможете сделать кучу дополнительных правок и тонких настроек, которые позволят получить более качественный конечный результат.

С помощью кнопки, где нарисован сканер, можем отсканировать нужный документ или загрузить готовую картинку. После чего получим панель с инструментами с помощью, которой можем подкорректировать изображение, повернуть его и выбрать область для распознавания.

OCR CuneiForm как пользоваться

Кнопочка с циркулем, позволяет сделать разметку страницы, выделяя колонки, изображения и блоки с текстом. Все блоки, которые будут найдены, можно редактировать, передвигая их и изменяя размеры с помощью мыши. Поводите курсором около синих линий и увидите, как он будут менять свою форму, дальше, думаю, сами разберетесь.

Ионкой с очками, распознаем непосредственно текст, в подготовленных областях. После того как текст будет готов, щелкните по любой букве и увидите тот участок рисунка картинки, на котором она была найдена.

Кнопка с самолетиком предназначена для сохранения распознанного текста в файлы или в Word Excel, почему опять этот стандартный набор непонятно, ведь есть еще куча замечательных текстовых редакторов.

В зависимости от того на каком этапе будете находиться панель инструментов будет менять свое содержимое, предлагая нужные на конкретном этапе инструменты.

Читайте также:
Serviwin что это за программа

Теперь перейдем к печальному на Windows 7 отказался работать со сканером, программа его видела, сканер даже начинал гудеть, и на мониторе бежала пунктирная линия свидетельствующая что идет передача данных, а в конце выбрасывала ошибку. Все пляски с бубном и чтения форумов не дало положительных результатов. В том числе редактирование файла «Face.INI», где по рекомендации было исправлено «TWAIN_TransferMode=memory-buffered» на TWAIN_TransferMode=memory-native». В итоге пришлось делать обходной маневр, сканировать текст стандартными средствами Windows, а в CuneiForm подсовывать готовую картинку.

Еще плохо, что не поддерживаются pdf фалы самой программой. Приходится прибегать к обходным маневрам, использовать сторонние программы чтоб из pdf документов делать картинки, а потом задействовать OCR. Но опять из-за низкого разрешения картинок, качество распознавания текста очень низкое, поэтому потом приходится много чего исправлять руками.

Чуть не забыл, первый запуск на Windows Vista и 7 лучше делать от имени администратора, иначе программа впадет в транс на несколько минут, не подавая признаков жизни.

Программа действительно работает со всеми основными языками, их около 20 штуку включая русском, английском, украинском, немецком, французском, испанском, итальянском и смешанном русско-английском.

CuneiForm оставила двоякое впечатление, вроде работает, но не полностью, скорей всего из-за того что работу на программой прекратили в 2007 году, а после открытия исходных кодов команда которая могла дальше развивать проект так и не собралась. Приятно, что понимает русский язык, но придется немного приноровиться, пока научитесь подбирать нормальные параметры для сканирования, чтоб результаты распознавания удовлетворяли. Сейчас нахожусь именно на этом этапе.

В нынешнем виде не могу рекомендовать для использования обычным пользователям. Кто рискнул попробовать CuneiForm, морально подготовитесь, что с первого раза хороших результатов не получится, и решение возникших проблем придется искать самим.

Работает в 32-х и 64-х битных операционных системах. Интерфейс полностью на русском языке, и похоже других вариантов не предлагается.

Последняя версия на момент написания CuneiForm V12

Размер программы: архив 33,3Мб

Совместимость: Windows Vista и 7, Windows Xp

Источник: freevi.net

OCR Cuneiform — как пользоваться этой прогой когда нужно распознать текст из фотографий книги?

Вам будет предложено воспользоваться сканером для сканирования и передачи полученного изображения в программу, либо открыть изображение с диска.

В нашем примере рассмотрим второй вариант.

1. Отмечаем пункт «Открыть с диска» и кнопкой «Изменить» указываем путь к файлу изображения на диске — кнопка «Далее».

2. Если изображение имеет разрешение более 600 пикселей, откроется окно с сообщением о превышении максимального размера.
Впишите реальный размер, либо оставьте предложенный и жмите «Ок».

3. «Мастер распознавания». Здесь из списка выбираем язык либо их комбинацию, которые присутствуют на изображении — после чего снова кликаем «Далее».

4. С следующем окне советуем отметить:

  • «Словарный контроль», если текст не содержит общий терминов.Это повысит качество распознавания.
  • «Одна колонка» — отметьте если на изображении текст представлен в виде одной колонки.
  • «Матричный принтер» — отметьте, если изображение низкого качества.

5. «Режим распознавания таблиц и картинок»:

  • «Искать таблицы» — отмечайте при наличии таблиц на изображении.
  • «Искать картинки» — при наличии картинок, которые останутся в тексте.
  • «Сохранить расположение фрагментов» — оставить текущее расположения различных элементов оформления текста — таблиц, изображений и заголовков — на листе.
Читайте также:
Пауэр биай программа что это

В окне экспорта, будет предложено сохранить распознанный документ в один из доступных форматов.

В большинстве случаев довольно удобно сразу сделать экспорт в Word и затем уже выполнять форматирование текста и перетягивание элементов оформления.

При наличии большого количества ошибок в распознанном документе, используйте ручное редактирование, когда в верхней части окна отображается исходный результат, а в нижней окно исходного документа, для облегчения сравнения результата с исходным изображением.

Примечание: слова с возможными ошибками выделены зеленым цветом, что облегчает их поиск и исправление.

Источник: softobase.com

Распознавание текста — OCR CuneiForm

Что такое CuneiForm?
CuneiForm — это система оптического распознавания крупнейшего российского разработчика программного обеспечения Cognitive Technologies, которая обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов, получаемых, например, со сканера или факса, в редактируемый текст для последующей работы с ним в текстовых редакторах.

Для кого предназначена OCR CuneiForm?
Система распознавания текстов CuneiForm предназначена для всех, кому приходится вводить в компьютер факсы, книги, газеты, машинописные страницы, тексты договоров и т.д. Для работы с системой достаточно положить страницу с текстом в сканер, нажать кнопку, и через несколько секунд Вы получите готовый результат в многофункциональном текстовом редакторе.

Какие шрифты распознает OCR CuneiForm, требуется ли обучение?
CuneiForm — шрифтонезависимая (OmniFont) система. Алгоритмы, заложенные в CuneiForm, исходят из правил написания букв, из их топологии, и не требуют задания каких-либо эталонов, или обучения.
В системе используется технология интеллектуального самообучения на базе адаптивного распознавания символов.
Распознаются любые печатные шрифты — книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п.
Не распознается рукописный текст и декоративные шрифты (готический, стилизованный под рукописный).
В CuneiForm существуют специальные настройки для распознавания текстов с матричного принтера и факсов 200×100 dpi.

Чем OCR CuneiForm отличается от других подобных программ?

  • качеством распознавания;
  • высокой скоростью работы;
  • использованием уникальных технологий, таких как адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и других;
  • простой использования и интуитивным интерфейсом;
  • функциональным наполнением, наличием многих дополнительных возможностей.

Поддерживает ли OCR CuneiForm работу с таблицами?
Да. Программа автоматически находит в тексте таблицы различной структуры, в том числе без линий разграфки. Встроенный редактор поддерживает редактирование таблиц (можно уменьшать/увеличивать, удалять/создавать колонки и т.д.)

Как OCR CuneiForm отнесется к картинкам в тексте?
Как пожелаете. Может просто проигнорировать их присутствие, а может сохранить в выходном документе в черно-белом, сером или цветном виде, в зависимости от вашего желания.

Поделиться:

Оставьте свой комментарий!

Источник: pro-spo.ru

Распознавание текста с помощью специальных программ: урок проггера

Часто требуется перевести изображение, фотографию или отсканированный файл в формат текста, в который можно вносить исправления. Помогут справиться с этим заданием различные программы, главная функция которых – оптическое распознавание текста. Есть их много, но наиболее популярными стали Abbyy Finereader, CuneiForm, Microsoft OneNote и различные версии OmniPage. Рассмотрим каждую из них отдельно.

Программы для распознавания текста

  • Abbyy Finereader
  • Преимущества и возможности программы
  • Как пользоваться Abby Finereader
  • Функционал программы
  • Как пользоваться CuneiForm
  • Возможности программы
  • Возможности программы

Abbyy Finereader

Abbyy Finereader – популярная программа для распознания текста и сохранения его в любом формате. Помимо своих главных функций она имеет массу дополнительных характеристик и преимуществ перед аналогичным софтом.

Abbyy Finereader

LiveJournal

Преимущества и возможности программы

  1. возможность распознать текст из pdf формата в файл word,
  2. распознавание текста с фотографии, отсканированного файла или электронной книги,
  3. возможность сканировать документы и улучшать их качество перед распознаванием,
  4. перевод изображений, pdf фалов, снимков с камеры в другие форматы,
  5. поддержка многоязычного языкового пакета (более 42),
  6. сохранение форматирования в конечном вордовском документе,
  7. возможность машинного перевода с более, чем 30 мировых языков,
  8. экспорт по вашему желанию в любое из облачных хранилищ в интернете,
  9. направление копии документа в один из популярных редакторов, среди которых не только MSWord и MS Excel, но и Org Writer, PowerPoint, WordPerfekt, OpenOffice и Adobe Acrobat.
  10. высокая скорость работы и большие возможности редактирования файла непосредственно в рамках Abbyy Finereader.
Читайте также:
Что за программа vsdc free video editor

Как пользоваться Abby Finereader

Abbyy Finereader прекрасный рапознаватель текста с картинки, даже если она плохого качества. Эта программ обладает интуитивно понятным интерфейсом, а многие её процессы проходят в автоматическом режиме. Давайте на несложном примере рассмотрим, как перевести картинку в текст:

    Запускаем программу. Перед нами открывается такое окно.

LiveJournal

LiveJournal

Выбираем файл и нажимаем кнопку Открыть в его нижнем правом углу. Перетащите в окно программы нужный объект, удерживая левую кнопку мыши. Вот так выглядит окно программы после открытия файла.

LiveJournal

LiveJournal

Нажимаем кнопку Закрыть и видим, что слева расположена зона эскизов загруженных страниц файла (у нас это одна картинка). В центре — само изображение, в котором уже выделены зоны распознаваемого содержимого, а справа – сам текст.

Чтобы перевести картинку в формат Word нужно нажать кнопку Распознать, расположенную, как и кнопка Открыть, под главным меню. После этого вы увидеть диалоговое окно, отражающее ход распознания. Большие объёмы занимают много времени – от 10 минут до получаса. Единичная картинка не отнимет более 2-5 минут.

Чтобы сохранить информацию в формат Word, нажмите кнопку Сохранить с вордовским значком, которая находится справа от кнопки Распознать. Так выглядит новое окно, которое перед вами появится

LiveJournal

  • Выбирайте место сохранения и имя нового файла, после чего жмите кнопку Сохранить. Вордовский документ с распознанной информацией и картинками появится у вас на экране. Также происходит распознавание текста в PDF, с той лишь разницей, что полученный результат вы можете сохранить в один документ или каждую страницу в отдельный.

LiveJournal

Совет. Есть ещё один путь перевода файла из формата изображения или PDF –файла в вордовский документ. Для этого при запуске программы выберите в открывшемся окне команду Сканировать в MS Word или PDF или изображение в MS Word. При этом часть операций выполнится в автоматическом режиме, а вы получите готовый результат намного проще и быстрее.

Стоит отметить, что программа не бесплатна. Она требует регистрации. Но при необходимости используйте ABBYY Fine Reader Online без регистрации и бесплатно. Это сэкономит и деньги, если перевод информации из картинки в текст вы делаете редко, и время. Интерфейс в этом режиме очень похож на обычную программу и не вызовет у пользователя затруднений.

Да и перевести информацию из картинки в текст online вы сможете на любом компьютере и в любое время.

CuneiForm

CuneiForm – удобная и простая в использовании программа для распознавания текста при сканировании. У неё очень простой интерфейс, большой набор функций. При этом она распространяется абсолютно бесплатно, что не может не радовать пользователей.

Источник: pcyk.ru

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru