Распознавание текста с картинки, OCR (optical character recognition), то есть превращение картинки в текст доступно бесплатно на многих сайтах в режиме онлайн. Но везде свое качество и свои ограничения на количество распознаваемых картинок.
Я проверила с десяток онлайн-сервисов и составила рейтинг лучших.
Для примера распознавала фотографию документа, который есть у каждого – свидетельство ИНН физического лица (разрешением 1275×1750 пикселей).
да | 3 | https://drive.google.com/drive | |
Abbyy Finereader | да | 5 | https://finereaderonline.com/ru-ru |
Online OCR2 | — | 5 | http://www.onlineocr.net |
Free Online OCR | — | 2 | https://www.newocr.com |
OCR Convert | — | 4 | http://www.ocrconvert.com |
Free OCR | — | 1 | www.free-ocr.com |
I2OCR | — | 4 | http://www.i2ocr.com |
Яндекс ОCR | Распознает и переводит. | 5 | https://translate.yandex.ru/ocr |
Convertio | Работает своеобразно | 3 | https://convertio.co/ru/ocr/ |
Пример распознавания текста отсканированного учебника
В Google можно распознавать неограниченное количество картинок, лишь бы они поместились на Google Drive. Нужно просто открыть картинку с Google диска с помощью Google Документов, и она автоматически распознается.
Как пользоваться
У вас должен быть Google-аккаунт для пользования сервисом, если есть почта gmail – подойдет аккаунт от нее.
- Загрузите файл на страницу drive.google.com или выберите там уже загруженную картинку
- Нажмите правой кнопкой мыши на нужный файл.
- Выберите «Открыть с помощью» —> «Google Документы».
- Картинка преобразуется в документ Google и откроется на вкладке https://docs.google.com
Abbyy Finereader
В Abbyy Finereader Online самый удобный интерфейс, хорошее качество, но доступна только ознакомительная версия – можно распознать не более 10 страниц за две недели. (200 страниц в месяц стоят 299р). Для использования сервиса нужно зарегистрироваться (можно войти через аккаунты социальных сетей). Кроме того, полученный текст можно там же перевести на другой язык с помощью машинного перевода.
Бесплатно доступно не более 10 страниц в две недели.
Входные форматы | PDF, TIF, JPEG, BMP, PCX, PNG |
Выходные форматы | Word, Excel, Power Point, Open Document, RTF, Adobe PDF, Text Plain, Fb2, Epub |
Размер файла | До 100Мб |
Ограничения | 10 картинок на две недели |
Качество | Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Online OCR – какие-то части документа лучше распознались тем сервисом, а какие-то – этим. |
Строим Нейронную Сеть для Распознавания Изображений за 20 минут
Как пользоваться
- Загрузите файлы
- Выберите язык
- Выберите выходной формат
- Щелкните кнопку «Распознать»
Распознавание текста онлайн без регистрации
Online OCR
Online OCR http://www.onlineocr.net/ – единственный наряду с Abbyy Finereader сервис, который позволяет сохранять в выходном формате картинки вместе с текстом. Вот как выглядит распознанный вариант с выходным форматом Word:
Входные форматы | PDF, TIF, JPEG, BMP, PCX, PNG, GIF |
Выходные форматы | Word, Excel, Adobe PDF, Text Plain |
Размер файла | До 5Мб без регистрации и до 100Мб с ней |
Ограничения | Распознает не более 15 картинок в час без регистрации |
Качество | Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Abbyy Finereader – какие-то части документа лучше распознались тем сервисом, а какие-то – этим. |
Как пользоваться
- Загрузите файл (щелкните «Select File»)
- Выберите язык и выходной формат
- Введите капчу и щелкните «Convert»
Внизу появится ссылка на выходной файл (текст с картинками) и окно с текстовым содержимым
Free Online OCR
Free Online OCR https://www.newocr.com/ позволяет выделить часть изображения. Выдает результат в текстовом формате (картинки не сохраняются).
Входные форматы | PDF, DjVu JPEG, PNG, GIF, BMP, TIFF |
Выходные форматы | Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок). |
Размер файла | До 5Мб без регистрации и до 100Мб с ней |
Ограничения | Ограничения на количество нет |
Качество | Качество распознавания свидетельства инн плохое. |
Можно распознавать как все целиком, так и выделить часть изображения для распознавания.
Как пользоваться
- Выберите файл или вставьте url файла и щелкните «Preview» — картинка загрузится и появится в окне браузера
- Выберите область сканирования (можно оставить целиком как есть)
- Выберите языки, на которых написан текст на картинке и щелкните кнопку «OCR»
- Внизу появится окно с текстом
OCR Convert
Входные форматы | Многостраничные PDF, JPG, PNG, BMP, GIF, TIFF |
Выходные форматы | Text Plain |
Размер файла | До 5Мб общий размер файлов за один раз. |
Ограничения | Одновременно до 5 файлов. Сколько угодно раз. |
Качество | Качество распознавания свидетельства инн среднее. (ФИО распознано частично). Лучше, чем Google, хуже, чем Finereader |
Как пользоваться
-
- Загрузите файл, выберите язык и щелкните кнопку «Process»
-
-
- Появится ссылка на файл с распознанным текстом
Free OCR
Free OCR www.free-ocr.com распознал документ хуже всех.
Входные форматы | PDF, JPG, PNG, BMP, GIF, TIFF |
Выходные форматы | Text Plain |
Размер файла | До 6Мб |
Ограничения | У PDF-файла распознается только первая страница |
Качество | Качество распознавания свидетельства инн низкое – правильно распознано только три слова. |
Как пользоваться
-
- Выберите файл
- Выберите языки на картинке
- Щелкните кнопку «Start»
I2OCR
I2OCR http://www.i2ocr.com/ неплохой сервис со средним качеством выходного файла. Отличается приятным дизайном, отсутствием ограничений на количество распознаваемых картинок. Но временами зависает.
Как пользоваться
- Выберите язык
- Загрузите файл
- Введите капчу
- Щелкните кнопку «Extract text»
- По кнопке «Download» можно загрузить выходной файл в нужном формате
Яндекс OCR
Недавно обнаружила этот сервис, и он мне очень понравился качеством и простотой использования. Вообще то он предназначен для перевода загруженной картинки, но его можно использоваться и для распознавания текста с картинки. Регистрации не требует, ограничений на количество изображений нет. В данный момент находится в стадии бета-тестирования.
Просто перейдите на https://translate.yandex.ru/ocr, загрузите картинку (можно перетащить) и щелкните «Открыть в Переводчике». Откроется как текст с картинки, так и перевод в правом поле.
Convertio
Convertio hhttps://convertio.co/ru/ocr/ работает своеобразно, поэтому сравнивать его тяжело. В целом не понравился. Свидетельство ИНН, загруженное целиком, он не распознал совсем, так как плохо выделяет текст среди картинок. Не распозналось ни одного слова! Для его проверки я вырезала текстовый кусочек из ИНН и распознала его — это удалось сделать.
К тому же временами он зависает в попытках что-либо распознать.
Как пользоваться
- Загрузите файл
- Выберите язык
- Выберите выходной формат
- Введите капчу
- Щелкните «Преобразовать»
- Чтобы увидеть результат, промотайте наверх к форме загрузки файлов. Там же можно будет и скачать результат.
Вырезанный и распознанный кусок (целиком не распознается):
Заключение
Лучше всего документ распознал Abbyy Finereader и Online OCR. Кроме того, эти сервисы сохраняют форматирование файла: где нет текста, оставляют картинки и компонуют их с распознанным текстом. Из новых сервисов хорош Яндекс OCR.
Хуже всего сработал Free OCR — он распознал всего три слова.
Автор admin Опубликовано 23.03.2017 23.02.2018 Рубрики Сервисы онлайн
Распознавание текста онлайн — ТОП-9 сервисов: 5 комментариев
СПАСИБО! И меня очень выручили… по поиску в яндексе мои попытки тоже были безуспешные, а статья помогла и выбрала отличный ресурс, который преобразовал все 30 страниц) к слову, нужно было очень быстро и срочно!)))
Георгий :
если есть такая возможность то напишите пожалуйста
есть страничка
на ней картинки с текстом
конкретно адреса электронной почты
https://www.math.fsu.edu/People/faculty.php
вопрос можно ли вытащить каким то средствами текст этих адресов согласен что это не хорошо но увы нужно
сделайте скриншот, да распознайте картинку. Правда, качество там не очень
скромный) :
спасибо admin за относительно свежую статью и рейтинг про
«OCR сервис онлайн»
мне для научной статьи на англ. только изображения бесплатно нашлись. pdf/doc нет.
Источник: itlang.ru
Сервисы для распознавания текста (обзор 14 OCR)
Давайте вспомним далекие 2000-е годы… Когда так хотелось перенести текст с учебника в шпаргалку или сохранить важную информацию с газеты либо книги. В те времена распознавание текста было под силу только сканеру или специализированной программе.
Но эпоха операционной системы XP канула в прошлое, и теперь, сидя с ноутом или держа в руке смартфон, мы можем «перенести» без усилий текст с картинки в вордовский файл. Выполняют такое нелёгкое дело сервисы для распознавания текста — все они разные, поэтому мы решили проанализировать их и взвесить все «за» и «против».
Что это такое и откуда появилось?
Интересно, что прототипом подобных сервисов стала машина Таушека — механизм, запатентованный Густавом Таушеком в 1929 году в Германии. В нём использовался фотодетектор и шаблоны.
Прошло почти столетие, и на смену подобного рода механизмам пришел сервис распознавания текста (либо сокращенно OCR-сервис), который преобразует печатные, отсканированные или графические документы в текстовый формат данных. Кстати, с английского языка OCR расшифровывается как оптическое распознавание символов.
Сейчас такие сервисы доступны как на ПК, так и на смартфоне. Их используют, чтобы оцифровать книгу либо документ. Также эти сервисы нужны при автоматизации различных бизнес-процессов.
Список лучших OCR-сервисов
Чтобы выбрать лучшие сервисы для распознавания текста, мы учли несколько факторов — количество входящих и исходящих форматов, «знание» языков, поддерживаемые платформы, а также функционал в зависимости от платной и бесплатной версии.
Итак, в наш список попали:
- Google Disk
- OCR convert
- Microsoft Office Lens
- Fine reader
- img2txt.сom
- i2OCR
- Adobescan
- NewOCR
- Onlineocr
- Microsoft OneNote
- Readiris 17
- go4conver
- Convertio
- Sodapdf
Ниже мы подробно изучили преимущества и недостатки каждого сервиса, чтобы вы смогли подобрать для себя оптимальный вариант.
Google Disk
Самое первое, что вам придется сделать, если у вас нет Google-аккаунта, это пройти регистрацию. Но с этим не должно быть каких-либо проблем, так как сегодня почти каждый имеет свой Google-аккаунт.
Гугл Диск работает со стандартными картинками (TIF, JPG, PNG и др.), размер которых не больше 2 Мб. Кроме того, он способен определять PDF-документы. У вас могут возникнуть неудобства при считывании многостраничных документов. Дело в том, что сервис распознает первые 10 страниц. Но если вам нужно «перенести» пару страниц, то он с этим отлично справится.
Google Disk предлагает сохранить готовый текст в формате MS Word или блокнота, а также в PDF, ODT, RTF, HTML и т.д. Доступен Google Disk почти на всех популярных платформах: Windows, macOS, Android, iOS, Chrome OS.
- Откройте страницу drive.google.com на компьютере.
- Нажмите на нужный файл правой кнопкой мыши.
- Выберите «Открыть с помощью» затем «Google Документы».
- распространенный сервис, т.к. Google-аккаунт есть почти у всех;
- бесплатный ресурс.
- лимит на изображения — до 2 Мб;
- распознает всего 10 первых страниц.
OCR Convert
Сервисы и программы распознавания текста с фото и картинок (онлайн, бесплатно)
Современные студенты особо не парятся с рукописными конспектами, покупкой книжек и прочими материалами. Зачем все это делать, если можно все сфотографировать на телефон и потом просмотреть в любое удобное время?
Но иногда нам нужна не вся информация с картинки, а какая-то ее часть. И тут встает проблема: как выдернуть эту часть информации? Изображения – это вам не вордовский документ, из которого можно выделить и скопировать что надо.
В этом случае помогают разные сервисы по распознаванию текста из изображений вот небольшой обзор сервисов и программ, с помощью которых можно будет распознать текст с фото онлайн (бесплатно или не очень).
FineReader
Эта программа по распознаванию текста с фото (онлайн или на вашем компе) без регистрации. Единственный, но существенный минус программы – она платная.
Программа сканирует картинку, производит распознавание текста с фото в ворд. Иногда выходит коряво, если, к примеру, нужно распознавание рукописного текста онлайн с фото. Больше всего подходит для работы с PDF. Подробнее об обработке сканированного текста вы можете прочитать в нашей статье.
CuneiForm
Аналог предыдущей программы. Имеет все ее преимущества, но при этом является бесплатным сервисом распознавания текста. Так что пользуйтесь в свое удовольствие.
Онлайн-сервисы для бесплатного распознавания текста
А теперь перейдем к специальным сервисам, которые помогут быстро справиться с поставленной задачей и распознать текст с фото онлайн без регистрации.
Кстати! Для наших читателей сейчас действует скидка 10% на любой вид работы
Оcrconvert
Очень простой онлайн-сервис распознавания текста с картинки. Нужно всего лишь загрузить картинку, выбрать язык текста на изображении и запустить распознавание простым нажатием кнопки.
Единственный минус сайта – он полностью на английском языке. Однако интерфейс достаточно прост, и сайт вполне справляется с распознаванием текста на русском языке. Работает с файлами типа: PDF, GIF, BMP, JPEG. Пример того, как будет выглядеть ваш текст:
i2ocr
Этот онлайн-сервис поможет быстро распознать текст с фото так же, как и предыдущий. Работа проходит с теми же этапами. Скорость обработки одной страницы изображений – всего несколько секунд. Работает со следующими форматами изображения: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
Главное отличие в том, что он удобно выдает готовый результат. Перед вами будут 2 окошка – с распознанным текстом и с начальным изображением. Так что при необходимости в ходе работы можно легко вносить нужные правки.
newocr
Несмотря на схожее название, этот сервис имеет сразу 2 крупных преимущества. Программа, распознающая текст с фото онлайн, работает в дополнение к предыдущим еще и с новым и модным форматом – DJVU. А еще в ней можно выделять любую область текста на картинке.
Это будет невероятно полезно в случае, если, например, на изображении имеются не только тексты, но и графика, которую вам вовсе не нужно распознавать. Регистрироваться не нужно, качество распознавания – выше среднего.
free-ocr
Довольно неплохой сервис, который поможет распознать размытый текст по фото, нечеткий текст фото онлайн. Осложнен наличием капчи. Форматы, с которыми работает сервис: PDF, JPG, GIF, TIFF, BMP.
Ошибки, конечно, есть, как и везде. Но их не так уж и много. И чем выше будет качество исходного изображения, тем меньше ошибок выдаст программа.
Ну вот и все, теперь вы знаете, как распознать текст по фото. Удачи вам с распознаванием текстов по картинкам. А если чувствуете, что этого не хватит для беспроблемной учебы – обращайтесь в студенческий сервис, он всегда поможет написать курсовую, дипломную или контрольную!
Источник: zaochnik.ru