Программа которая распознает чертежи

Многие из нас помнят со школьных уроков черчения вот такие таблички, которые нужно было рисовать на каждом листе в правом нижнем углу. По ним всегда можно было быстро найти нужный чертеж в папке. Быстро? Ну, пока речь идет о чертежах, которые влезают в одну папку, – да. А если это целый шкаф технической документации?

Наши партнеры из компании CSoft занимаются консалтингом и внедрением комплексных решений в области систем проектирования и по роду деятельности сталкиваются с такими «шкафами» постоянно. Их программы предназначены для сканирования и обработки растровых изображений, а также последующего ввода полученных данных в информационные системы предприятия или другие приложения. Они позволяют работать с растровыми изображениями чертежей, карт, схем и других графических материалов строителей и проектировщиков.

На практике большая часть архивной документации, которую необходимо оцифровывать, обычно выполнена вручную и на старых носителях, поэтому специалисты СSoft встроили технологию распознавания ABBYY FineReader Engine, которая легко справляется с такими документами. Наше решение вошло в три программных продукта СSoft – RasterID, Spotlight и RasterDesk – и получило название ABBYY FineReader Plugin.

Как оцифровать чертеж со скана.

После того как ABBYY FineReader Plugin распознаёт текст в титульном блоке чертежа, полученная информация передаётся во внешнюю базу данных или систему документооборота для формирования карточки отсканированного документа, с помощью которой его можно оперативно найти для решения рабочих задач. При этом не имеет значения, как заполняли титульный блок – печатным способом или рукопечатным (печатными буквами от руки). Наши технологии позволяют распознавать и то, и другое более чем на 100 языках и применимы не только для работы со стандартными печатными документами формата A4, но и для обработки сложной и нестандартной документации. Инструментарий ABBYY FineReader Engine позволяет разработчику создавать приложения, с помощью которых можно обрабатывать не просто отдельные области изображения, а даже отдельные символы.

  • ABBYY
  • FineReader Engine
  • чертежи
  • встраиваемое OCR

Источник: habr.com

Программа типа FineReader только для чертежей и схем.Есть у кого желание протестить хорошенько?

Для распознавания чертежей имеются следующие возможности:
Распознавание различных графических элементов изображения – окружностей, дуг и ортогональных линий. Имеется возможности задания регулярной сетки и «притяжения» объектов к узлам сетки.
Для работы с картографической информацией:
Система привязки координат с возможностью сохранения кэффициентов привязки в файлах GeoTIFF и world-файлах системы ESRI ArcInfo. В программе имеется возможность указания высоты (z-координаты) контуров для оцифровки рельефов местности. Еще одно возможное применение этой функции – оцифровка графиков функций.

2021 ru Пример создания чертежа


Возможности программы, предназначенные для художников и дизайнеров:
Имеется возможность построения контуров растровых изображений, составленных из
сплайнов Безье.
Программа содержит встроенный векторный редактор, в котором можно скорректировать векторные объекты, построенные алгоритмами векторизации или вручную дорисовать необходимые объекты. Русский язык есть.

На фирме лет 5 назад покупали программу для оцифровки архивных чертежей. Так эта программа не могла отличить основную линию от тонкой. Для разработчиков это было несущественно, а вот для конструкторов — важно, поскольку нужно перечерчивать все виды со штриховкой. А если учесть качество старых чертежей, а тем более «синек», то оказалось проще сразу перечертить чертёж заново. ИМХО, все эти программы «распознования чертежей» не стоят времени, потраченного на их установку.
А та прога, стоимостью более 100 тыс (по тем временам немало) так и не использовалась. Компас 3Д рулит!

Читайте также:
Сайт программы кто там

prorad: проще сразу перечертить чертёж заново +100 .
На работе, ~2года назад, для создания эл.архива чертежей пытались использовать растрдеск(приложение к акаду) выяснилось что «автоматическая векторизация» хня полнейшая, если очень нужно то только ручкам в компасе или акаде.

AlexAlcoa: пытались использовать растрдеск(приложение к акаду)
тоже использовал. Там есть очень большое количество настроек, позволяющих улучшить распознавание, но тонкую от толстой линии оно не смого отличить и линии состояли и кривых отрезков. Использовал эту программу толья для улучшения небольших отсканированных чертежей и графиков для печати на большем формате. Эта программа позволяет сделать растровые линии тоньше.

А так. сканирую на сканере А4, склеиваю, подбираю яркость/контраст и ложу как фон в автокад. А дальше руками по шаблону.

pictele: Еще одно возможное применение этой функции – оцифровка графиков функций
это интересно. Вы пробовали?

Сергей К: А так. сканирую на сканере А4, склеиваю, подбираю яркость/контраст и ложу как фон в автокад. А дальше руками по шаблону. Аналогично только сканер у нас А0 и работаю в компасе.
В растрдеске настроек конечно много, даже лишнего, только толку от настроек не очень. Особенно понравилось его распознавание окружностей нарисованных пунктирной линией

Перепробовал все доступные программы векторизации чертежей, ни одна даже близко не отвечает минимальным требованиям. В несколько ином ключе векторизации неплохо показали себя VectorMagic и софты Consistent Software. А предложенный Векстрактор — примитивное барахло, это даже по интерфейсу видно. Поэтому не очень понятен призыв топикстартера
pictele: Есть у кого желание протестить хорошенько?
который этот Векстрактор явно не ваял, и даже не ломал.

GMAP: pictele: Есть у кого желание протестить хорошенько?
который этот Векстрактор явно не ваял, и даже не ломал.

Конечно нет.Я с программами подобного рода вообще дела не имел.
Очень хотелось знать мнение людей сведущих.
После всего прочитанного создалось мнение(пока),что руками вернее и проще.

Форум про радио — сайт, посвященный обсуждению электроники, компьютеров и смежных тем.

Источник: pro-radio.online

Блог

Сейчас вы читаете какой-то пост в нашем Блоге. Надеемся, вам интересно!

  1. Главная
  2. Карьера
  3. Блог
  4. Распознавание чертежей при помощи машинного обучения

Распознавание чертежей при помощи машинного обучения

Февраль 2023

Распознавание чертежей при помощи машинного обучения

В настоящее время успех любого бизнеса зависит от способности быстро и легко находить, получать доступ и редактировать данные документов. Обработка реальных документов — это ситуация, которая знакома компаниям любого размера. Она оказывает большое влияние на производительность компании, независимо от отрасли или направления деятельности.

История распознавания документов: От OCR до ИИ

Обработка документов прошла множество этапов в своем развитии. Традиционно вся обработка выполнялась вручную, что имело множество недостатков. Многие компании до сих пор сталкиваются с такими проблемами, как потеря времени на ручное извлечение данных, неправильная маркировка и т.д.

Для решения этих проблем предприятия часто обращаются к современным технологиям. Многие компании не только работают с электронными документами, но и прилагают усилия к тому, чтобы полностью перейти на такие документы.

OCR для оцифровки документов

Несмотря на то, что полный переход на электронный документооборот с каждым годом набирает все большую популярность, большинству компаний все еще приходится переводить физические документы в цифровой формат.

Читайте также:
Программа чтобы прятать файлы

Этот процесс часто включает в себя распознавание символов и шрифтов при помощи AI, распознавание специальных символов, распознавание типов документов и т.д.

Эти задачи решаются с помощью OCR, или оптического распознавания символов, которое помогает:

  • преобразовать физический документ в редактируемый PDF-файл,
  • обнаружить, распознать и подсчитать специальные символы или объекты, присутствующие в документе (что важно для чертежей и поэтажных планов зданий, планировок и т.д.),
  • обнаружить и распознать изображения.

Традиционный OCR имеет существенные ограничения. Качество распознавания документов сильно зависит от исходного качества документа. Извлечение и классификация данных эффективны лишь настолько, насколько качественно отсканированное изображение. OCR часто не может отличить «3» от «8» или «O» от «D». Именно эти проблемы и должен решать OCR.

Но вместо этого OCR превращается в новую головную боль, если качество отсканированного документа низко.

Распознавание документов с помощью искусственного интеллекта

В тех случаях, когда приходится выполнять распознавание документов низкого качетсва, в дело вступает искусственный интеллект. Возможности искусственного интеллекта продвинулись настолько, что его можно использовать для распознавания документа, когда традиционный OCR не справляется. Компании, предоставляющие услуги компьютерного зрения на заказ, создают и обучают модели машинного обучения для оптического распознавания символов.

Системы OCR на основе моделей ИИ, также известные как интеллектуальные OCR, обеспечивают гораздо лучшие результаты при распознавании документов, снижая количество ошибок и увеличивая скорость обработки. Распознавание документов с помощью ИИ помогает компаниям оцифровывать документы, которые раньше были сложны для систем OCR (например, чертежи, поэтажные планы, рукописные документы и т.д.).

Распознавание поэтажных планов

Планы этажей и чертежи чаще всего обрабатываются вручную из-за их сложной структуры и отсутствия стандартизации. Одним из основных направлений обработки поэтажных планов является определение местоположения различных объектов, таких как двери, окна, электрические розетки, вентиляционные шахты и т. д., а также перевод текста и таблиц в электронный формат для редактирования.

Из-за того, что строительные планы имеют сложную структуру, использование стандартного подхода на основе OCR для распознавания неэффективно.

Инструменты, зарекомендовавшие себя на рынке распознавания текста (такие как ABBYY и Microsoft), которые мы неоднократно использовали для распознавания паспортов, электронных таблиц, штрих-кодов и многого другого, не дают надежных результатов в случае распознавания чертежей.

Распознавание поэтажных планов, по сравнению с распознаванием обычного текста, является более сложной задачей. Потому что они включают в себя специальные символы и аббревиатуры, которые представляют сложность для готовых решений. Для качественного результата стоит разработать систему компьютерного зрения на заказ.

Машинное обучение и искусственный интеллект для распознавания поэтажных планов

Поскольку поэтажные планы — это сложные документы, включающие множество страниц, разделов и элементов, задача оцифровки обычно делится на несколько частей в зависимости от поставленной задачи. Можно оцифровать электронные таблицы, прилагаемые к плану этажа, чтобы отредактировать их, подсчитать, сколько раз тот или иной символ присутствует на странице, распознать текст и многое другое.

Распознавание чертежей: Текст

Информация о типе плана этажа, типе здания, размерах и т.д. — это текст. Обнаружение и распознавание текста — довольно простая задача, когда речь идет о современном компьютерном зрении, однако обнаружение текста на плане этажа является более сложной задачей. Текст, характерный для поэтажных планов, обычно содержит специальные символы, может быть любого размера, шрифта и цвета, а также может быть расположен под любым углом, повернут по размеру или даже перевернут вверх ногами.

Если обычные инструменты обнаружения текста, такие как OCRSpace и IText, могут использоваться с довольно высокой степенью точности для простого текста, но они очень неэффективны при обнаружении текста, расположенного под странным углом, например, размеров объекта. Чтобы добиться хороших результатов обнаружения в таких случаях, необходима разработка системы компьютерного зрения.

Читайте также:
Вы не можете открыть программу mac

Поскольку большинство инструментов OCR можно точно настроить, модуль балансировки может сравнивать различные настройки инструментов и выбирать те, которые дают наиболее точные результаты, а также сравнивать результаты различных инструментов и выбирать лучший из них. Более того, тонкая настройка инструментов OCR может значительно сократить время обработки документов — нам удалось добиться ускорения скорости обработки документов до 200 раз. Использование таких OCR-движков, как Tesseract, позволяет еще больше повысить качество распознавания текста до 99,9% точности.

Распознавание чертежей: Метки и специальные символы

Метки и специальные символы, обозначающие конкретные объекты, такие как двери, окна, электрические розетки и т.д. на чертежах зданий часто необходимо подсчитать для подготовки сметы. Обычно это делается вручную и занимает много времени, также велик фактор человеческой ошибки.

Метки обычно выглядят как геометрические фигуры, которые трудно отличить от их окружения на плане. Вариативность меток, используемых для обозначения одного и того же объекта, также увеличивает сложность обработки.

Готовые решения для компьютерного зрения, такие как библиотеки OpenCV для обнаружения символов, лучше всего работают с цветными фотографиями, на которых изображены объекты реального мира, например, фотографии людей или животных.

Планы этажей черно-белые и состоят в основном из геометрических фигур. Обычные методы OpenCV работают с переменным успехом и часто требуют доработки и усовершенствования для достижения достаточно высокой точности распознавания, достаточной для бизнес-потребностей.

Одной из основных проблем при обнаружении специальных символов на плане этажа являются ложноположительные результаты. Структура поэтажного плана состоит из простых геометрических форм, но и специальные символы и метки тоже, поэтому последние трудно отличить от окружающей среды.

Одним из способов решения этой проблемы является использование методов глубокого обучения или deep learning. Оно может быть реализовано для выявления неточных результатов обнаружения и их устранения.

Распознавание чертежей: Изображения

Некоторые поэтажные планы могут включать изображения, как цветные, так и черно-белые, изображающие фасад здания или его окрестности. Распознавание изображений — одна из самых популярных и, как следствие, более развитых областей компьютерного зрения. Распознавание изображений сильно зависит от объекта, который необходимо найти и классифицировать, поэтому имеет смысл пообщаться с разработчиками машинного обучения, чтобы узнать, как можно воплотить ваш проект в жизнь. Еще лучше сначала получить подтверждение вашей идеи ИИ — не каждая идея может быть реализована в разумные сроки и в рамках бюджетных ограничений.

Заключение

Распознавание плана этажа, как и любой другой проект компьютерного зрения, сильно зависит от бизнес-потребностей, стоящих за ним. Он может быть простым, как обнаружение небольшого блока текста, или сложным, как создание полностью автоматизированной спецификации путем обнаружения и подсчета всех объектов, присутствующих на этаже, независимо от используемых меток. Любой хороший проект начинается с изучения и проверки идеи, чтобы вы знали, возможно ли вообще реализовать задуманное.

Другие типы документов, такие как формы, заполненные от руки, контакты, электронные таблицы PDF и многие другие, могут потребовать различных подходов к решению конкретных проблем обнаружения, но общий подход к оцифровке любого документа остается неизменным. Всегда стоит сначала поговорить с командой разработчиков, чтобы понять, насколько прост или сложен ваш проект и сколько времени и денег он потребует.

Источник: www.technologika.ru

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru