Программа селдон это что

Широкое распространение машинного обучения помогло стимулировать инновации, которые всё труднее предсказать и создавать на их основе интеллектуальный опыт для продуктов и услуг бизнеса. Чтобы решить эту задачу, важно применять передовые методы. Сергей Десяк, ведущий эксперт центра компетенций DevOps компании Neoflex, делится опытом использования Seldon Core для машинного обучения, в частности, для «выкатки» моделей.

Что такое ML

Машинное обучение (ML) — это использование математических моделей данных, которые помогают компьютеру обучаться без непосредственных инструкций. Оно считается одной из форм искусственного интеллекта (ИИ). При машинном обучении с помощью алгоритмов выявляются закономерности в данных и на их основе создаётся модель для прогнозирования. Чем больше данных обрабатывает и использует такая модель, тем точнее становятся результаты ее работы. Это очень похоже на то, как человек оттачивает навыки на практике.

Обучение «Seldon» — Знакомство с программой

Все это называют жизненным циклом модели. Сначала ставят техническую задачу для дата-сайентистов, которые разрабатывают модели ML. В последствии эту модель обучают на архивных (накопленных) данных, чтобы в дальнейшем она работала с новыми данными. Нужного качества работы модели добиваются в зависимости от поставленной задачи и при необходимости «подкручивают» настроечные параметры пока не достигнут результата.

Благодаря такому адаптивному характеру машинное обучение отлично подходит для сценариев, когда постоянно изменяются данные и свойства запросов, и написать код для решения фактически невозможно.

Зачем ML DevOps

Хотя машинное обучение можно найти повсюду, оно создаёт определенные трудности при внедрении. Одной из них является потребность быстро и надёжно переходить от фазы экспериментов к фазе производства, где обученные модели могут начать оперативно работать, чтобы принести пользу бизнесу.

Индустрия ML предлагает множество инструментов, которые помогают решить эту проблему. Публичные облачные провайдеры имеют свои собственные управляемые решения для обслуживания моделей машинного обучения. В то же время существует множество проектов с открытым исходным кодом. Часть из них бесплатные (open source), часть — платные.

Со всем этим работают дата-сайентисты и MLOps.

MLOps — это стык таких технологий, как DevOps, Machine Learning, Data Engineering. Одни создают ML- модели, другие внедряют их в производство.

Как создавали и использовали модели раньше

Изначально дата-сайентисты вели разработку на своих локальных компьютерах. Порядок их действий был таким:

Как правильно искать тендеры? | Seldon 1.7

  1. Создавали модель;
  2. Обучали и подбирали необходимые для запуска параметры;
  3. Сохраняли в виде pkl-файла.

После этого модель готова, но её необходимо ещё и «выкатить». Для этого совершались дополнительные шаги:

  1. На Flask писали «обвязку» для запуска модели в виде REST API сервиса (опять же – врукопашную);
  2. Собирали образ;
  3. Затем на основе образа любым удобным способом создавали сущности в Kubernetes (pod, deployment, replicaset, services and etc).

Обязательно в этом процессе были задействованы и дата-сайентисты, и DevOps-инженеры, потому что постоянно вносились правки и в код модели, и параметры запуска. В частности, при изменении модели приходилось переписывать код для REST API сервиса, пересобирать образ и, возможно, устанавливать новые пакеты, привлекая для консультации дата-сайентистов.

Как удалось оптимизировать процесс

Впоследствии стали использовать один из дополнительных инструментов для запуска моделей — MLflow. Он имеет графический интерфейс и позволяет с помощью UI наблюдать – как модель отрабатывает и с каким результатом. Кроме того, MLflow показывает предыдущие запуски и эксперименты. С помощью него порядок действия изменился:

  1. Дата-сайентист создает модель (в Jupyter-Hub);
  2. Обучает модель, подбирая параметры, в MLflow;
  3. Собирается образ рабочей модели на основе пути к обученной модели и MLflow в режиме сервиса;
  4. Используя этот образ, DevOps создаёт манифесты для запуска в Kubernetes.
Читайте также:
Что это программа du

Но впоследствии всё равно оставались проблемы: модель только в формате MLflow и язык по-прежнему только Python. Вдобавок, невозможно было совершать дополнительные действия с данными, поступающими на вход модели. Если же модель менялась, то приходилось пересобирать образ и все делать заново.

Были и другие факторы, которые не устраивали:

• Ограниченность в самих форматах моделей;

• Отсутствие возможности строить из нескольких последовательных моделей pipeline (конвейер), то есть выходные данные одной модели подавать на вход другой, а также невозможность проведения предварительных преобразований входящих данных;

• Отсутствие контроля за работой модели, а также реакции на наличие сбоев;

• Невозможность проведения А/В тестов.

Компании стали искать более современное решение, потому что использовать лишь MLflow неудобно, сложно, затратно c точки зрения человеко-часов.

KFServing vs. Seldon Core

Выбор на рынке был из двух достаточно похожих продуктов:

KFServing

Использует Kubernetes CRD для создания сервиса из моделей. Из основных возможностей выделяют:

● Поддержку моделей различного типа (Tensorflow, XGBoost, ScikitLearn, PyTorch, ONNX);

● Наличие автомасштабирования, в том числе для графического процессора;

● Проверку работоспособности модели и конфигурации сервера при старте;

● Scale to Zero, то есть возможность практически останавливать работу, ожидая данные на входе;

● Canary Rollouts для развернутых сервисов.

Seldon Core

Seldon Core похож на KFServing. Он обладает теми же функциями, но с дополнительными «фичами» и поддержкой чуть большего количества типов моделей. Вдобавок, есть возможность из обычного скрипта (программы на Python, Java, NodeJS) разворачивать готовую модель в виде REST API и работать с ней. Не надо делать кучу промежуточных решений, просто взяли код на Python и запустили его как REST API сервис. Seldon готовит это всё под себя в нужном формате, поэтому никаких дополнительных ухищрений не надо.

Кроме того, он позволяет делать А/В тесты, канареечные выкатки и имеет Outlier Detector (детектор выбросов). Этот детектор проводит проверку входящих данных на схожесть их с теми, на которых модель обучалась. Если модель обучалась, например, на данных по температуре в Арктике, то эта температура никогда не была более +5 градусов. Поэтому, если вдруг выпадет +34, модель выдаст неправильный результат, Outlier Detector это «отловит» и сообщит, что что-то пошло не так. Это удобно, например, для скоринга в банках: когда оцениваются критерии выдачи кредита, модель при необходимости сообщит о том, что входные данные неверные, и не будет всем подряд одобрять кредит.

Благодаря наличию Language Wrapper Seldon Core позволяет из разных языков программирования строить модель.

Также по git у него более частые коммиты, то есть он чаще обновляется и имеет чуть получше документацию, чем в KFServing. Хотя она, честно скажу, не идеальна. Часто ищешь что-то на странице в доках, может выпасть 404 :). Так устроена документация. Но при этом в github у Seldon Core всё есть.

Cайт просто не поспевает за ним.

Как использовать Seldon Core для машинного обучения?

Если в общем, то мы продолжим использовать MLflow для логирования экспериментов.

Всем дата-сайентистам известен продукт Jupyter Hub, так как они практически только в нём и работают. Именно здесь происходит создание моделей, их запуск и обучение. Для этого подбираются необходимые параметры запуска и проводится отладка моделей для получения необходимого качества работы. Каждый запуск мониторится в MLflow.

В дальнейшем можно посмотреть логи и с какими параметрами модель лучше запустилась. Это нужно для того, чтобы выбрать лучшую по результатам метрик. Для этого просто импортируется библиотека MLflow и модель экспортируется туда.

Дальше стоит графический интерфейс и дата-сайентист может посмотреть – какой запуск его больше устроил.

Допустим, он добился своего – модель отработала как нужно. При достижении необходимых результатов он делает git push, модель сохраняется и отправляется в GitLab для сборки образа будущего контейнера модели. Тут используется утилита от Seldon s2i (Source-to-Image), которая из кода на языке (Python, Java и т.д.) создает рабочий образ в нужном формате, готовый для использования в Seldon Core. Образ можно запустить и отправить на вход тестовые данные (test stage) для проверки успешности сборки.

Читайте также:
Scada программа что это

На выходе мы получаем готовый образ для Seldon: то есть не просто образ для какой-то системы, а образ в том формате, который нужен Seldon. В нём уже настроены эндпойнты, обработаны входные данные и выдан результат. Дальше всё это «пушится» в репу для выкатки в Кубер (деплоится манифест).

В случае успешной сборки, модель «выкатывается» в Kubernetes с необходимыми параметрами с помощью Helm chart (используется Seldon Deployment) и ArgoCD. Так на основе одного единственного манифеста идёт выкатка всех сущностей, необходимых для работы модели в качестве REST API сервиса. Seldon работает на основе Custom resources definition (CRD) в Kubernetes. Он видит тип деплоя (Seldon Deployment) и разворачивает необходимые сервисы, поды – то есть всё, что нужно, чтобы модель заработала.

Во время сборки необходимо задать всего лишь имя модели. Также задается тип модели (router, classifier, splitter) и список используемых ею пакетов. После этого «подкидывается» единственный файл со списком библиотек, который использовал сам дата-сайентист. Для DevOps неважно, что внутри. Дата-сайентист добавляет новую либу, указывает в файле и модель соберется.

DevOps-инженер один раз настраивает pipeline и отдаёт его дата-сайентисту. Тот «пушит» в репу, всё это выкатывается с помощью, допустим, ArgoCD на Kubernetes, и можно уже посылать данные в «инстанс», который доступен снаружи на Kubernetes. При этом DevOps-инженер свободен, а дата-сайентист не отвлекается от своей работы. Это достаточно удобно, быстро и очень сильно экономит ресурсы.

Вывод

Подытожим плюсы использования Seldon Core для машинного обучения:

● Самое главное — процесс CI/CD для DevOps стал намного проще;

● Решение Kubernetes native за счет оператора автоматически уменьшает количество шагов во время «деплоя» модели. Нет необходимости привлекать большое количество сотрудников;

● Большая гибкость для использования разного типа моделей и в разных сочетаниях. Возможность создания конвейеров моделей, не прибегая к написанию большого количества кода;

● Интеграция с современными решениями: Istio, Prometheus;

● Логирование и управление из «коробки».

Дополнительно есть возможность в Prometheus следить за нагрузкой и результатом работы моделей. Если мы выкатываем A/B тесты, то можем видеть параметры отработки каждой модели на входных данных.

Это достаточно гибкое решение, потому что дата-сайентисты могут работать на разных языках. В основном это Python, но бывает NodeJS или Java. Образ с рабочей моделью соберется вне независимости от языка, на котором она написана.

  • Блог компании Конференции Олега Бунина (Онтико)
  • Блог компании Neoflex
  • Машинное обучение

Источник: habr.com

О продукте

Seldon 1.7 (Селдон 1.7) — это программный продукт, упрощающий и систематизирующий работу с закупками. Система консолидирует сведения о различных видах закупок на территории России и за ее пределами, дает возможность оперативно отслеживать и анализировать поступающую информацию. Входит в реестр отечественного ПО.

Интерфейс Селдон 1.7

Продуктовая линейка

Селдон 1.7 на сайте Seldon

Селдон ПРО на сайте Seldon

Селдон Базис на сайте Seldon

Seldon.Basis

Селдон Прайс на сайте Seldon

Seldon.Price

Селдон Док на сайте Seldon

Селдон Лайт на сайте Seldon

Seldon.Lite
Пропускаете выгодные для вас контракты?
Подумайте об автоматизированном поиске!

Детальный поиск на сайте seldongroup.ru

Детальный поиск

Гибкая система фильтров. Находите тендеры схожей тематики, в том числе по вложенным документам. Сбор информации обо всех видах закупок: государственных, коммерческих, международных, планируемых, реализиации имущества и др.

Расширенная аналитика на сайте seldongroup.ru

Расширенная аналитика

Автоматические отчеты по истории закупок конкретного заказчика, истории полученных контрактов конкурентов, ценовым предложениям профильной продукции и многие другие.

Для фармацевтов на сайте seldongroup.ru

Для фармацевтов

Находите закупки по названию товара, международному непатентованному наименованию, торговому наименованию, принадлежности к ЖНВЛП. Исследуйте цены на интересующие препараты. Находите потенциальных поставщиков конкретных лекарственных средств. Поможет определить объем поставок интересующего товара в конкретный регион.

Источник: seldongroup.ru

Продукты компании Seldon

Купить аналитическую систему для госзакупок Seldon 1.7 (Селдон 1.7)

Собранная в системе обширная база данных о закупках и их итогах позволяет формировать различные аналитические отчеты.

Задайте нужные условия, и система сама наглядно проиллюстрирует тенденции и распределение данных в форме графика или таблицы.

  • Крупнейшие игроки рынка и их объемы контрактов
  • Динамика закупок и заключения контрактов
  • Деятельность участников закупок
  • Победители и участники закупки
  • Поставщики по профилю
  • Поставщики конкретного заказчика
Читайте также:
Diskdigger это что за программа

Благодаря широким возможностям Вы сможете еще на этапе подачи заявки с большей долей вероятности выявить нечестных заказчиков, посмотреть какое снижение ожидается в текущей закупке и принять решение о том стоит ли участвовать и какую прибыль возможно получить. Не имеющий аналогов на рынке РФ аналитический модуль заставит Вас по-новому взглянуть на тендерный рынок.

Поиск в системе

Система собирает данные с 7 400+ информационных источников (включая собственные сайты компаний, различные порталыи т.п.) и отображает все интересующие закупки со всех площадок в одном окне.

Поисковые фильтры учитывают целый ряд параметров для максимально точного поиска: тематика, заказчик, НМЦК, регион или адрес поставки, ОКПД2 и другие критерии.

Форма сквозного поиска, находящаяся на главной странице системы, позволяет искать по всем разделам системы. Это особенно удобно, когда пользователь не знает, в каком именно разделе может содержаться поисковый запрос, или хочет получить комплексную информацию.

Уникальный поиск по документам позволит производить поиск внутри конкурсной документации, даже если заказчик разместил ее в формате скан-копий или фотографий. Данная функция не имеет аналогов на сегодняшний день, что дает Вам самые широкие возможности в отличие в конкурентов.

Законодательная база

В системе содержится правовая база «Гарант» c актуальной подборкой материалов непосредственно для тендерных специалистов.

Данным ресурсом может пользоваться как специалист по тендерам так и бухгалтерия и юридический отдел. Данные поступают напрямую с сервера разработчика СПС Гарант.

Наши преимущества

Более 7000 источников данных

Точная настройка поиска

Продукты компании Seldon — это будущее!

С помощью информационно-аналитических систем Seldon Вы всегда будете в курсе профильных тендеров, сможете проводить маркетинговые исследования рынка, просматривать информацию о всех закупках и знать о контрактах конкурентов.

Seldon - это будущее

Seldon.News

Продукты Seldon

Информация

Соц. сети

Whatsapp Seldon Viber Seldon Telegram Seldon

Политика конфиденциальности

Спасибо за обращение

Сообщение успешно отправлено

Согласие на обработку персональных данных

Заполняя форму на сайте seldon.online Вы даете добровольное согласие Администрации ресурса на обработку своих персональных данных. Под персональными данными понимается любая информация, относящаяся к Вам, отправленная с помощью формы обратной связи на сайте seldon.online (фамилия, имя, отчество, город проживания, контактный номер телефона, адрес электронной почты);

Ваше согласие распространяется на осуществление Администрацией сайта seldon.online действий в отношении ваших персональных данных, которые могут понадобиться для сбора, систематизации, хранения, уточнения (обновление, изменение), обработки (например, отправки писем или совершения звонков), распространения (в том числе возможная передача Генеральному партнеру ООО «Селдон ПРО»), блокирования и т.п. с учетом действующего законодательства;

Администрации ресурса получает персональные данные указанные в следующих целях:

  • ФИО Пользователя – для идентификации пользователя;
  • Телефон Пользователя – для возможности уведомлять пользователя о важных событиях, в случае его согласия;
  • Адрес электронной почты (e-mail) Пользователя для отправки писем и для возможности уведомлять пользователя о важных событиях, в случае его согласия;

Администрации ресурса обрабатывает персональные данные субъекта персональных данных исключительно в следующих целях:

  • осуществления деятельности по предоставлению онлайн сервисов Пользователям сайта;
  • осуществления деятельности по предоставлению доступа к программному обеспечению Информационно-аналитической системы Seldon Пользователям сайта;
  • заключения, исполнения и прекращения гражданско-правовых договоров с физическими, юридическим лицами, индивидуальными предпринимателями и иными лицами, в случаях, предусмотренных действующим законодательством и уставными или иными документами Администрации ресурса;
  • осуществления связи с Пользователем в случае необходимости, в том числе направления уведомлений, запросов и информации, связанных с использованием им сайта, оказанием услуг, а также обработки запросов и заявок от Пользователя;
  • улучшения качества оказываемых услуг, удобства их использования, разработки новых сервисов и услуг.

Администрации ресурса вправе не предоставлять бесплатный доступ к Информационно-аналитической системе Seldon 1.7, в случае:

  1. Не предоставления ИНН организации, т.е. не заполнения поля «ИНН организации».
  2. Предоставления несуществующего ИНН организации.
  3. Предоставления ИНН организации деятельность которой прекращена. ИНН — Идентификационный номер налогоплательщика

Источник: seldon.online

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru