Программа селдон это что

Содержание

Широкое распространение машинного обучения помогло стимулировать инновации, которые всё труднее предсказать и создавать на их основе интеллектуальный опыт для продуктов и услуг бизнеса. Чтобы решить эту задачу, важно применять передовые методы. Сергей Десяк, ведущий эксперт центра компетенций DevOps компании Neoflex, делится опытом использования Seldon Core для машинного обучения, в частности, для «выкатки» моделей.

Что такое ML

Машинное обучение (ML) — это использование математических моделей данных, которые помогают компьютеру обучаться без непосредственных инструкций. Оно считается одной из форм искусственного интеллекта (ИИ). При машинном обучении с помощью алгоритмов выявляются закономерности в данных и на их основе создаётся модель для прогнозирования. Чем больше данных обрабатывает и использует такая модель, тем точнее становятся результаты ее работы. Это очень похоже на то, как человек оттачивает навыки на практике.

Обучение «Seldon» — Знакомство с программой

Все это называют жизненным циклом модели. Сначала ставят техническую задачу для дата-сайентистов, которые разрабатывают модели ML. В последствии эту модель обучают на архивных (накопленных) данных, чтобы в дальнейшем она работала с новыми данными. Нужного качества работы модели добиваются в зависимости от поставленной задачи и при необходимости «подкручивают» настроечные параметры пока не достигнут результата.

Благодаря такому адаптивному характеру машинное обучение отлично подходит для сценариев, когда постоянно изменяются данные и свойства запросов, и написать код для решения фактически невозможно.

Зачем ML DevOps

Хотя машинное обучение можно найти повсюду, оно создаёт определенные трудности при внедрении. Одной из них является потребность быстро и надёжно переходить от фазы экспериментов к фазе производства, где обученные модели могут начать оперативно работать, чтобы принести пользу бизнесу.

Индустрия ML предлагает множество инструментов, которые помогают решить эту проблему. Публичные облачные провайдеры имеют свои собственные управляемые решения для обслуживания моделей машинного обучения. В то же время существует множество проектов с открытым исходным кодом. Часть из них бесплатные (open source), часть — платные.

Со всем этим работают дата-сайентисты и MLOps.

MLOps — это стык таких технологий, как DevOps, Machine Learning, Data Engineering. Одни создают ML- модели, другие внедряют их в производство.

Как создавали и использовали модели раньше

Изначально дата-сайентисты вели разработку на своих локальных компьютерах. Порядок их действий был таким:

Как правильно искать тендеры? | Seldon 1.7

Создавали модель;
Обучали и подбирали необходимые для запуска параметры;
Сохраняли в виде pkl-файла.

После этого модель готова, но её необходимо ещё и «выкатить». Для этого совершались дополнительные шаги:

На Flask писали «обвязку» для запуска модели в виде REST API сервиса (опять же – врукопашную);
Собирали образ;
Затем на основе образа любым удобным способом создавали сущности в Kubernetes (pod, deployment, replicaset, services and etc).

Обязательно в этом процессе были задействованы и дата-сайентисты, и DevOps-инженеры, потому что постоянно вносились правки и в код модели, и параметры запуска. В частности, при изменении модели приходилось переписывать код для REST API сервиса, пересобирать образ и, возможно, устанавливать новые пакеты, привлекая для консультации дата-сайентистов.

Как удалось оптимизировать процесс

Впоследствии стали использовать один из дополнительных инструментов для запуска моделей — MLflow. Он имеет графический интерфейс и позволяет с помощью UI наблюдать – как модель отрабатывает и с каким результатом. Кроме того, MLflow показывает предыдущие запуски и эксперименты. С помощью него порядок действия изменился:

Дата-сайентист создает модель (в Jupyter-Hub);
Обучает модель, подбирая параметры, в MLflow;
Собирается образ рабочей модели на основе пути к обученной модели и MLflow в режиме сервиса;
Используя этот образ, DevOps создаёт манифесты для запуска в Kubernetes.

KFServing vs. Seldon Core

Выбор на рынке был из двух достаточно похожих продуктов:

KFServing

Использует Kubernetes CRD для создания сервиса из моделей. Из основных возможностей выделяют:

● Поддержку моделей различного типа (Tensorflow, XGBoost, ScikitLearn, PyTorch, ONNX);

● Наличие автомасштабирования, в том числе для графического процессора;

● Проверку работоспособности модели и конфигурации сервера при старте;

● Scale to Zero, то есть возможность практически останавливать работу, ожидая данные на входе;

● Canary Rollouts для развернутых сервисов.

Seldon Core

Seldon Core похож на KFServing. Он обладает теми же функциями, но с дополнительными «фичами» и поддержкой чуть большего количества типов моделей. Вдобавок, есть возможность из обычного скрипта (программы на Python, Java, NodeJS) разворачивать готовую модель в виде REST API и работать с ней. Не надо делать кучу промежуточных решений, просто взяли код на Python и запустили его как REST API сервис. Seldon готовит это всё под себя в нужном формате, поэтому никаких дополнительных ухищрений не надо.

Кроме того, он позволяет делать А/В тесты, канареечные выкатки и имеет Outlier Detector (детектор выбросов). Этот детектор проводит проверку входящих данных на схожесть их с теми, на которых модель обучалась. Если модель обучалась, например, на данных по температуре в Арктике, то эта температура никогда не была более +5 градусов. Поэтому, если вдруг выпадет +34, модель выдаст неправильный результат, Outlier Detector это «отловит» и сообщит, что что-то пошло не так. Это удобно, например, для скоринга в банках: когда оцениваются критерии выдачи кредита, модель при необходимости сообщит о том, что входные данные неверные, и не будет всем подряд одобрять кредит.

Благодаря наличию Language Wrapper Seldon Core позволяет из разных языков программирования строить модель.

Также по git у него более частые коммиты, то есть он чаще обновляется и имеет чуть получше документацию, чем в KFServing. Хотя она, честно скажу, не идеальна. Часто ищешь что-то на странице в доках, может выпасть 404 :). Так устроена документация. Но при этом в github у Seldon Core всё есть.

Cайт просто не поспевает за ним.

Как использовать Seldon Core для машинного обучения?

Если в общем, то мы продолжим использовать MLflow для логирования экспериментов.

Всем дата-сайентистам известен продукт Jupyter Hub, так как они практически только в нём и работают. Именно здесь происходит создание моделей, их запуск и обучение. Для этого подбираются необходимые параметры запуска и проводится отладка моделей для получения необходимого качества работы. Каждый запуск мониторится в MLflow.

В дальнейшем можно посмотреть логи и с какими параметрами модель лучше запустилась. Это нужно для того, чтобы выбрать лучшую по результатам метрик. Для этого просто импортируется библиотека MLflow и модель экспортируется туда.

Дальше стоит графический интерфейс и дата-сайентист может посмотреть – какой запуск его больше устроил.

Допустим, он добился своего – модель отработала как нужно. При достижении необходимых результатов он делает git push, модель сохраняется и отправляется в GitLab для сборки образа будущего контейнера модели. Тут используется утилита от Seldon s2i (Source-to-Image), которая из кода на языке (Python, Java и т.д.) создает рабочий образ в нужном формате, готовый для использования в Seldon Core. Образ можно запустить и отправить на вход тестовые данные (test stage) для проверки успешности сборки.

Вывод

Подытожим плюсы использования Seldon Core для машинного обучения:

● Самое главное — процесс CI/CD для DevOps стал намного проще;

● Решение Kubernetes native за счет оператора автоматически уменьшает количество шагов во время «деплоя» модели. Нет необходимости привлекать большое количество сотрудников;

● Большая гибкость для использования разного типа моделей и в разных сочетаниях. Возможность создания конвейеров моделей, не прибегая к написанию большого количества кода;

● Интеграция с современными решениями: Istio, Prometheus;

● Логирование и управление из «коробки».

Дополнительно есть возможность в Prometheus следить за нагрузкой и результатом работы моделей. Если мы выкатываем A/B тесты, то можем видеть параметры отработки каждой модели на входных данных.

Это достаточно гибкое решение, потому что дата-сайентисты могут работать на разных языках. В основном это Python, но бывает NodeJS или Java. Образ с рабочей моделью соберется вне независимости от языка, на котором она написана.

Блог компании Конференции Олега Бунина (Онтико)
Блог компании Neoflex
Машинное обучение

Источник: habr.com

О продукте

Seldon 1.7 (Селдон 1.7) — это программный продукт, упрощающий и систематизирующий работу с закупками. Система консолидирует сведения о различных видах закупок на территории России и за ее пределами, дает возможность оперативно отслеживать и анализировать поступающую информацию. Входит в реестр отечественного ПО.

Продуктовая линейка

Seldon.Basis

Seldon.Price

Seldon.Lite
Пропускаете выгодные для вас контракты?
Подумайте об автоматизированном поиске!

Детальный поиск

Гибкая система фильтров. Находите тендеры схожей тематики, в том числе по вложенным документам. Сбор информации обо всех видах закупок: государственных, коммерческих, международных, планируемых, реализиации имущества и др.

Расширенная аналитика

Автоматические отчеты по истории закупок конкретного заказчика, истории полученных контрактов конкурентов, ценовым предложениям профильной продукции и многие другие.

Для фармацевтов

Находите закупки по названию товара, международному непатентованному наименованию, торговому наименованию, принадлежности к ЖНВЛП. Исследуйте цены на интересующие препараты. Находите потенциальных поставщиков конкретных лекарственных средств. Поможет определить объем поставок интересующего товара в конкретный регион.

Источник: seldongroup.ru

Продукты компании Seldon

Купить аналитическую систему для госзакупок Seldon 1.7 (Селдон 1.7)

Собранная в системе обширная база данных о закупках и их итогах позволяет формировать различные аналитические отчеты.

Задайте нужные условия, и система сама наглядно проиллюстрирует тенденции и распределение данных в форме графика или таблицы.

Крупнейшие игроки рынка и их объемы контрактов
Динамика закупок и заключения контрактов
Деятельность участников закупок
Победители и участники закупки
Поставщики по профилю
Поставщики конкретного заказчика

Наши преимущества

Более 7000 источников данных

Точная настройка поиска

Продукты компании Seldon — это будущее!

С помощью информационно-аналитических систем Seldon Вы всегда будете в курсе профильных тендеров, сможете проводить маркетинговые исследования рынка, просматривать информацию о всех закупках и знать о контрактах конкурентов.

Seldon - это будущее

Seldon.News

Продукты Seldon

Информация

Соц. сети

Viber Seldon

Политика конфиденциальности

Спасибо за обращение

Сообщение успешно отправлено

Согласие на обработку персональных данных

Заполняя форму на сайте seldon.online Вы даете добровольное согласие Администрации ресурса на обработку своих персональных данных. Под персональными данными понимается любая информация, относящаяся к Вам, отправленная с помощью формы обратной связи на сайте seldon.online (фамилия, имя, отчество, город проживания, контактный номер телефона, адрес электронной почты);

Ваше согласие распространяется на осуществление Администрацией сайта seldon.online действий в отношении ваших персональных данных, которые могут понадобиться для сбора, систематизации, хранения, уточнения (обновление, изменение), обработки (например, отправки писем или совершения звонков), распространения (в том числе возможная передача Генеральному партнеру ООО «Селдон ПРО»), блокирования и т.п. с учетом действующего законодательства;

Администрации ресурса получает персональные данные указанные в следующих целях:

ФИО Пользователя – для идентификации пользователя;
Телефон Пользователя – для возможности уведомлять пользователя о важных событиях, в случае его согласия;
Адрес электронной почты (e-mail) Пользователя для отправки писем и для возможности уведомлять пользователя о важных событиях, в случае его согласия;

Администрации ресурса обрабатывает персональные данные субъекта персональных данных исключительно в следующих целях:

осуществления деятельности по предоставлению онлайн сервисов Пользователям сайта;
осуществления деятельности по предоставлению доступа к программному обеспечению Информационно-аналитической системы Seldon Пользователям сайта;
заключения, исполнения и прекращения гражданско-правовых договоров с физическими, юридическим лицами, индивидуальными предпринимателями и иными лицами, в случаях, предусмотренных действующим законодательством и уставными или иными документами Администрации ресурса;
осуществления связи с Пользователем в случае необходимости, в том числе направления уведомлений, запросов и информации, связанных с использованием им сайта, оказанием услуг, а также обработки запросов и заявок от Пользователя;
улучшения качества оказываемых услуг, удобства их использования, разработки новых сервисов и услуг.

Администрации ресурса вправе не предоставлять бесплатный доступ к Информационно-аналитической системе Seldon 1.7, в случае:

Не предоставления ИНН организации, т.е. не заполнения поля «ИНН организации».
Предоставления несуществующего ИНН организации.
Предоставления ИНН организации деятельность которой прекращена. ИНН — Идентификационный номер налогоплательщика

Источник: seldon.online

Что такое ML

Зачем ML DevOps

Как создавали и использовали модели раньше

Как удалось оптимизировать процесс

KFServing vs. Seldon Core

Seldon Core

Как использовать Seldon Core для машинного обучения?

Вывод

О продукте

Продукты компании Seldon

Наши преимущества

Продукты компании Seldon — это будущее!

Seldon.News

Продукты Seldon

Информация

Соц. сети

Для чего нужна программа компилятор

Программа смешанное белье для чего

Токси риск программа для чего

Программа аршин метрология для чего

Программа чек пфр для чего

Для чего предназначена программа стили

Для чего нужна программа тренажер

Для чего нужна программа apkpure