R Services — это компонент SQL Server 2016, который дает возможность выполнять скрипты R с реляционными данными. Вы можете использовать платформы и пакеты с открытым кодом и пакеты Майкрософт R для прогнозной аналитики и машинного обучения. Скрипты выполняются в базе данных без перемещения данных за пределы SQL Server или по сети. В этой статье объясняются основы SQL Server R Services.
R Services были переименованы в Службы машинного обучения в SQL Server 2017 и более поздних версий и поддерживают Python и R.
Что такое службы R?
SQL Server R Services позволяют выполнять скрипты R в базе данных. С их помощью можно подготавливать и очищать данные, выполнять проектирование признаков, а также обучать, оценивать и развертывать модели машинного обучения в базе данных. Этот компонент выполняет скрипты там, где хранятся данные, и устраняет необходимость перемещения данных по сети на другой сервер.
Базовые распределения R включены в службы R Services. Вы можете использовать пакеты и платформы с открытым кодом в дополнение к пакетам Microsoft RevoScaleR, MicrosoftML, [olapR]../r/ref-r-olapr.md) и sqlrutils для R.
Installing Microsoft R Services in SQL 2016
R Services используют платформу расширяемости для выполнения скриптов R на SQL Server. Дополнительные сведения о том, как это работает:
- Платформа расширяемости
- Расширение R
Что можно сделать с помощью служб R Services?
Службы R Services можно использовать для создания и обучения моделей машинного обучения и глубокого обучения в SQL Server. Можно также развернуть существующие модели в службах R Services и использовать реляционные данные для прогнозов.
Примеры типов прогнозов, для которых можно использовать SQL Server R Services:
Классификация и категоризация | Автоматическое разделение отзывов клиентов на положительные и отрицательные |
Регрессия/прогнозирование непрерывных значений | Прогнозирование стоимости домов на основе размера и расположения |
Обнаружение аномалий | Обнаружение мошеннических банковских транзакций |
Рекомендации | Предложение продуктов, которые могут понравиться покупателям Интернет-магазина, на основе их предыдущих покупок |
Как выполнять скрипты R
Существует два способа выполнения скриптов R в R Services:
- Наиболее распространенным способом является использование хранимой процедуры T-SQL sp_execute_external_script.
- Вы также можете использовать предпочтительный клиент R и написать скрипты, которые принудительно отправляют выполнение (так называемый удаленный контекст вычислений) на удаленный SQL Server. Дополнительные сведения см. в разделе о настройке обработки и анализа для разработки на R.
Версии R
Ниже перечислены версии среды выполнения R, включенные в службы R для SQL Server 2016.
SQL Server 2016 RTM — SP2 CU13 | 3.2.2 |
SQL Server 2016 с пакетом обновления 2 (SP2) CU14 и более поздние версии | 3.2.2 и 3.5.2 |
Что такое Windows Server и в чем отличие от Windows?
Накопительное обновление (CU) 14 для SQL Server 2016 с пакетом обновления 2 (SP2) и более поздних версий включает в себя более новые среды выполнения R. Дополнительные сведения см. в статье Изменение версии языковой среды выполнения по умолчанию.
Если нужно запустить другие версии R или Python, воспользуйтесь Службами машинного обучения для SQL Server 2017 и более поздних версий.
Пакеты R
В дополнение к корпоративным пакетам Майкрософт можно использовать платформы и пакеты с открытым кодом. Наиболее распространенные пакеты R с открытым кодом предварительно установлены в R Services. Также включены следующие пакеты R от Майкрософт:
RevoScaleR | Основной пакет для масштабируемого R. Преобразования и обработка данных, статистическая сводка, визуализация и многие виды моделирования. Кроме того, функции в этом пакете автоматически распределяют рабочие нагрузки между доступными ядрами для параллельной обработки. |
MicrosoftML (R) | Добавляет алгоритмы машинного обучения для создания пользовательских моделей для анализа текста, анализа изображений и анализа тональности. |
olapR | Функции R, используемые для запросов многомерных выражений к кубу OLAP SQL Server Analysis Services. |
sqlrutils | Механизм для использования скриптов R в хранимой процедуре T-SQL, регистрации этой хранимой процедуры в базе данных и ее запуска из среды разработки R. |
Microsoft R Open | Microsoft R Open (MRO) — это улучшенная версия R от Майкрософт. Это полная платформа с открытым кодом для статистического анализа и обработки и анализа данных. Она основана на R, полностью совместима с ним и включает дополнительные возможности для повышения производительности и воспроизводимости. |
Как начать работать с R Services?
- Установка SQL Server 2016 R Services
- Настройте средства разработки. Вы можете использовать:
- Azure Data Studio или SQL Server Management Studio (SSMS) для использования T-SQL и хранимой процедуры sp_execute_external_script, чтобы выполнить скрипт R.
- R на собственном ноутбуке или рабочей станции разработки для выполнения скриптов. Можно либо извлечь данные локально, либо отправить выполнение удаленно в SQL Server с помощью RevoScaleR. Дополнительные сведения см. в разделе о настройке обработки и анализа для разработки на R.
- Напишите свой первый скрипт R
- Краткое руководство. Создание и выполнение простых скриптов R в SQL Server
- Краткое руководство. Создание и обучение модели прогнозирования на R
- Руководство по Использование R в T-SQL. Просмотр данных, разработка признаков, обучение и развертывание моделей, создание прогнозов (серия из пяти частей)
- Руководство по Использование служб R в инструментах R. Просмотр данных, создание графов и графиков, разработка признаков, обучение и развертывание моделей, создание прогнозов (серии из шести частей)
Дальнейшие шаги
- Установка SQL Server 2016 R Services
- Настройка клиента обработки и анализа данных для разработки на R
Источник: learn.microsoft.com
Microsoft R Server 9.0 поможет обрабатывать большие данные
Microsoft объявила о выпуске новой версии Microsoft R Server 9.0 (MRS) — решения, ориентированного на корпоративных заказчиков и предназначенного для масштабного анализа данных, создания интеллектуальных приложений и получения ценных сведений из различных внутренних и внешних источников компании. Наверное, самое интригующее в этом анонсе — название продукта. Имя «R Server» до сих пор было практически неизвестно на ИТ-рынке, но в то же время номер версии говорит о большой, и, судя по всему, довольно успешной (до такого номера доживают далеко не все разработки) истории этого ПО. Парадокс этот объясняется достаточно просто: MRS 9.0 — это первый выпуск под маркой Microsoft продуктовой линейки компании Revolution Analytics, которую Редмонд приобрел в начале 2015 г.
Созданная в 2007 г. Revolution Analytics изначально специализировалась на задачах статистической обработки больших объемов данных, и, по мнению экспертов, в последние годы входила в число лидеров этого направления, конкурируя с такими гигантами, как SAS и IBM (Голубой гигант вышел на это рынок, купив в известного специализированного игрока SPSS Statistics). При создании своего ПО Revolution Analytics сделала ставку на использование открытого языка R, изначально ориентированного именно на статобработку. Ее основной продукт Revolution R, который теперь называется R Server, представляет собой высокопроизводительную версию среды выполнения языка R, оптимизированную для многопоточных вычислений, в дополнение к которому имеется набор библиотек, прежде всего для массово-параллельной обработки в рамках концепции Big Data. Вторая его важная особенность (и отличие от решений SAS и SPSS) — использование методов обработки данных в оперативной памяти (in-memory).
В марте 2016 г. Microsoft объявила о поддержке языка R в своем средстве разработки Visual Studio, при этом R стал первым языком именно вычислительной направленности в составе этого инструмента. Выпущенный сейчас MRS 9.0 также тесно связан с Visual Studio и доступен для загрузки через аккаунты MSDN и Visual Studio Dev Essentials. Продукт также интегрирован с Microsoft SQL Server, который используется, в том числе, для хранения результатов статистической обработки. Кроме того новый функционал статобработки включен в состав SQL Server 2016 в виде служб SQL Server R Services. Для работы с внешними источниками данных MRS 9.0 может использовать фреймворк Spark 2.0 (в дополнение к ранее задействованной версии Spark 1.6), при этом расширен список поддерживаемых версий Linux и Hadoop.
Как следует из комментариев представителей Microsoft, корпорация намерена продвигать MRS в направлении решения задач искусственного интеллекта и машинного обучения. Важным шагом в этом направлении является появление в составе сервера нового программного пакета MicrosoftML (Machine Learning), который в существенной мере реализован на базе открытых библиотек CRAN R. Сейчас MicrosoftML работает в средах Windows и SQL Server, но компания обещает появление уже в следующем году поддержки Linux и Hadoop.
Источник: www.itweek.ru
Revolution R переименован в Microsoft R и доступен бесплатно для разработчиков и студентов
За девять месяцев, с тех пор как Microsoft приобрела Revolution Analytics, компанией было выпущено много обновлений для Revolution R Open и Revolution R Enterprise, не говоря уже об интеграции R с SQL Server, PowerBI, Azure и Cortana Analytics.
Американская компания Revolution Analytics является производителем программного обеспечения для статистической обработки данных. Компания специализируется на коммерциализации языка программирования R и создании программных решений с его использованием.
Основным продуктом компании Revolution Analytics является Revolution R — это среда выполнения языка R (язык программирования для статистической обработки данных и работы с графикой), оптимизированная для многопоточных вычислений, а также, набор библиотек, для параллельной обработки в рамках концепции «больших данных».
Несколько дней назад, Microsoft предоставила доступ к продуктам R Server по подпискам MSDN и DreamSpark.
Официальный анонс от Microsoft состоялся 12 января. Компания сообщила, что Revolution R Open переименован в Microsoft R Open и доступен для бесплатной загрузки, а также Revolution R Enterprise переименован в Microsoft R Server.
Джозеф Сирош, корпоративный вице-президент Microsoft Data Group, сообщил на страничке Machine Learning Blog о выходе нового продукта — Microsoft R Server Developer Edition. Этой же редакцией будет укомплектована анонсированная ранее Microsoft Data Science Virtual Machine. Это позволит пользователям R быстро начать работу по исследованию данных и моделированию в облаке, без необходимости настраивать окружение. Microsoft R Server Developer Edition включает в себя возможности коммерческой версии, однако распространяется бесплатно.
Коммерческий дистрибутив Microsoft R Server будет интегрирован в SQL Server 2016 в виде SQL Server R Services. До выхода SQL Server 2016, Revolution R Enterprise для Windows будет поставляться в виде отдельного продукта.
Чтобы начать работать с Microsoft R Server, вы можете загрузить его по одной из следующих ссылок:
Для всех: Download Microsoft R Open from MRAN (Бесплатно.)
Для студентов: Download Microsoft R Server from DreamSpark (Бесплатно. Необходима учетная запись Microsoft)
Для разработчиков: Download Microsoft R Server from Visual Studio Dev Essentials (Бесплатно. Необходима учетная запись Microsoft)
Источник: habr.com