RevoScaleR - RevoScaleR

RevoScaleR
Оригинальный автор (ы)Microsoft
изначальный выпуск2016
Написано вPython
ПлатформаWindows, Linux
Доступно вр
Интернет сайтдокументы.microsoft.com/ en-us/ машинное обучение-сервер/ r-ссылка/ revoscaler/ revoscaler

RevoScaleR это машинное обучение пакет в р сделано Microsoft. Он доступен как часть сервера машинного обучения, клиента Microsoft R и служб машинного обучения в Microsoft SQL Server 2016.

В пакете есть функции для создания линейная модель, логистическая регрессия, случайный лес, Древо решений и усиленное дерево решений, и K-означает, в дополнение к некоторым сводным функциям для проверки и визуализации данных.[1].

У него есть аналог пакета Python, называемый ревоскалепия. Другой тесно связанный пакет - MicrosoftML, который содержит алгоритмы машинного обучения, которых нет в RevoScaleR, например нейронная сеть и SVM.

Концепции

Многие пакеты R предназначены для анализа данных, которые могут уместиться в памяти машины, и обычно не используют параллельную обработку. RevoScaleR был разработан для устранения этих ограничений. Функции RevoScaleR ориентированы на три основных концепции абстракции, которые пользователи могут указать для обработки большого количества данных, которые могут не уместиться в памяти, и использования параллельных ресурсов для ускорения анализа.

Вычислить контексты

Контекст вычислений относится к месту, где происходит вычисление данных. Он может быть «локальным» (на клиентском компьютере) или «удаленным» (на платформе данных, такой как SQL сервер, или Искра ). Передача вычислений на удаленный сервер позволяет людям использовать в своих интересах большие вычислительные ресурсы, которые может иметь удаленная машина. Если анализируемые данные находятся на одном компьютере, использование контекста удаленных вычислений также устраняет необходимость передачи данных по сети на клиентский компьютер. [2]

Источник данных

Источник данных определяет, откуда поступают данные. В RevoScaleR доступны различные источники данных, такие как текстовые данные, данные Xdf, данные в SQL и фрейм данных Spark. Люди могут заключить свои данные в объект источника данных и использовать его как аналитику запуска в другом контексте вычислений. Доступны разные источники данных в разном контексте вычислений. Например, если для контекста вычислений задан SQL-сервер, то единственным источником данных, который можно использовать, будет источник данных in-SQL.

Аналитика

Аналитические функции в RevoScaleR принимают объект источника данных, контекст вычислений и другие параметры, необходимые для построения конкретной модели, такие как формула для логистической регрессии или количество деревьев в дереве решений. В дополнение к этим параметрам можно также указать уровень параллелизма, например размер блока данных для каждого процесса или количество процессов для построения модели. Однако параллелизм доступен только в неэкспресс-версии.

Ограничения

Пакет в основном предназначен для использования с SQL-сервером или другими удаленными машинами. Чтобы полностью использовать абстракции, которые он использует для обработки большого набора данных, нужен удаленный сервер и бесплатная версия пакета, отличная от Express. Его нелегко установить, например, запустив "install.packages (" RevoScaleR ")", как большинство пакетов R с открытым исходным кодом. Он доступен только через Microsoft R Client, дистрибутив R для науки о данных или Microsoft Machine Learning Server (автономный без подключенного SQL-сервера) или Microsoft Machine Learning Services (службы SQL-сервера). Тем не менее, можно по-прежнему использовать функции аналитики в бесплатной экспресс-версии пакета.

Смотрите также

Рекомендации

  1. ^ «Пакет RevoScaleR». Корпорация Майкрософт. Получено 2018-04-12.
  2. ^ «Вычислительный контекст для выполнения скрипта на сервере машинного обучения». Корпорация Майкрософт. Получено 2018-04-12.

внешняя ссылка