На рынке представлено две самых сильных компании, предлагающие программные продукты для статистического анализа данных: STATISTICA (http://statsoft.ru/ ) и SPSS (https://www.ibm.com/analytics/ru/ru/technology/spss/ ). Во многих научных работах есть указания на то, что обработка проводилась при помощи Microsoft Excel, но поскольку этот продукт позиционируется значительно шире, чем специализированное программное обеспечение, здесь мы его рассматривать не будем.
Важная ремарка: любой программный продукт, каким бы хорошим он не был, это только инструмент. В умелых руках – он дает точные результаты, в неграмотных – иллюзию объективности.
Программа STATISTICA (текущая русифицированная версия 10)
Цена для 1 пользователя: ~800$
Достоинства:
По нашему мнению, лучший пакет для научных исследований.
Отличные возможности для построения графиков.
Автоматический отчет, который можно редактировать в Word.
Много литературы (включая электронную, доступную открыто в Интернет) по работе с пакетом.
An introduction to Statistica
Все основные методы анализа (описательные, факториальные, корреляции и т.д.)
Недостатки:
Сложный интерфейс.
Программа SPSS (текущая русифицированная версия 22)
Цена для 1 пользователя: ~2500$
Достоинства:
Есть методы, отсутствующие у STATISTICA.
Достаточное количество литературы по работе с пакетом.
Часто используется в гуманитарных дисциплинах, психологии, социологии.
Удобен при обработке результатов опросов.
Есть модуль для автоматизации процесса разработки анкеты и ввода результатов опросов (Data Entry).
Источник: statanalys.blogspot.com
Сравнение программ для статистического анализа
На сегодняшний день существует много универсальных программ обработки и анализа статистической информации. Благодаря кругу охватываемых задач, они могут быть полезны не только студентам на стадии изучения статистических методов, но и научным работникам, экономистам, решающим задачи анализа и прогноза с использованием статистических данных. Но перед специалистами встает вопрос: какую именно из программ выбрать из множества имеющихся? В статье приводится сравнительный анализ двух известных статистических пакетовSTATISTICA и Eviews. Сравнение проводится в зависимости от решаемых задач, простоты и удобства их выполнения, таким образом, отмечая преимущества и недостатки рассматриваемых приложений.
Рис.1. Вид рабочего окна в программе STATISTICA
Сразу отметим, что обе программы являются адаптированными к операционной системе Windows, поддерживают технологии OLE, drop-down и д.р., являются компактными и занимают мало места дискового пространства. Оба приложения имеют удобные графические интерфейсы.
STATISTICA для медицинских приложений
Сравнение программ STATISTICA и Eviews проведем по следующей схеме, в зависимости от конкретных задач приложения:
· Основные описательные статистики;
· Регрессионный анализ (линейная, множественная и нелинейная регрессия);
· Анализ временных рядов (адаптивные модели прогнозирования, методы выделения компонент временного ряда, модели с распределенными лагами);
· Моделирование стационарных и нестационарных случайных процессов (модели ARMA, ARIMA, ARCH, коинтеграция рядов);
· Работа с панельными данными.
1. Ввод данных
Программа STATISTICA имеет модульную структуру, то есть состоит из модулей, каждый из которых используется для решения своего конкретного класса задач, а именно: анализ временных рядов и прогнозирование, множественная регрессия, нелинейное оценивание, факторный анализ, моделирование структурными уравнениями, непараметрическая статистика, дисперсионный анализ (ANOVA/MANOVA), дискриминантный функциональный анализ. Несколько модулей объединены в группу промышленная статистика: контроль качества, анализ процессов, планирование эксперимента.
При загрузке пакета программ STATISTICA и при создании нового файла появляется электронная таблица, в которой столбцы являются переменными, а строки – наблюдениями. Удобство введения данных в программеSTATISTICA обусловлено тем, что файл таблицы похож на аналогичный из программы Excel. Данная программа позволяет импортировать данные из других Windows приложений и программ DOS, таких как: MS Excel, MS Access, FoxPro, Paradox, dBASE, CSV, SPSS, а также из файлов *.txt.
В отличие от STATISTICA приложение Eviews не имеет модульной системы, однако оно содержит так называемое окно рабочего файла, где можно сохранять ряд объектов.
Объектная структура рабочего окна позволяет работать одновременно с различными типами информации. Управление объектами осуществляется с помощью процедур (procs), которые в свою очередь могут сами создавать новые объекты. Каждый объект содержит конкретный вид информации: ряд данных, коэффициенты, графики и диаграммы, модели, результаты вычислений, таблицы (матрицы) и др. Все типы объектов представлены на рис. 3.
Кроме того, программа Eviews имеет командную строку, куда вводятся определенные команды позволяющие производить статистический анализ данных. Команды могут быть сохранены в отдельном файле, что позволяет исследователю запомнить ретроспективу выполняемых действий.
В отличие от программы STATISTICA в Eviews прежде, чем ввести данные, необходимо задать их формат, далее создать объект типа ряд, задать количество переменных и количество наблюдений. Пакет Eviews позволяет работать с восьмью типами данных (годовые, полугодовые, квартальные, месячные, недельные (5 дней), недельные (7 дней), ежедневные и недатированные наблюдения). Процедура ввода и описания данных в приложении Eviews сложнее, чем в STATISTICA, и поэтому предпочтительнее импортировать данные из других приложений. Программа позволяет работать с данными заимствованными из таких программ как: MS Access, Gauss, ODBS, SAS, SPSS, MSExcel, Stata, ACSII, HTML.
Рис. 2. Вид рабочего окна программы Eviews.
Рис. З. Типы объектов рабочего файла Eviews
2. Графический анализ и основные описательные статистики
Для того чтобы легко визуализировать как исходные параметры модели, так и конечные результаты вычислений необходимо построение различных графиков, диаграмм, коррелограмм, спектрограмм и т.п. Просмотр в графической интерпретации исходных данных в виде линейных графиков, гистограмм распределений вероятности, диаграмм и т.п. для обоих приложений осуществляется с помощью команд меню. Просмотр результатов в виде графиков в программе STATISTICA производится непосредственно из рабочего модуля с помощью соответствующих кнопок, причем это приложение позволяет задать опцию построения графика автоматически после каждой проведенной процедуры, также имеется возможность просмотра данных в разных масштабах. Построение коррелограмм АКФ и ЧАКФ в пакете STATISTICA осуществляется только в разных окнах, в Eviews же их можно просмотреть и в одном окне, но зато в STATISTICA указаны границы белого шума. Результаты моделирования в Eviews в графическом режиме можно просмотреть с помощью команд основного меню рабочего файла.
Просмотр числовых характеристик исследуемых данных (среднее значение, стандартное отклонение, эксцесс, вероятность и др.) в приложении Eviews осуществляется с помощью команд меню, чтобы сделать это в STATISTICAнеобходимо зайти в отдельный модуль Основные статистики/Таблицы (Basic Statistics/Tables) (здесь же имеются критические значения различных распределений). Набор описательных статистик для обоих пакетов одинаковый.
3. Регрессионный анализ
3.1. Линейная регрессия
В программе STATISTICA оценка коэффициентов однофакторной и многофакторной линейной регрессии осуществляется в отдельном модуле Множественная регрессия (Multiple regression). Результаты просматриваются в отдельном окне, где есть коэффициенты, оцененные методом наименьших квадратов, коэффициент детерминации, статистика Фишера оценки значимости регрессии, статистики Стьюдента оценки значимости коэффициентов, коэффициент корреляции (матрица корреляций), статистика ДарбинаУотсона [3].
Существенными недостатками приложения STATISTICA является: во-первых, тот факт, что оценка коэффициентов простой регрессии производится только методом наименьших квадратов; во-вторых, определение наличия гетероскедастичности остатков приходится проводить в отдельном модуле (а именно, с помощью теста Спирмена в модуле непараметрические статистики). В отличие от STATISTICA пакет Eviews позволяет проводить оценку регрессии не только методом наименьших квадратов, но также методами максимального правдоподобия, взвешенным и нелинейным методами наименьших квадратов, достаточно просто набрать название метода в командной строке при оценке коэффициентов модели. К тому же Eviews позволяет сделать поправку на гетероскедастичность с учетом характера зависимости ошибок от независимой переменной. С помощью команды меню гетероскедастичность определяется тестом Уайта [1]. Отметим, что с помощью командной строки можно задать методику выявления гетероскедастичности методами Парка, Глейзера и др.
Проблему мультиколлинеарности факторов можно преодолеть в программе STATISTICA двумя способами: найти оценки методом главных компонент (реализуемо в модуле Факторный анализ (Factor Analysis)) или использовать гребневую регрессию (возможно только для STATISTICA версии старше 6.0).
3.2. Нелинейная регрессия
Оценка нелинейной регрессии в программе STATISTICA производится в отдельном модуле Нелинейное оценивание (Non-linear estimation), здесь можно как задать вид зависимости самостоятельно, так и воспользоваться имеющимися: регрессия логит/пробит, регрессия экспоненциального роста, кусочно-линейная регрессия [3]. Для оценки коэффициентов нелинейной регрессии произвольного вида используются итеративные методы, такие как квази-ньютоновский, Хука-Дживса, симплексный и др.
Результатами оценки являются лишь индекс детерминации и статистика Фишера. Подбор вида гладкой функции можно осуществить только на основе визуального анализа графиков. В отличие от этого в программе Eviews подобрать нелинейную функцию, наилучшим образом отражающей зависимость, можно на основе теста Бокса-Кокса. Оценка коэффициентов осуществляется на основе нелинейного МНК (NLS) и взвешенного МНК (WLS).
3.3. Модели с дискретной зависимой переменной
Модели бинарного выбора (логит/пробит модели) легко оцениваются в пакете STATISTICA в модуле Нелинейное оценивание, выходными данными служат логарифмическая функция правдоподобия, ограниченная логарифмическая функция правдоподобия, ч2-статистика, оцененные методом максимального правдоподобия параметры модели. В отличие от STATISTICA Eviews позволяет строить не только модели бинарного выбора, но также и модели множественного выбора, как с порядковыми, так и с неупорядоченными альтернативами. Для этого просто в поле выбора метода оценивания следует сделать выбор в пользу метода, соответствующего искомой модели. Выходными параметрами служат ч2-статистика, псевдо-коэффициент детерминации, логарифмические функции правдоподобия.
4. Анализ временных рядов
Анализ временных рядов в программе STATISTICA осуществляется в модуле Анализ Временных рядов/Прогнозирование (Time Series analysis/ forecasting). Данный модуль содержит следующие методы исследования временных рядов: модель авторегрессии проинтегрированного скользящего среднего, модели интервенции для АРПСС, экспоненциальное сглаживание и прогнозирование (адаптивные модели прогнозирования), анализ распределенных лагов, сезонная декомпозиция и спектральный анализ ряда. Кроме этого существует окно преобразования исходного ряда, которое позволяет производить различные алгебраические операции с рядом, брать разности различного порядка, выделять тренд методом скользящих средних.
К преимуществам STATISTICA перед Eviews следует отнести построение адаптивных моделей прогнозирования. В программе STATISTICA имеется удобная таблица, в которой можно определить тип модели (аддитивная, мультипликативная, с линейным трендом, включающая сезонную компоненту), а также задать параметры адаптации в трех режимах: «вручную», автоматически (на основании критерия сходимости по минимальной средней квадратической ошибке), выбор с помощью сетки различных минимальных ошибок [2].
В Eviews аналогичная процедура построения адаптивных моделей достаточно усложнена: требуется определить тип модели, метод оценивания параметров, выбрать начальные значения адаптационных коэффициентов, критерий сходимости процесса расчета и т.д. в нескольких диалоговых окнах. Также более предпочтительно построение регрессионных моделей с распределенными лагами в программе STATISTICA, нежели чем в Eviews, так как процедура построения очень проста в применении: требуется лишь задать значение максимального лага и степень аппроксимирующего полинома (лаги Алмон).
Выделение тренда из ряда с помощью гладких функций и моделирование сезонной компоненты на основе гармоник в оболочке STATISTICA выполняется в модуле Нелинейная оценка. Процедуру сглаживания тренда с помощью различного рода скользящих средних легко выполнить в обоих приложениях. Что касается определения наличия тренда в исходных данных, то его можно осуществить, в обоих приложениях, только с помощью спектрального анализа, либо коррелограмм АКФ и ЧАКФ, специального теста (например, тест Форстера-Стюарта) программы не проводят. Но в программе Eviews, с помощью менеджера тестов, такую проверку можно осуществить, задав соответствующие команды в командной строке.
5. Моделирование стационарных процессов
Существенным недостатком программы STATISTICA является отсутствие возможностей проверки ряда на стационарность, и судить о его стационарности можно лишь на основе визуального анализа графика ряда, спектрограммы и коррелограмм АКФ и ЧАКФ. В отличие от этого, приложение Eviews позволяет провести как обычный, так и расширенный тесты Дики-Фуллера на наличие стационарности (тесты единичного корня).
Построение моделей АРСС в программе STATISTICA выполняется с помощью модуля Анализ временных рядов/Прогнозирование. Идентификация модели производится либо на основе визуального анализа коррелограмм АКФ и ЧАКФ, учитывая их специфические особенности, либо спектров случайных процессов.
В программе Eviews идентификацию модели АРСС можно произвести еще и с помощью Q-статистики (тест Люнга-Бокса). К тому же есть возможность сравнить две значимые модели АРСС, то есть произвести их селекцию, по критериям Шварца и Акайке. Eviews выполняет эти критерии на основе дисперсии ошибки, которая должна быть минимальна.
Здесь отметим, что использование тестов Люнга-Бокса и информационных критериев в программе STATISTICA возможно только для версий старше 6.0 в отдельных модулях. Построить модели стационарных рядов, учитывающих изменение дисперсии (модели ARCH и GARCH) можно только в программе Eviews, STATISTICA таких возможностей не имеет. Кроме того, найденную модель АРСС с помощью ARCH метода можно протестировать на гетероскедастичную составляющую [1]. Следует отметить, что в версиях Eviews старше 5.1, имеются возможности оценки и спецификации моделей ТARCH и Е-GARCH (моделирует условную дисперсию как ассиметричную функцию, представленную в логарифмическом виде).
Программа Eviews позволяет провести спецификацию векторной авторегрессионной модели и модели исправления ошибки (исследование коинтеграции между несколькими переменными). Проверка коинтеграции в программе осуществляется с помощью процедуры Йохансена, которая определяет число векторов коинтеграции в группе временных рядов и обеспечивает оценки максимального правдоподобия векторов коинтеграции и векторов скорости приведения.
6. Моделирование нестационарных рядов
Обычно моделирование нестационарных рядов проводится на основе модели АРПСС, где порядок интегрирования является порядком взятия разности. В программе STATISTICA с помощью процедуры преобразования ряда вычисляют разности до тех пор, пока ряд не станет стационарным, причем стационарность можно проверить лишь на основе визуального анализа, далее идентифицируют и строят модель АРСС. В приложении Eviews для построения модели АРПСС используется расширенный тест Дики-Фуллера, причем проверка стационарности производится автоматически после взятия разности первого или второго порядков (соответствующий порядок следует указать в диалоговом окне). Отсюда можно сделать вывод, что построение модели АРПСС предпочтительней производить в Eviews.
7. Анализ панельных данных
В последнее время широкое распространение в экономикосоциологических исследованиях получил анализ панельных данных. Программа Eviews на сегодняшний день является одной из немногих статических пакетов, которая позволяет провести исследование панельных данных, причем, следует отметить, что такая возможность имеется только у программ старше пятой версии.
Визуальный анализ представленных данных можно проводить как с учетом структуры панели, так и с учетом объединения данных. Eviews позволяет легко произвести спецификацию модели, учитывающей лаг, а также оценить модель со случайными эффектами, используя тест Хаусмана [1]. Процедуру оценки можно произвести с помощью взвешенного обобщенного МНК. После оценки построенной модели по панельным данным могут быть проанализированы и отображены графически фиксированные и случайные эффекты.
Вывод
Для преподавателей эконометрики и экономико-математического моделирования для общих экономических специальностей следует предпочесть программу STATISTICA, так как в ней проще работать с вводом данных, строить регрессионные модели, исследовать структуру временного ряда, и в отличие от Eviews, нет необходимости запоминать все команды ввода в командной строке. Для более глубокого изучения эконометрического моделирования, например для специальностей «математические методы в экономике», «статистика», предпочтение следует отдать программе Eviews, хотя здесь можно посоветовать схему «от простого к сложному», изучив сначала STATISTICA, затем перейти к выполнению тех же процедур в Eviews.
Что касается предметов изучающих анализ временных рядов, например «методы прогнозирования финансовых показателей» или «методы исследования национальной экономики», то однозначно можно сделать выбор в пользу пакета Eviews, так как лучше всего его возможности раскрываются при решении задачи прогнозирования количественных показателей, представляющих собой именно временной ряд. Следует отметить, что в пакете Eviews имеется достаточно полный арсенал методов по обнаружению и борьбе с типичными для поставленных выше задач проблемами: гетероскедастичность, автокорреляция, нестационарность и наличие коинтеграции.
Для специалистов, занимающихся прогнозированием различного рода финансовых показателей, рекомендуется освоить пакет Eviews, так как сфера применения его охватывает все аспекты современной теории и практики бизнеса. Высокие функциональные возможности при обработке количественных переменных, позволяют говорить о Eviews как о надежном инструменте для прогнозирования продаж, динамики ресурсов, исследования инвестиционного риска. Для прогнозирования финансовых временных рядов EViews, помимо традиционных инструментов прогнозирования позволяет использовать анализ отклика на импульсы и моделирование условной гетероскедастичности, как меры волатильности. Дополнительно, подчеркнем, что EViews позволяет строить прогноз сразу же после построения модели.
Список использованных источников:
1. Практикум по эконометрике: учеб. пособие / Под ред. Елисеевой И.И. – М.: Финансы и статистика, 2007. – 344 с.
2. Саяпова А.Р., Гусельникова Е.А., Лакман И.А., Шамуратов Н.М. Математические методы прогнозирования экономических показателей. Учебное пособие, Уфа, 2000 – 128 с.
3. Шамуратов Н.М., Лакман И.А. Эконометрика. Учебное пособие, Уфа, 2007 – 118 с.
Источник: www.statproject.ru
Statistica
Система статистического анализа STATISTICA 10 — это высокопроизводительное решение может использоваться для тщательного и высокоточного анализа корпоративных данных, прогнозного моделирования и составления аналитических отчетов. Версия STATISTICA 10 предлагает клиентским организациям оценить целый ряд усовершенствований и новых функций, включая заметно возросшую производительность, улучшенную масштабируемость, более совершенные механизмы визуализации данных и многое другое.
Одним из главных преимуществ предлагаемого решения является поддержка технологий, реализованных в новых линейках многоядерных процессоров от Intel. Для создания новой версии продукта использовались самые современные средства разработки, а благодаря полностью переработанным алгоритмам моделирования, обработки и анализа данных, STATISTICA 10 справляется с большинством задач в три-четыре раза быстрее по сравнению с прошлыми версиями.
Список ключевых усовершенствований, представленных в STATISTICA 10, также включает в себя расширенные возможности моделирования, дополнительные процедуры для моделирования кредитных и страховых рисков. Пользователям также предлагается оценить более гибкие средства графического представления данных, тесную интеграцию с платформой Microsoft SharePoint и возможность прямого подключения к кубам OLAP.
В работе программы STATISTICA 10 применяются уникальные достижения 64-битной компьютерной технологии, а также параллельные процессы. Большинство функций программы STATISTICA, используемых при обработке данных и выполнении анализа, оптимизированы с помощью многопоточной технологии. Таким образом, стало возможным их параллельное использование на многоядерных процессорах и достижение высочайшего быстродействия для многоразмерных задач в экономике, бизнесе, медицине.
Интеграция и совместимость
- Загрузка и выгрузка из STATISTICA 10 теперь использует новые программы обмена и интеграции данных – Microsoft SharePoint. Документы STATISTICA теперь можно удобно передавать и получать из SharePoint с помощью пользовательского интерфейса программы.
- STATISTICA напрямую импортирует файлы Office 2007 и 2010, сохраняя форматирование. Эта новая технология позволила повысить скорость импорта данных из Excel 2007 и 2010 в таблицы программы STATISTICA, а также сделала его более устойчивым к ошибкам выгрузки. Загрузка/выгрузка из Excel 2007/2010 теперь поддерживает текстовый формат ячеек.
- STATISTICA Query может получать данные не только из внешних систем, таких как поставщик данных Microsoft OLE DB, но и из хранилищ бизнес-информации SAP Business Warehouse.
Визуализация данных
Расширенные графические возможности STATISTICA позволяют автоматически определять и использовать преимущества высокоэффективного аппаратного ускорения, которое может быть реализовано не только видеокартами стационарных компьютеров «топ»-уровня, но и графическими ускорителями ноутбуков «среднего» уровня. В результате графики строятся не только быстрей, но и поддерживают более продвинутые настройки изображения. Графические возможности программы STATISTICA были усовершенствованы благодаря новым процедурам расслоения, закрашивания и сглаживания линий, кривых и поверхностей. Кроме того, все графические документы STATISTICA (как отдельные, так и собранные в рабочую книгу) могут изменяться и настраиваться интерактивно (с помощью инструментов, расположенных в нижней части окна графика). Новые возможности STATISTICA 10 позволяют улучшать внешний вид графика, проводить более глубокий визуальный анализ и выявлять скрытые тренды путем постепенного уменьшения насыщенности изображения, а также вращения трехмерных графиков.
- Интерактивное масштабирование позволяет визуально выявить скрытые тренды с помощью растяжения или сжатия интересующей части графика. Пользователь может интерактивно изменять масштаб всех осей графика.
- Интерактивная прокрутка поможет обнаружить тренды, скрытые в массиве данных. С помощью мыши можно интерактивно прокручивать оси графика влево или вправо.
- Прозрачность – новая возможность STATISTICA 10 – позволит выявить тренды, скрытые в плотном массиве данных (особенно при построении диаграмм рассеяния по выборке большого объема). Целью является достижение оптимального уровня плотности точек, при котором можно выявить закономерности, скрытые большим количеством случайных данных (белым шумом), которые создают эффект «чернильного пятна».
- Соединительные линии можно быстро добавлять на график с помощью опции Reference Lines, доступной в диалоге «Все параметры графика».
- Интерактивная правка текста – текст можно изменять напрямую в окне графика, не открывая редактор. *Сам же редактор текста остался доступным и по-прежнему содержит дополнительные опции для форматирования.
Пользовательский интерфейс
Пользовательский интерфейс был существенно переработан с учетом последних достижений эргономики в следующих областях:
- Уменьшение зрительного напряжения.
- Улучшение эффективности работы человека с компьютером.
- STATISTICA 10 упрощает процедуру подгонки и моделирования.
- Обширная и широко масштабируемая реализация модели пропорциональных рисков Кокса (мощная модель для данных, содержащих времена жизни) добавлена в версию 10. Данный модуль имеет приложения в следующих областях: анализ времен жизни пациентов в медицине, анализ оборота клиентов и моделирование и оценка времени эксплуатации механических деталей.
- Модель пропорциональных рисков Кокса позволяет эффективно работать с цензурированными данными, категориальными предикторами и планами, содержащими взаимодействия и/или вложенные эффекты. В качестве техники построения моделей этот модуль использует метод наилучших подмножеств и пошаговую регрессию. Построение функций выживаемости для новых данных можно задать с помощью STATISTICA Rapid Deployment.
2015: Statistica 13
21 октября 2015 года компания Dell представила решение Statistica 13 для работы с Большими данными и аналитикой. Продукт ориентирован на помощь компаниям в быстром и надежном превращении данных в прогнозы для принятия верных решений в кратчайшие сроки.
Продукт может интегрироваться в бизнес-процессы и использоваться на каждом этапе работы для получения более высоких результатов.
Скриншот окна приложения (2014)
Версия программной платформы углубленной аналитики Dell Statistica 13 помогает упростить и улучшить процесс внедрения предиктивных моделей непосредственно в источники данных внутри брандмауэра, в облаке и в экосистеме партнера. Решение простое в эксплуатации, не требует написания кода и интегрируется с открытым языком R.
В составе Dell Statistica ряд инструментов для обнаружения и объединения данных и предиктивной аналитики. Система помогает организациям учитывать всю имеющуюся информацию для предсказывания тенденций будущего, идентификации новых клиентов и прогноза объемов продаж, испытывать сценарии вида «что, если», снижать вероятность мошенничества и других рисков для бизнеса.
Среди функций платформы Statistica 13:
- модернизированный графический интерфейс, упрощающий использование продукта и делающий данные более наглядными;
- углубленная интеграция с движком Statistica Interactive Visualization and Dashboard;
- интеграция с открытым языком R, упрощающая обмен и управление R-скриптами;
- инструмент поэтапной рекомендации оптимальных моделей для пользователей;
- расширенные возможности инструмента Native Distributed Analytics (NDA), позволяющие пользователям запускать анализ непосредственно в базах данных и работать более эффективно с крупными и растущими массивами данных.
Инструмент NDA помещает алгоритмы построения предиктивных моделей и функции подсчета непосредственно в источники данных. Это устраняет задержки и ограничения, которые имеют место вследствие наличия промежуточного сервера или настольной системы. Вся обработка выполняется в базе данных.
Такой подход позволяет организациям пользоваться преимуществами кластеров Hadoop, аппаратных средств и прочих высокопроизводительных платформ. Изначально в платформу Statistica 13 будут встроены функции NDA для баз данных Microsoft SQL Server. Согласно заявлению компании, поддержка других баз данных будет добавлена в последующих обновлениях.
— Интер РАО ЕЭС, ПАО | StatSoft Russia | 2011.01 | BI |
Источник: www.tadviser.ru