Statistica — начинающему пользователю Пример 1 Пример 2 Statistica — профессионалу Statistica 5.1 К официальной статистике люди всегда относились с недоверием. Достаточно вспомнить высказывание Марка Твена: «Существует три вида лжи — невинная ложь, наглая ложь и статистика».
К официальной статистике люди всегда относились с недоверием. Достаточно вспомнить высказывание Марка Твена: «Существует три вида лжи — невинная ложь, наглая ложь и статистика». В застойные времена в нашей стране статистические методы в основном применялись в научных исследованиях для обработки результатов экспериментов. Но по-настоящему широкий интерес к ней возник в послеперестроечное время. Статистика вдруг понадобилась всем — от политиков, желающих предсказать исход выборов, до предпринимателей, стремящихся оптимизировать прибыль при тех или иных вложениях капитала.
На Западе статистику используют широко и давно, так что эта наука интенсивно развивалась. Было создано множество программ, в том числе и для персональных компьютеров, позволяющих применять самые современные методы математической статистики для обработки данных.
Статистика с нуля за 5 минут ПРОСТЫМИ СЛОВАМИ
Стандартные статистические методы обработки данных включены в состав электронных таблиц, таких как Excel, Lotus 1-2-3, QuattroPro и др.; в математические пакеты общего назначения — Mathсad, Maple и т. д. Но, конечно, гораздо большими возможностями обладают такие специализированные пакеты как SPSS фирмы SPSS Inc., SAS фирмы SAS Institute, и среди них особого внимания заслуживает Statistica 5.1.
Пакет Statistica разработан фирмой StatSoft (США), основанной в 1984 г. Первоначально он входил в качестве модуля в состав самых популярных в то время электронных таблиц Lotus 1-2-3. Как самостоятельный продукт пакет впервые заявил о себе в 1991 г. и с тех пор занимает лидирующее положение среди специализированных статистических программ. Последняя версия продукта — Statistica 5.1 — совместима не только с Windows 3.1, но и с Windows 95, в ней поддерживается графический интерфейс пользователя (GUI) и динамический обмен данными (DDE). Благодаря этому пакет может работать в сочетании с другими Windows-приложениями. В новую версию включен также язык программирования Statistica-BASIC, позволяющий расширять возможности пакета в соответствии с потребностями пользователя.
Благодаря профессионализму исполнения, простоте освоения и удобству использования пакет приобрел большую популярность (зарегистрировано свыше 300 тыс. пользователей). Statistica 5.1 позволяет проводить исчерпывающий, всесторонний анализ данных для научного, коммерческого и инженерного применения. Программа обладает превосходными средствами представления результатов анализа в виде таблиц и графиков, позволяет автоматически создавать отчеты по проделанной работе. Система подсказок составлена настолько продуманно и так удобна в обращении, что с ее помощью можно обучаться не только работе с самим пакетом, но и современным методам статистического анализа.
Введение Знакомство Подготовка данных для работы в статистическом пакете Statistica 10!
Statistica — начинающему пользователю
Допустим, вы предприниматель и вам нужно собрать информацию о финансовых результатах деятельности фирмы. Эти данные могут быть использованы не только для представления отчета в налоговые органы. Пользуясь пакетом Statistica, можно проанализировать деятельность как фирмы в целом, так и отдельных ее подразделений, принять решения, направленные на улучшение результатов.
Однако хорошая иллюстрация нагляднее абстрактных рассуждений, поэтому мы продемонстрируем основные возможности пакета на двух конкретных примерах.
Пример 1
Представим такую ситуацию (пример взят из книги: Кимбл Г. Как правильно пользоваться статистикой, М.: Финансы и статистика, 1982. 294 с.). Вы поручили реализацию одинаковых партий продукции нескольким сотрудникам и по результатам их работы за некоторый период времени хотите определить, случайна ли разница в полученной выручке.
Если не случайна, значит, необходимо принять соответствующие меры для увеличения объема продаж. В таблицу внесены данные о продажах продукции четырьмя сотрудниками фирмы в течение десяти месяцев. Общее число продаж n=40. Каждому сотруднику соответствует группа из десяти случайных величин — объемов продаж (число групп N=4). Таблица состоит из четырех столбцов, в заголовках которых указан номер группы, в десяти строках — выручка за каждый месяц, а в последней строке — средняя выручка за весь рассматриваемый период (см. таблицу).
Очевидно, что у каждого сотрудника объемы продаж варьируются от месяца к месяцу, т. е. cуществует некоторый разброс результатов. Количественная характеристика этого разброса (дисперсия) вычисляется по формуле
где: X i — значения случайной величины X (в нашем случае — объема продаж), M — среднее значение случайной величины X в n событиях:
В нашем случае n=10, в нижней строке приведены средние значения для каждого сотрудника, вычисленные по этой формуле. Из таблицы видно, что существует разброс и между средними показателями отдельных сотрудников, который также можно оценить по формулам (1), (2); здесь, однако, случайными величинами будут средние показатели для отдельных сотрудников, а n=4. Интуитивно ясно, что чем больше дисперсия (разброс) средних показателей продаж сотрудников по отношению к дисперсии продаж каждого отдельного сотрудника, тем более вероятен такой вывод: либо сотрудники работают в разных условиях, либо представленные данные неверны.
Для количественного решения этой задачи в статистике применяется метод дисперсионного анализа (Analysis of variations — ANOVA). В этом методе для ответа на заданный выше вопрос используется так называемый F-критерий, величина которого равна отношению дисперсии средних показателей групп к средней дисперсии внутри отдельных групп. Программа Statistica может рассчитать F по данным Xi, числу групп N и числу событий n. При этом предполагается, что все случайные величины подчинены одному и тому же закону распределения (для нашего случая это означает, что все сотрудники работают в одинаковых условиях). Вероятность полученного значения величины F, вычисляемого с помощью этого метода, показывает, насколько справедливо сделанное предположение.
Давайте посмотрим, как решает подобные задачи программа Statistica.
Запустим программ и выберем метод анализа ANCOVA/MANCOVA. Загрузится соответствующий модуль. Можно получить более подробную информацию о методе, выбрав в меню Help/Index раздел «ANCOVA/MANCOVA — Вводный обзор основных понятий». При запуске модуля по умолчанию будет загружен также файл данных, использовавшийся в предыдущем сеансе работы программы.
Файл данных представляет собой обычную электронную таблицу. Пользователи Excel и других аналогичных электронных таблиц без труда освоят методы работы с данными в ней. В пакете Statistica все операции, включая копирование, перетаскивание и автоматическое заполнение ячеек, производятся так же, как в популярных электронных таблицах. При нажатии правой кнопки мыши появляется всплывающее меню, где точно так же предлагается перечень операций, которые можно выполнить над выделенным объектом.
Кроме того, данные можно скопировать из других Windows-приложений или импортировать из файлов. Кнопки на Панели инструментов позволяют вводить наименования переменных.
В нашем случае данные, приведенные в таблице, удобно занести в столбцы, соответствующие двум переменным (в каждом столбце по 40 строк). В первый столбец (независимая переменная «ГРУППА») заносятся номера групп, во второй (зависимая переменная «ВЫРУЧКА») — соответствующие объемы продаж.
Наконец файл данных готов. Теперь из раздела Analysis главного меню программы можно вызвать исходное окно (Startup Panel). В нем представлено много элементов, но если вы не знаете, что делать дальше, можно нажать знак ? в правом верхнем углу этого окна и получить подробную информацию обо всех его элементах. Впрочем, лучше нажать кнопку OK, и программа сама подскажет, что делать.
Первым делом Statistica предложит ввести зависимую и независимую переменные для анализа. Щелчком правой кнопки мыши обозначим независимую («Группа») и зависимую («Выручка») переменные и нажмем на кнопку OK. Вновь появится исходное окно, где следует опять нажать кнопку ОК.
После нажатия кнопки ОК появляется окно ANOVA-results с описанием условий задачи. В верхней строке указан метод анализа, а в следующих перечисляются зависимая («ВЫРУЧКА») и независимая («ГРУППА») переменные.
Осталось, нажав на кнопку All effects, получить информацию о результатах анализа. Программа выводит окно, в котором указаны параметры для вычисления F-фактора: df Effect=3 (N-1), MS Effect=1333 (межгрупповая дисперсия), df Error=36 (n-N), MS Error=66,66 (внутригрупповая дисперсия), значение самого F-фактора (F=20) и вероятность получения данного значения F-фактора при случайном разбросе средних (p-level). В нашем случае эта вероятность равна нулю с точностью до шести знаков. Вывод: полученная разница между объемами продаж с очень большой вероятностью (близкой к 100%) неслучайна, так что необходимо устранять причину неудовлетворительной работы двух сотрудников.
Другие кнопки в окне просмотра результатов анализа предназначены главным образом для всестороннего изучения (в том числе с использованием графиков распределений) исходных данных с точки зрения применимости нормального распределения случайных величин, которое предполагается в этом методе анализа. Например, если мы нажмем на кнопку Descriptive stats инфляция вычисляется как отношение приращения курса доллара за месяц к его величине на начало месяца.
Сначала поясним, как строится график временной зависимости прибыли и инфляции. Для этого нажмем верхнюю кнопку на левой панели инструментов (Custom 2D graphs) и в появившемся окне в разделе Plot1 в качестве X введем «ДАТА», а в качестве Y — «ПРИБЫЛЬ», в разделе Plot2 в качестве X введем «ДАТА», а в качестве Y — «ИНФЛЯЦИЯ». Для разделов Plot1 и Plot2 выберем вид графика Line Plot, а для разделов Plot3 и Plot4 — Ignore.
Нажав ОК, мы увидим в окне, что графики инфляции и прибыли ведут себя очень похоже: как правило, если прибыль падает, падает и инфляция. Поведение инфляции никак не связано с деятельностью фирмы и определяется общими экономическими процессами в государстве, поэтому очень важно определить, насколько существенна связь между прибылью и инфляцией. Для этого в статистике существует метод корреляционного анализа. В программе этот метод можно найти, переключившись на модуль Basic statistic/Tables, что мы и сделаем. Теперь вызовем исходное окно, щелчком правой кнопки мыши в окне данных выделим переменные, которые хотим анализировать («ПРИБЫЛЬ», «ИНФЛЯЦИЯ»), в исходном окне выберем раздел Correlation matrices и нажмем ОК.
На экране появится окно корреляционного анализа. Поскольку мы предварительно обозначили переменные, то в списке переменных в левом углу будет напечатано «First List: ПРИБЫЛЬ — ИНФЛЯЦИЯ». Теперь нажмем кнопку Correlations.
В появившейся таблице указан коэффициент корреляции, для переменных «ПРИБЫЛЬ» и «ИНФЛЯЦИЯ» равный 0,78.
Если теперь нажать кнопку 2D scatterp., а затем в качестве переменной X выбрать «ИНФЛЯЦИЯ», а в качестве переменной Y — «ПРИБЫЛЬ», то после нажатия ОК получим график, на котором изображены все точки данных и прямая линия, являющаяся наилучшим линейным приближением отражающим зависимость между переменными. Соответствующая этой прямой формула автоматически выписывается под заголовком графика:
ПРИБЫЛЬ = 7.0060 + .99166 3 3 ИНФЛЯЦИЯ
На этом же графике указан коэффициент корреляции между переменными (0,77548), штриховыми линиями обозначен доверительный интервал (область, в которой с вероятностью 95% лежат значения переменных).
В общем случае математическим коэффициентом корреляции между случайными величинами X и Y является величина
где Z — оценка (разница между значением данного наблюдения величины Xi и средним этой величины MX, отнесенная к упомянутой выше дисперсии случайной величины S). Коэффициент корреляции может принимать значения в интервале от -1 до 1, и чем ближе его абсолютная величина к 1, тем сильнее взаимосвязь между переменными (знак коэффициента r указывает на направление взаимосвязи — прямое или обратное). Значение r = +1 или r = -1 указывает на наличие строгой функциональной зависимости, значение r = 0 указывает на отсутствие какой-либо взаимосвязи. Таким образом, значение r = 0,78 между переменными «ПРИБЫЛЬ» и «ИНФЛЯЦИЯ» указывает на прямую взаимосвязь между этими величинами, и можно предположить, что падение прибыли и падение инфляции с высокой степенью вероятности связаны с одними и теми же отрицательными процессами в экономике.
Используя полученные данные, можно сделать и другие выводы. Например, о периодическом падении и возрастании спроса, что связано с сезонным фактором. Зависимость прибыли от времени можно аппроксимировать различными кривыми.
Для этого на левой панели инструментов нажмем кнопку Graphs Gallery и, выбрав Stats 2D Graphs — Scatterplots, нажмем ОК. В появившемся окне в качестве переменной X выберем «НОМЕР», а в качестве переменной Y — «ПРИБЫЛЬ». Теперь из списка можно выбрать различные варианты подгонки кривой «ПРИБЫЛЬ=f(НОМЕР)».
ПРИБЫЛЬ=23.523 3 exp(-0.06 3 НОМЕР),
где «НОМЕР» — номер месяца от начала работы фирмы. По этой формуле мы можем предсказать прибыль фирмы в недалеком будущем. Например, на 35-м месяце (N = 35) получим ПРИБЫЛЬ = 2,88, что в девять раз меньше прибыли в первом месяце.
Рассмотренные примеры достаточно просты, но они показывают, что на освоение методов анализа и обучение работе с программой Statistica не придется тратить много времени, а важность полученных результатов трудно переоценить.
Программа способна решать и гораздо более сложные задачи, она также помогает незнакомому с предметом пользователю повышать свой уровень.
Но и искушенный пользователь найдет программу Statistica не менее полезной.
Statistica — профессионалу
- Программа способна обрабатывать огромные массивы данных — таблицы с числом переменных (столбцов) до 32 000 и практически неограниченным числом строк (случаев); в ней имеется специальный модуль — менеджер файлов, который может создавать мегафайлы и манипулировать ими.
- Повышенная (quadruple) точность математических операций позволяет проводить анализ данных даже с очень малым разбросом величин.
- Расчеты и построение графиков выполняются с очень высокой скоростью (за счет оптимизации программного кода и механизмов управления памятью).
- Программа предлагает множество вариантов научных и технических графиков и диаграмм при великолепном качестве и поразительной точности отображения информации.
- Quick Basic Statistics (быстрый анализ) — модуль, позволяющий быстро провести анализ наиболее употребительными методами;
- Basic Statistics/Tables (основные статистические методы и таблицы) — описательные методы статистики, таблицы частот и корреляций, регрессии и другие базовые статистические методы;
- Nonparametrics/Distribution — внутригрупповые и межгрупповые непараметрические тесты, сравнение различных дискретных и непрерывных теоретических распределений с распределением наблюдаемых величин;
- ANCOVA/MANCOVA — однофакторный и многофакторный дисперсионный и ковариационный анализ;
- Multiple Regression — различные методы множественной линейной и фиксированной нелинейной регрессии (в частности, полиномиальной, экспоненциальной, логарифмической и др.);
- Nonlinear Estimation — методы подгонки к нелинейным зависимостям данных различных функций, в том числе заданных пользователем;
- Time Series/Forecasting — анализ при помощи временны’х рядов (рядов Фурье и др.) и прогнозирование временны’х зависимостей, в том числе анализ сезонных колебаний;
- Cluster Analysis — различные методы кластерного анализа и классификации;
- Factor Analysis — выделение наиболее существенных факторов сложного объекта методами повторных главных компонент, минимальных остатков, максимального правдоподобия;
- Canonical Analysis — метод канонического анализа корреляции между двумя группами переменных;
- Multidimensional Scaling — многомерное шкалирование;
- SEPATH — многомерный анализ с помощью моделирования причинных связей между переменными линейными структурными уравнениями, в том числе оценка достоверности результатов методом статистического моделирования Монте-Карло;
- Reliability/Item Analysis — анализ надежности сложного объекта на основе результатов диагностики его элементов;
- Discriminant Analysis — дискриминантный анализ, позволяющий на основе определенного критерия отнести объект к некоторому классу;
- Log-linear Analysis — логарифмический линейный анализ сложных многоуровневых таблиц частот;
- Survival Analysis — анализ долговечности (выживания) для задач социологии (особенно необходим страховым компаниям), биологии, инженерных задач (долговечность машин, сооружений) и др.
- Еще три модуля программы объединены в общий класс «Промышленная статистика».
- Quality Control — широкий набор методов контроля качества;
- Process Analysis — набор методов анализа производственных процессов, в том числе калибровочный анализ повторяющихся партий продукции;
- Experimental Design — модуль планирования эксперимента в промышленных и прикладных областях.
Statistica 5.1
Источник: www.osp.ru
Пакет STATISTICA
Пакет STATISTICA – универсальный статистический пакет компании StatSoft Inc1. Первая версия пакета (STATISTICA for DOS) была выпущена в 1991 г. На сегодняшний день разработана 9-я версия пакета (STATISTICA 9). Русифицирована только 6-я версия (STATISTICA 6).
Стандартную комплектацию пакета STATISTICA составляют три модуля, которые могут приобретаться как единым пакетом, так и отдельно.
1. Базовый пакет STATISTICA Base предоставляет обширные возможности выбора основных типов статистического анализа. Для эффективной работы базового пакета требуется как минимум 256 MB оперативной памяти. Минимальные требования к скорости процессора – 500 MHz.
2. Модуль Линейные и Нелинейные Модели (Advanced Linear/NonLinearModels) содержит большой набор инструментов для моделирования и прогнозирования, включая возможности автоматического выбора модели и расширенные интерактивные средства визуализации.
3. Модуль Многомерные разведочные технологии анализа (Multivariate Exploratory Techniques) служит для применения разведочного анализа различных типов данных в сочетании с интерактивными средствами визуализации.
Помимо общих статистических и графических средств в системе имеются специализированные модули, например, для проведения социологических или биомедицинских исследований, решения технических и промышленных задач, – карты контроля качества, модули анализа процессов и планирования эксперимента.
Разработчики STATISTICA утверждают, что пакет может применяться для решения задач в таких областях, как:
· НИОКР, контроль качества, процесс мониторинга в химической, фармацевтической промышленности и в производстве потребительских товаров;
· гарантийный анализ и приложения для удаленного мониторинга в обрабатывающей промышленности;
· анализ рисков, сегментация потребителей и оценка кредитоспособности заемщиков в банковской сфере, в сфере предоставления финансовых услуг и в страховой деятельности.
Возможны различные варианты установки пакета в зависимости от целей и задач пользователя:
· однопользовательская версия (Single-User);
· сетевая версия (Concurrent Network) для работы в локальных вычислительных сетях;
· Enterprise – версия для применения в вычислительных системах и крупных организациях
· Web-Based – версия для использования в крупных сетях через веббраузер.
Пакет предоставляет пользователям следующие возможности статистического анализа данных:
· исследование корреляций между переменными;
· диаграмма рассеяния, матричная диаграмма рассеяния;
· быстрые основные статистики и блоковые статистики (интерактивные средства, позволяющие одним щелчком мыши вычислять основные статистики и строить графики в любой момент в течение сеанса работы);
· интерактивный калькулятор вероятностных распределений (позволяет интерактивно исследовать структуру распределений, например, зависимость вероятности от параметров);
· анализ многомерных откликов, многомерное шкалирование;
· анализ при помощи временных рядов и прогнозирование временных зависимостей, в том числе анализ сезонных колебаний.
Достоинства STATISTICA:
· реализован обмен данными между STATISTICAи Windows-приложениями;
· результаты анализа в виде графиков, таблиц и текста могут быть сохранены в файле с форматом RTF, который открывается и редактируется в MS Word;
· возможность расширения системы при помощи создания программ на встроенном в STATISTICA языке программирования;
· исходные данные из MS Excel можно легко импортировать в STATISTICA;
· возможность записи макросов для автоматизации выполнения однотипных задач;
· программа способна обрабатывать большие массивы данных – базы данных с числом переменных до 32 000 и практически неограниченным числом наблюдений.
В пакете представлены несколько сотен типов графиков 2D, 3D и 4D, матрицы и пиктограммы; предоставляется возможность разработки собственного дизайна графика. Средства управления графиками позволяют работать одновременно с несколькими графиками, изменять размеры сложных объектов, добавлять художественную перспективу и ряд специальных эффектов, разбивку страниц и быструю перерисовку. Например, 3D-графики можно вращать, накладывать друг на друга, сжимать или увеличивать 9Дюк В., Самойленко А. Data Mining: учебный курс (+CD). – СПб: Изд. Питер, 2001. .
STATISTICA обладает огромными возможностями для построения графиков непосредственно из таблиц исходных данных и таблиц результатов. Построение графических объектов и анализ данных в пакете тесно интегрированы. После получения результатов статистического анализа их можно с легкостью представить графически посредством команды Быстрые статистические графики. В разных модулях системы имеются свои специальные графики, учитывающие особенности получаемых в них результатов 10Борисова С.Ф. Компьютер и Интернет для социолога [электронный ресурс]: учеб. пособие-справочник / С.Ф. Борисова. – Н. Новгород, 2002. – URL: https://www.unn.ru/rus/f14/k2/courses/borisova.htm (29.07.10). .
Начинающие пользователи могут начать работу со специальной версии, разработанной для обучения основам статистических методов – Studеnt Еditiоn оf STATISTICA. Эта версия представляет собой урезанный вариант пакета и позволяет анализировать файлы данных, включающих не более 400 наблюдений.
Внешний вид диалогового окна STATISTICA представлен на рис.11.5.
Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:
Источник: studopedia.ru
Statistica
Система статистического анализа STATISTICA 10 — это высокопроизводительное решение может использоваться для тщательного и высокоточного анализа корпоративных данных, прогнозного моделирования и составления аналитических отчетов. Версия STATISTICA 10 предлагает клиентским организациям оценить целый ряд усовершенствований и новых функций, включая заметно возросшую производительность, улучшенную масштабируемость, более совершенные механизмы визуализации данных и многое другое.
Одним из главных преимуществ предлагаемого решения является поддержка технологий, реализованных в новых линейках многоядерных процессоров от Intel. Для создания новой версии продукта использовались самые современные средства разработки, а благодаря полностью переработанным алгоритмам моделирования, обработки и анализа данных, STATISTICA 10 справляется с большинством задач в три-четыре раза быстрее по сравнению с прошлыми версиями.
Список ключевых усовершенствований, представленных в STATISTICA 10, также включает в себя расширенные возможности моделирования, дополнительные процедуры для моделирования кредитных и страховых рисков. Пользователям также предлагается оценить более гибкие средства графического представления данных, тесную интеграцию с платформой Microsoft SharePoint и возможность прямого подключения к кубам OLAP.
В работе программы STATISTICA 10 применяются уникальные достижения 64-битной компьютерной технологии, а также параллельные процессы. Большинство функций программы STATISTICA, используемых при обработке данных и выполнении анализа, оптимизированы с помощью многопоточной технологии. Таким образом, стало возможным их параллельное использование на многоядерных процессорах и достижение высочайшего быстродействия для многоразмерных задач в экономике, бизнесе, медицине.
Интеграция и совместимость
- Загрузка и выгрузка из STATISTICA 10 теперь использует новые программы обмена и интеграции данных – Microsoft SharePoint. Документы STATISTICA теперь можно удобно передавать и получать из SharePoint с помощью пользовательского интерфейса программы.
- STATISTICA напрямую импортирует файлы Office 2007 и 2010, сохраняя форматирование. Эта новая технология позволила повысить скорость импорта данных из Excel 2007 и 2010 в таблицы программы STATISTICA, а также сделала его более устойчивым к ошибкам выгрузки. Загрузка/выгрузка из Excel 2007/2010 теперь поддерживает текстовый формат ячеек.
- STATISTICA Query может получать данные не только из внешних систем, таких как поставщик данных Microsoft OLE DB, но и из хранилищ бизнес-информации SAP Business Warehouse.
Визуализация данных
Расширенные графические возможности STATISTICA позволяют автоматически определять и использовать преимущества высокоэффективного аппаратного ускорения, которое может быть реализовано не только видеокартами стационарных компьютеров «топ»-уровня, но и графическими ускорителями ноутбуков «среднего» уровня. В результате графики строятся не только быстрей, но и поддерживают более продвинутые настройки изображения. Графические возможности программы STATISTICA были усовершенствованы благодаря новым процедурам расслоения, закрашивания и сглаживания линий, кривых и поверхностей. Кроме того, все графические документы STATISTICA (как отдельные, так и собранные в рабочую книгу) могут изменяться и настраиваться интерактивно (с помощью инструментов, расположенных в нижней части окна графика). Новые возможности STATISTICA 10 позволяют улучшать внешний вид графика, проводить более глубокий визуальный анализ и выявлять скрытые тренды путем постепенного уменьшения насыщенности изображения, а также вращения трехмерных графиков.
- Интерактивное масштабирование позволяет визуально выявить скрытые тренды с помощью растяжения или сжатия интересующей части графика. Пользователь может интерактивно изменять масштаб всех осей графика.
- Интерактивная прокрутка поможет обнаружить тренды, скрытые в массиве данных. С помощью мыши можно интерактивно прокручивать оси графика влево или вправо.
- Прозрачность – новая возможность STATISTICA 10 – позволит выявить тренды, скрытые в плотном массиве данных (особенно при построении диаграмм рассеяния по выборке большого объема). Целью является достижение оптимального уровня плотности точек, при котором можно выявить закономерности, скрытые большим количеством случайных данных (белым шумом), которые создают эффект «чернильного пятна».
- Соединительные линии можно быстро добавлять на график с помощью опции Reference Lines, доступной в диалоге «Все параметры графика».
- Интерактивная правка текста – текст можно изменять напрямую в окне графика, не открывая редактор. *Сам же редактор текста остался доступным и по-прежнему содержит дополнительные опции для форматирования.
Пользовательский интерфейс
Пользовательский интерфейс был существенно переработан с учетом последних достижений эргономики в следующих областях:
- Уменьшение зрительного напряжения.
- Улучшение эффективности работы человека с компьютером.
- STATISTICA 10 упрощает процедуру подгонки и моделирования.
- Обширная и широко масштабируемая реализация модели пропорциональных рисков Кокса (мощная модель для данных, содержащих времена жизни) добавлена в версию 10. Данный модуль имеет приложения в следующих областях: анализ времен жизни пациентов в медицине, анализ оборота клиентов и моделирование и оценка времени эксплуатации механических деталей.
- Модель пропорциональных рисков Кокса позволяет эффективно работать с цензурированными данными, категориальными предикторами и планами, содержащими взаимодействия и/или вложенные эффекты. В качестве техники построения моделей этот модуль использует метод наилучших подмножеств и пошаговую регрессию. Построение функций выживаемости для новых данных можно задать с помощью STATISTICA Rapid Deployment.
2015: Statistica 13
21 октября 2015 года компания Dell представила решение Statistica 13 для работы с Большими данными и аналитикой. Продукт ориентирован на помощь компаниям в быстром и надежном превращении данных в прогнозы для принятия верных решений в кратчайшие сроки.
Продукт может интегрироваться в бизнес-процессы и использоваться на каждом этапе работы для получения более высоких результатов.
Скриншот окна приложения (2014)
Версия программной платформы углубленной аналитики Dell Statistica 13 помогает упростить и улучшить процесс внедрения предиктивных моделей непосредственно в источники данных внутри брандмауэра, в облаке и в экосистеме партнера. Решение простое в эксплуатации, не требует написания кода и интегрируется с открытым языком R.
В составе Dell Statistica ряд инструментов для обнаружения и объединения данных и предиктивной аналитики. Система помогает организациям учитывать всю имеющуюся информацию для предсказывания тенденций будущего, идентификации новых клиентов и прогноза объемов продаж, испытывать сценарии вида «что, если», снижать вероятность мошенничества и других рисков для бизнеса.
Среди функций платформы Statistica 13:
- модернизированный графический интерфейс, упрощающий использование продукта и делающий данные более наглядными;
- углубленная интеграция с движком Statistica Interactive Visualization and Dashboard;
- интеграция с открытым языком R, упрощающая обмен и управление R-скриптами;
- инструмент поэтапной рекомендации оптимальных моделей для пользователей;
- расширенные возможности инструмента Native Distributed Analytics (NDA), позволяющие пользователям запускать анализ непосредственно в базах данных и работать более эффективно с крупными и растущими массивами данных.
Инструмент NDA помещает алгоритмы построения предиктивных моделей и функции подсчета непосредственно в источники данных. Это устраняет задержки и ограничения, которые имеют место вследствие наличия промежуточного сервера или настольной системы. Вся обработка выполняется в базе данных.
Такой подход позволяет организациям пользоваться преимуществами кластеров Hadoop, аппаратных средств и прочих высокопроизводительных платформ. Изначально в платформу Statistica 13 будут встроены функции NDA для баз данных Microsoft SQL Server. Согласно заявлению компании, поддержка других баз данных будет добавлена в последующих обновлениях.
— Интер РАО ЕЭС, ПАО | StatSoft Russia | 2011.01 | BI |
Источник: www.tadviser.ru