Программа statistica что это такое

StatSoft Statistica — программа для анализа данных

Стандартную комплектацию пакета STATISTICA составляет 3 модуля: базовый модуль STATISTICA Base, модуль линейных и нелинейных моделей STATISTICA Advanced Linear/Non-Linear Models и модуль многомерных разведочных технологий анализа STATISTICA Multivariate Exploratory Techniques . Модули могут приобретаться как единым пакетом, так и отдельно. При этом, для работы модулей STATISTICA Advanced Linear/Non-Linear Models и STATISTICA Multivariate Exploratory Techniques требуется наличие базового пакета STATISTICA Base.

STATISTICA Base (самостоятельный продукт) — это широкий набор основных статистик в понятном интерфейсе со всеми преимуществами, простотой и мощностью технологий STATISTICA. STATISTICA Base включает в себя:

Полный набор графических инструментов STATISTICA
Описательные и внутригрупповые статистики, разведочный анализ данных
Корреляции
Быстрые основные статистики и блоковые статистики
Интерактивный вероятностный калькулятор
T-критерии (и другие критерии групповых различий)
Таблицы частот, сопряженности, флагов и заголовков, анализ многомерных откликов

Вебинар «STATISTICA для медицинских приложений: актуальные задачи»

Множественная регрессия
Непараметрические статистики
Общая модель дисперсионного и ковариационного анализа
Подгонка распределений

STATISTICA Advanced Linear/Non-Linear Models предлагает широкий спектр линейных и нелинейных средств моделирования, поддерживает непрерывные и категориальные предсказания, взаимодействия, иерархические модели, возможность автоматического выбора моделей, а также компоненты дисперсии, временные ряды и другие методы. Все анализы снабжены разнообразными интерактивными графиками и встроенным редактором Visual Basic. В состав системы входят следующие модули:

Компоненты дисперсии и смешанная модель ANOVA/ANCOVA
Анализ выживаемости
Общее нелинейное оценивание (включая логит/пробит регрессию)
Логлинейный анализ
Анализ временных рядов и прогнозирование

Моделирование структурными уравнениямий (SEPATH)
Общие Линейные модели (GLM)
Общие Регрессионные Модели (GRM)
Обобщенные Линейные Модели (GLZ)
Общие Модели Частных Наименьших Квадратов (PLS)

STATISTICA Multivariate Exploratory Techniques предоставляет широкий выбор разведочных технологий, начиная с кластерного анализа до расширенных методов классификационных деревьев, в сочетании с бесчисленным набором средств интерактивной визуализации для построения связей и шаблонов. В состав системы входят:

Кластерный анализ
Факторный анализ
Анализ главных компонент и классификация
Каноническая корреляция
Надежность и позиционный анализ
Деревья классификации
Анализ соответствий
Многомерное шкалирование

Дискриминантный анализ
Общие модели дискриминантного анализа (GDA)

В данный момент в продаже имеется русскоязычная версия STATISTICA 6 и англоязычная версия STATISTICA 9.

Для академических организаций:

Statistica Base for Windows v.9 English Однопольз. версии — 525 $;
Statistica Base for Windows v.9 English Сетевые версии 3-5 пользователей — 695 $ за место;

Ввод данных STATISTICA #01 | СТАТИСТИКА STATISTICA

Statistica Base for Windows v.9 English Сетевые версии 6-25 пользователей (Licence) (первые 5 лицензий) — 3 475$;

Statistica Base for Windows v.9 English Сетевые версии 6-25 пользователей (Licence) (дополнительная лицензия) — 525 $ за место;

Statistica Advanced for Windows v.9 English Однопольз. версии — 1 095 $;
Statistica Advanced for Windows v.9 English Сетевые версии 3-5 пользователей — 1 295 $ за место;

Statistica Advanced for Windows v.9 English Сетевые версии 6-25 пользователей (Licence) (первые 5 лицензий) — 6 475$;

Statistica Advanced for Windows v.9 English Сетевые версии 6-25 пользователей (Licence) (дополнительная лицензия) — 1 095$ за место;

Statistica Base for Windows v.9 English Однопольз. версии — 630 $;
Statistica Base for Windows v.9 English Сетевые версии 3-5 пользователей — 835 $ за место;

Statistica Base for Windows v.9 English Сетевые версии 6-25 пользователей (Licence) (первые 5 лицензий) — 4 175$;

Statistica Base for Windows v.9 English Сетевые версии 6-25 пользователей (Licence) (дополнительная лицензия) — 630 $ за место;

Statistica Advanced for Windows v.9 English Однопольз. версии — 1 315 $;
Statistica Advanced for Windows v.9 English Сетевые версии 3-5 пользователей — 1 555 $ за место;

Statistica Advanced for Windows v.9 English Сетевые версии 6-25 пользователей (Licence) (первые 5 лицензий) — 7 775$;

Statistica Advanced for Windows v.9 English Сетевые версии 6-25 пользователей (Licence) (дополнительная лицензия) — 1 315$ за место;

Версия 6 руссифицированные:

Statistica for Windows v.6 Russian Однопольз. версии Education — 895 $;

Операционная система: Microsoft Windows

  • OpenStat2 – можно скачать с сайта http://www.agrivisser.com/Cgi-bin/English/OpenStat2.htm

Поделиться:

Оставьте свой комментарий!

Источник: pro-spo.ru

8.1 Требования к статистическим пакетам общего назначения

Для того, чтобы статистический пакет общего назначения был удоб­ным и эффективным в работе, он должен удовлетворять многочисленным и весьма жестким требованиям. В частности, необходимо, чтобы он:

1. содержал достаточно полный набор стандартных статистических методов;

2. был достаточно простыми для быстрого освоения и использо­вания;

3. отвечал высоким требованиям к вводу, преобразованиям и орга­низации хранения данных как в самом пакете, так и обмену с широко распространенными базами данных ( dBase , Lotus 1-2-3 и т.п.);

4. имел широкий набор средств графического представления дан­ных и результатов.

5. имел подробную документацию, хорошо продуманную с учетом интересов как начинающего пользователя, так и специалиста-статистика.

Наконец, немаловажное значение имеет цена пакета. Профессио­нальные западные статистические пакеты ( SAS , BMDP и т.д.) обычно стоят от 2 до 10 тысяч долларов и более. Эти пакеты позволяют обраба­тывать гигантские объемы данных, включают средства описания задач на встроенном языке и дают возможность построения на их основе систем обработки информации для целых предприятий.

Читайте также:
Microsoft people что это за программа и нужна ли она на Windows 10

Пакеты, рассчитанные на массового пользователя, стоят дешевле — обычно 500—1500 долларов. Эти пакеты отличаются от профессио­нальных прежде всего ориентацией на индивидуального пользователя: преимущественно диалоговым режимом работы, наличием ограничений по объему обрабатываемых данных и т.д. Имеются и более дешевые пакеты (200-300 долларов и ниже), но они обычно обладают весьма скромными возможностями.

Отечественные статистические пакеты стоят существенно дешевле, как правило, их цена составляет от 200 до 500 долларов.

8.2 Российские пакеты обработки данных

В отличие от западных, многие отечественные пакеты в гораздо большей степени подходят для нужд среднего российского пользователя. Здесь основные операции обычно сразу обозримы из головных меню, а рутинные процедуры выполняются с минимумом действий и разветвлений по принципу: «прямым путем – к понятному результату».

Наиболее развитой системой контекстной экранной помощи включающей объемный справочник-гипертекст и экспертную систему по выбору метода статистического анализа, обладает пакет STADIA . Здесь каждый числовой статистический вывод сопровождается короткой и понятной интерпретацией (впрочем, более искушенный в статистике пользователь может сделать интерпретацию результатов сам, благо все данные для этого также выводятся на экран).

В пакете Мезозавр реализована оригинальная система экспертной оценки сложных моделей временных рядов. Система Эвриста выделяется живо и изобретательно написанной документацией, которая читается как захватывающее повествование о возможностях статистических методов.

Все три пакета аккумулируют передовой опыт российской науки, что не удивительно: их создавали ведущие специалисты Академии наук и Московского университета. Они стабильно распространяются и эксплуатируются сотнями пользователей на протяжении целого ряда последних лет.

Замечание. Периодически на выставках и семинарах можно встретить и другие российские программы анализа данных (например, достаточно интересный интегрированный пакет «Термит» г. Кемерово, представленный на выставке SofTool -93).

8 . 3 Пакет STATISTICA

STATISTICA — это универсальная интегрированная система, предназначенная для статистического анализа, визуализации данных и разработки пользовательских приложений. Программа содержит широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе. Помимо общих статистических и графических средств в системе имеются специализированные модули, например, для проведения социологических или биомедицинских исследований, решения технических и промышленных задач: карты контроля качества, анализ процессов и планирование эксперимента.

Пользователями системы являются крупнейшие университеты, исследовательские центры, компании, банки всего мира, государственные учреждения.

Система STATISTICA может служить не только эффективным инструментом для научных исследований, но и чрезвычайно удобной средой для обучения методам статистического анализа. Система STATISTICA активно используется в учебном процессе в таких вузах, как МГУ, МГИЭМ, МЭСИ, МФТИ, МИФИ, МГТУ им. Баумана, СПбГУЭФ и многих других.

Пакет STATISTICA является наиболее динамично развивающимся статистическим пакетом и по многочисленным рейтингам является мировым лидером на рынке статистического программного обеспечения.

Пользователь может добавить собственную панель инструментов с тем или иным методом статистического анализа. Несомненным достоинством пакета является возможность дописывать (наращивать) систему при помощи встроенного языка программирования.

STATISTICA Neural Networks — универсальный и мощный нейронно-сетевой пакет. Он дает возможность автоматически получать эффективные и правильные решения для широкого круга задач, в которых использование традиционных статистических методов затруднено, например, из-за отсутствия априорных моделей или конкретных гипотез.

8.4 Пакет STADIA

Универсальный российский статистический пакет STADIA — за 12 лет существования и развития стал аналитическим инструментом для многих тысяч пользователей в различных областях науки, техники, планирования, управления, производства, сельского хозяйства, экономики, бизнеса, маркетинга, образования, медицины по всей русскоязычной Евразии. По своим базовым возможностям сопоставим с наиболее известными западными статистическими пакетами. Отличается простотой использования применительно к отечественной аудитории.

Следует обратить внимание на удивительную компактность пакета STADIA : он требует в несколько раз меньше места на диске, чем его конкуренты, и при этом не уступает, а часто и превосходит их по своим функциональным возможностям.

Пакет работает на любом IBM-совместимом компьютере (от 286 и выше) и в любой среде Windows от 3.11 и выше. Для Windows NT и Windows 2000 существует специальная модификация. Программа занимает на диске 4.1 Мб и требует минимальной памяти от 8 Мб.

Возможности:

1. исчерпывающий набор самых современных и эффективных методов анализа: описательная статистика, дисперсионный, корреляционный и спектральный анализ, сглаживание, прогнозирование, простая, нелинейная регрессия, кластерный и факторный анализ, методы контроля качества, анализ и замена пропущенных значений.

2. полный комплект деловой и научной, 2-х, 3-х и многомерной графики: функции, зависимости, прогнозы, диаграммы рассеяния, карты, гистограммы, столбиковые, башенные и круговые диаграммы, установка размеров, надписей по осям и под рисунком и проч.

3. разнообразные преобразования и вычисления, импорт / экспорт данных и результатов;

4. развитая экранная помощь, понятная интерпретация результатов.

Demo -версия программы STADIA обладает всеми возможностями пакета и позволяет обрабатывать данные небольшого объема (до 400 чисел), вводимые с клавиатуры. Тем самым она позволяет самостоятельно и практически овладеть всеми современными методами прикладной статистики, а во многих областях исследования сразу получить научные и практически значимые результаты.

Источник: tsput.ru

БиоСтатистика — 02. Тема 2. Программа Statistica

Тема 2. Статистические программы и файл-пример для работы с ними

2.1. Разнообразие программ для статистических расчетов

Мы приступили к изучению биологической статистики. Оно может быть организовано двумя разными способами. При первом из них (его можно обозначить «ab ovo») студентам объясняют математические основы изучаемых методов, выводят необходимые формулы и доказывают объясняющие их теоремы. Если студент освоил такой курс, решение конкретных проблем, связанных с тем или иным набором данных в его области исследований оказывается не такой уж сложной задачей. Второй способ («делай, как я») заключается в том, что студентам показывают, как решать типовые задачи с помощью того или иного инструментария.

Читайте также:
Для чего программа ic

Первый способ сложнее. Люди, успешно справившиеся с обучением по первому способу, имеют более высокую подготовку и более универсальны. Однако, в значительной степени, первый способ работает по принципу «все или ничего». Ты или освоил основные подходы и можешь их применять, или не знаешь, что делать и теряешься при необходимости решить простейшие задачи.

Второй способ «демократичнее» и позволяет легко решать типичные задачи. Увы, без понимания основ методов люди, которых научили повторять какие-то последовательности действий, но не объяснили их смысл, часто делают ошибки. Еще одним недостатком второго подхода является привыкание к определенным программам (инструментам для решения типовых задач). Естественно, что для разных категорий студентов нужен или первый, или второй способ, или их сочетание. Опыт преподавания биометрии студентам-биологам свидетельствует, что им, преимущественно, нужен подход «делай, как я».

Реализация подхода «делай, как я» требует выбора программ, с помощью которых будет проводиться обучение. Тут приходится выбирать между пятью категориями программ:
— бесплатные любительские и полупрофессиональные программы; их немало, но среди них нет универсальных, и, к тому же, чуть не каждая из них требует своего подхода (хотя некоторые решения следует признать удачными, как, например, этот набор онлайн-калькуляторов);
— вероятно, самая удачная из бесплатных программ, созданная палеонтологами как упрощенный и бесплатный аналог пакета Statistica — программа PAST; скачать последнюю версию самой программы и руководства пользователя к ней можно тут;
— свободное ПО; лидер в этой области — среда R: мощнейший программный пакет (или язык) для статистической обработки (вот его основная страница); в базовом случае требует работы с командной строкой, хотя чаще используется с оболочками наподобие RStudio (скачать его можно тут);
— платное или свободное ПО, не предназначенное для решения статистических задач специально, но представляющее широкие возможности для работы с данными и, в том числе, и их статистической обработки; к этой категории относятся Excell и Access, компоненты Microsoft Office, а также их бесплатные аналоги, как LibreOffice Calc;

«Тут следует отметить ещё одну вещь: ни в коем случае не рекомендуется производить какой-либо статистический анализ в программах электронных таблиц. Не говоря уже о том, что интернет просто забит статьями об ошибках в этих программах и/или в их статистических модулях, это ещё и крайне неверно идеологически. Иначе говоря: Используйте R!». А. Б. Шипунов, Е. М. Балдин “Анализ данных с R”.

— платные профессиональные специальные программы; лидерами рынка в этой области являются программы SPSS и Statistica.

Использование программ пятой категории позволяет в наибольшей степени сосредоточиться на сути решаемых проблем. Увы, оно сопряжено с необходимостью выбора между покупкой дорогой (очень дорогой!) лицензии или использования взломанных, пиратских версий. Тем не менее, по мнению автора, именно такие программы позволяют быстрее всего получить опыт работы с данными, в том числе, и с использованием методов многомерного анализа, требующих сложнейших вычислений.

Один из авторов этого пособия начал работать с программой Statistica фирмы StatSoft (в ее предыдущих реинкарнациях) около 1992 года (тогда она называлась CSS, и она была предназначена для работы в DOS). В то время именно эту программу использовали квалифицированные зоологи Москвы и Киева. Сделанный тогда выбор и предопределил ту программу, на которую ориентировано изложение в этом пособии. Надо признаться, что человеку, который привык работать в программе с оконным интерфейсом, выбирая опции из предложенного списка, чрезвычайно тяжело перейти к работе в режиме командной строки, требующему помнить имена и синтаксис необходимых программ. Впрочем, альтернативы осваивоению среды R для профессионального биолога уже нет.

Авторы планируют расширять данное пособие пояснениями, как реализовать описанные в нем методы в программе PAST и в среде R. До того для знакомства с R можно лишь рекомендовать достаточно многочисленные источники, доступные в Сети, описывающие использование этого пакета. Среди них — посвященные R блоги, в том числе r-analytics и statinr. Очень полезно пройти русскоязычный курс по работе в R.

Есть в Сети и ресурсы, посвященные работе в Statistica; среди них особо можно рекомендовать замечательный портал Статосфера.

2.2. Опис файлу-прикладу Pelophylax_example

Мощными инструментами анализа данных являются средства для построения графиков. Зачастую именно тот или иной способ визуализации собранных данных позволяет понять, какие статистические гипотезы следует проверять в ходе дальнейшего анализа, увидеть интересные или непонятные особенности собранных данных.

В файле использован фрагмент данных, полученных А.В. Коршуновым при подготовке диссертации на соискание степени кандидата биологических наук (автор искренне благодарен А. В. Коршунову за разрешение использовать результаты его работы). В оригинальном файле содержалось описание нескольких сот лягушек по 16 морфометрическим признакам; в выбранном фрагменте оставлено 57 лягушек и приведены данные об изменчивости у них 7 морфометрических признаков. Структура данных объясняется на примере файла Statistica, потому что именно эта программа позволяет корректнее всего показать текстово-числовые соответствия и спецификации переменных.

Все описанные в файле-примере особи принадлежат к гибридогенному комплексу зеленых лягушек, Pelophylax esculentus complex. Это два родительских вида, прудовая лягушка Pelophylax lessonae (Camerano, 1882) и озерная лягушка, P. ridibundus (Pallas, 1771), а также их диплоидные и триплоидные гибриды, называемые съедобными лягушками, P. esculentus (Linnaeus, 1758). Триплоидные гибриды P. esculentus представлены двумя формами, отличающимися по составу геномов в генотипе. Воспроизводство гибридов связано с феноменом гемиклональной наследственности. Все названные формы лягушек могут образовывать гемиклональные популяционные системы (ГПС), где в ходе совместного размножения передаются как клональные, так и рекомбинантные геномы.

Читайте также:
For rest что это за программа

Родительские виды и гибриды обладают определенными внешними особенностями, которые, однако, не позволяют отчетливо отличать их друг от друга. Один из методов доказательной идентификации различных форм зеленых лягушек состоит в использовании проточной ДНК-цитометрии. Взвешенные клетки лягушек с током жидкости проходят через ультрафиолетовый детектор.

Они облучаются ультрафиолетовым излучением на длине поглощения ДНК, а затем на той длине, на которой возбужденная ДНК излучает энергию, регистрируется интенсивность флуоресценции (вторичного излучения) клетки. Сравнивая клетки изучаемых особей с реперными клетками (например, трявяной лягушки, Rana temporaria), имеющими точно известную массу ДНК, приходящуюся на клетку, можно определить массу ДНК в изучаемых клетках. Эта масса измеряется в пикограммах, пг. Поскольку известно, что геном P. lessonae имеет массу около 7 пг, а геном P. ridibundus — 8 пг., по массе клеточной ДНК можно определить, какие геномы входят в генотип данной особи.

В файле Pelophylax_example.sta содержатся данные о лягушках с 5 разными генотипами. Обозначая геном P. lessonae как L, а геном P. ridibundus — как R, эти 5 форм можно обозначить как LL, LLR, LR, LRR и RR. Все эти формы встречаются в Харьковской области.

В файле Pelophylax_example.sta строкам (Cases, наблюдениям) соответствуют отдельные особи, а столбцам (Variables, переменным) — их признаки. Характеристика каждой особи включает в себя место сбора, его координаты, а также указание того, относится данная точка к водосборному бассейну Днепра (запад и северо-запад Харьковской области) или Дона (т.е. Северского Донца; большая часть территории области). Кроме того, для каждой лягушки указывается ее пол.

В файле приведены данные о половозрелых лягушках. При возможности выбора, они отбирались так, чтобы для каждой формы лягушек включенные в файл данных особи происходили из разных точек.

Измерение морфометрических признаков проводилось на фиксированных лягушках с помощью штангенциркуля; данные измерялись с точностью до 0,1 мм. Самым существенным из этих признаков является длина тела. Все прочие признаки могут использоваться как в виде абсолютных значений, так и в виде пропорций (отношения данного признака к длине тела). Кроме того, для тех или иных целей могут вычисляться индексы — комплексные признаки, которые вычисляются как некие комбинации исходных морфометрических признаков. Строго говоря, пропорции (отношения промеров к длине тела) тоже являются индексами, но в целях удобства эти понятия проще сузить так, как это предложено в данном абзаце.

Источник: batrachos.com

Основы работы со статистическим пакетом StatSoft Statistica

Работа с популярным и очень мощным статистическим пакетом Statistica компании StatSoft Inc существенно облегчает и ускоряет проведение статистических анализов. В частности, с его помощью легко определить существование и силу связей между различными величинами [14].

Для того, чтобы рассчитывать корреляционные взаимосвязи методом попарной корреляции Пирсона, нужно проделать следующее.

1. Внести данные в программу «Statistica» (ручным способом или импортировать): пункт меню File — Open.

Для примера, нас интересует существуют ли связи между зараженностью зерна пшеницы спорами «картофельной» палочки (показатель выражается в единицах КОЕ/г — колониеобразующих единиц бактерий в 1 грамме зерна) и тепло-и влагообеспеченностью района произрастания этой пшеницы (показатели суммы температур и коэффициента атмосферного увлажнения). Кроме того добавлен такой априори незначительный показатель как день фазы Луны в момент посева зерна.

  • 2. Выбрать пункт меню Statistics — Basic Statistics/Tables — Correlation matrices. Появится панель как на рисунке 19.
  • 3. Нажимаем кнопку One variable list (один список переменных) и выбираем все переменные, нажав кнопочку Select all, а потом Ок. Таким образом мы включаем в анализ все наши переменные. При желании можно выбрать только некоторые из них, либо сгруппировать два списка переменных (кнопка Two lists. ) для перекрестного определения корреляций только между этими переменными (рисунок 20).
  • 4. На вкладке Options, в секции Display format for correlation matrices, отмечаем пункт выставленный по умолчанию Display simple matrix, с подсветкой достоверных уровней значимости р. В секции управления отсутствующими значениями «MD deletion» выбираем пункт попарной обработки Pairwise и жмем Summary. Попарная обработка означает, что программа, формируя выборку для анализа, не будет учитывать отсутствующие значения.
  • 5. В результате мы получили корреляционную матрицу, представляющую собой таблицу в первом столбце и в первой строке которой перечислены все наши переменные, а на пересечении любых двух переменных указан соответствующий их взаимосвязи коэффициент корреляции. По диагонали матрицы идут коэффициенты корреляции переменной «сама с собой» равные 1. Например, можно отметить, что величина обсеменности спорами «картофельной» палочки зерна прямо коррелирует с суммой температур в месте произрастания пшеницы, с коэффициентом корреляции г=0,87 и р т Добавить в Отчет т ,

ВТ и 5 S 3 g ^||| tog Л | « [?§• ^ S 21 «•? $ перемег

Д Данные: Копня КОЕ+тем-ра+увлажнение.$1а (4v * 28с)

Источник: bstudy.net

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru