Stadia
Пакет российского производства, который начал разрабатываться более 60 лет назад, и с тех пор переносился на новые платформы и дорабатывался. Он относится к классу «среднего звена», т.е. универсальным пакетам статистического анализа. Его возможности скромнее, чем у корпоративных SAS/SPSS, но он отлично справляется с данными, насчитывающими несколько тысяч переменных.
Для задач прикладной статистики этого вполне достаточно. В ходе работы строятся всевозможные графики с высоким качеством отображения информации. Достаточно упомянуть, что этот пакет активно используют НИИ, в т.ч. дефектоскопии, медицины, биологии и приборостоения, а также более мелкие предприятия и учреждения. Этому способствует и довольно низкая цена пакета в 500 у.е.
Statistica 6.0
Пакет компании Statsoft активно распространяется благодаря магазину Softline. Не предназначен для массового применения, так как изобилует специальной терминологией. Обладает очень широким спектром алгоритмов, функций и добавочных расширения благодаря встроенному языку, что привлекает профессионалов-статистиков.
Самые странные и сложные языки программирования 🫠
Имеются возможности многомерного анализа, создания собственных типов переменных, присвоения табличных связей типа «объект-признак» и т.д. Управление пакетом упрощено и эргономично, интерфейс снабжен множеством функциональных пиктограмм, не требуется работать в консоли для ввода данных или составления программ. Вывод отчетов возможен в табличной форме, в виде матриц, картинок или 2/3D графики, причем графику можно менять, добавлять собственный дизайн, накладывать ее слоями, увеличивать и т.д.
Minitab
Возможности этого пакета столько широки, что разработчикам часто советуют сменить первую часть названия на Maxi. Пакет платный, проприетарной разработки Пенсильванского университета, ориентированный на математическую статистику. Последняя версия 10 вышла еще в 2010 году, русской локализации не имеется.
Пакет часто ассоциируется с методиками развития вроде «Шесть сигма» и подобными процедурами. Пакет поддерживает управление файлами и данными в виде графических электронных таблиц для удобства восприятия, многомерный анализ данных, прогнозирование и временные ряды, дисперсионный и системный анализ и многое другое. Возможности расширения системы тоже присутствуют. В качестве вывода используются таблицы и диаграммы, которые можно выбирать из списков и проектировать самостоятельно.
Statgraphics 5.1
Тоже один из самых популярных инструментов «на слуху» у пользователей. Пакет позволяет импортировать данные в диалоговом режиме из других приложений, выбирать методы анализа из сгруппированных разделов. Применяется во всех предметных областях, обладает гибкой возможностью осуществления регрессионного анализа с выбором альтернатив. Система поддерживает традиционные выводы отчетов в виде таблиц и графиков, поддерживает более 250 функций, применяющихся во многих областях статистических знаний, допускает расширение примением дополнительных модулей.
Статистический метод (критерий): как выбрать для анализа?
SPSS for Windows
Это последний из рассматриваемых нами сегодня пакетов, но, несмотря на очередь в конце, один из самых лучших. Его сила не только в огромном количестве всевозможных функций, необходимых в любых предметных областях, где требуется статистический анализ, но и в том, что при всей своей мощи он доступен для управления даже непрофессионалами – в нем все функции производятся мышкой с элементами выбора, т.е. так называемым режимом мастеров.
Особенно удобен пакет для создания и анализа опросников, для чего используется встроенный простой язык, на котором может писать любой человек, едва с ним познакомившись. Меню и понятные диалоговые окна освобождают от необходимости копаться в специальной терминологии. Очень хорошо организован ввод данных, без применения консольных команд. Для вывода используются развитые средства в виде текстовых, табличных или графических отчетов – более 50 типов различных диаграмм. Пакет часто упоминается в связке с SAS, но, фактически, гораздо слабее его, относясь к категории универсальных программ для статистики и анализа.
Описание пакета SAS вы сможете рассмотреть самостоятельно, но нужно учесть, что он предназначен для сверхмощного применения большими корпорациями. Соответственно, его стоимость тоже зашкаливает за все разумные пределы. Надеемся, что эти неформальные описания привлекут ваш интерес к этой области, которая часто имеет вполне практический смысл.
Источник: dprogu.ru
VII Международная студенческая научная конференция Студенческий научный форум — 2015
КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ
Костин А.А., Заяц О.А.
Работа в формате PDF
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке «Файлы работы» в формате PDF
Владение основами статистических методов необходимо специалистам, работающим в естественнонаучных и инженерных областях, а также представителям гуманитарных профессий: экономистам, социологам, психологам, лингвистам. Возможности компьютеров в обработке больших объемов информации сделали доступными для пользователей самые современные методы статистического анализа. В настоящее время разработано большое количество статистических пакетов программ, которые по своим возможностямделятся на две основные группы:специализированные пакеты и пакеты общего назначения.
Статистические пакеты общего назначения имеют универсальную направленность, которая позволяет решать задачи разных предметных областей: финансово-экономическая сфера (анализ рисков, прогнозирование финансовых и экономических показателей, микро- и макроэкономическое моделирование, анализ операций по вкладам, страхование); торговля (сравнительный анализ поставщиков, прогнозирование потребления и оптимизация запасов, ценообразование); маркетинг (ранжирование товаров, сегментирование рынка, анализ спроса); производство (анализ качества продукции, прогнозирование потребления ресурсов, оптимизационные эксперименты); социология (анализ результатов опросов, анализ качества услуг информационных провайдеров в Интернет); образование (обучение методам статистического анализа данных) и многие другие.
Универсальные статистические пакеты реализуют множество модификаций статистических методов анализа, при этом объем обрабатываемых данных ограничивается лишь возможностями компьютера. Рассмотрим наиболее известные универсальные статистические пакеты программ.
В настоящее время одним из лидеров среди универсальных статистических пакетов является SPSS[13]. Пакет отличается гибкостью и мощностью применения для всех видов статистических расчетов. В России существует представительство компании SPSS, которое распространяет русифицированную версию пакета. На русском языке создан электронный учебник по применению данного пакета, изданы работы по его применению [20].Вместе с тем в пакете SPSS встроенные модули и тесты для пространственных данных и временных рядов отстают от современного уровня развития науки. Это делает его малопривлекательным для современных эконометрических исследований.
Среди универсальных систем статистического анализа данных широкое распространение получил пакет STATISTICA [1,2,5]. Он относится к числу базовых пакетов вузов России. Фирма-разработчик этого пакета имеет свое российское представительство [16], на сайте которого размещен электронный учебник по статистике, а также доступная студенческая версия программы.Пакет программ STATISTICA по своим средствам и возможностям графического отображения информации конкурирует с универсальным научным пакетом MATHEMATICA [18].
Универсальная система статистических программ SAS — мощный интегрированный комплекс более чем из 20 различных программных продуктов. Основное преимущество данного пакета — его непревзойденная мощность по набору реализованных алгоритмов статистических процедур, хотя по качеству и многообразию тот или иной его раздел может уступать соответствующему разделу специализированного статистического пакета. В России функционирует центр SAS-технологий в МГТУ им. Н.Э. Баумана.
К числу достаточно мощных универсальных статистических пакетов относится также STATGRAPHICS PLUS [19]. Важнейшим достоинством пакета считаются хорошая интеграция математико-статистического аппарата обработки данных с современной интерактивной графикой и его динамичная эволюция с учетом развития компьютерных технологий.
Статистическая система Systat [17] в течение нескольких лет была одним из лучших среди универсальных пакетов углубленного статистического анализа. Широкий диапазон реализованных статистических методов и доскональность функционального наполнения позволяют использовать пакет для выполнения самых разнообразных эконометрических исследований.
Специализированные пакеты ориентированы на реализацию только одного или двух определенных разделов статистики или методов, используемых в конкретной предметной области. Наиболее распространенными являются пакеты для анализа и прогнозирования временных рядов, корреляционного и регрессионного анализа, классификации объектов, решения задач сокращения размерности, реализации методов описательной статистики и др.
Рассмотрим некоторые специализированные статистические пакеты, которые имеют профессиональную ориентацию на реализацию методов анализа данных, применяемых для разработки эконометрических моделей.
Профессиональный статистический пакет Stata [6,10,15] ориентирован на решение задач эконометрики. Программа имеет хорошие средства для обработки пространственных данных и временных рядов и обстоятельную документацию; для пользователей системы издается специальный журнал. Интерфейс пакета предполагает программирование на командном языке при выполнении минимальных действий с помощью диалогового графического меню. Встроенный язык программирования удобен для разработки дополнительных приложений. В качестве причины, сдерживающей распространение данного пакета, отмечают отсутствие на официальном сайте [15] его демонстрационной версии.
Отечественный статистический пакет МЕЗОЗАВР (MESOSAUR) [7] является профессионально-ориентированной системой для анализавременных рядов. В целом данный пакет отличается быстротой анализа данных, подбором возможных моделей, легкостью освоения и использования и, несмотря на отсутствие отдельных современных эконометрических методов, выгодно отличается от аналогичных систем.
Отечественный пакет STADIA [10,20] — достаточно известная система статистического анализа данных. Набор модулей данного пакета составлен исходя из следующих принципов: значительная часть реализованных классических методов изучается в вузах России при подготовке выпускников разных специальностей и подробно описана в учебниках; в него включены почти все наиболее часто применяемые статистические методы; пакет не перегружен новыми или сложными специфическими методами. В пакет встроен справочник, который вместе с документацией может служить методическим пособием для студентов. Со страницы сети Интернет [4] можно перекачать демонстрационную версию пакета.
К числу широко используемых эконометрических пакетов относится программная система EViews[14], которая предоставляет разнообразные возможности анализа временных рядов, обеспечивает сложный и тонкий инструментарий статистической обработки пространственных данных, строит прогнозные модели. Пакет функционирует под управлением ОС Windows, имеет встроенный язык программирования для разработки пользователями своих приложений, удобный и легко осваиваемый интерфейс. На сайте разработчика [14] размещена подробная информация о пакете, имеется также доступная студенческая версия программы. Пакет снабжен развитой системой подсказок, которая по существу является учебником по эконометрике с практической ориентацией. В доступной форме на странице Интернета [9] приведено учебное пособие «Компьютерный практикум по начальному курсу эконометрики (реализация на Eviews)».
В зависимости от реализованной системы управления различают три группы статистических пакетов: управляемые с помощью меню, обладающим удобным графическим интерфейсом; управляемые на основе интерфейса, задаваемого в виде командной строки; использующие специализированные языки программирования и соответствующие процессоры с входного языка, которые обладают встроенными возможностями для выполнения стандартных статистических вычислений. Пакеты первой группы используют в основном в учебных целях; пакеты второй группы ориентированы на профессионалов, имеющих навыки программирования; пакеты третьей группы имеют исследовательский характер, так как профессиональные пользователи с помощью встроенных языков программирования могут создавать прикладные программы в виде приложений для решения различных задач. Существует также группа статистических пакетов, которая использует комбинации перечисленных типов управления в интересах пользователей различной квалификации и профессиональных интересов.
Несмотря на разнообразие статистического программного обеспечения в России чаще всего используется программный комплекс (приложение) MicrosoftExcel [2,11,12]. Это объясняется широким распространением русскоязычной версии данного ПО для персональных компьютеров. В программной среде MSOffice приложение MSExcel выполняет функции электронной таблицы с достаточно мощной математической поддержкой решения задач, в которой определенные статистические процедуры являются дополнительными встроенными формулами. Существует также макрос-дополнение XLSTAT-Pro [8,10] для приложения MSExcel, включающее в себя более 50 статистических процедур.
Таким образом, благодаря современному уровню развития информационных технологий в распоряжении исследователей различных сфер науки и техники, экономики и производства, а также образовательных учреждений имеются доступные научные и статистические пакеты программ, удовлетворяющие разнообразные потребности пользователей.
Список использованной литературы:
Источник: scienceforum.ru
Программы статистической обработки данных
Стати́стика — отрасль знаний, наука, в
которой излагаются общие вопросы сбора,
измерения и анализа массовых
статистических (количественных или
качественных) данных; изучение
количественной стороны массовых
общественных явлений в числовой форме.
3. Все программы статистической обработки данных можно разделить на:
профессиональные,
полупрофессиональные (популярные)
и специализированные
4. В настоящее время из статистических пакетов в России вероятно шире всего используются:
STATISTICA,
STADIA,
SPSS
5.
Statistica — программный пакет для
статистического анализа, разработанный
компанией StatSoft, реализующий функции
анализа данных, управления данных,
добычи данных, визуализации данных с
привлечением статистических методов.
6. STADIA
Пакет STADIA обладает развитой системой контекстной
экранной помощи. Программа отечественной
разработки с 16-и летней историей. Включает в себя все
необходимые статистические функции. Она прекрасно
справляется со своей задачей — статистическим
анализом. Но. Программа внешне фактически не
изменяется с 1996 года. Графики и диаграммы,
построенные при помощи STADIA, выглядят в
современных презентациях архаично. Цветовая гамма
программы (красный шрифт на зеленом) очень утомляет
в работе. К положительным качествам программы можно
отнести русскоязычный интерфейс и наличие книг
описывающих работу.
Специализированные пакеты посвящены решению
узкого круга задач.
7. SPSS (Statistical Package for Social Science).
Самый часто используемый пакет статистической
обработки данных с более чем 30-и летней
историей spss Отличается гибкостью, мощностью
применим для всех видов статистических расчетов
применяемых в биомедицине. Недавно вышла 13-я
англоязычная версия. Существует русскоязычное
представительство компании spss которое
предлагает полностью русифицированную версию
SPSS 12.0.2 для Windows. Появился учебник на
русском языке, позволяющий шаг за шагом освоить
возможности SPSS, репетитор по статистике на
русском языке, помогающий в выборе нужной
статистической или графической процедуры для
конкретных данных и задач, а также справка по
SPSS Base и SPSS Tables.
8. STATGRAPHICS Plus
Пакет STATGRAPHICS Plus for Windows включает более 250 процедур,
применяющихся в бизнесе, экономике, медицине, биологии,
социологии, психологии, на производстве и в других предметных
областях, генерирует понятные, настраиваемые отчеты. Последняя
доступная версия — 5.1. Ее можно получить на сайте
http://www.statgraphics.com. Есть возможность скачать демо-версию..
Пакет имеет модульную структуру. Модуль «Контроль качества»
предназначен для оценки эффективности производственного
процесса. Модуль «Планирование эксперимента» помогает
подобрать наилучший план измерений, за счет которого сокращается
объем экспериментальных исследований и время их проведения.
Модуль «Анализ временных рядов» позволяет выявить сезонные
эффекты, циклические изменения, тренды (тенденции), ошибки и
выбросы. Модуль «Многомерные методы» предназначен для изучения
и раскрытия взаимоотношений множества факторов. С его помощью
можно сортировать и группировать данные.
В пакете «Мезозавр» реализована оригинальная система экспертной
оценки сложных моделей временных рядов.
9. отзывы о STATISTICA
Достоинства:
– широкий выбор разнообразных инструментов для статистического
анализа данных;
– позволяет обработать массивные объемы данных;
– возможность проведения кластерного, дискриминантного,
канонического, дисперсионного и факторного анализа;
– наличие функции группировки данных;
– возможность построения рядов, линейных и нелинейных моделей;
– большой набор инструментов для исследования корреляции между
различными переменными;
– поддержка нейронных сетей;
– возможность импортирования данных из Excel-документов;
– наличие блока инструментов data mining;
– возможность построения диаграмм и 2D/3D графиков (более 10000
типов);
– возможность категоризации по переменным (иерархическая [Читать
далее. ]
Недостатки:
– относительно высокая стоимость продукта для отечественного бизнеса;
– срок действия пробной версии программы ограничен 1 месяцем.
10.
Программа анализа данных Statistica широко
применяется в финансовой, промышленной,
медицинской, экономической, страховой,
коммерческой и некоммерческой сферах
деятельности людей. Продукт удобен в
использовании, легок в освоении, оснащен
интуитивно понятным интерфейсом. При
помощи нескольких несложных действий
пользователь сможет выбрать и применить
аналитические инструменты, которые
требуются для статистического анализа.
11.
12. преимущества
наличие качественных инструментов для
построения графиков и схем;
сформированные отчеты можно анализировать
в Word;
высокая точность расчетов, ошибки исключены;
есть руководство по решению статистических
операций;
разнообразные методы редактуры графиков,
схем, диаграмм;
возможность запуска системы через Excel;
доступность средств детализации,
качественной графики.
13. Процедуры:
автокорреляции;
множественная регрессия;
аппроксимация;
графический анализ таблиц;
вычисление экстремумов;
подгонка распределений;
байесовский анализ и т.д.
14. основные возможности специализированного программного комплекса Statistica:
• интеграция решения с всемирной сетью
Интернет;
• настройка системы под свои потребности;
• возможность выполнять прогнозирование в
программе;
• высокая скорость и точность проводимых
вычислений;
• соответствие действующим стандартам
Windows;
• расчеты в программе Statistica любого уровня
сложности;
• быстрое понимание и освоение основных
инструментов.
Источник: ppt-online.org