В данном разделе приводится краткое описание возможностей системы «ЭВРИСТА» и руководство для ее практического использования при работе с экспериментальными данными. Само название системы – «ЭВРИСТА», что означает Э кспериментальные В ременные Р яды: И нтерактивный С татистический А нализ, показывает, что система предназначена для обработки данных, зависящих от времени. Пакет программ представляет собой большую исследовательскую систему для IBM совместимых компьютеров и включает набор методов, необходимый для прикладного анализа экспериментальных данных в различных областях. Система предназначена для работы в среде WINDOWS и разработана в Центре Статистических исследований и Лаборатории статистического анализа МГУ.
Вся работа в системе организуется с помощью главного горизонтального меню, основными разделами которого являются:
· Данные – создание новых переменных, открытие и создание списка рабочих переменных, импорт и экспорт данных.
· Таблица – просмотр и редактирование рабочих переменных, вызов калькулятора и интерпретатора формул.
11 класс, 24 урок, Статистические методы обработки информации
· Граф – создание и редактирование графических окон.
· Метод – перечень методов статистической обработки временных рядов.
· Проект – создание, открытие и редактирование проекта, представляющего собой заданную последовательность методов.
· Счет – выполнение расчетов по выбранному методу.
· Результаты – сохранение результатов расчетов и работа с текстовыми файлами.
· Окно – проведение стандартных действий с окнами.
· Опции – задание и редактирование настроек системы, определение рабочего каталога.
· Помощь – справочная информация о работе системы и используемых методах.
· Файл – создание и редактирование текстовых файлов.
· Редактирование – стандартные операции редактирования текстовых файлов.
Знакомство с основными разделами мы проведем на примерах выполнения стандартных операций с данными, необходимыми при выполнении лабораторных работ.
8.1. Работа с данными
В разделе рассматриваются операции создания и редактирования переменнных.
В системе под переменной понимается набор однотипных данных, имеющий единый способ графического отображения и упорядоченных во времени. Таким образом, для исследователя переменной будет называться ряд измерений физической величины, полученных с конкретного объекта в течение эксперимента или в результате его моделирования.
Система позволяет работать как с реальными временными рядами, так и с рядами, полученными в результате моделирования. Данные, полученные в результате реального эксперимента, должны быть преобразованы в формат системы «ЭВРИСТА», импортированы в систему и помещены в рабочий каталог. В процессе импорта указываются имена файла и переменной, после чего они становятся доступными для анализа. Моделирование временных рядов может быть выполнено, используя возможности системы, и также предусматривает создание новой переменной.
Все имеющиеся в рабочем каталоге переменные хранятся в базе данных системы, а переменные, отмеченные как рабочие, отображаются в электронной таблице, обладающей всеми свойствами стандартных таблиц (о работе с данными смотри ниже).
Статистический метод (критерий): как выбрать для анализа? SPSS
Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:
Источник: studopedia.ru
Глава 1 Программные средства статистической обработки результатов психолого-педагогических исследований.
Современные информационные технологии в психолого-педагогической статистике применяются на всех этапах разработки и проведения статистического наблюдения, включающих: разработку форм статистического наблюдения, формирование плана выборки, сбор и ввод данных, обработку и анализ данных, предоставление информации пользователю. В данной работе мы рассмотрим современные программные средства статистической обработки данных.
Потребность в средствах статистического анализа данных очень велика, что и послужило причиной для развития рынка статистических программ.
Наилучший выбор статистического пакета для анализа данных зависит от характера решаемых задач, объема обрабатываемых данных, квалификации пользователей, имеющегося оборудования.
Число статистических пакетов, получивших распространение в России, достаточно велико (несколько десятков). Из зарубежных пакетов это STATGRAPHICS, SYSTAT, STATISTICA, SPSS, SAS, CSS. Из отечественных можно назвать такие пакеты, как STADIA, ЭВРИСТА, МЕЗОЗАВР, САНИ, КЛАСС-МАСТЕР, СТАТЭксперт и др.
Для пользователей, имеющих дело со сверхбольшими объемами данных или узкоспециальными методами анализа, пока нет альтернативы использованию профессиональных западных пакетов.
Среди интерактивных пакетов такого рода наибольшими возможностями обладает пакет SAS.
Если Вам необходимо обработать данные умеренных объемов (несколько сотен или тысяч наблюдений) стандартными статистическими методами, подойдет универсальный или специальный статистический пакет, надо только убедиться, что он содержит нужные методы обработки.
Пакеты STADIA и STATISTICA являются универсальными пакетами содержащими большинство стандартных статистических методов. Пакеты SPSS и SyStat перенесены на персональные компьютеры с больших ЭВМ предыдущих поколений, поэтому, наряду с представительным набором тщательно реализованных вычислительных методов, они сохраняют и некоторые архаические элементы. Однако имеющиеся в них возможности командного языка (впрочем, очень непростые в изучении использовании) могут быть весьма полезны для сложных задач обработки данных. Пакеты STADIA и STATISTICA исходно разработаны для ПЭВМ, а поэтому проще в обращении. Эти пакеты, пожалуй, содержат наибольшее количество методов статистического анализа.
Для того чтобы статистический пакет общего назначения был удобным и эффективным в работе, он должен удовлетворять многочисленным и весьма жестким требованиям. В частности, необходимо, чтобы он: содержал достаточно полный набор стандартных статистических методов; был достаточно простыми для быстрого освоения и использования; отвечал высоким требованиям к вводу, преобразованиям и организации хранения данных как в самом пакете, так и обмену с широко распространенными базами данных; имел широкий набор средств графического представления данных и результатов.
Имел подробную документацию, хорошо продуманную с учетом интересов, как начинающего пользователя, так и специалиста-статистика.
Наконец, немаловажное значение имеет цена пакета. Профессиональные западные статистические пакеты обычно стоят от 2 до 10 тысяч долларов и более. Эти пакеты позволяют обрабатывать гигантские объемы данных, включают средства описания задач на встроенном языке и дают возможность построения на их основе систем обработки информации для целых предприятий. Имеются и более дешевые пакеты (200…300 долларов и ниже), но они обычно обладают весьма скромными возможностями.
В отличие от западных, многие отечественные пакеты в гораздо большей степени подходят для нужд среднего российского пользователя.
Здесь основные операции обычно сразу обозримы из головных меню, а рутинные процедуры выполняются с минимумом действий и разветвлений по принципу: «прямым путем – к понятному результату».
Наиболее развитой системой контекстной экранной помощи включающей объемный справочник-гипертекст и экспертную систему по выбору метода статистического анализа, обладает пакет STADIA. Здесь каждый числовой статистический вывод сопровождается короткой и понятной интерпретацией.
В пакете Мезозавр реализована оригинальная система экспертной оценки сложных моделей временных рядов. Система Эвриста выделяется живо и изобретательно написанной документацией, которая читается как захватывающее повествование о возможностях статистических методов.
STATISTICA — это универсальная интегрированная система, пред назначенная для статистического анализа, визуализации данных и разработки пользовательских приложений. Программа содержит широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе. Помимо общих статистических и графических средств в системе имеются специализированные модули, например, для проведения социологических или биомедицинских исследований, решения технических и промышленных задач: карты контроля качества, анализ процессов и планирование эксперимента.
Система STATISTICA может служить не только эффективным инструментом для научных исследований, но и чрезвычайно удобной средой для обучения методам статистического анализа. Система STATISTICA активно используется в учебном процессе в многих ведущих вузах России.
Универсальный российский статистический пакет STADIA — за 12 лет существования и развития стал аналитическим инструментом для многих тысяч пользователей в различных областях науки, техники, планирования, управления, производства, сельского хозяйства, экономики, бизнеса, маркетинга, образования, медицины по всей русско-зычной Евразии. По своим базовым возможностям сопоставим с наиболее известными западными статистическими пакетами. Отличается простотой использования применительно к отечественной аудитории.
Возможности: исчерпывающий набор самых современных и эффективных методов анализа: описательная статистика, дисперсионный, корреляционный и спектральный анализ, сглаживание, прогнозирование, простая, нелинейная регрессия, кластерный и факторный анализ, методы контроля качества, анализ и замена пропущенных значений.
Разнообразные преобразования и вычисления, импорт экспорт данных и результатов; развитая экранная помощь, понятная интерпретация результатов.
Источник: studfile.net
История создания системы ЭВРИСТА.
Идея создания специализированного статистического пакета по анализу и прогнозированию временных рядов возникла вначале 80-х годов на кафедре математической статистики Московского государственного университета. Главным идеологом будущей программной системы выступил старший научный сотрудник кафедры, к.ф.-м.н. Ю.Г.Баласанов. Первая версия системы ЭВРИСТА была реализована на языке ФОРТРАН для ЭВМ БЭСМ-6 и с 1984 года началось и использование системы в учебном процессе факультета.
Первая коммерческая версия системы ЭВРИСТА для персонального компьютера появилась 1987 году и ее первым покупателем стало объединение КАМАЗ (г. Набережные Челны). Несмотря на то, что первые персональные компьютеры имели слабые (особенно с нынешних позиций) графические возможности, разработчики по максимуму старались их использовать, и в результате ЭВРИСТА, одна из немногих программных систем того времени, уже имела полностью графический многооконный интерфейс.
В 1988 году Ю.Г.Баласанов и его коллеги создают специализированную статистическую группу высокопрофессиональных статистиков-программистов в СП ДИАЛОГ.
В 1991 году выходит вторая версия системы для IBM-совместимых компьютеров.
В январе 1993 года коллектив разработчиков системы ЭВРИСТА в полном составе переходит в ТОО “Центр Статистических Исследований” и все последующие версии системы выходят в рамках этой организации.
В настоящее время система ЭВРИСТА имеет более 500 зарегистрированных пользователей и по праву заслужила звание популярнейшей отечественной специализированной статистической системы по анализу и прогнозированию временных рядов. Среди наших пользователей: Центральный Банк России, Московский Сбербанк, АКБ «Гута-банк», Bank of America, Институт проблем переходного периода, Институт социологии парламентаризма, МГУ им. М.В.Ломоносова и многие другие.
С 1997 “ЭВРИСТА” — зарегистрированная торговая марка ООО “Центр Статистических Исследований” (свидетельство N 148880 комитета Российской федерации по патентам и товарным знакам (РосПатент)). Статистическая система “ЭВРИСТА” зарегистрирована как самостоятельное электронное издание ООО “Центр Статистических Исследований” (свидетельство N0114-97.1.0.RUS Серия Б. Комитета при Президенте Российской Федерации по политике информатизации).
ППП «ОЛИМП»
Пакет «Олимп» предназначен для автоматизации обработки данных на основе широкого набора современных методов прикладной статистики. Он реализован в расчете на самых разнообразных пользователей – от новичков до экспертов в области статистики.
В состав пакета, кроме основных программ, входят также электронная таблица MNCALC и программное средство «Прикладные социологические исследования (ПСИ)».
Пакет «ОЛИМП» позволяет организовать полный цикл исследований по статистическому анализу и прогнозированию данных, начиная с ввода исходных данных, их проверке и визуализации и заканчивая проведением расчетов и анализом результатов.
С функциональной точки зрения пакет состоит из следующих программ (процедур): редактора средств графического отображения и утилит преобразования данных, а также программ реализации методов статистического анализа.
Редактор данных обеспечивает возможность ввода, просмотра и редактирования исходных данных (в том числе пропущенных наблюдений).
Средства графического отображения данных позволяют выводить различные виды графиков на экран, а также сохранять их на диске для дальнейшего использования.
Утилиты преобразования данных выполняют арифметические преобразования данных (унарные и бинарные), различные виды сортировки (в том числе по нескольким переменным), агрегирование (объединение по одному признаку) и фильтрование данных (отбор по одному признаку).
Программы пакета «ОЛИМП» реализуют следующие методы статистического анализа: корреляционный, регрессионный, дисперсионный, дискриминантный, факторный и компонентный, анализ таблиц сопряженности рядов и др.
Для анализа и прогнозирования динамических данных применяются следующие методы:
· адаптивные методы прогнозирования;
· модели динамической регрессии;
· модели прогнозирования на основе линейной регрессии;
· модели гармонического, спектрального анализа и частотной фильтрации.
Каждая из перечисленных выше моделей может управляться пользователем с помощью параметров, характеризующих эту модель. Такой подход позволяет постепенно осваивать заложенные в программе возможности и облегчает работу с ней.
С помощью корреляционного анализа рассчитывается матрица парных корреляций, матрица частных корреляций, а также коэффициенты множественных корреляций.
На основе регрессионного анализа решаются следующие задачи: установление форм зависимости (положительная, отрицательная, линейная, нелинейная).
Компонентный и факторный анализ – два принципиально различных статистических метода. В программе они объединены в единый блок, поскольку такое объединение оправдано с вычислительной точки зрения.
Компонентный анализ служит для определения структурной зависимости между случайными переменными. В результате его использования получается сжатое описание явления, несущее почти всю информацию, содержащуюся в исходных данных.
Факторный анализ является более общим методом преобразования исходных переменных по сравнению с компонентным анализом. В задачи факторного анализа входит: определение числа общих факторов, определение оценок общих и специфических факторов.
Анализ временных рядов включает в себя расчет статистических характеристик, анализ кривых роста по 16 функциям и некоторые адаптивные параметрические модели для анализа одномерных временных рядов.
Анализ автокорреляции динамического ряда выполняется с помощью графика автокорреляции.
Расчет кривых роста рассматривается как построение парной регрессии, в которой основной переменной является время.
Углубленный анализ предполагает использование адаптивных методов, сезонных методов прогнозирования. Для решения задач частотного анализа могут быть использованы методы частотной фильтрации, гармонического анализа, спектрального анализа.
Электронная таблица MNCALC представляет собой табличный процессор, сходный по своим функциональным возможностям с пакетами LOTUS 1-2-3 или EXCEL.
С точки зрения пользователя пакета «ОЛИМП» база данных MNCALC является таблицей, каждый столбец которой содержит переменную, а строки – значения переменных.
Преимущество MNCALC по сравнению со стандартным редактором пакета ОЛИМП заключается в том, что он позволяет отображать и редактировать сразу весь набор данных. Кроме того, в таблице могут находиться формулы, с помощью которых можно формировать новые переменные на основе существующих. Таблицы могут содержать различную текстовую информацию, позволяющую именовать переменные и комментировать наборы данных.
Программное средство ПСИ предназначено для формирования структуры анкет и ввода данных по этим анкетам. ПСИ содержит пять стандартных типов вопросов, наиболее часто встречающихся в анкетах.
Программное средство ПСИ разработано для подготовки данных с целью их последующей обработки при помощи пакета «ОЛИМП», однако может быть с успехом использовано как средство подготовки данных для других программных продуктов. В ПСИ реализован оригинальный пользовательский интерфейс, позволяющий быстро и легко освоить работу с ним.
ППП «МЕЗОЗАВР»
Основное назначение пакета «МЕЗОЗАВР» заключается в проведении разведочного анализа временных рядов. Это касается ситуации, когда необходимо «пощупать» имеющуюся числовую информацию, по усмотрению исследователя применяя различные методы обработки и анализируя получающиеся при этом результаты и их адекватность. Пакет позволяет осуществлять подобные исследования весьма оперативно и эффективно.
Пакет «МЕЗОЗАВР» используется для анализа временных рядов умеренной (не более нескольких тысяч наблюдений) длины. Диалог происходит по желанию пользователя на русском или английском языке. Управление осуществляется с помощью меню и клавиш быстрого доступа.
Под временным рядом понимается последовательность наблюдений за некоторой числовой характеристикой показателей, сделанных с постоянным шагом во времени (например ежегодно, ежемесячно, каждый час и т.п.). В статистике примерами подобных показателей могут служить на макроэкономическом уровне ежегодные, ежеквартальные, ежемесячные и т.п. объемы производства, поставок, перевозок, потребления; индексы цен и другие макроэкономические показатели; на уровне предприятия – объемы выпуска продукции, затраты, расход ресурсов, эволюция характеристик качества и др.
Пакет «МЕЗОЗАВР» обладает следующими преимуществами по вводу и хранению информации:
· имеет свой стандарт файлов, ввод информации в которые осуществляется через встроенный редактор данных типа «электронной таблицы»;
· предоставляет возможность сохранения в стандартных файлах любых данных, полученных в ходе анализа;
· допускает экспорт и импорт информации из текстовых файлов.
Предельная длина одного анализируемого временного ряда равна 16 тыс. значений, однако возможности анализа такого ряда будут весьма ограничены и поэтому наиболее эффективно работать с рядами до 2 – 3 тыс. значений.
Одновременно можно анализировать до 256 рядов, однако их суммарная не должна превышать 60 тыс. чисел. При этом можно пользоваться либо реальными временными шкалами (шаг по времени – начиная от 1 мин. до любого (целого) числа лет), или же условной временной шкалой.
Редактирование данных осуществляется с помощью встроенного табличного редактора или же в графическом режиме, а их преобразование – с помощью дополнительного меню преобразований более специального характера.
Кроме того, есть возможность непосредственно указать предварительное преобразование данных, которое далее учитывается в процессе анализа. При всех арифметических операциях над рядами учитывается совместимость временных шкал.
Пакет «МЕЗОЗАВР» реализует следующие основные процедуры по анализу временных рядов: сглаживание, прогнозирование, фильтрацию, а также построение различных регрессионных зависимостей. Все процедуры снабжены мощной графической поддержкой с большим числом интерактивных возможностей, таких, как установка различных шкал, увеличение любого куска графика и т.д.
Заключение
В настоящее время рынок математического программного обеспечения очень развит. На нём можно найти свыше тысячи программ, различного уровня, направленности, качества, требованиям к аппаратному обеспечению и, наконец, отличающиеся ценой.
Число статистических пакетов, получивших распространение в России, достаточно велико и спрос на них продолжает возрастать.
В данном реферате я рассказывала про отечественные статистические пакеты и про статистические пакеты в целом. Так же он содержит описание и характеристики некоторых пакетов.
В моей работе приведена таблица общих сведений об СПП, которая наглядно показывает категорию пользователей, цену, продавцов и т.д.
Для наиболее доступного понимания, в реферате описывается легкость использования пакета и его освоение.
В моей работе перечислены виды статистических пакетов.
Так же здесь можно найти описание некоторых отечественных пакетов, таких как «Эвриста», «Stadia», «ОЛИМП» и «Мезозавр».
Особенности отечественных пакетов: более простой путь; аккумулируют опыт передовой российской науки; методы анализа сгруппированы по содержательному принципу, а не по фамилии авторов.
Недостаток отечественных пакетов – это их малочисленность.
Документация отечественных пакетов не уступает зарубежным пакетам(Fore Cast Expert, Олимп Старт Эксперт).
При впечатляющем разнообразии статистических программных продуктов, которым характеризуется современный мировой и отечественный рынок (по официальным данным Международного статистического института, число наименований СПП приближается к тысяче), крайне важно — как для производителя, так и для потребителя этой продукции — правильно ориентироваться в этом многообразии.
СПИСОК ЛИТЕРАТУРЫ
1. Прикладная статистика: Классификация и снижение размерности: Справ. изд. М ., 1989. 607 с .
2. Айвазян С.А. Интеллектуализированные инструментальные системы в статистике и их роль в построении проблемно-ориентированных систем поддержки принятия решений// Обозрение проблем прикладной математики. Том 4, #2. М.: Наука; Изд-во «ТВП», 1997.
3. Статистические и математические системы//Тысячи программных продуктов: Каталог: Вып. 2. М., 1995. С. 88-92.
4. Козырев А.Н. Рынок программного обеспечения в СССР, лицензионные и авторские договоры, цены//Мир ПК. 1989. #3.
Источник: megaobuchalka.ru