Программа статистика как сгруппировать данные

В SPSS можно выполнять анализ данных раздельно по группам. Группой в этом контексте называется определенное количество наблюдений с одинаковыми значениями признаков. Чтобы можно было производить обработку по группам, файл должен быть отсортирован по группирующим переменным. Такой переменной может быть, например, переменная sex.

В этом случае все переменные со значением признака 1 (женский) образуют одну группу, а все переменные со значением признака 2 (мужской) — другую группу. С каждой группой можно проводить определенные операции, например, выполнять частотный анализ. При этом частотный анализ проводится раздельно для признаков мужской и женский. В SPSS такое разделение на группы можно выполнять автоматически. Рассмотрим следующий пример, основанный на опросе студентов об их психическом состоянии и социальном положении:

Проведем частотный анализ переменной psyche (психическое состояние) раздельно для всех изучаемых специальностей. В соответствии со значениями переменной fach (специальность) у нас образуются 9 групп (1 = Юриспруденция, 2 = Экономика, 3 = Гуманитарные науки, 4 = Психология и т.д.). В этом случае файл данных studium.sav должен быть сначала отсортирован по переменной fach. Поступите следующим образом:

Сводка и группировка данных

  • Загрузите файл studium.sav в редактор данных.
  • Выберите в меню команды Data (Данные) Split File. (Разделить файл) Откроется диалоговое окно Split File.

Рис. 7.7: Диалоговое окно Split File

По умолчанию разделение на группы не предполагается. Если выбрать пункт Organize output by groups (Разделить вывод на группы), мы получим вывод результатов по каждой группе отдельно. Эти группы должны быть определены в поле Groups based on (Группы, созданные на основе) на базе соответствующих переменных.

Еще одну возможность предоставляет опция Compare Groups (Сравнить группы). Она организует вывод таким образом, что можно визуально сравнить разные группы друг с другом. Но сначала мы рассмотрим раздельный вывод.

  • Выберите опцию Organize output by groups. Для раздельного выполнения операций по группам необходимо, чтобы файл данных был предварительно отсортирован по этим группирующим переменным. По этой причине опция Sort the file by grouping variables (Сортировать файл по группирующим переменным) выбрана по умолчанию.
  • Перенесите переменную fach в поле Groups based on. Если выбирается несколько группирующих переменных, то последовательность, в которой они стоят в списке, определяет порядок или приоритет сортировки.
  • Щелкните на кнопке ОК. Файл studium.sav будет отсортирован по переменной fach, то есть разбит на группы в соответствии с ее значениями. Сообщение File split on (Разделение файла включено) в строке состояния внизу окна SPSS информирует об активации режиме разделения.
  • Выполните частотный анализ переменной psyche.

Вы получите следующий результат (ниже для экономии места показаны частотные таблицы только для специальностей Юриспруденция и Естественные науки).

Группировка данных в статистике

Специальность = Юриспруденция

Статистика (а)

Источник: www.datuapstrade.lv

2. Группировка данных в пакете statistica

Группировка данных в пакете STATISTICA, построение рядов распределений, их визуализация с помощью средств пакета STATISTICA.

2.2. Краткие теоретические сведения.

Исследование массовых общественных явлений включает этапы сбора статистической информации и ее первичной обработки, сведения и группировки результатов наблюдения в определенные совокупности, обобщения и анализа полученных материалов.

Разбиение совокупности на группы, однородные по какому-либо признаку, называется группировкой. Признак, по которому происходит объединение отдельных единиц совокупности в однородные группы, называется группировочным признаком (он может быть как количественным, так и качественным). Количественные границы выделяемых групп очерчивает интервал, представляющий собой промежуток между максимальными и минимальными значениями признака в группе. Интервал – это значение варьирующего признака, лежащее в определенных границах.

Группировка, в которой для характеристики групп применяется численность группы, называется рядом распределения. Ряд распределения состоит из двух элементов: варианты – отдельного значения варьирующего признака, которое он принимает в ряду распределения, и частоты – численность отдельных вариант, т.е. частота повторения каждой варианты. Если частота выражена в долях единицы или в процентах к итогу (к общей сумме частот), то это – частость.

Читайте также:
Программа как замедлить музыку

Ряды распределения, построенные по качественным группировочным признакам, называются атрибутивными. Ряды распределения, построенные по количественным группировочным признакам, называются вариационными. Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному группировочному признаку. Интервальный вариационный ряд строится в случае непрерывной вариации группировочного признака у единиц совокупности (величина признака может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколь угодно малую величину).

Графическим изображением вариационного ряда при дискретной вариации признака является полигон распределения, при непрерывной вариации – гистограмма.

2.3. Способы группировки данных в пакете statistica

В пакете STATISTICA широкие возможности по проведению группировки, построению рядов распределения и их графиков предоставляют Frequency tables – Таблицы частот (рисунок 2.1) и Tables and banners -Таблицы и заголовки в меню Analysis-Анализ модуля Basic Statistics and Tables – Основные статистики и таблицы.

2.3.1. Построение таблицы частот (простая группировка данных)

Таблицы частот представляют собой простейший метод анализа, когда группировка данных и построение ряда распределения производится по одному группировочному признаку.

Открывшееся диалоговое окно (рисунок 2.2) содержит опции:

  • Переменные – выбор переменных для построения таблицы частот.
  • Таблицы частот – вычисление таблицы частот для каждой выбранной переменной.
  • Гистограммы – построение графиков гистограмм для каждой выбранной переменной с наложенной кривой нормального распределения.

Рисунок 2.1 – Выбор Frequencytables– Таблицы частот в меню Analysis–Анализ в модуле BasicStatisticsandTables– Основные статистики и таблицы

Рисунок 2.2 – Диалоговое окно меню Frequencytables– Таблицы частот Щелчок по кнопке Variables– Переменные открывает окно Selectthevariablesforanalysis– Выбрать переменные для анализа, где следует мышью указать на имя переменной и либо дважды щелкнуть по ней мышью, либо нажать на ОК. Для примера выберем переменную выберем переменную Age– Возраст из файла ex1.sta. Для группировки данных предназначен ряд опций под общим названием Categorizationmethodfortables Cumul.count– Накопленная частота; Percent– Частость;Cumul.percent– Накопленная частость Missing–дополнительная строка, отображающая количество пропущенных (отсутствующих) данных. На экране эта строка появляется, если включен режим MissingData(MD)Count– Считать пропущенные данные(см. рисунок 2.2). Рисунок 2.3 – Таблица частот (ряд распределения), полученная для переменной Age– Возраст с помощью опции Alldistinctvalues– Все различающиеся значения Выбрать показатели, которые пользователь хочет видеть на экране помимо частоты, можно с помощью группы опций под общим названием Displayoptions– Опции отображения (см. рисунок 2.2). Если убрать все галочки, то нажав на кнопку Frequencytables– Таблица частот,получим простую таблицу частот, имеющую лишь две графы: варианты и их частоты. Группировочный признак наряду с количественным значением может иметь качественное. Отметив галочкой withtextvalues– с текстовыми значениями, получим атрибутивный ряд распределения. Пример применения этой опции для построения ряда распределения переменной Football– Футбол приведен на рисунке 2.4. В противном случае качественные значения переменной будут отображены количественно (рисунок 2.5). Рисунок 2.4 – Таблица частот, полученная для переменной Football– Футбол с помощью опции Alldistinctvalues– Все различающиеся значения с включенной опцией withtextvalues– с текстовыми значениями
Рисунок 2.5 – Таблица частот, полученная для переменной Football– Футбол с помощью опции Alldistinctvalues– Все различающиеся значения с отключенной опцией withtextvalues– с текстовыми значениями 2) Опция No.ofexactintervals– Число равных интервалов позволяет получить ряд распределения с заданным количеством равных интервалов. Пример применения этой опции для построения ряда распределения переменной Age– Возраст приведен на рисунке 2.6.
Рисунок 2.6 – Таблица частот, полученная для переменной Age– Возраст с помощью опции No.ofexactintervals– Число равных интервалов. Число интервалов задано равным 6 3) Опция «Neat»intervalsapp.no. – Приближенное число интервалов позволяет получить наглядную частотную таблицу, в которой границы интервалов имеют «круглые» значения. Применив эту опцию для построения ряда распределения переменной Age– Возраст,получим легкую для чтения и наглядную группировку, приведенную на рисунке 2.7. При этом следует помнить, что выполненные с помощью данной опции группировки не всегда имеют заданное пользователем число интервалов. Рисунок 2.7 – Таблица частот, полученная для переменной Age– Возраст с помощью опции No.ofexactintervals– Число равных интервалов. Число интервалов задано равным 5 4) Опция Stepsize– Размер шага позволяет провести группировку иначе, изначально задав желаемую величину интервала и начало первого интервала, которое чаще всего является минимальным значением признака (отметить at minimum) или 0 – в окне startingat– начать с указать 0. Пользователь может назначить любую другую точку отсчета. Пример применения этой опции для построения ряда распределения переменной Age– Возраст приведен на рисунке 2.8. Рисунок 2.8 – Таблица частот (ряд распределения), полученная для переменной Age– Возраст с помощью опции Stepsize– Размер шага. Размер шага задан равным 4 5) Опции Integercategories– Целые категории строит таблицу частот только для целых значений наблюдений, все нецелые величины показателя будут проигнорированы. В программе предусмотрены и более сложные способы группировки данных, когда пользователь сам разбивает значения признаков на классы. Например, опция Userspecifiedcategories– Определенные пользователем категории открывает диалоговое окно, где пользователь сможет осуществить свой выбор. Графически таблицы частот представляются в пакете STATISTICA в виде гистограмм. Все настройки, произведенные для таблицы частот, действуют и в отношении гистограмм. На график переменной также накладывается гипотетическая кривая нормального распределения (отображается красным цветом).

Читайте также:
Основным способом ведения учета в программе 1с бухгалтерия 8 является

Источник: studfile.net

Сводка и группировка статистических данных

Чаще всего простые итоговые сводки не удовлетворяют исследователя, так как они дают слишком общие представления об изучаемом явлении. Поэтому статистический материал подвергается группировке.

Группировка — это метод, при котором вся исследуемая совокупность разделяется на группы по какому-то существенному признаку. Например, группировка предприятий по формам собственности или группировка населения по размеру среднедушевого дохода.

Группировка создаёт основу для последующей сводки и анализа данных.

Третий этап статистического исследования состоит в том, что с помощью обобщающих обобщающих статистических показателей: относительных и средних величин, показателей вариации и динамики, экономических индексов, а также с помощью табличного и графического методов осуществляется анализ полученных данных.

Группировка статистических данных

Группировка — это метод, при котором вся исследуемая совокупность разделяется на группы по какому-то существенному признаку.

Признак, по которому осуществляется группировка называется группировочным признаком или основанием группировки.

Группировка представляет собой способ подразделения рассматриваемой совокупности данных на однородные по изучаемым признакам группы. Это делается с целью изучения структуры этой совокупности либо взаимосвязей между отдельными элементами этой совокупности. С помощью группировки можно выявить влияние отдельных единиц на средние итоговые показатели. Так, например, группировка рабочих данной организации по уровню производительности труда используется с целью выявления влияния высокой производительности труда отдельных рабочих на среднюю производительность по организации и для определения резерва, кроющегося в повышении производительности труда всех рабочих до уровня передовых рабочих.

Как будет показано в статьях данного сайта, наибольшее распространение в экономическом анализе имеет группировка по факторам, связанным:

  • с трудовыми ресурсами, т.е. с живым трудом;
  • со средствами труда, т.е. с основными производственными фондами;
  • с предметами труда, т.е. с материальными ресурсами.

Эти три группы факторов оказывают влияние на объем продукции, выпускаемой данной организацией.

Виды группировок

Выбор группировочного признака зависит от цели данной группировки и предварительного экономического анализа явления.

В зависимости от степени сложности массового явления и задач анализа — группировки могут производится по одному или нескольким признакам:

  • Если производится группировка только по одному признаку, то она называется простой.
  • Если по двум и более признакам, то такая группировка называется сложной или комбинационной.

В зависимости от решаемых задач различают типологические, структурные и аналитические группировки:

  • Типологическая группировка — представляет собой разделение исследуемой совокупности на однородные группы. (группировка предприятий по формам собственности)
  • Структурная группировка — группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-то варьирующему признаку. (группировка населения по уровню дохода). Анализ статистических данных структурных группировок, взятых за ряд периодов показывает изменение структуры изучаемых явлений, то есть структурные сдвиги.
  • Аналитическая (факторная) группировка — позволяет выявить взаимосвязи между изучаемыми явлениями и их признаками. (группировка банков по сумме уставного капитала, величине активов и балансовой прибыли)
Читайте также:
Как работать с программой налогоплательщик юл инструкция для ИП

В процессе проведения экономического анализа, как правило, применяются два основных вида группировок: структурные и аналитические.

Структурные группировки используются с целью исследования состава и структуры совокупности данных, а также с целью изучения тех изменений в этой совокупности, которые имеют место в соответствии с выбранным изменяющимся признаком.

Аналитические же группировки используются для исследования взаимных связей, существующих между показателями, характеризующими рассматриваемую совокупность данных. В этих условиях один из показателей является обобщающим, результативным, а другие показатели рассматриваются как факторы, влияющие на обобщающий показатель.

Принципы построения группировок

1. Выбор группировочного признака

В зависимости от вида группировочных признаков различают группировки по количественным и качественным (атрибутивным) признакам.

2. Определение числа групп:

Если в основании группировки атрибутивный (качественный) признак, то количество групп равняется количеству значений этого признака

Если в основании группировки лежит количественный признак, то число групп определяют по формуле Стерджесса:

3. Выбор интервала группировки:

Интервал группировки — это значение варьирующего признака, лежащее в определенных пределах. Нижняя граница интервала — это значение наименьшего признака в интервале. Верхняя граница — это наибольшее значение в интервале.

Величина интервала — это разница между верхней и нижней границами.

Интервалы группировок могут быть равными и неравными.
Равные интервалы применяются в тех случаях, когда значение количественного признака внутри совокупности изменяется равномерно.

Величина равных интервалов определяется по формуле:

  • — величина интервала
  • — максимальное значение признака в совокупности
  • — минимальное значение признака в совокупности
  • — число групп
  • Если интервал имеет один знак ДО запятой, то полученное значение округляется до десятых (0,88 = 0,9; 8,715 = 8,7)
  • Если величина интервала имеет два знака ДО запятой, то полученное значение округляется до целых (11,11 = 11; 29,98 = 30)
  • Если интервал трех, четырех и более значимое число, то интервал принимают кратным 50 или 100

Интервалы бывают открытые и закрытые. Закрытым считается интервал, в котором есть и нижняя и верхняя границы, в противном случае интервал считается открытым. При решении задач неизвестную границу открытого интервала определяют по величине смежного с ним интервала.

Классификация

От группировок следует отличать классификацию. Классификация является основой группировок.

Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. Отличительной чертой классификации является то, что в основу ее кладется качественный признак.

Пример. Распределение предприятий по региона по величине розничного товарооборота в текущем году.

Если заранее не задано число групп , то для определения количества групп можно использовать формулу Стерджесса:

где — чило единиц совокупности.

Величину интервала определяют по следующей формуле:

Результаты представим в табличной форме.

Вторичная группировка

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

  • Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.
  • Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.

Пример. Имеется группировка сотрудников двух управлений одного из банков по размеру месячной заработной платы.

Размер заработной платы,

Источник: www.grandars.ru

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru