Как работать в программе stata

Содержание

S t a t a Stata S t a t a Давайте поговорим о его преимуществах. По сравнению с другими серьезными языками программирования, где у Stata есть преимущества:

  • Короткий и мощный
  • Очень быстрая скорость расчета
  • Отличная функция рисования
  • Поразительная скорость обновлений и развития
  • Обработка и анализ данных для научных исследований

Исследователи не нуждаются в крупномасштабной структуре проекта, но нуждаются в таком виде скриптового, динамического программного обеспечения, которое позволяет легко получать результаты, поэтому Stata относительно популярна в области научных исследований.

2. Сетевые ресурсы

  • Официальный сайт Stata: http://www.stata.com/links/
  • Интерактивные учебные материалы, предоставленные UCLA (Калифорнийский университет в Лос-Анджелесе): http://stats.idre.ucla.edu/stata/
  • Экономический форум Народного Конгресса
  • Baidu

Два, основная операция Stata

1. Журнал операции

Зачем мне журнал? Фактически, ведение журнала является хорошей рабочей привычкой и может записывать рабочий процесс.

Видео-уроки Stata #1. Регрессия

  • log using + Путь к хранилищу / имя журнала.log : Это нормально не писать, журнал будет храниться по пути по умолчанию;
  • log using + Путь к хранилищу / имя журнала. Журнал, добавить : Откройте файл журнала, а затем сделайте запись в исходном файле журнала;
  • log using + Путь к хранилищу / имя журнала.log, заменить : Откройте файл журнала и перезапишите исходный файл журнала.
  • log off : Запись файла журнала приостановлена;
  • log on : Пауза записи файла журнала заканчивается, и запись продолжается;
  • log close : Запись файла журнала заканчивается, и результат записи сохраняется автоматически.

2. Операции с документами

По сравнению с написанием команд непосредственно для запуска, запись в документе легче сохранить. Это еще одна сильная рекомендация. Напишите команду в редакторе do-файла и оставьте четкую пометку.

  • doedit :включить d o do d o Редактор документов
  • doedit mylog.do : Открыть существующий d o do d o Документ можно указать полный путь.

3. Манипулирование данными

После импорта данных:

  • edit : Редактировать данные, нельзя изменять данные
  • browse : Просматривать данные, изменять данные нельзя
  • format price wei len mpg %6.3f : Определить формат отображения переменной
  • br, nolabel : Сокращение от просмотра

4. Путь к файлу и настройки

  • pwd : Показать текущий рабочий путь
  • cd «/Users/dell» : Войти в папку, путь к содержимому определяется самостоятельно
  • dir : Файл по текущему пути
  • ls : Отобразить содержимое каталога, эквивалентное dir
  • sysdir : Путь к системному файлу
  • help : Следуйте команде, чтобы просмотреть файл справки внутренних команд Stata, очень мощный
  • search : Возьмите любое предложение и найдите соответствующую информацию
  • findit : Поиск внешних команд, затем вы можете скачать их вручную
  • clear : Очистка памяти
  • ssc install cmdname : Установить новые команды
  • findit dynamic cmdname : Поиск по ключевым словам, загрузка внешних команд

ssc install fsum // загрузить fsum

Три основных команды Stata

1. Три типа команд управления

Вы можете увидеть, что это за операторы:

Работа в STATA: базовые команды


оператор помощи // оператор

Оператор отношения: ==; >; =;
sysuse auto, clear // Использовать включенный файл данных sysuse — Использовать отправленный набор данных (автомобильные данные 1978 года) описать // Посмотрите значение каждой переменной в импортированном файле данных

прейскурантная цена // Список всех значений переменной цены

Операторы отношения часто и if Подключитесь, чтобы использовать:

прейскурантная цена if foreign == 0 // Перечислить значение цены с внешним значением 0 в записи, которая является внутренней
sum price if foreign! = 1 // Описательная статистика по цене foreign! = 1 в записи

Логические операторы: (and) ; | —>(or)

sysuse auto, clear sum price weight if (foreign==1 =3)

sum price wei if (rep78==1) | (rep78==5) | (foreign !=0)

sum price wei if (rep78>2 5) | (price>10000)

Читайте также:
Какие вредоносные программы могут работать под управлением удаленного компьютера

Арифметический оператор: + — * / ^ (Мощность)

display 5 ^ 2 // Мощность dis 1 — 3*2 + 4/5 — 9^3 dis 2*_pi

  • Упражнение
    а. Предоставьте описательные статистические данные о цене, весе и длине автомобилей отечественного производства, которые ремонтировались менее трех раз в 1978 году:

    б. Вычислите квадрат [(70 + 12), умноженный на 5, деленный на 3].

2. Импортировать данные

1. Импортируйте данные Excel.

Вы можете скопировать и вставить напрямую; или в строке меню, file-import ; Или команду:

import excel «path», sheet («. «) firstrow sysuse auto, clear // Загрузить файл данных, который поставляется со Stata

Вы также можете использовать do file для ввода данных:

идентификатор ввода женская раса ses str3 schtype prog чтение запись математика наука socst // после ввода следует имя переменной 147 1 1 3 pub 1 47 62 53 53 61 // Конкретное значение переменной 108 0 1 2 pub 2 34 33 41 36 36 18 0 3 2 pub 3 50 33 49 44 36 153 0 1 2 pub 3 39 31 40 39 51 50 0 2 2 pub 2 50 59 42 53 61 51 1 2 1 pub 2 42 36 42 31 39 102 0 1 1 pub 1 52 41 51 53 56 57 1 1 2 pub 1 71 65 72 66 56 160 1 1 2 pub 1 55 65 55 50 61 136 0 1 2 pub 1 65 59 70 63 51 end сохранить «упражнения.dta»

2. Откройте предыдущие данные dta.

Вы можете использовать меню или команду:

use «упражнения.dta» // после использования указывается путь к хранилищу данных

3. Добавление данных

А. Горизонтальное добавление слияния

По горизонтали в паспортеДобавить еще одну табличную переменную。

clear input id female race ses str3 schtype // после ввода следует имя переменной 147 1 1 3 pub // Конкретное значение переменной 108 0 1 2 pub 18 0 3 2 pub 153 0 1 2 pub 50 0 2 2 pub 51 1 2 1 pub 102 0 1 1 pub 57 1 1 2 pub 160 1 1 2 pub 136 0 1 2 pub end сохранить «Exercise 1.dta»

clear идентификатор ввода женский прогр чтение запись математика наука socst // после ввода следует имя переменной 147 1 1 47 62 53 53 61 // Конкретное значение переменной 108 0 2 34 33 41 36 36 18 0 3 50 33 49 44 36 153 0 3 39 31 40 39 51 50 0 2 50 59 42 53 61 51 1 2 42 36 42 31 39 102 0 1 52 41 51 53 56 57 1 1 71 65 72 66 56 160 1 1 55 65 55 50 61 136 0 1 65 59 70 63 51 end save «Exercise 2.dta» // Изменить путь

Теперь, когда у нас есть две таблицы, как их объединить?

use «Exercise 1.dta» // Используемая основная таблица объединить 1: 1 id с помощью «Exercise 2.dta» // Горизонтальное добавление // Использование идентификатора переменной для слияния // Идентификатор основной таблицы и вторичной таблицы 1: 1

б. Вертикальное добавление

clear идентификатор ввода женская раса ses str3 schtype prog чтение запись математика наука socst // после ввода следует имя переменной 147 1 1 3 pub 1 47 62 53 53 61 // Конкретное значение переменной 108 0 1 2 pub 2 34 33 41 36 36 18 0 3 2 pub 3 50 33 49 44 36 153 0 1 2 pub 3 39 31 40 39 51 50 0 2 2 pub 2 50 59 42 53 61 end сохранить «Exercise 3.dta» // Изменить путь clear идентификатор ввода женская раса ses str3 schtype prog чтение запись математика наука socst // после ввода следует имя переменной 51 1 2 1 pub 2 42 36 42 31 39 102 0 1 1 pub 1 52 41 51 53 56 57 1 1 2 pub 1 71 65 72 66 56 160 1 1 2 pub 1 55 65 55 50 61 136 0 1 2 pub 1 65 59 70 63 51 end save «Exercise 4.dta» // Изменить путь

используйте «Exercise 3.dta» добавить, используя «Exercise 4.dta» // Данные объединены ниже

Четыре, анализ данных

1. Основные команды

  • sysuse auto, clear : Импортировать файл данных, поставляемый со Stata.
  • describe : Опишите источник данных и размер данных
  • list : По очереди перечислить значения наблюдаемых переменных
    list price foreign in 1/20, sepby(foreign) : Перечислите первые 20 значений переменных цены и иностранных
  • lookfor «Repair» : Поиск переменных, содержащих определенные ключевые слова
  • sum //summarize : Описание базовой статистики
  • codebook : Опишите подробности данных
  • compress : Формат хранения автоматически сжатых данных.
  • count if price > 10000 : count
  • sort price : Сортировать по цене в порядке возрастания
  • gsort price : Сортировать по цене в порядке возрастания
  • gsort -price : Сортировка в порядке убывания по цене (gsort может использовать «+» для сортировки в порядке возрастания переменной и «-» для сортировки в порядке убывания переменной)
  • bysort foreign: sum price wei len : Групповая статистика

  • tabulate foreign : Занесен в таблицу с указанием частоты
  • tabulate foreign rep78 : Двумерный список частот (обратите внимание, что всего 69, потому что есть некоторые пропущенные значения)

  • tabulate foreign rep78, sum(price) mean
  • tabstat price wei len mpg turn foreign, s(mean sd p50 min max) :Compact table of summary statistics
  • rename weight wei : Переименовать одну переменную
  • rename (length gear_ratio) (len gr) : Пакетное переименование
  • drop turn gr make : Удалить переменные, можно удалить несколько
  • drop if rep78==. : Используется с реляционными операциями для удаления этих отсутствующих значений

  • replace price==15000 if price>15000 : Заменить, использовать с реляционными операциями, заменить те, у которых значение цены больше 15000, как цена
Читайте также:
Программа как сделать свой фильм на компьютере

2. Создайте переменные

  • gen weight2=weight^2 : Создать новую переменную weight2 , Значение weight в квадрате
    -
  • egen zprice = std(price)
    egen rpice = mean(price), by(foreign) : Группировать по внешним и генерировать новые переменные
    egen mprice = median(price), by(foreign) : Группировать по внешним и генерировать новые переменные

    egen — это расширение gen,Не беспокойтесь о конкретной разнице. Короче говоря, обычно используют gen для генерации переменных, еслиХотите использовать некоторые специальные функции для генерации некоторых переменных, Просто используйте egen.

На самом деле это просто, gen newvar = exp Указывает, что новая переменная, сгенерированная gen, должна быть получена операцией выражения, egen newvar = fcn(arguments) , Это означает, что новая переменная, сгенерированная egen, должна быть получена операцией функции.

3. Преобразуйте строку в символьную переменную.

  • describe make

найти make Это строковая переменная, преобразуйте ее в символьную переменную:

  • encode make, gen(cenmake) : Строковая переменная становится числовой переменной
  • tostring price, gen(price_1) : Числовые переменные возвращаются к строковой форме
  • destring price_1, replace : Строковая форма возвращается к числовой форме

4. Создайте фиктивные переменные.

sysuse nlsw88.dta, clear gen ln_wage=ln(wage) gen dum_black=(race==2) gen tenure_bl = tenure*dummy_black

5. Работа с этикеткой

1. Переименовать ярлык

  • label var ln_wage «In(wage)»
  • label var dum_black «1=blak;0=otherwise»
  • label var tenure_bl «tenure*dum_black»

После изменения метки используйте describe Когда, вы увидите описание новой переменной.

2. Добавьте таблицу соответствия номер-текст

label define hard_work 1 «часов> отраслевое медианное значение» 0 в противном случае » label list hard_work // Отображение соответствия числа-текста конкретной переменной labelbook // Отображаем соответствие числа-текста всех переменных

6. Матрица коэффициентов корреляции

sysuse auto, clear pwcorr price weight length length mpg // Получить матрицу коэффициентов корреляции этих переменных, официальная команда

график матрица цена вес длина миль на галлон // график матрицы коэффициентов корреляции (диаграмма разброса)

7. Гистограмма и график функции плотности.

  • histogram price : Гистограмма.
    — histogram price, frequency : Частотный график

 — kdensity price : Карта ядерной плотности
 — scatter price weight : Нарисовать точечную диаграмму

  • двухсторонний (вес разброса) (вес цены лфита), заголовок («график разброса и график линейной аппроксимации»)

Интеллектуальная рекомендация

cf 1092d2 мышление + стек

Заглавие: n столбцов из вертикально расположенных кирпичей, высота каждого столбца ai, существует бесчисленное множество кирпичей 2 * 1, которые можно разместить горизонтально только на двух соседних .

ПУТИ

Команда Python Daemon, почему это взломано? Целые трояны используют это!

Почему команда Python Daemon должна быть взломана? Весь троян используется. Yingqi. Python полный стек инженер Подумайте об использовании Python, чтобы сделать целое, троянское программное обеспечение.

Когда Mac Brew, я застрял в решении Brew Update

Не говоря уже о том, что варево переключается на источник или что -то в этом роде, он слишком бросает. Правильный метод состоит в том, что когда обновляющий варево . Control+C возвращается, чтобы ос.

Использование регулярных выражений BeautifulSoup в Python Crawler

В BeautifulSoup вы можете найти имя и атрибут по имени и атрибутам, чтобы найти конкретный html-код. Что еще похвально, attrs поддерживает регулярные выражения. Такие как: Для поиска этой строки вы мо.

Источник: russianblogs.com

Семинар 1. Введение в Stata

Stata – наиболее часто используемый прикладными экономистами пакет. При решении задач на семинарах Вам придется часто использовать Stata для получения ответов. На первом занятии мы познакомимся с пакетом, а на последующих занятиях в тексте заданий будут присутствовать инструкции там, где потребуются знания по Stata, выходящие за пределы данного занятия.

Управление данными

Обычно данные подготавливаются в пакете Excel, а затем уже попадают в статистические пакеты, так как Excel удобен для манипуляций с данными, но не содержит продвинутых возможностей анализа данных.

Формат исходных данных

идентификационный номер фильма

Читайте также:
Программы архиваторы это драйверы

является ли фильм сиквелом (1) или нет (0)

метод производства (анимация, игра актеров и т.п.)

рейтинг Американской ассоциации кинопроизводителей, указывающий на возрастные ограничения к просмотру фильма

производственный бюджет, скорректированный на инфляцию ($ 2011 года)

кассовые сборы внутри США, скорректированные на инфляцию ($ 2011 года)

номинальные кассовые сборы внутри США, нескорректированные на инфляцию

количество кинотеатров, в которых фильм показывался в первый уик-энд проката

количество фильмов-конкурентов, вышедших за 14 дней до или после релиза фильма

количество фильмов-конкурентов, вышедших за 7 дней до или после релиза фильма

суммарный бюджет фильмов-конкурентов, вышедших за 14 дней до или после релиза фильма

суммарный бюджет фильмов-конкурентов, вышедших за 7 дней до или после релиза фильма

Импорт данных в пакет Stata

Импортируем данные в пакет Stata из Excel. Для этого лучше всего сохранить файл в формате «Текстовый файл с разделителями табуляциями»). Затем в Stata выбираем File-Import-ASCII data created by a spreadsheet и указываем путь к файлу movies2000-2011.txt. Обратите внимание, что в связи с особенностями Stata в имени пути не должно быть буквы «я».

Далее обычно можно оставить настройки по умолчанию (Stata сама определит тип разделителя и тип данных для каждой переменной):

  • В окне результатов появилась команда вида:

insheet using «путь к текстовому файлу с данными»

  • Мы могли выполнить импорт введя эту команду в командную строку, но импорт файла обычно проще выполнить через кнопочный интерфейс.
  • В левом верхнем углу сохраняются введенные команды так, чтобы их в любой момент можно было повторно ввести или скопировать куда-либо. Желательно сохранять все использованные Вами команды с комментариями, чтобы потом Ваш анализ легко было воспроизвести Вам самим или другим людям.
  • В левом нижнем углу выводится список переменных в нашем наборе данных. Это названия переменных, которые были в верхней строке Excel-файла.

Для того чтобы увидеть данные подобно тому, как мы видели их в Excel, нужно зайти в меню Data – Data Editor – Data Editor (edit):

Числовые значения отображаются черным цветом, а переменные строкового типа – красным.

Источник: studfile.net

Работа в статистическом пакете Stata

Статистический пакет Stata 12 — это многофункциональное программное обеспечение для анализа данных и выполнения статистических расчетов.

Включение надстроек в Excel

Рис. 1.1. Включение надстроек в Excel

Включение анализа данных в Excel

Рис. 1.2. Включение анализа данных в Excel

Преимущества Stata следующие.

  • 1. Простота и легкость в использовании.
  • 2. Большое количество встроенных по умолчанию статистических моделей и функций.
  • 3. Возможность программирования в среде статистического пакета Stata и создания пользовательских функций.
  • 4. Возможность подключения дополнительных пользовательских пакетов из Интернета.
  • 5. Кросс-платформенность. Существуют версии Stata для Windows, Mac и Unix/Linux.
  • 6. Полный и подробный раздел справки, который содержит как информацию о синтаксисе и семантике программного языка, так и полную справку о применяемых статистических моделях с примерами.

Недостатки пакета Stata следующие.

  • 1. Платное распространение. Чтобы пользоваться этим пакетом, необходимо купить дорогостоящую лицензию.
  • 2. Не совсем удобный для начинающих программный язык Mata, но которому существует не столь много учебников.
  • 3. Трудности при импорте наборов данных, особенно в форматах других статистических пакетов.
  • 4. Меньшее количество (но сравнению с R) встроенных функций, не являющихся статистическими.
  • 5. Сильное отличие скриптового языка от существующих языков программирования. Некоторые часто используемые в программировании конструкции (циклы с произвольными итераторами, регулярные выражения POSIX или Perl и т.н.) в пакете Stata еще не реализованы.

Существует несколько изданий статистического пакета Stata 12 (МР, SE, 1C, small)’, различие заключается в поддержке нескольких процессоров или в ограничениях на объем используемой базы данных. Для выполнения нижеприведенных заданий подойдет любое издание Stata 12. Стоит отдельно сказать про предыдущие версии: в версиях Stata наблюдается хорошая преемственность, поэтому особых различий между семантикой и синтаксисом программного языка в разных версиях нет [1] .

Вначале рассмотрим, как выглядит рабочее окно программы Stata 12.

В верхней строке находится меню (выпадающие списки), которое позволяет получить доступ к запрашиваемым функциям статистического пакета Stata без применения командной строки, через графическое меню, что зачастую более оптимально для начинающего пользователя (рис. 1.3). Опытные же пользователи предпочитают писать команды, нежели использовать ручную навигацию по меню.

Строка меню в Stata

Рис. 13. Строка меню в Stata

  • [1] На момент выхода учебника выпущена Stata 14. Кардинальных отличий от Stata 12,за исключением поддержки Unicode, в ней не наблюдается.

Источник: studme.org

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru