Está en la página 1de 15

Taller de Stata 16

Rincón de la Economı́a
Gianfranco David Chamorro Rodriguez
gianfranco.chamorror@gmail.com
Diciembre 2021

El presente documento es una guı́a para el Taller de Incursión a STATA 16


realizado en Diciembre del 2021. El orden y selección de temas viene dado
de manera que el estudiante inicie con el software reconociendo sus funcio-
nes, herramientas y capacidades básicas para el cumplimiento de trabajos e
informes.

1
1 INTRODUCCIÓN A STATA

1. Introducción a STATA
Stata es un software de Estadı́stica completo e integrado que provee todo
lo que necesita para el Análisis de Datos, Gestión de Datos y Gráficos. A
continuación

1.1. Entorno de STATA


Cuando iniciemos Stata podremos ver las siguientes ventanas:

Resultados: Observaremos los comandos ejecutados

Comando: Ingresamos los comandos a ejecutar.

Revisión : Observaremos los comandos ejecutados.

Variables: Observaremos las variables de nuestra base de datos.

Propiedades: Observaremos las propiedades de la variable.

Figura 1.1 Entorno de STATA

2
1.2 Barra de Herramientas 1 INTRODUCCIÓN A STATA

1.2. Barra de Herramientas


En la barra de herramientas podremos Abrir, guardar, editar y observar
una base de datos,asi como también abrir un archivo Do y una bitácora que
nos permitirá llevar un orden y registro del trabajo realizado.

Figura 1.2 Barra de Herramientas

1.3. Tipos de Archivo de STATA


El software trabaja y nos brinda como resultados los siguientes tipos de
archivos:

Archivo de Extensión .dta : Este tipo de archivo es para las bases


de datos que trabajaremos.

Archivo de Extensión .log o .smcl : Estos tipos de archivos son pro-


pios de la bitácora que generaremos donde se guardarán los resultados
de una forma ordenada.

Archivo de Extensión .do : Es el archivo que contiene los comandos


de ejecución.

Archivo de Extensión .gph : Es el tipo de archivo de los gráficos de


STATA.

3
1.4 Estructura de un Proyecto 2 GESTIÓN DE BASE DE DATOS

1.4. Estructura de un Proyecto


En el presente Taller se recomienda seguir la siguiente estructura para un
proyecto :

Figura 1.3 Estructura de un Proyecto

2. Gestión de Base de Datos


2.1. Iniciando un Dofile
Siguiendo la estructura Básica de un proyecto mencionado en el capı́tulo
anterior se propone el siguiente orden para un Do-File:

4
2.2 Revisando la Base de Datos 2 GESTIÓN DE BASE DE DATOS

Figura 2.1 Inicio de Do-File

El comando clear all nos permite limpiar la memoria.

El comando cd nos permite cambiar nuestra direccion de carpeta de


trabajo.

El comando log using nos permite crear una nueva bitácora con el
nombre .taller indicando la extensión .log y el comando replace nos
permitira replicar el Do-File en la misma carpeta.

De contar con una base de datos propia se utiliza el comando use, en


este ejemplo se utiliza el comando sysuse ya que utilizamos la base de
datos de STATA.

El comando log close nos permite cerrar la bitácora.

2.2. Revisando la Base de Datos


Lo recomendable una vez ingresada una Base de Datos se recomienda
verificar sus caracterı́sticas para poder planificar el trabajo a realizar. En el
presente ejercicio utilizaremos la BD auto.dta .

Para describir la base de datos que estamos trabajando haremos uso


del comando describe que tambien se puede ejecutar como d.

5
2.2 Revisando la Base de Datos 2 GESTIÓN DE BASE DE DATOS

Figura 2.2 Comando describe


Para inspeccionar las variables hacemos uso del comando inspect y
para generar un diccionario de variables con el comando codebook.
Para fines del presente manual ingresaremos una variable luego de los
comandos sin embargo el comando solo ejecuta todas las variables.

Figura 2.3 Comando inspect

6
2.3 Generando Variables 2 GESTIÓN DE BASE DE DATOS

Figura 2.4 Comando codebook


Para realizar un resumen estadı́stico de las variables de nuestra BD utiliza-
remos el comando summarize.

Figura 2.5 Comando summarize

2.3. Generando Variables


Existen dos comandos, generate y egen que nos permiten crear nuevas
variables en STATA , la primera de ella nos permite crear variables usando
relaciones lógicas y matemáticas y la segunda nos permite crear variables de
una forma mas compleja es decir generando medias, desviación estándar, etc.

Figura 2.6 Comando generate


Haremos uso del comando list para verificar las variables creadas y las
variables bases, cabe resaltar que se podrı́a observar la base de datos completa

7
3 ANÁLISIS DE DATOS

con el comando browse pero con el fin de utilizar mas comandos se realiza
de esta manera.

Figura 2.7 Comando list


Haremos uso del comando egen para crear las variables , summarize para
verificar la información.

Figura 2.8 Comando egen

3. Análisis de Datos
3.1. Análisis Descriptivo
El análisis descriptivo,aunque suene redundante, consiste en describir las
tendencias claves en los datos existentes y observar las situaciones que con-
duzcan a nuevos hechos. Este método se basa en una o varias preguntas de
investigación y no tiene una hipótesis. Además, incluye la recopilación de

8
3.2 Summarize 3 ANÁLISIS DE DATOS

datos relacionados, posteriormente, los organiza, tabula y describe el resul-


tado. El software nos permitirá responder estas preguntas organizandolas ,
tabulandolas y graficandolas para una mejor comprensión y transmisión de
la información.

3.2. Summarize
El comando summarize nos brindará un resumen estadı́stico básico don-
de observaremos el número de observaciones , el promedio, la desviación
estándar, el valor mı́nimo y máximo de las variables que hemos indicado o
de la base en general.

Figura 3.1 Comando summarize

3.3. Tablas y Tabulaciones


Las herramientas que nos brinda STATA para poder presentar nuestra
información de una manera ordenada y siguiendo ciertas condiciones.

3.3.1. Table
El comando table nos permite crear tablas de una , dos y hasta tres
variables , tambien nos permite mostrar la frecuencia a nivel horizontal o
vertical.

9
3.3 Tablas y Tabulaciones 3 ANÁLISIS DE DATOS

Figura
3.2 Comando table

3.3.2. Tabulate
El comando tabulate muestra una tabla la cual senala una lista de los
distintos valores que tiene una variable con su frecuencia absoluta, porcentual
y acumulada.

10
3.3 Tablas y Tabulaciones 3 ANÁLISIS DE DATOS

Figura 3.3 Comando tabulate

11
4 GRÁFICOS

3.3.3. Tabstat
Un resumen estadı́stico mas detallado y que nos permite una mejor per-
sonalización a diferencia de summarize es el comando tabstat

Figura 3.4 Comando tabstats

4. Gráficos
4.1. Tipos de Gráficos
STATA nos brinda una amplia gama de gráficos que nos permitirán des-
cribir la distribución o tendencia de nuestros datos según su naturaleza. Re-
visaremos los mas importantes y la sintaxis para personalizarlos.La Perso-
nalización de todos los gráficos se realizó durante el taller

12
4.1 Tipos de Gráficos 4 GRÁFICOS

4.1.1. Histograma
Un gráfico de Histograma es una representación gráfica de una variable
en forma de barras, donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados. En stata nos ayudará el comando
histogram.

Figura 4.1 Comando histogram

4.1.2. Gráfico de Pie


Un gráfico de Pastel es aquel que se utiliza para representar porcenta-
jes y proporciones. Es un recurso muy utilizado que nos permite transmitir
información de forma gráfica muy sencilla.

Figura 4.2 Gráfico de Pastel simple

13
4.1 Tipos de Gráficos 4 GRÁFICOS

4.1.3. Gráfico de Barras


Un gráfico de barras es una forma de resumir un conjunto de datos por
categorı́as.Haremos uso del comando graph bar donde especificaremos las
variables a observar y tambien el estadı́stico.

Figura 4.3 Gráfico de Barras

4.1.4. Diagrama de Caja y Bigote


Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una
presentación visual que describe varias caracterı́sticas importantes, al mismo
tiempo, tales como la dispersión y simetrı́a. Utilizaremos el comando graph
box

Figura 4.4 Gráfico de Barras acumulado

14
4.1 Tipos de Gráficos 4 GRÁFICOS

4.1.5. Diagrama de Dispersión


Un diagrama de dispersión o gráfica de dispersión o gráfico de burbujas
grafico de bolas es un tipo de diagrama matemático que utiliza las coordena-
das cartesianas para mostrar los valores de dos variables para un conjunto de
datos. Nos permite tener una idea gráfica de la relación entre dos variables.
Utilizaremos el comando graph twoway scatter.

Figura 4.5 Gráfico de Dispersión

15

También podría gustarte