Está en la página 1de 16

Introducción a Stata

Luján Puchot 1

30 de agosto del 2023

1
Ante cualquier duda, inconveniente o sugerencia, pueden escribirme a
lujanpuchot1@gmail.com
Temas que vamos a abordar

¿Qué es Stata?

Instalación de Stata

Editor de texto

Comandos útiles
¿Qué es Stata?

Stata es un software estadı́stico pago muy utilizado en la


investigación y en el análisis de datos utilizado para gestionar,
analizar y visualizar información.
¡Tiene muchı́simo uso en Economı́a aplicada!
Instalación de Stata 15

• Se puede acceder al programa en formato .zip haciendo click


acá
• Se debe extraer la carpeta correspondientemente en el
directorio del usuario. Este punto es importante, porque
podrı́a suscitar inconvenientes en la utilización del programa.
Recursos útiles

• Es importante tener en consideración que, en aquella carpeta


que utilizaron para bajar el programa, hay diversas bases de
datos para utilizar durante la cursada, algunas de ellas
utilizadas en el libro de Wooldridge, J. M. (2015).
¿Dónde trabajar?

• Do File (’Archivo .do’): Un archivo ”do file.es un archivo de


texto en el que se puede escribir y almacenar comandos de
Stata para realizar tareas especı́ficas. Los archivos ”do
file”tienen la extensión ”.do”.
• Archivo de Código Formato Stata (’archivo.dta’):e s un
archivo que contiene comandos de Stata organizados en un
formato especı́fico. Estos archivos tienen la extensión ”.dta”.

Comúnmente, vamos a trabajar con archivos do.


Comandos útiles

• Para borrar todo lo que se hizo anteriormente

clear all

• Para correr más rápido el código

s e t more o f f
Comandos útiles
• Importar base de datos desde Excel:

import e x c e l para comenzar . xlsx , f i r s t r o w case


( lower )

Donde para comenzar.xlsx es el nombre del archivo. Luego, se


hacen las aclaraciones de que la primera fila refiere al nombre de las
variables que se deben poner en minúscula. En este caso, se tuvo
que haber declarado el directorio previamente de la siguiente forma:
cd ”C : \ u s e r s \ yo \ . . . ”

Otra manera de importar desde Excel es:


import e x c e l ” r u t a \ f i l e . x l s x ” , s h e e t (”
nombre hoja ”) f i r s t r o w
Comandos útiles

Es pertinente mencionar que hay que tener cautela respecto a


cómo se expresan los decimales. Si esto es incorrecto, es posible
cambiarlo mediante la barra de opciones. Especı́ficamente, con ’set
dp’.
• Para observar la base de datos

browse

br

• Proporcionar información descriptiva acerca de las variables en


un conjunto de datos
describe mivariable

Al utilizar este comando, se obtiene información acerca de las


variables en términos de su tipo de dato, valor mı́nimo y máximo,
media, desviación estándar y valores faltantes.
• El comando ’summarize’ o ’summ’ es similar al comando
anterior en tanto proporciona información descriptiva sobre las
variables en un conjunto de datos. Sin embargo, a diferencia
del comando describe, el comando summarize proporciona un
resumen más detallado de las estadı́sticas de resumen para
cada variable, incluyendo la media, mediana, desviación
estándar, valores mı́nimos y máximos, ası́ como el número de
observaciones no faltantes.
summarize m i v a r i a b l e

Es posible tener una descripción más detallada agregando ’, detail’.


• Tabla de frecuencia:

tabulate mivariable

Se produce una tabla de frecuencia o una tabla de contingencia


para una o más variables categóricas en un conjunto de datos.
Muestra la distribución de frecuencias de una o más variables
categóricas, indicando el número y porcentaje de observaciones en
cada categorı́a.
• Mostrar estadı́sticas descriptivas (media, desviación estándar,
mediana, mı́nimo, máximo, entre otros) para una o más
variables numéricas:
t a b s t a t e s t c i v i l , s t a t i s t i c s ( mean median
sd c o u n t ) by ( s e x o )

En este caso, se ven ver dichas caracterı́sticas teniendo en cuenta


otra variable, sexo.
• Tablas de contingencia y de resumen para variables en un
conjunto de datos:
t a b l e c a t e d u c , c o n t e n t s ( mean s a l a r i o s d
salario )

El comando table muestra la frecuencia de ocurrencia de las


combinaciones de valores de dos o más variables categóricas.
Muestra algo del tipo:
Imagen: Salida del comando ’table’. Media del salario en función de la
categorı́a educacional en la que se encuentran los individuos.
Frame Title

¡Muchas gracias!

También podría gustarte