Está en la página 1de 2

Taller de Stata – Neuroscience 1.

I. MUESTRA ALEATORIA CON ESTRUCTURA

El objetivo del ejercicio es automatizar la elección de una muestra aleatoria estratificada y el reporte
de un cuadro de estadísticos sobre la representatividad de la muestra. Utilice la base de datos
2_empresas.dta que contiene el directorio de empresas que conforman el marco muestral. Para
desarrollar el ejercicio se sugieren los siguientes pasos:

Paso 1: Crear variables

1. Cargue 2_empresas.dta y cree las siguientes variables, en una línea por variable:

Nombre Contenido
grupo Identificador de estrato. Igual al primer
dígito del código de actividad económica.
meses Meses de antigüedad de la empresa. Por
ejemplo, la antigüedad de una empresa que
inició actividades en agosto (mes 8) del 2012
sería 53 meses.
sociedad 1 si la organización jurídica de la empresa es
sociedad anónima, sociedad anónima
cerrada o sociedad comercial; 0 de lo
contrario.
agrupada 1 si la empresa fue parte de un grupo
económico el 2016; 0 de lo contrario
trabajan Número de trabajadores y prestadores de
servicio de la empresa
crecimiento Tasa de crecimiento anual de las ventas
netas. Por ejemplo, crecimiento = 5 significa
que las ventas netas crecieron en 5% anual,
en promedio, entre el 2014 y el 2016.
potencial Estimación de las ventas netas del 2016 si se
hubiera usado el 100% de la capacidad
instalada. Asuma que no hay rendimientos
decrecientes (aplique regla de tres simple).
distrito 1 si la empresa está ubicada en Miraflores,
San Isidro o Santiago de Surco; 0 de lo
contrario.

2. Cree un global que guarde los nombres de las variables creadas, excepto la variable grupo.
Mantenga la variable de identificación y las variables que creó. Guarde en base0.dta
Paso 2: Elegir una muestra aleatoria

1. Cree las siguientes variables. Pueden crearse en una línea, excepto orden y pesos

Nombre Contenido
aleatorio Números aleatorios bajo la distribución de
probabilidad de su preferencia
orden Para cada subpoblación definida por grupo,
contiene números correlativos ascendentes
empezando por la observación con menor
valor aleatorio a la observación con mayor
valor aleatorio dentro de cada
subpoblación. El conteo vuelve a 1 para
cada subpoblación.
nmuestra Guarda el tamaño de muestra de cada
estrato. La variable grupo contiene el
identificador de estrato. El tamaño de
muestra es 16, 20 y 24 para los grupos 1, 2
y 3 respectivamente.
muestra 1 si la observación pertenece a la muestra; 0
de lo contrario. Una empresa pertenece a la
muestra si el valor en orden es menor o igual
al tamaño de muestra de su estrato.
npoblacion Para cada grupo, guarda el número de
empresas que pertenecen al grupo.
pesos Inversa de la probabilidad de elección. Trate
a los no elegidos como si fueran otra
muestra. Por ejemplo, si se elige una
muestra de 20 empresas de una población
de 80 empresas, el peso es 80/20 para las 20
empresas elegidas y 80/60 para las 60
empresas no elegidas.

2. Además de las variables del paso1 mantenga muestra y pesos. Guarde en base1.dta

Paso 3: Interruptor para prueba de hipótesis con una variable

1. Cargue base1.dta. Cree un escalar denominado sirve que tome el valor de 1.


2. Calcule una hipótesis de diferencia de medias de los meses de antigüedad de la empresa entre las
empresas elegidas en la muestra y las empresas no elegidas.
3. Guarde en un escalar el p-value de la prueba de hipótesis. Revise los valores guardados. Recuerde
que para una H0 de dos colas:
y̅ − 𝜇𝑦,0
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 2 × Φ (− | 𝑐𝑎𝑙 |)
𝜎y̅
Donde Φ(.) representa la distribución normal estándar acumulada. Vea el help de la función normal().
𝑦̅̅𝑐𝑎𝑙𝑐 es el valor observado de la diferencia de medias. 𝜎𝑦̅̅ es el error estándar observado. 𝜇𝑦̅,0 es el
valor del parámetro asumido como cierto en la hipótesis nula.