Está en la página 1de 58

Métodos Estadísticos

para Investigaciones
Sociales
Pruebas de Hipótesis
Conceptos Básicos
Prueba de Hipótesis de una Muestra
Prueba de Hipótesis de dos Muestras
Conceptos Básicos
Conceptos Básicos
Conceptos
Hipótesis
Es una afirmación o declaración sobre una propiedad de una población.

Prueba de hipótesis
Es un procedimiento para probar una hipótesis sobre una propiedad de una
población.

Ejemplos de hipótesis:
 El gasto per cápita promedio de los hogares en Lima Metropolitana es menor
de 725 soles.
 La proporción de consumidores que realizan compras por internet es mayor
que 0.3.
Conceptos Básicos
Prueba de Hipótesis
En cualquier problema de prueba de hipótesis hay dos hipótesis contradictorias en
consideración.

Hipótesis nula (denotada por H0)


 Es la pretensión que inicialmente se supone verdadera (la pretensión de
“creencia previa”).
 La palabra nula significa “sin ningún valor, efecto o consecuencia”, lo que
sugiere que H0 debería ser identificada con la hipótesis de ningún cambio (de la
opinión actual), ninguna diferencia, o ninguna mejora.

Hipótesis alternativa (denotada por Ha)


 Es la aseveración contradictoria de H0.
 Es la pretensión que al investigador en realidad le gustaría validar, por lo que
también es conocida como la “hipótesis del investigador”.
Conceptos Básicos
Prueba de Hipótesis
Ejemplo 1
Hipótesis nula
H0: µ >= 725
El gasto per cápita promedio de los hogares en Lima Metropolitana es de 725 soles o más.
Hipótesis alternativa
Ha: µ < 725
El gasto per cápita promedio de los hogares en Lima Metropolitana es menor de 725 soles..

Ejemplo 2
Hipótesis nula
H0: p <= 0.3
La proporción de consumidores que realizan compras por internet es menor o igual a 0.3.
Hipótesis alternativa
Ha: p > 0.3
La proporción de consumidores que realizan compras por internet es mayor que 0.3.
Conceptos Básicos
Objetivo de la Prueba de Hipótesis
Decidir, con base en información muestral, si la hipótesis nula debe ser
rechazada.

 La hipótesis nula será rechazada en favor de la hipótesis alternativa sólo si la


evidencia muestral sugiere que H0 es falsa.
 Si la muestra no contradice fuertemente a H0 se continuará creyendo en la
factibilidad de la hipótesis nula.

Por lo tanto, las dos posibles conclusiones derivadas de un análisis de prueba de


hipótesis son:
 Rechazar H0 o
 No rechazar H0.
Conceptos Básicos
Objetivo de la Prueba de Hipótesis
Ejemplo: Posibles conclusiones derivadas de un análisis de prueba de hipótesis

Ejemplo 1
Se rechaza H0: µ >= 725
Hay evidencia suficiente para justificar el rechazo de la afirmación de que el gasto per
cápita promedio de los hogares en Lima Metropolitana es de 725 soles o más.

Ejemplo 2
No se rechaza H0: p <= 0.3
No hay evidencia suficiente para justificar el rechazo de la afirmación de que la
proporción de consumidores que realizan compras por internet es menor o igual a 0.3.
Conceptos Básicos
Nivel de significancia α
 El nivel de significancia α para una prueba de hipótesis es el valor de
probabilidad utilizado como punto de corte para determinar cuándo la evidencia
muestral es suficientemente significativa contra la hipótesis nula.
 Por su naturaleza, el nivel de significancia α es la probabilidad de rechazar
erróneamente la hipótesis nula cuando es verdadera:

Nivel de significancia α = P(rechazar H0 cuando es verdadera)


Conceptos Básicos
Errores Tipo I y Tipo II
Cuando se prueba una hipótesis nula, llegamos a la conclusión de rechazarla o no
rechazarla. Nuestras conclusiones a veces son correctas y en ocasiones son
incorrectas (incluso si aplicamos todos los procedimientos de manera adecuada).

Error tipo I
El error de rechazar la hipótesis nula cuando en realidad es verdadera.
El símbolo α (alfa) se usa para representar la probabilidad de un error tipo I.
α = P(error tipo I) = P(rechazar H0 cuando H0 es verdadera)

Error tipo II
El error de no rechazar la hipótesis nula cuando en realidad es falsa.
El símbolo β (beta) se usa para representar la probabilidad de un error tipo II.
β = P(error tipo II) = P(no rechazar H0 cuando H0 es falsa)
Conceptos Básicos
Errores Tipo I y Tipo II
 La dificultad con la utilización de un procedimiento basado en datos muestrales
es que, debido a la variabilidad del muestreo, el resultado podría ser una
muestra no representativa.
 Un buen procedimiento es aquel en que la probabilidad de cometer un error
tipo I es pequeña y la probabilidad de cometer un error tipo II es pequeña.

Estado de la naturaleza verdadero


La hipótesis nula es La hipótesis nula
verdadera es falsa
Error tipo I:
Rechazar una H0
Rechazar H0 Decisión correcta
verdadera.
P (error tipo I) = α
Conclusión
preliminar Error tipo II:
No se puede No se rechaza una
Decisión correcta
rechazar H0 H0 falsa.
P (error tipo II) = β
Conceptos Básicos
Estadístico de Prueba
Un estadístico de prueba es una función de los datos de la muestra utilizada como
base para decidir si H0 debe ser rechazada.

En una prueba de hipótesis se llega a una


conclusión seleccionando un número α, llamado
nivel de significancia de la prueba, que está
razonablemente cercano a 0. Entonces:
 Si el estadístico de prueba está en la región
crítica, se rechazará H0 en favor de Ha.
 Si el dato estadístico de prueba no está en la
región crítica, no se rechazará H0.

En la práctica, los niveles de significancia


utilizados con más frecuencia son (en orden) α
= 0.05, 0.01.
Conceptos Básicos
Región crítica (o región de rechazo)
Es el área correspondiente a todos los valores del
estadístico de prueba que conducen al rechazo de
la hipótesis nula.
Dependiendo de la afirmación que esté siendo
probada, la región crítica podría estar en las dos
colas extremas, en la cola izquierda o en la cola
derecha.
Conceptos Básicos
Valor P
El valor P es la probabilidad, calculada al suponer que la hipótesis nula es verdadera,
de obtener un valor del estadístico de prueba al menos tan contradictorio a H0 como el
valor calculado de los datos de la muestra disponible.

Entonces:
 El valor P es una probabilidad.
 Esta probabilidad se calcula suponiendo que la hipótesis nula es verdadera.
 Para determinar el valor P primero se debe decidir qué valores del estadístico de
prueba son al menos tan contradictorios a H0 como el valor obtenido de nuestra
muestra.
 Mientras más pequeño sea el valor P, más fuerte es la evidencia contra H0 y a favor
de Ha.

El valor P no es la probabilidad de que la hipótesis nula sea verdadera o falsa, ni la


probabilidad de que se llegue a una conclusión errónea.
Conceptos Básicos
Valor P
Un valor p muy bajo significa que, si nuestra hipótesis nula sobre la población
fuera cierta, entonces habría sido muy poco probable obtener el estadístico de
muestra que obtuvimos. Pero dado que obtuvimos ese estadístico de muestra,
concluimos que nuestra hipótesis nula sobre la población probablemente sea
incorrecta.

En una prueba de hipótesis se llega a una conclusión


seleccionando un número α, llamado nivel de
significancia de la prueba, que está razonablemente
cercano a 0. Entonces:
 Si el valor P <= α se rechazará H0 en favor de Ha
 Si el valor P > α, H0 no se rechazará.

En la práctica, los niveles de significancia utilizados con


más frecuencia son (en orden) α = 0.05, 0.01.
Conceptos Básicos
Distribución Normal
La distribución normal es la más importante en la estadística.

Se dice que una variable aleatoria continua X tiene una distribución normal con parámetros µ
y σ, si la función de densidad de probabilidad de X es:

Propiedades
 Es simétrica respecto a µ y acampanada, de
modo que el centro de la campana es tanto
la media de la distribución como la mediana.
 La media µ es un parámetro de ubicación, ya
que al cambiar su valor desplaza la curva de
densidad hacia uno u otro lado.
 σ es un parámetro de escala porque al
cambiar su valor estira o comprime la curva
horizontal sin cambiar la forma básica.
Conceptos Básicos
Distribución Normal Estándar z
La distribución normal estándar es una distribución normal específica.

Propiedades
 La gráfica de la distribución normal estándar tiene forma de campana.
 µ = 0: La distribución normal estándar tiene una media igual a 0.
 σ = 1: La distribución normal estándar tiene una desviación estándar igual a 1.
Conceptos Básicos
Distribución t de Student
Si una población tiene una distribución normal, entonces la distribución de
𝑥−µ
𝑡= 𝑠
𝑛
es una distribución t de Student para todas las muestras de tamaño n.

Propiedades
 La distribución t de Student es diferente para distintos tamaños de muestra.
 La distribución t de Student tiene la misma forma general de campana que la
distribución normal estándar; su forma más amplia refleja la mayor variabilidad que
se espera cuando se usa s para estimar σ.
 La distribución t de Student tiene una media de t = 0.
 La desviación estándar de la distribución t de Student varía con el tamaño de la
muestra y es mayor que 1.
 A medida que el tamaño de muestra n aumenta, la distribución t de Student se
acerca más a la distribución normal estándar.
Procedimiento para las
Pruebas de Hipótesis
Procedimiento para las Pruebas de
Hipótesis
Procedimiento para las Pruebas de Hipótesis
Paso 1. Identifique la afirmación (hipótesis)
 Identifique la afirmación que será probada y exprésela en forma simbólica.

Paso 2. Proporcione la forma simbólica


 Proporcione la forma simbólica que debe ser verdadera cuando la afirmación
original sea falsa.

Paso 3. Identifique las hipótesis nula y alternativa


Considere las dos expresiones simbólicas obtenidas hasta ahora:
 La hipótesis nula H0 es la expresión simbólica de que el parámetro es igual al
valor fijo bajo consideración (contiene la igualdad).
 La hipótesis alternativa Ha es la que NO contiene la igualdad, por lo que Ha
usa el símbolo >, < o ≠.
Procedimiento para las Pruebas de
Hipótesis
Procedimiento para las Pruebas de Hipótesis
Paso 4. Seleccione el nivel de significancia
 Seleccione el nivel de significancia α en función de la gravedad de un error de
tipo I. Haga α pequeño si las consecuencias de rechazar una H0 verdadera son
severas.
 Son muy comunes los valores de 0.05 y 0.01.

Paso 5. Encuentre el valor P (método del valor P)


 Encuentre el valor P.

Paso 6. Tome una decisión


 Rechace H0 si el valor P <= α.
 No rechace H0 si el valor P > α.
Procedimiento para las Pruebas de
Hipótesis
Procedimiento para las Pruebas de Hipótesis
Paso 7. Exprese de nuevo la decisión en términos no técnicos
 Exprese de nuevo la decisión previa en términos simples, no técnicos y en
relación con la afirmación original.

Notas
 Se recomienda decir que “no se rechaza la hipótesis nula” en vez de decir que
“se acepta la hipótesis nula”.
 El término aceptar es engañoso, porque implica incorrectamente que la
hipótesis nula ha sido probada, pero nunca podemos probar una hipótesis nula.
 La frase “no se rechaza” dice más correctamente que la evidencia disponible
no es suficientemente fuerte como para justificar el rechazo de la hipótesis
nula.
Pruebas de Hipótesis de una
Muestra
Pruebas de Hipótesis de una Muestra
Prueba sobre la Proporción Poblacional
Notación
• n tamaño de muestra o número de ensayos
• x número de éxitos
• 𝑝 𝑥 𝑛 (proporción muestral)
• p proporción poblacional (p es el valor usado en el enunciado de la
hipótesis nula)
• q 1-p
Pruebas de Hipótesis de una Muestra
Prueba sobre la Proporción Poblacional
Requisitos
1. Las observaciones muestrales son una muestra aleatoria simple.
2. Se satisfacen las condiciones para una distribución binomial:
a) Hay un número fijo de ensayos.
b) Los ensayos son independientes.
c) Cada ensayo tiene dos categorías: “éxito” y “fracaso”.
d) La probabilidad de éxito es la misma en todos los ensayos.
3. Se satisfacen las condiciones np ≥ 5 y nq ≥ 5. Note que p se usa aquí como la
proporción supuesta utilizada en la afirmación, no como la proporción muestral
𝑝.
Pruebas de Hipótesis de una Muestra
Prueba sobre la Proporción Poblacional
Estadístico de prueba

𝑝−𝑝
𝑧=
𝑝𝑞
𝑛
Pruebas de Hipótesis de una Muestra
Prueba sobre la Proporción Poblacional (EJEMPLO)
Afirmación
La mayoría de la población de 6 a 17 años de edad hace uso de internet.

Base de datos
Encuesta ENAHO, segundo trimestre 2020, módulo 300 Educación.
Pregunta 314a: En el mes anterior, ¿Ud. hizo uso del servicio de internet?

use “enaho01a_2020_300.dta", clear


keep if p204 == 1 & codinfor != "00" & (p208a >= 6 & p208a <= 17)

* recodificación de pregunta original a códigos 1 y 0


label define dummy 1 "Si" 0 "No"
gen usoint=(p314a==1)
label var usoint "Uso del servicio de internet"
label value usoint dummy

tabulate usoint
Pruebas de Hipótesis de una Muestra
Prueba sobre la Proporción Poblacional (EJEMPLO)
Verificación de requisitos
1. Las 7038 personas de 6 a 17 años se seleccionan al azar.

2. Hay un número fijo (7038) de casos independientes con dos categorías (la persona usa el
servicio de internet o no usa el servicio de internet).

3. Sobre las proporciones, obtenemos


np = (7038)(0.5) = 3519 > 5
nq = (7038)(0.5) = 3519 > 5

Se satisfacen los tres requisitos


Pruebas de Hipótesis de una Muestra
Prueba sobre la Proporción Poblacional (EJEMPLO)
Procedimiento

Paso 1
p > 0.5

Paso 2
p ≤ 0.5

Paso 3
H0: p = 0.5
Ha: p > 0.5

Paso 4
α = 0.05
Pruebas de Hipótesis de una Muestra
Prueba sobre la Proporción Poblacional (EJEMPLO)
Procedimiento

Paso 5
* prueba de hipótesis de una proporción
prtest usoint = 0.5, level(95)

Valor P
Pruebas de Hipótesis de una Muestra
Prueba sobre la Proporción Poblacional (EJEMPLO)
Procedimiento

Paso 6
Debido a que el valor P de 0.0000 es menor o igual que el nivel de significancia α = 0.05,
rechazamos la hipótesis nula.

Paso 7
Concluimos que hay suficiente evidencia muestral para respaldar el argumento de que la mayoría de
la población de 6 a 17 años de edad hace uso de internet.
Pruebas de Hipótesis de una Muestra
Prueba sobre la Media Poblacional (varianza desconocida)
Cuando σ no se conoce, lo estimamos con la desviación estándar muestral s.

Notación
• n tamaño de muestra
• 𝑥 media muestral
• s desviación estándar muestral
• µ media poblacional (este valor se toma de la afirmación y se usa en el
enunciado de la hipótesis nula H0)
Pruebas de Hipótesis de una Muestra
Prueba sobre la Media Poblacional (varianza desconocida)
Requisitos
1. La muestra es una muestra aleatoria simple.
2. Se cumple al menos una de las siguientes condiciones: la población se
distribuye normalmente o n > 30.

Estadístico de prueba

𝑥 − µ𝑥
𝑡= 𝑠
𝑛
Pruebas de Hipótesis de una Muestra
Prueba sobre la Media Poblacional (EJEMPLO)
Afirmación
La población de 14 a más años de edad trabajan menos de 30 horas a la semana en promedio, en
su ocupación principal.

Base de datos
Encuesta ENAHO, segundo trimestre 2020, módulo 500 Empleo.
Pregunta p513t: ¿Cuántas horas trabajó la semana pasada, en su ocupación principal, total?

use “enaho01a_2020_500x.dta", clear


keep if p204 == 1 & codinfor != "00" & (p208a >= 14) & (p501 == 1 | p502 == 1 |
p503 == 1 ///
| (p5041 == 1 | p5042 == 1 | p5043 == 1 | p5044 == 1 | p5045 == 1 | p5046 == 1
///
| p5047 == 1 | p5048 == 1 | p5049 == 1 | p50410 == 1 | p50411 == 1)) & p513t > 0

tabstat p513t, stats(mean median min max n)


Pruebas de Hipótesis de una Muestra
Prueba sobre la Media Poblacional (EJEMPLO)
Verificación de requisitos
1. La muestra es una muestra aleatoria simple.

2. El tamaño de la muestra es n =10656 > 30.

Se satisfacen los dos requisitos

1.00
Gráfico de probabilidad normal
El gráfico de probabilidad normal compara la distribución

0.75
empírica de la muestra de datos, con la teórica distribución
Normal F[(p513t-m)/s]

normal.

0.50
Si la distribución de la variable es normal, los puntos quedarán
cerca de una línea recta.

0.25
* determinación si la muestra proviene de una
distribución normal 0.00

pnorm p513t
0.00 0.25 0.50 0.75 1.00
Empirical P[i] = i/(N+1)
Pruebas de Hipótesis de una Muestra
Prueba sobre la Media Poblacional (EJEMPLO)
Procedimiento

Paso 1
µ < 30

Paso 2
µ >= 30

Paso 3
H0: µ = 30
Ha: µ < 30

Paso 4
α = 0.05
Pruebas de Hipótesis de una Muestra
Prueba sobre la Media Poblacional (EJEMPLO)
Procedimiento

Paso 5
* prueba de hipótesis de una media
ttest p513t = 30, level(95)

Valor P
Pruebas de Hipótesis de una Muestra
Prueba sobre la Media Poblacional (EJEMPLO)
Procedimiento

Paso 6
Debido a que el valor P de 0.0953 es mayor que el nivel de significancia α = 0.05, no rechazamos la
hipótesis nula.

Paso 7
Concluimos que no hay evidencia suficiente para respaldar la afirmación de que la población de 14 a
más años de edad trabajan menos de 30 horas a la semana en promedio, en su ocupación principal.
Pruebas de Hipótesis de dos
Muestras
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Proporciones
Notación
• pi proporción de la población i (i=1,2)
• ni tamaño de la muestra i
• xi número de éxitos en la muestra i
𝑥𝑖
• 𝑝𝑖 = proporción de la muestra i
𝑛𝑖
• 𝑞𝑖 = 1 - 𝑝𝑖 complemento de 𝑝𝑖

Proporción muestral agrupada


Combina las dos proporciones muestrales en una proporción.

𝑥1 + 𝑥2
𝑝= 𝑞 =1− 𝑝
𝑛1 + 𝑛2
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Proporciones
Requisitos
• Las proporciones muestrales son de dos muestras aleatorias simples.
• Las dos muestras son independientes. (Las muestras serán independientes si
los valores muestrales seleccionados de una población no están relacionados o
de alguna forma naturalmente pareados con los valores muestrales de la otra
población).
• Para cada una de las dos muestras, hay al menos 5 éxitos y al menos 5
fracasos. (Es decir, n𝑝 ≥ 5 y n𝑞 ≥ 5 para cada una de las dos muestras).

Estadístico de prueba

(𝑝1 −𝑝2 ) − (𝑝1 − 𝑝2 )


𝑧=
𝑝𝑞 𝑝𝑞
+
𝑛1 𝑛2
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Proporciones (EJEMPLO)
Afirmación
El uso de internet es igual en los grupos de edad de 6 a 11 años y de 12 a 17 años.

Base de datos
Encuesta ENAHO, segundo trimestre 2020, módulo 300 Educación.
Pregunta 314a: En el mes anterior, ¿Ud. hizo uso del servicio de internet?

use “enaho01a_2020_300.dta", clear


keep if p204 == 1 & codinfor != "00" & (p208a >= 6 & p208a <= 17)

* recodificación de pregunta original a códigos 1 y 0


label define dummy 1 "Si" 0 "No"
gen usoint=(p314a==1)
label var usoint "Uso del servicio de internet"
label value usoint dummy

tabulate usoint
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Proporciones (EJEMPLO)
Base de datos

* variable de grupos de edad


label define grupo 1 "6 a 11 años" 2 "12 a 17 años"
gen gedad=(p208a <= 11)
replace gedad=2 if (gedad == 0)
label var gedad "Grupo de edad"
label value gedad grupo

tabulate gedad usoint


Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Proporciones (EJEMPLO)
Verificación de requisitos
1. Las dos muestras son muestras aleatorias simples.

2. Las dos muestras son independientes porque las personas en las muestras no están
relacionados o emparejados de ninguna manera.

3. Sobre el número de éxitos y fracasos, tenemos:


Consideremos un “éxito” como una persona que hace uso del servicio de internet, y un “fracaso”
como una persona que no hace uso del servicio de internet

Grupo de edad de 6 a 11 años


n1 𝑝1 = 1589 > 5
n1 𝑞1 = 1755 > 5

Grupo de edad de 12 a 17 años


n2 𝑝2 = 2608 > 5
n2 𝑞2 = 1086 > 5

Se satisfacen los tres requisitos


Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Proporciones (EJEMPLO)
Procedimiento

Paso 1
p1 = p2
El subíndice 1 corresponde al grupo de edad de 6 a 11 años; y el subíndice 2 corresponde al grupo
de edad de 12 a 17 años.

Paso 2
p1 ≠ p2

Paso 3
H0: p1 = p2
Ha: p1 ≠ p2

Paso 4
α = 0.05
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Proporciones (EJEMPLO)
Procedimiento

Paso 5
* prueba de hipótesis sobre dos proporciones
prtest usoint, by(gedad) level(95)

Valor P
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Proporciones (EJEMPLO)
Procedimiento

Paso 6
Debido a que el valor P de 0.0000 es menor o igual que el nivel de significancia α = 0.05,
rechazamos la hipótesis nula.

Paso 7
Concluimos que hay evidencia suficiente para justificar el rechazo de la afirmación de que el uso de
internet es igual en los grupos de edad de 6 a 11 años y de 12 a 17 años.
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Medias (muestras independientes)
Notación
• µi media de la población i (i=1,2)
• σi desviación estándar de la población i
• ni tamaño de la muestra i
• 𝑥𝑖 media de la muestra i
• si desviación estándar de la muestra i

Notas
 Si las dos muestras tienen diferentes tamaños de muestra sin datos faltantes,
deben ser independientes.
 Si las dos muestras tienen el mismo tamaño de muestra, las muestras pueden
ser independientes o no.
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Medias (muestras independientes)
Requisitos
1. Los valores de σ1 y σ2 son desconocidos y no suponemos que sean iguales.
2. Las dos muestras son independientes.
3. Ambas muestras son muestras aleatorias simples.
4. Se cumple al menos una de las siguientes condiciones:
a) Los dos tamaños de muestra son grandes (con n1 > 30 y n2 > 30) o
b) Ambas muestras provienen de poblaciones que tienen distribuciones normales.

Notas
 Los métodos utilizados son robustos contra las desviaciones de la normalidad,
por lo que para muestras pequeñas el requisito de normalidad es flexible en el
sentido de que los procedimientos funcionan bien siempre que no haya valores
atípicos y las desviaciones de la normalidad no sean demasiado extremas.
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Medias (muestras independientes)
Estadístico de prueba

(𝑥1 − 𝑥2 ) − (µ1 − µ2 )
𝑡=
𝑠12 𝑠22
+
𝑛1 𝑛2
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Medias (EJEMPLO)
Afirmación
Las personas de 14 a 24 años y de 25 a 44 años de edad trabajan las mismas horas a la semana en
promedio, en su ocupación principal.

Base de datos
Encuesta ENAHO, segundo trimestre 2020, módulo 500 Empleo.
Pregunta p513t: ¿Cuántas horas trabajó la semana pasada, en su ocupación principal, total?

use “enaho01a_2020_500x.dta", clear


keep if p204 == 1 & codinfor != "00" & (p208a >= 14 & p208a <= 44) & (p501
== 1 | p502 == 1 | p503 == 1 ///
| (p5041 == 1 | p5042 == 1 | p5043 == 1 | p5044 == 1 | p5045 == 1 | p5046
== 1 ///
| p5047 == 1 | p5048 == 1 | p5049 == 1 | p50410 == 1 | p50411 == 1)) &
p513t > 0
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Medias (EJEMPLO)
Base de datos

* variable de grupos de edad


label define grupo 1 "14 a 24 años" 2 "25 a 44 años"
gen gedad=(p208a <= 24)
replace gedad=2 if (gedad == 0)
label var gedad "Grupo de edad"
label value gedad grupo

tabstat p513t, stats(mean median min max n) by (gedad)


Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Medias (EJEMPLO)
Verificación de requisitos
1. No se conocen los valores de las desviaciones estándar poblacionales y no
suponemos que sean iguales.
2. Las dos muestras son independientes porque las personas de 14 a 24 años y las
personas de 25 a 44 años no están relacionados o emparejados de ninguna
manera.
3. Las muestras son aleatorias simples.
4. Los tamaño de las muestras son:
Personas de 14 a 24 años, n1 = 2064 > 30.
Personas de 25 a 44 años, n2 = 3993 > 30.

Se satisfacen los cuatro requisitos


Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Medias (EJEMPLO)
Procedimiento

Paso 1
µ1 = µ2

Paso 2
µ1 ≠ µ2

Paso 3
H0: µ1 = µ2
Ha: µ1 ≠ µ2

Paso 4
α = 0.05
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Medias (EJEMPLO)
Procedimiento

Paso 5
* prueba de hipótesis sobre dos medias
ttest p513t, by(gedad) unequal level(95)

Valor P
Pruebas de Hipótesis de dos Muestras
Prueba sobre dos Medias (EJEMPLO)
Procedimiento

Paso 6
Debido a que el valor P de 0.0000 es menor que el nivel de significancia α = 0.05, rechazamos la
hipótesis nula.

Paso 7
Concluimos que hay evidencia suficiente para justificar el rechazo de la afirmación de que las
personas de 14 a 24 años y de 25 a 44 años de edad trabajan las mismas horas a la semana en
promedio, en su ocupación principal.
COMUNICACIÓN PERMANENTE CON LA ESCUELA

Correo de la Escuela del INEI


enei@inei.gob.pe

Área de Campus Virtual


Campus.virtual@inei.gob.pe

Para poder atenderte mejor puedes contactarnos al 433-3127 anexo 102-103 o


escribirnos a: enei@inei.gob.pe

Pasaje Hernán Velarde 285 Lima (Altura cuadra 1 y 2 de la Av Arequipa)

También podría gustarte