Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diplomado - Sesión 2.1 - Pruebas de Hipótesis I
Diplomado - Sesión 2.1 - Pruebas de Hipótesis I
Pruebas de hipótesis I
µ=3
0 +0.81
¿Prueba paramétrica o no-paramétrica?
Pruebas No
Ordinal
Paramétricas
Escala de
medición
Intervalo/
Razón
No Pruebas No
¿Distribución Paramétricas
Normal?
Sí
Pruebas No
No Paramétricas
¿Varianzas
iguales?
Sí Pruebas
Paramétricas
Pruebas de hipótesis
Paramétricas vs No paramétricas
José Alfredo Zavala Loayza
Pruebas paramétricas
• Están basadas en la distribución de un parámetro (promedio,
probabilidad).
• Requieren supuestos específicos sobre la distribución de la variable
dentro de la población.
• Tiene mayor poder estadístico.
• Otros requisitos:
• Escala de medición al menos de intervalo.
• Homocedasticidad.
Pruebas no-paramétricas
• No requiere de información sobre la distribución de la población
(ranks).
• No requiere de supuestos sobre la distribución de la variable dentro
de la población.
• Tiene menor poder estadístico.
• A diferencia de las pruebas paramétricas:
• Escala de medición al menos ordinal.
• Homocedasticidad.
Prueba paramétrica
µ=3
0 +0.81
Prueba no-paramétrica (1)
• Datos: 15.5, 14.5, 16.0, 15.7 V. obs. |V. teórico Rank Signo Rank +
– V. obs.| Signo
• H0: Mediana = 15 15.5 0.5 1.5 + +1.5
14.5 0.5 1.5 - -1.5
15.7 0.7 3 + +3
16.0 1.0 4 + +4
Prueba no-paramétrica (2)
• H0: Mediana = 15
Mediana = 15
• P ( 3(+) y 1(-) | H0: Mediana = 15)
• ⇒ Z = ∑(SRi)/ √∑(SRi2)
= 7/√29.5
= 1.29
3+, 1-
• ⇒ Valor-p = P(Z > |1.29|)
= 0.197 -1.29 0 +1.29
Pruebas de hipótesis
para una muestra
José Alfredo Zavala Loayza
Prueba de hipótesis: una muestra
• En ocasiones deseamos evaluar si un valor teórico es verdadero.
• La edad promedio en población Peruana es 28 años.
• El 30% de la población infantil tiene sobrepeso/obesidad.
• La mitad de las familias rurales tienen 3 hijos o más.
µ=3
0 +0.81
Prueba de hipótesis: t-student
• Supuestos:
• La muestra es seleccionada aleatoriamente.
• Las observaciones son independientes.
• La variable dependiente es numérica.
• La distribución de la variable dependiente es normal.
• La escala de medición de la variable dependiente es al menos de
intervalo.
Prueba Wilcoxon
• H0: Mediana = 15
Mediana = 15
• P ( 3(+) y 1(-) | H0: Mediana = 15)
• ⇒ Z = ∑(SRi)/ √∑(SRi2)
= 7/√29.5
= 1.29
3+, 1-
• ⇒ Valor-p = P(Z > |1.29|)
= 0.197 -1.29 0 +1.29
Prueba de hipótesis: Wilcoxon
• Supuestos:
• La muestra es seleccionada aleatoriamente.
• Las observaciones son independientes.
• La variable dependiente es numérica.
• La escala de medición de la variable dependiente es al menos ordinal.
Bondad de ajuste (Escenario)
• Debido al calor de este verano, ha decidido crear una empresa de
helados. Para optimizar su producción, busca información sobre qué
sabores producir en mayor cantidad. Usted recibe esta información
sobre preferencias de sabor de helados:
• Maracuyá: 80%
• Chicha morada: 12%
• Piña: 1%
• Fresa: 3%
• Otros sabores: 4%
Valores Observados vs. Esperados (1)
• La distribución chi2 es la más apropiada para el análisis de datos
categóricos.
• Se comparan las frecuencias observadas y esperadas dentro de las
variables de estudio.
• Los valores esperados son aquellos que esperaríamos observar si la
Ho es verdadera.
Valores Observados vs. Esperados (2)
Bondad de ajuste (Pregunta)
• ¿Las frecuencias de las preferencias de sabor de helados observadas
son consistentes con la información disponible?
Chicha Otros
Maracuyá morada Piña Fresa sabores
Observado 1920 347 19 84 130
Chicha Otros
Maracuyá morada Piña Fresa sabores
Proporción 80% 12% 1% 3% 4%
Bondad de ajuste (Hipótesis)
• Ho: Las frecuencias observadas de las preferencias de sabor de
helado SON IGUALES a las del reporte obtenido.
• Ha: Las frecuencias observadas de las preferencias de sabor de helado
SON DIFERENTES a las del reporte obtenido.
V. Esperados si H0 es cierta
• 2500 x 80% = 2000
• 2500 x 12% = 300
• 2500 x 1% = 25
• 2500 x 3% = 75
• 2500 x 4% = 100
Año pasado Chicha Otros
Maracuyá morada Piña Fresa sabores
Proporción 80% 12% 1% 3% 4%
Esperado 2000 300 25 75 100
Bondad de ajuste (Cálculo)
µt - µnt = 0
-2.7 0 +2.7
Prueba de hipótesis: t-student
• Supuestos:
• Las muestras son seleccionadas aleatoriamente.
• Las observaciones son independientes.
• La variable dependiente es numérica.
• La distribución de la variable dependiente en cada muestra es normal.
• La escala de medición de la variable dependiente es al menos de
intervalo.
Pruebas de hipótesis: Mann-Withney
• Hipótesis nula (H0): En la población general, la mediana de glicemia
en ayunas en varones es igual a la mediana de glicemia en ayunas en
mujeres.
• Valores esperados:
Chicha Otros
Sabores Maracuyá morada Piña Fresa sabores
Niños 22.9 22.9 11.2 17.8 10.2
Adultos 22.1 22.1 10.8 17.2 9.8
Prueba de hipótesis: Chi-cuadrado.
• Supuestos:
• Las muestras son seleccionadas aleatoriamente.
• Las observaciones son independientes.
• La variable dependiente es categórica.
• Al menos el 80% de las celdas tienen valor esperado ≥ 5.
Pruebas de hipótesis:
Muestras pareadas
José Alfredo Zavala Loayza
Prueba de hipótesis: muestras pareadas
• En ocasiones los observaciones no son independientes.
• Medición de la presión arterial antes y después de recibir tratamiento.
• Estudios de casos-controles en los cuales los controles son seleccionados por
cada caso.