Está en la página 1de 45

DIPLOMADO EN INVESTIGACIÓN CLÍNICA

Pruebas de hipótesis I

José Alfredo Zavala, MD, MSc(c)


2019
Prueba de hipótesis: Una media

µ=3

0 +0.81
¿Prueba paramétrica o no-paramétrica?
Pruebas No
Ordinal
Paramétricas
Escala de
medición
Intervalo/
Razón

No Pruebas No
¿Distribución Paramétricas
Normal?

Pruebas No
No Paramétricas
¿Varianzas
iguales?
Sí Pruebas
Paramétricas
Pruebas de hipótesis
Paramétricas vs No paramétricas
José Alfredo Zavala Loayza
Pruebas paramétricas
• Están basadas en la distribución de un parámetro (promedio,
probabilidad).
• Requieren supuestos específicos sobre la distribución de la variable
dentro de la población.
• Tiene mayor poder estadístico.
• Otros requisitos:
• Escala de medición al menos de intervalo.
• Homocedasticidad.
Pruebas no-paramétricas
• No requiere de información sobre la distribución de la población
(ranks).
• No requiere de supuestos sobre la distribución de la variable dentro
de la población.
• Tiene menor poder estadístico.
• A diferencia de las pruebas paramétricas:
• Escala de medición al menos ordinal.
• Homocedasticidad.
Prueba paramétrica

µ=3

0 +0.81
Prueba no-paramétrica (1)
• Datos: 15.5, 14.5, 16.0, 15.7 V. obs. |V. teórico Rank Signo Rank +
– V. obs.| Signo
• H0: Mediana = 15 15.5 0.5 1.5 + +1.5
14.5 0.5 1.5 - -1.5
15.7 0.7 3 + +3
16.0 1.0 4 + +4
Prueba no-paramétrica (2)
• H0: Mediana = 15
Mediana = 15
• P ( 3(+) y 1(-) | H0: Mediana = 15)
• ⇒ Z = ∑(SRi)/ √∑(SRi2)
= 7/√29.5
= 1.29
3+, 1-
• ⇒ Valor-p = P(Z > |1.29|)
= 0.197 -1.29 0 +1.29
Pruebas de hipótesis
para una muestra
José Alfredo Zavala Loayza
Prueba de hipótesis: una muestra
• En ocasiones deseamos evaluar si un valor teórico es verdadero.
• La edad promedio en población Peruana es 28 años.
• El 30% de la población infantil tiene sobrepeso/obesidad.
• La mitad de las familias rurales tienen 3 hijos o más.

• Los estudios descriptivos realizan estimaciones de los valores


poblaciones (considerando un margen de error), pero no evalúan si
las estimaciones coinciden con valores teóricos.
Pruebas de hipótesis: una muestra
Tipo de la variable Numérica Categórica
dependiente

Observaciones Independientes Independientes

Pruebas paramétricas t-student

Pruebas no- Bondad de


Wilcoxon
paramétricas ajuste
Prueba t-student

µ=3

0 +0.81
Prueba de hipótesis: t-student
• Supuestos:
• La muestra es seleccionada aleatoriamente.
• Las observaciones son independientes.
• La variable dependiente es numérica.
• La distribución de la variable dependiente es normal.
• La escala de medición de la variable dependiente es al menos de
intervalo.
Prueba Wilcoxon
• H0: Mediana = 15
Mediana = 15
• P ( 3(+) y 1(-) | H0: Mediana = 15)
• ⇒ Z = ∑(SRi)/ √∑(SRi2)
= 7/√29.5
= 1.29
3+, 1-
• ⇒ Valor-p = P(Z > |1.29|)
= 0.197 -1.29 0 +1.29
Prueba de hipótesis: Wilcoxon
• Supuestos:
• La muestra es seleccionada aleatoriamente.
• Las observaciones son independientes.
• La variable dependiente es numérica.
• La escala de medición de la variable dependiente es al menos ordinal.
Bondad de ajuste (Escenario)
• Debido al calor de este verano, ha decidido crear una empresa de
helados. Para optimizar su producción, busca información sobre qué
sabores producir en mayor cantidad. Usted recibe esta información
sobre preferencias de sabor de helados:
• Maracuyá: 80%
• Chicha morada: 12%
• Piña: 1%
• Fresa: 3%
• Otros sabores: 4%
Valores Observados vs. Esperados (1)
• La distribución chi2 es la más apropiada para el análisis de datos
categóricos.
• Se comparan las frecuencias observadas y esperadas dentro de las
variables de estudio.
• Los valores esperados son aquellos que esperaríamos observar si la
Ho es verdadera.
Valores Observados vs. Esperados (2)
Bondad de ajuste (Pregunta)
• ¿Las frecuencias de las preferencias de sabor de helados observadas
son consistentes con la información disponible?

Chicha Otros
Maracuyá morada Piña Fresa sabores
Observado 1920 347 19 84 130

Chicha Otros
Maracuyá morada Piña Fresa sabores
Proporción 80% 12% 1% 3% 4%
Bondad de ajuste (Hipótesis)
• Ho: Las frecuencias observadas de las preferencias de sabor de
helado SON IGUALES a las del reporte obtenido.
• Ha: Las frecuencias observadas de las preferencias de sabor de helado
SON DIFERENTES a las del reporte obtenido.
V. Esperados si H0 es cierta
• 2500 x 80% = 2000
• 2500 x 12% = 300
• 2500 x 1% = 25
• 2500 x 3% = 75
• 2500 x 4% = 100
Año pasado Chicha Otros
Maracuyá morada Piña Fresa sabores
Proporción 80% 12% 1% 3% 4%
Esperado 2000 300 25 75 100
Bondad de ajuste (Cálculo)

Este año Chicha Otros


Maracuyá morada Piña Fresa sabores
Observado 1920 347 19 84 130
Esperado 2000 300 25 75 100
Bondad de ajuste (Decisión)
• Estimado chi2 = 22.083
• Grados de libertad: 4 (celdas -1)
• Valor-p = 0.0002

• Rechazamos la hipótesis nula.


Prueba de hipótesis: Chi-cuadrado.
• Supuestos:
• Las muestras son seleccionadas aleatoriamente.
• Las observaciones son independientes.
• La variable dependiente es categórica.
• Al menos el 80% de las celdas tienen valor esperado ≥ 5.
Prueba de hipótesis: una muestra
• Finalidad: Corroborar un valor teórico; a partir del resultado de una
muestra.
• Valor-p: Probabilidad de observar un resultado o más extremo, en
una muestra de tamaño “n”; asumiendo que el valor teórico es
verdadero.
• Práctica clínica:
• Infrecuente contrastar valores teóricos para una muestra.
• Tener en cuenta procedencia del valor teórico (población).
• Crucial reconocer cuál es el parámetro evaluado.
Pruebas de hipótesis:
Dos muestras independientes
José Alfredo Zavala Loayza
Prueba de hipótesis: dos muestras
independientes
• Usualmente deseamos comparar poblaciones.
• ¿Diferencia en la sobrevida según tratamiento (cirugía vs medicamentos)?
• ¿Sobrepeso es factor de riesgo para diabetes?
• ¿Qué familias tienen mayor número de hijos: rurales o urbanas?
Pruebas de hipótesis: dos muestras

Tipo de la variable dependiente Numérica Categórica

Observaciones Independientes Pareadas Independientes Pareadas

Pruebas paramétricas t-student t-student p.

Pruebas no-paramétricas Mann-Withney Wilcoxon Chi-cuadrado McNemar


Pruebas de hipótesis: t-student
• Hipótesis nula (H0): En la población de niños con anemia, el promedio
de hemoglobina de aquellos tratados con cacao fortificado es igual al
promedio de hemoglobina de aquellos no-tratados.

• Hipótesis alterna (H1): En la población de niños con anemia, el


promedio de hemoglobina de aquellos tratados con cacao fortificado
es diferente al promedio de hemoglobina de aquellos no-tratados.
Pruebas de hipótesis: t-student

µt - µnt = 0

-2.7 0 +2.7
Prueba de hipótesis: t-student
• Supuestos:
• Las muestras son seleccionadas aleatoriamente.
• Las observaciones son independientes.
• La variable dependiente es numérica.
• La distribución de la variable dependiente en cada muestra es normal.
• La escala de medición de la variable dependiente es al menos de
intervalo.
Pruebas de hipótesis: Mann-Withney
• Hipótesis nula (H0): En la población general, la mediana de glicemia
en ayunas en varones es igual a la mediana de glicemia en ayunas en
mujeres.

• Hipótesis alterna (H1): En la población general, la mediana de


glicemia en ayunas en varones es igual a la mediana de glicemia en
ayunas en mujeres.
Prueba de hipótesis: Mann-Withney
V. obs. Rank Grupo
120 3.5 Mujer
124 6 Varón
118 1 Mujer
120 3.5 Varón
121 5 Mujer
133 7 Varón
119 2 Mujer
Prueba de hipótesis: Mann-Withney
• Supuestos:
• Las muestras son seleccionadas aleatoriamente.
• Las observaciones son independientes.
• La variable dependiente es numérica.
• La distribución de la variable dependiente es igual en cada grupo de
comparación.
• La escala de medición de la variable dependiente es al menos ordinal.
Prueba de hipótesis: chi-cuadrado
• Ho: Las frecuencias de las preferencias de sabor de helado en los niños
SON IGUALES a las frecuencias de las preferencias de sabor de helado en
los adultos.
• Ha: Las frecuencias de las preferencias de sabor de helado en los niños
SON DIFERENTES a las frecuencias de las preferencias de sabor de helado
en los adultos.
Prueba de hipótesis: Chi-cuadrado
• Valores observados:
Chicha Otros
Sabores Maracuyá morada Piña Fresa sabores
Niños 20 30 10 15 10
Adultos 25 15 12 20 10

• Valores esperados:
Chicha Otros
Sabores Maracuyá morada Piña Fresa sabores
Niños 22.9 22.9 11.2 17.8 10.2
Adultos 22.1 22.1 10.8 17.2 9.8
Prueba de hipótesis: Chi-cuadrado.
• Supuestos:
• Las muestras son seleccionadas aleatoriamente.
• Las observaciones son independientes.
• La variable dependiente es categórica.
• Al menos el 80% de las celdas tienen valor esperado ≥ 5.
Pruebas de hipótesis:
Muestras pareadas
José Alfredo Zavala Loayza
Prueba de hipótesis: muestras pareadas
• En ocasiones los observaciones no son independientes.
• Medición de la presión arterial antes y después de recibir tratamiento.
• Estudios de casos-controles en los cuales los controles son seleccionados por
cada caso.

• El pareamiento debe formar parte del análisis estadístico.


• Asumir observaciones independientes genera errores en el tamaño
de muestra y, por lo tanto, en el error estándar.
Pruebas de hipótesis: dos muestras

Tipo de la variable dependiente Numérica Categórica

Observaciones Independientes Pareadas Independientes Pareadas

Pruebas paramétricas t-student t-student p.

Pruebas no-paramétricas Mann-Withney Wilcoxon Chi-cuadrado McNemar


Prueba de hipótesis: muestras pareadas
• Cada par es una unidad de análisis.
• Las hipótesis estadísticas se formulan como se ha hecho hasta ahora.
• Parámetro (antes) = Parámetro (después)
• Parámetro (casos) = Parámetro (controles)

• Tanto para pruebas paramétricas, como no-paramétricas se empieza


por calcular la diferencia de la variable dependiente en cada par.
• Luego, estas diferencias se analizan como si fuesen una sola muestra.
Prueba de hipótesis: t-student
• Supuestos:
• Las muestras son seleccionadas aleatoriamente.
• Cada par de observaciones son independientes.
• La variable dependiente es numérica.
• La distribución de la diferencia de valores en cada par es normal.
• La escala de medición de la variable dependiente es al menos de
intervalo.
Prueba de hipótesis: Wilcoxon
• Supuestos:
• Las muestras son seleccionadas aleatoriamente.
• Cada par de observaciones son independientes.
• La variable dependiente es numérica.
• La escala de medición de la variable dependiente es al menos ordinal.
Gracias

También podría gustarte