Está en la página 1de 47

Significancia estadística

Diego A. Beltrán
Médico familiar
Esp. en Docencia Universitaria
Agenda

• ¿Qué sabemos ya?


• ¿A que apunta la significancia estadística?
• Distribución muestral de la probabilidad
• Teorema del límite central
• Distribución de una media
• Distribución de una proporción
• Intervalos de confianza
• Para una media
• Para una proporción
• Prueba de hipótesis
• Prueba de igualdad
• Prueba de diferencia
¿Qué sabemos ya?

La epidemiología cuenta y mide variables

Las variables tienen diferentes tipos y escalas

Las variables se distribuyen en su frecuencia absoluta y relativa

La frecuencia se puede equiparar a la probabilidad de ocurrencia

La probabilidad, como la frecuencia, tiene una distribución

Existen diferentes distribuciones de probabilidad según el tipo de variable


¿A que apunta la significancia estadística?

Generar Determinar si los


conclusiones de una fenómenos se deben
población desde una al azar o por algo no
muestra relacionado al azar

Intervalos de Prueba de
confianza hipótesis
Distribución muestral de la probabilidad

25 muestras, cada muestra tiene


una media particular
¿Cuántas muestras de dos
sujetos podemos crear?
Distribución muestral de la probabilidad
Distribución muestral de la probabilidad

La distribución de todos los valores posibles que puede


asumir un estadístico, calculados a partir de muestras
del mismo tamaño, seleccionadas aleatoriamente de la
misma población, se llama distribución muestral de la
estadística.
¿Será que las muestras que elegimos se relacionan de alguna forma con la
población que la contiene?
¿Será que las muestras de un estudio deben ser gigantescas?
¿Cómo podríamos saber que una muestra me sirve para concluir sobre la
población?
Teorema del límite central
Teorema del límite central

Dada una población de cualquier forma funcional no normal


con una media μ y una varianza finita σ², la distribución
muestral de x̄, calculada a partir de muestras de tamaño n de
esta población, tendrá media μ y varianza σ²/n y se
distribuirá aproximadamente de forma normal cuando el
tamaño de la muestra sea grande.

Distr.
Dist. Probabilidad
Dist. frecuencia probabilidad de
de evento
la media muestral
Teorema del límite central
Teorema del límite central

Precisión Confianza

• Que tanto me acerco a la • Probabilidad máxima con


media poblacional real la cual nos
• Dependiente del error comprometemos a decir
estándar y por lo tanto del que incluye la media
tamaño muestral poblacional real
• Se relaciona al error alfa o
de tipo I
La epidemiología
busca ser precisa y
exacta

La exactitud se relaciona al
sesgo
La precisión se relaciona al
error aleatorio
Distribución muestral de una media

• Si tenemos 5
personas de 5 edades 𝜇=10
diferentes, podemos 𝜎 2=8
generar 25 muestras
de 2 sujetos
• Al tomar la media de
la población y de las
muestras, se genera
un comportamiento
diferente 𝜇 𝑋 =10

𝜎 2𝑋 =4
Distribución muestral de una media

Población con Población sin


distribución normal distribución normal
𝜇 𝑋 =𝜇 𝜇 𝑋 =𝜇
𝑋 −𝜇 𝑋
2 𝑍= 2
2 𝜎 𝜎 2 𝜎
𝜎 𝑋= 𝜎 𝑋=
𝑛 √𝑛 𝑛
𝜎 𝜎
𝜎 𝑋= Error estándar 𝜎 𝑋=
√𝑛 √𝑛
La distribución de la media muestral sigue una distribución
normal
Distribución muestral de una media

• Si en una población la media de


𝑋 −𝜇 𝑋 87 −82
glucosa es 82 mg/dL y la 𝑍= = =2,282=0,011
desviación estándar es de 12 𝜎 / √ 𝑛 12/ √ 30
mg/dL, ¿Cuál es la probabilidad de
que la media sea superior a 87
mg/dL en una muestra de 30
personas?

𝑃 ( 𝑋 ≥87,𝑛=30,𝜇=82,𝜎=12)= 0,011
Distribución muestral de una media

𝑋 −𝜇 𝑋 80− 82
𝑍1= = =− 0,913=0,181
• Si en una población la media de 𝜎 / √ 𝑛 12/ √ 30
glucosa es 82 mg/dL y la
desviación estándar es de 12 𝑋 −𝜇 𝑋 77 −82
𝑍2= = =−2,282=0,011
mg/dL, ¿Cuál es la probabilidad de 𝜎 / √ 𝑛 12/ √ 30
que la media se ubique entre 77 a
80 mg/dL en una muestra de 30
personas?

𝑃 ( 75 ≤ 𝑋 ≥ 80 ) =0,17
Distribución muestral de una proporción

• La distribución de una proporción


muestral tiene las mismas 𝜇 ^𝑝=𝑝
condiciones de construcción que la
de la media
^ −𝑝
𝑝
• Se plantea que la proporción 𝑝𝑞 𝑍=


2
muestral tiene una distribución 𝜎 =
^
𝑝 𝑝𝑞
𝑛
cercana a la normalidad 𝑛
• Los parámetros de la distribución


tienen diferentes construcciones 𝑝𝑞
𝜎 ^𝑝 =
𝑛
Distribución muestral de una proporción

𝜇 ^𝑝=𝑝 𝜇 ^𝑝=0,4
• Si en la población la proporción de
ser infiel es de p = 0,4, ¿Cuál es la
probabilidad de que se encuentre
una proporción superior a 0,55 en
𝜎 ^𝑝 =

^ −𝑝
√ 𝑝𝑞
𝑛 √
𝜎 ^𝑝 =
0,4 ∗0,6
50
=0,0693

𝑝 0,55 − 0,4
una muestra de 50 personas? 𝑍= 𝑍= =2,165

√ 𝑝𝑞
𝑛 √0,4 ∗0,6
50

𝑃 (𝑝 ≥ 0,55)=0,015
PARO POR SALUD MENTAL

Reúnanse en grupos y desarrollen los ejercicios del


taller “distribución de medias y proporciones”
Intervalos de confianza

• Mencionamos que la inferencia estadística se basa en una de dos


posibilidades: intervalos de confianza o pruebas de hipótesis
• Un intervalo de confianza es una poderosa herramienta para establecer
siginificancia
• Toda medida generada puede y debe tener un intervalo de confianza
• ¿Cómo se calculan e interpretan los intervalos?
Intervalos de confianza

Conocemos μ, Estimamos en
σ, x̄, donde esta μ

Los intervalos
caen en Definimos una
Establecemos
Los intervalos
Z de x̄
confianza y el
EE
± incluirán a
μ
Determinamo
Medimos x̄
s P de x̄
¿Qué elementos componen el cálculo de
un intervalo de confianza?
𝐼𝐶=𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 ± 𝑐𝑜𝑒𝑓 . 𝑐𝑜𝑛𝑓𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 ∗ 𝐸𝐸
𝐼𝐶= 𝑋 ± 𝑍 (1− 𝛼/ 2) ∗ 𝜎 𝑋 Margen ^ ± 𝑍 (1− 𝛼 /2) ∗ 𝜎 𝑝^
𝐼𝐶 =𝑝
de error


𝜎
𝐼𝐶 90 %= 𝑋 ± 1,64 ∗ 𝑝^ 𝑞^
√𝑛 𝐼𝐶 90%= 𝑝^ ± 1,64∗
𝜎 𝑛
𝐼𝐶 95 %= 𝑋 ± 1,96 ∗
√𝑛 …
𝜎
𝐼𝐶 99 %= 𝑋 ± 2,58 ∗ …
√𝑛
Interpretación probabilística: En un muestreo repetido, de una
población distribuida normalmente con una desviación típica conocida,
el 100 (1-α) por ciento de todos los intervalos de la forma incluirán a la
larga la media poblacional μ.

Interpretación práctica: Cuando el muestreo se realiza a partir de una


población distribuida normalmente con desviación típica conocida,
tenemos un 100(1-a) por ciento de confianza en que el único intervalo
calculado, , contiene la media poblacional μ.
Hagamos cálculos del grupo usando
muestras del grupo

Género Edad

Otra
Madrugar
variable
Prueba de hipótesis

• Mencionamos que la inferencia estadística se basa en una de dos


posibilidades: intervalos de confianza o pruebas de hipótesis
• Las pruebas de hipótesis es otra herramienta que permite tener la
inferencia estadística
• Esta puede complementar a los intervalos de confianza, con el fin de
apoyar o no la generación de conclusiones y la toma de decisiones
• Sigue un proceso ordenado y se sustenta en el concepto de hipótesis
Hipótesis: proposición acerca de
Hipótesis
una o mas poblaciones
Los estudiantes no aprenden
Hipótesis de
Hipótesis estadística
epidemiología
investigación
El profesor no sabe enseñar
Van a perder un 10% la materia
Derivada del
Los que tengan 8 inasistencias Hipótesis
pierden
protocolo de Hipótesis nula
alternativa
investigación la materia
Hipótesis de investigación: aquella
conjetura que motiva la investigación.
(Pregunta de investigación)

Hipótesis estadística: afirmaciones


establecidas con el fin de ser evaluadas
por técnicas estadísticas adecuadas
Datos Supuestos Hipótesis

Distribución
Regla de Estadística
de
decisión de prueba
estadística

Cálculo de la Decisión Conclusión y


estadística estadística valor p
Datos Supuestos

• Definición de las • Suposiciones


características de los relacionadas al origen de
datos disponibles para la los datos, el
prueba comportamiento de
• Se requiere la estos en cuanto a la
categorización de la normalidad, grupos de
variable de interés para comparación, etc.
la prueba
• El tipo de variable define
el proceso estadístico
Hipótesis Estadístico de prueba

• Se trabaja con 2 hipótesis: nula y • Valor de estadístico que se puede


alternativa calcular por medio de los datos
• Se intenta comprobar la H. nula obtenidos de la muestra
• Si se rechaza se toma por verdadera • Valor Z, valor t, χ², etc.
la H. alternativa • La toma de decisiones depende de
• H. De investigación es igual a la este valor. Implica aceptar o rechazar
alterna la H. nula
• Se escribe con notación matemática
𝐸𝑠𝑡 − 𝑃𝑎𝑟 𝑠𝑢𝑝𝑢𝑒𝑠𝑡𝑜
𝐸𝑠𝑡𝑑=
𝐻 0 : 𝜇= 𝑋 𝐻 𝐴 :𝜇≠ 𝑋 𝐸𝐸 𝑑𝑒𝑙 𝐸𝑠𝑡

𝐻0 : 𝜇 ≤ 𝑋 𝐻 𝐴 : 𝜇> 𝑋 𝑋 −𝜇 0
𝑍=
𝐻0 : 𝜇 ≥ 𝑋 𝐻 𝐴 : 𝜇< 𝑋 𝜎 /√ 𝑛
Distribución de la estadística Regla de decisión

• Se relaciona a la • Defino previo a todo


distribución muestral del cálculo el valor que me
estadístico de prueba permite a aceptar o
• La distribución nos informa rechazar la H. nula
la probabilidad del • Se habla de regiones de
hallazgo rechazo o de no rechazo
• La distribución cambia • La región de rechazo se
según la prueba utilizada relaciona al nivel de
(normal, t, χ², etc.) significancia, que se
relaciona al error alfa
Área que determinamos
como anómalo que se
tenga un valor del
estadístico, asumiendo
que la sea verdadera
Yo creo que mi mamá me quiere, y por lo
tanto si me va bien en Epi me va a comprar

Sí me fue bien en Epi, pero me regaló

¿Qué tan probable es que mamá sí me


quiere? 
Si mi estadístico cae aquí,
y mi es verdadera…
Como que la muy
verdadera, no es.

Pero puede que me


equivoque… pero solo en 5
casos de 100
Cálculo del estadísitico Decisión estádística

• Se procede al cálculo del • Tras el cálculo del estadístico


estadístico definido de prueba, y su comparación
previamente con la región de rechazo, se
• Este resultará ubicado en emite una decisión
alguna de las regiones en la • Aceptar o rechazar la
curva de distribución hipótesis nula
• Se compara con la región de
rechazo principalmente
Conclusión Valor p

• Si rechazo , acepto la • La gente que no sabe se


hipótesis alternativa queda en decir que un
• Si acepto , rechazo la p<0.05 es indicativo de
hipótesis alternativa “significancia”
• Siempre se debe tomar un • La gente que sabe dice que
camino o el otro el valor p representa la
probabilidad de obtener el
valor obtenido asumiendo
que la es verdadera.
• Prueba bilateral
• Me interesa a la der. e izq. de Z

• Prueba unilateral
• Me interesa a la der. de Z

• Prueba unilateral
• Me interesa a la izq. de Z
En una muestra de 49 adolescentes que se prestaron como sujetos para un estudio
inmunológico, una variable de interés fue la prueba del diámetro de reacción de la piel a un
antígeno. La media de la muestra y la desviación estándar fueron eritema de 21 y 11 mm,
respectivamente. ¿Es posible concluir a partir de estos datos que la media de la población es
igual que 30? Sea α =.05.

𝑛=49 𝑋=21 𝑆=11 𝛼=0,05 𝑋 −𝜇 0 21 −30


𝑍= = =− 5 , 72
𝜎 / √ 𝑛 11/ √ 49
1. Datos: Edades, cuantitativa discreta
2. Suposición: Datos normales
3. Hipótesis:
4. Estadísitica:
5. Distribución: Normal
6. Regla: Rechazo sí
7. Cálculo:
8. Decisión: Se rechaza
9. Conclusión: Se rechaza y se acepta
10. Valor Rechazo
En una muestra de 49 adolescentes que se prestaron como sujetos para un estudio
inmunológico, una variable de interés fue la prueba del diámetro de reacción de la piel a un
antígeno. La media de la muestra y la desviación estándar fueron eritema de 21 y 11 mm,
respectivamente. ¿Es posible concluir a partir de estos datos que la media de la población es
mayor que 30? Sea α =.05.

𝑛=49 𝑋=21 𝑆=11 𝛼=0,05 𝑋 −𝜇 0 21 −30


𝑍= = =− 5 , 72
𝜎 / √ 𝑛 11/ √ 49
1. Datos: Edades, cuantitativa discreta
2. Suposición: Datos normales
3. Hipótesis:
4. Estadísitica:
5. Distribución: Normal
6. Regla: Rechazo sí
7. Cálculo:
8. Decisión: Se acepta
9. Conclusión: Se acepta y se rechaza
10. Valor Rechazo
En una muestra de 49 adolescentes que se prestaron como sujetos para un estudio
inmunológico, una variable de interés fue la prueba del diámetro de reacción de la piel a un
antígeno. La media de la muestra y la desviación estándar fueron eritema de 21 y 11 mm,
respectivamente. ¿Es posible concluir a partir de estos datos que la media de la población es
menor que 30? Sea α =.05.

𝑛=49 𝑋=21 𝑆=11 𝛼=0,05 𝑋 −𝜇 0 21 −30


𝑍= = =− 5 , 72
𝜎 / √ 𝑛 11/ √ 49
1. Datos: Edades, cuantitativa discreta
2. Suposición: Datos normales
3. Hipótesis:
4. Estadísitica:
5. Distribución: Normal
6. Regla: Rechazo sí
7. Cálculo:
8. Decisión: Se rechaza
9. Conclusión: Se rechaza y se acepta
10. Valor Rechazo
En una muestra de 49 adolescentes que se prestaron como sujetos para un estudio
inmunológico, una variable de interés fue la prueba del diámetro de reacción de la piel a un
antígeno. La media de la muestra y la desviación estándar fueron eritema de 21 y 11 mm,
respectivamente. ¿Es posible concluir a partir de estos datos que la media de la población es
menor que 30? Sea α =.05.

𝑛=49 𝑋=21 𝑆=11 𝛼=0,05

𝐼𝐶=𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 ± 𝑐𝑜𝑒𝑓 . 𝑐𝑜𝑛𝑓𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 ∗ 𝐸𝐸


𝑆 ¿El valor 30 está en el IC?
𝐼𝐶 95 %= 𝑋 ± 1,96 ∗
√𝑛 La media ni es 30 ni es
11 mayor que 30, solo es
𝐼𝐶 95 %=21± 1,96 ∗
√ 49 menor que 30
𝐼𝐶 95 %=21± 3,08=(17,92− 24,08)

También podría gustarte