Está en la página 1de 37

BIOESTADÍSTICA Y DISEÑO EXPERIMENTAL

UNIDAD VI
BIOESTADÍSTICA ANALÍTICA
Dra. Inés Badano
Docente Investigador UNaM-CONICET
CONTENIDOS
■ Inferencia Estadística
– Parámetros y Estimadores.
■ Intervalo de Confianza
■ Prueba de Hipótesis
– Errores en el contraste de hipótesis:
error tipo 1 y error tipo 2.
■ Interpretación de valores p: significación
estadística.
■ Errores sistemáticos y errores aleatorios
OBJETIVOS
■ Reconocer la utilidad de los intervalos de confianza como un
método de estimación.
■ Interpretar la información brindada por un intervalo de confianza.
■ Interpretar la información obtenida a través de una prueba de
hipótesis.
■ Distinguir entre Intervalo de Confianza y Prueba de Hipótesis en
cuanto a su utilidad.
INFERENCIA
¨La inferencia es una adivinanza educada¨
(Lehmann, 1983)
INFERENCIA ESTADÍSTICA
■ Uno de los objetivos de la Bioestadística es hacer inferencia con
respecto a la población en base a la información contenida en una
muestra.
■ Para ello se calculan estadísticos.
¨Los estadísticos son funciones de algunas o de todas las observaciones
individuales que componen la muestra y pueden expresarse mediante
formulas¨.
PARÁMETROS Y ESTIMADORES
■ A partir del análisis de estadísticos (valores obtenidos de la muestra) tales
como la media muestral (𝑥 ̅), la varianza muestral (s), la proporción de un
suceso (p, frecuencia relativa), es posible estimar o inferir parámetros
poblacionales como la media (µ), la varianza (σ2 ) y la probabilidad de
ocurrencia de un suceso (π).
■ En estos casos, los estadísticos se denominan estimadores.
■ Para los parámetros se suelen reservar las letras griegas y son desconocidos.

Muestra Población
Media 𝑥̅ µ
Varianza S2 σ2
Desviación estándar S σ
Proporción p π
INFERENCIA ESTADÍSTICA
■ Las variables que se definen en los experimentos en general pueden ser
asociadas a distintas distribuciones que dependen de parámetros, por
ejemplo:
– La distribución Binomial está definida por una función de densidad
puntual f(x,n,p) que depende de los parámetros n y p.
– La distribución Normal está definida por una función de densidad f(x,µ,σ)
que depende de los parámetros µ y σ.
■ El objetivo de la mayoría de las investigaciones científicas es hacer inferencia
con respecto a ciertos parámetros poblacionales, los cuales en general son
desconocidos.
INFERENCIA ESTADÍSTICA
■ La estadística no mide valores exactos sino
que los estima.
■ Cuando hablamos de estimación nos referimos
al cálculo más cercano que podamos hacer del
verdadero valor y cuál es el grado de precisión
con el cual este valor ha sido calculado.
■ La Inferencia Estadística utiliza dos técnicas
para lograr su objetivo: la Estimación (puntual y
por Intervalos) y la Prueba de Hipótesis.
INTERVALO DE CONFIANZA
■ Un intervalo de confianza es un rango de valores que se confía que
contenga el parámetro poblacional.
■ Estos intervalos se usan como procedimiento habitual para estimar
parámetros de una población.
■ Los intervalos presentan dos valores: un límite inferior y límite
superior y son simétricos con respecto al parámetro.
■ Idealmente sería conveniente que el intervalo tuviera las siguientes
propiedades:
– que contenga al verdadero valor del parámetro
– que sea relativamente de longitud pequeño.
MEDIA DE UNA MUESTRA
■ Cuando reportamos el IC 95% de nuestra muestra, estamos informando entre
qué valores se encuentra el 95% de la población; esto nos da una idea del
grado de dispersión que presentan nuestros datos.
■ Si entre ± 1,96 DS de la media muestral se encuentra el 95% de los valores
esperados ¿cuáles serían estos valores?
■ Para el cálculo del IC 95% sólo necesitamos el valor de la media muestral y el
del DS.
ERROR ESTANDAR
■ Los intervalos de confianza se construyen a partir de los estimadores.
■ El error estándar es el error de estimación. Es un concepto central en los
intervalos de confianza y se usa habitualmente para calcularlos.
■ A menudo, para hallar un IC 95% bastará con sumar y restar 1.96 veces
el error estándar al estimador muestral:
– El error estándar es al estimador muestral lo que la desviación
estándar es al individuo.
■ El error estándar mide el grado de incertidumbre con
respecto a la capacidad del estimador muestral para
estimar el parámetro poblacional.
■ Calcule los Intervalos de Confianza de los siguientes ejemplos:
ESTIMACIÓN DE UNA
PROPORCIÓN
■ El uso de proporciones, expresadas coloquialmente como porcentajes, es
muy frecuente, sobre todo en medicina.
■ Por ejemplo: la proporción o porcentaje de fumadores que desarrollarán
cáncer de pulmón, la proporción de alumnos de bioestadística que
aprobarán la asignatura en la primera mesa, etc.
■ La estimación de una proporción se suele
hacer por aproximación a la normal.
– Con muestras grandes
– Cuanto más cercana a p = 0,5
(porcentaje = 50%) sea la proporción,
mejor será la aproximación.
ESTIMACIÓN DE UNA
PROPORCIÓN
■ Fórmula para el cálculo del error estándar de la
proporción (EEP)
IC95% (∏) = p ± 1.96 EEP
INTERVALO DE CONFIANZA
■ Confianza no es probabilidad.
■ Ningún intervalo contiene el parámetro con una probabilidad del 95%.
Simplemente lo contiene (probabilidad = 100%) o no lo contiene
(probabilidad = 0%)
■ Esta confianza está fundada en
saber que, si se repitiese la
experiencia 100 veces y en todas
ellas se calculase un IC 95%, habría
95 intervalos que contendrían el
parámetro y 5 que no lo
contendrían.
PRUEBA DE HIPÓTESIS
■ El propósito de las pruebas de hipótesis es
ayudar al investigador a tomar una decisión
en torno a una población, examinando una
muestra de ella
■ Una hipótesis se define simplemente como
una afirmación acerca de una o más
poblaciones.
■ Los investigadores tratan con dos tipos de
hipótesis: las hipótesis de investigación y las
hipótesis estadísticas.
HIPÓTESIS ESTADÍSTICA
■ Las hipótesis estadísticas se refieren a los parámetros de las
poblaciones acerca de las cuales se hace la afirmación.
■ Por medio de las pruebas de hipótesis, se determina si tales
proposiciones son compatibles o no con los datos de que se
dispone.
■ En las pruebas de hipótesis se trabaja con dos hipótesis
estadísticas que deben enunciarse explícitamente:
■ Hipótesis Nula (H0)
■ Hipótesis alternativa (HA).
HIPÓTESIS NULA
■ La Ho es una proposición de conformidad con (o no diferencia respecto de)
condiciones verdaderas en la población de interés.
■ En general, la hipótesis nula se establece con el propósito expreso de ser
rechazada.
■ En las hipótesis estadísticas el indicador de igualdad (=, ≤, ≥) debe estar
incluido en la hipótesis nula.
■ Por ejemplo: ¿Se puede concluir que la media de una población es diferente
de 50?.
■ La H0 es: H0: u = 50
■ y la HA: u ≠ 50
■ La hipótesis nula es la que debe ser comprobada.
HIPÓTESIS ALTERNATIVA
■ La H0 y la Ha deben ser complementarias. Es decir, las dos contemplan de
manera exhaustiva todos los valores posibles que los parámetros de
suposición pueden asumir.
– Ejemplo: Se desea saber si puede concluirse que la media de la
población es mayor que 50.
■ La H0 es: H0: u ≤ 50
■ y la HA: u > 50
– Ejemplo: Se desea saber si puede concluirse que la media de la
población es menor que 50.
■ La H0 es: H0: u ≥ 50
■ y la HA: u < 50
■ La HA generalmente expresa la conclusión que el investigador desea
alcanzar.
CONTRASTE DE HIPÓTESIS
Pasos de un contraste de hipótesis son:
■ Identificar la hipótesis nula (H0) y su
correspondiente alternativa (HA ).
■ Elegir la Estadística de Prueba y Analizar
los datos (por ej. en InfoStat)
■ Aplicar la Regla de Decisión (interpretar el
valor p de significación estadística).
■ Decidir si se rechaza o no la hipótesis nula.
INTERPRETACIÓN DEL VALOR P
■ El valor p de significación estadística es una probabilidad
condicionada. La condición es que H0 sea cierta.
■ Nos permite decidir si se rechaza o no H0
■ Un valor p muy bajo significa que sería muy raro encontrar esta
muestra si H0 fuese cierta.
■ Habitualmente, el límite para considerar bajo un valor p se suele
poner en p < 0,05.
■ Cuando p < 0,05, se suele rechazar la hipótesis nula y se dice que el
resultado es «estadísticamente significativo».
■ En este caso, habría que quedarse con la hipótesis alternativa (HA).
INTERPRETACIÓN DEL VALOR P
INTERPRETACIÓN DEL VALOR P
REGLA DE DECISIÓN
Algunos ejemplos
INFERENCIA BASADA EN DOS
MUESTRAS
Prueba T para muestras independientes
■ Se asume que se dispone de dos muestras independientes, cada una
desde una población o distribución.
■ La prueba puede ser vista como una herramienta para la
comparación de medias (esperanzas) en dos poblaciones
(distribuciones).
■ Sus Hipótesis son:
– H0: E(X1) = E(X2); versus H1: E(X1) ≠ E(X2

■ Regla de decisión: si p < 0,05 se rechaza la H0.


INFERENCIA BASADA EN DOS
MUESTRAS

El valor p (<0,0001) indica que hay


diferencias significativas entre las
dos medias
INFERENCIA BASADA EN UNA
MUESTRA
Prueba de normalidad (Shapiro-Wilks modificado)
■ InfoStat permite probar si la variable en estudio tiene
distribución normal.
■ Las hipótesis de la prueba son:
– H0: las observaciones tienen distribución normal;
– HA: las observaciones no tienen distribución normal
INFERENCIA BASADA EN UNA
MUESTRA

El valor p (<0,0001) indica que se rechaza la


hipótesis de normalidad
CONTRASTE DE HIPÓTESIS
■ Se debe tener en cuenta que al tomar la decisión de rechazar o de no
rechazar la hipótesis nula H0, no se hace con un 100% de seguridad, pues
se está trabajando con la información de una muestra para obtener
conclusiones con respecto a toda una población.

α
β
ERRORES TIPO I (α)
■ El Error de Tipo I: se rechaza una H0
verdadera. Se llama alfa α
– Llevaría a decir que hay diferencias
significativas, cuando en realidad no
las hay.
■ Es importante medir el riesgo de tomar
una decisión errónea.
■ Este riesgo se mide a través de una
probabilidad, que por ser una probabilidad
de error debe tomar valores pequeños.
ERRORES TIPO II (β)
■ El Error de Tipo II: se acepta una H0 falsa. Se llama Beta β
– Llevaría a decir que no hay diferencias significativas cuando
realmente las hay.
– El complemento de beta (1 – β) se denomina Potencia
Estadística y corresponde a la probabilidad de encontrar
resultados significativos cuando la HA es cierta.

Futuros estudios con un mayor


número de muestras….
NIVEL DE SIGNIFICANCIA
■ El riesgo α también se llama nivel de significación (p. ej., α = 0,05).
■ Si el riesgo α establece el criterio de rechazar H0 cada vez que se
encuentre un valor p inferior al 5% (p < 0,05), esto será lo que podrá
ocurrir con 5 de cada 100 muestras cuando la hipótesis nula sea
cierta, y se dirá incorrectamente que hubo diferencias significativas.
■ Tales rechazos incorrectos de H0 son los errores tipo 1. Son graves
porque vienen a ser como descubrimientos en falso que pueden
traducirse en decisiones desafortunadas.
■ Por eso se suele fijar un riesgo α pequeño.
■ En cambio, el error tipo 2 es menos grave, porque ocurre en un
contexto en que no se tomará decisión alguna.
NIVEL DE SIGNIFICANCIA
■ Gráficamente es el área
bajo la curva sobre la zona
de rechazo.
■ α es el valor crítico y
determina un intervalo
llamado zona de rechazo.
■ La Zona de rechazo es el
conjunto de valores del
estadístico de contraste
que lleva a descartar la H0.
CONSIDERACIONES FINALES
■ Al fijar α = 0,05, se admite que en el 5% de las ocasiones en que el
resultado sea significativo el supuesto hallazgo será incorrecto. Por todo
esto no puede absolutizarse un valor p < 0,05 como criterio de verdad de H1
■ Por otra parte, el cálculo del intervalo de confianza es una forma alternativa
de evaluar el rol del azar y es más informativo que el solo cálculo del valor p,
ya que aporta el grado de certidumbre con el cual hemos estimado un valor.
■ Siempre debe tenerse en cuenta, además, el diseño del estudio, la
consistencia de estos hallazgos con otras investigaciones, la plausibilidad
biológica y otros criterios epidemiológicos de causalidad.
■ Este planteamiento debe considerar también los sesgos (errores
sistemáticos), otros errores o, simplemente, la posibilidad de que el modelo
matemático que se ha asumido sea inadecuado.
ICONOS
■ Error iconos creados por Smashicons
■ Número uno iconos creados por Freepik
■ Calculadora iconos creados por Freepik
■ Error iconos creados por juicy_fish
■ Elipsis iconos creados por Freepik
■ Hipótesis iconos creados por Muhammad Waqas Khan
■ By Qwfp at the English Wikipedia, CC BY-SA 3.0,
https://commons.wikimedia.org/w/index.php?curid=58960830

También podría gustarte