Está en la página 1de 57

T.

9 Inferencia estadística:
Estimación puntual y por
intervalos de confianza.
Test de hipótesis estadísticos
Dra. Amelia García Luque

Inferencia estadística (IE)
Conjunto de procedimientos que nos
permiten sacar conclusiones acerca
de la población a estudio a partir de
la información proporcionada por los
datos de la muestra

Estimación puntual
Provee un solo valor, un valor concreto para la estimación.

Un estimador puntual es simplemente un estadístico (media
aritmética, varianza, etc.) que se emplea para estimar parámetros
(media poblacional, varianza poblacional, etc.).

Por ejemplo, cuando obtenemos una media aritmética a partir de una
muestra, tal valor puede ser empleado como un estimador para el
valor de la media poblacional.

Algunos autores comparan los estimadores con los lanzamientos en
una diana: el círculo central sería el valor real del parámetro.
3

Por intervalo
Determina dos valores (límites de confianza) entre los
que acepta puede estar el valor del estimador.

En todo intervalo de confianza hay una noticia buena y
otra mala:
La buena: hemos usado una técnica que en % alto de
casos acierta.
La mala: no sabemos si ha acertado en nuestro caso.

4

Población: Se entiende por tal todo conjunto
de personas, animales u objetos sobre el que
se va a llevar a cabo una investigación y al
que se van a referir las conclusiones de la
misma.

Muestra: Es un subconjunto de la población
que constituye el objeto de estudio. Las
técnicas estadísticas permiten inferir las
características y relaciones existentes en
una población analizando dichos aspectos en
una muestra representativa.

.

Para evitar sesgos. con independencia de los miembros seleccionados previamente.La elección de los diferentes miembros de la muestra está basada en el azar. .Cada miembro de la población tiene la misma probabilidad de ser seleccionado. . se debe seleccionar una muestra aleatoria de la población: .

.-El investigador trabaja con una de las infinitas muestras posibles. -Dos herramientas en IE: prueba de significación y prueba de hipótesis.

Estadística analítica • Extrae conclusiones de la colección de datos observados Finalidades: 1) Estimación de parámetros 2) Contraste de hipótesis .

sus parámetros nos son desconocidos      ¿cuál es la prevalencia de alérgicos a productos lácteos? ¿cuál es la proporción de fumadores varones mayores de 16 años? ¿cuál es la renta media anual por familia? ¿cuál será el porcentaje de curación del nuevo fármaco? Etc. etc. dada una población en la que se observa un fenómeno.Estimación de parámetros En general.… .

Estimación de parámetros Conocer exactamente el valor de un parámetro implica observar a todos los individuos de la población Inferencia estadística Métodos que nos van a permitir obtener conclusiones de la población a partir de la información proporcionada por una muestra .

Estimación de parámetros x 1 x 2 x 3 x 4 x 5 x 6 x i  .

Estimación de parámetros Un trabajo de investigación realizado sobre una muestra tiene interés en la medida que pueda representar al conjunto de la población Conceptos: – Error estándar: dispersión imaginaria que presentarían las sucesivas medias o porcentajes que se obtendrían ante una hipotética repetición del experimento – Intervalo de confianza: intervalo dentro del cual se encuentra el verdadero valor de la población – Probabilidad de error: probabilidad que se escape el valor verdadero (poblacional) de ese intervalo .

Tipos de error Error sistemático: falta de validez Error aleatorio: falta de precisión Precisión y validez .

Tipos de error Error sistemático: falta de validez Error aleatorio: falta de precisión .

Validez • Error en el proceso de selección de individuos (una muestra no representativa) • Mediciones erróneas de la variable a estudio (mala calidad) • Pruebas poco sensibles • Diagnósticos incorrectos • Etc.Tipos de error Error aleatorio: Debido al azar. Precisión y fiabilidad • • • • • Se trabaja con muestras y no con poblaciones Errores por los instrumentos de medida Variabilidad biológica Debidos al observador Etc. Error sistemático: Debido a los sesgos. .

es prácticamente imposible corregirlo en la fase de análisis • Limita mucho la validez del estudio .Tipos de error El error sistemático no disminuye cuando aumentamos el tamaño de la muestra • Una vez introducido.

¡Gran diferencia! Muestra aleatori a X  20 años Rechazo la hipótesis . Creo que la edad media es 40 años...Contrastando una hipótesis Son demasiados...

¿Qué es una hipótesis? • Una creencia sobre la población. principalmente sus parámetros: – Media – Varianza – Proporción/Tasa • OJO: Si queremos contrastarla. debe establecerse antes del análisis. Creo que el porcentaje de enfermos será el 5% .

Identificación de hipótesis • Hipótesis nula Ho • Hip.  .  p  50% . Alternativa H1 – La que contrastamos – Niega a H0 – Los datos pueden refutarla – Los datos pueden mostrar evidencia a su favor – No debería ser rechazada sin una buena razón. . .  H0 :   H1 : p  50% . – No debería ser aceptada sin una gran evidencia a su favor.

.

¿Quién es H0? • Problema: ¿La osteoporosis está relacionada con el sexo? • Solución: – Traducir a lenguaje estadístico: p  50% – Establecer su opuesto: p  50% – Seleccionar la hipótesis nula H 0 : p  50% .

¿Quién es H0? • Problema: ¿El colesterol medio para la dieta mediterránea es 6 mmol/l? • Solución: – Traducir a lenguaje estadístico: – Establecer su opuesto: – Seleccionar la hipótesis nula H0 :   6  6 6 .

¿qué hace un científico cuando su teoría no coincide con sus predicciones?   40 X  20 .. .. Sin embargo ocurrió..Razonamiento básico Si supongo que H0 es cierta. el resultado del experimento sería improbable..

Rechazo que H0 sea cierta. el resultado del experimento sería improbable.   40 X  20 ....Razonamiento básico Si supongo que H0 es cierta.. Sin embargo ocurrió. .

el resultado del experimento es coherente. ...Razonamiento básico Si supongo que H0 es cierta.. ¿Si una teoría hace predicciones con éxito. queda probado que es cierta? • No hay evidencia contra H0 •No se rechaza H0 •El experimento no es concluyente •El contraste no es significativo   40 X  38 ..

. Reg. 5% Es conocida antes de realizar el • Fijado de antemano por el investigador experimento: resultados experimentales que refutarían • Es la probabilidad de rechazar H 0 H0 cuando es cierta =5% Reg. • Número pequeño: 1% . Crit. No rechazo H0 =40  .. Crit.Región crítica y nivel de significación Región crítica • • Nivel de significación:  Valores ‘improbables’ si.

Contrastes: unilateral y bilateral La posición de la región crítica depende de la hipótesis alternativa Bilateral H1: 40 Unilateral Unilateral H1: <40 H1: >40 .

Significación: p No se rechaza H0: =40  H0: =40 X  43 .

Significación: p Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es “no significativo” cuando p> No se rechaza la Ho No se rechaza H0: =40 X  43 P  P  .

Significación : p Se rechaza H0: =40 Se acepta H1: >40  X  50 .

 P Se rechaza H0: =40 Se acepta H1: >40  P X  50 . si el resultado experimental discrepa más de “lo tolerado” a priori.Significación : p El contraste es estadísticamente significativo cuando p<  Es decir.

p y criterio de rechazo • Sobre   • Sobre p – Es número pequeño. preelegido al diseñar el experimento – Es conocido tras realizar el experimento – Conocido  sabemos todo sobre la región crítica – Conocido p sabemos todo sobre el resultado del experimento Sobre el criterio de rechazo  Contraste significativo = p menor que  .Resumen: .

Riesgos al tomar decisiones Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito Los datos pueden refutarla • H0: Hipótesis nula – Es inocente La que se acepta si las pruebas no indican lo contrario Rechazarla por error tiene graves consecuencias • H1: Hipótesis alternativa – Es culpable No debería ser aceptada sin una gran evidencia a favor. Rechazarla por error tiene consecuencias consideradas menos graves que la anterior .

1) Es culpable – (Ej.2) El nuevo tratamiento no tiene efecto – (Ej.3) No hay nada que destacar • H1: Hipótesis alternativa – (Ej. 3) Hay una situación anormal Especulativa .1) Es inocente – (Ej.Riesgos al contrastar hipótesis Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo no • H0: Hipótesis nula No especulativa – (Ej.2) El nuevo tratamiento es útil – (Ej.

El tratamiento si tiene efecto pero no lo percibimos. Poder del contraste (1-β) . Probabilidad Rechazo H0 (“Acepto H1”) β Correcto Error de tipo I El tratamiento no tiene efecto pero se decide que sí. Probabilidad α 36 El tratamiento tiene efecto y el experimento lo confirma.Tipos de error al contrastar hipótesis Realidad H0 cierta No Rechazo H0 (“Acepto H0”) H0 Falsa (H1 es cierta) Correcto Error de tipo II El tratamiento no tiene efecto y así se decide.

no se pueden reducir a la vez ambos tipos de error.  • Para un tamaño muestral fijo. . • Para reducir . hay que aumentar el tamaño muestral.

– H1 : El peso de la prueba recae en ella.Algunas conclusiones. las hipótesis nula y alternativa no tienen el mismo papel: – H0 : Hipótesis científicamente más simple. • α debe ser pequeño • Rechazar una hipótesis consiste en observar si p<α • Rechazar una hipótesis no prueba que sea falsa. hasta ahora • Las hipótesis no se plantean después de observar los datos. Podemos cometer error de tipo I • No rechazar una hipótesis no prueba que sea cierta. • En ciencia. Podemos cometer error de tipo II • Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos. .

La “p” no es una medida de asociación 2. es mejor que el otro .Significación estadística frente a relevancia clínica 1. Debemos ser nosotros los que fijemos previamente lo que consideramos clínicamente RELEVANTE EJEMPLO: Se conocen dos tratamientos para una enfermedad y se desea saber si el fármaco A produce un número diferente de curaciones (mayor o menor) que un fármaco B • Ho: el fármaco A es igual al B • H1: uno de los dos.

Significación estadística frente a relevancia clínica ¿La diferencia encontrada tiene una relevancia práctica o clínica? •Un fármaco A cura en un 89% de los casos •Un fármaco B cura en un 90% de los casos N=1000 p=0.001 •Un fármaco A cura en un 80% de los casos •Un fármaco B cura en un 90% de los casos •N=500 p=0.06 .

IC99%: (0. por persona. p=0.025 IC95%: (1. 5) Kg.Intervalos de confianza • Sólo en pruebas PARAMÉTRICAS • Dan mucha más información que el nivel de significación “p” Ej: Con una dieta en 80 pacientes se ha reducido una media de 3 Kg. 5. Hay un 95% de confianza de que este intervalo contenga el verdadero valor poblacional .5.5) Kg.

y así disponer de un dato más para decidir si se rechaza o se mantiene la hipótesis formulada . a partir de datos empíricos obtenidos en un único estudio.Pruebas de significación La prueba de significación es una herramienta para valorar la credibilidad de una hipótesis concreta.

Ejemplo: -Suponemos que la alcoholemia aumenta el tiempo de reacción de los sujetos. . -Disponemos de una muestra al azar de 36 sujetos a los que se provoca alcoholemia de 0.8 g/l para valorar el tiempo de reacción ante un estímulo luminoso ( =38 ms y DS=12 ms) X -Debemos disponer de una distribución de referencia con los tiempos de reacción de los sujetos antes de tomar alcohol (μ=31 ms y σ=10 ms). Generalmente no se dispone de esta información.

presenta valores excepcionalmente grandes que corroboran la hipótesis de que la alcoholemia influye sobre el tiempo de reacción: .Ahora averiguaremos si la muestra experimental es semejante a las muestras extraídas al azar de esta distribución de referencia. o por el contrario.

el TCL permite aceptar que esta distribución sigue una ley Normal:n 1036 Media: µx=31 ms y Desviación estándar: SE= = =1.1) Definir la distribución de referencia La distribución de referencia buscada es la distribución muestral de las medias de muestras de tamaño n=36 procedentes de una población con μ=31 ms y σ=10 ms. Puesto que en este estudio la muestra es grande (n>30).67 ms .

Distribución Normal Representación de 100 muestras de tamaño n=36 obtenidas de forma aleatoria 5000 140 120 4000 100 3000 80 60 2000 31 40 20 1000 0 0 0 10 20 30 40 50 60 70 80 90 Por el Teorema Central del Límite: Media muestral Desviación Típica de la media (error estándar de la media) Media poblacional DT n 100 .

.

. Se trata de 1.2)=0. Ir a tablas o con ordenador Pr(X≥38)=Pr(z ≥4.2) Evaluar la verosimilitud de observar en la población de referencia muestras con medias de 38 ms o más Se trata de calcular la probabilidad X X condicionada: P= Pr ( ≥38/ є distribución de referencia) Puesto que la distribución sigue una ley Normal X su de μ=31 y error estándar SE=1.67 transformar el valor =38 m en el valor estandarizado z: z= =4. Esta probabilidad es el valor p del resultado de nuestro experimento.2. 38  31 cálculo es muy sencillo.000).00001 (1 por 100.67 m.

.

Comparación de los rasgos diferenciales de las pruebas de significación y de las pruebas de hipótesis .

Prueba de significación -Una sola hipótesis: Ho -Valor P: No significativo Significativo (≤0.β . Error tipo II: aceptar Ho si H1 es cierta. Potencia: 1.05) -El valor P no se interpreta como una probabilidad sino como un indicador de credibilidad de la Ho Prueba de hipótesis -Dos hipótesis complementarias: Ho y H1 -Región crítica: Regla de decisión entre H0 y H1 Decisiones erróneas: Error tipo I: aceptar H1 si Ho es cierta. Riesgo β: probabilidad de cometer un error tipo II. Riesgo α: probabilidad de cometer un error tipo I.

Prueba de significación -La muestra de significación no necesita el supuesto de muestreo aleatorio. -El valor P se asocia a un estudio único -El valor P se usa de forma flexible junto con otras informaciones. -Los riesgos α y β representan frecuencias de errores que se producirían al repetir el estudio muchas veces. en el proceso de inferencia inductiva Prueba de hipótesis -La prueba de hipótesis se basa en la teoría de la probabilidad. -La prueba de hipótesis limita el riesgo β con el cálculo previo del número de sujetos . -El valor P se usa como índice de credibilidad de la Ho.

Más conclusiones .

No demuestra que la Ho sea cierta. -Un resultado significativo no permite dar una conclusión en sentido causal.-El valor P es un valor asociado a un experimento concreto que debe ser utilizado de forma flexible y considerado como un argumento más en el proceso de inferencia inductiva que forma parte del ciclo iterativo que genera el método de investigación científica. Dependerá del diseño del estudio. -”Estadísticamente no significativo” sólo indica que es compatible con la Ho porque la discrepancia observada es pequeña. .

nada tiene que ver con la importancia clínica.-Que sea significativo. Un resultado puede ser estadísticamente muy significativo y carecer de relevancia clínica. biológica o práctica de la hipótesis. indica que la Ho es poco creíble. . biológica o práctica de la hipótesis. -La expresión “muy significativo” tampoco tiene nada que ver con la magnitud del efecto ni con la intensidad de la relación entre las variables.

Intervalos de confianza versus pruebas de significación .

Si el IC incluye el valor δ=0 (hipótesis nula) el “efecto” no es estadísticamente significativo • El valor P resultante de la prueba no permite a un clínico experto realizar ningún juicio sobre la importancia clínica del “efecto” observado .Intervalo de confianza Prueba de significación • Proporciona información sobre la magnitud del “efecto” (con un elevado nivel de confianza) • Informa sobre la probable existencia de un “efecto” • Cuanto más estrecho es el IC mayor información tenemos sobre la magnitud del “efecto” • Cuanto más pequeño es el valor P menos probable es que el “efecto” pueda haber sido producido por azar (variabilidad propia del muestreo) • Esta información es un argumento más que ayuda a un clínico experto a valorar la importancia práctica del “efecto” • Un valor P más pequeño no es indicativo de un “efecto” de mayor intensidad • Representa el conjunto aceptable de hipótesis.