Prueba de Hipótesis

Tipos de inferencias (2)

PRUEBA DE HIPOTESIS: busca responder a una pregunta sobre el valor de un parámetro en la población (siempre utilizando los resultados de la muestra)
Esta pregunta sobre el valor del parámetro en la

población se plantea utilizando hipótesis

El procedimiento cuantifica en que medida los datos de la muestra apoyan la hipótesis planteada

En el ejemplo anterior, la pregunta es si hay menos resistencia con el nuevo antimalárico

En Estadística

Los métodos estadísticos son herramientas de la ciencia para el contraste formal de hipótesis. Las hipótesis para ser contrastadas con métodos estadísticos deben ser formuladas de modo particular

Elementos necesarios

Las hipótesis

Un procedimiento para responder a la pregunta o hipótesis utilizando los datos de la muestra
Criterios para interpretar los resultados

Hipótesis  Son enunciados formulados como respuestas tentativas a preguntas de investigación. Pregunta de investigación  Hipótesis  .

Conclusión . Se obtienen datos (muestra) La hipótesis es contrastada con la evidencia de la muestra.Método Científico  Cómo funciona la Ciencia: 1. Se formula una hipótesis. 4. 2. 3.

Las observaciones se obtienen de unidades de estudio (individuos). • . usualmente de una muestra.• La evidencia proviene de la información de las observaciones del fenómeno que se estudia.

Porqué hipótesis?  La pregunta de investigación debe tratar de expresarse en forma de hipótesis El método científico no permite determinar que una hipótesis es verdadera. solamente puede determinar si es falsa Por lo tanto debe plantearse una hipótesis que al ser rechazada dé respuesta a la pregunta de investigación   .

Las dos hipótesis  Hipótesis nula. es planteada en forma opuesta a la pregunta de investigación de interés. H0 Hipótesis de no diferencia o no asociación. Aceptaremos que Ha es verdadera si los datos sugieren que H0 es falsa: “la tasa de resistencia difiere entre ambos antimaláricos”  . definida para ser rechazada: “la tasa de resistencia a ambos antimaláricos es similar” Hipótesis alternativa o alterna. Ha Es la pregunta científica de interés.

Ejemplos Ho Riesgo relativo = 1 Ha Riesgo relativo  1 Resistencia  50% XCD4-intervención = XCD4-estándar Resistencia < 50% XCD4-intervención  XCD4-estándar Sensibtest1  Sensibtest2 Xint1 = Xint2 = Xint3 = Xint4 En una regresión. β1 = 0 Sensibtest1 > Sensibtest2 Algún Xi es diferente β1  0 Curaanalgésico1 < Curaanalgésico2 Curaanalgésico1  Curaanalgésico2 .

De la ASOCIACIÓN (entre el tipo de construcción de las casas y la distribución del Dengue). – . De una DIFERENCIA (de las medias del peso al nacer ó las proporciones del bajo peso al nacer entre dos poblaciones).Las hipótesis se plantean como: – – De existencia del EFECTO (de un tratamiento).

No expuestas. –  Que los alumnos formulen sus preguntas de investigación y las conviertan en hipótesis . a Nivel del Mar. La sustancia X incrementa la posibilidad de malformaciones congénitas: Existe DIFERENCIA en la prevalencia de malformaciones congénitas entre gestantes expuestas a X vs. Ejemplos adicionales: – La Altura produce incremento en la frecuencia de nacimientos prematuros: Existe DIFERENCIA entre las Edades gestacionales de neonatos en la Altura vs.

No hay efecto.  .Formulación de Hipótesis (continuación)  Hipótesis Nula (Ho) : – Enunciado formal para el contraste de hipótesis con métodos estadísticos: No hay asociación. Hipótesis alternativa (H1): – Hipótesis complementaria a Ho: Si hay asociación. No hay diferencia. Si hay efecto. Si hay diferencia.

en Epidemiología) se plantean en función de una Medida del Efecto. Diferencias de prevalencias Razones de riesgo (Riesgos relativos) Razones de chances („Odds ratios‟) .  Medidas del efecto son: – – – – Diferencias de medias. ej. La Hipótesis nula y la Hipótesis alternativa habitualmente (p.

Hipótesis de dos colas  Un clínico trata de demostrar que la reacción al tratamiento es diferente entre el fármaco A y el fármaco B Hipótesis: Ho: A = B (Nula) Ha: A  B (Alterna)  .

Hipótesis de una cola  Interés específico en una sola dirección No existe interés/relevancia científica si el efecto se presenta en la otra dirección Ejemplo: se quiere demostrar que el fármaco A tiene mayor efecto que el fármaco B Hipótesis: Ho: A  B (Nula) Ha: A > B (Alterna)    .

entonces automáticamente se acepta que Ha es verdadera Si los resultados no indican que se rechaze Ho tampoco se puede concluir nada sobre Ha   .¿Cuál hipótesis es verdadera (o falsa)?  Con los datos de la muestra se calcula un valor (llamado estadístico de prueba) que sirve para decidir si Ho es falsa y debe ser rechazada (única y exclusivamente para eso) Si los resultados sugieren que se debe rechazar Ho.

el famoso valor p El valor p. “p”. se calcula una probabilidad. que varía según el tipo de hipótesis evaluada).05 (5%). entonces es muy probable que Ho sea falsa y por lo tanto debe ser rechazada   . o p-value puede interpretarse como la probabilidad de que Ho sea verdadera Por convención se acepta que si p < 0.Usando el estadístico de prueba  Con el estadístico de prueba y una fórmula matemática (distribución de probabilidades.

Ha: Peso > 70   En 30 personas.Ejemplo  Queremos determinar si el promedio de peso en varones es bajo (<70k) Ho: Peso  70. 10 kg .E. promedio 50kg y D.

.

Escala de grises……   Mientras más pequeño sea el valor P. . más fuerte es la evidencia en contra de la hipótesis nula.El Valor P y la evidencia  El Valor P ó Significancia estadística es una medida (cuantitativa) de la fuerza de la evidencia en contra de la Hipótesis nula.

El Valor P como una probabilidad .

96 Tcrítico = -1.Utilizando el valor crítico Zobservado = -10. 70 Región de rechazo: 2.5% bajo la curva .

Cálculo de probabilidad exacta Zobservado = -10.96 p exacto = área bajo la curva .

 Una interpretación práctica (aunque no exacta) del valor P es: “P es la probabilidad de que la Hipótesis nula sea cierta” .

Entonces es más probable que esta Hipótesis sea cierta.Valor P (continuación)  Si las observaciones en la muestra soportan la Hipótesis nula. .

Reglas de Decisión   Para tomar una decisión sobre rechazar o no rechazar la hipótesis nula hay que especificar una Regla de decisión. se rechaza Ho . Hay que especificar un punto de corte ó punto crítico: – Si P es menor que Alfa (). se rechaza Ho – Si P es mayor que Alfa ().

Para cada prueba. el cálculo de “p” puede diferir Prueba sobre Una proporción Razón de momios Diferencia de 2 proporciones Diferencia de 2 medias Distribución Binomial o normal (Z) Chi cuadrado Z o chi cuadrado ZoT Regresión lineal F La fórmula del estadístico de prueba también cambia! .

Normal/Large Sample Data? Yes Inference on means? Yes Independent? No Inference on variance? Yes Variance known? No Paired t 1 Variances equal? Yes F test for variances No Yes Z test Yes T test w/ pooled variance No T test w/ unequal variance 2 3 .

Normal/Large Sample Data? No Yes Independent? No Binomial? No Nonparametric test Yes Expected ≥5 Yes 2 sample Z test for proportions or contingency table No Fisher’s Exact test 4 McNemar’s test .

ojalá) que la decisión tomada de rechazar o no Ho sea errónea ¿Qué error podríamos cometer? .Ahora. recordemos que estamos usando una muestra para concluir sobre la población Es posible (poco probable.

Escenarios posibles ESTADO REAL (LA VERDAD) H0 es falsa y H0 es verdadera. Ha es verdadera No hay diferencia Hay diferencia EVIDENCIA/ DATOS DE LA No diferencia (No rechaza H0)) NO HAY ERROR Error Tipo II ( β) MUESTRA Hay diferencia (Rechazar H0 y aceptar Ha) Error Tipo I (α) NO HAY ERROR .

Posibles escenarios ESTADO REAL (VERDAD) desconocido Hay Diferencia No hay diferencia EVIDENCIA ( DATOS) observados Diferencia (Rechazar H0) NO HAY ERROR Error Tipo I (α) NO HAY ERROR No diferencia (No rechazar H0) Error Tipo II (β) .

Errores en la toma de decisiones  Al tomar una decisión basados en un punto de corte se pueden cometer uno de dos errores: 1. Rechazar Ho siendo esta cierta (Error tipo I). No rechazar Ho siendo esta falsa (Error tipo II) 2. .

Error Tipo I (α)  PUEDE ocurrir cuando la evidencia (datos de la muestra) sugiere NO RECHAZAR Ho El error consiste en reportar una diferencia o asociación que realmente no existe Puede deberse a un tamaño de muestra muy grande que detecta diferencias no biológicas También puede darse por azar. estimándose que puede ocurrir con una probabilidad “p”    .

Error Tipo II (β)  PUEDE ocurrir cuando la evidencia sugiere RECHAZAR Ho El error consiste en reportar que no hay una diferencia o asociación cuando si la hay Puede deberse a tener una muestra pequeña que no permite detectar diferencias reales También puede darse por azar. aunque el cálculo de la probabilidad (ß) es muy complejo    .

tenemos controlada la magnitud del Error tipo I. En general  y  se minimizan con tamaños de muestra grandes. El Error tipo II () se controla modificando el tamaño de la muestra. significa que el Error tipo I de la prueba estadística será del 5%.   . Esto trasladado a nuestra regla de decisión.05. Habitualmente (Tradicionalmente) se especifica a priori un punto de corte () de 0. Una vez especificado el valor de .

. En este caso tiene más sentido minimizar  (abandonar para siempre el estudio de una droga efectiva).   ¿Cómo determinar el tamaño de los errores  y  ? :Debiera depender de las consecuencias de cometer uno u otro error ? EJEMPLOS: Al investigar una nueva Droga en un estudio in vitro: Si el resultado es significativo se continua investigando. caso contrario se abandona el estudio.

El error  (abandonar el estudio de una droga efectiva para la que existen varias opciones) no es tan importante como cometer un error  que implicaría sacar al mercado una droga inútil. Si el resultado es significativo. la droga entra al mercado. En un ensayo clínico de una Droga para tratar una enfermedad (que tiene varios otros tratamientos efectivos). En este caso  tendría prioridad en ser minimizada . caso contrario el trabajo en esta droga cesará.

Errores conceptuales comunes  Las inferencias son válidas sólo para las muestras donde se tomaron los datos Si no rechazamos H0 eso significa que H0 es verdadera Una diferencia estadísticamente significativa tiene relevancia biológica El valor p mide que tan diferentes son los promedios/proporciones    .

Supuestos más comunes  Todas las observaciones son independientes entre sí Tamaño de muestra “grande” para que se cumpla el teorema del límite central En variables numéricas. no deben haber valores extremos o sesgos que limiten la representatividad del promedio como medida de tendencia central   .

Ejemplo: Prueba de Hipótesis  Un Clínico compara la proporción de pacientes con Hepatitis crónica que responde favorablemente a dos tratamientos: A y B. Hipótesis: Ho: A – B =0 (Nula) H1: A – B ≠0 (Alterna)  .

  Se llevó a cabo un Ensayo clínico asignando de manera aleatoria (y ciega) la droga A y la droga B a 300 pacientes con Hepatitis crónica. 30% tuvieron respuesta favorable. Se observó que en el grupo que recibió la droga A. En contraste con el grupo que recibió la droga B (17% respondieron favorablemente). .

 Especificando un punto de corte para significancia: Alfa () = 0.05 Prueba estadística para comparar proporciones (30% versus 17%): P=0. droga B) es significativa.015 Conclusión: La diferencia en las respuestas al tratamiento entre los grupos (droga A vs.   .

tiempo hasta un evento.) las hipótesis varian.. riesgos relativos [RR]) y del tipo de variables a analizar (promedios. etc..Dependiendo de la Medida del efecto empleada (diferencias. . odds ratios [OR]. proporciones. así como los métodos estadísticos que se deben usar.

  . Las Implicancias de un resultado „significativo‟ deben ser juzgados en otro terreno [el Biológico]. Significancia estadística vs. En muestras grandes. además del estadístico. Significancia biológica. La significancia estadística no dice nada acerca de la verdadera magnitud o la importancia de un „efecto‟. las diferencias muy pequeñas que tienen poca o ninguna importancia biológica pueden resultar significativas.

Ejemplos con Stata (1)  Pregunta de investigación: ¿El sexo influye en la edad de inicio del consumo de cigarrillos? Ho: Edadinicio consumo(varones-mujeres)=0 H1: Edadinicio consumo(varones-mujeres)≠0 Datos: Encuesta de drogas    .

  Variables: p59 (Edad de inicio del consumo de cigarrillos) e inf_sexo (Sexo) Prueba estadística: Prueba t para dos medias independientes .

Ejemplos con Stata (2)  Pregunta de investigación: ¿Existen diferencias entre sexos en la prevalencia de consumo de cigarrillos? Ho: P(varones) –P(mujeres)=0 H1: P(varones) –P(mujeres)≠0 Datos: Encuesta de drogas    .

  Variables: fuma (generada de p58) e inf_sexo (Sexo) Prueba estadística: Prueba Z para dos proporciones .

Sign up to vote on this title
UsefulNot useful