Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Semana 5 (Hipotesis)
Semana 5 (Hipotesis)
El procedimiento cuantifica en que medida los datos de la muestra apoyan la hiptesis planteada
En Estadstica
Los mtodos estadsticos son herramientas de la ciencia para el contraste formal de hiptesis. Las hiptesis para ser contrastadas con mtodos estadsticos deben ser formuladas de modo particular
Elementos necesarios
Las hiptesis Un procedimiento para responder a la pregunta o hiptesis utilizando los datos de la muestra Criterios para interpretar los resultados
Hiptesis
Son enunciados formulados como respuestas tentativas a preguntas de investigacin. Pregunta de investigacin Hiptesis
Mtodo Cientfico
Cmo funciona la Ciencia:
1. 2. 3.
4.
Se formula una hiptesis. Se obtienen datos (muestra) La hiptesis es contrastada con la evidencia de la muestra. Conclusin
La evidencia proviene de la informacin de las observaciones del fenmeno que se estudia. Las observaciones se obtienen de unidades de estudio (individuos), usualmente de una muestra.
Porqu hiptesis?
La pregunta de investigacin debe tratar de expresarse en forma de hiptesis El mtodo cientfico no permite determinar que una hiptesis es verdadera, solamente puede determinar si es falsa Por lo tanto debe plantearse una hiptesis que al ser rechazada d respuesta a la pregunta de investigacin
Ejemplos
Ho Riesgo relativo = 1 Resistencia 50% XCD4-intervencin = XCD4-estndar Sensibtest1 Sensibtest2 Xint1 = Xint2 = Xint3 = Xint4 En una regresin, 1 = 0 Ha Riesgo relativo 1 Resistencia < 50% XCD4-intervencin XCD4-estndar Sensibtest1 > Sensibtest2 Algn Xi es diferente 1 0
De existencia del EFECTO (de un tratamiento). De una DIFERENCIA (de las medias del peso al nacer las proporciones del bajo peso al nacer entre dos poblaciones). De la ASOCIACIN (entre el tipo de construccin de las casas y la distribucin del Dengue).
Ejemplos adicionales:
La Altura produce incremento en la frecuencia de nacimientos prematuros: Existe DIFERENCIA entre las Edades gestacionales de neonatos en la Altura vs. a Nivel del Mar. La sustancia X incrementa la posibilidad de malformaciones congnitas: Existe DIFERENCIA en la prevalencia de malformaciones congnitas entre gestantes expuestas a X vs. No expuestas.
Que los alumnos formulen sus preguntas de investigacin y las conviertan en hiptesis
La Hiptesis nula y la Hiptesis alternativa habitualmente (p. ej. en Epidemiologa) se plantean en funcin de una Medida del
Efecto.
Medidas del efecto son:
Diferencias de medias, Diferencias de prevalencias Razones de riesgo (Riesgos relativos) Razones de chances (Odds ratios)
Ejemplo
Queremos determinar si el promedio de peso en varones es bajo (<70k) Ho: Peso 70, Ha: Peso > 70
10
El Valor P y la evidencia
El Valor P Significancia estadstica es una medida (cuantitativa) de la fuerza de la evidencia en contra de la Hiptesis nula. Escala de grises Mientras ms pequeo sea el valor P, ms fuerte es la evidencia en contra de la hiptesis nula.
11
12
13
Valor P (continuacin)
Si las observaciones en la muestra soportan la Hiptesis nula. Entonces es ms probable que esta Hiptesis sea cierta.
Reglas de Decisin
Para tomar una decisin sobre rechazar o no rechazar la hiptesis nula hay que especificar una Regla de decisin. Hay que especificar un punto de corte punto crtico: Si P es menor que Alfa (), se rechaza Ho Si P es mayor que Alfa (), se rechaza Ho
14
Yes
Inference on means?
Yes
Independent?
No
Inference on variance?
Yes
Variance known?
No
Paired t
Yes
1 F test for variances
No
Yes
Z test
Variances equal?
Yes
T test w/ pooled variance
No
T test w/ unequal variance
15
Normal/Large Sample Data? No Yes Independent? No Yes Expected 5 Yes 2 sample Z test for proportions or contingency table No Fishers Exact test
4
Binomial?
No
Nonparametric test
McNemars test
Ahora, recordemos que estamos usando una muestra para concluir sobre la poblacin
Es posible (poco probable, ojal) que la decisin tomada de rechazar o no Ho sea errnea
16
Escenarios posibles
ESTADO REAL (LA VERDAD)
H0 es falsa y H0 es verdadera, Ha es verdadera No hay diferencia Hay diferencia
No diferencia (No rechaza H0))
Posibles escenarios
ESTADO REAL (VERDAD) desconocido
Hay Diferencia No hay diferencia
NO HAY ERROR
Error Tipo I
()
NO HAY ERROR
Error Tipo II
()
17
Rechazar Ho siendo esta cierta (Error tipo I). No rechazar Ho siendo esta falsa (Error tipo II)
2.
Error Tipo I ()
PUEDE ocurrir cuando la evidencia (datos de la muestra) sugiere NO RECHAZAR Ho El error consiste en reportar una diferencia o asociacin que realmente no existe Puede deberse a un tamao de muestra muy grande que detecta diferencias no biolgicas Tambin puede darse por azar, estimndose que puede ocurrir con una probabilidad p
18
Error Tipo II ()
PUEDE ocurrir cuando la evidencia sugiere RECHAZAR Ho El error consiste en reportar que no hay una diferencia o asociacin cuando si la hay Puede deberse a tener una muestra pequea que no permite detectar diferencias reales Tambin puede darse por azar, aunque el clculo de la probabilidad () es muy complejo
Habitualmente (Tradicionalmente) se especifica a priori un punto de corte () de 0.05. Esto trasladado a nuestra regla de decisin, significa que el Error tipo I de la prueba estadstica ser del 5%. Una vez especificado el valor de , tenemos controlada la magnitud del Error tipo I. El Error tipo II () se controla modificando el tamao de la muestra. En general y se minimizan con tamaos de muestra grandes.
19
Cmo determinar el tamao de los errores y ? :Debiera depender de las consecuencias de cometer uno u otro error ? EJEMPLOS: Al investigar una nueva Droga en un estudio in vitro: Si el resultado es significativo se continua investigando; caso contrario se abandona el estudio. En este caso tiene ms sentido minimizar (abandonar para siempre el estudio de una droga efectiva).
En un ensayo clnico de una Droga para tratar una enfermedad (que tiene varios otros tratamientos efectivos). Si el resultado es significativo, la droga entra al mercado; caso contrario el trabajo en esta droga cesar. El error (abandonar el estudio de una droga efectiva para la que existen varias opciones) no es tan importante como cometer un error que implicara sacar al mercado una droga intil. En este caso tendra prioridad en ser minimizada
20
Supuestos ms comunes
Todas las observaciones son independientes entre s Tamao de muestra grande para que se cumpla el teorema del lmite central En variables numricas, no deben haber valores extremos o sesgos que limiten la representatividad del promedio como medida de tendencia central
21
Se llev a cabo un Ensayo clnico asignando de manera aleatoria (y ciega) la droga A y la droga B a 300 pacientes con Hepatitis crnica. Se observ que en el grupo que recibi la droga A, 30% tuvieron respuesta favorable. En contraste con el grupo que recibi la droga B (17% respondieron favorablemente).
22
Especificando un punto de corte para significancia: Alfa () = 0.05 Prueba estadstica para comparar proporciones (30% versus 17%): P=0.015 Conclusin: La diferencia en las respuestas al tratamiento entre los grupos (droga A vs. droga B) es significativa.
Dependiendo de la Medida del efecto empleada (diferencias, odds ratios [OR], riesgos relativos [RR]) y del tipo de variables a analizar (promedios, proporciones, tiempo hasta un evento, etc...) las hiptesis varian, as como los mtodos estadsticos que se deben usar.
23
Significancia estadstica vs. Significancia biolgica. La significancia estadstica no dice nada acerca de la verdadera magnitud o la importancia de un efecto. En muestras grandes, las diferencias muy pequeas que tienen poca o ninguna importancia biolgica pueden resultar significativas. Las Implicancias de un resultado significativo deben ser juzgados en otro terreno [el Biolgico], adems del estadstico.
24
Variables: p59 (Edad de inicio del consumo de cigarrillos) e inf_sexo (Sexo) Prueba estadstica: Prueba t para dos medias independientes
25
Variables: fuma (generada de p58) e inf_sexo (Sexo) Prueba estadstica: Prueba Z para dos proporciones
26