Documentos de Académico
Documentos de Profesional
Documentos de Cultura
8 PRUEBAS DE HIPOTESIS
Proporción: P
8.1 Introduccion Diferencia de proporciones: P1 – P2
Como ocurre con la estimación, el propósito de Es importante aclarar que para estimar los
las pruebas de hipótesis es ayudar al parámetros de una o dos poblaciones, la
investigador a tomar una decisión en torno a estimación y las pruebas de hipótesis no son
una población, al examinar una muestra de ella tan distintas. Es posible utilizar intervalos de
(1). confianza para llegar a las mismas conclusiones
que se alcanzan al utilizar los procedimientos
Hasta el momento se han utilizado algunas de pruebas de hipótesis.
pruebas de hipótesis para contrastar la
normalidad de un conjunto de datos
(Kolmogorov-Smirnov & Shapiro-Wilk) y la 8.2 Prueba de hipotesis
igualdad de varianzas de dos o más muestras
(Levene, Bartlett, entre otras). Se ha Una hipótesis se define simplemente como una
mencionado una hipótesis nula (Ho) y una proposición o afirmación acerca de la
hipótesis alterna (Ha). población. En otras palabras, es una afirmación
acerca de los parámetros (obviamente de la
Recordemos que las pruebas de Kolmogorov- población).
Smirnov (n>50) y Shapiro-Wilk (n50) permiten
contrastar la hipótesis: Los elementos de una prueba de hipótesis se
pueden resumir así:
Ho: La distribución de los datos es normal
Ha: La distribución de los datos no es normal 1. Hipótesis nula, Ho
2. Hipótesis alternativa, Ha
Un valor p muy pequeño (<0.05) para la prueba 3. Estadístico de prueba
de Kolmogorov-Smirnov o Shapiro-Wilk conlleva 4. Región de rechazo , RR
a rechazar la hipótesis nula, y concluir que los 5. Decisión
datos no se distribuyen normalmente. Un valor 6. Conclusión
grande de p (≥0.05) no permite rechazar la
hipótesis nula, y aceptar que el conjunto de La idea general de una prueba de hipótesis es
datos se distribuye de manera normal. plantear las hipótesis a contrastar (Ho y Ha),
elegir la prueba estadística adecuada y calcular
Igualmente, el test de Levene permite un estadístico de prueba. Establecer una región
determinar la homocedasticidad o de rechazo para el estadístico de prueba, y
heterocedasticidad de dos o más muestras. Se finalmente llegar a una conclusión. Un resumen
plantea la hipótesis: de las pruebas de hipótesis para los 7 casos que
estamos viendo se presenta al final de la sesión
Ho: Las varianzas de las muestras son iguales en la
Ha: Las varianzas no son iguales
Media:
Diferencia de medias: 1 – 2
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 43
Tabla 2. valores posibles que los parámetros pueden conlleva a rechazar Ho, y se dice que es
asumir. significativo (1).
El caso 1 (para X no normal y n grande), y el
caso 3 (comparación de dos medias con El nivel de significación, , es la probabilidad
varianzas conocidas) se presentan al final de la Ejemplo 2: de rechazar una hipótesis nula verdadera. Dado
sesión como un anexo para las personas que que rechazar una hipótesis nula verdadera
quieran consultarlo. La razón de esto es que en Para las hipótesis nulas planteadas en el sería un error, parece razonable hacer pequeña
la práctica se utiliza la prueba t de Student ejemplo 1, las hipótesis alternativas son: la probabilidad de cometerlo, y de hecho esto
para una o dos muestras, y las varianzas de las es lo que se hace al trabajar con un
poblaciones raramente son conocidas. A B C pequeño.
Hipótesis
El caso 1 (X normal y desviación estándar H0 : = 0 H0 : 0 H0 : 0
nula El error que se comete cuando se rechaza la
poblacional conocida), aunque tampoco se Hipótesis hipótesis nula verdadera se conoce como error
utiliza mucho en la práctica, se desarrolla en Ha : 0 Ha : > 0 Ha : < 0
alternativa tipo I (1).
esta sesión, ya que sirve como ejemplo para Cuando la hipótesis alterna se plantea con el El error tipo II se comete cuando no se rechaza
familiarizarse con el concepto de pruebas de signo “” se dice que la prueba es bilateral o la hipótesis nula falsa. La probabilidad de
hipótesis. de dos colas (two-tailed). Si el signo de la cometer un error tipo II se designa por beta ()
hipótesis alternativa es “>” ó “<” la prueba es (1).
unilateral o de una cola (one-tailed).
8.2.1 Hipótesis nula, Ho En la Tabla 1 se muestran los dos tipos de
errores que se pueden cometer en un estudio,
En las pruebas de hipótesis se trabaja con dos 8.2.3 Estadístico de prueba que dan origen a la confiabilidad y el poder del
hipótesis estadísticas que deben enunciarse estudio. El poder también se conoce como la
explícitamente (1). potencia de la prueba estadística.
El estadístico de prueba es alguna estadística
La primera es la hipótesis que debe probarse,
que se puede calcular a partir de los datos de
mejor conocida como hipótesis nula, y que se
la muestra (zc o tc, léase z calculado y t Tabla 1. Condiciones en las que es posible
designa por el símbolo Ho (o H1). La hipótesis
calculado, respectivamente). La magnitud de cometer un error de tipo I y un error de tipo II
nula a veces se conoce como la hipótesis de no
la estadística de prueba permitirá aceptar o
diferencia (o hipótesis de igualdad) (1).
rechazar la hipótesis nula (1). Un ejemplo de Condición verdadera
estadística de prueba para el caso 1 es la H0 es verdadera H0 es falsa
cantidad: “Decisión
Ejemplo 1:
x 0 No correcta”
Error tipo II
Conclusiones de la
Para probar una media poblacional (Caso 1), se zc rechaza Nivel de
podría plantear, por ejemplo, cualquiera de las H0 confianza
muestra
n (1- )
siguientes hipótesis nulas (A, B, C), donde 0 es
un valor o numero real (media poblacional a “Decisión
Error tipo I
probar) que el investigador propone contrastar. correcta”
Rechaza Nivel de
8.2.4 Región de rechazo, RR Poder de la
H0 significación
prueba
A. Ho : = 0
(1 – )
B. Ho : 0 Especifica los valores del estadístico de prueba
C. Ho : 0 para los cuales se rechaza la hipótesis nula, y
se toma con base en el nivel de significación 8.2.5 Decisión
En el caso A el investigador propone, como deseado, que se designa por . Recuerde que
hipótesis nula, probar si la media de la la cantidad (1-) es el nivel de confianza. Un
población es igual a un valor especifico 0. En ejemplo de región de rechazo es la que se A partir de los datos de la muestra se calculó
encuentra sombreada en las siguientes una estadística de prueba (zc o tc), y se
el caso B el interés es simplemente saber si es
graficas: comparó con las regiones de aceptación y de
menor o igual que el valor 0 y en el caso C si
rechazo especificadas (1).
es mayor o igual que 0.
La decisión estadística consiste en el rechazo o
En general la hipótesis nula se establece con el Prueba no rechazo de la hipótesis nula. Se rechaza Ho
propósito de ser rechazada. En el proceso de bilateral si el valor calculado de la estadística de prueba
prueba, la hipótesis nula puede ser rechazada
cae en la región de rechazo, y no se rechaza si
o no rechazada. Si la hipótesis nula no se
el valor calculado de la estadística de prueba
rechaza (o se acepta) se dirá que los datos Región de
cae en la región de aceptación (1).
sobre los cuales se basa la prueba no aceptación
proporcionan evidencia suficiente que cause el /2 /2
rechazo. Si el procedimiento de la prueba 8.2.6 Conclusión
conduce al rechazo, se concluye que los datos
disponibles no son compatibles con la hipótesis
nula (1). En este caso se aceptará la hipótesis Si se rechaza Ho, se concluye que Ha es
alternativa. verdadera.
Si no se rechaza Ho, se concluye que Ho
Prueba
puede ser verdadera.
unilateral
8.2.2 Hipótesis alternativa, Ha (Ha: >)
Región de Es importante aclarar que cuando la hipótesis
nula no es rechazada, tampoco se puede decir
Es importante aclarar que la hipótesis de aceptación que se acepta. Se debe decir que la hipótesis
interés para el investigador se describe en la
nula “no se rechaza”. Se evita el uso de la
hipótesis alternativa. Las hipótesis nula y
El nivel de significación, , designa el área de palabra “aceptar” en este caso porque pudo
alternativa son complementarias. Es decir, las
rechazo. Un valor calculado para el estadístico haberse cometido un error tipo II (1).
dos contemplan detalladamente todos los
de prueba que cae en la región de rechazo
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 44
Caso 1:
Observe en la
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 45
Ejemplo 4: En una prueba bilateral la región de rechazo se Cuando el muestreo se realiza a partir de una
divide entre los dos lados o colas de la población que sigue una distribución normal
En el ejemplo anterior, se plantearon las distribución de la estadística de prueba. con varianza desconocida se utiliza la prueba t
hipótesis: de Student para una muestra (1). La estadística
En una prueba de hipótesis unilateral, la región de prueba es:
Ho : = 25 de rechazo esta en una sola cola (derecha o
x 0
Ha : 25 izquierda) según el signo de la hipótesis nula (>
ó < respectivamente).
tc
s
Si un investigador reporta el valor p=0.1586 de
la prueba de hipótesis, al utilizar un nivel de
n
significancia de 0.01 ó 0.05, se llega a la Ejemplo 6:
conclusión de que no es posible rechazar H0. La cual, cuando Ho es verdadera, sigue una
Utilizando la información del ejemplo 3, distribución t de Student con n-1 grados de
Por ejemplo, suponiendo que el valor p hubiera suponer que los investigadores se hubieran libertad.
sido 0.001, entonces a un nivel de significancia preguntado: ¿Se puede concluir que < 25?
0.01 ó 0.05, se rechazaría la hipótesis nula.
Solución: Ejemplo 7:
Prueba de hipótesis vs. Intervalos de Hipótesis nula y alterna: (1) Varios investigadores reunieron las
confianza concentraciones de amilasa en el suero de una
Ho : 25 muestra aleatoria de 15 personas
Anteriormente se dijo que es posible utilizar Ha : < 25 aparentemente sanas. La media y desviación
intervalos de confianza para llegar a las estándar calculadas a partir de la muestra son
mismas conclusiones que se alcanzan al utilizar El signo < de la hipótesis alternativa, 96 y 35 unidades/100 ml, respectivamente. Los
los procedimientos de pruebas de hipótesis. determina que la prueba es unilateral. investigadores desean saber si es posible
concluir que la media de la población de la
Comprobemos con el siguiente ejemplo: El estadístico de prueba es: cual se extrajo la muestra:
a) Es distinta de 120
Ejemplo 5: x 0 22 25 -1,41 b) Es menor de 120
zc
En el ejemplo anterior se uso el procedimiento 45
n Solución:
de prueba de hipótesis para probar H0: = 25 10
contra la hipótesis alternativa H0: 25. No
Para un nivel de significancia de 0.05, la región a) Los investigadores pueden confirmar su
fue posible rechazar la hipótesis nula, ya que
hipótesis si logran rechazar la hipótesis
el estadístico de prueba cayó en la región de de rechazo esta dada por Z = -1.645
nula que dice que la media real es 120.
aceptación (valor p=0.1586).
Esto sugiere una prueba de hipótesis
bilateral.
Construyendo un intervalo de confianza del 95%
para , se tiene que: Hipótesis nula y alterna:
Región de
x Z1 / 2 Ho : = 120
aceptación Ha : 120
n
El estadístico de prueba es:
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 47
El valor p para esta prueba fue de 0.085 > 0.05, Para un nivel de significancia de 0.05, la región
por tanto no es posible rechazar la hipótesis de rechazo esta dada por zc > z1-/2 = 1,96
nula.
Caso 7:
Ejemplo 9:
Según la
(1) Suponer que hay interés por saber qué
proporción de la población de conductores de
automóviles utiliza con regularidad el cinturón
de seguridad del asiento. En una encuesta de
300 conductores adultos de automóviles, 123
de ellos dijeron que regularmente utilizaban el
cinturón de seguridad del asiento. ¿Es posible
concluir a partir de estos datos que, en la
población muestreada, la proporción de
quienes utilizan regularmente el cinturón de
seguridad no es de 0.50 (equivalente al 50%)?
Solución:
q̂ = 1- p̂ = 0,59
La hipótesis es:
H0 : p = 0.50
Ha : p 0.50
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 49
La prueba que se utiliza con mayor frecuencia La hipótesis alterna planteada permite probar El valor p para esta prueba es:
con relación a la diferencia entre las que la proporción de pacientes que se curan
proporciones de dos poblaciones es aquella en con el tratamiento habitual (p1) es menor que P(Z < zc) = P(Z < -2,31) = 0,0104
la que su diferencia es cero. Cuando la la proporción de pacientes que se curan con el
hipótesis nula (Ho) que va a probarse es p1- nuevo tratamiento (p2). Si se llega a rechazar Hasta ahora se ha visto que existen dos
p2=0, se supone que las proporciones de las dos la hipótesis nula (Ho), podríamos concluir que maneras de determinar si dos proporciones son
poblaciones son iguales. Esto se utiliza como el nuevo tratamiento es mas efectivo. estadísticamente significativas o no. Una de
justificación para combinar los resultados de ellas es construir un IC y la otra es plantear
las dos muestras y obtener una estimación Se tienen los siguientes datos: una prueba de hipótesis. En la práctica se usa
ponderada de la proporción común supuesta. Si la prueba Chi-cuadrado para el caso 7, la cual
se adopta este procedimiento se calcula (1): Individuos que será vista en detalle en la sesión 12 del curso.
Tamaño
Tratamiento respondieron
muestra
x1 x2 q 1 p
satisfactoriamente
p y
Habitual n1 = 100 x1 =78
n1 n2 Referencias:
Nuevo n2 = 100 x2 =90 (1) Daniel Wayne W. Bioestadística. Base para
donde x1 y x2 son, respectivamente, el numero
el análisis de las ciencias de la salud.
de la primera y segunda muestra que poseen la
x1 78 x2 90 Editorial Limusa S.A. Grupo Noriega
característica de interés.
pˆ1 0,78 pˆ 2 0,90 Editores. 2000.
n1 100 n2 100
La estadística de prueba es:
Luego,
( pˆ 1 pˆ 2 ) ( p1 p2 )
zc
pq pq x1 x2 78 90
p 0,84
n1 n2 n1 n2 100 100
Solución:
Parámetro Caso Supuestos Hipótesis nula Hipótesis alternativa Estadístico de prueba Región de rechazo
x1 = 62,6 s1 = 33,8
2 2
x 2 = 47,2 s2 = 10,1 Donde, w s1 ; w s 2 ,
1 2
n1 n2
Solución: Región de
t1 = t1-/2; con (n1-1) grados de libertad y /2 aceptación /2
H0 : 1 - 2 = 0 H0 : 1 = 2 t2 = t1-/2; con (n2-1) grados de libertad
ó
Ha : 1 - 2 0 Ha : 1 2
-2.25 2.25
s2 (33,8) 2 = 114,2
w1 1
El estadístico de prueba es: n1 10 El estadístico de prueba calculado (t’c =
1,41) cae en la región de aceptación, por
2
( x1 x2 ) ( 1 2 ) s22 (10,1) = 5,1 tanto no es posible rechazar H0.
t c' w2
s12 s 22 n2 20 No es posible concluir que las dos muestras
t1 = t1-/2; para (n1-1) g.l. de las dos poblaciones son diferentes.
n1 n2
t1 = t0.975; para (9) g.l. t1 = 2.2622