Está en la página 1de 11

Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 42

Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica

8 PRUEBAS DE HIPOTESIS
 Proporción: P
8.1 Introduccion  Diferencia de proporciones: P1 – P2

Como ocurre con la estimación, el propósito de Es importante aclarar que para estimar los
las pruebas de hipótesis es ayudar al parámetros de una o dos poblaciones, la
investigador a tomar una decisión en torno a estimación y las pruebas de hipótesis no son
una población, al examinar una muestra de ella tan distintas. Es posible utilizar intervalos de
(1). confianza para llegar a las mismas conclusiones
que se alcanzan al utilizar los procedimientos
Hasta el momento se han utilizado algunas de pruebas de hipótesis.
pruebas de hipótesis para contrastar la
normalidad de un conjunto de datos
(Kolmogorov-Smirnov & Shapiro-Wilk) y la 8.2 Prueba de hipotesis
igualdad de varianzas de dos o más muestras
(Levene, Bartlett, entre otras). Se ha Una hipótesis se define simplemente como una
mencionado una hipótesis nula (Ho) y una proposición o afirmación acerca de la
hipótesis alterna (Ha). población. En otras palabras, es una afirmación
acerca de los parámetros (obviamente de la
Recordemos que las pruebas de Kolmogorov- población).
Smirnov (n>50) y Shapiro-Wilk (n50) permiten
contrastar la hipótesis: Los elementos de una prueba de hipótesis se
pueden resumir así:
Ho: La distribución de los datos es normal
Ha: La distribución de los datos no es normal 1. Hipótesis nula, Ho
2. Hipótesis alternativa, Ha
Un valor p muy pequeño (<0.05) para la prueba 3. Estadístico de prueba
de Kolmogorov-Smirnov o Shapiro-Wilk conlleva 4. Región de rechazo , RR
a rechazar la hipótesis nula, y concluir que los 5. Decisión
datos no se distribuyen normalmente. Un valor 6. Conclusión
grande de p (≥0.05) no permite rechazar la
hipótesis nula, y aceptar que el conjunto de La idea general de una prueba de hipótesis es
datos se distribuye de manera normal. plantear las hipótesis a contrastar (Ho y Ha),
elegir la prueba estadística adecuada y calcular
Igualmente, el test de Levene permite un estadístico de prueba. Establecer una región
determinar la homocedasticidad o de rechazo para el estadístico de prueba, y
heterocedasticidad de dos o más muestras. Se finalmente llegar a una conclusión. Un resumen
plantea la hipótesis: de las pruebas de hipótesis para los 7 casos que
estamos viendo se presenta al final de la sesión
Ho: Las varianzas de las muestras son iguales en la
Ha: Las varianzas no son iguales

Al igual que en las pruebas de normalidad, un


valor p muy pequeño para el test de Levene
indicaría que se rechaza Ho, y por tanto las
varianzas de las muestras son diferentes. Un
valor p grande no permitiría rechazar Ho, y por
tanto concluir que las muestras tendrían
varianzas iguales.

En esta sesión se tratará ampliamente la


conceptualización teórica y matemática de las
pruebas de hipótesis. No obstante considero
importante su entendimiento para luego
extender sus conceptos a todas las pruebas
estadísticas que veremos en este curso.

Las pruebas de hipótesis que se tratarán en


esta sesión son para hacer estimaciones de los
parámetros de la población:

 Media: 
 Diferencia de medias: 1 – 2
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 43

Tabla 2. valores posibles que los parámetros pueden conlleva a rechazar Ho, y se dice que es
asumir. significativo (1).
El caso 1 (para X no normal y n grande), y el
caso 3 (comparación de dos medias con El nivel de significación, , es la probabilidad
varianzas conocidas) se presentan al final de la Ejemplo 2: de rechazar una hipótesis nula verdadera. Dado
sesión como un anexo para las personas que que rechazar una hipótesis nula verdadera
quieran consultarlo. La razón de esto es que en Para las hipótesis nulas planteadas en el sería un error, parece razonable hacer pequeña
la práctica se utiliza la prueba t de Student ejemplo 1, las hipótesis alternativas son: la probabilidad de cometerlo, y de hecho esto
para una o dos muestras, y las varianzas de las es lo que se hace al trabajar con un 
poblaciones raramente son conocidas. A B C pequeño.
Hipótesis
El caso 1 (X normal y desviación estándar H0 :  = 0 H0 :   0 H0 :   0
nula El error que se comete cuando se rechaza la
poblacional conocida), aunque tampoco se Hipótesis hipótesis nula verdadera se conoce como error
utiliza mucho en la práctica, se desarrolla en Ha :   0 Ha :  > 0 Ha :  < 0
alternativa tipo I (1).
esta sesión, ya que sirve como ejemplo para Cuando la hipótesis alterna se plantea con el El error tipo II se comete cuando no se rechaza
familiarizarse con el concepto de pruebas de signo “” se dice que la prueba es bilateral o la hipótesis nula falsa. La probabilidad de
hipótesis. de dos colas (two-tailed). Si el signo de la cometer un error tipo II se designa por beta ()
hipótesis alternativa es “>” ó “<” la prueba es (1).
unilateral o de una cola (one-tailed).
8.2.1 Hipótesis nula, Ho En la Tabla 1 se muestran los dos tipos de
errores que se pueden cometer en un estudio,
En las pruebas de hipótesis se trabaja con dos 8.2.3 Estadístico de prueba que dan origen a la confiabilidad y el poder del
hipótesis estadísticas que deben enunciarse estudio. El poder también se conoce como la
explícitamente (1). potencia de la prueba estadística.
El estadístico de prueba es alguna estadística
La primera es la hipótesis que debe probarse,
que se puede calcular a partir de los datos de
mejor conocida como hipótesis nula, y que se
la muestra (zc o tc, léase z calculado y t Tabla 1. Condiciones en las que es posible
designa por el símbolo Ho (o H1). La hipótesis
calculado, respectivamente). La magnitud de cometer un error de tipo I y un error de tipo II
nula a veces se conoce como la hipótesis de no
la estadística de prueba permitirá aceptar o
diferencia (o hipótesis de igualdad) (1).
rechazar la hipótesis nula (1). Un ejemplo de Condición verdadera
estadística de prueba para el caso 1 es la H0 es verdadera H0 es falsa
cantidad: “Decisión
Ejemplo 1:
x  0 No correcta”
Error tipo II

Conclusiones de la
Para probar una media poblacional (Caso 1), se zc  rechaza Nivel de

podría plantear, por ejemplo, cualquiera de las  H0 confianza

muestra
n (1- )
siguientes hipótesis nulas (A, B, C), donde 0 es
un valor o numero real (media poblacional a “Decisión
Error tipo I
probar) que el investigador propone contrastar. correcta”
Rechaza Nivel de
8.2.4 Región de rechazo, RR Poder de la
H0 significación
prueba
A. Ho :  = 0 
(1 – )
B. Ho :   0 Especifica los valores del estadístico de prueba
C. Ho :   0 para los cuales se rechaza la hipótesis nula, y
se toma con base en el nivel de significación 8.2.5 Decisión
En el caso A el investigador propone, como deseado, que se designa por . Recuerde que
hipótesis nula, probar si la media de la la cantidad (1-) es el nivel de confianza. Un
población es igual a un valor especifico 0. En ejemplo de región de rechazo es la que se A partir de los datos de la muestra se calculó
encuentra sombreada en las siguientes una estadística de prueba (zc o tc), y se
el caso B el interés es simplemente saber si es
graficas: comparó con las regiones de aceptación y de
menor o igual que el valor 0 y en el caso C si
rechazo especificadas (1).
es mayor o igual que 0.
La decisión estadística consiste en el rechazo o
En general la hipótesis nula se establece con el Prueba no rechazo de la hipótesis nula. Se rechaza Ho
propósito de ser rechazada. En el proceso de bilateral si el valor calculado de la estadística de prueba
prueba, la hipótesis nula puede ser rechazada
cae en la región de rechazo, y no se rechaza si
o no rechazada. Si la hipótesis nula no se
el valor calculado de la estadística de prueba
rechaza (o se acepta) se dirá que los datos Región de
cae en la región de aceptación (1).
sobre los cuales se basa la prueba no aceptación
proporcionan evidencia suficiente que cause el /2 /2
rechazo. Si el procedimiento de la prueba 8.2.6 Conclusión
conduce al rechazo, se concluye que los datos
disponibles no son compatibles con la hipótesis
nula (1). En este caso se aceptará la hipótesis  Si se rechaza Ho, se concluye que Ha es
alternativa. verdadera.
 Si no se rechaza Ho, se concluye que Ho
Prueba
puede ser verdadera.
unilateral
8.2.2 Hipótesis alternativa, Ha (Ha: >)
Región de Es importante aclarar que cuando la hipótesis
nula no es rechazada, tampoco se puede decir
Es importante aclarar que la hipótesis de aceptación  que se acepta. Se debe decir que la hipótesis
interés para el investigador se describe en la
nula “no se rechaza”. Se evita el uso de la
hipótesis alternativa. Las hipótesis nula y
El nivel de significación, , designa el área de palabra “aceptar” en este caso porque pudo
alternativa son complementarias. Es decir, las
rechazo. Un valor calculado para el estadístico haberse cometido un error tipo II (1).
dos contemplan detalladamente todos los
de prueba que cae en la región de rechazo
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 44

8.3 Prueba de hipótesis para la media


de una población

Caso 1:

Observe en la
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 45

Tabla 2 que se pueden plantear una de las tres


0,95 0,05 -1,645 1,645
siguientes hipótesis: Si se elige un nivel de significación de
0.05 (=0.05), y se sabe que es una 0,96 0,04 -1,75 1,75
1. Ho :  = 0 vs. Ha :   0 prueba bilateral, entonces el valor de Z/2 0,98 0,02 -2,05 2,05
2. Ho :   0 vs. Ha :  < 0 es –1.96 y el valor de Z1-/2 es 1.96:
0,99 0,01 -2,33 2,33
3. Ho :   0 vs. Ha :  > 0
Prueba Bilateral
Cuando el muestreo se realiza a partir de una Nivel de
población que sigue una distribución normal y Confiabilidad significancia Ha: 
se conoce la varianza de la población, la Z Z 1-/2
(1 – ) /2 /2
estadística de prueba es:
Región de 0,90 0,05 -1,645 1,645
x  0 /2 aceptación /2
0,95 0,025 -1,96 1,96
zc 
 0,96 0,02 -2,05 2,05
n 0,98 0,01 -2,33 2,33
-1.96 1.96
0,99 0,005 -2,58 2,58
Ejemplo 3: Figura 1. Región de rechazo para el ejemplo 3
5. La decisión
(1) Un grupo de investigadores está interesado
en conocer la concentración media de una Recordemos esto:
Si ubicamos el estadístico de prueba
enzima en cierta población. Por decirlo así, se Si =0.05 entonces /2=0.025. Se busca calculado (zc = -1.41) en la Figura 1 este
preguntan lo siguiente ¿Es posible concluir que dentro de la tabla de la distribución cae en la región de aceptación, luego no
el nivel medio de la enzima en esta población normal estándar el valor de 0.025 y se se puede rechazar la hipótesis nula.
es diferente de 25? Los datos de una muestra observa que corresponde a un Z de -1.96.
de 10 individuos extraída de la población 6. La conclusión
dieron una media de 22. Supóngase que la Recuerde también que: P(Z<-1.96) = 0.025
muestra proviene de una población normal y Se concluye que la media poblacional, ,
que la población tiene una varianza conocida Entonces Z0.025= -1.96 y Z0.975= 1.96 puede ser igual a 25, es decir que la
de 45 (2=45). concentración media de enzimas puede
ser 25.
La región de rechazo estará dada por los
Solución: valores del estadístico de prueba (zc)
menores o iguales que -1.96 y por los El Valor p
1. La hipótesis nula, H0 valores mayores o iguales que 1.96.
Muchos autores estudios de investigación, e
Para responder la pregunta de los Si la prueba fuera unilateral (Ha:  < 25 ó incluso los programas estadísticos, no informan
investigadores (Ha25) la hipótesis nula a Ha:  > 25), la región de rechazo estuviera si el estadístico de prueba es significativo o no,
probar es que la concentración de enzimas dada por los valores Z o Z1- sino que prefieren informar el valor p (1).
es igual a 25 respectivamente, es decir:
El valor p se define como la probabilidad de
Ho :  = 25 obtener un valor tanto o más extremo que el
observado, si la hipótesis nula es verdadera.
También se puede definir como la
2. La hipótesis alternativa, Ha compatibilidad de los datos con la hipótesis
Región de nula, o la probabilidad de que la hipótesis nula
La hipótesis alternativa (la de interés para sea verdadera.
los investigadores) indica que la  aceptación
concentración media de enzima de la El valor p es la probabilidad de que el
población es diferente de 25. Note que el -1.645 estadístico de prueba calculado caiga en la
signo  determina que la prueba es región de rechazo. En una prueba bilateral:
bilateral.
Ha :   25 Valor p = P(Z < -zc) + P(Z > zc)

Región de Para el ejemplo, se tiene que:


3. El estadístico de prueba
aceptación P(Z < -zc) = ?

Dado que se esta probando una hipótesis P(Z < -zc) = P(Z < -1.41) = 0.0793
acerca de la media de la población, y que 1.645
se supone que esta sigue una distribución Luego,
normal, y la varianza es conocida, la Los valores de Z/2 y Z1-/2, para pruebas
estadística de prueba es: bilaterales; Z y Z1- para pruebas Valor p = 0.0793 + 0.0793
unilaterales, más utilizados se presentan
x  0 22  25 en la siguiente tabla. Valor p = 0.1586
zc     1,41
 45 Es decir, dado que la hipótesis nula es
n 10 Prueba Unilateral verdadera, la probabilidad de obtener un
Nivel de estadístico de prueba calculado de –1.41 es del
Confiabilidad significancia Ha:< Ha:> 0.1586. Esta probabilidad es relativamente
4. La región de rechazo, RR (1 – )  Z Z 1- alta, por tanto no se puede rechazar la
hipótesis nula.
La región de rechazo se muestra en la 0,90 0,10 -1,28 1,28
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 46

Interpretación del valor p -1.645


22  (1,96) 45
 Si el valor p es menor que , es posible 10 Decisión: Al ubicar el estadístico de prueba en
rechazar la hipótesis nula la grafica, éste cae en la región de aceptación,
 Si el valor p es mayor o igual que , no es 22  4,16 por lo tanto no se puede rechazar la hipótesis
posible rechazar la hipótesis nula nula.
El informe de valores p como parte de los 17,84 <  < 26,16
resultados de investigación proporciona mas Dado que el intervalo de confianza incluye al Se concluye con un nivel de confianza del 95%,
información al lector que afirmaciones tales 25, se dice que es posible que la media que la media real de la población puede ser
como “la hipótesis nula se rechaza en el nivel poblacional sea 25, con un nivel de igual o mayor que 25, pero no menor.
de significancia de 0.05” o “los resultados no confiabilidad del 95%.
fueron significativos en el nivel 0.05”. Al
informar el valor p asociado con una prueba se El valor p para esta prueba es:
permite al lector saber con exactitud qué tan En general, una hipótesis nula puede probarse
extraño o qué tan común es el valor calculado construyendo un intervalo de confianza: Valor p = P(Z < -zc)
de la estadística de prueba, dado que H0 es Valor p = P(Z < -1.41)
verdadera. En resumen, se recomienda  Se rechaza Ho en el nivel de significancia Valor p = 0.0793
reportar siempre el valor p exacto (1).  sí el parámetro supuesto no esta
contenido dentro del intervalo de Como el valor p es mayor que , entonces no
También es importante aclarar que el valor p confianza se puede rechazar la hipótesis nula.
no es un concepto de todo o nada. Por
ejemplo, un valor p de 0.08 con una muestra  Si el parámetro supuesto está contenido
pequeña puede estar sugiriendo una dentro de dicho intervalo, no es posible
asociación, y que seguramente el problema es rechazar Ho en el nivel  de significación 8.3.1 Población con distribución
de poder. Por otro lado un valor p de 0.04 normal y varianza desconocida
debería verse con mucho cuidado pues
podríamos estar enfrentando un error tipo I. Prueba de hipótesis unilateral Caso 2:

Ejemplo 4: En una prueba bilateral la región de rechazo se Cuando el muestreo se realiza a partir de una
divide entre los dos lados o colas de la población que sigue una distribución normal
En el ejemplo anterior, se plantearon las distribución de la estadística de prueba. con varianza desconocida se utiliza la prueba t
hipótesis: de Student para una muestra (1). La estadística
En una prueba de hipótesis unilateral, la región de prueba es:
Ho :  = 25 de rechazo esta en una sola cola (derecha o
x  0
Ha :   25 izquierda) según el signo de la hipótesis nula (>
ó < respectivamente).
tc 
s
Si un investigador reporta el valor p=0.1586 de
la prueba de hipótesis, al utilizar un nivel de
n
significancia de 0.01 ó 0.05, se llega a la Ejemplo 6:
conclusión de que no es posible rechazar H0. La cual, cuando Ho es verdadera, sigue una
Utilizando la información del ejemplo 3, distribución t de Student con n-1 grados de
Por ejemplo, suponiendo que el valor p hubiera suponer que los investigadores se hubieran libertad.
sido 0.001, entonces a un nivel de significancia preguntado: ¿Se puede concluir que  < 25?
0.01 ó 0.05, se rechazaría la hipótesis nula.
Solución: Ejemplo 7:

Prueba de hipótesis vs. Intervalos de Hipótesis nula y alterna: (1) Varios investigadores reunieron las
confianza concentraciones de amilasa en el suero de una
Ho :   25 muestra aleatoria de 15 personas
Anteriormente se dijo que es posible utilizar Ha :  < 25 aparentemente sanas. La media y desviación
intervalos de confianza para llegar a las estándar calculadas a partir de la muestra son
mismas conclusiones que se alcanzan al utilizar El signo < de la hipótesis alternativa, 96 y 35 unidades/100 ml, respectivamente. Los
los procedimientos de pruebas de hipótesis. determina que la prueba es unilateral. investigadores desean saber si es posible
concluir que la media de la población de la
Comprobemos con el siguiente ejemplo: El estadístico de prueba es: cual se extrajo la muestra:

a) Es distinta de 120
Ejemplo 5: x  0 22  25 -1,41 b) Es menor de 120
zc   
En el ejemplo anterior se uso el procedimiento  45
n Solución:
de prueba de hipótesis para probar H0: = 25 10
contra la hipótesis alternativa H0:  25. No
Para un nivel de significancia de 0.05, la región a) Los investigadores pueden confirmar su
fue posible rechazar la hipótesis nula, ya que
hipótesis si logran rechazar la hipótesis
el estadístico de prueba cayó en la región de de rechazo esta dada por Z = -1.645
nula que dice que la media real es 120.
aceptación (valor p=0.1586).
Esto sugiere una prueba de hipótesis
bilateral.
Construyendo un intervalo de confianza del 95%
para , se tiene que: Hipótesis nula y alterna:
Región de
x  Z1 / 2  Ho :  = 120
aceptación Ha :   120
n 
El estadístico de prueba es:
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 47

El cálculo del valor p para esta prueba fue de ( x1  x2 )  ( 1   2 )


tc 
x  0 96  120 0.0055. Es decir que dado que la hipótesis nula
tc     2,66 es verdadera, la probabilidad de observar un s 2p

s 2p
s 35 estadístico de prueba calculado de –2.66, es n1 n2
n 15 menor que 0.01, (muy poco probable) por
tanto es posible rechazar la hipótesis nula.
Para un nivel de significancia de 0.05, la región el cual sigue una distribución t de Student con
(n1 + n2 – 2) grados de libertad.
de rechazo esta dada por tc > t1-/2, con n-1
grados de libertad (15-1=14 grados de 8.4 Prueba de hipótesis para la
libertad). t1-/2 = t0.975 = 2.1448 diferencia de medias de dos
poblaciones
Ejemplo 8:

Generalmente la prueba de hipótesis que (1) Un grupo de investigadores colectó datos


comprende la diferencia entre las medias de acerca de las concentraciones de amilasa en el
dos poblaciones se utiliza para determinar si es suero de muestras de individuos sanos y de
Región de razonable concluir que las medias de dos individuos hospitalizados. Desean saber si es
/2 aceptación /2 grupos son iguales o distintas entre sí. posible concluir que las medias de las
poblaciones son distintas. Los datos son las
Para ello se pueden plantear una de las mediciones de amilasa en suero de n1=22
-2.1448 2.1448 siguientes hipótesis: individuos hospitalizados y n2=15 individuos
sanos. Las medias muestrales y sus
Decisión: Al ubicar el estadístico de prueba en 1. 2. 3. desviaciones estándar son las siguientes:
la grafica, éste cae en la región de rechazo, Ho: 1-2 = 0 Ho: 1-2  0 Ho: 1-2  0
por lo tanto se rechaza la hipótesis nula. Ha: 1-2  0 Ha: 1-2 < 0 Ha: 1-2 >0
x1 = 120 unidades/ml s1 = 40 unidades/ml
Se concluye con un nivel de confianza del 95%, Que también se podrían plantear así: x 2 = 96 unidades/ml s2 = 35 unidades/ml
que la media real de la población puede ser 1. 2. 3.
diferente de 120. H0 : 1 = 2 H0 : 1  2 H0 : 1  2 Solución:
Ha : 1  2 Ha : 1 < 2 Ha : 1 > 2
El valor p para esta prueba es de 0.015 (valor H0 : 1 - 2 = 0 H0 : 1 = 2
obtenido de un paquete estadístico). Es decir Sin embargo, también es posible probar la ó
Ha : 1 - 2  0 Ha : 1  2
que dado que la hipótesis nula es verdadera, la hipótesis de que la diferencia es igual, mayor o
probabilidad de observar un estadístico de menor a un valor distinto de cero. El test de Levene no fue significativo (valor p >
prueba calculado de –2.66, es menor que 0.02,
0.05) lo que permite asumir varianzas iguales.
(poco probable) por tanto sí tiene sentido La prueba de hipótesis para diferencia de La varianza ponderada es:
rechazar la hipótesis nula. medias se trata en tres contextos:
b) Se plantea una prueba de hipótesis (n1  1) s12  (n2  1) s22
1. Poblaciones con distribución normal y s 2p 
unilateral varianzas conocidas (Caso 3) n1  n2  2
Ho :   120 2. Poblaciones con distribución normal y
Ha :  < 120 varianzas desconocidas iguales (Caso 4)
(22  1) (40) 2  (15  1)(35) 2
s 2p   1450
3. Poblaciones con distribución normal y 22  15  2
El estadístico de prueba es: varianzas desconocidas diferentes (Caso 5)
El estadístico de prueba es:
x  0 96  120 Los casos 3 y 5 se presentan en el Anexo de
tc   = -2,66
esta sesión. Para los casos 4 y 5 se hace uso de ( x1  x2 )  ( 1   2 )
s 35 tc 
la prueba estadística t de Student para
n 15 muestras independientes, según las varianzas s 2p s 2p
sean iguales o diferentes, respectivamente.

Para un nivel de significancia de 0.05, la región n1 n2
de rechazo esta dada por tc < -t1-, con n-1 (120  96)  (0)
grados de libertad (15-1=14 grados de  1,88
libertad): t1- = t0.95 = 1.7613 1450 1450
8.4.1 Poblaciones con distribución 
normal y varianzas 22 15
desconocidas iguales
Para un nivel de confianza del 95%, la región
Región de Caso 4: de rechazo esta dada por tc > t1-/2; n1+n2-2 =
aceptación t0.975; 35 = 2,0301
 Cuando se desconocen las varianzas de las
poblaciones, es adecuado ponderar las
-1.7613 varianzas de las muestras por medio de la
formula:
Decisión: Al ubicar el estadístico de prueba en (n1  1) s12  (n2  1) s22
la grafica, éste cae en la región de rechazo, s 2p  Región de
por lo tanto se rechaza la hipótesis nula. n1  n2  2
/2 aceptación /2
Se concluye con un nivel de confianza del 95%, El estadístico de prueba es:
que la media real de la población es menor de
120. -2.0301 2.0301
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 48

Decisión: El estadístico de prueba cae en la La estadística de prueba es:


región de aceptación, por tanto no es posible
rechazar Ho. pˆ  p0 = 0,41  0,50 = -3,12
zc 
Con base en los datos, a un nivel de p0 q0 (0,50)(0,50)
confiabilidad del 95% no es posible concluir que
las dos muestras de las dos poblaciones son
n 300
diferentes.

El valor p para esta prueba fue de 0.085 > 0.05, Para un nivel de significancia de 0.05, la región
por tanto no es posible rechazar la hipótesis de rechazo esta dada por zc > z1-/2 = 1,96
nula.

8.5 Prueba de hipótesis para una


proporcion
Región de
Caso 6:
/2 aceptación /2
Para una proporción se pueden plantear una de
las siguientes hipótesis: -1,96 1,96

Ho : p = po vs. Ha : p  po Se observa que el estadístico de prueba


Ho : p  po vs. Ha : p < po calculado cae en la región de rechazo, por
Ho : p  po vs. Ha : p > po tanto se rechaza la hipótesis nula, y se
concluye que la proporción de personas que
La prueba de hipótesis de proporciones acostumbran usar cinturón de seguridad es
poblacionales se realiza casi en la misma forma diferente del 50%.
utilizada para las medias cuando son
satisfechas las condiciones necesarias para El valor p para esta prueba es:
emplear la curva normal (1). Cuando se
dispone de una muestra lo suficientemente Valor p = P(Z < -zc) + P(Z > zc)
grande para la aplicación del teorema central
del límite, la estadística de prueba es: P(Z < - zc) = P(Z < -3,12) = 0,009

pˆ  p0 El valor p es: 2 x P(Z < zc) = 2 x 0.009 = 0.002


zc 
p0 q0
8.6 Prueba de hipótesis para
n diferencia de proporciones

Caso 7:
Ejemplo 9:
Según la
(1) Suponer que hay interés por saber qué
proporción de la población de conductores de
automóviles utiliza con regularidad el cinturón
de seguridad del asiento. En una encuesta de
300 conductores adultos de automóviles, 123
de ellos dijeron que regularmente utilizaban el
cinturón de seguridad del asiento. ¿Es posible
concluir a partir de estos datos que, en la
población muestreada, la proporción de
quienes utilizan regularmente el cinturón de
seguridad no es de 0.50 (equivalente al 50%)?

Solución:

La proporción muestral que utiliza


regularmente el cinturón de seguridad es: p̂ =
123/300 = 0,41

q̂ = 1- p̂ = 0,59

La hipótesis es:

H0 : p = 0.50
Ha : p  0.50
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 49

Tabla 2, se pueden plantear una de las p2 > p1  equivalente a  p1 < p2


siguientes hipótesis: El estadístico de prueba cae en la región de
Luego, se plantean las siguientes hipótesis rechazo, por tanto se rechaza la hipótesis nula.
H0 : p1 = p2 vs. Ha : p1  p2
H0 : p1  p2 vs. Ha : p1 < p2 H0 : p1  p2 Los datos sugieren que el nuevo tratamiento es
H0 : p1  p2 vs. Ha : p1 > p2 Ha : p1 < p2 más efectivo que el habitual.

La prueba que se utiliza con mayor frecuencia La hipótesis alterna planteada permite probar El valor p para esta prueba es:
con relación a la diferencia entre las que la proporción de pacientes que se curan
proporciones de dos poblaciones es aquella en con el tratamiento habitual (p1) es menor que P(Z < zc) = P(Z < -2,31) = 0,0104
la que su diferencia es cero. Cuando la la proporción de pacientes que se curan con el
hipótesis nula (Ho) que va a probarse es p1- nuevo tratamiento (p2). Si se llega a rechazar Hasta ahora se ha visto que existen dos
p2=0, se supone que las proporciones de las dos la hipótesis nula (Ho), podríamos concluir que maneras de determinar si dos proporciones son
poblaciones son iguales. Esto se utiliza como el nuevo tratamiento es mas efectivo. estadísticamente significativas o no. Una de
justificación para combinar los resultados de ellas es construir un IC y la otra es plantear
las dos muestras y obtener una estimación Se tienen los siguientes datos: una prueba de hipótesis. En la práctica se usa
ponderada de la proporción común supuesta. Si la prueba Chi-cuadrado para el caso 7, la cual
se adopta este procedimiento se calcula (1): Individuos que será vista en detalle en la sesión 12 del curso.
Tamaño
Tratamiento respondieron
muestra
x1  x2 q  1 p
satisfactoriamente
p y
Habitual n1 = 100 x1 =78
n1  n2 Referencias:
Nuevo n2 = 100 x2 =90 (1) Daniel Wayne W. Bioestadística. Base para
donde x1 y x2 son, respectivamente, el numero
el análisis de las ciencias de la salud.
de la primera y segunda muestra que poseen la
x1 78 x2 90 Editorial Limusa S.A. Grupo Noriega
característica de interés.
pˆ1    0,78 pˆ 2    0,90 Editores. 2000.
n1 100 n2 100
La estadística de prueba es:
Luego,
( pˆ 1  pˆ 2 )  ( p1  p2 )
zc 
pq pq x1  x2 78  90
 p   0,84
n1 n2 n1  n2 100 100

Las hipótesis también podrían plantearse de la De allí,


siguiente forma: q 1 p 1 0,84  0,16
1. 2. 3.
La estadística de prueba es:
H0: p1-p2 = 0 H0: p1-p2  0 H0: p1 - p2  0
Ha: p1-p2  0 Ha: p1-p2 < 0 Ha: p1 - p2 > 0
Ejemplo 10: ( pˆ 1  pˆ 2 )  ( p1  p 2 ) =
zc 
pq pq
(1) En un ensayo clínico para comparar un 
nuevo tratamiento para la migraña con el n1 n 2
tratamiento habitual, 78 de los 100 individuos
que recibieron el tratamiento habitual
(0,90  0,78)  0
respondieron favorablemente. De los 100   2,31
individuos que recibieron el nuevo tratamiento, (0,84)(0,16) (0,84)(0,16)
90 respondieron satisfactoriamente. 
¿Proporcionan estos datos evidencia suficiente 100 100
para afirmar que el nuevo tratamiento es más Para un nivel de significancia de 0.05, la región
efectivo que el habitual? de rechazo esta dada por zc < Z = Z0.05 = -
1.645.

Solución:

Se podría decir que el nuevo tratamiento es


más efectivo que el habitual, si el porcentaje Región de
de individuos que responden satisfactoriamente aceptación
con el nuevo tratamiento (p2) es superior al del 
tratamiento habitual (p1).
- 1.645
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 50

Tabla 2. Resumen de formulas para pruebas de hipótesis

Parámetro Caso Supuestos Hipótesis nula Hipótesis alternativa Estadístico de prueba Región de rechazo

H0 :  = 0 Ha :   0 zc > Z1-/2


1 x  0
X normal
zc 
Caso 1  conocida H0 :   0 Ha :  < 0  zc < Z
n (pequeño ó grande) n
H0 :   0 Ha :  > 0 zc > Z1-

H0 :  = 0 Ha :   0 zc > Z1-/2


x  0
 Caso 1
X normal o no normal
 desconocida (s=) H0 :   0 Ha :  < 0
zc  zc < Z
s
n (grande) n
H0 :   0 Ha :  > 0 zc > Z1-

H0 :  = 0 Ha :   0 tc > t1-/2, n-1


x  0
Caso 2
X normal
 desconocida H0 :   0 Ha :  < 0
tc  tc < - t1-, n-1
s
n (pequeño) n
H0 :   0 Ha :  > 0 tc > t1-, n-1

H0 : 1 - 2 = 0 Ha : 1 - 2  0 ( x1  x2 )  ( 1   2 ) zc > Z1-/2


X normal zc 
Caso 3 Varianzas conocidas H0 : 1 - 2  0 Ha : 1 - 2 < 0  12  22 zc < Z
n (pequeño, grande) 
n1 n2
H0 : 1 - 2  0 Ha : 1 - 2 > 0 zc > Z1-

( x1  x2 )  ( 1   2 ) tc > t1-/2;


X normal H0 : 1 - 2 = 0 Ha : 1 - 2  0
Varianzas tc  n1+n2-2
poblacionales s 2p s 2p
1 – 2 Caso 4 desconocidas pero H0 : 1 - 2  0 Ha : 1 - 2 < 0  tc < - t1-; n1+n2-2
iguales n1 n2
n (pequeño, grande) H0 : 1 - 2  0 Ha : 1 - 2 > 0 tc > t1-; n1+n2-2

X normal H0 : 1 - 2 = 0 Ha : 1 - 2  0 t’c > t’1-/2


( x1  x2 )  ( 1   2 )
Varianzas
poblacionales
t c' 
Caso 5 H0 : 1 - 2  0 Ha : 1 - 2 < 0 s12 s 22 t'c < - t’
desconocidas pero 
distintas n1 n2
n (pequeño, grande) H0 : 1 - 2  0 Ha : 1 - 2 > 0 t'c > t’1-

H0 : p = p 0 Ha : p  p0 zc > Z1-/2


pˆ  p0
zc 
p Caso 6 np, nq > 5 H0 : p  p0 Ha : p < p 0 p0 q0 zc < Z
n
H0 : p  p0 Ha : p > p 0 zc > Z1-

H0 : p1 = p2 Ha : p1  p2 zc > Z1-/2


( pˆ 1  pˆ 2 )  ( p1  p2 )
n1 y n2 (grande) zc 
p1-p2 Caso 7 p1 y p2 no cercano a H0 : p1  p2 Ha : p1 < p2 pq pq zc < Z
0ó1 
n1 n2
H0 : p1  p2 Ha : p1 > p2 zc > Z1-

(n1  1) s12  (n2  1) s22 w1t1  w2 t 2 w1t1  w2 t 2


s 2p  t1'  / 2  t1'  
n1  n2  2 w1  w2 w1  w2
1
”X normal” simboliza que la variable en estudio, llámese X, es una variable cuantitativa que presenta una distribución normal o en forma de campana.
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 51

Decisión: El estadístico de prueba cae en la Para un nivel de significancia de 0.05, la


8.7 Anexo región de rechazo, por lo tanto se rechaza la región de rechazo esta dada por zc > z1-/2
hipótesis nula. = z0.975 = 1.96
8.7.1 Población con distribución no
normal y tamaño de muestra Con un nivel de confiabilidad del 95% se
grande concluye que el número medio de recetas
por persona al año para esta población es
mayor que cinco.
Caso 1: El valor p es: Región de
Si como ocurre con frecuencia, la muestra /2 aceptación /2
Valor p = P(Z > zc)
proviene de una población que no presenta Valor p = P(Z > 3,16)
distribución normal y si la muestra es grande Valor p = 0.0008 -1.96 1.96
(mayor o igual que 30), es posible utilizar el
teorema del límite central y usar zc como
Decisión: El estadístico de prueba cae en la
estadística de prueba. Si no se conoce la
región de rechazo, por lo tanto se rechaza
desviación estándar de la población, la 8.7.2 Poblaciones con distribución
H0.
práctica común es utilizar la desviación normal y varianzas conocidas
estándar de la muestra como una
Con un nivel de significancia de 0.05, se
estimación. La estadística de prueba para la
Caso 3: concluye que las medias de los datos son
media poblacional es:
diferentes.
Cuando cada una de las dos muestras son
x  0 extraídas de una población que sigue una El valor p para esta prueba es:
zc  distribución normal con varianzas conocidas,
s la estadística de prueba para probar la Valor p = P(Z > zc)
n hipótesis nula de igualdad de las medias Valor p = P(Z > 2,84)
Ejemplo 11: poblacionales es: Valor p = 0.0023

En una encuesta sanitaria de cierta ( x1  x2 )  ( 1   2 ) Como la prueba es bilateral, el valor p es


comunidad se entrevistó a 150 personas. zc  (2x0.0023) 0.0046.
Uno de los elementos de información  2
 2
1
 2
obtenidos fue el número de recetas médicas n1 n2 El intervalo de confianza del 95% para la
por persona durante el año anterior. El diferencia de medias es: (0.3 < 1 – 2 <
Ejemplo 12:
número promedio para las 150 personas fue 1.9). Dado que este intervalo no incluye el
de 5,8 con una desviación estándar de 3,1. cero, se llega a la misma conclusión.
Un equipo de investigación desea saber si
El investigador desea saber si esos datos
los datos que han recolectado proporcionan
proporcionan evidencia suficiente para
la evidencia suficiente para indicar una
indicar que la media de la población es
diferencia entre las concentraciones medias 8.7.3 Poblaciones con distribución
mayor que 5.
de ácido úrico en el suero de individuos normal y varianzas
normales e individuos con el síndrome de
Solución:
Down. Los datos presentan las
desconocidas diferentes
concentraciones de ácido úrico de 12
La media de la población será mayor que Caso 5:
individuos con el síndrome de Down y 15
cinco si se puede rechazar la hipótesis nula
que propone una media menor igual que individuos sanos. Las medias son x1 = 4,5
Cuando dos muestras aleatorias simples e
cinco. Se plantea la siguiente prueba de mg/100 ml y x2 = 3,4 mg/100 ml, independientes han sido extraídas de
hipótesis unilateral: poblaciones que siguen distribución normal
respectivamente. El comportamiento de los
H0 :   5 datos de la población es normal con una con varianzas desconocidas y diferentes, el
Ha :  > 5 desviación estándar de 1. estadístico de prueba para probar la
hipótesis H0: 1 = 2, es:
El estadístico de prueba es: Solución:
( x1  x2 )  ( 1   2 )
x  0 5,8  5 Los datos darán evidencia de ser diferentes, t c' 
zc    3,16 si se rechaza la hipótesis nula que indica s12 s 22
s 3,1 
que las medias de los dos grupos son iguales: n1 n2
n 150
H0 : 1 - 2 = 0 H0 : 1 = 2
ó El valor crítico de t’c para un nivel  de
Ha : 1 - 2  0 Ha : 1  2 significación y una prueba bilateral es
Para un nivel de significancia de 0.05, la
región de rechazo esta dada por zc > Z1-, es aproximadamente:
decir zc > Z0.95 = 1.645. El estadístico de prueba es:
w1t1  w2 t 2
t1'  / 2 
( x1  x2 )  ( 1   2 ) = w1  w2
zc 
 12  22
 2 2
Región de n1 n2 Donde, w  s1 ; w  s 2 , t1 = t1-/2; con (n1-
1 2
n1 n2
aceptación (4,5  3,4)  (0)
 2,84
 1) grados de libertad y t2 = t1-/2; con (n2-1)
1 1 grados de libertad

1.645 12 15
Unidad de Epidemiología y Bioestadística Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica 52

Ejemplo 13: (62,6  47,2)  (0)


  1,41 Luego,
Un grupo de investigadores quiere saber si (33,8) 2 (10,1) 2 w1t1  w2 t 2

dos poblaciones difieren con respecto al
10 20 t1'  / 2 
valor medio de la actividad total del w1  w2
complemento del suero (CH50). Los datos se
componen de la actividad total del
Para hallar la región de rechazo se debe
complemento del suero en n1=10 individuos
enfermos y n2=20 individuos aparentemente
calcular: (114,2)(2,2622)  (5,1)(2,0930) =
w t  w2 t 2 
sanos. Las medias de las muestras y las '
t  11 114,2  5,1
desviaciones estándar son: 1 / 2
w1  w2 2,25

x1 = 62,6 s1 = 33,8
2 2
x 2 = 47,2 s2 = 10,1 Donde, w  s1 ; w  s 2 ,
1 2
n1 n2
Solución: Región de
t1 = t1-/2; con (n1-1) grados de libertad y /2 aceptación /2
H0 : 1 - 2 = 0 H0 : 1 = 2 t2 = t1-/2; con (n2-1) grados de libertad
ó
Ha : 1 - 2  0 Ha : 1  2
-2.25 2.25
s2 (33,8) 2 = 114,2
w1  1 
El estadístico de prueba es: n1 10 El estadístico de prueba calculado (t’c =
1,41) cae en la región de aceptación, por
2
( x1  x2 )  ( 1   2 ) s22  (10,1) = 5,1 tanto no es posible rechazar H0.
t c'  w2 
s12 s 22 n2 20 No es posible concluir que las dos muestras
 t1 = t1-/2; para (n1-1) g.l. de las dos poblaciones son diferentes.
n1 n2
t1 = t0.975; para (9) g.l. t1 = 2.2622

t2 = t1-/2; para (n2-1) g.l.


t2 = t0.975; para (19) g.l. t2 = 2.0930

También podría gustarte