UNIDAD 6 (Con Demostraciones)

BIOESTADÍSTICA
Unidad 6
Dra. Myriam Nuñez

TEST DE HIPÓTESIS
En las unidades anteriores vimos como se puede
estimar un parámetro a partir de los datos contenidos
en una muestra. Puede encontrarse ya sea, un sólo
número (estimador puntual), ó, un intervalo de valores
posibles (intervalo de confianza).
Sin embargo muchos problemas requieren que se
tome una decisión entre aceptar o rechazar una
proposición sobre algún parámetro.
Esta proposición recibe el nombre de hipótesis.
2
¿Qué es una Hipótesis?
Una hipótesis estadística es una proposición o

supuesto sobre los parámetros de una o más
poblaciones.
Ejemplo: Supongamos que nos interesa saber si la
altura media de los estudiantes del curso es de 1,65 m.
Esto puede expresarse de manera formal como dos
alternativas ó hipótesis.
H0: μ = 1,65 m
H1: μ  1,65 m
3
La proposición H0: μ = 1,65 se conoce como hipótesis nula;
mientras que la proposición H1: μ  1,65 recibe el nombre de
hipótesis alternativa.
A este procedimiento se lo conoce como prueba de hipótesis
bilateral.
Podría sólo considerarse un caso en la hipótesis alternativa,
o sea, que la hipótesis alternativa especifique valores de μ
que pueden ser mayores o menores que 1,65 m, es decir,
H0: μ = 1,65 m H0: μ = 1,65 m

H1: μ > 1,65 m H1: μ < 1,65 m
A este procedimiento se lo conoce como prueba de

hipótesis unilateral. 4
Es importante recordar que las hipótesis siempre
son proposiciones sobre la población bajo estudio,
no proposiciones sobre la muestra.
Un procedimiento que conduce a una decisión sobre
una hipótesis en particular recibe el nombre de
prueba de hipótesis.
Los procedimientos de prueba de hipótesis
dependen del empleo de la información contenida en
la muestra aleatoria de la población de interés.
5
Si esta información es consistente con la
hipótesis, se concluye que esta es verdadera; sin
embargo, si esta información es inconsistente
con la hipótesis, se concluye que esta es falsa.
Debe hacerse hincapié en que la verdad o
falsedad de una hipótesis en particular nunca
puede conocerse con certidumbre, a menos que
pueda examinarse a toda la población.
Usualmente esto es imposible, por tanto, es
necesario desarrollar un procedimiento de prueba
de hipótesis teniendo en cuenta la probabilidad
de llegar a una conclusión equivocada. 6
La hipótesis alternativa, representada por H1, es
la afirmación contradictoria a H0, y ésta,
generalmente, es la hipótesis a investigar.
La hipótesis nula se rechaza a favor de la
hipótesis alternativa, sólo si la evidencia
muestral sugiere que H0 es falsa. Si la muestra
no contradice decididamente a H0, se continúa
creyendo en la validez de la hipótesis nula.
Entonces, las dos conclusiones posibles de un
análisis por prueba de hipótesis son:
Rechazar H0 No rechazar H0
7
8
9
Realidad
H0 es H0 es
Verdadera Falsa
Error
Aceptar H0
Decisión
Bien
de tipo II
Error
Rechazar H0 Bien
de tipo I
10
 = P(cometer error de tipo I) =
= P(Rechazar H0 y en realidad es H0 Verdadera)
 = P(cometer error de tipo II) =
= P(Aceptar H0 y en realidad es H0 Falsa)
Lo que uno quisiera es que  y  fuesen pequeñas, pero si
una disminuye la otra aumenta
 la fija el experimentador con un valor pequeño: 0,05; 0,01; ...

 puede tomar cualquier valor grande o pequeño
 = Nivel de significación del Test

11
Juez ante un acusado: sus dos hipótesis son Inocente o
Culpable. ¿Cuál sería H0 y H1?
Los dos posibles errores son:
• Decidir culpable y en realidad es inocente
• Decidir inocente y en realidad es culpable
Principio jurídico: Toda persona es inocente hasta que se
pruebe que es culpable
 = P(Rechazar H0 si en realidad es H0 Verdadera)
 = P(Decidir culpable si en realidad es inocente) = pequeña
H0: Inocente H1: Culpable
De las dos hipótesis posibles, lo que se quiere

probar con más seguridad se debe colocar en H1 12
Definición de Potencia ()
Llamamos potencia de un test de hipótesis a la

probabilidad de no cometer Error de Tipo II.
Es la probabilidad de rechazar H0 si en realidad H0 es
falsa.
 = P(rechazar H0 si en realidad H0 es falsa)
=1-
13
Ejemplo
Un laboratorio hace una propaganda en la que dice que el
tiempo medio en que su aspirina calma el dolor de cabeza
es menor que 15 minutos.
Otro laboratorio de la competencia, sospecha que lo que
dice la propaganda no es cierto. Quiere decidir si le hace
juicio o no acusándolo de propaganda desleal. ¿Qué
hipótesis plantearía?
X = Tiempo en que la aspirina de la propaganda calma el
dolor de cabeza
Suposición: X ~ N(m ; s)
14
m = Tiempo medio en que la aspirina de la propaganda
calma el dolor de cabeza
La propaganda dice: m < 15
Las dos únicas posibilidades son plantear:

H0: m  15 H1: m < 15
H0: m  15 H1: m > 15
Decidir m < 15 significa no acusarlo de propaganda desleal
Decidir m > 15 significa acusarlo de propaganda desleal

15
De los dos posibles errores, el de probabilidad  será el que
queremos controlar, es decir, el que queremos que tenga
pequeña probabilidad de ocurrir.
 = P(Hacer juicio acusándolo de propaganda desleal y en

realidad la propaganda es cierta)
 = P(Decidir m > 15 y en realidad es m  15)
 = P(Rechazar H0 y en realidad es H0 Verdadera)
H0: m  15 H1: m >15

16
Procedimiento de test de hipótesis
• Definir las variables aleatorias.
• Establecer las suposiciones necesarias.
• Plantear la hipótesis nula y la alternativa.
• Definir el estadístico de prueba.
• Fijar el nivel de significación ().
• Determinar la zona de rechazo, en función de a.
• Calcular el valor del estadístico de prueba en la muestra
• Tomar la decisión.
• Interpretar la decisión en términos estadísticos.
• Interpretar la decisión en los términos del problema.
17
Definiciones
➢Estadístico de prueba
Es un valor que se determina a partir de la
información de la muestra, es utilizado para decidir si
se rechaza o no la hipótesis nula.
➢Valor crítico
El punto que divide la región entre el lugar en el que
la hipótesis nula es rechazada y no rechazada.
18
Test de Gauss para una media
Suposición: X ~ N(m ; s) s es conocida

H0: m  m0 H1: m > m0 m0 es un número conocido
H0: m  m0 H1: m < m0 depende del problema
H0: m = m0 H1: m  m0
X − m0
Z=
Estadístico de prueba:
s n
Si µ = µ0 entonces Z ~ N(0;1)
Para cada una de las posibles situaciones hay que
19
determinar la zona de rechazo
H0: m  m0 H1: m > m0
Se rechaza H0 para valores

grandes de Z
Zona de rechazo: Z.R.: Z  ?
? = Z
Z.R: Z  Z
20
H0: m  m0 H1: m < m0
Se rechaza H0 para valores de

Z muy negativos
Zona de rechazo: Z.R: Z  -?
-? = - Z 
Z.R: Z  − Z 
21
H0: m = m0 H1: m  m0
Z muy grandes o muy
negativos
Zona de rechazo: Z.R.
Z  -? ó Z  ?
? = Z /2
Z.R: Z   Z /2
Test de dos colas

22
Test de Gauss para una media
Resumen
Suposición: X ~ N(m ; s) s es conocida
m0 es un número conocido
X − m0
Estadístico de prueba: Z=
s n
Zona de Rechazo (Z.R.)
H0: m  m0 H1: m > m0 Z  Z
H0: m  m0 H1 : m < m 0 Z −Z
H0: m = m0 H1: m  m0 Z   Z /2
23
EJEMPLO
Una muestra aleatoria de 100 muertes registradas en Estados

Unidos el año pasado, muestra una vida promedio de 71,8
años. Supongamos que la desviación estándar poblacional es
8,9 años. Queremos probar si la vida media hoy en día es
mayor a 70 años con base en esa muestra. La muestra
parecería indicar que es así, pero, ¿cuál es la probabilidad de
que la media de la muestra no refleje la verdadera media de la
población?
24
Solución
Se trata de una distribución muestral de medias con
desviación estándar conocida.
Datos
μ = 70 años
σ = 8,9 años
X = 71,8 años
n = 100
α = 0,05
25
Establecemos las hipótesis
H0: m ≤ 70 H1: m > 70
Nivel de significación
α = 0,05 Zα = 1,645
μ=0 1,645
Regla de decisión
Si Z ≤ 1,645 no se rechaza H0
Si Z > 1,645 se rechaza H0 26
Cálculos
X −m 71,8 − 70
Z= = = 2,02
s 8,9
n 100
Decisión
Como 2,02 > 1,645 se rechaza H0
Conclusión
La vida media es mayor que 70 años.
27
Ejemplo de la aspirina (de la dispositiva 14)
Se administró la aspirina a 25 personas y se obtuvo una
media muestral de 17 minutos. Suponiendo que la varianza
poblacional es 36 min2, ¿cuál será la decisión del laboratorio
con un nivel de significación del 5%?
X = Tiempo (min) en que la aspirina de la propaganda calma el
dolor de cabeza
Suposición: X ~ N(m ; s) s conocida s=6

H0: m 15 H1: m >15
X − 15
Z=
6 n 28
 = 0,05 Z.R. Z  Z  = 1,645
17 − 15
Zm = = 1,667
6 25
Zm =1,667 > 1,645 Se rechaza H0
Se decide m > 15 ¿Cuál es la probabilidad de error?
P(Decidir que m >15 si en realidad es m 15) =  = 0,05
“Tiempo medio en que la aspirina de la propaganda calma el
dolor de cabeza es mayor que 15 minutos”
La probabilidad de error de esta afirmación es menor que 5%
El laboratorio decide acusarlo de propaganda desleal y

29
la probabilidad de equivocarse en la decisión es 5%.
Justificación que la condición más desfavorable, al
determinar la zona de rechazo, ocurre si µ = 15
H0: m  15 H1: m > 15
Se determinó como zona de rechazo Z > 1,645
La distribución del estadístico de prueba es:
X − 15 m − 15
Z= ~ N( ; 1)
s n s/ n
P(error de tipo I) =
P(Rechazar H0 si es verdadera) =
= P(Z  1,645 si µ < 15) < 0,05
30
En el test: H0: µ  µ0 H1: µ > µ0
Tomar µ = µ0 como valor de m si H0 es verdadera para
determinar la zona de rechazo Z  Z es correcto porque el
verdadero nivel de significación es menor que .
¿Cuál hubiese sido la decisión si  = 0,01?
Z.R: Z  Z Z0,01 = 2,326
Z.R: Z  2,326 Zm = 1,667 < 2,326
No se rechaza H0 con probabilidad de error menor que 0,01

31
P = Nivel Justo de Significación es el menor  con el que
se rechaza H0
Si con nivel de significación  se rechaza H0 es P  
Si con nivel de significación  no se rechaza H0 es P > 
El tiempo medio en que la aspirina de la propaganda calma

el dolor de cabeza es mayor que 15 minutos.
P  0,05
32
En el ejemplo, hallar el verdadero valor de P.
Z.R: Z  Z Zm = 1,667
P = P ( Z  Zm siendo Z ~ N(0;1) ) = P ( Z  1,667) =

= 1 – F(1,67) = 1 – 0,9525 = 0,0475
P = 0,0475
33
Representación gráfica de ,  y 
H0: m  m0
Z.R.: Z > Z 
H1: m > m0
 = P(Rechazar H0 si en realidad es
H0 Verdadera)
 = P(Aceptar H0 si en realidad es H0
Falsa)
34
= P(rechazar H0 si en realidad H0 es falsa)
= P(Z  Z si µ > µ0 )
35
Relación entre  y m
H0: m  m0
H1: m > m0
Z.R.: Z  Z 
 y n fijos
si m está lejos de m0
 disminuye
36
Relación entre  y 
H0: m  m0
H1: m > m0
Z.R.: Z  Z 
n fijo
si  disminuye,
 aumenta
37
Test de Student para una media
Para aplicar el test de Student para una media es necesario

verificar el cumplimiento de los supuestos del modelo.
Suposición: X~N(m ; s) m y s son desconocidos
Es decir, debemos verificar que la variable sigue una distribución

aproximadamente normal.
38
Test de Normalidad
Estos contrastes se realizan para comprobar
la hipótesis nula de que la muestra ha sido
extraída de una población con distribución
normal, se pueden realizar gráfica y
analíticamente.
El gráfico Q-Q plot representa los datos
observados de la variable frente a los datos
esperados si la distribución fuera normal. Si
los puntos están cerca de la diagonal
podemos decir que la distribución es
normal. 39
Test de Normalidad en Infostat
Prueba de normalidad en InfoStat (Shapiro-

Wilks modificado) permite probar si la variable
en estudio tiene distribución normal. Las
hipótesis de la prueba son:
H0: las observaciones tienen distribución normal

versus
H1: las observaciones no tienen distribución normal
40
Ejemplo (Nadadoras Experimentador 1)
41
Ejemplo
Q-Q PLOT
Cuantiles observados(PESO MASA GRASA)

15,57 n= 10 r= 0,982 (PESO MASA GRASA)
13,85
12,13
10,42
8,70
8,70 10,42 12,13 13,85 15,57
42
Cuantiles de una Normal(12,18,4,7951)
Ejemplo
43
Ejemplo
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(Unilateral D)

PESO MASA GRASA 10 12,18 2,19 0,92 0,4872
Como p = 0,4872 (es decir, p > 0,05), no se rechaza H0,

la variable sigue una distribución aproximadamente
normal.
44

H0: m  m0 H1: m > m0 m0 es un número conocido
H0: m  m0 H1: m < m0 depende del problema
H0: m = m0 H1: m  m0
X − m0
Estadístico de prueba: T=
S n
Si µ = µ0 entonces, T ~ tn-1
Para cada una de las posibles situaciones hay que
determinar la zona de rechazo 45
H0: m  m0 H1: m > m0
Se rechaza H0 para Zona de rechazo: Z.R.: T > ?
valores grandes de T
? = tn-1;  Z.R: T > tn-1;  46

H0: m  m0 H1: m < m0

T muy negativos
Zona de rechazo: Z.R: T < -?
-? = - tn-1; 
Z.R: T < − tn-1; 
47
H0: m = m0 H1: m  m0
T muy grandes o muy
negativos
Zona de rechazo: Z.R.
T < -? ó T > ?
? = tn-1; /2
Z.R: T  > tn-1; /2
Test de dos colas

48
Resumen
X − m0
Estadístico de prueba: T=
S n
Z.R.
H0: m  m0 H1: m > m0 T > tn-1; 
H0: m  m0 H1: m < m0 T < - tn-1; 
H0: m = m0 H1: m  m0 T  > tn-1; /2
49
Ejemplo de la aspirina suponiendo que s es desconocida y
que en la muestra resultó s = 6
X = Tiempo (min) en que la aspirina de la propaganda
calma el dolor de cabeza
Suposición: X ~ N(m ; s) s desconocida
H0: m  15 H1: m >15

X − m0 X − 15
T= T=
S n S n
 = 0,05
50
Z.R. T > tn-1;  tn-1; = t24; 0,05 = 1,711
Z.R.: T > 1,711

17 − 15
Tm = = 1,667 Tm = 1,667 < 1,711
6 25
No se rechaza H0
¿Cuál es la probabilidad de error al decidir H0) m  15?
Como la decisión es aceptar H0, se comete error si H0

es Falsa.
Por lo tanto, la probabilidad de error es β. 51
Como  puede tomar cualquier valor se dice:
“m no es significativamente mayor que 15”
“El tiempo medio en que la aspirina de la propaganda calma

el dolor de cabeza no es significativamente mayor que 15
minutos”
• Si se rechaza H0 se afirma H1 con P < 

• Si no se rechaza H0 no se puede decir nada porque
la probabilidad de error es 
Juez: Culpable o queda libre por falta de pruebas
52
Test de hipótesis mediante un
intervalo de confianza
Para un parámetro desconocido  se tiene un intervalo
de confianza de nivel 1-: (L1 ; L2)
P (L1 <  < L2 ) = 1 - 
Se plantea un test de hipótesis de dos colas para :
H0:  = 0 H1:   0 0 es conocido
Si se toma como regla de decisión: rechazar H0 si 0 no

pertence al intervalo de confianza, el nivel de
significación de este test es 
53
Ejemplo 1 (2 muestras)
Un investigador está interesado en comparar el efecto de 2

hormonas (A y B) de crecimiento sobre la longitud total
alcanzada por una leguminosa. Para ello se tomó una muestra
de 20 plantas, asignando al azar 10 a cada hormona.
Se quiere determinar si hay diferencias significativas entre los
crecimientos producidos por ambas hormonas a un nivel del
5%.
54
Planteo del problema
X1 = crecimiento producido por la hormona A sobre la

longitud de leguminosas
X2 = crecimiento producido por la hormona B sobre la

longitud de leguminosas
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y

X2 independientes
55
H0: m1 = m2 H1: m1  m2
Se necesita aplicar un test de hipótesis para poder tomar la

decisión.
Se debe usar un Test para diferencia de medias
56
A 7 pacientes acromegálicos se les realizó una prueba de

tolerancia a la glucosa. A cada uno de ellos se le midió la
Glucemia (mg/dl) en ayunas y a los 120 minutos después de
tomar una dosis de glucosa.
Se quiere decidir si, en los pacientes acromegálicos, hay
variación en la glucemia media en ayunas y a los 120 minutos.
57
Planteo del problema
X1 = Glucemia (mg/dl) en ayunas en pacientes
acromegálicos
X2 = Glucemia (mg/dl) a los 120 minutos después de
tomar una dosis de glucosa en pacientes
acromegálicos
Suposiciones: X2 - X1 ~ N(md ; sd) X1 y X2 no son

independientes
H0) m1 = m2 H1) m1  m2
Ambas mediciones se hicieron sobre las mismas
personas, X1 y X2 no son independientes, se dice
58
que son muestras apareadas.
PRUEBAS PARA
DIFERENCIA DE
MEDIAS
MUESTRAS
INDEPENDIENTES PAREADAS
59
Test de Gauss para diferencia de
medias en muestras independientes
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 y s2 conocidas
H0: m1 − m2  a H1: m1 - m2 > a
a valor conocido,
H0: m1 − m2  a H1: m1 − m2 < a
H0: m1 − m2 = a H1: m1 − m2  a generalmente es 0
X1 − X2 −a
Estadístico de prueba: Z=
s12 s2
+ 2
n1 n2
60
Propiedad 6.1
Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes s1 y s2 conocidas
Se toma una muestra aleatoria de tamaño n1 de X1 y una
muestra de tamaño n2 de X2,
independiente de la anterior, entonces
 s12 s 22 
X1 − X 2 ~ N  m1 − m 2 ; +
 n1 n2 
 
X1 − X 2 − (m1 − m 2 )
o bien ~ N (0 ; 1)
s12 s 22 Demostración
+
n1 n2 61
H0: m1 − m2 a H1: m1 - m2 > a
X1 − X2 −a ¿Cuál es la zona de rechazo?
Z=
s12 s2 Si H0) es verdadera consideramos
+ 2
n1 n2 m1 − m2 = a, entonces Z ~ N(0 ; 1)
Se rechaza H0 para valores grandes de Z
Zona de rechazo: Z.R.: Z ?
Z.R.: Z  Z
Las otras zonas de rechazo se determinan análogamente 62

Test de Gauss para diferencia de medias
en muestras independientes - Resumen
X1 y X2 independientes, s1 y s2 conocidas
X 1 − X 2− a
Estadístico de prueba: Z =
s 12 s 22
+
n1 n2
Z.R.
H0: m1 − m2  a H1 : m 1 - m 2 > a Z  Z
H0: m1 − m2  a H1: m1 − m2 < a Z−Z
H0: m1 − m2 = a H1 : m 1 − m 2  a Z   Z /2 63
Distribución F de Fisher
La variable aleatoria Y sigue distribución F de Fisher con

n1 grados de libertad en el numerador y n2 grados de
libertad en el denominador (Y ~ Fn ;n ) , si y sólo si
1 2
X1 / n1
Y=
X2 / n 2
 2
1
 2
X1 ~ n ; X2 ~ n ; X1 y X2 independientes
2
64
Si Y ~ Fn ;n
1 2
P( Y > Fn ;n ; ) = 
1 2
TABLA
65
La tabla sólo da los puntos críticos para  = 0,01

 = 0,05  = 0,10
Si se necesitan puntos críticos para

 = 0,90  = 0,95  = 0,99
hay que calcularlos a partir de los valores de la
tabla utilizando la siguiente propiedad.
66
Propiedad 6.4
1
F1− ; n1 ; n 2 =
F ; n 2 ; n1
67
Propiedad 6.5
Si Y ~ tn entonces Y2 ~ F1 ; n
68
Demostrar
Demostración
Z
Y ~ tn entonces Y=
X /n
Z ~ N(0;1) X
Z y X son independientes
1
2 2
Z
Y2 =
X
Z2 ~ entonces Y2 ~ F1 ; n
n
69
Propiedad 6.6
( t  / 2 ; n ) = F ;1; n
2
70
Propiedad 6.7
X1 ~ N(μ1;σ1) ; X2 ~ N(μ2;σ2) X1 y X2 independientes
S12 es la varianza de una muestra aleatoria de X1 de tamaño n1
S22 es la varianza de una muestra aleatoria de X2 de tamaño n2
S12 s 22
 2  2 ~ F n1 −1; n2 −1
S2 s 1
71
Demostrar
Demostración
(n1 − 1) S12 (n2 − 1) S 22
~  2n1 −1 ~  2n2 −1
s 12 s 22
(n1 − 1) S12
s 12
(n1 − 1)
~ Fn1 −1;n2 −1
(n2 − 1) S 22
s 22
(n2 − 1)
72
Test F para comparar dos varianzas
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2

independientes
H0: s12  s22 H1: s12 > s22
H0: s12  s22 H1: s12 < s22
H0: s12 = s22 H1: s12  s22
S12
Estadístico de prueba: F= 2
S2
Para determinar las zonas de rechazo se debe conocer

73
la distribución que sigue F si H0 es verdadera
Habíamos visto que si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes y se toma una muestra aleatoria de
tamaño n1 de X1 y una muestra de tamaño n2 de X2 ,
independiente de la anterior, con S12 y S22 sus varianzas
muestrales, entonces
S12 s 22
 2 ~ Fn1 −1 ; n 2 −1
S2 s1
2
Si H0 es verdadera consideramos s12 = s22
S12
F= ~ Fn1 −1; n 2 −1
S 22
74
H0: s12  s22 H1: s12 > s22
Se rechaza H0 para valores grandes de F
Zona de rechazo: Z.R.: F  A
A = Fn1−1; n2 −1; 
Z.R.: F  Fn1−1; n2 −1; 
75
H0: s12  s22 H1: s12 < s22
Se rechaza H0 para valores pequeños de F
Zona de rechazo: Z.R.: F  B
B = Fn1 −1;n2 −1;1− 
Z.R.: F  Fn1 −1; n2 −1;1− 
76
H0: s12 = s22 H1: s12  s22
Z.R.: F  C o F  D
C = Fn1 −1;n2 −1;1−  / 2 D = Fn1 −1;n2 −1;  / 2
Z.R.: F  Fn1 −1; n2 −1;1−  / 2 o F  Fn1 −1;n2 −1;  / 2

77
En la aplicación práctica de este test surge el inconveniente
que la tabla de la distribución F tiene únicamente los puntos
críticos para  = 0,01;  = 0,05 y  = 0,10 .
Para determinar las zonas de rechazo limitadas por Fn1 −1; n2 −1;1−  / 2
o por Fn1 −1;n2 −1;  / 2 hay que emplear a la fórmula que relaciona
F con F 1-.
Para solucionar este trastorno y utilizar sólo los valores que

están en la tabla, se recurre a la siguiente regla práctica:
78
Regla práctica
• Al plantear el problema, elegir las variables aleatorias de

modo que si el test es de una cola sea:
H0: s12  s22 H1: s12 > s22
• El estadístico de prueba en la muestra se calcula:
2
sMayor nM = tamaño de la muestra de S2Mayor
Fm =
sm2 enor nm = tamaño de la muestra de S2menor
79
Siempre es Fm > 1 y sólo hay que verificar si está o no dentro de
la zona de rechazo de la derecha
H0: s12  s22 H1: s12 > s22
Z.R. F  FnM −1; nm −1; 
H0: s12 = s22 H1: s12  s22
Z.R. F  FnM −1;nm −1;  / 2

80
Aplicación
A un grupo de 18 varones hipertensos delgados se les da un
tratamiento con amlodipina. Nueve de ellos toman 5 mg por
día y a los otros 10 mg por día.
Al cabo de un mes se les realiza una presurometría
ambulatoria y se registra el valor de la PAS 7-23hs.
Se quiere decidir si la PAS 7-23hs media de los que toman 5
mg, difiere de la de los que toman 10 mg, determinando el
nivel justo de significación.
81
X1 = PAS 7-23hs de la presurometría ambulatoria de varones
hipertensos delgados después de tomar 5mg de
amlodipina por día durante un mes
X2 = PAS 7-23hs de la presurometría ambulatoria de varones
hipertensos delgados después de tomar 10mg de
amlodipina por día durante un mes
X2 independientes
H0) m1 = m2 H1) m1  m2
Se necesita aplicar un test de hipótesis para poder tomar la
decisión.
Se debe usar un Test para diferencia de medias 82
Aplicación
Cuando se utiliza el test de Student para muestras
independientes hay que suponer que s1 = s2 .
Se puede aplicar el test de igualdad de varianzas para
verificar esta suposición.
Se aplicará este test en el ejemplo en que se comparaban las
dosis de 5 y 10 mg de amlodipina (Diapositiva 97)
H0: s1 = s2 H1: s1  s2
¿Qué valor de  se elige?

Como se quiere aceptar H0, la probabilidad de error será .
Se elige  grande para que  sea pequeño. 83
 = 0,10 Z.R.: F > F8; 8; 0,05 = 3,44
s 2 5,4312
Fm = = 1,017
Fm =
Mayor
2
2 5,385
s m enor
No se rechaza H0
s1 no difiere significativamente de s2
Es válido aplicar el test de Student

• Si se rechaza H0 es s1  s2 . No puede aplicarse el test
de Student.
• Se puede efectuar una transformación a los datos de
manera que las varianzas sean homogéneas
84
• Se puede aplicar el test con la corrección de Welch.
Test de Student para dos medias
en muestras independientes
X1 y X2 independientes, s1 = s2
H0: m1 − m2  a H1 : m 1 - m 2 > a
H0: m1 − m2  a H1 : m 1 − m 2 < a
H0: m1 − m2 = a H1: m1 − m2  a
s1 se estima con S1 y s2 se estima con S2, pero s1 = s2 = s
¿cómo se estima s?
Con un promedio “pesado” de S1 y S2 que se llama Sp 85
sˆ = Sp ( n − 1)  S2
+ ( n − 1)  S2
S2p = 1 1 2 2
n1 + n 2 − 2
Propiedad 6.2
Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 = s2 = s
muestra de tamaño n2 de X2, independiente de la anterior, S12
y S22 son sus varianzas muestrales, entonces
2
(n1 + n 2 − 2)  Sp
~ 2n + n − 2
2
s 1 2 86
Propiedad 6.3
Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 = s2 = s
muestra de tamaño n2 de X2, independiente de la anterior,
S12 y S22 son sus varianzas muestrales. Entonces:
X 1 − X 2 − (m 1 − m 2 )
~ t n1 + n 2 − 2
1 1
Sp  +
n1 n2
87
El estadístico de prueba es:
X1 − X 2 − a
T=
1 1
Sp  +
n1 n2
Si H0 es verdadera consideramos m1 − m2 = a, entonces

T ~ t n1 + n 2 − 2
Las zonas de rechazo para cada hipótesis alternativa se

determinan en forma similar al test de Student para una
media, sólo cambian los grados de libertad
88
Test de Student para dos medias
en muestras independientes
Resumen
X1 y X2 independientes, s1 = s2
X 1 − X 2− a ( n − 1)  S2
+ ( n − 1)  S2
Estadístico T= S2p = 1 1 2 2
Sp 
1 1
+ n1 + n 2 − 2
de prueba n1 n2
Z.R.
H0: m1 − m2  a H1: m1 - m2 > a T > tn1 +n2 −2 ; 
H0: m1 − m2  a H1: m1 − m2 < a T < - tn1+n2 −2 ; 
H0: m1 − m2 = a H1: m1 − m2  a T > tn1 +n2 − 2 ;  / 2
89
Ejemplo 1

X2 independientes, s1 = s2
H0: m1 = m2 H1: m1  m2
90
Los datos obtenidos fueron: Hormona Hormona
A B
10 15
n1 = n2 = 10 10 11
13 16
12 17
Primero se calculan la media y los 10 18
desvíos de cada muestra. 8 9
12 14
11 12
Parece lógico suponer que 16 15

15 16
s1 = s2 Media 11,7 14,3
s 2,45 2,83
91
X1 − X 2 − a
T=
Estadístico de prueba: 1 1
Sp  +
n1 n2
( n − 1)  S2
+ ( n − 1)  S2
S2p = 1 1 2 2
n1 + n 2 − 2
 = 0,05 Z.R: T > tn1 +n2 − 2 ;  / 2
t18; 0,05/2 = 2,101 Z.R: T > 2,11

9.(2, 45) 2
+ 9.(2,83) 2
s 2p = = 7,0057
18
S 12 + S 22
2
Notar que si n1 = n2 entonces es: p =
S
2 92
11,7 − 14,3
Tm = = −2,1965
1 1
7,0057  +
10 10
Tm = 2,1965 > 2,101 Rechazo H0
Existen diferencias significativas entre los crecimientos

producidos por ambas hormonas a un nivel del 5%.
93
Utilización del paquete estadístico INFOSTAT
CRECIMIENTO HORMONA
10 1
10 1
13 1
12 1
10 1
8 1
12 1
11 1
16 1
15 1
15 2
11 2
16 2
17 2
18 2
9 2
14 2
12 2
15 2
16 2
94
95
19
16
CRECIMIENTO
13
10
8
1 2
HORMONA
96
Prueba T para muestras Independientes
Variable:CRECIMIENTO - Clasific:HORMONA -
prueba:Bilateral
Grupo 1 Grupo 2
1 2
n 10 10
Media 11,70 14,30
Media(1)-Media(2) -2,60
LI(95) -5,09
LS(95) -0,11
pHomVar 0,6757
T -2,20
gl 18
p-valor 0,0415
97
Test de Student para diferencia de
medias en muestras pareadas
Suposiciones: D ~ N(md ; sd)

X1 y X2 se miden en el mismo individuo
H0: m1 − m2  a H1 : m 1 - m 2 > a
H0: m1 − m2  a H1: m1 − m2 < a
H0: m1 − m2 = a H1 : m 1 − m 2  a
Se define la variable diferencia: D = X1 - X2

98
Si X2 se mide antes de un tratamiento y X1 después, sobre el
mismo individuo, D mide el efecto del tratamiento.
m D = m1 - m2
Suposición: D ~ N(mD; sD)
Las hipótesis escriben en función de mD:
H0: mD  a H1 : m D > a
H0: mD  a H1 : m D < a
H0: mD = a H1: mD  a
Se aplica el Test de Student para una media (mD) ya
que sD es desconocida
99
Con los datos de la variable D se efectúa el test
  n 
2
   Di   1 n
n    D =   Di
  D i 2 −  i =1  
1 n i =1
S 2D =
n − 1 i =1 n 
 
 
  D −a
T=
Estadístico de prueba: SD n
Z.R.
H0: mD  a H1 : m D > a T  tn-1; 
H0: mD  a H1 : m D < a T  - tn-1; 
H0: mD = a H1: mD  a T   tn-1; /2
100
Los datos siguientes corresponden a la prueba de tolerancia a
la glucosa realizada en 7 pacientes acromegálicos. Se midió
la Glucemia (mg/dl) en ayunas y a los 120 minutos después
de tomar una dosis de glucosa. Se quiere decidir si hay
variación en la glucemia media.
Paciente 1 2 3 4 5 6 7
en ayunas 81 77 85 82 97 86 78
a los 120 minutos 76 84 83 95 92 97 84
Diferencia 5 -7 2 -13 5 -11 -6
X1 = Glucemia (mg/dl) en ayunas
X2 = Glucemia (mg/dl) a los 120 minutos 101
D = X1 - X2 = variación de la glucemia durante la prueba
mD = m1 - m2
Suposición: D ~ N(mD; sD)
H0) mD = 0 H1) mD  0
D −a
T= Z.R. T   tn-1; /2
SD n
 = 0,05 t6; /2 = 2,447 Z.R. T  > 2,447

102
Con los 7 valores de la variable D se calcula la media y el
desvío estándar muestral
d = −3,57 sD = 7,5246
− 3,57
Tm = = −1,255
7,5246 7
T  =1,255 < 2,447 No se rechaza H0
No se halló diferencia significativa entre la glucemia

media en ayunas y a los 120 minutos después de tomar la
dosis de glucosa.
103
EN AYUNAS A LAS 2 HORAS

81 76
77 84
85 83
82 95
97 92
86 97
78 84
104
Prueba T (muestras apareadas)
Obs(1) Obs(2) N media(dif) DE(dif) T Bilateral

EN AYUNAS A LOS 120 MINUTOS 7 -3,57 7,52 -1,26 0,2559
105
Ejemplo completo
Se midió excreción urinaria de 5-HIAA (mg en 24 hs) en
pacientes con cardiopatía carcinoide y en un grupo control
sin cardiopatía carcinoide. Se obtuvieron los siguientes
datos:
con 63 120 135 180 1270 274 1585 288 350 891 150 603 721
sin 28 32 43 60 73 119 124 153 854 400 588 445
Decidir si la excreción urinaria de 5-HIAA media es mayor en los

pacientes con cardiopatía carcinoide.
X1 = excreción urinaria de 5-HIAA (mg en 24 hs) en
pacientes con cardiopatía carcinoide
X2 = excreción urinaria de 5-HIAA (mg en 24 hs) en
pacientes sin cardiopatía carcinoide 106
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2
independientes; s1= s2
H0: m1  m2 H1: m1 > m2
El resumen de datos es:
con sin
Media 510 243
s 482,5 267,7
n 13 12
107
Se sospecha que no se cumple la suposición s1= s2
Se debe efectuar el test F para:
H0: s1 = s2 H1: s1  s2
482,52
Fm = = 3,25
267,72
Z.R.: F > F12; 11; 0,05 = 2,79

108
Se rechaza H0
No se puede aplicar el test de Student. ¿Qué se hace?

Se puede efectuar una transformación a los datos o aplicar la
corrección de Welch.
Efectuamos la transformación logaritmo sobre los datos:

Esto significa que se toma una nueva variable
Y = log X
Con los datos transformados, se calculan la media y la

varianza muestral y resulta:
109
log con log sin
Media 2,521 2,128
s 0,432 0,509
n 13 12
H0: s1 = s2 H1: s1  s2
0,5092 Z.R.: F > F11; 12; 0,05 = 2,72
Fm = = 1,39
0,4322
Fm < 2,72 No se rechaza H0
Se acepta igualdad de varianzas y se puede aplicar el test de Student
para las medias con los datos transformados.
12  0, 432 2
+ 11  0,509 2
s 2p = = 0,221 110
13 + 12 − 2
2,521− 2,128
Tm = = 2,09
1 1
0,221 +
13 12
 = 0,05 Z.R: T > tn1+n2-2; 
t23; 0,05 = 1,714 Z.R: T > 1,714
Tm = 2,09 > 1,714 Se rechaza H0
La excreción urinaria de 5-HIAA media en los pacientes

con cardiopatía carcinoide es significativamente mayor
que en los pacientes sin cardiopatía carcinoide. P < 0,05
111
Procedimientos a seguir si no se cumplen
las suposiciones del test de Student para
diferencia de medias en muestras
independientes
Las suposiciones son:
• Hay dos variables aleatorias X1 y X2

• X1 y X2 son normales
• X1 y X2 son independientes
• Las varianzas de X1 y X2 son iguales 112
Dos NO
ANOVA
Variables
SI
Variables NO Métodos no
Normales paramétricos
SI
Muestras NO Test de muestras
Independientes pareadas
SI Efectuar una
Varianzas NO transformación
Iguales
SI Corrección
Test de de Welch
Student Muestras
Independientes 113

UNIDAD 6 (Con Demostraciones)

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

UNIDAD 6 (Con Demostraciones)

Cargado por

Copyright:

Formatos disponibles

BIOESTADÍSTICA

Dra. Myriam Nuñez

Una hipótesis estadística es una proposición o

H0: μ = 1,65 m H0: μ = 1,65 m

A este procedimiento se lo conoce como prueba de

 la fija el experimentador con un valor pequeño: 0,05; 0,01; ...

 = Nivel de significación del Test

De las dos hipótesis posibles, lo que se quiere

Llamamos potencia de un test de hipótesis a la

 = P(rechazar H0 si en realidad H0 es falsa)

Las dos únicas posibilidades son plantear:

Decidir m < 15 significa no acusarlo de propaganda desleal

Decidir m > 15 significa acusarlo de propaganda desleal

 = P(Hacer juicio acusándolo de propaganda desleal y en

 = P(Decidir m > 15 y en realidad es m  15)

 = P(Rechazar H0 y en realidad es H0 Verdadera)

H0: m  15 H1: m >15

Suposición: X ~ N(m ; s) s es conocida

Se rechaza H0 para valores

 = P(Rechazar H0 si en realidad es H0 Verdadera)

Se rechaza H0 para valores de

Test de dos colas

Una muestra aleatoria de 100 muertes registradas en Estados

Suposición: X ~ N(m ; s) s conocida s=6

La probabilidad de error de esta afirmación es menor que 5%

El laboratorio decide acusarlo de propaganda desleal y

¿Cuál hubiese sido la decisión si  = 0,01?

Z.R: Z  Z Z0,01 = 2,326

Z.R: Z  2,326 Zm = 1,667 < 2,326

No se rechaza H0 con probabilidad de error menor que 0,01

Si con nivel de significación  se rechaza H0 es P  

Si con nivel de significación  no se rechaza H0 es P > 

El tiempo medio en que la aspirina de la propaganda calma

P = P ( Z  Zm siendo Z ~ N(0;1) ) = P ( Z  1,667) =

Para aplicar el test de Student para una media es necesario

Suposición: X~N(m ; s) m y s son desconocidos

Es decir, debemos verificar que la variable sigue una distribución

Prueba de normalidad en InfoStat (Shapiro-

H0: las observaciones tienen distribución normal

Cuantiles observados(PESO MASA GRASA)

Variable n Media D.E. W* p(Unilateral D)

Como p = 0,4872 (es decir, p > 0,05), no se rechaza H0,

Suposición: X~N(m ; s) m y s son desconocidos

? = tn-1;  Z.R: T > tn-1;  46

Se rechaza H0 para valores de

Z.R: T < − tn-1; 

Z.R: T  > tn-1; /2

Test de dos colas

Suposición: X ~ N(m ; s) s desconocida

H0: m  15 H1: m >15

Z.R.: T > 1,711

Como la decisión es aceptar H0, se comete error si H0

“El tiempo medio en que la aspirina de la propaganda calma

• Si se rechaza H0 se afirma H1 con P < 

Si se toma como regla de decisión: rechazar H0 si 0 no

Un investigador está interesado en comparar el efecto de 2

X1 = crecimiento producido por la hormona A sobre la

X2 = crecimiento producido por la hormona B sobre la

Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y

Se necesita aplicar un test de hipótesis para poder tomar la

A 7 pacientes acromegálicos se les realizó una prueba de

Suposiciones: X2 - X1 ~ N(md ; sd) X1 y X2 no son

Zona de rechazo: Z.R.: Z ?