Está en la página 1de 113

BIOESTADÍSTICA

Unidad 6

Dra. Myriam Nuñez


TEST DE HIPÓTESIS
En las unidades anteriores vimos como se puede
estimar un parámetro a partir de los datos contenidos
en una muestra. Puede encontrarse ya sea, un sólo
número (estimador puntual), ó, un intervalo de valores
posibles (intervalo de confianza).
Sin embargo muchos problemas requieren que se
tome una decisión entre aceptar o rechazar una
proposición sobre algún parámetro.
Esta proposición recibe el nombre de hipótesis.
2
¿Qué es una Hipótesis?

Una hipótesis estadística es una proposición o


supuesto sobre los parámetros de una o más
poblaciones.
Ejemplo: Supongamos que nos interesa saber si la
altura media de los estudiantes del curso es de 1,65 m.
Esto puede expresarse de manera formal como dos
alternativas ó hipótesis.

H0: μ = 1,65 m
H1: μ  1,65 m
3
La proposición H0: μ = 1,65 se conoce como hipótesis nula;
mientras que la proposición H1: μ  1,65 recibe el nombre de
hipótesis alternativa.
A este procedimiento se lo conoce como prueba de hipótesis
bilateral.
Podría sólo considerarse un caso en la hipótesis alternativa,
o sea, que la hipótesis alternativa especifique valores de μ
que pueden ser mayores o menores que 1,65 m, es decir,

H0: μ = 1,65 m H0: μ = 1,65 m


H1: μ > 1,65 m H1: μ < 1,65 m

A este procedimiento se lo conoce como prueba de


hipótesis unilateral. 4
Es importante recordar que las hipótesis siempre
son proposiciones sobre la población bajo estudio,
no proposiciones sobre la muestra.
Un procedimiento que conduce a una decisión sobre
una hipótesis en particular recibe el nombre de
prueba de hipótesis.
Los procedimientos de prueba de hipótesis
dependen del empleo de la información contenida en
la muestra aleatoria de la población de interés.

5
Si esta información es consistente con la
hipótesis, se concluye que esta es verdadera; sin
embargo, si esta información es inconsistente
con la hipótesis, se concluye que esta es falsa.
Debe hacerse hincapié en que la verdad o
falsedad de una hipótesis en particular nunca
puede conocerse con certidumbre, a menos que
pueda examinarse a toda la población.
Usualmente esto es imposible, por tanto, es
necesario desarrollar un procedimiento de prueba
de hipótesis teniendo en cuenta la probabilidad
de llegar a una conclusión equivocada. 6
La hipótesis alternativa, representada por H1, es
la afirmación contradictoria a H0, y ésta,
generalmente, es la hipótesis a investigar.
La hipótesis nula se rechaza a favor de la
hipótesis alternativa, sólo si la evidencia
muestral sugiere que H0 es falsa. Si la muestra
no contradice decididamente a H0, se continúa
creyendo en la validez de la hipótesis nula.
Entonces, las dos conclusiones posibles de un
análisis por prueba de hipótesis son:
Rechazar H0 No rechazar H0
7
8
9
Realidad
H0 es H0 es
Verdadera Falsa

Error
Aceptar H0
Decisión

Bien
de tipo II

Error
Rechazar H0 Bien
de tipo I

10
 = P(cometer error de tipo I) =
= P(Rechazar H0 y en realidad es H0 Verdadera)
 = P(cometer error de tipo II) =
= P(Aceptar H0 y en realidad es H0 Falsa)
Lo que uno quisiera es que  y  fuesen pequeñas, pero si
una disminuye la otra aumenta

 la fija el experimentador con un valor pequeño: 0,05; 0,01; ...


 puede tomar cualquier valor grande o pequeño

 = Nivel de significación del Test


11
Juez ante un acusado: sus dos hipótesis son Inocente o
Culpable. ¿Cuál sería H0 y H1?
Los dos posibles errores son:
• Decidir culpable y en realidad es inocente
• Decidir inocente y en realidad es culpable
Principio jurídico: Toda persona es inocente hasta que se
pruebe que es culpable
 = P(Rechazar H0 si en realidad es H0 Verdadera)
 = P(Decidir culpable si en realidad es inocente) = pequeña
H0: Inocente H1: Culpable

De las dos hipótesis posibles, lo que se quiere


probar con más seguridad se debe colocar en H1 12
Definición de Potencia ()

Llamamos potencia de un test de hipótesis a la


probabilidad de no cometer Error de Tipo II.
Es la probabilidad de rechazar H0 si en realidad H0 es
falsa.

 = P(rechazar H0 si en realidad H0 es falsa)

=1-
13
Ejemplo
Un laboratorio hace una propaganda en la que dice que el
tiempo medio en que su aspirina calma el dolor de cabeza
es menor que 15 minutos.
Otro laboratorio de la competencia, sospecha que lo que
dice la propaganda no es cierto. Quiere decidir si le hace
juicio o no acusándolo de propaganda desleal. ¿Qué
hipótesis plantearía?
X = Tiempo en que la aspirina de la propaganda calma el
dolor de cabeza

Suposición: X ~ N(m ; s)
14
m = Tiempo medio en que la aspirina de la propaganda
calma el dolor de cabeza
La propaganda dice: m < 15

Las dos únicas posibilidades son plantear:


H0: m  15 H1: m < 15
H0: m  15 H1: m > 15

Decidir m < 15 significa no acusarlo de propaganda desleal

Decidir m > 15 significa acusarlo de propaganda desleal


15
De los dos posibles errores, el de probabilidad  será el que
queremos controlar, es decir, el que queremos que tenga
pequeña probabilidad de ocurrir.

 = P(Hacer juicio acusándolo de propaganda desleal y en


realidad la propaganda es cierta)

 = P(Decidir m > 15 y en realidad es m  15)

 = P(Rechazar H0 y en realidad es H0 Verdadera)

H0: m  15 H1: m >15


16
Procedimiento de test de hipótesis
• Definir las variables aleatorias.
• Establecer las suposiciones necesarias.
• Plantear la hipótesis nula y la alternativa.
• Definir el estadístico de prueba.
• Fijar el nivel de significación ().
• Determinar la zona de rechazo, en función de a.
• Calcular el valor del estadístico de prueba en la muestra
• Tomar la decisión.
• Interpretar la decisión en términos estadísticos.
• Interpretar la decisión en los términos del problema.
17
Definiciones

➢Estadístico de prueba
Es un valor que se determina a partir de la
información de la muestra, es utilizado para decidir si
se rechaza o no la hipótesis nula.
➢Valor crítico
El punto que divide la región entre el lugar en el que
la hipótesis nula es rechazada y no rechazada.

18
Test de Gauss para una media

Suposición: X ~ N(m ; s) s es conocida


H0: m  m0 H1: m > m0 m0 es un número conocido
H0: m  m0 H1: m < m0 depende del problema
H0: m = m0 H1: m  m0
X − m0
Z=
Estadístico de prueba:
s n
Si µ = µ0 entonces Z ~ N(0;1)
Para cada una de las posibles situaciones hay que
19
determinar la zona de rechazo
H0: m  m0 H1: m > m0

Se rechaza H0 para valores


grandes de Z
Zona de rechazo: Z.R.: Z  ?

 = P(Rechazar H0 si en realidad es H0 Verdadera)

? = Z

Z.R: Z  Z

20
H0: m  m0 H1: m < m0
 = P(Rechazar H0 si en realidad es H0 Verdadera)

Se rechaza H0 para valores de


Z muy negativos
Zona de rechazo: Z.R: Z  -?

-? = - Z 

Z.R: Z  − Z 

21
H0: m = m0 H1: m  m0
 = P(Rechazar H0 si en realidad es H0 Verdadera)
Se rechaza H0 para valores de
Z muy grandes o muy
negativos
Zona de rechazo: Z.R.
Z  -? ó Z  ?
? = Z /2

Z.R: Z   Z /2

Test de dos colas


22
Test de Gauss para una media
Resumen
Suposición: X ~ N(m ; s) s es conocida

m0 es un número conocido
X − m0
Estadístico de prueba: Z=
s n
Zona de Rechazo (Z.R.)
H0: m  m0 H1: m > m0 Z  Z
H0: m  m0 H1 : m < m 0 Z −Z
H0: m = m0 H1: m  m0 Z   Z /2
23
EJEMPLO

Una muestra aleatoria de 100 muertes registradas en Estados


Unidos el año pasado, muestra una vida promedio de 71,8
años. Supongamos que la desviación estándar poblacional es
8,9 años. Queremos probar si la vida media hoy en día es
mayor a 70 años con base en esa muestra. La muestra
parecería indicar que es así, pero, ¿cuál es la probabilidad de
que la media de la muestra no refleje la verdadera media de la
población?
24
Solución
Se trata de una distribución muestral de medias con
desviación estándar conocida.

Datos
μ = 70 años
σ = 8,9 años
X = 71,8 años
n = 100
α = 0,05

25
Establecemos las hipótesis
H0: m ≤ 70 H1: m > 70
Nivel de significación
α = 0,05 Zα = 1,645

μ=0 1,645

Regla de decisión
Si Z ≤ 1,645 no se rechaza H0
Si Z > 1,645 se rechaza H0 26
Cálculos
X −m 71,8 − 70
Z= = = 2,02
s 8,9
n 100

Decisión
Como 2,02 > 1,645 se rechaza H0
Conclusión
La vida media es mayor que 70 años.

27
Ejemplo de la aspirina (de la dispositiva 14)
Se administró la aspirina a 25 personas y se obtuvo una
media muestral de 17 minutos. Suponiendo que la varianza
poblacional es 36 min2, ¿cuál será la decisión del laboratorio
con un nivel de significación del 5%?
X = Tiempo (min) en que la aspirina de la propaganda calma el
dolor de cabeza

Suposición: X ~ N(m ; s) s conocida s=6


H0: m 15 H1: m >15
X − 15
Z=
6 n 28
 = 0,05 Z.R. Z  Z  = 1,645
17 − 15
Zm = = 1,667
6 25
Zm =1,667 > 1,645 Se rechaza H0
Se decide m > 15 ¿Cuál es la probabilidad de error?
P(Decidir que m >15 si en realidad es m 15) =  = 0,05
“Tiempo medio en que la aspirina de la propaganda calma el
dolor de cabeza es mayor que 15 minutos”

La probabilidad de error de esta afirmación es menor que 5%

El laboratorio decide acusarlo de propaganda desleal y


29
la probabilidad de equivocarse en la decisión es 5%.
Justificación que la condición más desfavorable, al
determinar la zona de rechazo, ocurre si µ = 15
H0: m  15 H1: m > 15
Se determinó como zona de rechazo Z > 1,645
La distribución del estadístico de prueba es:
X − 15 m − 15
Z= ~ N( ; 1)
s n s/ n

P(error de tipo I) =
P(Rechazar H0 si es verdadera) =
= P(Z  1,645 si µ < 15) < 0,05
30
En el test: H0: µ  µ0 H1: µ > µ0
Tomar µ = µ0 como valor de m si H0 es verdadera para
determinar la zona de rechazo Z  Z es correcto porque el
verdadero nivel de significación es menor que .

¿Cuál hubiese sido la decisión si  = 0,01?

Z.R: Z  Z Z0,01 = 2,326

Z.R: Z  2,326 Zm = 1,667 < 2,326

No se rechaza H0 con probabilidad de error menor que 0,01


31
P = Nivel Justo de Significación es el menor  con el que
se rechaza H0

Si con nivel de significación  se rechaza H0 es P  

Si con nivel de significación  no se rechaza H0 es P > 

El tiempo medio en que la aspirina de la propaganda calma


el dolor de cabeza es mayor que 15 minutos.
P  0,05
32
En el ejemplo, hallar el verdadero valor de P.

Z.R: Z  Z Zm = 1,667

P = P ( Z  Zm siendo Z ~ N(0;1) ) = P ( Z  1,667) =


= 1 – F(1,67) = 1 – 0,9525 = 0,0475

P = 0,0475
33
Representación gráfica de ,  y 
H0: m  m0
Z.R.: Z > Z 
H1: m > m0

 = P(Rechazar H0 si en realidad es
H0 Verdadera)

 = P(Aceptar H0 si en realidad es H0
Falsa)

34
= P(rechazar H0 si en realidad H0 es falsa)

= P(Z  Z si µ > µ0 )

35
Relación entre  y m

H0: m  m0
H1: m > m0

Z.R.: Z  Z 

 y n fijos
si m está lejos de m0
 disminuye
36
Relación entre  y 

H0: m  m0
H1: m > m0

Z.R.: Z  Z 

n fijo
si  disminuye,
 aumenta

37
Test de Student para una media

Para aplicar el test de Student para una media es necesario


verificar el cumplimiento de los supuestos del modelo.

Suposición: X~N(m ; s) m y s son desconocidos

Es decir, debemos verificar que la variable sigue una distribución


aproximadamente normal.

38
Test de Normalidad
Estos contrastes se realizan para comprobar
la hipótesis nula de que la muestra ha sido
extraída de una población con distribución
normal, se pueden realizar gráfica y
analíticamente.
El gráfico Q-Q plot representa los datos
observados de la variable frente a los datos
esperados si la distribución fuera normal. Si
los puntos están cerca de la diagonal
podemos decir que la distribución es
normal. 39
Test de Normalidad en Infostat

Prueba de normalidad en InfoStat (Shapiro-


Wilks modificado) permite probar si la variable
en estudio tiene distribución normal. Las
hipótesis de la prueba son:

H0: las observaciones tienen distribución normal


versus
H1: las observaciones no tienen distribución normal

40
Test de Normalidad en Infostat
Ejemplo (Nadadoras Experimentador 1)

41
Test de Normalidad en Infostat
Ejemplo
Q-Q PLOT

Cuantiles observados(PESO MASA GRASA)


15,57 n= 10 r= 0,982 (PESO MASA GRASA)

13,85

12,13

10,42

8,70
8,70 10,42 12,13 13,85 15,57
42
Cuantiles de una Normal(12,18,4,7951)
Test de Normalidad en Infostat
Ejemplo

43
Test de Normalidad en Infostat
Ejemplo

Shapiro-Wilks (modificado)

Variable n Media D.E. W* p(Unilateral D)


PESO MASA GRASA 10 12,18 2,19 0,92 0,4872

Como p = 0,4872 (es decir, p > 0,05), no se rechaza H0,


la variable sigue una distribución aproximadamente
normal.
44
Test de Student para una media

Suposición: X~N(m ; s) m y s son desconocidos


H0: m  m0 H1: m > m0 m0 es un número conocido
H0: m  m0 H1: m < m0 depende del problema
H0: m = m0 H1: m  m0

X − m0
Estadístico de prueba: T=
S n
Si µ = µ0 entonces, T ~ tn-1
Para cada una de las posibles situaciones hay que
determinar la zona de rechazo 45
H0: m  m0 H1: m > m0
 = P(Rechazar H0 si en realidad es H0 Verdadera)
Se rechaza H0 para Zona de rechazo: Z.R.: T > ?
valores grandes de T

? = tn-1;  Z.R: T > tn-1;  46


H0: m  m0 H1: m < m0
 = P(Rechazar H0 si en realidad es H0 Verdadera)

Se rechaza H0 para valores de


T muy negativos
Zona de rechazo: Z.R: T < -?

-? = - tn-1; 

Z.R: T < − tn-1; 

47
H0: m = m0 H1: m  m0
 = P(Rechazar H0 si en realidad es H0 Verdadera)
Se rechaza H0 para valores de
T muy grandes o muy
negativos
Zona de rechazo: Z.R.
T < -? ó T > ?
? = tn-1; /2

Z.R: T  > tn-1; /2

Test de dos colas


48
Test de Student para una media
Resumen
Suposición: X~N(m ; s) m y s son desconocidos

X − m0
Estadístico de prueba: T=
S n

Z.R.
H0: m  m0 H1: m > m0 T > tn-1; 
H0: m  m0 H1: m < m0 T < - tn-1; 
H0: m = m0 H1: m  m0 T  > tn-1; /2
49
Ejemplo de la aspirina suponiendo que s es desconocida y
que en la muestra resultó s = 6
X = Tiempo (min) en que la aspirina de la propaganda
calma el dolor de cabeza

Suposición: X ~ N(m ; s) s desconocida

H0: m  15 H1: m >15


X − m0 X − 15
T= T=
S n S n

 = 0,05
50
Z.R. T > tn-1;  tn-1; = t24; 0,05 = 1,711

Z.R.: T > 1,711


17 − 15
Tm = = 1,667 Tm = 1,667 < 1,711
6 25

No se rechaza H0
¿Cuál es la probabilidad de error al decidir H0) m  15?

Como la decisión es aceptar H0, se comete error si H0


es Falsa.
Por lo tanto, la probabilidad de error es β. 51
Como  puede tomar cualquier valor se dice:
“m no es significativamente mayor que 15”

“El tiempo medio en que la aspirina de la propaganda calma


el dolor de cabeza no es significativamente mayor que 15
minutos”

• Si se rechaza H0 se afirma H1 con P < 


• Si no se rechaza H0 no se puede decir nada porque
la probabilidad de error es 
Juez: Culpable o queda libre por falta de pruebas
52
Test de hipótesis mediante un
intervalo de confianza
Para un parámetro desconocido  se tiene un intervalo
de confianza de nivel 1-: (L1 ; L2)
P (L1 <  < L2 ) = 1 - 
Se plantea un test de hipótesis de dos colas para :
H0:  = 0 H1:   0 0 es conocido

Si se toma como regla de decisión: rechazar H0 si 0 no


pertence al intervalo de confianza, el nivel de
significación de este test es 
53
Ejemplo 1 (2 muestras)

Un investigador está interesado en comparar el efecto de 2


hormonas (A y B) de crecimiento sobre la longitud total
alcanzada por una leguminosa. Para ello se tomó una muestra
de 20 plantas, asignando al azar 10 a cada hormona.
Se quiere determinar si hay diferencias significativas entre los
crecimientos producidos por ambas hormonas a un nivel del
5%.

54
Planteo del problema

X1 = crecimiento producido por la hormona A sobre la


longitud de leguminosas

X2 = crecimiento producido por la hormona B sobre la


longitud de leguminosas

Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y


X2 independientes
55
H0: m1 = m2 H1: m1  m2

Se necesita aplicar un test de hipótesis para poder tomar la


decisión.
Se debe usar un Test para diferencia de medias

56
Ejemplo 2 (2 muestras)

A 7 pacientes acromegálicos se les realizó una prueba de


tolerancia a la glucosa. A cada uno de ellos se le midió la
Glucemia (mg/dl) en ayunas y a los 120 minutos después de
tomar una dosis de glucosa.
Se quiere decidir si, en los pacientes acromegálicos, hay
variación en la glucemia media en ayunas y a los 120 minutos.

57
Planteo del problema
X1 = Glucemia (mg/dl) en ayunas en pacientes
acromegálicos
X2 = Glucemia (mg/dl) a los 120 minutos después de
tomar una dosis de glucosa en pacientes
acromegálicos

Suposiciones: X2 - X1 ~ N(md ; sd) X1 y X2 no son


independientes

H0) m1 = m2 H1) m1  m2
Ambas mediciones se hicieron sobre las mismas
personas, X1 y X2 no son independientes, se dice
58
que son muestras apareadas.
PRUEBAS PARA
DIFERENCIA DE
MEDIAS

MUESTRAS

INDEPENDIENTES PAREADAS

59
Test de Gauss para diferencia de
medias en muestras independientes
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 y s2 conocidas
H0: m1 − m2  a H1: m1 - m2 > a
a valor conocido,
H0: m1 − m2  a H1: m1 − m2 < a
H0: m1 − m2 = a H1: m1 − m2  a generalmente es 0

X1 − X2 −a
Estadístico de prueba: Z=
s12 s2
+ 2
n1 n2
60
Propiedad 6.1
Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes s1 y s2 conocidas
Se toma una muestra aleatoria de tamaño n1 de X1 y una
muestra de tamaño n2 de X2,
independiente de la anterior, entonces
 s12 s 22 
X1 − X 2 ~ N  m1 − m 2 ; +
 n1 n2 
 

X1 − X 2 − (m1 − m 2 )
o bien ~ N (0 ; 1)
s12 s 22 Demostración
+
n1 n2 61
H0: m1 − m2 a H1: m1 - m2 > a
X1 − X2 −a ¿Cuál es la zona de rechazo?
Z=
s12 s2 Si H0) es verdadera consideramos
+ 2
n1 n2 m1 − m2 = a, entonces Z ~ N(0 ; 1)
Se rechaza H0 para valores grandes de Z

Zona de rechazo: Z.R.: Z ?

Z.R.: Z  Z

Las otras zonas de rechazo se determinan análogamente 62


Test de Gauss para diferencia de medias
en muestras independientes - Resumen
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 y s2 conocidas
X 1 − X 2− a
Estadístico de prueba: Z =
s 12 s 22
+
n1 n2
Z.R.
H0: m1 − m2  a H1 : m 1 - m 2 > a Z  Z
H0: m1 − m2  a H1: m1 − m2 < a Z−Z
H0: m1 − m2 = a H1 : m 1 − m 2  a Z   Z /2 63
Distribución F de Fisher

La variable aleatoria Y sigue distribución F de Fisher con


n1 grados de libertad en el numerador y n2 grados de
libertad en el denominador (Y ~ Fn ;n ) , si y sólo si
1 2

X1 / n1
Y=
X2 / n 2
 2
1
 2
X1 ~ n ; X2 ~ n ; X1 y X2 independientes
2
64
Distribución F de Fisher

Si Y ~ Fn ;n
1 2

P( Y > Fn ;n ; ) = 
1 2
TABLA

65
Distribución F de Fisher

La tabla sólo da los puntos críticos para  = 0,01


 = 0,05  = 0,10

Si se necesitan puntos críticos para


 = 0,90  = 0,95  = 0,99
hay que calcularlos a partir de los valores de la
tabla utilizando la siguiente propiedad.

66
Propiedad 6.4

1
F1− ; n1 ; n 2 =
F ; n 2 ; n1

67
Propiedad 6.5

Si Y ~ tn entonces Y2 ~ F1 ; n

68

Demostrar
Demostración
Z
Y ~ tn entonces Y=
X /n

Z ~ N(0;1) X
Z y X son independientes
1
2 2
Z
Y2 =
X
Z2 ~ entonces Y2 ~ F1 ; n
n

69
Propiedad 6.6

( t  / 2 ; n ) = F ;1; n
2

70
Propiedad 6.7
X1 ~ N(μ1;σ1) ; X2 ~ N(μ2;σ2) X1 y X2 independientes
S12 es la varianza de una muestra aleatoria de X1 de tamaño n1

S22 es la varianza de una muestra aleatoria de X2 de tamaño n2

S12 s 22
 2  2 ~ F n1 −1; n2 −1
S2 s 1

71

Demostrar
Demostración
(n1 − 1) S12 (n2 − 1) S 22
~  2n1 −1 ~  2n2 −1
s 12 s 22

(n1 − 1) S12
s 12
(n1 − 1)
~ Fn1 −1;n2 −1
(n2 − 1) S 22
s 22
(n2 − 1)

72
Test F para comparar dos varianzas

Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2


independientes
H0: s12  s22 H1: s12 > s22
H0: s12  s22 H1: s12 < s22
H0: s12 = s22 H1: s12  s22

S12
Estadístico de prueba: F= 2
S2

Para determinar las zonas de rechazo se debe conocer


73
la distribución que sigue F si H0 es verdadera
Habíamos visto que si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes y se toma una muestra aleatoria de
tamaño n1 de X1 y una muestra de tamaño n2 de X2 ,
independiente de la anterior, con S12 y S22 sus varianzas
muestrales, entonces
S12 s 22
 2 ~ Fn1 −1 ; n 2 −1
S2 s1
2

Si H0 es verdadera consideramos s12 = s22

S12
F= ~ Fn1 −1; n 2 −1
S 22
74
H0: s12  s22 H1: s12 > s22

Se rechaza H0 para valores grandes de F

Zona de rechazo: Z.R.: F  A

 = P(Rechazar H0 si en realidad es H0 Verdadera)

A = Fn1−1; n2 −1; 
Z.R.: F  Fn1−1; n2 −1; 
75
H0: s12  s22 H1: s12 < s22

Se rechaza H0 para valores pequeños de F

Zona de rechazo: Z.R.: F  B

B = Fn1 −1;n2 −1;1− 

Z.R.: F  Fn1 −1; n2 −1;1− 

76
H0: s12 = s22 H1: s12  s22

Z.R.: F  C o F  D

 = P(Rechazar H0 si en realidad es H0 Verdadera)

C = Fn1 −1;n2 −1;1−  / 2 D = Fn1 −1;n2 −1;  / 2

Z.R.: F  Fn1 −1; n2 −1;1−  / 2 o F  Fn1 −1;n2 −1;  / 2


77
En la aplicación práctica de este test surge el inconveniente
que la tabla de la distribución F tiene únicamente los puntos
críticos para  = 0,01;  = 0,05 y  = 0,10 .
Para determinar las zonas de rechazo limitadas por Fn1 −1; n2 −1;1−  / 2

o por Fn1 −1;n2 −1;  / 2 hay que emplear a la fórmula que relaciona

F con F 1-.

Para solucionar este trastorno y utilizar sólo los valores que


están en la tabla, se recurre a la siguiente regla práctica:

78
Regla práctica

• Al plantear el problema, elegir las variables aleatorias de


modo que si el test es de una cola sea:
H0: s12  s22 H1: s12 > s22
• El estadístico de prueba en la muestra se calcula:

2
sMayor nM = tamaño de la muestra de S2Mayor
Fm =
sm2 enor nm = tamaño de la muestra de S2menor

79
Siempre es Fm > 1 y sólo hay que verificar si está o no dentro de
la zona de rechazo de la derecha

H0: s12  s22 H1: s12 > s22

Z.R. F  FnM −1; nm −1; 

H0: s12 = s22 H1: s12  s22

Z.R. F  FnM −1;nm −1;  / 2


80
Aplicación
A un grupo de 18 varones hipertensos delgados se les da un
tratamiento con amlodipina. Nueve de ellos toman 5 mg por
día y a los otros 10 mg por día.
Al cabo de un mes se les realiza una presurometría
ambulatoria y se registra el valor de la PAS 7-23hs.
Se quiere decidir si la PAS 7-23hs media de los que toman 5
mg, difiere de la de los que toman 10 mg, determinando el
nivel justo de significación.

81
X1 = PAS 7-23hs de la presurometría ambulatoria de varones
hipertensos delgados después de tomar 5mg de
amlodipina por día durante un mes
X2 = PAS 7-23hs de la presurometría ambulatoria de varones
hipertensos delgados después de tomar 10mg de
amlodipina por día durante un mes
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y
X2 independientes

H0) m1 = m2 H1) m1  m2
Se necesita aplicar un test de hipótesis para poder tomar la
decisión.
Se debe usar un Test para diferencia de medias 82
Aplicación
Cuando se utiliza el test de Student para muestras
independientes hay que suponer que s1 = s2 .
Se puede aplicar el test de igualdad de varianzas para
verificar esta suposición.
Se aplicará este test en el ejemplo en que se comparaban las
dosis de 5 y 10 mg de amlodipina (Diapositiva 97)

H0: s1 = s2 H1: s1  s2

¿Qué valor de  se elige?


Como se quiere aceptar H0, la probabilidad de error será .
Se elige  grande para que  sea pequeño. 83
 = 0,10 Z.R.: F > F8; 8; 0,05 = 3,44

s 2 5,4312
Fm = = 1,017
Fm =
Mayor
2
2 5,385
s m enor
No se rechaza H0

s1 no difiere significativamente de s2

Es válido aplicar el test de Student


• Si se rechaza H0 es s1  s2 . No puede aplicarse el test
de Student.
• Se puede efectuar una transformación a los datos de
manera que las varianzas sean homogéneas
84
• Se puede aplicar el test con la corrección de Welch.
Test de Student para dos medias
en muestras independientes
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 = s2

H0: m1 − m2  a H1 : m 1 - m 2 > a
H0: m1 − m2  a H1 : m 1 − m 2 < a
H0: m1 − m2 = a H1: m1 − m2  a
s1 se estima con S1 y s2 se estima con S2, pero s1 = s2 = s
¿cómo se estima s?
Con un promedio “pesado” de S1 y S2 que se llama Sp 85
sˆ = Sp ( n − 1)  S2
+ ( n − 1)  S2
S2p = 1 1 2 2
n1 + n 2 − 2

Propiedad 6.2
Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 = s2 = s
Se toma una muestra aleatoria de tamaño n1 de X1 y una
muestra de tamaño n2 de X2, independiente de la anterior, S12
y S22 son sus varianzas muestrales, entonces

2
(n1 + n 2 − 2)  Sp
~ 2n + n − 2
2
s 1 2 86
Propiedad 6.3
Si X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 = s2 = s
Se toma una muestra aleatoria de tamaño n1 de X1 y una
muestra de tamaño n2 de X2, independiente de la anterior,
S12 y S22 son sus varianzas muestrales. Entonces:

X 1 − X 2 − (m 1 − m 2 )
~ t n1 + n 2 − 2
1 1
Sp  +
n1 n2
87
El estadístico de prueba es:

X1 − X 2 − a
T=
1 1
Sp  +
n1 n2

Si H0 es verdadera consideramos m1 − m2 = a, entonces


T ~ t n1 + n 2 − 2

Las zonas de rechazo para cada hipótesis alternativa se


determinan en forma similar al test de Student para una
media, sólo cambian los grados de libertad
88
Test de Student para dos medias
en muestras independientes
Resumen
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2)
X1 y X2 independientes, s1 = s2

X 1 − X 2− a ( n − 1)  S2
+ ( n − 1)  S2
Estadístico T= S2p = 1 1 2 2
Sp 
1 1
+ n1 + n 2 − 2
de prueba n1 n2
Z.R.
H0: m1 − m2  a H1: m1 - m2 > a T > tn1 +n2 −2 ; 
H0: m1 − m2  a H1: m1 − m2 < a T < - tn1+n2 −2 ; 
H0: m1 − m2 = a H1: m1 − m2  a T > tn1 +n2 − 2 ;  / 2
89
Ejemplo 1

Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y


X2 independientes, s1 = s2

H0: m1 = m2 H1: m1  m2

90
Ejemplo 1 (2 muestras)
Los datos obtenidos fueron: Hormona Hormona
A B
10 15
n1 = n2 = 10 10 11
13 16
12 17
Primero se calculan la media y los 10 18
desvíos de cada muestra. 8 9
12 14
11 12

Parece lógico suponer que 16 15


15 16
s1 = s2 Media 11,7 14,3
s 2,45 2,83

91
X1 − X 2 − a
T=
Estadístico de prueba: 1 1
Sp  +
n1 n2
( n − 1)  S2
+ ( n − 1)  S2
S2p = 1 1 2 2
n1 + n 2 − 2

 = 0,05 Z.R: T > tn1 +n2 − 2 ;  / 2

t18; 0,05/2 = 2,101 Z.R: T > 2,11


9.(2, 45) 2
+ 9.(2,83) 2
s 2p = = 7,0057
18
S 12 + S 22
2
Notar que si n1 = n2 entonces es: p =
S
2 92
11,7 − 14,3
Tm = = −2,1965
1 1
7,0057  +
10 10

Tm = 2,1965 > 2,101 Rechazo H0

Existen diferencias significativas entre los crecimientos


producidos por ambas hormonas a un nivel del 5%.

93
Utilización del paquete estadístico INFOSTAT
CRECIMIENTO HORMONA
10 1
10 1
13 1
12 1
10 1
8 1
12 1
11 1
16 1
15 1
15 2
11 2
16 2
17 2
18 2
9 2
14 2
12 2
15 2
16 2
94
Utilización del paquete estadístico INFOSTAT

95
Utilización del paquete estadístico INFOSTAT
19

16
CRECIMIENTO

13

10

8
1 2
HORMONA
96
Utilización del paquete estadístico INFOSTAT

Prueba T para muestras Independientes

Variable:CRECIMIENTO - Clasific:HORMONA -
prueba:Bilateral

Grupo 1 Grupo 2
1 2
n 10 10
Media 11,70 14,30
Media(1)-Media(2) -2,60
LI(95) -5,09
LS(95) -0,11
pHomVar 0,6757
T -2,20
gl 18
p-valor 0,0415
97
Test de Student para diferencia de
medias en muestras pareadas

Suposiciones: D ~ N(md ; sd)


X1 y X2 se miden en el mismo individuo

H0: m1 − m2  a H1 : m 1 - m 2 > a
H0: m1 − m2  a H1: m1 − m2 < a
H0: m1 − m2 = a H1 : m 1 − m 2  a

Se define la variable diferencia: D = X1 - X2


98
Si X2 se mide antes de un tratamiento y X1 después, sobre el
mismo individuo, D mide el efecto del tratamiento.
m D = m1 - m2

Suposición: D ~ N(mD; sD)

Las hipótesis escriben en función de mD:

H0: mD  a H1 : m D > a
H0: mD  a H1 : m D < a
H0: mD = a H1: mD  a
Se aplica el Test de Student para una media (mD) ya
que sD es desconocida
99
Con los datos de la variable D se efectúa el test
  n 
2
   Di   1 n
n    D =   Di
  D i 2 −  i =1  
1 n i =1
S 2D =
n − 1 i =1 n 
 
 
  D −a
T=
Estadístico de prueba: SD n

Z.R.
H0: mD  a H1 : m D > a T  tn-1; 
H0: mD  a H1 : m D < a T  - tn-1; 
H0: mD = a H1: mD  a T   tn-1; /2
100
Ejemplo 2 (2 muestras)
Los datos siguientes corresponden a la prueba de tolerancia a
la glucosa realizada en 7 pacientes acromegálicos. Se midió
la Glucemia (mg/dl) en ayunas y a los 120 minutos después
de tomar una dosis de glucosa. Se quiere decidir si hay
variación en la glucemia media.
Paciente 1 2 3 4 5 6 7
en ayunas 81 77 85 82 97 86 78
a los 120 minutos 76 84 83 95 92 97 84
Diferencia 5 -7 2 -13 5 -11 -6
X1 = Glucemia (mg/dl) en ayunas
X2 = Glucemia (mg/dl) a los 120 minutos 101
D = X1 - X2 = variación de la glucemia durante la prueba

mD = m1 - m2

Suposición: D ~ N(mD; sD)

H0) mD = 0 H1) mD  0

D −a
T= Z.R. T   tn-1; /2
SD n

 = 0,05 t6; /2 = 2,447 Z.R. T  > 2,447


102
Con los 7 valores de la variable D se calcula la media y el
desvío estándar muestral

d = −3,57 sD = 7,5246

− 3,57
Tm = = −1,255
7,5246 7

T  =1,255 < 2,447 No se rechaza H0

No se halló diferencia significativa entre la glucemia


media en ayunas y a los 120 minutos después de tomar la
dosis de glucosa.
103
Utilización del paquete estadístico INFOSTAT

EN AYUNAS A LAS 2 HORAS


81 76
77 84
85 83
82 95
97 92
86 97
78 84

104
Utilización del paquete estadístico INFOSTAT

Prueba T (muestras apareadas)

Obs(1) Obs(2) N media(dif) DE(dif) T Bilateral


EN AYUNAS A LOS 120 MINUTOS 7 -3,57 7,52 -1,26 0,2559

105
Ejemplo completo
Se midió excreción urinaria de 5-HIAA (mg en 24 hs) en
pacientes con cardiopatía carcinoide y en un grupo control
sin cardiopatía carcinoide. Se obtuvieron los siguientes
datos:
con 63 120 135 180 1270 274 1585 288 350 891 150 603 721
sin 28 32 43 60 73 119 124 153 854 400 588 445

Decidir si la excreción urinaria de 5-HIAA media es mayor en los


pacientes con cardiopatía carcinoide.
X1 = excreción urinaria de 5-HIAA (mg en 24 hs) en
pacientes con cardiopatía carcinoide
X2 = excreción urinaria de 5-HIAA (mg en 24 hs) en
pacientes sin cardiopatía carcinoide 106
Suposiciones: X1 ~ N(m1 ; s1) y X2 ~ N(m2 ; s2) X1 y X2
independientes; s1= s2

H0: m1  m2 H1: m1 > m2

El resumen de datos es:

con sin
Media 510 243
s 482,5 267,7
n 13 12

107
Se sospecha que no se cumple la suposición s1= s2

Se debe efectuar el test F para:

H0: s1 = s2 H1: s1  s2

482,52
Fm = = 3,25
267,72

Z.R.: F > F12; 11; 0,05 = 2,79


108
Se rechaza H0

No se puede aplicar el test de Student. ¿Qué se hace?


Se puede efectuar una transformación a los datos o aplicar la
corrección de Welch.

Efectuamos la transformación logaritmo sobre los datos:


Esto significa que se toma una nueva variable
Y = log X

Con los datos transformados, se calculan la media y la


varianza muestral y resulta:
109
log con log sin
Media 2,521 2,128
s 0,432 0,509
n 13 12

H0: s1 = s2 H1: s1  s2
0,5092 Z.R.: F > F11; 12; 0,05 = 2,72
Fm = = 1,39
0,4322
Fm < 2,72 No se rechaza H0
Se acepta igualdad de varianzas y se puede aplicar el test de Student
para las medias con los datos transformados.

12  0, 432 2
+ 11  0,509 2
s 2p = = 0,221 110
13 + 12 − 2
2,521− 2,128
Tm = = 2,09
1 1
0,221 +
13 12

 = 0,05 Z.R: T > tn1+n2-2; 

t23; 0,05 = 1,714 Z.R: T > 1,714

Tm = 2,09 > 1,714 Se rechaza H0

La excreción urinaria de 5-HIAA media en los pacientes


con cardiopatía carcinoide es significativamente mayor
que en los pacientes sin cardiopatía carcinoide. P < 0,05
111
Procedimientos a seguir si no se cumplen
las suposiciones del test de Student para
diferencia de medias en muestras
independientes

Las suposiciones son:

• Hay dos variables aleatorias X1 y X2


• X1 y X2 son normales
• X1 y X2 son independientes
• Las varianzas de X1 y X2 son iguales 112
Dos NO
ANOVA
Variables

SI
Variables NO Métodos no
Normales paramétricos

SI
Muestras NO Test de muestras
Independientes pareadas
SI Efectuar una
Varianzas NO transformación
Iguales
SI Corrección
Test de de Welch
Student Muestras
Independientes 113

También podría gustarte