Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema - 8 Test de Hipotesis PDF
Tema - 8 Test de Hipotesis PDF
Tests de hipótesis
8.1. Introducción
8.1.1. Definiciones
8.1.2. Pasos para la realización de un test
249
! 8.1. Introducción
! 8.1.1. Definiciones
250
Ejemplos:
Tests paramétricos:
Establecemos la afirmación: µ ≤ 10
Tests no paramétricos:
251
2. Hipótesis del test:
Ejemplos:
Test paramétricos:
H 0 : µ ≤ 10
H 1 : µ > 10
Test no paramétricos:
H 0 : La muestra se ha seleccionado
aleatoriamente
H 1 : La muestra no se ha seleccionado
aleatoriamente
252
3. Estadístico del test
! Llamamos Estadístico del Test o Estadístico de
Contraste a una variable aleatoria, con distribución de
probabilidad conocida, y cuyos valores nos permiten
tomar la decisión de aceptar o rechazar la hipótesis
nula.
H 0 : µ = µ 0 σ
X → Nµ ;
H1 : µ ≠ µ 0 n
1 n
x1 , x 2 ,..., x n x = ∑ xi
n i =1
253
4. Errores asociados al contraste
! Error tipo I: Error que se comete al rechazar la
hipótesis nula, H 0, cuando ésta es cierta.
α = P [ Error tipo I ] =
P [ Rechazar H 0 / H 0 es verdadera ]
β = P [ Error tipo II ] =
P [ No Rechazar H 0 / H 0 es falsa ]
H0 Rechazo No rechazo
Verdadera Error tipo I (α) Correcto
1 − β = P [ Rechazar H 0 / H 0 es falsa ]
254
# Ejemplo Contrate de Hipótesis
H 0 : µ = µ 0
1. Planteamiento del test:
H1 : µ ≠ µ 0
σ
2. Estadístico del test: X → Nµ ;
n
σ
Bajo la hipótesis nula: X → N µ0 ;
n
1 n
cuya media valdrá: x = ∑ xi
n i =1
255
3. Criterio de decisión: Comprobar si el valor concreto
de la media muestral calculada, está o no muy alejado
de µ 0
! Rechazamos H 0 si la media muestral no está
“próxima” a µ 0.
! No rechazamos H 0 si la media muestral está
“próxima” a µ 0.
α /2 1−α α /2
µ 0.
Media muestral
Rechazo No Rechazo Rechazo
256
5. Tipos de hipótesis. Región Crítica. P-valor.
Contrastes unilaterales y bilaterales
H: θ ∈ ( θ 1, θ 2 )
H0 : µ = µ0
Simple – Compuesta
H1 : µ ≠ µ 0
H0 : µ ≤ µ0
Compuesta – Compuesta
H1 : µ > µ0
H0 : µ ≥ µ0
Compuesta - Compuesta
H1 : µ < µ0
257
Al aplicar un contraste de hipótesis, clasificamos los
puntos del espacio muestral en dos regiones excluyentes
y complementarias:
Región de rechazo
Región de no
rechazo
258
! p-valor o nivel de significación observado: Es
el área que deja a la derecha el valor experimental
del estadístico.
No rechazar
hipótesis nula
p-valor
zexp zα
Si α ≥ p - valor ⇒ Rechazar H 0
Rechazar
hipótesis nula
p-valor
zα zexp
259
! Contrastes unilaterales y bilaterales:
" Si la hipótesis alternativa da lugar a una región
crítica “a ambos lados” del valor del parámetro,
diremos que el test es bilateral o de dos colas
Región crítica
Región crítica
260
! 8.1.2. Pasos para la realización de un test
H0 : θ = θ0
Si el contraste es bilateral
H1 : θ ≠ θ0
Varianza Conocida
H 0 : µ = µ0 z exp ≤ − z α 2
H1 : µ ≠ µ0 z exp ≥ zα 2
H 0 : µ ≤ µ0
X −µ0
Z= → N (0;1)
σ
H1 : µ > µ0 n z exp ≥ zα
H 0 : µ ≥ µ0 z exp ≤ − z α
H1 : µ < µ0
262
Varianza Desconocida
Estadístico de contraste
X −µ0
T=
S
→ t n−1
n
Hipótesis
Criterio de rechazo
del test
H 0 : µ = µ0 t exp ≤ −t α 2;n −1
H1 : µ ≠ µ0
t exp ≥ t α 2;n −1
H 0 : µ ≤ µ0
t exp ≥ t α ;n −1
H1 : µ > µ0
H 0 : µ ≥ µ0
t exp ≤ − t α ;n −1
H1 : µ < µ0
263
# Ejemplo:
X: “Contenido Proteico”, X → N (µ ; σ )
Contraste de Hipótesis:
H 0 : µ ≥ 42
H1 : µ < 42
264
n = 10; x = 40; s = 3.5
H 0 : µ ≥ 42
Contraste de Hipótesis:
H1 : µ < 42
Estadístico de contraste:
x − µ0
→ t n−1
S
n
40 − 42
t exp = = −1.8070 ⇒ No rechazamos H 0
3.5
10
0.05
0.95
t 0.95 ; 9 texp
265
! Contrastes sobre la varianza
Media desconocida
Estadístico de contraste
χ2 =
( )
n − 1 S 2
→ χ n2−1
σ 02
2
H 0 : σ 2 = σ 02 χ exp ≤ χ 12−α 2; n −1
H1 : σ 2 ≠ σ 02 2
χ exp ≥ χ α2 2; n −1
H 0 : σ 2 ≤ σ 02 2
χ exp ≥ χ α2 ; n −1
H1 : σ 2 > σ 02
H 0 : σ 2 ≥ σ 02 2
χ exp ≤ χ 21−α ; n −1
H1 : σ 2 < σ 02
266
# Ejemplo:
X → N (µ ; σ )
n = 15; s 2 = 0.21
Contraste de Hipótesis:
H 0 : σ 2 ≥ 0.25
2
H1 : σ < 0.25
267
n = 15; s 2 = 0.21
H 0 : σ 2 ≥ 0.25
Contraste de Hipótesis:
2
H1 : σ < 0.25
2
α = 0.05; χ 0.95;14 = 6.57
Estadístico de contraste: χ2 =
( n − 1) S 2
→χ2n −1
σ 02
2 14 × 0.21
χ exp = = 11.76 ⇒ No rechazamos H 0
0.25
0.05
0.95
2 2
χ 0.95;14 χ exp
X1, X 2 ,..., X nX (
m.a.s. de X → N µ X ; σ X )
Y1, Y2 ,..., YnY (
m.a.s. de Y → N µ Y ; σ Y )
269
Varianzas conocidas
Estadístico de contraste
Z=
( X − Y ) − µ0
→ N ( 0; 1)
σ X2 σ Y2
+
nX nY
H 0 : µ X − µY = 0 z exp ≤ − z α 2
H1 : µ X − µY ≠ 0
z exp ≥ z α 2
H 0 : µ X − µY ≤ 0
H1 : µ X − µY > 0
z exp ≥ z α
H 0 : µ X − µY ≥ 0
H1 : µ X − µY < 0
z exp ≤ − z α
270
Varianzas desconocidas, pero iguales
Estadístico de contraste
T=
( X − Y ) − µ0 → t n X + nY − 2
1 1
Sp +
n X nY
H 0 : µ X − µY = 0 texp ≤ −tα 2; n X + nY −2
H1 : µ X − µY ≠ 0 texp ≥ tα 2; n X + nY −2
H 0 : µ X − µY ≤ 0 texp ≥ tα ; n X + nY −2
H1 : µ X − µY > 0
H 0 : µ X − µY ≥ 0 texp ≤ −tα ; n X + nY −2
H1 : µ X − µY < 0
( nX − 1) S X2 + ( n Y − 1) S Y2
S p2 =
nX + n Y − 2
271
Varianzas desconocidas, distintas o no,
con n x, n y ≥ 30
Estadístico de contraste
Z=
( X − Y ) − µ0
→ N ( 0; 1)
S X2 S Y2
+
nX nY
H 0 : µ X − µY = 0 z exp ≤ − z α 2
H1 : µ X − µY ≠ 0 z exp ≥ z α 2
H 0 : µ X − µY ≤ 0
z exp ≥ z α
H1 : µ X − µY > 0
H 0 : µ X − µY ≥ 0 z exp ≤ − z α
H1 : µ X − µY < 0
272
# Ejemplo:
En un estudio sobre la angina de pecho en ratas, se
dividió aleatoriamente a 18 animales afectados en dos
grupos de 9 individuos cada uno. A un grupo se le
suministró un placebo y al otro un fármaco
experimental FL113. Después de un ejercicio
controlado sobre una “cinta sin fin”, se determinó el
tiempo de recuperación de cada rata, obteniéndose los
siguientes resultados:
Placebo FL113
nX = 9 nY = 9
x = 329 seg. y = 283 seg.
S X = 45 seg. S Y = 43 seg.
Estadístico de contraste:
T=
( X −Y ) − µ0 → t n X + nY − 2
1 1
Sp +
n X nY
S p2 =
( nX ( )
− 1) S X2 + n Y − 1 S Y2 8 × 452 + 8 × 432
= = 1937
nX + n Y − 2 9+9−2
texp = 2.22
⇒ Rechazamos H 0
t0.05;16 = 1.746
0.95 0.05
t 0.05;16 texp
El fármaco experimental es eficaz en la reducción
del tiempo de recuperación en ratas con angina de pecho.
274
! Contrastes sobre la igualdad de
varianzas
Medias desconocidas
Estadístico de contraste
2
SX
F= → Fn X −1 ; nY −1
2
SY
Hipótesis del test Criterio de rechazo
H 0 : σ 2 = σ 02 Fexp ≤ F1−α 2; n X + nY −2
H1 : σ 2 ≠ σ 02 Fexp ≥ Fα 2; n X + nY −2
H 0 : σ 2 ≤ σ 02
Fexp ≥ Fα ; n X + nY −2
H1 : σ 2 > σ 02
H 0 : σ 2 ≥ σ 02 Fexp ≤ F1−α ; n X + nY −2
H1 : σ 2 < σ 02
275
# Ejemplo:
Se realiza un estudio de prácticas de prescripción. El
propósito es analizar la prescripción de digoxina, un
fármaco importante, potencialmente tóxico y
comúnmente utilizado. El nivel de dosificación para
los mayores de 64 años debe ser menor que el de
personas más jóvenes. Se extraen muestras
independientes de cada grupo y se obtiene el nivel de
dosificación para cada paciente seleccionado. Los
resultados son:
X → N (µ X , σ X )
Independientes
Y → N (µY ,σ Y )
276
Contraste de Hipótesis: H 0 : σ X2 = σ Y2
2 2
H1 : σ X ≠ σ Y
Estadístico de S X2
contraste:
F= → Fn X −1 ; nY −1
S Y2
n X = 41; s X = 0.102mg. / día
nY = 29; sY = 0.068mg . / día
0.102 2
Fexp = = 2.25
0.068 2
F 0.025; 40, 28 = 2.05 ⇒
1 1
F0.975; 40, 28 = = = 0.515
f 0.025; 28, 40 1.94
Rechazamos H 0
Las varianzas poblacionales
son diferentes
0.95
0.025
0.025
277
! 8.2.3. Contrastes para una proporción
Estadístico de contraste
pˆ − p0
Z= → N (0; 1)
p0 (1 − p0 )
n
H 0 : p = p0 z exp ≤ − z α 2
H1 : p ≠ p0 z exp ≥ z α 2
H 0 : p ≤ p0
z exp ≥ z α
H1 : p > p0
H 0 : p ≥ p0 z exp ≤ − z α
H1 : p < p0
278
# Ejemplo:
Entre los pacientes con cáncer de pulmón, el 90% o
más muere generalmente en el espacio de tres años.
Como resultado de nuevas formas de tratamiento, se
cree que esta tasa se ha reducido. En un reciente
estudio sobre 150 pacientes diagnosticados de cáncer
de pulmón, 128 murieron en el espacio de tres años.
¿Se puede afirmar que realmente ha disminuido la tasa
de mortalidad al nivel α = 0.1?
Estadístico de contraste:
pˆ − p0
Z= → N (0; 1)
p0 (1 − p0 )
n
Estimación muestral del parámetro:
Nº éxitos 128
pˆ = = = 0.853
Nº observaciones 150
279
H 0 : p ≥ 0.9
Contraste de Hipótesis:
H1 : p < 0.9
pˆ = 0.853
pˆ − p0 0.853 − 0.9
zexp = = = −1.905
p0 (1 − p0 ) 0.9(1 − 0.9)
n 150
⇒ Rechazamos H 0
0.1 0.9
− z exp − z 0.1
280
! 8.2.4. Contrastes para la comparación
de dos proporciones
Estadístico de contraste
( pˆ X − pˆY ) − ( pˆ X − pˆY )0
Z= → N(0;1)
pX (1− pX ) pY (1− pY )
+
nX nY
H 0 : p X − pY = ( p X − pY )0 z exp ≤ − z α 2
H1 : p X − pY ≠ ( p X − pY )0
z exp ≥ z α 2
H 0 : p X − pY ≤ ( p X − pY )0
H1 : p X − pY > ( p X − pY )0
z exp ≥ z α
H 0 : p X − pY ≥ ( p X − pY )0
z exp ≤ − z α
H1 : p X − pY < ( p X − pY )0
281
# Ejemplo:
Se quiere comprobar la teoría de que la vitamina C es
una ayuda en el tratamiento del cáncer. Se examinaron
dos grupos de 75 pacientes cada uno. Al primero de
ellos se le dio 10 gr. de vitamina C diariamente y se
observó que 47 pacientes presentaron mejoría. A los
pacientes del segundo grupo se les suministró un
placebo y 43 experimentaron mejoría. Contrastar las
hipótesis: H : p − p ≤ 0.04
0 X Y
H 1 : p X − pY > 0.04
Estadístico de contraste:
( pˆ X − pˆY ) − ( pˆ X − pˆY )0
Z= → N(0;1)
pX (1− pX ) pY (1− pY )
+
nX nY
Estimación muestral de los parámetros:
47
pˆ X = = 0.63
75
43
pˆ Y = = 0.57
75
282
H 0 : p X − pY ≤ 0.04
H 1 : p X − pY > 0.04
Z exp =
( 0.63 − 0.57 ) − 0.04 = 0.75
0.63 (1 − 0.63) 0.57 (1 − 0.57 )
+
75 75
z0.05 = 1.645
z exp ≥ zα ⇒ No rechazamos H 0
0.95 0.05
zexp z 0.05
283
! 8.3. Tests No Paramétricos
H 0 : X → F ( x)
H1 : X sigue otra distribución
284
! Planteamiento
285
Clases Marca Fr. Prob. Valores
de clase Absolutas Teóricas esperados
empíricas
1 x1 n1 p1 np1
2 x2 n2 p2 np2
... ... ... ... ...
i xi ni pi npi
... ... ... ... ...
k xk nk pk npk
n 1 n
286
! Solución del test
Hipótesis nula H 0 : X → F ( x )
Estadístico de contraste
( ni − n pi )
2
k
Y =∑ → χ2
n pi ( k −1)−r
i =1
Criterio de rechazo
Yexp ≥ χ 2
α ; ( k −1) − r
287
# Ejemplo:
Se mide el número de partículas que llegan a una
determinada zona procedentes de una
sustancia radioactiva en un corto espacio de
tiempo siempre igual, anotándose los
resultados en la siguiente tabla:
Nº de partículas 0 1 2 3 4 5 6
Nº de períodos
269 325 207 82 28 7 2
de tiempo
n
1 0 × 269 + 1 × 325 + .... + 6 × 2
λ! = x = ∑ n i x i = = 1.24
n i =1 269 + 325 + .... + 2
X → P ( λ = 1.24)
288
Cálculo de probabilidades
P( X = 0) = 0.2898 ; P ( X = 1) = 0.3586 ;
P( X = 2) = 0.2222 ; P( X = 3) = 0.919
P( X = 4) = 0.0285 ; P ( X = 5) = 0.007
P( X = 6) = 0.0014
H o : X → P(λ = 1.24 )
H1 : X sigue otra distribución
289
Nº de Fr. Ab. Prob Val. Esp.
Partíc ni np i np i
0 269 0.2898 266.616
1 325 0.3586 329.912
2 207 0.2222 204.424
3 82 0.0919 84.548
4 28 0.0285 26.22
5 7 0.0070 6.44
6 2 0.0014 1.288
n = 920 1
290
Estadístico de contraste:
( ni − npi )
2
k
Y =∑ → χ 2k −1 −r
np i ( )
i =1
Nº de Gr. de Libertad, (k-1) - r = (6-1) -1 = 4;
r = Nº de Parámetros estimados = 1
2
Criterio de rechazo: Yexp ≥ χ
α ; ( k −1) − r
χ 02.05;4 = 9.49
k (n − np )2 ⇒ No rechazamos H 0
Yexp = ∑ i i = 0.5335
i =1 npi
0.95
0.05
2
Yexp χ 0.05;3
291
! 8.3.2. Contrastes para la independencia de
dos caracteres
292
s
ni. = ∑ nij , i = 1, 2,..., r. Total de la i -ésima fila
j =1
r
n. j = ∑ nij , j = 1, 2,..., s. Total de la j -ésima columna
i =1
n i.n. j
Valores esperados: eij =
n
293
! Solución del test
Estadístico de contraste
( nij − eij )
2
r s
U =∑∑ → χ 2r −1 s −1
e ij ( )( )
i =1 j =1
Criterio de rechazo
294
# Ejemplo:
Un psicólogo realiza una investigación para determinar
si existe asociación aparente entre el peso de un
muchacho y un éxito precoz en la escuela. Se
selecciona una m.a.s. de 500. Se clasifica a cada uno
de acuerdo a dos criterios: el peso y el éxito en la
escuela, obteniéndose los siguientes resultados:
Sobrepeso
Éxito Sí No
Sí 162 263
No 38 37
295
Cálculo de los valores esperados, e ij
eij =
. .
ni n j
n
e11 =
. .
n1 n 1 425 × 200
=
n 500
Sobrepeso
Éxito Sí No Total
Sí 162 263 425
(170) (255)
No 38 37 75
(30) (45)
Total 200 300 500
296
Estadístico de contraste:
( nij − eij )
2
r s
U =∑∑ → χ 2r −1 s −1
e ij ( )( )
i =1 j =1
2 2
U exp =
(162 − 170 )
+
( 263 − 255 )
+
170 255
2 2
+
( 38 − 30 )
+
( 37 − 45 )
= 4.18
30 45
U exp = 4.18
(r − 1)(s − 1) = 1 ⇒ Rechazamos H o
2
χ 0.05;1 = 3.84
0.95
0.05
2
χ 0.05;1 Uexp
La obesidad y la precocidad en la escuela no son
independientes
297
! 8.3.3. Contrastes de homogeneidad
298
! Solución del test
Hipótesis nula
H 0: Las muestras son homogéneas
Estadístico de contraste
( nij − eij )
2
r p
U =∑∑ → χ 2r −1 p −1
e ij ( )( )
i =1 j =1
Criterio de rechazo
299
# Ejemplo:
Un grupo de personas ha sido expuesto a la
radiactividad de un vertedero con desechos atómicos.
Se realiza una investigación para descubrir si hay
alguna asociación entre la exposición y el desarrollo de
una enfermedad en la sangre. Se eligen 300 personas
expuestas al peligro y 320 no expuestas y se estudia a
cada sujeto para determinar si tiene o no la
enfermedad. ¿Qué se puede concluir a la vista de los
resultados?
Tiene la enfermedad
Radioactividad Sí No
Sí 52 248
No 48 272
Contraste de Hipótesis:
H 0 : Hay homogeneidad
H1 : No hay homogeneidad
300
Cálculo de los valores esperados, e ij
eij =
. .
ni n j
n
e12 =
. .
n 1 n 2 300 × 520
=
n 620
Tiene la enfermedad
Radioactividad Sí No Total
Sí 52 248 300
(48.39) (251.61)
No 48 272 320
(51.61) (268.39)
Total 100 520 620
301
Estadístico de contraste:
( nij − eij )
2
r p
U =∑∑ → χ 2r −1 p −1
e ij ( )( )
i =1 j =1
U exp = 0.62
(r − 1)( p − 1) = 1 ⇒ No rechazamos H o
2
χ 0.05;1 = 3.84
0.95
0.05
2
Uexp χ 0.05;1
302
!8.3.4. Contraste de aleatoriedad.
Test de rachas
EJEMPLOS:
Valores grandes de ni : R → N (µ r ; σ r )
Estadístico de contraste Criterio de Rechazo
r − µr
Z= → N (0; 1)
σr z exp ≤ − zα 2
2n1n2
µr = +1
n1 + n2 z exp ≥ zα 2
2n1n2 (2n1n2 − n1 − n2 )
σr =
(n1 + n2 )2 (n1 + n2 − 1)
304
Caso de variables cuantitativas
305
Ejemplo:
Se desea saber si en un proceso de fabricación de píldoras,
la obtención de éstas en mal estado se produce de manera
aleatoria. Para ello se anota el estado de 50 píldoras
obtenidas en la cadena de producción a una determinada
hora:
B: Buen estado D: Defectuosa
BDBDBBBDDBDBDDBDBBBBDBDBDBBDDDBDBD
BDBBDBBDBBBBDBDB
Test de Hipótesis:
H 0 : Hay aleatoriedad
H1 : No hay aleatoriedad
r − µr35 − 25.36
zexp = = = 2.827
σr 3.41
z0.025 = 1.96 ⇒ Rechazamos H 0
z0.975 = −1.96
Hay algún fallo en el
0.025 proceso de obtención
de las píldoras
306
Ejemplo:
Test de Hipótesis:
H 0 : Hay aleatoriedad
H1 : No hay aleatoriedad
Ordenamos los datos: 495 496 497 498 501 502 505 510 520
X (5 ) + X (6 ) 498 + 501
n = 10 ⇒ Me = = = 499.5
2 2
Paso 2: Determinación de la nueva secuencia:
- - + + - - - + + +
Parámetros: r = 4 rachas ; n1 = 5; n2 = 5
ni < 20 ⇒ Tabla [F] Para α = 0.01, RI=3, RS=9
RI r RS
307
! 8.3.5. Test de Kolmogorov -- Smirnov
Aplicaciones del test:
308
Desarrollo del test:
309
Cálculo del estadístico D:
1. Se ordena la muestra
2. Para cada i = 1, 2,..., n, se calcula:
{
D1 =máx F( x1), Fˆn ( x(1) ) −F ( x(1) ) }
{ }
Di =máx Fˆn (x(i−1) ) −F (x(i) ) , Fˆn (x(i) ) −F (x(i) ) ,
i =2,...,n
3. Dexp= máx{Di, i = 1,2,...,n}
310
Ejemplo:
311
! 8.3.6. Test de los rangos signados de Wilcoxon
312
Se llama Rango de Xi a la posición que ocupa | Di |
en la secuencia ordenada en orden creciente de los
valores absolutos de las diferencias Di.
Solución del test:
H1: Me ≠ m
n(n + 1)(2n + 1)
T → N n(n + 1),
24
313
Ejemplo:
Contrastar si 1, 1.1, -1.2, -0.8, 3 y 1.9 son valores de
una muestra X1, X2, ..., X6 extraída de una población
con distribución continua y mediana Me = 0.2, o si
proceden de una población con mayor mediana
H 0 : Me = 0.2
Test de hipótesis:
H1 : Me > 0.2
Cálculo de las diferencias Di:
314
! 8.3.7. Test de Mann – Whitney - Wilcoxon
Aplicaciones del test:
$ Contrasta la igualdad de las distribuciones de
dos v.a.
Dadas dos muestras de dos distribuciones
independientes de tipo continuo:
X 1 , X 2 ,..., X n x ; m.a.s. de X → F X
Y1 , Y2 ,..., Yn y ; m.a.s. de Y → FY
Se formulan los contrastes:
H 0 : FX = FY H 0 : FX = FY H 0 : FX = FY
H1 : FX ≠ FY H1 : FX < FY H1 : FX > FY
H1: FX ≠ FY
C = [R , rI ] ∪ [rS , R ]
R
(los resultados son los
mismos sea cual sea la H1: FX < FY
muestra escogida) C = [R, rI ], tomando α ' = 2α
H1: FX > FY
C = [rS , R ], tomando α ' = 2α
Valores grandes de n ( n ≥ 25)
Ri → N
( ) (
ni n x + n y + 1 n x n y n x + n y + 1
;
)
2 12
316
Ejemplo:
Indicar si, a nivel α=0.1, hay evidencia de diferencia
entre las distribuciones a partir de los siguientes
datos, procedentes de distribuciones independientes
A: 5 10 3 2
B: 13 6 14 8
H 0 : FX = FY
Test de hipótesis:
H1 : FX ≠ FY
Análisis de la varianza
Paramétrico No Paramétrico
De un factor
De más de un
factor
318
Ejemplos:
319
! Anova Paramétrico de un Factor
320
! Hipótesis del ANOVA paramétrico
321
! MODELO
x ij =µ i + eij
X i → N (µi ; σ ), ∀i = 1, 2,..., n
Siendo:
H 0 : µ1 = µ 2 = " = µ k
H1 : µi ≠ µ j , para algún i ≠ j
322
! Cálculos para el ANOVA:
T x
Notación:
k ni k ni k ni
(
∑ ∑ xij − x )2
= ∑ ∑ xij − xi ( )2
+ ∑ ∑ ( xi − x )2
i =1 j =1 i =1 j =1 i =1 j =1
VT = VNE + VE
VNE (n − k )VE → F
"
2
→ χ 2
n−k ⇒ (k − 1)VNE k −1,n − k
σ
VE 2
"
2
→ χ k −1
σ
324
Tabla ANOVA de una vía
Entre VE k-1 VE
grupos Se2 =
k −1
2
Dentro de S
VNE e
S R2 =
VNE n-k
grupos
n−k S d2
Total 2 VT
VT n-1 St =
n −1
Criterio de rechazo
Se2
2 → Fk −1,n −k
SR
Rechazamos si
Se 2
> Fα ;k −1,n −k
S R2
325
Ejemplo:
Una compañía farmacéutica investiga los efectos de 5
compuestos; el experimento consiste en inyectar los
compuestos a 12 ratas de características similares y anotar
los tiempos de reacción. Los animales se clasifican en 5
grupos, administrándole a cada uno de ellos un compuesto
diferente. Se obtuvieron los siguientes resultados:
H 0 : µ1 = µ 2 = µ3 = µ 4 = µ5
H1 : µ1 ≠ µ j , para algún i ≠ j
Cálculos:
Compuesto Tiempos ni Ti xi
1 8.3, 7.6, 8.4, 4 32.6 8.15
8.3
2 7.4, 7.1 2 14.5 7.25
3 8.1, 6.4 2 14.5 7.25
4 7.9, 8.5, 10.0 3 27.4 9.13
5 7.1 1 7.1 7.1
Total 12 96.1 8.01
k ni
" (
VNE = ∑ ∑ xij − xi 2 = 4.30 )
i =1 j =1
k
" VE = ∑ ni ( xi − x )2 = 7.01
i =1
327
Tabla ANOVA:
Fuentes Grados
Suma de
de de Varianzas Estadístico
Cuadrados
variación libertad
Entre
VE = 7.01 k-1=4 SE2 = 1.75
grupos
Dentro de
grupos
VNE =4.30 n-k=7 SR2 = 0.61 2.8
2
Se
En nuestro caso:
2 → F4,7
SR
A partir de las tablas se obtiene que
328
Comprobación de las
hipótesis previas al ANOVA
$ Test de Independencia
" Independencia
de las variables $ Análisis de los
residuos
$ Test de Bondad de
" Normalidad de las ajuste
distribuciones
$ Teorema Central del
Límite
329
Homogeneidad de la varianza. Test de Bartlett
1 k 2 k 2
B = ∑ (ni − k ) ln s − ∑ (ni − 1) ln si → χ k2−1
c i =1 i =1
k
∑ (ni − 1) ln si
2 k
1 1 1
s2 = i =1 ; c =1+ ∑ − k
3(k − 1) i =1 ni − 1
k
∑ (ni − k ) ∑ (ni − k )
i =1
i =1
Criterio de rechazo
Estadístico de contraste:
1 k 2 k 2
B = ∑ (ni − k ) ln s − ∑ (ni − 1) ln si → χ k2−1
c i =1 i =1
k
∑ (ni − 1) ln si
2
62
s 2 = i =1 k = ⇒ ln s 2 = 0.4307
23
∑ (ni − k )
i =1
1 k 1 1 = 1.0652
c = 1+ ∑ − k
3(k − 1) i =1 ni − 1
∑ (ni − k )
i =1
Bexp = 0.4168
2 ⇒ No rechazamos H 0
χ 0.01,2 = 9.21
332
ANOVA:
Cálculos:
Fert. Producción ni Ti xi
A 67565847 8 48 6
B 10 9 9 10 10 6 6 54 9
C 34837636 12 60 5
4736
Total 26 162 6.23
Tabla ANOVA:
f exp = 11.98
⇒ Rechazamos H 0
f 0.01;2,23 = 5.66
333
Análisis posteriores al ANOVA
Comparación Método de
de las medias Scheffé para
por parejas comparaciones
múltiples
Método de Scheffé para comparaciones múltiples:
H 0 : L = 0
Contraste de hipótesis:
H1 : L ≠ 0
siendo L una combinación lineal de las medias de los
tratamientos:
k
L = ∑ ci µi
i =1 k
y ci constantes verificando: ∑ ci = 0
i =1
k
! Estimador insesgado de L: Lˆ = ∑ ci xi
i =1
335
Ejemplo:
Se desea contrastar la eficacia de tres fertilizantes A,
B y C. El fertilizante A se aplica en 8 parcelas, el B
en 6 parcelas y el C en 12 parcelas. Las parcelas son
de características similares en cuanto a su fertilidad,
por lo que se considera que las diferencias en la
producción serán debidas al tipo de fertilizante. Las
toneladas producidas en cada parcela en una
temporada y para el mismo producto son:
336
a) ANÁLISIS DE LA VARIANZA
Hipótesis nula: La producción media es la misma
independientemente del fertilizante
Cálculos:
Fertilizante Producción ni Ti xi
A 6, 7, 5, 6, 5, 8, 8 48 6
4, 7
B 10, 9, 9, 10, 6 54 9
10, 6
C 3, 4, 8, 3, 7, 6, 12 60 5
3, 6, 4, 7, 6, 3
Total 26 162 6.23
H 0 : L1 = 0
Contraste 1:
H1 : L1 ≠ 0
Lˆ1 = x1 − x3 = 6 − 5 = 1
1 1
S L2 = 2.696 + = 0.5616
1 8 12
Intervalo de confianza:
[ ]
I1 = 1 − 0.5616 × 2 × F0.01; 2, 23 , 1 + 0.5616 × 2 × F0.01; 2, 23 =
= [− 1.521, 3.531] 0∈I1, por lo que podemos
considerar µ1= µ3
H 0 : L2 = 0
Contraste 2:
H1 : L2 ≠ 0
Lˆ2 = 2 x 2 − x1 − x3 = 18 − 6 − 5 = 7
4 1 1
S L2 = 2.696 + + = 2.359
2 6 8 12
Intervalo de confianza:
[
I1 = 7 − 2.359 × 2 × F0.01;2, 23 , 7 + 2.359 × 2 × F0.01;2, 23 = ]
= [1.832, 12.167 ]
0∉I2, por lo que podemos
considerar 2µ2 ≠ µ1+ µ3
338
! Anova No Paramétrico
Sean:
(X11, X12 ,..., X1n1 ),..., (X k1, X k 2 ,..., X knk )
k muestras independientes de tamaños n1, n2, ...,
nk, respectivamente, de distribuciones continuas
H 0 : Las k distribuciones son idénticas
H1 : Las distribuciones difieren en su tendencia central
12 k Ri2
H= ∑ − 3( N + 1) → χ 2
k −1
N ( N + 1) i =1 ni
Criterio de rechazo
2
H exp > χ α,k −1
341
Ejemplo:
12 17.5 2 18.52 55 2
= + + − 3(13 + 1) = 9.45
13(13 + 1) 5 3 5
343