Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística
comparativa
Principio
Hipótesis nula: p1 = p2 = p
Hipótesis alternativa: p1 ≠ p2
Se supondrá además que los tamaños de las muestras, n1 y n2, son grandes, de
modo que se podrá aplicar el teorema del límite central.
Comparación de
dos proporciones
p1 (1− p1 ) p2 (1− p2 )
F1 ~ p1 + N (0,1) F2 ~ p2 + N (0,1)
n1 n2
1 1
F1 − F2 ~ p (1− p) + N (0,1)
n1 n2
Comparación de
dos proporciones
Se rechaza H0 si, para el riesgo α asumido, |F1 – F2| supera un valor crítico
dado por la tabla de la distribución normal (test bilateral, con riesgo α/2 en
cada lado).
Sin embargo, estos tests son robustos,, por lo que se puede tolerar desviaciones
con respecto a estos supuestos, en particular, que la distribución de los datos no
sea exactamente Gaussiana.
Test de Student
para dos medias
Se busca testear la significancia de la diferencia X 1 − X 2 entre las medias
experimentales de dos muestras de tamaños n1 y n2 y desviaciones estándares S1 y
S2, respectivamente. Sean µ1 y µ2 las medias de las poblaciones asociadas a las
dos muestras. Se supone que estas poblaciones tienen la misma varianza σ2.
Hipótesis nula: µ1 = µ2 = µ
Hipótesis alternativa: µ1 ≠ µ2
Test de Student
para dos medias
Bajo la hipótesis nula (las dos muestras provienen de poblaciones con la misma
media µ y la misma varianza), T tiene una distribución de Student con n1 + n2 – 2
grados de libertad. Luego, con las tablas de esta distribución, se decide si el valor
observado de T es significativamente alto o bajo, con un determinado riesgo de
primera especie α.
Test de Student
para dos medias
Cuando las muestras tienen el mismo tamaño (n1 = n2 = n), las fórmulas
anteriores se simplifican:
X − X2 S12 + S 22
T= 1 con S=
2 2
S
n
Test de Student
para dos medias
Observación
Método 1 Método 2
Media 0.817 0.835
Desviación estándar 0.081 0.075
Número de datos 15 15
Test de Student
para dos medias
Hipótesis nula: µ1 = µ2 = µ
Hipótesis alternativa: µ1 ≠ µ2
Test de Student
para dos medias
Bajo la hipótesis nula (µ1 = µ2), la variable
X1 − X 2
T=
S12 S 22
+
n1 n2
Sean:
• n el tamaño de muestras (idéntico para ambas muestras)
• S la desviación estándar esperada
• δ la diferencia mínima que se quiere detectar
• zα el valor Gaussiano (unilateral o bilateral, según la hipótesis alternativa) para un
nivel de significancia 1 – α.
2
Entonces, se debe tomar n ≥ 2 α
Sz
δ
Selección de tamaño
de muestra
El haber considerado el valor Gaussiano (zα) para un nivel de significancia 1 – α
es una aproximación, debido a que no se conoce el número de grados de libertad
de la distribución de Student (precisamente porque no se conoce el tamaño de
muestra n).
2
S ( z α + zβ )
n ≥ 2
δ
donde
• zα es el valor para un nivel de significancia 1 – α (error tipo I)
• zβ es el valor para un nivel de significancia 1 – β (error tipo II).
Contrariamente a zα, el valor zβ siempre es unilateral.
Selección de tamaño
de muestra
Nuevamente, el haber considerado los valores Gaussianos (zα y zβ) constituye una
aproximación. Se puede refinar la solución encontrada utilizando un
procedimiento iterativo. Otra opción consiste en:
2
S ( z α + zβ )
1) calcular n con la fórmula anterior naprox = 2
δ
f +3
3) calcular el valor corregido de n como n = naprox
f +1
Selección de tamaño
de muestra
Con el tamaño de muestra n previamente determinado, si el valor de T supera
el valor crítico, entonces se rechaza la hipótesis nula con una probabilidad de
error (tipo I) igual a α. Al contrario, si el valor crítico de T no está excedido, se
acepta la hipótesis nula con una probabilidad β de equivocarse (error tipo II).
Como el tamaño de muestra suele ser grande para controlar ambos errores, es
común tomar un valor de β mayor que α, por ejemplo α = 0.05 y β = 0.20. En
la prueba de nuevos procedimientos, esta elección tiende a privilegiar el
status quo (mayor probabilidad β de aceptar la hipótesis nula cuando en
realidad existe una diferencia entre el nuevo procedimiento y el antiguo).
Test de Student
para una sola media
Se busca saber si la media µ de una población (de la cual se tiene una muestra de
tamaño n, media X y desviación estándar S) es distinta a un valor predeterminado
µ0
Hipótesis nula: µ = µ0
Hipótesis alternativa: µ ≠ µ0
Test de Student
para una sola media
Se plantea
X − µ0
T=
S/ n
Hipótesis nula: µ = µ0
Hipótesis alternativa: µ ≠ µ0
Test de Student
para una sola media
T 2 = n ( X − µ 0 )t V −1 ( X − µ 0 )
Bajo la hipótesis nula (µµ = µ0), pn( n−−p1) T 2 tiene una distribución de Fisher de p y
n – p grados de libertad. Se rechaza la hipótesis nula si el valor observado
supera el valor crítico para el nivel de significancia deseado (test unilateral
solamente).
Test de Student
para muestras pareadas
Ejemplos
De este modo, se transforma dos series de valores que constituyen dos muestras
distintas en una sola serie de valores correspondiente a una muestra.
Se plantea
D
T=
S/ n
Bajo la hipótesis nula (D tiene una esperanza nula), T tiene una distribución de
Student con n – 1 grados de libertad. Se rechaza la hipótesis nula si el valor
observado de T supera el valor crítico para el nivel de significancia deseado
(test unilateral o bilateral, según la hipótesis alternativa).
Test de Student
para muestras pareadas
Al contrario, si las diferencias entre pares son pequeñas, el test puede ser
menos potente que la comparación de las dos muestras. También es
peligroso utilizar este test cuando no existe un acoplamiento natural de las
dos muestras, y que el usuario define los pares arbitrariamente.
Selección de tamaño
de muestra
Se tiene los mismos resultados que con el test de Student de dos medias, salvo
que se omite el factor 2 en la fórmula que proporciona el tamaño de muestra.
2
S z
Para controlar el error de tipo I, se debe tomar n ≥ α
δ
2
S ( zα + zβ )
Para controlar los errores de tipo I y II, se debe tomar n ≥
δ
Test de Fisher
para dos varianzas
Se busca comparar las varianzas experimentales S12 y S22 de dos muestras
Gaussianas independientes de tamaños n1 y n2. Sean σ12 y σ22 la varianzas de las
poblaciones asociadas a estas dos muestras.
Bajo la hipótesis nula (las dos muestras provienen de poblaciones con la misma
varianza), F tiene una distribución de Fisher con n1 – 1 y n2 – 1 grados de
libertad. Luego se comparará el valor de F con el valor crítico para el nivel de
significancia 1 – α (test bilateral o unilateral dependiendo de la hipótesis
alternativa).
Test de Fisher
para dos varianzas
En la práctica, se puede ordenar las muestras de manera que S12 ≥ S22
S12
F = 2 ≥1
S2
desviación
tamaño media
estándar
S12 = 2.68 × 10 −3 S 22
−3
2
F = 2 = 1.98
S 2 = 5.31× 10 S1
3.05 para α = 5%
Ahora, las tablas estadísticas indican: F (12,14) =
4.43 para α = 1%
Por consiguiente, se puede aceptar la hipótesis que las varianzas son iguales.
Ejemplo: comparación
de dos muestras
Segunda etapa: igualdad de las medias
12.18 − 12.04
T= 2 2
= 5.92
14 × 0.0518 + 12 × 0.0729 1 1
+
15 + 13 − 2 15 13
2.056 para α = 5%
Las tablas estadísticas indican: | T26 | =
2.779 para α = 1%
Se rechaza la hipótesis que las medias son iguales, luego de que las dos muestras
provienen de la misma población.
Lecturas recomendadas
Davis, J.C., 2002. Statistics and Data Analysis in Geology. John Wiley & Sons,
Inc., New York.
Montgomery, D.C., Runger, G.C., 1999. Applied Statistics and Probability for
Engineers. John Wiley and Sons, New York.
Snedecor, G.W., Cochran, W.G., 1968. Statistical Methods. Iowa State University
Press, 6th edition.
Ejercicios