Está en la página 1de 39

Lección 5:

Estadística
comparativa
Principio

Supongamos que dos muestras han sido realizadas en forma independiente.


Para una variable aleatoria que nos interesa, la cual se denota como X1 para
la primera muestra y como X2 para la segunda muestra, se ha observado los
valores {X1,1,... X1,n1} e {X2,1,... X2,n2}. Las hipótesis que se consideran son:

Hipótesis nula: X1 y X2 tienen la misma distribución

Hipótesis alternativa: X1 y X2 tienen distribuciones distintas

Esto permitirá decidir si las dos muestras provienen o no de la misma


población.
Comparación de
dos proporciones
Interesa la proporción de individuos que cumplen cierta característica. Sean F1 y
F2 las frecuencias empíricas observadas en las dos muestras y p1 y p2 las
proporciones reales (probabilidades de ocurrencia) de la característica en las
poblaciones correspondientes.

La hipótesis nula y la hipótesis alternativa son:

Hipótesis nula: p1 = p2 = p

Hipótesis alternativa: p1 ≠ p2

Se supondrá además que los tamaños de las muestras, n1 y n2, son grandes, de
modo que se podrá aplicar el teorema del límite central.
Comparación de
dos proporciones

Se considera que las frecuencias observadas tienen distribuciones Gaussianas:

p1 (1− p1 ) p2 (1− p2 )
F1 ~ p1 + N (0,1) F2 ~ p2 + N (0,1)
n1 n2

Bajo la hipótesis H0, se tiene entonces:

1 1
F1 − F2 ~ p (1− p) + N (0,1)
n1 n2
Comparación de
dos proporciones

Se rechaza H0 si, para el riesgo α asumido, |F1 – F2| supera un valor crítico
dado por la tabla de la distribución normal (test bilateral, con riesgo α/2 en
cada lado).

Si la hipótesis alternativa fuera p1 > p2, entonces el rechazo de H0 se daría


si F1 – F2 superara un valor crítico positivo dado por las tablas de la
distribución normal (test unilateral con riesgo α en el lado positivo).

Igualmente, si la hipótesis alternativa fuera p1 < p2, entonces el rechazo de


H0 se daría si F1 – F2 fuera menor que un valor crítico negativo (test
unilateral con riesgo α en el lado negativo).
Comparación de medias:
tests de Student
Los tests de Student permiten comparar las medias de poblaciones de datos con
distribución Gaussiana (normal) de media y varianza constantes para todos los
individuos.

Sin embargo, estos tests son robustos,, por lo que se puede tolerar desviaciones
con respecto a estos supuestos, en particular, que la distribución de los datos no
sea exactamente Gaussiana.
Test de Student
para dos medias
Se busca testear la significancia de la diferencia X 1 − X 2 entre las medias
experimentales de dos muestras de tamaños n1 y n2 y desviaciones estándares S1 y
S2, respectivamente. Sean µ1 y µ2 las medias de las poblaciones asociadas a las
dos muestras. Se supone que estas poblaciones tienen la misma varianza σ2.

La hipótesis nula y la hipótesis alternativa son:

Hipótesis nula: µ1 = µ2 = µ

Hipótesis alternativa: µ1 ≠ µ2
Test de Student
para dos medias

X1 − X 2 (n1 − 1) S12 + (n2 − 1) S 22


Se define T= con S =
1 1 n1 + n2 − 2
S +
n1 n2

Bajo la hipótesis nula (las dos muestras provienen de poblaciones con la misma
media µ y la misma varianza), T tiene una distribución de Student con n1 + n2 – 2
grados de libertad. Luego, con las tablas de esta distribución, se decide si el valor
observado de T es significativamente alto o bajo, con un determinado riesgo de
primera especie α.
Test de Student
para dos medias
Cuando las muestras tienen el mismo tamaño (n1 = n2 = n), las fórmulas
anteriores se simplifican:

X − X2 S12 + S 22
T= 1 con S=
2 2
S
n
Test de Student
para dos medias
Observación

Según la hipótesis alternativa elegida, se usará un test unilateral o bilateral.

• Hipótesis alternativa (H1): µ1 ≠ µ 2


Se usará un test bilateral (el valor de T puede ser significativo, cualquiera sea
su signo)

• Hipótesis alternativa (H1): µ1 > µ 2


Se usará un test unilateral (sólo valores positivos de T pueden ser significativos).
Test de Student
para dos medias
Test bilateral
Test de Student
para dos medias
Ejercicio

Se considera un nuevo procedimiento para los ensayos de ley de cobre. Se desea


saber si este procedimiento da el mismo resultado que el antiguo. Para ello, se
selecciona 15 sub-muestras que se ensayan por ambos procedimientos.

Método 1 Método 2
Media 0.817 0.835
Desviación estándar 0.081 0.075
Número de datos 15 15
Test de Student
para dos medias

El test anterior se puede adaptar al caso de poblaciones con varianzas distintas.

La hipótesis nula y la hipótesis alternativa son:

Hipótesis nula: µ1 = µ2 = µ

Hipótesis alternativa: µ1 ≠ µ2
Test de Student
para dos medias
Bajo la hipótesis nula (µ1 = µ2), la variable

X1 − X 2
T=
S12 S 22
+
n1 n2

tiene una distribución aproximadamente de Student, con un número de grados


de libertad igual a
2
 S12 S 22 
 + 
ν = 2  12
n n2 
( S1 / n1 ) ( S 22 / n2 ) 2
+
n1 − 1 n2 − 1
Selección de tamaño
de muestra
Al planificar un experimento comparativo, es importante decidir el tamaño de las
muestras que se usarán en el test.

Sean:
• n el tamaño de muestras (idéntico para ambas muestras)
• S la desviación estándar esperada
• δ la diferencia mínima que se quiere detectar
• zα el valor Gaussiano (unilateral o bilateral, según la hipótesis alternativa) para un
nivel de significancia 1 – α.

2
Entonces, se debe tomar n ≥ 2 α 
Sz
 δ 
Selección de tamaño
de muestra
El haber considerado el valor Gaussiano (zα) para un nivel de significancia 1 – α
es una aproximación, debido a que no se conoce el número de grados de libertad
de la distribución de Student (precisamente porque no se conoce el tamaño de
muestra n).

Para refinar la solución, una vez calculado el valor de n, se puede reemplazar zα


por el valor de Student con 2n – 2 grados de libertad para el mismo nivel 1 – α,
luego recalcular el valor de n. Se puede iterar este procedimiento hasta que no
haya más cambios en el valor encontrado para n. Sin embargo, en la práctica,
utilizar el valor Gaussiano en lugar del valor de Student no tiene mucho impacto
cuando n es mayor que 10.
Selección de tamaño
de muestra
Ejercicio: retomemos el ejercicio anterior (ensayos de ley de cobre) y
suponemos que 0.02% Cu sería una diferencia inaceptable entre ambos
procedimientos. ¿Cuántos ensayos deberíamos hacer con cada procedimiento
para asegurarnos de detectar tal diferencia con 95% de confianza?
Selección de tamaño
de muestra
Lo anterior permite determinar el tamaño de muestra para controlar el error de
primera especie (tipo I). Si se desea controlar los errores de primera (tipo I) y
segunda especie (tipo II), se debe tomar el siguiente valor de n:

2
 S ( z α + zβ ) 
n ≥ 2 
 δ 

donde
• zα es el valor para un nivel de significancia 1 – α (error tipo I)
• zβ es el valor para un nivel de significancia 1 – β (error tipo II).
Contrariamente a zα, el valor zβ siempre es unilateral.
Selección de tamaño
de muestra
Nuevamente, el haber considerado los valores Gaussianos (zα y zβ) constituye una
aproximación. Se puede refinar la solución encontrada utilizando un
procedimiento iterativo. Otra opción consiste en:

2
 S ( z α + zβ ) 
1) calcular n con la fórmula anterior naprox = 2 
 δ 

2) determinar el número de grados de libertad f = 2(naprox – 1)

f +3
3) calcular el valor corregido de n como n = naprox
f +1
Selección de tamaño
de muestra
Con el tamaño de muestra n previamente determinado, si el valor de T supera
el valor crítico, entonces se rechaza la hipótesis nula con una probabilidad de
error (tipo I) igual a α. Al contrario, si el valor crítico de T no está excedido, se
acepta la hipótesis nula con una probabilidad β de equivocarse (error tipo II).

Como el tamaño de muestra suele ser grande para controlar ambos errores, es
común tomar un valor de β mayor que α, por ejemplo α = 0.05 y β = 0.20. En
la prueba de nuevos procedimientos, esta elección tiende a privilegiar el
status quo (mayor probabilidad β de aceptar la hipótesis nula cuando en
realidad existe una diferencia entre el nuevo procedimiento y el antiguo).
Test de Student
para una sola media
Se busca saber si la media µ de una población (de la cual se tiene una muestra de
tamaño n, media X y desviación estándar S) es distinta a un valor predeterminado
µ0

La hipótesis nula y la hipótesis alternativa son:

Hipótesis nula: µ = µ0

Hipótesis alternativa: µ ≠ µ0
Test de Student
para una sola media

Se plantea

X − µ0
T=
S/ n

Bajo la hipótesis nula (µ = µ0), T tiene una distribución de Student con n – 1


grados de libertad. Se rechaza la hipótesis nula si el valor observado de T
supera el valor crítico para el nivel de significancia deseado (test unilateral o
bilateral, según la hipótesis alternativa).
Test de Student
para una sola media
Versión multivariable (test de Hotelling). Se tiene una muestra de tamaño n de
un vector aleatorio X con p componentes. Se quiere saber si el vector de media µ
es distinto a un vector predeterminado µ0. Sea X el vector (p×1) de las medias
experimentales y V la matriz (p×p) de varianza-covarianza experimental.

La hipótesis nula y la hipótesis alternativa son:

Hipótesis nula: µ = µ0

Hipótesis alternativa: µ ≠ µ0
Test de Student
para una sola media

Se define la variable T cuadrado de Hotelling como:

T 2 = n ( X − µ 0 )t V −1 ( X − µ 0 )

Bajo la hipótesis nula (µµ = µ0), pn( n−−p1) T 2 tiene una distribución de Fisher de p y
n – p grados de libertad. Se rechaza la hipótesis nula si el valor observado
supera el valor crítico para el nivel de significancia deseado (test unilateral
solamente).
Test de Student
para muestras pareadas

Se busca comparar dos métodos, dos tratamientos o dos aparatos, que se


aplican a cantidades que no son constantes. En este caso, es apropiado
testear la significancia de la diferencia promedio entre pares de valores.

Ejemplos

• kilometraje recorrido por distintos


vehículos, siendo cada vehículo
probado con dos tipos de combustible.

• las leyes de cobre de un conjunto de muestras duplicadas,


informadas por dos laboratorios distintos
Test de Student
para muestras pareadas
Se define la variable de diferencia D = X1 – X2.

De este modo, se transforma dos series de valores que constituyen dos muestras
distintas en una sola serie de valores correspondiente a una muestra.

La hipótesis nula y la hipótesis alternativa son:

Hipótesis nula: D tiene esperanza nula

Hipótesis alternativa: D no tiene esperanza nula


Test de Student
para muestras pareadas

Se plantea

D
T=
S/ n

donde S es la desviación estándar experimental de D.

Bajo la hipótesis nula (D tiene una esperanza nula), T tiene una distribución de
Student con n – 1 grados de libertad. Se rechaza la hipótesis nula si el valor
observado de T supera el valor crítico para el nivel de significancia deseado
(test unilateral o bilateral, según la hipótesis alternativa).
Test de Student
para muestras pareadas

Se podría haber utilizado el test de comparación de dos muestras


independientes, pero en este caso no se hubiese tomado en cuenta toda la
información disponible. El test de muestras pareadas conduce a mejores
resultados que la simple comparación de dos muestras, cuando las
diferencias entre pares de datos son importantes y cuando las dos series de
valores están correlacionadas.

Al contrario, si las diferencias entre pares son pequeñas, el test puede ser
menos potente que la comparación de las dos muestras. También es
peligroso utilizar este test cuando no existe un acoplamiento natural de las
dos muestras, y que el usuario define los pares arbitrariamente.
Selección de tamaño
de muestra

Se tiene los mismos resultados que con el test de Student de dos medias, salvo
que se omite el factor 2 en la fórmula que proporciona el tamaño de muestra.

2
S z 
Para controlar el error de tipo I, se debe tomar n ≥  α 
 δ 

2
 S ( zα + zβ ) 
Para controlar los errores de tipo I y II, se debe tomar n ≥  
 δ 
Test de Fisher
para dos varianzas
Se busca comparar las varianzas experimentales S12 y S22 de dos muestras
Gaussianas independientes de tamaños n1 y n2. Sean σ12 y σ22 la varianzas de las
poblaciones asociadas a estas dos muestras.

La hipótesis nula y la hipótesis alternativa son:

Hipótesis nula: σ12 = σ22 = σ2

Hipótesis alternativa: σ12 ≠ σ22


Test de Fisher
para dos varianzas
Se define
S12
F= 2
S2

Bajo la hipótesis nula (las dos muestras provienen de poblaciones con la misma
varianza), F tiene una distribución de Fisher con n1 – 1 y n2 – 1 grados de
libertad. Luego se comparará el valor de F con el valor crítico para el nivel de
significancia 1 – α (test bilateral o unilateral dependiendo de la hipótesis
alternativa).
Test de Fisher
para dos varianzas
En la práctica, se puede ordenar las muestras de manera que S12 ≥ S22

S12
F = 2 ≥1
S2

De este modo, sólo se requiere comparar el valor de F con el valor crítico


proporcionado por las tablas. El nivel de significancia (1 – α o 1 – α/2) se elige
según si el test es unilateral o bilateral, el cual se determina según la hipótesis
alternativa.
Ejemplo: comparación
de dos muestras

Supongamos que tenemos dos muestras Gaussianas con las siguientes


características:

desviación
tamaño media
estándar

muestra 1 15 12.04 0.0518

muestra 2 13 12.18 0.0729


Ejemplo: comparación
de dos muestras

Primera etapa: igualdad de las varianzas

S12 = 2.68 × 10 −3  S 22
−3 
2
F = 2 = 1.98
S 2 = 5.31× 10  S1

3.05 para α = 5%
Ahora, las tablas estadísticas indican: F (12,14) =
4.43 para α = 1%

Por consiguiente, se puede aceptar la hipótesis que las varianzas son iguales.
Ejemplo: comparación
de dos muestras
Segunda etapa: igualdad de las medias

12.18 − 12.04
T= 2 2
= 5.92
14 × 0.0518 + 12 × 0.0729 1 1
+
15 + 13 − 2 15 13

2.056 para α = 5%
Las tablas estadísticas indican: | T26 | =
2.779 para α = 1%

Se rechaza la hipótesis que las medias son iguales, luego de que las dos muestras
provienen de la misma población.
Lecturas recomendadas

Davis, J.C., 2002. Statistics and Data Analysis in Geology. John Wiley & Sons,
Inc., New York.

Green, J.R., Margerison, D., 1978. Statistical Treatment of Experimental Data.


Elsevier Scientific Publishing Company, Amsterdam, 382 p.

Johnson, R.A, Bhattacharyya, G.K., 1996. Statistics: Principles and Methods.


Wiley, New York

Montgomery, D.C., Runger, G.C., 1999. Applied Statistics and Probability for
Engineers. John Wiley and Sons, New York.

Snedecor, G.W., Cochran, W.G., 1968. Statistical Methods. Iowa State University
Press, 6th edition.
Ejercicios

1) Se dispone de datos de sondajes de diamantina y de pozos de tronadura, con


mediciones de la ley de cobre total (en %). Se les pide diseñar un test para
decidir si ambos tipos de mediciones tienen la misma calidad.

2) A partir de un centenar de datos duplicados, enviados a dos laboratorios


distintos, se desea saber si existe un sesgo (error sistemático) entre estos
laboratorios.
Ejercicios

3) Se desea determinar si el pre-acondicionamiento en un sector de una mina


de block caving tiene influencia significativa en el tamaño de la roca
extraída en un punto de extracción. Se hizo un experimento en dos sectores
de similares características geológicas, uno con pre-acondicionamiento
(puntos A, B, C) y otro sin pre-acondicionamiento (puntos D, E, F), en
donde se midió el diámetro mediano (d50) en distintas etapas de extracción.
¿Cuántas mediciones serían necesarias para determinar si el pre-
acondicionamiento reduce el d50 de al menos 1 cm?
Ejercicios

4) En su calidad de metalurgista en jefe, Ud. recibe la propuesta de un


vendedor que pretende incrementar la recuperación de los minerales
sulfurados de cobre en el circuito de flotación de su planta, desde 89% a
95%, gracias a un nuevo reactivo. La propuesta le parece lo suficientemente
interesante para merecer una evaluación. El metalurgista de planta realiza
un ensayo con el nuevo reactivo por 6 días consecutivos y compara los
resultados con aquellos de los 20 días previos al ensayo (ver archivo
adjunto). Se les pide testear si la recuperación media con el nuevo reactivo
es de 95%, si la varianza de las recuperaciones es idéntica con los dos
reactivos, y si la recuperación media es idéntica con los dos reactivos.

Como la calidad del mineral enviado a planta puede haber cambiado


durante el ensayo anterior, Ud. decide realizar un ensayo de dos semanas, en
las cuales ambos reactivos son usados en circuitos de flotación paralelos
con el mismo mineral. Se les pide realizar nuevamente los tests anteriores.

También podría gustarte