Está en la página 1de 28

PRUEBAS DE

HOMOGENIDAD DE
VARIANZAS

Marco Antonio Rojas Paredes


PRUEBAS ESTADISTICAS PARA IGUALDAD DE VARIANZA

Aun cuando es frecuente el uso de las gráficas residuales


para diagnosticar la desigualdad de varianzas, se han
propuesto también varias pruebas estadísticas.
Estas pruebas pueden considerarse como pruebas
formales de las hipótesis

H0: s21 = s22 = ... = s2a

H1: s2i  s2j Para al menos un par (i, j)


PRUEBA DE BARLETT

➢ La prueba de Bartlett (Snedecor y Cochran, 1983) se


utiliza para probar si k muestras tienen varianzas
iguales.
➢ La igualdad de varianzas se llaman homogeneidad de
varianzas o Homocedasticidad.
➢ Algunas pruebas estadísticas, por ejemplo el análisis de
la varianza, asumen que las varianzas son iguales a
través de grupos o de muestras.
➢ La prueba de Bartlett se puede utilizar para verificar esa
asunción.
➢ La prueba de Bartlett es sensible frente a datos no
normales.
Objetivo Probar la homogeneidad de las varianzas entre
mas de 2 muestras
Requerimientos:
➢ Se puede utilizar con tamaño de muestra, ni ,
diferentes.
➢ Se recomienda ni > 3, preferentemente con ni > 5.
➢ Es muy sensible a alejamientos del supuesto de
normalidad.

Hipótesis:

➢ Ho: Las k muestras poseen igual varianza

➢ Ha: Al menos una de las k muestras no posee igual


varianza respecto al resto.
Estadístico de prueba

k : Número de muestras
ni : Tamaño de la i-ésima muestra
s²i : Varianza estimada para la i-ésima población
N = n1 + n2 + … + nk
Prueba de hipótesis

X2c < X2t (k-1, ἀ/2)

La hipótesis nula se acepta

Decisión estadística:
Cuando se acepta la hipótesis nula, se puede
afirmar que todas las poblaciones de donde se
obtuvieron las muestras, tienen la misma
varianza, con una confianza α
➢ Las diferencias ambientales afectan los niveles
de acidez-alcalinidad de las aguas de lluvia.
➢ El pH del agua de lluvia es una propiedad que
cambia.
Tratamientos (Tipos de suelo)
Repetición
marino volcanico desertico mesopotamico TOTAL
1 5.6 5.1 6.2 6.1 23
2 5.9 5.3 6 5.6 22.8
3 5.8 5.6 5.9 6.2 23.5
4 6.2 5.7 6.1 18
5 6.1 6.3 12.4
6 6.3 6 12.3

Hipótesis:
➢ Ho: Las k muestras poseen igual varianza
➢ Ha: Al menos una de las k muestras no posee igual
varianza respecto al resto.
SUPUESTOS del ANOVA

➢ Se han tomado una muestra aleatoria simple de


cada una de los “i” distribuciones.
➢ Las “i” distribuciones son normales.
➢ Las “i” distribuciones tienen todas idéntica varianza.
PRUEBA DE HOMOGENEIDAD DE VARIANZAS. PRUEBA DE BARTLETT
(MUESTRAS DE TAMAÑO DIFERENTE)
➢ Ejemplo del pH del agua de lluvia en las cuatro estaciones
meteorológicas se presenta algunos datos que facilitan los cálculos.
Tratamientos (Tipos de suelo)
Repetición
marino volcanico desertico mesopotamico TOTAL
1 5.6 5.1 6.2 6.1 23
2 5.9 5.3 6 5.6 22.8
3 5.8 5.6 5.9 6.2 23.5
4 6.2 5.7 6.1 18
5 6.1 6.3 12.4
6 6.3 6 12.3
ni 4 3 6 6 19
ni -1 3 2 5 5 15
si 0.250 0.252 0.216 0.243 0.961
s²i 0.063 0.0633 0.0467 0.0590 0.232
lg s²i -1.204 -1.198 -1.331 -1.229 -4.963
(n-1)lg s²i -3.612 -2.397 -6.655 -6.146 -18.810
(ni-1)s²i 0.188 0.127 0.233 0.295 0.843
Tratamientos (Tipos de suelo)
Repetición
marino volcanico desertico mesopotamico TOTAL
1 5.6 5.1 6.2 6.1 23
2 5.9 5.3 6 5.6 22.8
3 5.8 5.6 5.9 6.2 23.5
4 6.2 5.7 6.1 18
5 6.1 6.3 12.4
6 6.3 6 12.3
ni 4 3 6 6 19
ni -1 3 2 5 5 15
si 0.250 0.252 0.216 0.243 0.961
s²i 0.063 0.0633 0.0467 0.0590 0.232
lg s²i -1.204 -1.198 -1.331 -1.229 -4.963
(n-1)lg s²i -3.612 -2.397 -6.655 -6.146 -18.810
(ni-1)s²i 0.188 0.127 0.233 0.295 0.843
Decisión estadística: 0.541 < X2t (k-1, ἀ/2)).
Se acepta la hipótesis nula, las varianzas
son iguales

1
S2p = * 0. 843 = 0.0562
19−4 0.0541 < 9.488

19−4 −1 − −1 1
1 91 − 1
Estadístico Tabular: El valor teórico de la prueba de Bartlett es:

Decisión:
➢ La hipótesis nula (Ho) sería rechazada si T >Ttabla
➢ Caso contrario el conjunto de datos es
homocedástico al “1-α” % de confianza.
Prueba Kolmogórov-Smirnov para una muestra:

➢ Es una prueba de bondad de ajuste.


➢ Se emplea en una muestra independiente.
➢ El tipo de variable es cuantitativa continua (debe ser medida en
escala al menos ordinal)

Esta prueba responde a la pregunta: ¿Ajusta la distribución


empírica de datos muestrales de una variable ordinal o cuantitativa
a una distribución teórica conocida?
➢ Sirve para verificar o negar la hipótesis que un conjunto de
observaciones provienen de una distribución.
➢ La estadística D que se utiliza en esta prueba es una medida de
la diferencia máxima observada entre la distribución empírica
y la teórica supuesta.
➢ D es una variable aleatoria.
➢ Se utiliza esta prueba para verificar o negar que un conjunto
de números pseudoaleatorios tienen una distribución
uniforme en el intervalo cerrado [0,1].
➢ Esta prueba no requiere que los datos sean agrupados, lo que
permite que ésta haga uso de toda la información del conjunto de
datos.
➢ Puede utilizarse con muestras de cualquier tamaño (mientras que
la X² requiere que las muestras tengan un tamaño mínimo).

Hipótesis:
H0: F(x) = FT(x) para toda x desde - ∞ hasta + ∞
H1: F(x) ≠ FT(x) para al menos una x
Como es una prueba de bondad de ajuste aquí interesa no rechazar
la hipótesis nula, es decir, interesa que el valor de p sea mayor de
0,05 para no rechazar la hipótesis nula (queremos que p > 0,05).

Ejemplo:
➢ Se efectuaron mediciones del nivel de glucemia de 36 hombres
adultos en ayuno, no obesos y aparentemente sanos.
➢ Estas mediciones se muestran en la tabla que se presenta.
➢ Se pretende saber si es posible concluir que tales datos no
pertenecen a una población que sigue una distribución normal,
con una media de 80 y una desviación típica de 6. Emplee un α =
0,05.
Supuestos: La muestra disponible es una
muestra aleatoria simple que se extrajo de una
población que sigue una distribución continua.

Hipótesis:
H0: F(x) = FT(x) para toda x desde - ∞ hasta + ∞
H1: F(x) ≠ FT(x) para al menos una x
Estadístico de contraste:
Por tanto, el criterio para la toma de la decisión entre las dos
hipótesis será de la forma:

Donde el valor Dα se elige de tal manera que:

Siendo α el nivel de significación del contraste.


Procedimiento:
➢ Formular la hipótesis nula, H0. Teniendo en cuenta que los
números que se van a generar provienen de una distribución
uniforme.
➢ Se selecciona una muestra de tamaño n de números
pseudoaleatorios n.
➢ Se hallan los parámetros de acuerdo a la distribución que se
esté utilizando y demás datos que sirvan de base para la
realización de la prueba. Ej.: para el caso de una distribución
normal se deben hallar los parámetros respectivos (Media,
desviación estándar) y otros datos de utilidad.
➢ Se debe calcular la función de distribución acumulada
para después hallar las frecuencias respectivas.
➢ Antes de poder hallar el estadístico de prueba se debe
hallar la frecuencia observada y la frecuencia relativa de
cada uno de los intervalos establecidos de acuerdo al
rango.
➢ Se aplica la ecuación D = Frecuencia observada relativa-
Frecuencia esperada relativa para hallar la discrepancia
de las mismas o error estadístico.
➢ Posteriormente, se halla el estimador Smirnov-
Kolmogorov que es: Valor máximo entre todos los valores
hallados para cada intervalo. En Excel sería =Máx.
[Frecuencia observada relativa-Frecuencia esperada
relativa].
➢ Se hallan también los grados de libertad de acuerdo a la
distribución estadística utilizada. A su vez se establece un
nivel de significancia de acuerdo al planteamiento.
➢ Con base a lo anterior se consulta la tabla de límites de
aceptación para la prueba de Kolmogorov-Smirnov para
un tamaño de muestra n y un determinado nivel de riesgo
alfa, Si el estimador de la prueba es menor al valor
buscado en la tabla se acepta H0 o hipótesis nula, en caso
contrario se rechaza.
Para el cálculo práctico del estadístico D deben obtenerse:

Y a partir de estos valores:


A su vez, el valor de Dα depende del tipo de
distribución a probar y se encuentra tabulado.
En general es de la forma:

donde Cα y k(n) se
encuentran en las tablas
siguientes:
Ejemplo
Determinar si los valores de la primera columna se
conforman a una distribución normal:
https://www.youtube.com/watch?v=nGqhsxZrGlM

Como el valor D = 0.216 < 0.262,


no se rechaza H0 y se acepta
que los datos se distribuyen
normalmente.

También podría gustarte