Está en la página 1de 18

PREUEBAS DE BONDAD DE AJUSTE

Las pruebas de bondad de ajuste consisten en comprobar gráfica y


estadísticamente, si la frecuencia empírica de la serie analizada se ajusta
a una determinada función de probabilidades teórica seleccionada a
priori, con los parámetros estimados en base a los valores muestrales.

Las pruebas estadísticas, tienen por objeto medir la Incertidumbre que se


obtiene al haber una hipótesis estadística sobra una población, es decir
calificar el hecho de suponer que una variable aleatoria se distribuya según
una cierta función de probabilidades.

Las pruebas de bondad de ajuste mas utilizadas son:

AJUSTE GRÁFICO.
CHI CUADRADO.
AJUSTE ESTADISTICO
SMIRNOV - KOLMOGOROV
AJUSTE GRAFICO

El ajuste gráfico se puede realizar de las siguientes formas:

Comparar gráficamente el
histograma o función densidad
empírica de la serie de datos con la
función densidad teórica y decidir
visualmente si hay o no ajuste de
acuerdo a la similitud o diferencia de
ambos, respectivamente.
AJUSTE GRAFICO

• Comparar gráficamente la función


acumulada de la serie de datos,
con la función acumulada
teórica seleccionada, dibujada
en papel milimétrico, y decidir
visualmente si hay o no ajuste.
AJUSTE GRAFICO

Se puede comparar también


gráficamente la función

valor de la
acumulada de la serie de datos,

variable
con la función acumulada teórica,
ploteada en un papel
probabilístico adecuado.

Probabilidad
PRUEBA CHI-CUADRADO (χ²).-

La prueba Chi-Cuadrado es la más


comúnmente usada para verificar la bondad 𝑘
de ajuste de la distribución empírica a una ( Ө𝑖 − 𝑒𝑖 )
𝑋𝑐2 = ෍
distribución teórica conocida. 𝑒𝑖
𝑖=1

Donde:
k k
Σ θi = Σ ℮i =
i=1 i=1

χ²c = Valor calculado de Chi-Cuadrado, a partir de los datos .


θi = Número de valores observados en el intervalo de clase i.
℮i = Número de valores esperados en el intervalo de clase i.
k = Número de intervalos de clase.
PRUEBA CHI-CUADRADO (χ²)

El valor de χ²c obtenido, se compara con el χ²t de tablas, 𝑘


cuyo valor se determina con: ( Ө𝑖 − 𝑒𝑖 )
𝑋𝑐2 = ෍
𝑒𝑖
Nivel de significación: α = 0.05 ó α = 0.01 𝑖=1

Grados de libertad: gl = k – 1 – h

h = Número de parámetros a estimarse, así:


h = 2, para distribución normal
h = 3, para distribución Lognormal de 3 parámetros.

El criterio de decisión se fundamenta en la comparación del valor calculado de


Chi-Cuadrado con el valor encontrado, esto es:
PRUEBA CHI-CUADRADO (χ²)

El criterio de decisión se fundamenta en la comparación del valor 𝑘


( Ө𝑖 − 𝑒𝑖 )
calculado de Chi-Cuadrado con el valor encontrado, esto es: 𝑋𝑐2 = ෍
𝑒𝑖
𝑖=1
Si el Chi-Cuadrado calculado es menor o igual que el valor tabular,
es decir:
Χ²c ≤ χ²t

Entonces se acepta la hipótesis que el ajuste es bueno al nivel de


Significación seleccionado.

Si el Chi-Cuadrado calculado es mayor que el valor tabular, es


decir:
Χ²c ≥ χ²t
Entonces el ajuste es malo y se rechaza la hipótesis, siendo
necesario probar con otra distribución teórica.
PRUEBA CHI-CUADRADO (χ²)

VENTAJAS Y LIMITACIONES.-

1.- Es aplicable solo para ajustes a la distribución normal, 𝑘


puesto que ha sido desarrollado en base a datos ( Ө𝑖 − 𝑒𝑖 )
𝑋𝑐2 = ෍
normales e independientes. 𝑒𝑖
𝑖=1
2.- Es realizada en la función de densidad de datos
agrupados en intervalos de clase.

3.- Requiere un conocimiento a priori de la función de


distribución teórica utilizada en el ajuste.

4.- En la práctica se usa para cualquier modelo de ajuste,


pero estrictamente es válido solo para la Normal.

5.- Es de fácil aplicación.

6.- Al utilizar esta prueba, se debe tener cuidado que en cada


intervalo de clase, se tenga por lo menos 5 observaciones
Ejemplo.- Dada la serie histórica de caudales medios anuales en m3/seg
que corresponde a un registro de 21 años realizar las prueba de bondad
de ajuste chi-cuadrado para ver si se ajusta a una distribución normal.

121.3 26.7 110.1 63.4 122.4 64.2 59.6


144.9 92.8 95.6 76.3 162.1 110.2 40.3
142.9 58.3 48.8 52.3 97.2 144.7 112.2

1.- LA HIPOTESIS SERA:

Ho = frecuencia observada = frecuencia esperada


Ha = frecuencia observada ≠ frecuencia esperada
2.- ORDENAR LOS DATOS DE MENOR A MAYOR

1 121.3 26.7
2 26.7 40.3
3 110.1 48.8
4 63.4 52.3
5 122.4 58.3
6 64.2 59.6
7 59.6 63.4
8 144.9 64.2
9 92.8 76.3
10 95.6 92.8
11 76.3 95.6
12 162.1 97.2
13 110.2 110.1
14 40.3 110.2
15 142.9 112.2
16 58.3 121.3
17 48.8 122.4
18 52.3 142.9
19 97.2 144.7
20 144.7 144.9
21 112.2 162.1
3.- CALCULO DE LA FRECUENCIA PARA DATOS AGRUPADOS.-

3.1 Cálculo del número de intervalos de clase, según Yevjevich

NC = 1 + 1.33 LN (N)

NC = 1 + 1.33 LN (21)

NC = 5

3.2 CALCULO DE LA AMPLITUD DE CADA INTERVALO

𝑖 162.1 - 26.7
∆X = 1
=
4

∆X = 33.85 34

∆X/2 17
3.3 CALCULO DE LOS INTERVALOS DE CLASE, MARCAS DE CLASE,
FRECUENCIA ABSOLUTA OBSERVADA, FRECUENCIA RELATIVA

frecuencia absoluta Θ frecuencia


intervalos de clase (1) marcas de clase (2) (3) frecuencia relativa (4) acumulada (5)

9.7 - 43.7 26.7 2 0.0952 0.0952

43.7 -77.7 60.7 7 0.3333 0.4285

77.7 - 111.7 94.7 5 0.2381 0.6666

111.7 - 145.7 128.6 6 0.2857 0.9523

145.7 - 179.7 162.7 1 0.0476 1.0000

21
3.4 CALCULO DE LA MEDIA Y DESVIACION ESTANDAR PARA DATOS
AGRUPADOS .- (UTILIZANDO COLUMNAS (2) Y (4)

= ෍ 89.91
=

Xi * fi
26.7 0.0952 2.54
60.7 0.3333 20.23
94.7 0.2381 22.55
128.6 0.2857 36.74
162.7 0.0476 7.75
89.81

= ෍( − )2 36.75
𝑖 =1

(xi-xm)² fi
26.7 89.91 3995.50 0.0952 380.52
60.7 89.91 853.22 0.3333 284.41
94.7 89.91 22.94 0.2381 5.46
128.6 89.91 1496.92 0.2857 427.69
162.7 89.91 5298.38 0.0476 252.30
1350.39
36.75
4.- CALCULO DE LA FRECUENCIA ESPERADA, UTILIZANDO LA DISTRIBUCION TEORICA NORMAL.

frecuencia
intervalo de limite de clase probabilidad probablidad frecuencia observada Θi
clase (1) (2) z = (xi-xm)/S lim. Sup F(s) (4) lim. Inf. F(I) (5) abs., ei (6) (7)
9.7 -2.18
9.7 - 43.7 43.7 -1.26 0.1038 0.0146 2.00 2
43.7 -77.7 77.7 -0.33 0.6293 0.1038 11.00 7
77.7 - 111.7 111.7 0.59 0.7224 0.6293 2.00 5
111.7 - 145.7 145.7 1.52 0.9357 0.7224 5.00 6
145.7 - 179.7 179.7 2.44 0.9927 0.9357 1.00 1

(6) = ( 4 - 5 )*21

5.- CALCULO DEL CHI CUADRADO CALCULADO.-

(2 2) ( 11) ( 2) ( ) (1 1)
𝑋2 = + + + + = 4.29
2 1
6.- CALCULO DEL CHI CUADRADO TEORICO.-

grados de libertad: v = k - 1 – h = (5 – 1 – 2) = 2

k= numero de intervalos 5
h = número de parámetros de la función de distribución. 2

de la tabla 3, para v=2 y alfa = 0.05

Xt = 5.99

7.- CRITERIO DE DESICIÒN

como Xc = 4.29 es menor que Xt = 5.99

Se acepta la hipótesis nula, que los datos se ajustan a la distribución normal


con un nivel de significación del 5% y 95 % de probabilidad.
METODO GUMBEL

4.- CALCULO DE LA FRECUENCIA ESPERADA, UTILIZANDO LA DISTRIBUCION TEORICA NORMAL.

frecuencia frecuencia
intervalo de limite de clase probabilidad probablidad frecuencia esperada: ei observada Θi
clase (1) (2) lim. Sup F(s) (4) lim. Inf. F(I) (5) abs., ei (6) (6) (7)
9.7
9.7 - 43.7 43.7 0.0600 0.0001 1.26 2 2
43.7 -77.7 77.7 0.4232 0.0600 7.63 8 7
77.7 - 111.7 111.7 0.7688 0.4232 7.26 7 5
111.7 - 145.7 145.7 0.9228 0.7688 3.23 3 6
145.7 - 179.7 179.7 0.9757 0.9228 1.11 1 1

(6) = ( 4 - 5 )*21
u = Xm - 0.45 S = 73.37

α = 0.7806 S = 28.69

5.- CALCULO DEL CHI CUADRADO CALCULADO.-

( 2 2) ( 8) ( ) ( 3) (1 1)
𝑋𝑐 = + + + + = 3.70
2 8 3 1
6.- CALCULO DEL CHI CUADRADO TEORICO.-

grados de libertad: v = k - 1 - h = (5 - 1 - 2) = 2

k= numero de intervalos 5
h = número de parámetros de la función de
distribución. 2

de la tabla 3, para v=2 y alfa = 0.05

Xt = 5.99

7.- CRITERIO DE DESICIÒN

como Xc = 3.70 es menor que Xt = 5.99

Se acepta la hipotesis nula, que los datos se ajustan a la distribución gumbel


con un nivel de significación del 5% y 95 % de probabilidad.