Está en la página 1de 4

Como hacer una prueba de bondad de ajuste.

1)
2)
3)
4)
5)

Vamos a crear un conjunto de datos que asemejen los datos tomados en nuestra muestra.
Vamos a hacer el histograma de los datos usando 7 clases.
Vamos a calcular los parmetros del test estadstico chi-cuadrado
Aplicamos el test.
Concluimos.

En Scilab la funcin rexpweib(n,1,1) permite generar n valores exponenciales con parmetro


Lambda=1 (el 1 del centro) El 1 final es para elegir exponencial en lugar de weibull. Para nuestro
caso de inters n=100.
Obtenemos: -->x=rexpweib(100,1,1)
x =
2.063672

0.0437775

0.1635438

1.2840159

0.0316271

2.2085325

1.551526

0.1364742

0.0906078

0.7228322

0.0682861

3.0753949

1.5094385

0.2255140

0.3836652

1.9030443

0.4582976

0.2227930

0.3875243

2.3316867

1.1771133

1.213924

0.9194494

0.0059492

2.3274886

1.9527289

0.2774148

0.1942429

0.6029033

5.342586

0.3002308

0.1961326

1.2783436

0.8633158

0.2968810

0.3640901

1.6692836

2.1851175

0.7449486

2.0779805

0.6035231

0.0880277

0.9359145

1.1485397

0.0071442

0.4466569

0.8625422

0.2695148

0.0434224

0.2329321

0.4223907

0.0510596

0.0035450

0.1296183

1.7494752

0.7121485

0.0357427

0.0413509

1.7650006

3.3683601

0.0328384

0.6858485

1.197616

0.4100674

1.8476121

0.4219898

0.3480748

0.8238384

0.3204271

0.2257361

0.2265495

2.0722941

0.0298483

3.3322775

3.4472567

0.9634912

0.0190710

1.0180632

1.1502727

1.5596527

0.2672041

0.8946976

0.4364714

0.2137738

2.971695

0.7138308

0.2307033

1.2872636

0.2291617

0.7809098

0.3433853

0.3484598

3.3120539

0.8083646

0.0824312

0.3860998

1.6773282

0.7183236

0.2814526

5.8715744

Ahora al proceder a ordenar estos datos en una frecuencia de clases con siete clases para luego hacer el
histograma.
-->clf()

(Para prepara una ventana grfica sobre la cual se har el grfico deseado)

-->histplot(7, x, style=2);

(hace el histograma con 7 clases)

-->x = linspace(0, max(Xmax), 100)';

(genera valores de x que se plotearn sobre el histograma)

-->plot2d(x, lambda*exp(-lambda*x), strf="000", style=5)

(hace el plot)

-->legend(["Histograma de la muestra Exponencial" "Curva de densidad exacta"]);

Obtenindose:

Este grfico muestra el comportamiento claramente Exponencial, como era de esperarse.


Para ms opciones del comando histo consulte la ayuda de Scilab.

Ahora procedemos a hacer el test de bondad de ajuste.

Usaremos una hoja de Excel y nos apoyaremos en Wolfram Alpha y en una Tabla de Valores de la
Distribucin Chi-Cuadrado.
Por razones de no haber terminado la edicin de este documento en una sola sesin, los valores que
aparecen en la tabla de datos anterior no son los mismos que los tabulados a continuacin, sin embargo,
los principios son los mismos, y queda como un ejercicio para el lector realizar los pasos descritos a
continuacin con el conjunto de datos mostrados anteriormente.
Primero encontraremos el valor tabulado de Chi-Cuadrado, para ello definimos los grados de libertad de
la prueba (g.l.) y el nivel de significancia ().
Los grados de libertad se calculan as: Nmero de clases de frecuencias Nmero de parmetros - 1.
En nuestro caso se manejan 7 clases, y se conoce que de la distribucin a usar solo se tiene un parmetro
que es lambda (). As, los g.l. = 7 - 1 - 1 = 5.
Si fuera otra distribucin diferente a la Exponencial, hay que examinar cuntos parmetros tiene y as
cambiar dicho valor en la resta.
El nivel de significancia los hemos establecido que sea o bien el 90% o bien el 95%. A continuacin damos
los dos valores seleccionados de la tabla Chi-Cuadrado a los grados de libertad de 5:
Para 90% 2 = 9.24 y para el 95% 2 = 11.07 Estos son los valores tabulados, contra los cuales vamos
a contrastar el Chi-Cuadrado Calculado.
Ahora procederemos a encontrar el Chi-Cuadrado calculado:
Conocemos que la funcin de densidad de probabilidades Exponencial viene dada por:

() = {
0
1

Adems se conoce que () =

> 0
.
1

de all se deduce que = ()

De los datos anteriores se encuentra que el promedio de los 100 datos es 0.97757297 (aunque fueron
generados suponiendo un =1) de aqu que el valor de lambda de los datos de la muestra generada resulta
ser =1.0229.
Cuando se hizo la distribucin de clases se encontr que el Rango de los datos era 5.8680 (diferencia entre
el mayor menos el menor). De donde se obtuvo que el ancho de clase para tener siete clases era de 0.8383
Obtenindose la distribucin de frecuencias que se muestra ms adelante.
El test Chi-Cuadrado viene dado por: 2 = 7=1

( )2

Vamos de 1 hasta 7 porque solo hay siete clases en cuestin. La frecuencia observada se obtiene del
conteo de cuantos datos caen en cada clase.

La frecuencia esperada se calcula usando la frmula de la funcin de densidad de probabilidades, y


calculando para cada intervalo de clase (entre el lmite inferior y el lmite superior de cada clase) la
probabilidad de cada intervalo y luego se multiplica dicho dato por el nmero total de datos de la muestra
(100 en nuestro caso). Luego se hace la operacin indicada anteriormente en la frmula del test para
obtener el 2 . A continuacin se muestran los resultados.

Lmite
inferior
0.0035
0.8417
1.68
2.5183
3.3566
4.1949
5.0332

Lmite
Frecuencia
superior
observada Probabilidad
0.8417
60.00
0.573677
1.6800
20.00
0.24341
2.5183
12.00
0.10326
3.3566
4.00
0.0438052
4.1949
2.00
0.0185831
5.0332
0.00
0.00788339
5.868
1.00
0.00333547

Frecuencia
esperada
57.3677
24.341
10.326
4.38052
1.85831
0.788339
0.333547

ChiCuadrado
0.12078231
0.77417859
0.27138059
0.0330544
0.01080339
0.788339
1.33162523
3.33016352

La columna de probabilidad se obtuvo usando Wolfram Alpha, calculando:


integral of 1.0229*e^(-1.0229*x) dx from 0.0035 to 0.8417
Y as sucesivamente para cada par de Lmite inferior a Lmite superior.
Una vez obtenida cada probabilidad se multiplica por 100 y as se obtiene la frecuencia esperada para
cada sub-intervalo de clase. (Es por 100 debido a que son 100 datos).
Luego verifique que en la columna Chi-Cuadrado se ha efectuado en cada fila la operacin descrita en la
frmula. As al sumar los siete valore se obtiene el Chi-Cuadrado Calculado = 3.33016352.
Que resulta ser menor que cualquiera de los valores tanto para el nivel de significancia del 90% 2 =
9.24 como para el del 95% 2 = 11.07
Por lo que no se puede rechazar la hiptesis de que los datos siguen la Distribucin Exponencial. (Y se
asume dicha distribucin para los datos).
Conclusin:
Con un nivel de significancia del 10% y cinco grados de libertad, se puede afirmar que los datos siguen
una distribucin Exponencial, con parmetro =1.0229