Prueba de Bondad de Ajuste

También podría gustarte

Está en la página 1de 4

1.

En una planta de producción de aceite, un ingeniero encargado del control de la calidad


mide la cantidad de líquido en cada botella. Para esto, toma muestras de tamaño 5
durante 5 días. Los datos se resumen en la siguiente tabla en medidas de mililitro.

Cantidad de aceite en cada botella [ml]


DIA 129 178 145 175 173
1
DIA 147 132 157 154 163
2
DIA 142 151 165 160 171
3
DIA 114 161 178 167 166
4
DIA 155 127 193 137 186
5

Determinar la distribución de los datos.

SOLUCION.

La solución para este problema puede ser planteada en dos partes:

1. Es necesario construir un histograma para observar el comportamiento de la curva


de frecuencia de los datos observados:

- La medida mínima es 114 y la máxima es 193


- El rango esta dado por R = 193 – 114 = 79
- El número de intervalos de clase usando la fórmula de Sturgess:
k = 1 + 3.32 log (25) = 5.64 = 6
- La amplitud o ancho del intervalo de clase esta dado por:
c = rango/k = 79/6 = 13.17 = 13

La tabla de distribución de frecuencia se muestra en la tabla:

Intervalo X(i-1) X(i) f(i) Marca clase


i
1 114 127 2 120.5
2 128 141 3 134.5
3 142 155 6 148.5
4 156 169 7 162.5
5 170 183 5 176.5
6 184 197 2 190.5
25
8
7 La curva de frecuencias que se
6 observa, se asemeja a la curva
Frecuencias

5 de Gauss (forma de campana).


4 Por tanto de manera subjetiva y
3
en primera instancia se podría
2
decir que los datos siguen una
1
0
distribución normal con media
1 2 3 4 5 6 157.46ml y varianza 358.75ml2
Cantidad de aceite [ml]

2. Para poder confirmar la suposición establecida anteriormente, es necesario


recurrir a métodos estadísticos y analíticos. Esto se puede realizar mediante las
siguientes pruebas:

PRUEBA CHI-CUADRADA.
2
2 ( Oi−E i )
χ =∑
Estadístico de prueba: Ei
Donde:
Oi: frecuencia observada
Ei: frecuencia esperada

1. Hipótesis
Ho : Los datos siguen una N(157.46 , 358.7584)
H1 : Los datos no siguen una N(157.46 , 358.7584)

2. Nivel de significancia  = 5%

3. Criterio: Los grados de libertad v se determina a


partir de la cantidad de intervalos de la
tabla de frecuencia. Sin embargo, se debe
notar que la observaciones no deben ser
menores a 5 (ver la tabla de frecuencias
=0.05
abajo)

Se determina de tablas chi-cuadrada con:


v=5
2v=11.07 area= 0.05 ó 0.95

Rechazar H0 si 2 > 11.07


4. Cálculo:

Intervalo X(i-1) X(i) O(i) Pi() E(i) (o-e)2/e


i
1 114 127 2 0.043 1.075 0.7959
0
2 128 141 3 (5) 0.132 3.3125 0.0295
5
3 142 155 6 0.241 6.0275 0.0001
1
4 156 169 7 0.260 6.5 0.0385
0
5 170 183 5 0.165 4.13 0.1833
2
6 184 197 2 (7) 0.062 1.555 0.1273
2
∑ 25 1.1746

Cada Pi() corresponde a calcular, las respectivas probabilidades normales:

P1(113.5<X<127.5) = 0.0430 (Nótese que se usan las fronteras de clase)

Las frecuencias esperadas E(i) = Pi()*25, así por ejemplo E(1) = 0.0430*25 = 1.075
2
2 ( Oi−E i )
χ =∑
Finalmente se encuentra que Ei = 1.1746

5. Decisión: Se acepta que los datos siguen una distribución normal con media
157.46 ml y varianza 358.7584 ml2 con una confianza del 95%.

PRUEBA KOLMOROGOV- SMIRNOV

Estadístico de prueba: Dmax = | F(i) – S(i) |


Donde:
Dmax: diferencia máxima
F(i): distribución acumulada observada
S(i): distribución acumulada teorica

1. Hipótesis
Ho : Los datos siguen una N(157.46 , 358.7584)
H1 : Los datos no siguen una N(157.46 , 358.7584)

2. Nivel de significancia 5%

3. Criterio:

=0.05
Se determina de una tabla K-S con:
area= 0.05
número de datos= 25
D = 0.270

Rechazar H0 si Dmax > 0.270

4. Cálculo:

Intervalo i X(i- X(i) f(i) h(i) S(i) = Pi() F(i) D


1) H(i)
1 114 127 2 0.08 0.08 0.0430 0.0430 0.037
2 128 141 3 0.12 0.20 0.1325 0.1755 0.0245
3 142 155 6 0.24 0.44 0.2411 0.4166 0.0234
4 156 169 7 0.28 0.72 0.2600 0.6766 0.0434
5 170 183 5 0.2 0.92 0.1652 0.8418 0.0782
6 184 197 2 0.08 1.00 0.0622 0.9040 0.0960
25

Obsérvese que Pi() son las probabilidades con distribución normal de las fronteras de
cada clase, es decir: (ídem al cálculo realizado en la prueba chi-cuadrada)

P1(113.5<X<127.5) = 0.0430 (Nótese que se usan las fronteras de clase) …

Finalmente se obtiene que Dmax = | F(i) – S(i) | = 0.0960

5. Decisión: Se acepta que los datos siguen una distribución normal con media
157.46 ml y varianza 358.7584 ml2 con una confianza del 95%.

También podría gustarte