Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD IV
PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO PARAMETRICAS
4.1 BONDAD DE AJUSTE
Las pruebas de bondad de ajuste tratan de verificar si el conjunto de datos se
puede ajustar o afirmar que proviene de una determinada distribucin.
Las pruebas bsicas que pueden aplicarse son: la ji-cuadrada y la prueba de
Smirnov-Kolmogorov. Ambas pruebas caen en la categora de lo que en
estadstica se denominan pruebas de Bondad de Ajuste y miden, como el
nombre lo indica, el grado de ajuste que existe entre la distribucin obtenida a
partir de la muestra y la distribucin terica que se supone debe seguir esa
muestra. Ambas pruebas estn basadas en la hiptesis nula de que no hay
diferencias significativas entre la distribucin muestral y la terica, H 0 es la
distribucin que se supone sigue la muestra aleatoria. La hiptesis alternativa
siempre se enuncia como que los datos no siguen la distribucin supuesta.
Hablamos de bondad de ajuste cuando tratamos de comparar una distribucin de
frecuencia observada con los valores correspondientes de una distribucin
esperada o terica. Algunos estudios producen resultados sobre los que no
podemos afirmar que se contribuyen normalmente, es decir con forma
acampanada concentradas sobre la media.
Su frmula es la siguiente:
oi
i 1
f ei
f ei
Pgina 1
Categoras o celdas.
2 t2;K m 1
Se rechaza H0 cuando
Pgina 2
Frecuencia observada
Foi1
Foi2
.
.
Foik
n
Frecuencia esperada
Fe1
Fe2
.
.
Fek
n
( foifei )2
fei
2=
i1
( foifei )2
fei
Pgina 3
=0
>0
H0 se acepta
H0 se rechaza
(Oiei)2
ei
Grados de libertad
v = (r-1)*(c-1)
Frecuencia Esperada = Total de la columna * Total del rengln
Gran total
Caractersticas
X2 toma valores no negativos; es decir, puede ser cero o positiva.
X2 no es simtrica; es asimtrica hacia la derecha.
Existen muchas distribuciones X2 como en el caso de la distribucin t, hay
una distribucin, X2 diferente para cada valor de los grados de libertad.
Nos dan una tabla de contingencia.
El procedimiento de la prueba ji-cuadrada puede tambin utilizarse para probar la
hiptesis de independencia de dos variables de clasificacin.
Ejemplo:
Supngase que desea determinar si las opiniones de los residentes votantes del
estado de Illinois respecto a una nueva reforma impositiva son independientes de
sus niveles de ingreso. Una muestra aleatoria de 1000 votantes registrados del
estado de Illinois se clasifica de acuerdo con sus ingresos como bajo, medio y alto
Pgina 5
Medio
Alto
A favor
182
213
203
598
En contra
154
138
110
402
Total
336
351
313
1000
Reforma
Total
impositiva
Pgina 6
P ( F )=
598
1000
336
1000
P ( A )=
P (M )=
351
1000
P (H )=
313
1000
402
1000
336
598
( 1000
)( 1000
)
336
402
( 1000
)( 1000
)
351
598
( 1000
)( 1000
)
351
402
( 1000
)( 1000
)
313
598
( 1000
)( 1000
)
313
402
( 1000
)( 1000
)
x 100 =
( 336 )( 598 )
1000
= 200.9
Medio
Alto
A favor
182(200.9)
213(209.9)
203(187.2)
598
En contra
154(135.1)
138(141.1)
110(125.8)
402
Total
336
351
313
1000
Reforma
Total
impositiva
Pgina 8
Prueba De Independencia:
Calclese:
2=
i
(Oiei)2
ei
2 >
(182200.9)
=
200.9
2
(213209.9)
209.9
(138141.1)2
141.1
(203187.2)
187.2
(110125.8)2
125.8
P 0.02
Pgina 9
(154135.1)
135.1
= 7.85
0.05
= 5.991
2 (corregida)=
i
(|Oi ei|0.5)
ei
Pgina 10
prueba es:
( OiEi )2
=
Ei
i=1
2
0
Pgina 11
0 > , k p1 . En caso
contrario se acepta.
Donde t representa el valor proporcionado por las tablas, segn el nivel de
significacin elegido.
Cuanto ms se aproxima a cero el valor de ji-cuadrada, ms ajustadas estn
ambas distribuciones.
Un punto que cabe destacar en la aplicacin de este procedimiento de prueba se
refiere a la
20
no
Pgina 12
P1
P ( ai1 X ai ) = f ( x ) dx
ai1
frecuencia observada
Oi
12
14
12
13
Pgina 13
frecuencia observada
Ei
12.5
12.5
12.5
12.5
12
11
12
14
100
12.5
12.5
12.5
12.5
100
20=
i=1
( OiEi )2
Ei
0.05,5
>
7. clculos
8
20=
i=1
( OiEi )2
Ei
(1212.5) (1412.5)
(1412.5)
+
+ +
=0.64
12.5
12.5
12.5
Pgina 14
= 11.07
0 = 0.64 <
0.05,5
= 11.07 no puede
20
= 0.64 es P = 0.9861.
1
O11
O12
O1c
O21
O22
O2c
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Orl
Or2
Orc
Renglones
1
1
u^ i= oij v^ j = o ij
n j=1
n i=1
1
Eij =n u^ i v^ j= oij o ij
n j=1 i=1
Tiene una distribucin ji-cuadrada aproximada con (r-1) (c-1) grados de libertad si
la hiptesis nula es verdadera. Por lo tanto, la hiptesis de independencia se
rechazara si el valor observado del estadstico de prueba
excediera
2 ,(r1)(c1) .
Para calcular grados de libertad se tiene la siguiente frmula:
gl= (r-)(c-1)
NOTA: El clculo de grados de libertad nos dar la pauta para calcular el valor
total de frecuencias.
Ejemplo:
Pgina 17
totales
Trabajadores asalariados
160
140
40
340
40
60
60
160
Totales
200
200
100
500
Clasificacin laboral
0.40 y
ecuacin
c
Eij =n u^ i v^ j=
1
o o
n j=1 ij i=1 ij
totales
136
136
68
340
Pgina 18
64
64
32
160
200
200
100
500
20=
i=1 j=1
( OijEij )2
Eij
7. clculos
( OijEij )2
=
Eij
i=1 j=1
2
0
20
= 49.63 >
20.05,2=5.99 , se rechazar la
Pgina 20
Pgina 21
Pgina 22
Pgina 23
Pgina 24
llegar
un
ndice
general.
propiedad
medida.
Con esto notamos que esta escala no puede ser usada en los fenmenos
psicolgicos, pues no se puede hablar de cero inteligencia o cero aprendizaje,
etc.
Pgina 26
Pgina 28
Pgina 29
Llantas radiales
4.2
4.7
6.6
7.0
6.7
4.5
5.7
6.0
7.4
4.9
6.1
5.2
5.7
6.9
6.8
4.9
2= 0
H1: 1- 2 > 0
2.
3. = 0.05
Z= 10.5 7 = 1.87
14/2
Y entonces P= P(X 11) P ( Z>1.87)= 0.0307
6. DECISION: rechazar Ho y concluir que, en promedio, las llantas
radiales mejoran la economa de combustible.
Pgina 31
H0
F0 (x )
F0 ( x )
es continua y la muestra
F0 ( x )
es continua, es la basad en
F0 (x ) , se rechaza.
H 0 : F (x) F 0( x) , en donde
Pgina 32
F0 (x )
se
a las observaciones
y defnase la funcin de
de la muestra aleatoria,
menores a
posible evaluar a
este ltimo
F0 ( x )
x , y entonces compara
S n ( x) . Si la hiptesis nula es
La estadstica
Dn
Dn
es una estadstica
Dn
dn
que se encuentran en la
parte inferior de la tabla proporcionan una adecuada aproximacin para los valores
n
de
mayores de 50.
Para un tamao
P Dn >
c
= .
n
Pgina 33
Dn
H0
.
Como se hizo anteriormente, la estadstica de Kolmogorov Smirnov es, en
general, superior a la prueba de bondad de ajuste chi cuadrada cuando los datos
involucran una variable aleatoria continua, debido a que no es necesario agrupar
los datos. Adems, la prueba de Kolmogorov Smirnov tiene la atractiva
propiedad de ser aplicable a muestras de tamao pequeo. Por otro lado, la
estadstica se encuentra limitada, ya que el modelo propuesto bajo
H0
debe
(observar
que los datos se deben ordenar) vienen de una distribucin con funcin
acumulativa F
A2 = N S
Donde:
Pgina 34
H0
Pgina 35
Donde:
x ( i)
Donde:
Siendo m1,..., mn son los valores medios del estadstico ordenado, de variables
aleatorias
independientes
idnticamente
distribuidas,
muestreadas
de
CONCLUSION
De esta manera puedo finalizar que es muy substancial tener siempre en cuenta la
escala de medicin que se est utilizando, pues no todos los procedimientos
estadsticos son apropiados para cualquier anlisis.
En general, las variables estadsticas se clasifican en variables continuas o
cuantitativas y variables discretas o cualitativas, segn el nivel de escala en que
estn medidas. Las variables continuas se refieren a magnitudes medidas en
escala de intervalos o de razn, mientras que las variables discretas comprenden
magnitudes medidas en escalas de nivel nominal y ordinal. Por otro lado puedo
concluir que las pruebas no paramtricas se encargan de estudiar las pruebas y
modelos estadsticos cuya distribucin no se ajusta; o sea que no asumen ningn
parmetro de las variables mustrales, por eso es muy importante el conocimiento
de las pruebas no paramtricas, ya que se aplica en la administracin debido a la
Pgina 37
CONCLUSION
Para el desarrollo de esta unidad nuevamente llevamos a cabo la formulacin de
hiptesis, y a partir de ello se realizan diversas pruebas, de las cuales hablare a
continuacin. Como pudimos notar el trabajo anterior trato a cerca de las pruebas
de bondad de ajuste y las pruebas no paramtricas, a partir de ello puedo concluir
que, una prueba de bondad de ajuste mide como su nombre lo indica, el grado o
nivel de ajuste que existe entre una distribucin obtenida a partir de una muestra y
una distribucin terica que se supone debe seguir dicha muestra. Ambas pruebas
estn basadas en la hiptesis nula. Para probar la bondad de ajuste se utiliza un
procedimiento basado en la distribucin ji-cuadrada, y al obtener el valor de jicuadrada, mientras ms cercano a cero est, ms ajustadas estarn las
distribuciones.
Otra de las pruebas es la de independencia, sta trata de la comparacin de dos
situaciones, basndose en datos estadsticos obtenidos de la formulacin de datos
por medio de formulas y tablas, lo cual involucra las denominadas tablas de
contingencia, estas agrupa los datos segn renglones y columnas.
Pgina 38
BIBLIOGRAFA
Probabilidad y estadstica aplicadas a la ingeniera.
2 edicin
Montgomery Runger
Limusa Wiley
Probabilidad y estadstica.
Cuarta edicin
Walpole Myers
Mc Graw Hill
Estadstica
Richard C. Weimer
Pgina 39
Pgina 40