P. 1
Pruebas de Bondad de Ajuste Ji Cuadrada 2 Ejemplos

Pruebas de Bondad de Ajuste Ji Cuadrada 2 Ejemplos

|Views: 23|Likes:

More info:

Published by: Jassir Vidal Macedonio on Mar 18, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

04/20/2014

pdf

text

original

PRUEBAS DE BONDAD DE AJUSTE

Estas pruebas permiten verificar que la población de la cual proviene una muestra tiene una distribución especificada o supuesta. Sea X: variable aleatoria poblacional f0(x) la distribución (o densidad) de probabilidad especificada o supuesta para X

Se desea probar la hipótesis: Ho: f(x) = f0(x) En contraste con la hipótesis alterna: Ha: f(x) no= f0(x) (negación de Ho)

PRUEBA JI-CUADRADO
Esta prueba es aplicable para variables aleatorias discretas o continuas. Sea una muestra aleatoria de tamaño n tomada de una población con una distribución especificada f0(x) que es de interés verificar. Suponer que las observaciones de la muestra están agrupadas en k clases, siendo oi la cantidad de observaciones en cada clase i = 1, 2, ..., k Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato cualquiera pertenezca a una clase i. Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es decir, la cantidad de datos que según el modelo especificado deberían estar incluidos en la clase i: ei = pi n, i = 1, 2, ..., k

Tenemos entonces dos valores de frecuencia para cada clase i oi: frecuencia observada (corresponde a los datos de la muestra) ei: frecuencia esperada (corresponde al modelo propuesto) La teoría estadística demuestra que la siguiente variable es apropiada para realizar una prueba de bondad de ajuste: Definición Estadístico para la prueba de bondad de ajuste χ =
2

Ji-cuadrado

k (o − e ) 2 i i

i =1

ei

, distribución Ji-cuadrado con ν=k–r–1 grados de libertad

donde r es la cantidad de parámetros de la distribución que deben estimarse a partir de la muestra Es una condición necesaria para aplicar esta prueba que ∀i, ei ≥ 5 .

95 – 3. entonces el valor del estadístico χ2 estará en la región de rechazo de Ho 2 rechazo H 0 ⇔ χ 2 > χ α : Región de rechazo de Ho Ejemplo Se ha tomado una muestra aleatoria de 40 baterías y se ha registrado su duración en años.7 Solución Sea X: duración en años (variable aleatoria contínua) X ~ N ( 3.45) = P((1.Dado un nivel de significancia α se define un valor crítico χ 2 para el rechazo de la hipótesis α propuesta Ho: f(x) = f0(x).45 5 7 4.5)/0.95 – 3.95 – 2.0..95 2 2 1.95 – 3.0136 p2 = P(1.7 ) 1) Ho: 2) Ha: no H0 3) α = 0.7) = 0.95 – 4.5)/0. entonces el valor de estadístico de prueba χ2 será cercano a cero.95 4 4 2.95≤X≤2.45≤X≤2.135 .45 – 4. Estos resultados se los ha agrupado en 7 clases en el siguiente cuadro i clase (duración) frecuencia observada (oi) 1 1.5)/0.7) = 0.45 – 2.95 3 Verificar con 5% de significancia que la duración en años de las baterías producidas por este fabricante tiene duración distribuida normalmente con media 3.95) = P((2.5)/0.7 ≤Z≤ (2.45 – 3.0532 p3 = P(2. (etc) .95 10 6 3.45 – 1.5 .5.45 15 5 3. µ=3.45 1 3 2.05 (distribución normal.95 – 3. pero si estas diferencias son significativas.7 ≤Z≤ (2..7) = 0. σ=0.45 – 3.5 y desviación estándar 0.45 – 3.5)/0.7) Cálculo de la probabilidad correspondiente a cada intervalo p1 = P(X≤1.95) = P(Z≤(1. Si las frecuencias observadas no difieren significativamente de las frecuencias esperadas calculadas con el modelo propuesto.

.4 2.45 – 4.95 – 4.0532 (40) ≈ 2. (etc) Resumen de resultados duración (años) frecuencia observada (oi) frecuencia esperada (ei) 1. de donde r = 0 α = 0.95 10 10.5 Es necesario que se cumpla la condición ∀i.95 – 3.95 7 8.1 2.95 10 10.45 – 3.3 3.7 10.05. ⇒ χ 2. .5) 2 (15 − 10.815 0 2 Rechazar Ho si χ > 7.95 3 3.815 5) Cálculo del estadístico de prueba (Tabla χ2) (oi − ei ) 2  (7 − 8.45 – 1.5 Ahora se puede definir la región de rechazo de Ho Observemos que en este ejemplo la media y la desviación estándar de la distribución normal no se estimaron.95 4 5.95 8 10. se dice que no hay evidencia suficiente para rechazar el modelo propuesto para la población.3 10.05 = 7.7 3.815.Cálculo de las frecuencias esperadas e1 = p1 n = 0.45 5 7 4.135 (40) ≈ 5. Como resultado se tienen cuatro clases k=4 duración (años) frecuencia observada (oi) frecuencia esperada (ei) 1.5)2  =  χ = ∑ + + +  = 3.5 ei  8 .45 15 10.4 . 3.95 – 3.3) 2 (10 − 10.95 – 4.45 – 3.1 e3 = p3 n = 0.5 1.45 1 2.5 e2 = p2 n = 0.45 – 2.7)2 (8 − 10.7 la suma debe ser n =40 3.05 10.. sino que están propuestas.05 no es mayor a 7.3 Ojo con el redondeo.95 – 2.45 15 10.95 2 0.45 – 2. ei ≥ 5 por lo que se deben agrupar clases adyacentes. ν = k – 1 = 3.5  i =1   2 k 6) Decisión Como 3.5 2.0136 (40) ≈ 0.

88 (0.96 4 3 14 9.1 (2. De plantas 0 1 2 3 4 5 6 frecuencia observada (oi) 9 9 10 14 2 2 2 ¿Podrían estos datos ajustarse a una distribución de Poissón? Utilice un nivel 0.1 (2.. (etc) Cálculo de las frecuencias esperadas e1 = p1 n = e2 = p2 n = e3 = p3 n = e −2. (etc) Resumen de resultados i Nro.10 ) 2) Ha: no H0 3) α = 0..1 (2.1) 1 = 0.1 (48) = 5.96 .1962: 567-571) i 1 2 3 4 5 6 7 Nro.25725)(48 ) = 12. como se publica en el el artículo “Some Sampling Characteristics of Plants and Arthropods of the Arizona Desert” (Ecology.05 de significancia.10 ) Cálculo de la probabilidad correspondiente a cada intervalo p1 = P(X=0) = e −2.Ejemplo 2 La siguiente tabla presenta información de cantidades sobre el número de plantas Larrea divaricata halladas en cada uno de los 48 cuadrantes de nuestro.88 2 1 9 12..05 (distribución de Poisson con λ = 2.. De plantas frecuencia observada (oi) frecuencia esperada (ei) 1 0 9 5.oi = 101 = 2.10 λ= n 48 1) Ho: X ~ Poisson( 2 .1 0! e −2. ei ≥ 5 por lo que se deben agrupar clases adyacentes.75 Es necesario que se cumpla la condición ∀i.34 12. Solución El valor de λ en este caso debe estimarse ∑ x i .07 5 >= 4 6 7.25725 1! p3 = P(X=2)= . Como resultado se tienen cinco clases k=5 .1) 2 2! p2 = P(X=1)= e −2.1) 0 = e − 2.34 3 2 10 12.

+  = 6 .05.31 ∑ e 7 . se dice que no hay evidencia suficiente para rechazar el modelo propuesto para la población.. la distribución de Poisson da un ajuste razonable a los datos.815 5) Cálculo del estadístico de prueba (oi − ei ) 2  (9 − 5.815 0 (Tabla χ2) Rechazar Ho si χ2 > 7.815. de modo que al nivel de 5%.1 = 3.. χ2 = k .75) 2  =  + ...Ahora se puede definir la región de rechazo de Ho Observemos que en este ejemplo se estimó el parámetro de la distribución.05 = 7.75 i  5...88) 2 (6 − 7 . de donde r = 1 α = 0.31 no es mayor a 7. ν = 5 – 1 .88  i =1   6) Decisión Como 6. ⇒ χ 2..

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->