Universidad de San Carlos.

Facultad de ingeniería Estadística 2

Bondad de ajuste

Jorge Mario Vettorazzi Camo. Jorge Santiago Suruy Tocay

200718871 200718805

es decir que tiene la forma de campana. En estos casos debemos emplear técnicas como lo es la bondad de ajuste cuando una muestra no se ajuste a una distribución normal. Algunos estudios producen resultados sobre los que no podemos afirmar que se distribuyan de una forma normal.Introducción. con frecuencia es importante obtener información a través de una muestra sobre la forma como se distribuyen los datos de una población. Cuando se realizan investigaciones. .

Binomial De Fisher. Si la P (fracaso) se denota con q y 1 p. es decir que menos de los tienen un valor diferente del afirmado en cuyo caso por el menos dos deben ser diferentes. se hace referencia a los K resultados posibles en un determinado ensayo como categoría. . o en otras palabras mediciones que no pueden ordenarse. es constante de un ensayo a otro. donde K>2. Por ejemplo: Suponga que un almacén acepta tres tipos de tarjetas de crédito. De Anderson Darling.Porque aplicamos la Bondad de Ajuste. Entre otras. Un experimento multinomial generaliza un experimento Binomial permitiendo que cada ensayo de lugar a uno de K resultados posibles. Por ejemplo: En el caso que K=3. Para resolver el problema de las pruebas no para métricas usamos una prueba estadística que recibe el nombre de Pruebas de bondad de ajuste las cuales pueden ser: y y y y y Chi-cuadrada. La hipótesis nula de interés especifica el valor de cada . entonces . las pruebas no para métricas no asumen ningún parámetro de distribución de las variables muéstrales. que utiliza cada uno de los n clientes siguientes que paga con tarjeta de crédito. y el numero n de ensayos es fijo al inicio del experimento. Se supone que la probabilidad de éxito. En la estadística no para métrica que es una rama de la estadística que estudia las pruebas de la estadística cuya distribución no se ajusta a los criterios para métricos. puesto que su suma es igual a 1. Si el experimento consiste en seleccionar n individuos u objetos de una población y categorizar cada uno. La hipótesis alternativa expresa que no es verdad. puesto que si . tipo 1. De los cuales algunos experimentos producen respuestas que no son cuantificables. representado por P. y representa la probabilidad de que un ensayo como categoría . La prueba z es bilateral cuando la alternativa de interés es . se podría tener . entonces es la probabilidad de la población que cae en la i. Pero la posición de la respuesta en una escala de medición es arbitraria. Bondad de ajuste Binomial: Un experimento Binomial consiste en una secuencia de ensayos independientes en los que cada ensayo produce uno de dos resultados posibles éxito o fracaso. la hipótesis nula se puede escribir de otro modo como . tipo 2. En general. Como aplicamos la bondad de ajuste. tipo 3.ésima categoría. Si se presenta una prueba Z con muestras grandes para probar  Observe que esta hipótesis nula especifica tanto P (éxito) como P (fracaso). Un experimento multinomial resultaría de observar el tipo de tarjeta de crédito.

los valores esperados cuando es verdadera se muestra debajo de los valores observados. En el ejemplo antes . categoría observada esperada i=1 n1 np10 i=2 n2 np20 . Es común representar la en un formato tabular que consiste en un renglón de k celdas. varias de las cuentas observadas deben diferí sustancialmente de estas cuentas esperadas cuando los valores reales de las defieren en forma notable de lo que se afirma en la hipótesis nula. al igual que el numero de éxitos y el numero de fracasos en un experimento Binomial son variables aleatorias. Por ejemplo Un experimento esperado de éxitos y el número esperado de fracasos en un experimento Binomial son np y nq. Cuando    es verdad. DISTRIBUCION MULTINOMIAL La distribución multinomial es similar a la distribución binomial. y lo mismo resulta cierto para las . puede haber múltiples resultados: Ejemplo de distribución multinomial: a esas elecciones se presentaron 4 partidos políticos: el POPO obtuvo un 40% de los votos. el MUMU el 20% y el LALA el 10% restante. De manera similar. 3 hayan votado al POPO. ¿Cuál es la probabilidad de que al elegir 5 ciudadanos al azar. i=k nk NPk0 total de renglón n n Las deben estar razonablemente cerca de las correspondientes cuando es verdadera. con la diferencia de que en lugar de dos posibles resultados en cada ensayo. . los números previstos de acierto y errores son   . como se ilustra en la tabla. respectivamente. Las y las por lo común se denominan cuentas de celdas observadas y son las cuentas de celda esperadas correspondientes bajo . 1 al MUMU y 1 al LALA? La distribución multinomial sigue el siguiente modelo: . Puesto que cada ensayo produce exactamente una de las K categorías. en un experimento multinomial el número esperado de ensayos que dan lugar a la categoría i es  . Esta variable aleatoria se denota con y su valor observado con . respectivamente... Antes de llevar a cabo el experimento multinomial. una para cada categoría.    que se afirma en la hipótesis nula. el numero de ensayos que da lugar a la categoría    es una variable aleatoria. Por otro lado. estos valores esperados se convierten en . con que se rechaza cuando la discrepancia es suficientemente grande. El procedimiento de prueba requerida evaluar la discrepancia entre las y las . Cuando  es verdad.El símbolo representa el valor de mencionado. el JEJE el 30%.

84%.56% Nota: 0! es igual a 1. que la probabilidad de que las 5 personas elegidas hayan votado de esta manera es tan sólo del 2. la probabilidad de que el grupo esté formado por personas de estos países es tan sólo del 3.0256 Es decir. y cualquier número elevado a 0 es también igual a 1 Veamos otro ejemplo: En una fiesta. el 30% franceses. 5 veces) n!: es factorial de n (en el ejemplo: 5 * 4 * 3 * 2 * 1) p1: es la probabilidad del suceso X1 (en el ejemplo.0384 Por lo tanto. el 20% de los asistentes son españoles. . que el partido POPO lo hayan votado 3 personas) n: indica el número de veces que se ha repetido el suceso (en el ejemplo. el 40%) Veamos el ejemplo: Luego: P = 0. En un pequeño grupo se han reunido 4 invitados: ¿cual es la probabilidad de que 2 sean españoles y 2 italianos? Aplicamos el modelo: Luego P = 0. el 40% italiano y el 10% portugueses.Donde: X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo.

en cada ensayo hay tan sólo dos posibles resultados: o sale blanca o no sale.DISTRIBUCION HIPERGEOMETRICA Las distribución hipergeométrica es el modelo que se aplica en experimentos del siguiente tipo: En una urna hay bolas de dos colores (blancas y negras). al igual que en la distribución binomial. ¿cuál es la probabilidad de que al sacar 2 bolas las dos sean blancas? Son experimentos donde. La distribución hipergeométrica sigue el siguiente modelo: Donde: Vamos a tratar de explicarlo: N: es el número total de bolas en la urna N1: es el número total de bolas blancas N2: es el número total de bolas negras k: es el número de bolas blancas cuya probabilidad se está calculando n: es el número de ensayos que se realiza . Pero se diferencia de la distribución binomial en que los distintos ensayos son dependientes entre sí: Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca. en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son diferentes (hay dependencia entre los distintos ensayos).

DISTRIBUCION DE POISSON Las distribución de Poisson parte de la distribución binomial: Cuando en una distribución binomial se realiza el experimento un número "n" muy elevado de veces y la probabilidad de éxito "p" en cada ensayo es reducida. k = 3.3%. Se eligen 3 personas al azar ¿Cuál es la probabilidad de que las 3 sean solteras? Por lo tanto. Se sacan 4 bolas ¿Cuál es la probabilidad de que 3 sean blancas? Entonces: N = 12. n = 4 Si aplicamos el modelo: Por lo tanto. N2 = 5.3535.Veamos un ejemplo: en una urna hay 7 bolas blancas y 5 negras. Es decir. la probabilidad de sacar 3 bolas blancas es del 35. entonces se aplica el modelo de distribución de Poisson: Se tiene que cumplir que: " p " < 0.10 . sino que también se aplica con experimentos similares: Ejemplo: en una fiesta hay 20 personas: 14 casadas y 6 solteras. P (x = 3) = 0. P (x = 3) = 0. Pero este modelo no sólo se utiliza con experimentos con bolas. Es decir. la probabilidad de que las 3 personas sean solteras es tan sólo del 1.0175. N1 = 7.75%.

¿Cuál es la probabilidad de que entre 800 recien nacidos haya 5 pelirrojos? Luego." p * n " < 10 La distribución de Poisson sigue el siguiente modelo: Vamos a explicarla: El número "e" es 2.71828 " l " = n * p (es decir.0892 Por lo tanto. si se realizan 300 viajes. ¿cual es la probabilidad de tener 3 accidentes? Como la probabilidad " p " es menor que 0. Luego.012.602 . entonces aplicamos el modelo de distribución de Poisson. la probabilidad de tener 3 accidentes de tráfico en 300 viajes es del 8. P (x = 5) = 4.9% Otro ejemplo: La probabilidad de que un niño nazca pelirrojo es de 0. y el producto " n * p " es menor que 10. el número de veces " n " que se realiza el experimento multiplicado por la probabilidad " p " de éxito en cada ensayo) " k " es el número de éxito cuya probabilidad se está calculando Veamos un ejemplo: La probabilidad de tener un accidente de tráfico es de 0. P (x = 3) = 0.02 cada vez que se viaja.1.

25 redondas y verdes (1/16)(556) = 34. que es lo mismo que decir que las diferencias entre los valores observados y calculados se deben al azar con una probabilidad mayor al 90%.00 Total de semillas 315 semillas redondas y amarillas (9/16)(556) = 312. Fórmula de Chi-cuadrado: grados de libertad (gl): n-1 donde n es el número de clases.90. se observa que el valor de Chicuadrado encontrado se encuentra con una probabilidad mayor de 0. Quiere decir que la probabilidad de encontrar un valor de Chi-cuadrado como el calculado para nuestro experimento es mayor del 90%.Por lo tanto.25 arrugadas y amarillas X2 = 0. Probemos si los siguientes datos se ajustan a la proporción 9:3:3:1 Valores Observados 108 semillas redondas y verdes 32 semillas arrugadas y verdes 556 Total de semillas Aplicando la ecuación: Valores Esperados (3/16)(556) = 104. Una prueba estadística que resulta muy útil es la prueba de hipótesis de Chi-cuadrado.75 redondas y amarillas 101 semillas arrugadas y amarillas (3/16)(556) = 104.75 arrugadas y verdes 556.47 Número de clases: 4 Gl (grados de libertad): n-1= 4-1= 3 Valor de Chi-cuadrado: 0. . la probabilidad de que haya 5 pelirrojos entre 800 recien nacidos es del 4.47 Si se entra en la Tabla de Chi-cuadrado por tres grados de libertad.6% Prueba de Chi-Cuadrado Una pregunta importante que necesita responderse en cualquier experimento genético es cómo podemos decidir si nuestros datos están de acuerdo con las proporciones Mendelianas que hemos expuesto.

Por convención estadística se utiliza el valor de 0.37 6.99 9.35 . En el caso del ejemplo anterior el valor calculado es menor que el valor encontrado en la tabla de Chi-cuadrado por lo que se acepta la hipótesis de que los datos se ajustan a una distribución 9:3:3:1.25 7.46 2.9 0.82 11.05 de probabilidad como el valor límite o crítico.5 0.02 0. Tabla de Chi-cuadrado probabilidad Grados de Libertad 0.61 5.21 1.84 6.1 0.64 0.21 0.39 4. Si el valor de Chi-cuadrado calculado para un experimento es mayor que el correspondiente al de la probabilidad del 5% se rechaza la hipótesis.71 3.01 1 2 3 0.58 2.05 0.

Devore Sexta edición.aulafacil.com/CursoEstadistica/CursoEstadistica.edu.htm# http://www.fcien. http://uvigen.Bibliografía Probabilidad y estadística para ingeniería y ciencias Jay L.htm .uy/utem/genmen/06chi2.

Sign up to vote on this title
UsefulNot useful