Está en la página 1de 16

Pruebas de Bondad de Ajuste

Clase 2b
Claudio Álvaro Cerrón Landeo
Propósito de la Clase
Al finalizar la unidad, el estudiante será capaz de plantear, aplicar e
interpretar pruebas de hipótesis para la bondad de ajuste y de tablas
de contingencia a partir de una muestra aleatoria.
Reconocer las características de una
prueba no paramétrica Multinomial.

Realizar pruebas No paramétricas de


Bondad de Ajuste.

Realizar pruebas de Independencia y


Homogeneidad.
1. Un experimento multinomial.
Bondad de ajuste
1. Un experimento multinomial
• Generaliza un experimento binomial al permitir que
cada intento resulte en uno de k posibles resultados,
donde k>2.

Ejemplo Desgaste N° de
Se tienen una muestra de un Niv.
mgr/Kg Neumáticos
neumáticos para realizar un
experimento y probar su 1 50 a 100 23
resistencia al desgaste. Los
niveles (k) de desgaste y las 2 100 a 150 15
frecuencias en cada nivel se
muestran a continuación: 3 150 a 200 36
4 200 a 250 24
1. Un experimento multinomial
• Generaliza un experimento binomial al permitir que
cada intento resulte en uno de k posibles resultados,
donde k > 2.
Ejemplo
La frecuencias obtenidas Desgaste
Niv. O
con la muestra se mgr/Kg
denominan frecuencias
Observadas (O). 1 50 a 100 23
2 100 a 150 15
3 150 a 200 36
4 200 a 250 24
98
1. Un experimento multinomial
• Si el experimento consiste en seleccionar n individuos u
objetos de una población y clasificar cada uno, entonces pi
es la proporción de la población que cae en la i-ésima
categoría
Ejemplo
Las frecuencias para la Desgaste Prop. de
Niv.
población se pueden obtener mgr/Kg Neumáticos
utilizando los pi .
1 50 a 100 p1

E1 = n*p1. 2 100 a 150 p2


E2 = n*p2. 3 150 a 200 p3
....
4 200 a 250 p4
2. Pruebas de bondad de ajuste
Pruebas con experimentos multinomiales
2. Prueba de Bondad de Ajuste
• Resistencia de neumáticos: Se Desgaste N° de
tienen una muestra de un neumáticos Niv.
para realizar un experimento y probar mgr/Kg Neumáticos
su resistencia al desgaste. Los
niveles (k) de desgaste y las 1 50 a 100 23
frecuencias en cada nivel se
muestran a continuación. Según el 2 100 a 150 15
fabricante la distribución de las
resistencias sigue un patrón como:
3 150 a 200 36
p1 = 0.3 p2 = 0.3 p3 = 0.2 p4 = 0.2
• Al nivel de 5% pruebe que las
4 200 a 250 24
resistencias se ajustan al patrón
propuesto por el fabricante.
Condiciones de una Prueba de Bondad de ajuste:

• La muestra es aleatoria simple.


• Se tiene k categorías en las que se puede clasificar cada uno de
los elementos de una población.
• Se tiene una frecuencia esperada en cada categoría E ≥ 5.
• Las frecuencias esperadas se obtienen de E=npi
• El estadístico de prueba se calcula de:
𝑂−𝐸 2
χ2 = σ 𝐸
2. Prueba de Bondad de Ajuste
Ejemplo
• Las frecuencias para la población Desgaste
Cat. O E
se pueden obtener utilizando los mgr/Kg
pi . E1=n*p
1 50 a 100 23
1

2 100 a 150 15 E2=n*p


• Las frecuencias Hipotéticas en la 2
población se denominan E3=n*p
3 150 a 200 36
frecuencias esperadas E 3

4 200 a 250 24 E4=n*p


4
2. Prueba de Bondad de Ajuste
• La hipótesis nula de interés especificará el valor de cada pi. Por ejemplo, en el caso de k = 4,
se podría tener:
• p1 = 0.3, p2 = 0.3, p3 = 0.2, p4 = 0.2. Las que se nombran como frecuencias
• La hipótesis alternativa indicará que al menos una de la pi tiene un valor diferente de lo
expresado por H0

Ejemplo
Las hipótesis se pueden plantear de la siguiente manera:
H0: O = E: p1 = 0.3; p2 = 0.3; p3 = 0.2; p4 = 0.2
H1: O ≠ E: Por lo menos una de las proporciones es diferente.

H0: O = E: Los datos se ajustan a la distribución esperada.


H1: O ≠ E: Los datos no se ajustan a la distribución esperada.
2. Prueba de Bondad de Ajuste
Solución
Parámetro de interés: Los parámetros de interés son p1, p2, p3, p4, las frecuencias de
cada uno de los k =4 niveles respectivamente, y queremos saber si p1 = 0.3, p2 = 0.3,
p3 = 0.2, p4 = 0.2
H0: O = E: p1 = 0.3; p2 = 0.3; p3 = 0.2; p4 = 0.2
H1: O ≠ E: Por lo menos una de las proporciones es diferente.
Usando R: chisq.test(x,p)

Como el p valor es 0,000 menor que


el nivel de significancia de 0,05, hay
evidencia estadística para rechazar
a hipótesis nula. Se concluye que
los datos no tienen la distribución
esperada
Ejemplo 2
El sorgo es una importante cosecha de cereales cuya calidad y aspecto podrían ser afectadas por la
presencia de pigmentos en el pericarpio (las paredes del ovario de la planta). El artículo “A Genetic and
Biochemical Study on Pericarp Pigments” informa de un experimento que comprendía una cruza inicial,
entre sorgo CK60 (una variedad norteamericana con semillas blancas), y Abu Taima (una variedad etiope
con semillas amarillas). Según la teoría genética, esta cruza debería producir plantas con semillas rojas,
amarillas o blancas en igual proporción. A continuación aparece la información del experimento. ¿Los
datos confirman o contradicen la teoría genética? Utilice un nivel de significancia de 0.05

Color de
Rojo Amarillo Blanco
semilla
Frecuencia
195 73 100
observada
Solución
1. Parámetro de interés: Los parámetros de interés son p1, p2, p3, las frecuencias de cada uno
de los k =3 niveles respectivamente, y queremos saber si p1 = p2 = p3
2. Hipótesis:
H0: O = E: p1 = p2 = p3 Las semillas se dan por igual en cualquier color. (distribución uniforme)
H1: O ≠ E: Las semillas se dan en proporciones diferentes.

Usando R: chisq.test(x,p)

Como el p valor es 0,000 menor que


el nivel de significancia de 0,05, hay
evidencia estadística para rechazar
a hipótesis nula. Se concluye que
los datos contradicen a teoría
genétca.
Ejemplo 3
Cierto tipo de linterna eléctrica se vende con las cuatro baterías incluidas. Se obtiene una muestra
aleatoria de 150 linternas y se determina el número de baterías defectuosas; con los resultados
siguientes:

Se debe probar si la distribución de las baterías sigue una distribución binomial con p=0,36
Solución
H0: O = E: La distribución tiene comportamiento binomial
H1: O ≠ E: La distribución no tiene comportamiento binomial

Respuesta:

Conclusión:

También podría gustarte