Está en la página 1de 44

ESTADÍSTICA NO

PARAMETRICA
Estadística Aplicada

Semana 3 y 4
Una distribución de frecuencias para una
variable categórica.

• En una distribución de frecuencias se tiene un resumen de


todos los posibles resultados aleatorios de una variable:
Desgaste N° de
Ejemplo Se tienen una muestra Niv.
de un neumáticos para realizar
mgr/Kg Neumáticos
un experimento y probar su 1 50 a 100 23
resistencia al desgaste. Los
niveles (k) de desgaste y las 2 100 a 150 15
frecuencias en cada nivel se
muestran a continuación: 3 150 a 200 36
4 200 a 250 24
Un experimento
multinomial.
Bondad de ajuste
Un experimento multinomial
• Generaliza un experimento binomial al permitir
que cada intento resulte en uno de k posibles
resultados, donde k>2.

Ejemplo 1 Desgaste N° de
Se tienen una muestra Niv.
mgr/Kg Neumáticos
de un neumáticos para
realizar un experimento 1 50 a 100 23
y probar su resistencia
al desgaste. Los niveles 2 100 a 150 15
(k) de desgaste y las
frecuencias en cada 3 150 a 200 36
nivel se muestran a 4 200 a 250 24
continuación:
Un experimento multinomial
• Generaliza un experimento binomial al permitir
que cada intento resulte en uno de k posibles
resultados, donde k > 2.
Ejemplo 1
La frecuencias Desgaste
Niv. O
obtenidas con la mgr/Kg
muestra se denominan
frecuencias 1 50 a 100 23
Observadas (O).
2 100 a 150 15
3 150 a 200 36
4 200 a 250 24
98
Un experimento multinomial
• Si el experimento consiste en seleccionar n individuos u objetos
de una población y clasificar cada uno, entonces pi es la
proporción de la población que cae en la i-ésima categoría

Ejemplo Las frecuencias


para la población se Desgaste Prop. de
Niv.
pueden obtener mgr/Kg Neumáticos
utilizando los pi .
1 50 a 100 p1

E1 = n*p1. 2 100 a 150 p2


E2 = n*p2. 3 150 a 200 p3
....
4 200 a 250 p4
Pruebas de bondad
de ajuste
Pruebas con experimentos multinomiales
Condiciones de una Prueba de Bondad
de ajuste:
• La muestra es aleatoria simple.
• Se tiene k categorías en las que se puede clasificar cada uno de
los elementos de una población.
• El Valor Crítico (VC) se toma de la tabla IV con nivel de
significancia α y gl = K – 1.
• Se tiene una frecuencia esperada en cada categoría E ≥ 5.
• Las frecuencias esperadas se obtienen de E=npi
• El estadístico de prueba se calcula de:
𝑂−𝐸 2
χ2 = σ
𝐸
Prueba de Bondad de Ajuste

• Ejemplo
• Las frecuencias para la Desgaste
Cat. E
población se pueden mgr/Kg
obtener utilizando los pi . 1 50 a 100 E1=n*p1
2 100 a 150 E2=n*p2
• Las frecuencias Hipotéticas 3 150 a 200 E3=n*p3
en la población se
4 200 a 250 E4=n*p4
denominan frecuencias
esperadas E
9.2. Prueba de Bondad de Ajuste
• La hipótesis nula de interés especificará el valor de cada pi. Por ejemplo, en el caso de k
= 4, se podría tener:
• p1 = 0.3, p2 = 0.3, p3 = 0.2, p4 = 0.2. Las que se nombran como frecuencias
• La hipótesis alternativa indicará que al menos una de la pi tiene un valor diferente de lo
expresado por H0

Ejemplo 9.1
El planteamiento de las hipótesis se pueden plantear como:

H0: O = E: p1 = 0.3; p2 = 0.3; p3 = 0.2; p4 = 0.2


H1: O ≠ E: Por lo menos una de las proporciones es diferente.

H0: O = E: Los datos se ajustan a la distribución esperada.


H1: O ≠ E: Los datos no se ajustan a la distribución esperada.
Prueba de Bondad de Ajuste

• Ejemplo Resistencia de neumáticos:


Se tienen una muestra de un
neumáticos para realizar un Desgaste N° de
Niv.
experimento y probar su resistencia al mgr/Kg Neumáticos
desgaste. Los niveles (k) de desgaste
y las frecuencias en cada nivel se
1 50 a 100 23
muestran a continuación. Según el
fabricante la distribución de las
resistencias sigue un patrón como: 2 100 a 150 15
p1 = 0.3, p2 = 0.3, p3 = 0.2, p4 = 0.2.
• Al nivel de 5% pruebe que las 3 150 a 200 36
resistencias se ajustan al patrón
propuesto por el fabricante. 4 200 a 250 24
Prueba de Bondad de Ajuste
Ejemplo
La solución utiliza el procedimiento de prueba de hipótesis de cinco pasos que es la
siguiente:
• Parámetro de interés: Los parámetros de interés son p1, p2, p3, p4, las frecuencias de
cada uno de los k =4 niveles respectivamente, y queremos saber si p1 = 0.3, p2 = 0.3, p3
= 0.2, p4 = 0.2
Prueba de Bondad de Ajuste
Ejemplo 1
La solución utiliza el procedimiento de prueba de hipótesis de cinco pasos que es
la siguiente:
• Parámetro de interés: Los parámetros de interés son p1, p2, p3, p4, las
frecuencias de cada uno de los k =4 niveles respectivamente, y queremos
saber si p1 = 0.3, p2 = 0.3, p3 = 0.2, p4 = 0.2
• Hipótesis:
• H0: O = E: p1 = 0.3, p2 = 0.3, p3 = 0.2, p4 = 0.2
• H1: O ≠ E: El patrón expresado por el fabricante no se cumple
𝑂−𝐸 2
• Estadístico de la prueba: La estadística de la prueba es: 𝑥2 =σ
𝐸
• Regla de decisión: Rechace H0 si el x2 es mayor que el VC al nivel de
significancia de α y gl = K - 1
• Conclusión.
Prueba de Bondad de Ajuste
• Ejemplo
Regla de decisión:
H0: O = E: p1 = 0.3, p2 = 0.3, p3 = 0.2, p4 = 0.2
H1: O ≠ E: El patrón expresado por el fabricante no se cumple
Estadístico de la prueba: La estadística de la prueba es:

Desgaste
Cat. O n*p E
mgr/Kg
1 50 a 100 23

2 100 a 150 15

3 150 a 200 36

4 200 a 250 24
𝑂−𝐸 2
98 = 𝑥2 = σ
𝐸
Prueba de Bondad de Ajuste
• Ejemplo
Regla de decisión:
H0: O = E: p1 = 0.3, p2 = 0.3, p3 = 0.2, p4 = 0.2
H1: O ≠ E: El patrón expresado por el fabricante no se cumple
 = 0.05
Estadístico de la prueba: La estadística de la prueba es: gl = 4 – 1= 3

Desgaste 𝑂−𝐸 2
Cat. O n*p E 9.488
mgr/Kg 𝐸
1 50 a 100 23

2 100 a 150 15

3 150 a 200 36

4 200 a 250 24
𝑂−𝐸 2
98 = 𝑥2 = σ
𝐸
Prueba de Bondad de Ajuste
• Ejemplo
Regla de decisión:
H0: O = E: p1 = 0.3, p2 = 0.3, p3 = 0.2, p4 = 0.2
H1: O ≠ E: El patrón expresado por el fabricante no se cumple
 = 0.05
Estadístico de la prueba: La estadística de la prueba es: gl = 4 – 1= 3

Desgaste 𝑂−𝐸 2
Cat. O n*p E
mgr/Kg 𝐸 7.815
1 50 a 100 23 0.3(98) = 29.4 1.393
2 100 a 150 15 0.3(98) = 29.4 7.053
3 150 a 200 36 0.2(98) = 19.6 13.722
4 200 a 250 24 0.2(98) = 19.6 0.988
𝑂−𝐸 2
98 98 23.156 = 𝑥2 =σ
𝐸
Prueba de Bondad de Ajuste
• Ejemplo
Regla de decisión:
H0: O = E: p1 = 0.3, p2 = 0.3, p3 = 0.2, p4 = 0.2
H1: O ≠ E: El patrón expresado por el fabricante no se cumple
 = 0.05
Estadístico de la prueba: La estadística de la prueba es: gl = 4 – 1= 3

Desgaste 𝑂−𝐸 2
Cat. O n*p E
mgr/Kg 𝐸 7.815
1 50 a 100 23 0.3(98) = 29.4 1.393
2 100 a 150 15 0.3(98) = 29.4 7.053
3 150 a 200 36 0.2(98) = 19.6 13.722
4 200 a 250 24 0.2(98) = 19.6 0.988
𝑂−𝐸 2
98 98 23.156 = =σ 𝑥2
𝐸
Conclusión: No existe evidencia para probar que las resistencias se ajustan al patrón propuesto
por el fabricante.
Bondad de ajuste a
una distribuciones
Discretas y
Continuas
Pruebas con experimentos multinomiales.
Bondad de ajuste: Distribuciones Discretas y
Continuas
• La prueba ji cuadrada también se puede usar para probar si la
muestra proviene de una familia especificada de distribuciones
continuas, como es el caso de la familia binomial, de Poisson,
exponencial, o la familia normal.

• H0: O=E: La distribución de la población es . . . .


• H1: O≠E: La distribución de la población no es . . . .

• Los valores pi se deben hallar usando las distribuciones


correspondientes.
Bondad de ajuste: Distribuciones Discretas y
Continuas
• El artículo “Nonbloated Burned Clay Aggregate Concrete” (J.
Materials, 1972: 555-563) publica los siguientes datos sobre resistencia
flexional de 7 días, de muestras de concreto con agregado de arcilla
quemada sin curar (en libras por pulgada cuadrada psi):

257 327 317 300 340 340 343 374 377 386

383 393 407 407 434 427 440 407 450 440

456 460 456 476 480 490 497 526 546 700

• Pruebe al nivel 0.10 para determinar si la resistencia flexional es una


variable distribuida normalmente con media de 420psi y desviación
estándar de 86,3.
Bondad de ajuste a distribuciones
Discretas y Continuas
Ejemplo

•La solución utiliza el procedimiento de prueba de


hipótesis de cinco pasos que es la siguiente:
1. Hipótesis:
• H0: O = E: La población tiene una distribución normal
de u=420psi y desviación estándar de σ=86,3.
H1: O ≠ E: La población no tiene una distribución
normal.
• Se podría generalizar el uso de la prueba Chi Cuadrada
para distribuciones discretas como la binomial y la
Poisson
Proceso de la Prueba de Bondad de
ajuste:
Ho: O = E, La población sigue o se ajusta a la
distribución …….
H1: O ≠ E La población no sigue o no se ajusta la
distribución ………
El estadístico de prueba se calcula de:

𝑂−𝐸 2
χ2 = σ
𝐸

E=npi, la probabilidad pi se obtiene de la distribución


de probabilidad especificada.
Proceso de la Prueba de Bondad de
ajuste:
La prueba es de una cola a la derecha.
El valor crítico o valor-p con la distribución χ2
El Valor Crítico (VC) con nivel de significancia α y gl
= K – 1.
Se calcula el valor-p
EJEMPLO DE BINOMIAL
• El trabajo de explotación de un yacimiento se realiza en
tres turnos cada día. El resultado de la extracción se
califica de Excelente (1), Bueno (2), Regular (3) o
Deficiente (4) Muy deficiente (5). Se toma una muestra de
600 turnos y se obtiene la siguiente distribución:
nivel 1 2 3 4 5
Nro. de 46 119 225 158 52
turno

• Pruebe que la distribución se ajusta a una distribución


binomial con una probabilidad p = 0.615.
Estadística Aplicada

Prueba de
Independencia chi
cuadrado
Diferencias entre Independencia y homogeneidad:

• Ahora se estudiaran problemas en los que los datos también están formados
por cantidades o frecuencias, pero la tabla de información ahora tendrá I filas
(i ≥ 2) y J columnas (j > 2) , por tanto ij celdas. Hay dos situaciones que por lo
general se encuentran y en las que se muestran los datos:

Las poblaciones de interés,


Hay una sola población de interés, con
correspondientes a cada fila de la
cada individuo de la población
tabla, y cada población está dividida
clasificado con respecto a dos
en las mismas J categorías de las
factores(filas y columnas) diferentes.
columnas. Nos interesa si la distribución
Nos interesa saber si el factor en las
de las poblaciones i son iguales en
filas i se relaciona de alguna manera
todas las columnas j.
con el factor de columnas j.

Prueba de Homogeneidad Prueba de Independencia


Condiciones de una Prueba de Bondad de ajuste:
• Ahora se estudiarán problemas en los que los datos también están formados por
cantidades o frecuencias, pero la tabla de información ahora tendrá I filas (I ≥ 2) y J (J > 2)
columnas, por tanto, IJ celdas. Hay dos situaciones que por lo general se encuentran y en
las que se muestran los datos:

Una compañía empaca un producto particular La Ford Motor Company opera una planta de
en latas de tres tamaños diferentes. La mayor ensamble en Dearborn, Michigan. La planta
parte de las latas se apegan a especificaciones, opera tres turnos. El gerente de control de
pero un ingeniero de control de calidad ha calidad quiere comparar el nivel de calidad en
identificado los siguientes errores: Defecto en los tres turnos. Los vehículos se clasifican por su
lata, Grieta en lata, Ubicación incorrecta de nivel de calidad (aceptable, inaceptable) y por
arillo y otros. ¿Sugiere la información que las turno (matutino, vespertino, nocturno). ¿Hay
proporciones que caen en las diversas alguna diferencia en el nivel de calidad en los
categorías de fuera tres turnos? Es decir, ¿está relacionada la
de especificación son iguales para las tres calidad del producto con el turno donde se
líneas? fabricó?

Prueba de Homogeneidad Prueba de Independencia


Planteamiento de hipótesis:

De prueba de Independencia
H0: O = E; La variable de filas es independiente de la
variable de columnas.
H1: O ≠ E: Las variables no son independientes, relacionan
de alguna manera.
De prueba de Homogeneidad
H0: O = E; Las poblaciones en las filas son homogéneas
H1: O ≠ E: Las poblaciones no son homogéneas con
respecto a las categorías.
Tabla de contingencia:

Se tienen “i” filas ≥ 2 y “j” columnas en las que


se puede clasificar cada uno de los elementos
de una población.
Variable B
1 2 3 ... j
1 a11 a12 a13 ... a1j
Variable A

2 a21 a22 a23 ... a2j


3 a31 a32 a33 ... a3j
... ... ... ... ... ...
i ai1 ai2 ai3 ... aij
Estadístico de prueba:

El estadístico de prueba es:


𝑂−𝐸 2
χ2 = σ
𝐸

Las frecuencias esperadas (E) se calculan de:


(𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑜𝑙𝑢𝑚𝑛𝑎)(𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑓𝑖𝑙𝑎)
E=
𝑇𝑜𝑡𝑎𝑙
Ejemplo de prueba de Independencia:
La Ford Motor Company opera una planta de ensamble en Dearborn, Michigan. La
planta opera tres turnos. El gerente de control de calidad quiere comparar el nivel de
calidad en los tres turnos. Los vehículos se clasifican por su nivel de calidad (aceptable,
inaceptable) y por turno (matutino, vespertino, nocturno). ¿Hay alguna diferencia en el
nivel de calidad en los tres turnos? Es decir, al nivel del 5% de significancia ¿está
relacionada la calidad del producto con el turno donde se fabricó? Los datos siguientes
pertenecen a una muestra de 87 unid.

Nivel de Calidad
Inaceptabl Total de
Aceptable
e Filas
1 12 14 26
Turno 2 18 23 41
3 6 14 20
Total 36 51 87
Ejemplo de prueba de Independencia:
(Continuación)

Planteamiento de Hipótesis
H0: O = E; La calidad del producto es
independiente del turno donde se fabricó:
H1: O ≠ E: La calidad del producto no es
independiente del turno donde se fabricó.
(Calidad y turno se relacionan o son
dependientes).
Ejemplo de prueba de Independencia:
(Continuación)

Calculo de estadístico de la prueba: La


estadística de la prueba es: Inaceptabl Total de
Aceptable
e Filas
 = 2
1 12 14 26
𝑂−𝐸 2 Turno 2 18 23 41
σ 3 6 14 20
𝐸
Total 36 51 87

Realizamos una tabla para los valores Esperados (E)


Aceptabl Inacepta Total de Aceptabl Inacepta Total de
e ble Filas e ble Filas
1 26 1 10,759 15,241 26
(36)(26)
Turno 87 Turno 2 16,966 24,034 41
2 41
3 20 3 8,276 11,724 20
Total 36 51 87 Tota
36 51 87
l
Ejemplo de prueba de Independencia:
(Continuación)

Realizamos el cálculo de x2:

12 − 10,759 2 14 − 15,241 2
+
10,759 15,241
2 2
 =
2 +
18 − 16,966
+
23 − 24,034 2
16,966 24,034 =1,419
6 − 8,276 2 14 − 11,724 2
+ +
8,276 11,724
Ejemplo de prueba de Independencia:
(Continuación)

Punto crítico:
Si α = 0,05 y gl = (f-1)(c-1) = (2)(1) = 2 2 0,05;2 = 5,991.
Regla de decisión:

 2 =1,419  2 0,05;2 = 5,991

Decisión
Por tanto no se rechaza H0 dado que 2 calculado es menor que el 2 0,05;6
Conclusión: Existe evidencia suficiente para probar que la calidad del producto es
independiente del turno donde se fabricó. Es decir Calidad y turno no se relacionan
Ejemplo de prueba de Homogeneidad:

Una compañía empaca un producto particular en latas de tres tamaños diferentes. La


mayor parte de las latas se apegan a especificaciones, pero un ingeniero de control de
calidad ha identificado los siguientes errores: Defecto en lata, Grieta en lata, Ubicación
incorrecta de arillo y otros. ¿Sugiere la información que las proporciones que caen en las
diversas categorías de fuera de especificación son iguales para las tres líneas? Realice una
prueba al nivel del 5% de significancia si se tiene una muestra de 321 con fallas clasificadas
según la tabla siguiente

Razón de falla
Tamaño
Defecto Grieta Ubicación Otros
muestral
1 34 65 17 13 129
Línea de
2 23 52 25 6 106
Producción
3 32 28 16 10 86
Total 89 145 58 29 321
Ejemplo de prueba de Homogeneidad:
(Continuación)

Planteamiento de Hipótesis
H0: O = E; las proporciones que caen en las
diversas categorías de fuera de especificación
son homogéneas (iguales) para las tres líneas
H1: O ≠ E; las proporciones que caen en las
diversas categorías de fuera de especificación
son no homogéneas (diferentes ) para las tres
líneas
Ejemplo de prueba de Independencia:
(Continuación)

Calculo del Estadístico de la prueba: La estadística de


la prueba es:
Tamaño
Defecto Grieta Ubicación Otros
muestral
1 34 65 17 13 129
𝑂−𝐸 2
2 = σ 𝐸
2
3
23
32
52
28
25
16
6
10
106
86
Total 89 145 58 29 321

Realizamos una tabla para los valores Esperados (E)


Tamaño
Defecto Grieta Ubicación Otros
muestral
1 (89)(129) 129
321
2 106
3 86
Total 89 145 58 29 321
Ejemplo de prueba de Independencia:
(Continuación)

Ubicació Tamaño
Defecto Grieta Otros
n muestral
1 34 65 17 13 129
2 23 52 25 6 106
3 32 28 16 10 86
Total 89 145 58 29 321

Valores Esperados (E)

Ubicaci Tamaño
Defecto Grieta Otros
ón muestral
1 35.766 58.271 23.308 11.654 129
2 29.389 47.882 19.153 9.576 106
3 23.844 38.847 15.539 7.769 86
Total 89 145 58 29 321
Ejemplo de prueba de Independencia:
(Continuación)

Realizamos el cálculo de x2:

34 − 35,766 2 65 − 58,274 2 17 − 23,308 2 13 − 11,654 2


+ + +
35,667 58,274 23,308 11,654
2 2 2
23 − 29,389 52 − 47,882 25 − 19,153 6 − 9,576 2
2= +
29,389
+
47,882
+
19,153
+
9,576
2 2 2
28 − 23,844 28 − 38,847 16 − 15,539 10 − 7,769 2
+ + + +
23,844 38,847 15,539 7,769

 2 =14,063
Ejemplo de prueba de Independencia:
(Continuación)

Regla de decisión: Si α = 0,05 y gl = (f-1)(c-1) = (2)(3) = 6


 2 0,05;6 = 12,592.

 2 0,05;2 =
12,592  2 =14,063

Por tanto, se rechaza H0 dado que 2 es mayor que el 2 0,05;6

Conclusión: Existe evidencia suficiente para probar que las líneas de


producción son homogéneas con respecto a las cinco categorías de
falla.

También podría gustarte