Documentos de Académico
Documentos de Profesional
Documentos de Cultura
XI
PRUEBAS DE BONDAD DE AJUSTE E
INDEPENDENCIA
1. Introducción
Muchas veces, los resultados obtenidos de muestras no siempre
concuerdan exactamente con los resultados teóricos esperados, según
las reglas de probabilidad. Por ejemplo, aunque consideraciones
teóricas conduzcan a esperar 50 caras y 50 sellos cuando se lanza 100
veces una moneda bien hecha, es raro que se obtengan exactamente
estos resultados.
Supóngase que en una determinada muestra se observan una serie
de posibles sucesos E1 , E 2 , E3 ,..., E k , que ocurren con frecuencias
O1 , O2 , O3 ,..., OK , llamadas frecuencias observadas y que, según las
reglas de probabilidad, se espera que ocurran con frecuencias
1, E
E 2, E
3 ,..., E
k , llamadas frecuencias teóricas o esperadas.
2 2 2 2
2 (O1 E1 ) (O2 E 2 ) (O3 E 3 ) ... (Ok E k )
1
E 2
E 3
E k
E
2
k
j
Oj E
2
j 1
j
E
Donde:
O j Frecuencia observada.
j Frecuencia esperada.
E
Si el total de frecuencias es N, entonces O E
j j
N
Observaciones:
Si 0, las frecuencias observadas y esperadas concuerdan
2
próxima a cero debe mirarse con cierto recelo, puesto que es raro que
Pruebas de bondad de ajuste e independencia 709
las frecuencias observadas concuerden demasiado bien con las
esperadas. Para examinar tales situaciones, se puede determinar si el
valor calculado de es menor que las 2 críticas o de tabla (ensayo
2
Solución
Ensayo de hipótesis:
H 0 : Las frecuencias observadas y esperadas son significati-
vamente iguales (dado bien hecho).
H 1: Las frecuencias observadas y esperadas son diferentes (dado
cargado).
Primero se procede a calcular los valores esperados. Como es bien
sabido por todos la probabilidad de obtener cualquier número en un
dado no cargado es de 1/6. Como la suma de los valores observados es
de 120, se multiplica este valor por 1/6 dando un resultado de 20 para
cada clasificación.
Cara 1 2 3 4 5 6 Total
Frecuencia observada 25 17 15 23 24 16 120
Frecuencia esperada 20 20 20 20 20 20
Grados de libertad = k – 1 – m = 6 – 1– 0 = 5
No se tuvo que calcular ningún parámetro para obtener las
frecuencias esperadas, es por ello que m toma el valor 0.
710 Estadística para Administración y Economía
Z.
Z. Rechazo
rechazo
Z. Aceptación
Z. aceptación 0.05
2(5,
2
5,0.05
0.05)
11.1
11.07 v2
Regla de decisión:
Rechazar H 0 si 11.07
2
Valor de prueba:
O E
2
k
2 j
j
j 1
j
E
2 25 20 17 20 15 20
2 2 2
20 20 20
23 20 24 20 16 20
2 2 2
5
20 20 20
Como 5 es menor que 11.07 se acepta H0 y se concluye, con una
significación de 0.05, que el dado está bien hecho.
Ejemplo 2
Una encuesta sobre 320 familias con 5 niños dio la distribución
que aparece en la siguiente tabla. ¿Es el resultado consistente con la
hipótesis de que el nacimiento de un varón y una mujer son igualmente
posibles? Emplee 0.05
Número de niños 5 4 3 2 1 0
Número de niñas 0 1 2 3 4 5
Número de familias 18 56 110 88 40 8
Solución
Ensayo de hipótesis:
H 0: El nacimiento de niños y niñas es igualmente probable.
H1: El nacimiento de niños y niñas no es igualmente probable.
Pruebas de bondad de ajuste e independencia 711
Este experimento tiene un comportamiento binomial, puesto que
se tienen dos posibles resultados y la probabilidad de éxito se mantiene
constante en todo el experimento.
Se le llamará éxito al nacimiento de un varón o niño. Por lo que la
variable aleatoria "X" tomará valores desde 0 hasta 5.
Como se quiere ver si es igualmente probable el nacimiento de
niños y niñas, la probabilidad de éxito será de 0.5.
Utilizando la fórmula de la distribución binomial se calcularán las
probabilidades, que multiplicadas por el número total de familias nos
darán los valores esperados en cada clasificación.
Recordando la fórmula de la distribución binomial:
C xn p x q n x
Donde:
n = 5 y "x" es el número de niños.
Probabilidad de 5 niños y 0 niñas = C55 (0.5) 5 (0.5) 0 0.031
Probabilidad de 4 niños y 1 niña = C 45 (0.5) 4 (0.5)1 0.156
Probabilidad de 3 niños y 2 niñas = C 35 (0.5) 3 (0.5) 2 0.313
Probabilidad de 2 niños y 3 niñas = C 25 (0.5) 2 (0.5) 3 0.313
Probabilidad de 1 niño y 4 niñas = C15 (0.5)1 (0.5) 4 0.156
Probabilidad de 0 niños y 5 niñas = C 05 (0.5) 0 (0.5) 5 0.031
Si cada una de estas probabilidades se multiplica por 320 se
obtienen los valores esperados:
Número de niños 5 4 3 2 1 0
Total
Número de niñas 0 1 2 3 4 5
Número de familias 18 56 110 88 40 8 320
Frecuencias esperadas 10 50 100 100 50 10
Z.Z.Rechazo
rechazo
Z.aceptación
Z. Aceptación 0.05
2(5,
2
11.1
0.05)
5,0.05
11.07 v2
712 Estadística para Administración y Economía
Grados de libertad: k – 1 – m = 6 – 1– 0 = 5
Regla de decisión:
Rechazar H 0 si 11.07
2
Valor de prueba:
O E
2
k j
2 j
j 1
j
E
2 2 2
2
18 10
56 50
110 100
10 50 100
2 2 2
88 100
40 50
8 10 12
100 50 10
Como 12 y es mayor que 11.07, se rechaza H0 y se
2
Número (frecuencia
de caras observada)
0 38
1 144
2 342
3 287
4 164
5 25
Total 1000
Se pude afirmar que el número de caras sigue una distribución
binomial con un nivel 0.05 .
Solución
Planteamiento de hipótesis:
H 0 : Los datos se ajustan a una distribución binomial.
H 1 : Los datos no se ajustan a una distribución binomial.
Para obtener los valores esperados se tiene que utilizar la fórmula
de la distribución binomial: C xn p x q ( n x ) , donde n en este ejemplo vale 5,
p y q son las probabilidades respectivas de cara y sello en un solo
lanzamiento de la moneda. Para calcular el valor de p, se sabe que
np en una distribución binomial, por lo que 5 p .
Para la distribución de frecuencias observadas, la media del
número de caras es:
38(0) 144(1) 342(2) 287(3) 164(4) 25(5)
1000
2.47
2.47
Por lo tanto, p 0.494. Así pues, la distribución
5 5
binomial ajustada viene dada por: p ( x) C x5 (0.494) x (0.506)(5 x )
Al seguir esta fórmula se calcula la probabilidad de obtener caras,
según el valor de la variable aleatoria. La probabilidad multiplicada por
1000 nos dará el valor esperado. Se resumen los resultados en la tabla
siguiente:
714 Estadística para Administración y Economía
0 0.0332 33.2 38
1 0.1619 161.9 144
2 0.3162 316.2 342
3 0.3087 308.7 287
4 0.1507 150.7 164
5 0.0294 29.4 25
Para los grados de libertad el valor de m será uno, ya que se tuvo
que estimar la media de la población para poder obtener el valor de p y
así poder calcular los valores esperados.
Grados de libertad: k – 1– m = 6 – 1 – 1 = 4
Z.
Z. Rechazo
rechazo
Z.
Z. aceptación
Aceptación 0.05
(2424,0.05
, 0 .0 5 )
9.49
9 .4 9 v2
Regla de decisión:
Rechazar H 0 si 9.49
2
Valor de prueba:
2
k O j
E
2
j
j 1
j
E
8.487
308.7 150.7 29.4
Como 8.487 es menor que 9.49, se acepta H 0 y se concluye, con
un 0.05, que el ajuste de los datos a una distribución binomial es
bueno.
Pruebas de bondad de ajuste e independencia 715
2.3.2. Distribución de Poisson
Veamos ahora, a través de un ejemplo, la prueba de bondad de
ajuste para ver si una variable aleatoria sigue una distribución de
Poisson; igual que en el caso de la binomial m toma el valor 1 ya que
hay que estimar para el cálculo de las frecuencias esperadas.
Ejemplo 4
Se propone que el número de defectos en las tarjetas de circuito
impreso sigue una distribución de Poisson. Se reúne una muestra
aleatoria de 60 tarjetas de circuito impreso y se observa el número de
defectos. Los resultados obtenidos son los siguientes:
Número de Frecuencia
defectos observada
0 32
1 15
2 9
3 ó más 4
¿Muestran estos datos suficiente evidencia para decir que
provienen de una distribución de Poisson? Haga la prueba de bondad de
ajuste con un 0.05.
Solución
H 0: La forma de la distribución de los defectos es de Poisson.
H1: La forma de la distribución de los defectos no es de Poisson.
La media de la distribución de Poisson propuesta en este ejemplo
es desconocida y debe estimarse a partir de los datos contenidos en la
muestra.
32(0) 15(1) 9(2) 4(3)
0.75
60
A partir de la distribución de Poisson con parámetro 0.75, pueden
calcularse las probabilidades asociadas con el valor de X. Esto es, la
fórmula de Poisson es:
e x e0.75 (0.75) x
p( x) p( x)
x! x!
Con esta fórmula se calculan las probabilidades, las mismas que
se multiplican por 60 para obtener los valores esperados:
716 Estadística para Administración y Economía
0 0.472 28.32 32
1 0.354 21.24 15
2 0.133 7.98 9
3 ó más 0.041 2.46 4
Puesto que la frecuencia esperada en la última celda es menor que
5, se combinan las dos últimas celdas:
Número de Frecuencia Frecuencia
defectos esperada observada
0 28.32 32
1 21.24 15
2 ó más 10.44 13
Z.
Z. Rechazo
rechazo
Z. aceptación
Aceptación 0.05
21,0.05
(1, 0 .0 5) 3.84
2
3 .8 4 v2
Regla de decisión:
Rechazar H 0 si 3.84
2
Valor de prueba:
2 32 28.32 15 21.24 13 10.44 2.94
2 2 2
Media ( x ) 3.0928571
Desviación ( ) 0.8017837
16
14
12
10
0
1.7 2.2 2.7 3.2 3.7 4.2 4.7
0.2451
0.2451
0.0764
0.0764 0.2167
0.2167
0.1355
0.1355 0.1863
0,1863 0.1400
0.1400
Z.
Z.Rechazo
rechazo
Z.
Z. Aceptación
aceptación 0.05
2
(3,
3,0.05
0.05 ) 7.81
7.8 1 v2
Regla de decisión:
Rechazar H 0 si 7.81
2
Valor de prueba:
O E
2
k j
2
j
j 1
j
E
5 4.28 8 7.52 10 12.21
2 2 2
2
4.28 7.52 12.21
15 13.59 10 10.39 8 7.97
2 2 2
13.59 10.39 7.97
0.71
2
Z.
Z. Rechazo
rechazo
0.10
Z.Z.Aceptación
aceptación
2(2,0.10
2 v2
) 4.61
2 , 0 .10 4.61
Regla de decisión:
Rechazar H 0 si 4.61
2
Valor de prueba:
O E
2
k
2 j j
j 1
j
E
78.90 25.62
7.03
2
3. Tablas de contingencia
En muchas ocasiones, los n elementos de una muestra tomada de
una población pueden clasificarse con dos criterios diferentes. Por
tanto, es interesante saber si los dos métodos de clasificación son
estadísticamente independientes. Supóngase que el primer método de
clasificación tiene r niveles, y que el segundo tiene c niveles. Sea Oi j
la frecuencia observada para el nivel i del primer método de
clasificación y el nivel j del segundo método de clasificación. En
general, los datos aparecerán como se muestra en la siguiente tabla.
Una tabla de este tipo usualmente se conoce como tabla de
contingencia r x c.
Columnas
1 2 ... c
1 O11 O12 ... O1c
2 O21 O22 ... O2c
Filas . . . . .
. . . . .
. . . . .
r Or1 Or2 ... Orc
El interés recae en probar la hipótesis de que los dos métodos de
clasificación renglón-columna son independientes. Si se rechaza esta
hipótesis, entonces, se concluye que existe alguna interacción entre los
dos criterios de clasificación. Los procedimientos de prueba exactos
son difíciles de obtener, pero puede obtenerse un estadístico de prueba
aproximado, válido para n grande.
Sea pi j la probabilidad de que un elemento seleccionado al azar
caiga en la ij-ésima celda, dado que las dos clasificaciones son
independientes. Entonces, pi j ui v j donde ui es la probabilidad de que
un elemento seleccionado al azar pertenezca al renglón de la clase i, y
v j es la probabilidad de que un elemento seleccionado pertenezca a la
columna de la clase j. Ahora bien, si se supone independencia, los
estimadores de ui y v j son:
1 c 1 r
ui Oi j
n j 1
vj Oi j
n i 1
724 Estadística para Administración y Economía
Ejemplo 7
Una asociación de profesores universitarios quiere determinar si
la satisfacción en el trabajo es independiente del rango académico. Para
ello se realizó un estudio nacional entre los académicos universitarios y
encontró los resultados mostrados en la tabla siguiente. Con 0.05,
haga una prueba para saber si son dependientes la satisfacción en el
trabajo y el rango.
Rango
Profesor Profesor Profesor Profesor
asistente auxiliar asociado principal
Mucha 40 60 52 63
Satisfacción
en el trabajo Regular 78 87 82 88
Poca 57 63 66 64
Solución
Planteamiento de las hipótesis
H 0: La satisfacción en el trabajo y el rango son independientes.
H1: La satisfacción en el trabajo y el rango no son independientes.
Pruebas de bondad de ajuste e independencia 725
Z.Z.Rechazo
rechazo
Z. aceptación
Z. Aceptación 0.05
2(6,
2
12.59
0.05)
6,0.05
12.59 v2
Regla de decisión:
Rechazar H 0 si 12.59
2
Regular 78 87 82 88 335
Poca 57 63 66 64 250
Total 175 210 200 215 800
i j Ri C j
E
n
11 215 175 47.03
E E 21
335175 73.28
800 800
12 215 210 56.44
E 2 2 335 210 87.94
E
800 800
13 215 200 53.75
E 23 335 200 83.75
E
800 800
726 Estadística para Administración y Economía
Tabla de frecuencias esperadas:
Rango
Profesor Profesor Profesor Profesor
Total
asistente auxiliar asociado principal
Valor de prueba:
O
2
r c i j
E
2
ij
i 1 j 1
i j
E
40 47.03 60 56.44
2 2
2
47.03 56.44
52 53.75 64 67.19
2 2
...
53.75 67.19
2.752
Solución
H 0: La proporción de artículos defectuosos es la misma para los
tres turnos.
H1: La proporción de artículos defectuosos no es la misma para
los tres turnos.
Grados de libertad: r 1 c 1 2 1 3 1 2
Z. rechazo
Z. Rechazo
Z.
Z. aceptación
Aceptación 0.025
(222,0.025 )7.38 v2
2
, 0 .025 7.38
Regla de decisión:
Rechazar H 0 si 7.38
2
i j Ri C j
E
n
11 170 950 56.97
E
2835
i 1 j 1
i j
E
2
...
56.97 56.7 56.33 883.67
6.26
2
EJERCICIOS RESUELTOS
1. Se sabe que en un centro de enseñanza primaria, el 62% de los
estudiantes de último año dejan de estudiar, el 23% pasan a
formación profesional y el 15% pasan a enseñanza secundaria. Se
toma una muestra de 80 de estos estudiantes que finalizaron el año
pasado. De ellos, 54 dejaron de estudiar, 17 se pasaron a formación
profesional. Contrastar la hipótesis nula de que los datos muestrales
del año pasado concuerda con las estadísticas de años anteriores.
Solución
n 80
H 0: Los porcentajes del año pasado son los mismos que en años
anteriores.
H1: Los porcentajes del año pasado no son los mismos que en
años anteriores.
Bajo esta hipótesis nula tenemos:
Condición del Frecuencia Frecuencia
Probabilidad
estudiante esperada observada
Deja de estudiar 0.62 49.6 54
Pasa a form. prof. 0.23 18.4 17
Pasa a ens. sec. 0.15 12 9
Total 1 80 80
g.l. k 1 m 3 1 0 2
Z. rechazo
Z. Rechazo
Z. aceptación
Z. Aceptación 0.05
(2222,0.05
, 0 .0 5)
5.99
5 .9 9 v2
Regla de decisión:
Rechazar H 0 si 5.99
2
730 Estadística para Administración y Economía
Valor de prueba:
O E
2
k j
2
j
j 1
j
E
54 49.6 17 18.4
2 2 2
(9 12)
2
1.247
49.6 18.4 12
Al resultar 1.247 el valor de prueba, entonces se acepta H 0 y se
concluye, con un 0.05, que los porcentajes del año pasado
son los mismos que en años anteriores.
2. A una muestra aleatoria de 30 periodistas deportivos se les pidió
que dijeran cuál de entre tres licenciados en educación física tenía
mejores posibilidades futuras. Estos tres licenciados venían,
respectivamente, de una urbanización donde viven muchos
miembros de la alta sociedad, de un barrio marginal y de una zona
de nivel de vida medio. La siguiente tabla muestra cuales fueron las
opiniones. Contrastar la hipótesis nula de que las posibilidades eran
las mismas para los tres licenciados.
Opiniones a favor 12 11 7
Solución
n 30
H 0: Las posibilidades son las mismas para los tres licenciados.
H1: Las posibilidades no son las mismas para los tres licenciados.
Bajo esta hipótesis nula tenemos:
Frecuencia Frecuencia
Nivel Probabilidad
esperada observada
Alta sociedad 1/3 10 12
Barrio marginal 1/3 10 11
Clase media 1/3 10 7
g.l. k 1 m 3 1 0 2
Pruebas de bondad de ajuste e independencia 731
Z.
Z. Rechazo
rechazo
Z. aceptación
Z. Aceptación 0.05
(2222,0.05 55.99
, 0 .0 5 ) .9 9 v2
Regla de decisión:
Rechazar H 0 si 5.99
2
Valor de prueba:
2
k j
Oj E
2
j 1
j
E
2
1.4
10 10 10
g.l. k 1 m 3 1 0 2
Z.
Z. Rechazo
rechazo
Z. Aceptación
aceptación 0.05
2(22,0.05
2 , 0 .0 5 ) 5.99
5 .9 9 v2
Regla de decisión:
Rechazar H 0 si 2 5.99
Valor de prueba:
O E
2
k j
2
j
j 1 E j
70 75 21 15 9 10
2 2 2
2
2.833
75 15 10
Como 2 2.833 se encuentra en la zona de aceptación se
concluye, con un 0.05 , que el patrón de los profesores que se
presentan a decano en Harvard es el mismo que en años anteriores.
4. Se obtuvo una muestra aleatoria de los 300 dividendos diarios de
una acción que se cotiza en bolsa. El coeficiente de asimetría
muestral fue de 0.47 y la curtosis muestral de 3.86. Contrastar la
hipótesis nula de que la distribución de la población de dividendos
diarios de esta acción sigue una distribución normal.
Solución
Una forma alternativa para determinar si un conjunto de datos se
distribuye de forma normal es mediante la Prueba de Bowman-Shelton.
Esta prueba, para contrastar la normalidad, se basa en la cercanía a cero
Pruebas de bondad de ajuste e independencia 733
del coeficiente de asimetría y en la cercanía a tres del coeficiente de
curtosis. El estadístico de contraste es:
Coeficiente de asimetría 2 Curtosis – 32
B n
6 24
La siguiente tabla muestra las diferentes relaciones entre los
tamaños muestrales y los niveles de significación. El proceso
recomendado será, pues, calcular el estadístico B y rechazar la hipótesis
nula de normalidad si dicho valor es superior al correspondiente en la
tabla:
Tamaño Significación Significación
muestral del 10% del 5%
20 2.13 3.26
30 2.49 3.71
40 2.7 3.99
50 2.9 4.26
75 3.09 4.27
100 3.14 4.29
125 3.31 4.34
150 3.43 4.39
200 3.48 4.43
250 3.54 4.51
300 3.68 4.6
400 3.76 4.74
500 3.91 4.82
800 4.32 5.46
4.61 5.99
Entonces, de acuerdo al ejercicio planteado tenemos:
H 0: Los datos se ajustan a una distribución normal.
H 1: Los datos no se ajustan a una distribución normal.
El valor del estadístico es:
0.47 2 3.86 – 32
B 300 20.4
6 24
Z. Rechazo
rechazo
Z. aceptación
Z. Aceptación 0.05
Regla de decisión:
Rechazar H 0 si 2 9.49
Valor de prueba:
O E
2
k j
2
j
j 1
j
E
16 26.2 50 53.4 51 54.2
2 2 2
2
26.2 53.4 54.2
44 36.6 28 18.6 11 11
2 2 2
10.623
36.6 18.6 11
Como 10.623 es mayor que 9.49, se rechaza H 0 y se concluye,
con un 0.05, que los datos no se ajustan a una distribución de
Poisson.
6. Se realizó una investigación para estudiar la reacción de las
empresas ante las opiniones de importantes auditores. La siguiente
tabla muestra, para empresas que habían recibido una opinión
positiva o negativa de un auditor al año siguiente. Contrastar, a un
nivel del 1%, la hipótesis nula de que el cambio de auditor por las
empresas no depende del hecho de que anteriormente dichas
empresas recibieran una opinión positiva o negativa del auditor.
Opinión recibida
Positiva Negativa
Cambiaron auditor 141 227
No cambiaron auditor 991 851
Solución
H0: El cambio de auditor de las empresas es independiente del
hecho de que anteriormente dicha empresa recibió una
opinión positiva o negativa del auditor.
736 Estadística para Administración y Economía
H1: El cambio de auditor de las empresas no es independiente del
hecho de que anteriormente dicha empresa recibió una
opinión positiva o negativa del auditor.
Grados de libertad: r 1 c 1 2 1 2 1 1
Z. Rechazo
rechazo
aceptación
Z. Aceptación 0.01
22
(1, 0 .0 1)6.63
6 .6 3 v2
1,0.01
Regla de decisión:
Rechazar H 0 si 2 6.63
Se procederá a calcular los valores esperados de cada celda.
Como los grados de libertad es 1, esto quiere decir que necesitamos
calcular únicamente una frecuencia esperada, y las faltantes se
encuentran por diferencia.
11 . Como se necesitan los totales
Se calculará el valor esperado E
de renglón y columna se mostrarán en la tabla siguiente:
Opinión recibida
Positiva Negativa Total
Cambiaron auditor 141 227 368
No cambiaron auditor 991 851 1842
Total 1132 1078 2210
R1C1
E 11
n
368 1132 188.496
E 11
2210
Opinión recibida
Positiva Negativa Total
Cambiaron auditor 188.496 179.504 368
No cambiaron auditor 943.504 898.496 1842
Total 1132 1078 2210
Pruebas de bondad de ajuste e independencia 737
Valor de prueba:
O
2
i j Ei j
r c
2
i 1 j 1
i j
E
141 188.496 227 179.504
2 2
2
188.496 179.504
991 943.504 851 898.496
2 2
943.504 898.496
29.44
2
Z. Rechazo
Z. rechazo
0.10
Z.Z.Aceptación
aceptación
22
(1, 0 .1 0 ) 2 .7 1 v2
1,0.10 2.71
738 Estadística para Administración y Economía
Regla de decisión:
Rechazar H 0 si 2 2.71
Se procederá a calcular los valores esperados de cada celda.
Como los grados de libertad es 1, esto quiere decir que necesitamos
calcular únicamente una frecuencia esperada, y las faltantes se
encuentran por diferencia.
11 .
Se calculará el valor esperado E
Como se necesitan los totales de renglón y columna se calculan y se
muestran en la tabla siguiente:
Horas de televisión por día
Menos de 2 1/2 2 1/2 o más Total
Hombre 18 10 28
Mujer 17 13 30
Total 35 23 58
28 35 16.89
R1C1 E
E 11 11
n 58
Horas de televisión por día
Menos de 2 1/2 o
Total
2 1/2 más
Hombre 16.89 11.11 28
Mujer 18.11 11.89 30
Total 35 23 58
Valor de prueba:
O
2
r c i j
E
2
ij
i 1 j 1
i j
E
18 16.89 10 11.11 17 18.11 13 11.89
2 2 2 2
2
16.89 11.11 18.11 11.89
0.35
2
Z.
Z.Rechazo
rechazo
Z.aceptación
Z. Aceptación 0.05
(232, 0 .0 5 ) 77.81
.8 1 v2
3,0.05
Regla de decisión:
Rechazar H 0 si 2 7.81
Se procederá a calcular los valores esperados de cada celda.
Como los grados de libertad son 3, esto quiere decir que necesitamos
calcular 3 frecuencias esperadas, y las faltantes se encuentran por
diferencia.
11 , E
Se calcularán los valores esperados: E 12 y E
13
Número de bebidas
Origen 0-1 2-4 5 - 10 más de 10 Total
Anglosajón 19 45 27 28 119
Hispano 25 47 29 13 114
Total 44 92 56 41 233
740 Estadística para Administración y Economía
i j Ri C j
E 119 92 46.99
E 12
n 233
119 44 13 119 56 28.60
E 11 22.47 E
233 233
Número de bebidas
Origen 0-1 2-4 5 - 10 más de 10 Total
Anglosajón 22.47 46.99 28.6 20.94 119
Hispano 21.53 45.01 27.4 20.06 114
Total 44 92 56 41 233
Valor de prueba:
2
r c i j
Oi j E
2
i 1 j 1
i j
E
19 22.47 45 46.99 27 28.6 13 20.06
2 2 2 2
2
...
22.47 46.99 28.6 20.06
6.32
2
Z. Rechazo
rechazo
Z. Aceptación
Z. aceptación 0.01
(24,
2 13.28
0.01) 13.28 v2
4,0.01
Regla de decisión:
Rechazar H 0 si 2 13.28
Se procederá a calcular los valores esperados de cada celda.
Como los grados de libertad son 4, esto quiere decir que necesitamos
calcular 4 frecuencias esperadas, y las faltantes se encuentran por
diferencia.
Se calcularán los valores esperados: E 11 , E
12 , E
13 y E
21
La siguiente tabla muestra los totales de cada fila y columna:
Fidelidad
Baja Promedio Alta Total
Baja 7 12 31 50
Selectividad Promedio 35 59 18 112
Alta 15 13 0 28
Total 57 84 49 190
50 57 15
E 50 49 12.89
E
11 13
190 190
50 84 22.11
E 112 57 33.6
E
12 21
190 190
Fidelidad
Baja Promedio Alta Total
Baja 15 22.11 12.89 50
Selectividad Promedio 33.6 49.52 28.88 112
Alta 8.4 12.38 7.22 28
Total 57 84.01 48.99 190
742 Estadística para Administración y Economía
Valor de prueba:
O
2
r c i j
E
2
ij
i 1 j 1
i j
E
7 15 12 22.11 31 12.89 0 7.22
2 2 2 2
2
...
15 22.11 12.89 7.22
2 52.74
Se rechaza H 0 a un nivel de significancia del 5%. Esto quiere
decir que: la fidelidad no es independiente de la selectividad.
10. Se pidió a una muestra de empleados en una gran planta industrial
química que indicara su preferencia por uno de tres planes de
pensión o retiro. Los resultados se presentan en la tabla que sigue.
¿Parece haber alguna relación entre el plan de pensión seleccionado
y la clasificación de trabajo de los empleados? Utilice el nivel de
significancia de 0.01.
Plan de retiro
Clases de trabajo Plan A Plan B Plan C
Supervisor 10 13 29
Oficinista 19 80 19
Obrero 81 57 22
Solución
H 0: El plan de pensión es independiente de la clasificación del
trabajo del empleado.
H1: El plan de pensión no es independiente de la clasificación del
trabajo del empleado.
Grados de libertad: r 1 c 1 3 1 3 1 4
Z.Z.rechazo
Rechazo
Z. aceptación
Z. Aceptación 0.01
(224, 0.01)13.28
13.28 v2
4,0.01
Pruebas de bondad de ajuste e independencia 743
Regla de decisión:
Rechazar H 0 si 2 13.28
Se procederá a calcular los valores esperados de cada celda.
Se calcularán los valores esperados: E 11 , E
12 , E
13 y E 21
La siguiente tabla muestra los totales de cada fila y columna:
Plan de retiro
Clases de trabajo Plan A Plan B Plan C Total
Supervisor 10 13 29 52
Oficinista 19 80 19 118
Obrero 81 57 22 160
Total 110 150 70 330
52 110 17.33
E 52 70 11.03
E
11 13
330 330
52 150 23.64
E 118 110 39.33
E
12 21
330 330
Plan de retiro
Clases de
trabajo Plan A Plan B Plan C Total
Supervisor 17.33 23.64 11.03 52
Oficinista 39.33 53.64 25.03 118
Obrero 53.33 72.73 33.94 160
Total 110 150 70 330
Valor de prueba:
O
2
r c i j
E
2
ij
i 1 j 1
i j
E
10 17.33 13 23.64 29 11.03 22 33.94
2 2 2 2
2
...
17.33 23.64 11.03 33.94
84.04
2
8 a 9 a.m. 6
9 a 10 a.m. 6
10 a 11 a.m. 20
11 a 12 p.m. 8
1 a 2 p.m. 7
2 a 3 p.m. 8
3 a 4 p.m. 19
4 a 5 p.m. 6
Utilizando la prueba de bondad de ajuste y el nivel de significancia
de 0.01, determine si los accidentes están distribuidos unifor-
memente o no durante el día. Dé una breve explicación acerca de la
conclusión.
10. Se dan las siguientes hipótesis:
H 0 : Se tiene que el 40% de las observaciones están en la categoría
A, 40% están en la B, y 20%, en la C.
H1 : Las observaciones no son como se describe en H 0 .
Se toma una muestra de 60, con los resultados que siguen:
Categoría f0
A 30
B 20
C 10
a) Enuncie la regla de decisión aplicando el nivel de significancia
de 0.01.
b) Calcule el valor de Chi-cuadrada.
c) ¿Cuál es la decisión considerando H 0?
11. Durante muchos años los funcionarios de televisión utilizaron la
guía de que 30% de la televidencia (o “audiencia”) observaba
durante una noche a la semana las emisiones de cada una de las
emisoras en el horario con más público (prime-time), y 10% veía
televisión por cable. Una muestra aleatoria de 500 televidentes,
tomada de Tampa - San Petersburgo, Florida, la noche del lunes
Pruebas de bondad de ajuste e independencia 747
pasado, reveló que en 165 hogares se sintonizaron con la compañía
afiliada de ABC, 140 con la red asociada NBC, y el resto observaba
una estación de televisión por cable. Al nivel de significancia de
0.05, ¿puede concluirse que la guía sigue siendo razonable?
12. El fabricante de un terminal de computadoras informa en su
material de publicidad que la duración media de tal dispositivo,
según uso normal, es de 6 años, con desviación estándar de 1.4
años. Una muestra de 90 unidades vendidas hace 10 años, mostró la
siguiente distribución de las duraciones. Al nivel de significancia de
0.05, ¿puede el fabricante concluir que tales tiempos están distri-
buidos normalmente?
Vida útil (años) frecuencia
Hasta 4 7
4a5 14
5a6 25
6a7 22
7a8 16
8 o mayor 6
13. Se informa que las comisiones sobre las ventas de autos nuevos,
promedian en 1500 dólares por mes, con una desviación estándar de
300 dólares. Una muestra de 500 agentes o representantes de ventas
en la región noroeste de Estados Unidos, indicó la siguiente
distribución de las comisiones. Al nivel de significancia de 0.01, ¿se
puede concluir que la población está normalmente distribuida, con
una media de 1500 dólares y una desviación estándar de 300 dólares?
Comisiones (dólares) frecuencia
Menor que 900 9
900 a 1200 63
1200 a 1500 165
1500 a 1800 180
1800 a 2100 71
2100 o mayores 12
Total 500
14. Una socióloga estuvo investigando esta cuestión: ¿existe relación
entre el nivel de educación y las actividades sociales de una
persona? Decidió manejar tres niveles de educación: asistió o
terminó la instrucción universitaria, asistió o termino la preparatoria
y asistió a la primaria o inferior. Cada uno lleva un registro de sus
actividades sociales, como jugar boliche en grupo, y salir a bailes o
ceremonias religiosas. La socióloga los dividió en frecuencia
748 Estadística para Administración y Economía
superior al promedio, frecuencia promedio y frecuencia inferior al
promedio.
Actividad social
Instrucción Superior al promedio Promedio Inferior al promedio
Universitaria 18 12 10
Preparatoria 17 15 13
Primaria 9 9 22
a) ¿Cómo se denomina la tabla?
b) Establezca la hipótesis nula.
c) ¿Debe rechazarse la hipótesis nula al nivel de significancia de
0.05? Cite cifras para respaldar su decisión.
d) En forma específica, ¿qué indica esto para el problema?
15. El director de mercadotecnia de un diario metropolitano estudia la
relación entre el tipo y comunidad en que el (la) lector (a) vive y la
parte del periódico que lee primero. Para una muestra de lectores se
reunió la información que sigue:
Noticias Historietas
Comunidad Deportes
nacionales cómicas
Urbana 170 124 90
Rural 120 112 100
Granjera 130 90 88
19. Los vehículos que se dirigen al oeste sobre la calle Front pueden
dar vuelta a la derecha, a la izquierda, o bien seguir derecho hasta la
calle Elm. Un experto en tránsito urbano cree que la mitad de los
vehículos continuará sin cambio de dirección por la intersección.
De la mitad restante, proporciones iguales darán vuelta hacia la
derecha o hacia la izquierda. Se observan 200 vehículos, con un
nivel de significancia de 0.10. ¿Se puede concluir que el experto en
tránsito está en lo correcto?
No cambia Vuelta a la Vuelta la
de dirección derecha izquierda
Frecuencia 112 48 40
20. El departamento de tarjetas de crédito bancarias de Carolina Bank
sabe, por su larga experiencia, que 5% de los tarjetahabientes han
tenido algunos estudios de bachillerato, 15% han terminado dicho
nivel escolar, 25% han tenido ciertos estudios universitarios y 55%
han concluido la instrucción de la universidad. De los 500
tarjetahabientes que fueron reportados por falta de pago este mes,
50 tenían estudios en bachillerato, 100 terminaron el nivel escolar,
190 tenían cierta preparación y 160 concluyeron la instrucción en
la universidad. ¿Se puede concluir que la distribución de
750 Estadística para Administración y Economía
tarjetahabientes que no han pagado sus cuentas es diferente de la de
los demás? Aplique el nivel de significancia de 0.01.
21. El editor de una revista deportiva planea ofrecer uno de tres regalos
a los nuevos suscriptores: una sudadera con el logotipo de su equipo
favorito, una taza para café con tal símbolo o un par de aretes
también con dicho distintivo. A continuación se presenta la
información con respecto a la cantidad de obsequios seleccionados
para una muestra de 500 nuevos suscriptores. Al nivel de
significancia de 0.05, ¿existe alguna preferencia por cada regalo, o
se puede concluir que los obsequios gustan por igual?
Regalo Frecuencia
Sudadera 183
Taza para café 175
Aretes 142
22. En un determinado mercado de televisión estadounidense hay tres
estaciones de televisión comercial, cada una con su propio
programa de tarde, de 6:00 a 6:30 p.m. Según un informe en el
periódico local de esta mañana, una muestra aleatoria de 150
espectadores de anoche indicó que 53 vieron las noticias de la
estación WNAE (canal 5), 64 observaron la emisión de la WRRN
(canal 11), y 33 la de la WSPD (canal 13). Al nivel de significancia
de 0.05, ¿existe alguna diferencia en la proporción de espectadores
que vieron los tres canales?
23. Hay cuatro entradas a la tienda Saga Falabella, en Piura. El
supervisor de mantenimiento de la tienda desearía saber si los
accesos se utilizan equitativamente. Para investigar se observan a
400 personas que entraban a la tienda. A continuación se presenta la
cantidad de veces que se utiliza cada entrada. Al nivel de
significancia de 0.01, ¿existe diferencia en el uso de los cuatro
accesos?
Entrada Frecuencia
Calle Principal 140
Calle Cuzco 120
Calle Arequipa 90
Calle Huancavelica 50
Total 400
24. El propietario de un servicio comercial de pedidos por correo
desearía comparar sus ventas con la distribución geográfica de la
población. De acuerdo con la Oficina del Censo de Estados Unidos,
Pruebas de bondad de ajuste e independencia 751
21% de la población vive en el noreste, el 24% en el oeste medio,
35% en el sur y 20% en el oeste. A continuación se presenta una
clasificación de una muestra de 400 pedidos seleccionados al azar
de los enviados en el mes anterior. Al nivel de significancia de 0.05,
¿es independiente la proporción en ventas de la zona geográfica?
Región Frecuencia
Noreste 68
Oeste medio 104
Sur 155
Oeste 73
Total 400
25. ¿Alguna vez compró una bolsa de dulces de chocolate M&M, y se
preguntó acerca de la distribución de los colores? El fabricante
informa que el 30% de las golosinas son de color café, 30%
amarillas, y un 10% corresponde a cada uno de los colores azul,
anaranjado, rojo, y verde. Una bolsa de 6.0 onzas de tales dulces
que se adquirió en cierta tienda de Piura, contenía un total de 72
golosinas con 17 cafés, 20 amarillas, 13 azules, 9 anaranjadas, 6
verdes y 7 rojas. Al nivel de significancia de 0.05, ¿se puede
concluir que la clasificación real por color de dichos dulces
concuerda con la distribución esperada?
26. El INEI informó recientemente que el número medio de televisores
por familia en Perú, es de 2.30 y la desviación estándar es de 1.474.
Una muestra de 100 hogares en Lima, indicó la siguiente cantidad
de televisores por casa:
Número de Número de
televisores hogares
0 7
1 27
2 28
3 18
4 10
5 o más 10
Al nivel de significancia de 0.05, ¿es razonable concluir que el
número de televisores por familia sigue una distribución normal?
Sugerencia: utilice límites tales como 0.50, 1.5, etc.
27. La empresa Eckel Manufacturing cree que los sueldos que paga por
hora siguen una distribución normal. Para confirmar esto, se tomó
una muestra de 300 trabajadores y los resultados fueron
organizados en la siguiente distribución de frecuencias. Determine
752 Estadística para Administración y Economía
la media y la desviación estándar de estos datos agrupados en tal
distribución de frecuencias. Al nivel de significancia de 0.10, ¿se
puede concluir razonablemente que la distribución de salarios (o
sueldos) por hora se aproxima a una de tipo normal?
Menos de 100 13 10
Entre 100 y 500 18 12
Más de 500 32 6
35. Una muestra de empresas en crisis fueron clasificadas según si los
fondos de capital habían sido o no declarados y también según si
existiese o no evidencia de una futura mejora. Utilizar los datos de
la siguiente tabla para contrastar la hipótesis nula de no asociación
entre estos atributos.
Posibilidad de futura mejora
Declaraciones
Sí No
Sí 28 39
No 20 47
36. Supongamos que en una tabla de contingencia de 2 × 2 representa-
mos los números observados como a, b, c, y d, como se indica en la
siguiente tabla:
TOTALES
a b
c d
TOTALES a+c b+d
n(ad bc) 2
2
Predicción
Resultado Aceleración No aceleración
Crecimiento 18 11
Decrecimiento 6 20
39. Se realizó un seguimiento a lo largo de un año de una muestra de
201 vendedores de computadoras. En la siguiente tabla vemos una
clasificación de los vendedores según estuvieran casados o solteros,
y según si al cabo de ese año habían abandonado el trabajo o
continuaban. Contrastar al nivel de significación del 5% la hipótesis
nula de no asociación entre estar o no cansado y abandonar o no el
trabajo al cabo de un año.
Estado civil Siguieron trabajando Abandonaron
Casado 128 27
Soltero 34 12
40. A una serie de individuos, abogados o de otra profesión, se les pidió
que afirmaran si estaban o no de acuerdo con la siguiente
afirmación: “en los anuncios publicitarios debería aparecer siempre
el precio del producto que se anuncia”. Los resultados obtenidos se
756 Estadística para Administración y Economía
muestran en la siguiente tabla. Contrastar la hipótesis nula de que
los abogados tiene la misma opinión respecto a la afirmación
anterior.
Profesión De acuerdo No opinan En desacuerdo
Abogados 76 16 25
No abogados 242 36 33
Pruebas de bondad de ajuste e independencia 757
APLICACIONES EN EXCEL
Independencia entre atributos
En general dos atributos son independientes si la distribución de
probabilidad de cualquiera de los dos atributos no es condicionada por
las categorías del otro.
Ejercicio 1
De acuerdo al archivo Data_Estatus, creado en el capítulo 2, estudiar
la independencia entre las variables Estatus y Región.
Solución
Abrir el archivo Excel Data_Estatus