Documentos de Académico
Documentos de Profesional
Documentos de Cultura
5 Problemas Contingencia
5 Problemas Contingencia
Estadística Teórica II
TABLAS DE CONTINGENCIA
1.- Para comprobar si los operarios encontraban dificultades con una prensa manual de
imprimir, se hizo una prueba a cuatro operarios anotando el número de atascos sufridos
al introducir el mismo número de hojas, dando lugar a la siguiente tabla:
Operario A B C D Total
Obstrucciones 6 7 9 18 40
Con un nivel de significación del 5%, ¿existe diferencia entre los operarios?
Solución.-
La probabilidad de que se atascase una hoja sería 1 / 4 para todos los operarios.
De este modo, el número de atascos esperados para cada uno de ellos sería
( e i = 10 )i =1 , L , 4 .
Operario A B C D Total
6 7 9 18 40
Obstrucciones
(10) (10) (10) (10) (40)
k ( ni − e i ) 2 k ni2
χ 2
k −1 = ∑ ei
=∑
ei
−n < χ 2α ; k −1
123
k ≡ número intervalos
i =1 i =1
14
424 4
3 estadístico teórico
estadístico contraste
⎧⎪ k (ni − e i )2 ⎫⎪
o bien, la región de rechazo de la hipótesis nula: R = ⎨ ∑ ≥ χ 2α ; k −1 ⎬
⎪⎩ i=1 ei ⎪⎭
4 ni2 6 2 7 2 9 2 18 2
con lo cual, χ 23 = ∑ −n = + + + − 40 = 9
i =1 ei 10 10 10 10
Número partículas 0 1 2 3 4 5
Número períodos de tiempo 120 200 140 20 10 2
¿Se pueden ajustar los datos obtenidos a una distribución de Poisson, con un nivel de
significación del 5%?
Solución.-
⎧⎪ k (ni − e i )2 ⎫⎪
o bien, la región de rechazo de la hipótesis nula: R = ⎨ ∑ ≥ χ 2α ; k −p −1 ⎬
⎪⎩ i=1 e i ⎪⎭
xi ni x i ni P (x i = k ) = p i
0 120 0 0,3012
x =λ =
∑ x i ni =
590
= 1,2
1 200 200 0,3614 n 492
2 140 280 0,2169 λ = 1, 2
3 20 60 0,0867 en consecuencia,
xi 0 1 2 3 4 5
120 200 140 20 10 2
frecuencias ( e1 = 148, 2 ) ( e 2 = 177, 8 ) ( e 3 = 106, 7 ) ( e 4 = 42, 7 ) ( e 5 = 12,8) ( e 6 = 3,05 )
dando lugar a una tabla de contingencia 1 x 6, en donde hay que agrupar las dos últimas
columnas por tener la última columna frecuencias esperadas menores que cinco.
Por tanto, se tiene la tabla de contingencia 1 x 5:
xi 0 1 2 3 4 y 5
120 200 140 20 12
frecuencias
( e1 = 148, 2 ) ( e 2 = 177, 8 ) ( e 3 = 106, 7 ) ( e 4 = 42, 7 ) ( e 5 = 15, 8 )
♦ El estadístico de contraste:
2
5 ( ni − ei ) 2 5 ni 120 2 200 2 140 2 20 2 12 2
2
χ3 = ∑ ei
= ∑e −n = + + + +
148, 2 177, 8 106, 27 42, 7 15, 8
− 492 = 32, 31
i =1 i =1 i
⎧⎪ k (ni − e i )2 ⎫⎪
Se verifica la región de rechazo: R = ⎨ ∑ ≥ χ 2α ; k −p −1 ⎬ ≡ { 32,31 > 7,815 }
⎪⎩ i=1 e i ⎪⎭
Hay que tener en cuenta el número de modalidades que admite el carácter, ya que al haber
más modalidades la χ 2 va siendo cada vez más grande.
Para emplearlo correctamente es necesario que las frecuencias esperadas de las distintas
modalidades no sea inferior a cinco.
3.- Para una muestra aleatoria simple de 350 días, el número de urgencias tratadas
diariamente en un hospital A queda reflejado en la siguiente tabla:
Solución.-
Intervalos xi ni xi n i xi2 ni
0-5 2,5 20 50 125
5 - 10 7,5 65 487,5 3656,25
10 - 15 12,5 100 1250 15625
15 - 20 17,5 95 1662,5 29093,75
20 - 25 22,5 60 1350 30375
25 - 30 27,5 10 275 7562,5
6 6 6
n = ∑ ni = 350 ∑ xi ni = 5075 ∑ xi2 ni = 86437,5
i =1 i =1 i =1
6 ( ni − e i ) 2
χ =∑
2
3 = 4, 57
i =1 ei
CONTRASTE DE HOMOGENEIDAD.
4.- Para conocer la opinión de los ciudadanos sobre la actuación del alcalde de una
determinada ciudad, se realiza una encuesta a 404 personas, cuyos resultados se
recogen en la siguiente tabla:
Contrastar, con un nivel de significación del 5%, que no existen diferencias de opinión
entre hombres y mujeres ante la actuación del alcalde.
Solución.-
Tenemos dos muestras clasificadas en tres niveles, donde se desea conocer si los
hombres y mujeres proceden de la misma población, es decir, si se comportan de
manera semejante respecto a la opinión de la actuación del alcalde.
La hipótesis nula: H0 : 'No existe diferencia entre hombres y mujeres respecto a la opinión'
{
Región de rechazo de la hipótesis nula: R = χ 2(k − 1).(m − 1) ≥ χ 2α ; (k − 1).(m − 1) }
Se forma una tabla de contingencia 2 x 3 de la siguiente forma: en cada frecuencia
observada (nij )i=1, L, k ; j=1,L, m en la tabla de contingencia tenemos una frecuencia teórica o
nxi n y j
esperada eij que se calcula mediante la expresión: eij = pij n = , donde pij son las
n
probabilidades de que un elemento tomado de la muestra presente las modalidades xi
de X e y j de Y.
118 62 25
Varones (e 21 = 102, 5) (e 22 = 71, 03) (e 23 = 31, 46) 205
2 3 (n ij − e ij ) 2
El estadístico de contraste: ∑∑ e ij
= χ 2( 2 − 1 ) . ( 3 − 1 ) = χ 22 , con lo que,
i=1 j =1
( 25 − 31, 46) 2
+ = 9, 76
31, 46
sigue una χ 2 con dos grados de libertad si es cierta la hipótesis nula con eij > 5 ∀ i, j ;
en caso contrario sería necesario agrupar filas o columnas contiguas.
k m (ni j − ei j ) 2 k m ni2j
♦ El estadístico de contraste: ∑∑ ei j
=χ 2
(k − 1) . ( m − 1)
= ∑∑ e − n (manera útil)
i =1 j = 1 i =1 j = 1 ij
2
2 3 nij 84 2 78 2 37 2 118 2 62 2 25 2
∑∑ e ij − n = 99, 5 + 68, 96 + 30, 53 + 102, 5 + 71, 03 + 31, 46 − 404 = 9, 76
i = 1 j =1
Como χ 22 = 9, 76 > χ 20, 05 ; 2 = 5, 991 se cumple la región de rechazo, concluyendo que las
muestras no son homogéneas, esto es, no proceden de la misma población, hombres y
mujeres no opinan lo mismo.
CONTRASTE DE INDEPENDENCIA.
A un nivel de significación del 10%, ¿hay relación entre las dos variables tabuladas?
Solución.-
k m (ni j − ei j ) 2 k m ni2j
El estadístico de contraste: ∑∑ ei j
= χ 2(k − 1) . ( m − 1) = ∑∑ e − n (manera útil)
i =1 j = 1 i =1 j = 1 ij
{
Siendo la región de rechazo de la hipótesis nula: R = χ 2(k − 1) . ( m − 1) ≥ χ 2α ; (k − 1) . ( m − 1) }
En la tabla de contingencia 2 x 4 para cada frecuencia observada (nij )i=1, L, k ; j=1,L, m
se tiene una frecuencia teórica o esperada eij que se calcula mediante la expresión:
nxi n y j
eij = pij n =
n
El estadístico de contraste:
2 4
ni2j 2452 228 2 177 2 219 2 312 27 2 132 10 2
χ 23 = ∑∑ e
i=1 j=1 ij
−n= + + + + + + +
252, 46 233,25 173,8 209, 47 23,53 21,74 16,2 19,52
− 950 = 9,75
ó bien,
2 4
(n ij − e ij ) 2 (245 − 252, 46) 2 (228 − 233,25) 2 (177 − 173,8) 2 (219 − 209, 47) 2
χ 23 = ∑∑
i =1 j =1
e ij
=
252, 46
+
233,25
+
173,8
+
209, 47
+
sigue una χ 2 con tres grados de libertad si es cierta la hipótesis nula con eij > 5 ∀ i, j ;
en caso contrario sería necesario agrupar filas o columnas contiguas.
Meses A B C Total
1 6 10 10 26
2 8 12 12 32
3 8 8 14 30
4 9 14 16 39
Total 31 44 52 127
Solución.-
a) Con la simple observación de los datos, el empaquetado A parece ser el mejor, ya que
es el que menos kilos de tomates estropeados tuvo; si bien, esta situación puede ser
engañosa, ya que hay que tener en cuenta el número de kilos que se empaquetaron.
Para tomar una decisión sobre si hay diferencia entre los diferentes métodos de
empaquetado, se contrasta la hipótesis nula H0 ='No existe diferencia entre los
métodos de empaquetado'.
b) Sea la hipótesis nula H0 ='No existe diferencia entre los métodos de empaquetado'.
k m
ni2j
Se acepta H0 si: χ 2(k − 1).(m − 1) = ∑∑ e
i=1 j=1 ij
− n < χ 2α ;(k − 1).(m − 1)
n xi . n y j
Formamos la tabla de contingencia 3 x 4 , donde e ij =
n
Empaquetado
Meses A B C Total
6 10 10 26
1
(e 11 = 6, 35) (e 12 = 9, 01) (e 13 = 10, 62) (26)
8 12 12 32
2
(e 21 = 7, 81) (e 22 = 11, 09) (e 23 = 13, 10) (32)
8 8 14 30
3
(e 31 = 7, 32) (e 32 = 10, 39) (e 33 = 12, 28) (30)
26 . 31 32 . 31 30 . 31 39 . 31
e 11 = = 6, 35 e 21 = = 7, 81 e 31 = = 7, 32 e 41 = = 9, 52
127 127 127 127
26 . 44 32 . 44 30 . 44 39 . 44
e 12 = = 9, 01 e 22 = = 11, 09 e 32 = = 10, 39 e 42 = = 13, 51
127 127 127 127
26 . 52 32 . 52 30 . 52 39 . 52
e 13 = = 10, 65 e 23 = = 13, 10 e 33 = = 12, 28 e 43 = = 15, 97
127 127 127 127
3 4
ni2j
Estadístico de contraste: χ2(3−1) (4 −1) = χ26 = ∑∑ e
i =1 j =1 ij
− n = 128,24 − 127 = 1,24
7.- Una empresa multinacional desea conocer si existen diferencias significativas entre
sus trabajadores en distintos países en el grado de satisfacción en el trabajo- Para ello
se toman muestran aleatorias simples de trabajadores, obteniendo los siguientes
resultados:
Satisfacción en el trabajo
Muy satisfecho Satisfecho Insatisfecho Muy insatisfecho
España 200 300 300 100
Francia 300 400 350 150
Italia 350 300 250 150
Solución.-
La hipótesis nula H0: 'Las proporciones de los trabajadores con los distintos grados de
satisfacción son iguales en los tres países'
Se acepta H0:
k m
(ni j − e i j )2 k m
ni2j
χ 2(k − 1).(m − 1) = ∑∑
i=1 j=1
eij
= χ (2k − 1).(m − 1) = ∑∑ e
i=1 j=1 ij
− n < χ 2α ;(k − 1).(m − 1)
{
Región de rechazo de la hipótesis nula: R = χ 2(k − 1).(m − 1) ≥ χ 2α ; (k − 1).(m − 1) }
Se forma la tabla de contingencia 3 x 4 donde cada frecuencia observada
nxi n y j
(nij )i=1, L, k ; j=1,L, m tiene una frecuencia teórica o esperada eij = pij n =
n
Satisfacción en el trabajo
Muy satisfecho Satisfecho Insatisfecho Muy insatisfecho Total
200 300 300 100 900
España
(e 11 = 242,86) (e 12 = 285, 71) (e 13 = 257, 14) (e 14 = 114, 29) (900)
300 400 350 150 1200
Francia
(e 21 = 323, 81) (e 22 = 380, 95) (e 23 = 342, 86) (e 24 = 152, 38) (1200)
350 300 250 150 1050
Italia
(e 31 = 283, 33) (e 32 = 333, 33) (e 33 = 300) (e 34 = 133, 33) (1050)
3 4
(ni j − e i j )2 3 4
ni2j
Estadístico observado: χ 2(3 − 1).(4 − 1) = ∑∑
i=1 j=1
eij
= ∑∑ e
i=1 j=1 ij
−n=
Como χ26 = 49,55 > 12,592 = χ 20,05 ; 6 se rechaza la hipótesis nula de homogeneidad de
las tres muestras; es decir, la satisfacción en el trabajo de los empleados de los tres
países es significativamente distinta en los tras países.
8.- Las compañías de seguros de automóviles suelen penalizar en sus primas a los
conductores más jóvenes, con el criterio que éstos son más propensos a tener un mayor
número de accidentes. En base a la tabla adjunta, con un nivel de significación del 5%,
contrastar si el número de accidentes es independiente de la edad del conductor.
Solución.-
La hipótesis nula H0: 'El número de accidentes sufridos por los conductores no depende
de la edad del conductor'
Se acepta H0:
k m
(ni j − e i j )2 k m
ni2j
χ 2(k − 1).(m − 1) = ∑∑
i=1 j=1
eij
= χ (2k − 1).(m − 1) = ∑∑ e
i=1 j=1 ij
− n < χ 2α ;(k − 1).(m − 1)
{
Región de rechazo de la hipótesis nula: R = χ 2(k − 1).(m − 1) ≥ χ 2α ; (k − 1).(m − 1) }
Se forma la tabla de contingencia 3 x 5 donde cada frecuencia observada
(nij )i=1, L, k ; j=1,L, m tiene una frecuencia teórica o esperada en caso de independencia
nxi n y j
eij = pij n =
n
Número de accidentes por año
Edad del n xi
0 1 2 3 4
conductor
25 o 10 10 20 40 70 150
menos e 11 = 33,75 e 12 = 26,25 e 13 = 24,37 e 14 = 26,25 e 15 = 39,37 (150)
20 10 15 20 30 95
26 - 35
e 21 = 21,37 e 22 = 16,62 e 23 = 15,44 e 24 = 16,62 e 25 = 24,94 (95)
60 50 30 10 5 155
más de 36
e 31 = 34,87 e 32 = 27,12 e 33 = 25,19 e 34 = 27,12 e 35 = 40,69 (155)
ny j 90 70 65 70 105 400
donde,
150 . 90 95 . 90 155 . 90
e 11 = = 33, 75 e = = 21,37 e = = 34, 87
400 21 400 31 400
150 . 70 95 . 70 155 . 70
e 12 = = 26, 25 e = = 16, 62 e = = 27,12
400 22 400 32 400
150 . 65 95 . 65 155 . 65
e 13 = = 24, 37 e = = 15, 44 e = = 25,19
400 23 400 33 400
150 . 70 95 . 70 155 . 70
e 14 = = 26,25 e = = 16, 62 e = = 27,12
400 24 400 34 400
3 5
(ni j − e i j )2 3 5
ni2j
Estadístico observado: χ 2(3 − 1).(5 − 1) = χ 28 = ∑∑
i=1 j=1
eij
= ∑∑ e
i=1 j=1 ij
−n=
⎛ 10
2
10 2
20 2
40 2
70 ⎞ ⎛ 20 2
10 15 2 20 2 2
30 2 ⎞ 2
= ⎜⎜ + + + + ⎟+⎜
⎟ ⎜ + + + + ⎟+
⎟
⎝ 33,75 26,25 24,37 26,25 39,37 ⎠ ⎝ 21,37 16,62 15,44 16,62 24,94 ⎠
⎛ 60 2 50 2 30 2 10 2 52 ⎞
+ ⎜⎜ + + + + ⎟ − 400 = 143,51
⎝ 34,87 27,12 25,19 27,12 40,69 ⎟⎠
Como χ28 = 143,51 > 15,507 = χ 20,05 ;8 se rechaza la hipótesis nula de independencia
entre la edad del conductor y el número de accidentes; es decir, la edad influye
significativamente en el número de accidentes al año.
COEFICIENTE DE CONTINGENCIA
9.- En dos ciudades, A y B, se observó el color del pelo y de los ojos de sus habitantes,
encontrándose las siguientes tablas:
Ciudad A Ciudad B
Pelo Pelo
Rubio No Rubio Rubio No Rubio
Ojos Ojos
Azul 47 23 Azul 54 30
No azul 31 93 No azul 42 80
Se pide:
a) Hallar los coeficientes de contingencia de las dos ciudades.
b) ¿En cuál de las dos ciudades podemos afirmar que hay mayor dependencia entre el
color del pelo y de los ojos?
Solución.-
χ2
C= donde C ≤ 1
χ2 + n
Cuánto mayor sea el valor de C más alto es el grado de dependencia entre dos
caracteres (X, Y).
Estadístico de contraste:
2 2
ni2j 47 2 23 2 312 93 2
χ2(2 −1) (2 −1) = χ21 = ∑∑ e
i =1 j = 1 ij
−n= + + +
28,14 41,85 49,85 74,14
− 194 = 33,07
33,07
El coeficiente de contingencia: C A = = 0,3816
33,07 + 194
Ciudad B
Pelo
Rubio No Rubio Total
Ojos
54 30 84
Azul
(e 11 = 39, 15) (e 12 = 44,85) (84)
42 80 122
No azul
(e 21 = 56, 85) (e 22 = 65, 15) (122)
Total 96 110 206
Estadístico de contraste:
2 2
ni2j 54 2 30 2 42 2 80 2
χ2(2 −1) (2 −1) = χ21 = ∑∑ e
i =1 j = 1 ij
−n= + + +
39,15 44,85 56,85 65,15
− 206 = 17,82
17,82
El coeficiente de contingencia: C B = = 0,282
17,82 + 206