Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Departamento de Informática
Se ruega al lector estudioso que comunique al profesor cualquier error que descubra en
este documento.
1. Diagramas de caja correspondientes a la duración (en minutos) de los eventos de congestión en cada
grupo se presentan en la Figura 1.
(a) (26%) Determine el valor de los cuartı́les, valores mı́nimos, valores máximos, outliers superiores y
outliers inferiores correspondientes a cada grupo.
(b) (9%) Evaluamos el IQR en cada grupo y concluimos que la dispersión es mayor en el grupo AM-JL.
Grupo IQR Q3 − Q2 Q2 − Q1
AM-JL 40 - 28 = 12 40 - 38 = 2 38 - 28 = 10
AM-VI 56 - 51= 5 56 - 55 = 1 55 - 51 = 4
PM-JL 50 - 42 = 8 50 - 45 = 5 45 - 42 = 3
PM-VI 50 - 46 = 4 50 - 47 = 3 47 - 46 = 1
(c) (9%) En la tabla anterior se expone el valor de Q3 − Q2 y Q2 − Q1 para los diferentes grupos.
Cuando Q3 − Q2 Q2 − Q1 nos esperamos un claro sesgo positivo. Cuando Q3 − Q2 Q2 − Q1
nos esperamos un claro sesgo negativo. De acuerdo a los valores obtenidos el mayor sesgo positivo
se espera para los grupos PM-JL y PM-VI, siendo más marcado el efecto para el último debido
a que tiene una dispersión menor. El mayor sesgo negativo se espera en cambio para el grupo
AM-JL.
(d) (20%) ¿Existe una diferencia significativa entre los grupos AM-JL y PM-JL? ¿AM-JL y AM-VI?
¿PM-JL y PM-VI? ¿AM-VI y PM-VI? Justifique usando argumentos estadı́sticos.
1
Par Conclusión
AM-JL vs PM-JL Se aprecian diferencias significativas. Las cajas no se superponen.
Un 75% de las observaciones del grupo PM-JL son mayores a un
75% de las observaciones del grupo AM-JL.
AM-JL vs AM-VI Se aprecian diferencias significativas. Las cajas no se superponen.
Todas las observaciones del grupo AM-VI son mayores a todas las
observaciones del grupo AM-JL.
PM-JL vs PM-VI Las cajas se sobreponen, lo que hace que obtener conclusiones sea
más difı́cil. Sin embargo, observamos que un 75% de las obser-
vaciones del grupo PM-VI son mayores a la mediana del grupo
PM-JL. Concluimos que hay diferencias entre ambos grupos.
AM-VI vs PM-VI Se aprecian diferencias significativas. Las cajas no se superponen.
Un 75% de las observaciones del grupo AM-VI son mayores a un
75% de las observaciones del grupo PM-VI
(e) (24%) ¿Se puede concluir que la duración de un evento de congestión depende de la hora del
dı́a? ¿Del momento de la semana? ¿Se puede concluir que la duración de un evento de con-
gestión aumenta durante los viernes y aumenta durante las tardes? Justifique usando argumentos
estadı́sticos.
Como argumentamos en la respuesta anterior, al comparar los valores obtenidos para un mismo
momento de la semana, pero en distintos momentos del dı́a (AM-JL vs PM-JL, AM-VI vs PM-
VI) observamos diferencias significativas, que sugieren un claro efecto del momento del dı́a en la
duración de un evento de congestión. No se puede concluir sin embargo que la duración de los
eventos aumente durante las tardes o aumente durante las mañanas. El dı́a viernes la duración de
los eventos disminuye durante la tarde (Un 75% de las observaciones del grupo PM-VI son menores
a un 75% de las observaciones del grupo AM-VI) mientras que los dı́as LJ aumenta (un 75% de
las observaciones del grupo PM-JL son mayores a un 75% de las observaciones del grupo AM-
JL). Esto muestra que el efecto del momento del dı́a depende del valor que tomen otras variables
explicativas.
Cuando comparamos los valores obtenidos para un mismo momento del dı́a, pero en distintos
momentos de la semana (AM-JL vs AM-VI, PM-JL vs PM-VI) observamos diferencias entre los
grupos. Aunque las diferencias resulten un poco más vagas al comparar los eventos de las tardes
(PM-JL vs PM-VI), concluimos que el momento de la semana tiene un efecto sobre la duración de
un evento de congestión. En ambos casos la duración de los eventos aumenta los viernes. Todas
las observaciones del grupo AM-VI son mayores a todas las observaciones del grupo AM-JL. Un
75% de las observaciones del grupo PM-VI son mayores al 50% de las observaciones del grupo
PM-JL.
(f) (12%) Suponga que se descubre que el valor máximo del grupo PM-LJ estaba mal registrado y era
en realidad x = 57. Determine cómo se modificarı́a el diagrama correspondiente.
Como Q3 + 1.5 · IQR = 50 + 12 = 62 el dato no serı́a detectado como un outlier. Esto significa
que sólo se moverı́a el bigote superior a la nueva posición 57.
2. Una fábrica de maquinaria pesada tiene 3 plantas, S1 , S2 , S3 , con 50, 100 y 150 operarios respecti-
vamente. Se estima que la probabilidad de que un operario de la planta S1 sufra un accidente en el
trabajo es del 5% y que dicha probabilidad es el doble y triple en las plantas S2 y S3 , respectivamente.
(a) (50%) Considere la extracción aleatoria de un trabajador de la fábrica y defina los eventos
Si : El operario trabaja en la planta Si (1)
A : El operario sufre un accidente
Tenemos que determinar P (S3 |A). Sabemos que P (A|S1 ) = 0.05, P (A|S2 ) = 0.1 y P (A|S3 ) = 0.15.
Sabemos además que P (S1 ) = 1/6, P (S2 ) = 2/6 = 1/3 y P (S1 ) = 3/6 = 1/2. Por la regla de la
2
probabilidad total
X
1 2 3
P (A) = P (A|Si )P (Si ) = 6 · 0.05 + 6 · 0.1 + 6 · 0.15 = 0.1167 (2)
i
Por Bayes,
3
P (A|S2 )P (S2 ) · 0.15 0.0333
P (S3 |A) = = 6 = = 0.6427 (3)
P (A) 0.1167 0.1167
(b) (50%) Considere la extracción aleatoria de 2 trabajadores de una misma planta y defina los eventos
Tenemos que determinar P (SS2 |A2 ). Sabemos que P (A2 |SS1 ) = (0.05)2 , P (A2 |SS2 ) = (0.1)2 y
P (A2 |SS3 ) = (0.15)2 .
50
2 50 · 49
P (SS1 ) = 50 100
150 = 50 · 49 + 100 · 99 + 150 · 149
= 0.0706 (5)
2 + 2 + 2
100
2 100 · 99
P (SS2 ) = 50 100
150 = 50 · 49 + 100 · 99 + 150 · 149
= 0.2853
2 + 2 + 2
150
2 150 · 149
P (SS3 ) = 50 100
150 = 50 · 49 + 100 · 99 + 150 · 149
= 0.6441
2 + 2 + 2
Por Bayes,
3
se entrevista de todos modos. En efecto, las probabilidades calculadas suman 1.
f (2) = P (X = 2) = 0.152 = 0.0225 (8)
2
f (3) = P (X = 3) = 0.152 0.85 = 0.03825
1
3
f (4) = P (X = 4) = 0.152 0.852 = 0.0487687
1
4
f (5) = P (X = 5) = 0.152 0.853 = 0.05527125
1
5
f (6) = P (X = 6) = 0.152 0.854 = 0.0587257
1
6
f (7) = P (X = 7) = 0.152 0.855 = 0.05990022
1
7
f (8) = P (X = 8) = 0.152 0.856 = 0.05940105
1
8
f (9) = P (X = 9) = 0.152 0.857 = 0.05770388
1
8 8
f (10) = P (X = 10) = 0.85 + 0.151 0.858 = 0.5994
1
De este modo el valor esperado de X es
10
X
E[X] = k · f (k) = 8.39138 . (9)
k=2
Sea T (X) tiempo que las directivas pasan entrevistando candidatos si entrevistan X personas.
Tenemos que
10
X 5
X 10
X
E[T ] = t(k) · f (k) = 20k · f (k) + (10k + 100) · f (k) (10)
k=2 k=2 k=6
5
X 10
X 10
X
= 20 k · f (k) + 20 k · f (k) + 100 f (k)
k=2 k=6 k=6
= 20 · 0.6311811 + 10 · 7.760199 + 100 · 0.8351309 = 173.7387 .
RNA+CVV LATEX