Está en la página 1de 4

Universidad Técnica Federico Santa Marı́a

Departamento de Informática

Estadı́stica Computacional INF-280 II-2018


Certamen I - Jueves 25.10.18
PAUTA

Se ruega al lector estudioso que comunique al profesor cualquier error que descubra en
este documento.

1. Diagramas de caja correspondientes a la duración (en minutos) de los eventos de congestión en cada
grupo se presentan en la Figura 1.

(a) (26%) Determine el valor de los cuartı́les, valores mı́nimos, valores máximos, outliers superiores y
outliers inferiores correspondientes a cada grupo.

Grupo Q1 Q2 Q3 Min Max Outlier Superiores Outlier Inferiores


AM-JL 28 38 40 28 45 No No
AM-VI 51 55 56 46 57 No No
PM-JL 42 45 50 28 55 No 28
PM-VI 46 47 50 38 54 No 38

Table 1: Solución Pregunta 1(a).

(b) (9%) Evaluamos el IQR en cada grupo y concluimos que la dispersión es mayor en el grupo AM-JL.

Grupo IQR Q3 − Q2 Q2 − Q1
AM-JL 40 - 28 = 12 40 - 38 = 2 38 - 28 = 10
AM-VI 56 - 51= 5 56 - 55 = 1 55 - 51 = 4
PM-JL 50 - 42 = 8 50 - 45 = 5 45 - 42 = 3
PM-VI 50 - 46 = 4 50 - 47 = 3 47 - 46 = 1

Table 2: Solución Pregunta 1(b).

(c) (9%) En la tabla anterior se expone el valor de Q3 − Q2 y Q2 − Q1 para los diferentes grupos.
Cuando Q3 − Q2  Q2 − Q1 nos esperamos un claro sesgo positivo. Cuando Q3 − Q2  Q2 − Q1
nos esperamos un claro sesgo negativo. De acuerdo a los valores obtenidos el mayor sesgo positivo
se espera para los grupos PM-JL y PM-VI, siendo más marcado el efecto para el último debido
a que tiene una dispersión menor. El mayor sesgo negativo se espera en cambio para el grupo
AM-JL.
(d) (20%) ¿Existe una diferencia significativa entre los grupos AM-JL y PM-JL? ¿AM-JL y AM-VI?
¿PM-JL y PM-VI? ¿AM-VI y PM-VI? Justifique usando argumentos estadı́sticos.

1
Par Conclusión
AM-JL vs PM-JL Se aprecian diferencias significativas. Las cajas no se superponen.
Un 75% de las observaciones del grupo PM-JL son mayores a un
75% de las observaciones del grupo AM-JL.
AM-JL vs AM-VI Se aprecian diferencias significativas. Las cajas no se superponen.
Todas las observaciones del grupo AM-VI son mayores a todas las
observaciones del grupo AM-JL.
PM-JL vs PM-VI Las cajas se sobreponen, lo que hace que obtener conclusiones sea
más difı́cil. Sin embargo, observamos que un 75% de las obser-
vaciones del grupo PM-VI son mayores a la mediana del grupo
PM-JL. Concluimos que hay diferencias entre ambos grupos.
AM-VI vs PM-VI Se aprecian diferencias significativas. Las cajas no se superponen.
Un 75% de las observaciones del grupo AM-VI son mayores a un
75% de las observaciones del grupo PM-VI

Table 3: Solución Pregunta 1(b).

(e) (24%) ¿Se puede concluir que la duración de un evento de congestión depende de la hora del
dı́a? ¿Del momento de la semana? ¿Se puede concluir que la duración de un evento de con-
gestión aumenta durante los viernes y aumenta durante las tardes? Justifique usando argumentos
estadı́sticos.
Como argumentamos en la respuesta anterior, al comparar los valores obtenidos para un mismo
momento de la semana, pero en distintos momentos del dı́a (AM-JL vs PM-JL, AM-VI vs PM-
VI) observamos diferencias significativas, que sugieren un claro efecto del momento del dı́a en la
duración de un evento de congestión. No se puede concluir sin embargo que la duración de los
eventos aumente durante las tardes o aumente durante las mañanas. El dı́a viernes la duración de
los eventos disminuye durante la tarde (Un 75% de las observaciones del grupo PM-VI son menores
a un 75% de las observaciones del grupo AM-VI) mientras que los dı́as LJ aumenta (un 75% de
las observaciones del grupo PM-JL son mayores a un 75% de las observaciones del grupo AM-
JL). Esto muestra que el efecto del momento del dı́a depende del valor que tomen otras variables
explicativas.
Cuando comparamos los valores obtenidos para un mismo momento del dı́a, pero en distintos
momentos de la semana (AM-JL vs AM-VI, PM-JL vs PM-VI) observamos diferencias entre los
grupos. Aunque las diferencias resulten un poco más vagas al comparar los eventos de las tardes
(PM-JL vs PM-VI), concluimos que el momento de la semana tiene un efecto sobre la duración de
un evento de congestión. En ambos casos la duración de los eventos aumenta los viernes. Todas
las observaciones del grupo AM-VI son mayores a todas las observaciones del grupo AM-JL. Un
75% de las observaciones del grupo PM-VI son mayores al 50% de las observaciones del grupo
PM-JL.
(f) (12%) Suponga que se descubre que el valor máximo del grupo PM-LJ estaba mal registrado y era
en realidad x = 57. Determine cómo se modificarı́a el diagrama correspondiente.
Como Q3 + 1.5 · IQR = 50 + 12 = 62 el dato no serı́a detectado como un outlier. Esto significa
que sólo se moverı́a el bigote superior a la nueva posición 57.

2. Una fábrica de maquinaria pesada tiene 3 plantas, S1 , S2 , S3 , con 50, 100 y 150 operarios respecti-
vamente. Se estima que la probabilidad de que un operario de la planta S1 sufra un accidente en el
trabajo es del 5% y que dicha probabilidad es el doble y triple en las plantas S2 y S3 , respectivamente.
(a) (50%) Considere la extracción aleatoria de un trabajador de la fábrica y defina los eventos
Si : El operario trabaja en la planta Si (1)
A : El operario sufre un accidente

Tenemos que determinar P (S3 |A). Sabemos que P (A|S1 ) = 0.05, P (A|S2 ) = 0.1 y P (A|S3 ) = 0.15.
Sabemos además que P (S1 ) = 1/6, P (S2 ) = 2/6 = 1/3 y P (S1 ) = 3/6 = 1/2. Por la regla de la

2
probabilidad total
X
1 2 3
P (A) = P (A|Si )P (Si ) = 6 · 0.05 + 6 · 0.1 + 6 · 0.15 = 0.1167 (2)
i

Por Bayes,
3
P (A|S2 )P (S2 ) · 0.15 0.0333
P (S3 |A) = = 6 = = 0.6427 (3)
P (A) 0.1167 0.1167

(b) (50%) Considere la extracción aleatoria de 2 trabajadores de una misma planta y defina los eventos

SSi : Ambos operarios trabajan en la planta Si (4)


A2 : Ambos operarios sufren un accidente

Tenemos que determinar P (SS2 |A2 ). Sabemos que P (A2 |SS1 ) = (0.05)2 , P (A2 |SS2 ) = (0.1)2 y
P (A2 |SS3 ) = (0.15)2 .
50

2 50 · 49
P (SS1 ) = 50 100
 150 = 50 · 49 + 100 · 99 + 150 · 149
 = 0.0706 (5)
2 + 2 + 2
100

2 100 · 99
P (SS2 ) = 50 100
 150 = 50 · 49 + 100 · 99 + 150 · 149
 = 0.2853
2 + 2 + 2
150

2 150 · 149
P (SS3 ) = 50 100
 150 = 50 · 49 + 100 · 99 + 150 · 149
 = 0.6441
2 + 2 + 2

Por la regla de la probabilidad total


X
P (A2 ) = P (A2 |SSi )P (SSi ) = 0.0706 · (0.05)2 + 0.2853 · (0.1)2 + 0.6441 · (0.15)2 = 0.0175
i
(6)

Por Bayes,

P (A2 |SS2 )P (SS2 ) 0.6441 · (0.15)2 0.0333


P (SS2 |A2 ) = = = = 0.8271 (7)
P (A2 ) 0.0175 0.1167

3. En cierta compañı́a ...

(a) (50%) Debemos determinar la probabilidad de tener que entrevistar X = 2, 3, . . . , 10 candidatos.


Hasta k = 9, la probabilidad P (X = k) es simplemente la f.d.p. de la distribución binomial
negativa con r = 2y p = 0.15. La probabilidad de hacer 10 entrevistas en cambio es la probabilidad
de que se produzcan solo fracasos hasta el octavo candidato y se deban seleccionar los últimos 2
(que se entrevistan de todos modos) más la probabilidad de que se haya llegado al noveno candidato
con un éxito, la entrevistas a éste sea un fracaso, y se deban seleccionar al último candidato, que

3
se entrevista de todos modos. En efecto, las probabilidades calculadas suman 1.
f (2) = P (X = 2) = 0.152 = 0.0225 (8)
 
2
f (3) = P (X = 3) = 0.152 0.85 = 0.03825
1
 
3
f (4) = P (X = 4) = 0.152 0.852 = 0.0487687
1
 
4
f (5) = P (X = 5) = 0.152 0.853 = 0.05527125
1
 
5
f (6) = P (X = 6) = 0.152 0.854 = 0.0587257
1
 
6
f (7) = P (X = 7) = 0.152 0.855 = 0.05990022
1
 
7
f (8) = P (X = 8) = 0.152 0.856 = 0.05940105
1
 
8
f (9) = P (X = 9) = 0.152 0.857 = 0.05770388
1
 
8 8
f (10) = P (X = 10) = 0.85 + 0.151 0.858 = 0.5994
1
De este modo el valor esperado de X es
10
X
E[X] = k · f (k) = 8.39138 . (9)
k=2

Sea T (X) tiempo que las directivas pasan entrevistando candidatos si entrevistan X personas.
Tenemos que
10
X 5
X 10
X
E[T ] = t(k) · f (k) = 20k · f (k) + (10k + 100) · f (k) (10)
k=2 k=2 k=6
5
X 10
X 10
X
= 20 k · f (k) + 20 k · f (k) + 100 f (k)
k=2 k=6 k=6
= 20 · 0.6311811 + 10 · 7.760199 + 100 · 0.8351309 = 173.7387 .

(b) (50%) Si se mantiene la posición, la probabilidad de ser seleccionado (evento S) es la probabilidad


de que el primer seleccionado se produzca en la posición 8 (evento A) ó la probabilidad de que el
segundo seleccionado se produzca en la posición 8 (evento B). Los eventos A y B son disjuntos.
Entonces
 
7 7
P (S) = P (A) + P (B) = (0.85) 0.15 + (0.85)6 (0.15)2 = 0.0481 + 0.0594 = 0.1075 (11)
1
Si se cambia la posición, la probabilidad de ser seleccionado (evento S) es la probabilidad de
que se termine de entrevistar al candidato 8 sin ningún candidato seleccionado (evento A) ó la
probabilidad de que se haya seleccionado un candidato antes de entrevistar al candidato 9 y que
al entrevistar al candidato 9 éste no se seleccione. Los eventos A y B son disjuntos. Entonces
 
8 8
P (S) = P (A) + P (B) = (0.85) + (0.85)7 (0.15)1 0.85 = 0.2725 + 0.3269 = 0.5994 (12)
1
Concluimos que conviene cambiar posición.

RNA+CVV LATEX

También podría gustarte