Está en la página 1de 6

Universidad Técnica Federico Santa Marı́a

Departamento de Informática

Pauta Certamen I - Estadı́stica Computacional


Semestre I 2014 - Lunes 05.05.14

1. Análisis Exploratorio de Datos


a. Denotaremos por X la primera muestra (ordenada) y por Z la segunda (ordenada). La siguiente
tabla resume las estadı́sticas necesarias para construir los boxplot. Los diagramas correspondientes se
proporcionan en la Figura 1.

Liceo1 Liceo2
Mediana (X11 + X12 )/2 3.05 Z8 2.10
Q1 X6 2.50 (Z4 + Z5 )/2 1.35
Q3 X17 3.50 (Z11 + Z12 )/2 2.50
IQR Q3 − Q1 1.00 Q3 − Q1 1.15
Tol. Outliers 1.5 · IQR 1.50 1.5 · IQR 1.73
Lim. Sup. Outliers Q3 + 1.5 · IQR 5.00 Q3 + 1.5 · IQR 4.48
Lim. Inf. Outliers Q1 − 1.5 · IQR 1.00 Q1 − 1.5 · IQR -0.38
Outliers X21 , X22 5.2 5.3 Z14 , Z15 5.4 5.5

Variante criterio antiguo:

Liceo1 Liceo2
Mediana (X11 + X12 )/2 3.05 Z8 2.10
Q1 0.25X5 + 0.75X6 2.50 Z4 1.3
Q3 0.75X17 + 0.25X18 3.525 Z12 2.50
IQR Q3 − Q1 1.025 Q3 − Q1 1.2
Tol. Outliers 1.5 · IQR 1.5375 1.5 · IQR 1.8
Lim. Sup. Outliers Q3 + 1.5 · IQR 5.0625 Q3 + 1.5 · IQR 4.3
Lim. Inf. Outliers Q1 − 1.5 · IQR 0.9625 Q1 − 1.5 · IQR -0.5
Outliers X21 , X22 5.2 5.3 Z14 , Z15 5.4 5.5

De la figura, se concluye rápidamente que al menos un 75% de las observaciones del liceo 1 son mayores
a un 75% de las observaciones del liceo 2 (Q1 (X) > Q3 (Z)). Por lo tanto hay una diferencia significativa.

b. La varianza muestral del primer grupo es 0.36. La varianza muestral del segundo grupo se puede

1
5
4
3
2
1

1 2

Figure 1: Boxplot pregunta 1a.

calcular como
15
1 X
s22 = (Zi − Z̄)2
14 i=1
15
!
15 1 X 2
= Z − Z̄ 2
14 15 i=1 i
 
15 1 2
= · 111.92 − 2.39
14 15
15
= (7.46 − 5.70)
14
15
= (1.76)
14
= 1.89

La dispersión en el segundo grupo es mucho mayor. Si usamos en cambio el IQR como medida de
dispersión, vemos que los valores son similares en ambos liceos (1 versus 1.2). La razón es que la varianza
es una medida de dispersión mucho más sensible a valores extremos (outliers) que las estadı́sticas de
orden involucradas en el cálculo del IQR.
c. Construya sendos histogramas que permitan resumir y comparar las mediciones efectuadas en ambos
liceos. Utilice las clases y el papel milimetrado proporcionado en el apéndice. ¿Puede confirmar las
conclusiones obtenidas en (a)? (35%).
La Figura 2 presenta los histogramas a escala. Se confirma la conclusión presentada en a) porque la del
gráfico resulta evidente que la gran mayorı́a de las observaciones del liceo 2 están bajo 2.5 mientras que la
gran mayorı́a de las observaciones del liceo 1 están sobre ese valor.

2
Freq. Absolutas
clase Liceo1 Liceo 2
[1, 1.5] 0 5
(1.5, 2] 2 2
(2, 2.5] 4 5
(2.5, 3] 5 1
(3, 3.5] 6 0
(3.5, 4] 3 0
(4, 4.5] 0 0
(4.5, 5] 0 0
(5, 5.5] 2 2

liceo 1 liceo 2
6

5
5

4
4

3
Frequency

Frequency
3

2
2

1
1
0

1 2 3 4 5 1 2 3 4 5

m1 m22

Figure 2: Histogramas pregunta 1c.

2. Teorı́a de Probabilidades
Nota: Este problema esta planteado en el libro guı́a (Devore) usando tres repetidores (ejercicio 94 de la octava
edición). El caso de 1 repetidor se agregó para que resultara más fácil llegar a la solución final u obtener algo
de puntaje si el caso más complicado no se lograba abordar.

Para la solución, considere los eventos definidos en la tabla 1 (izquierda) y sus complementos (derecha).
Inicialmente, suponga que existe sólo un repetidor entre origen y destino.
a. Nos preguntamos por la probabilidad de que el destino E reciba un 1, es decir P (ER1). E recibe un 1
sólo si R transmite un 1. Entonces tenemos,

P (ER1) = P (R1T 1) = P (R1T 1|ST 1)P (ST 1) + P (R1T 1|ST 0)P (ST 0)

Ahora, si un 70% de los bits enviados por el transmisor S corresponden a un 1,

P (ER1) = P (R1T 1) = P (R1T 1|ST 1)P (ST 1) + P (R1T 1|ST 0)P (ST 0)
= 0.8 · 0.7 + 0.2 · 0.3 = 0.62

3
ST 1 S transmite un 1 ST 1 S transmite un 0
R1T 1 Repetidor 1 transmite un 1 R1T 0 Repetidor 1 transmite un 0
R2T 1 Repetidor 2 transmite un 1 R2T 0 Repetidor 2 transmite un 0
R3T 1 Repetidor 3 transmite un 1 R3T 0 Repetidor 3 transmite un 0
ER1 Destino recibe un 1 ER0 Destino recibe un 0

Table 1: Eventos para 2a y sus complementos (derecha).

Si sabemos que el transmisor S ha enviado un 1, la probabilidad pedida es P (ER1|ST 1), es decir 0.8
(probabilidad de que se mantenga el bit).
b. Si E acaba de recibir un 1, ¿Cuál es la probabilidad de que S haya enviado un 1? La probabilidad en
cuestión es P (ST 1|ER1). Ahora,
P (ER1|ST 1)P (ST 1)
P (ST 1|ER1) =
P (ER1)
0.8 · 0.7
= = 0.9032
0.62
Suponga ahora que existen 3 repetidores entre origen y destino y que éstos operan independientemente.
c. Si el transmisor S envı́a un 1, ¿Cuál es la probabilidad de que se E reciba un 1?. Nos preguntamos por
P (ER1|ST 1). Ahora,
P (ER1|ST 1) = P (R3T 1|ST 1) = P (R3T 1|R2T 1, ST 1)P (R2T 1|ST 1) + P (R3T 1|R2T 0, ST 1)P (R2T 0|ST 1)
P (R2T 1|ST 1) = P (R2T 1|R1T 1, ST 1)P (R1T 1|ST 1) + P (R2T 1|R1T 0, ST 1)P (R1T 0|ST 1)
P (R1T 1|ST 1) = 0.8
Instanciando los valores,
P (R1T 1|ST 1) = 0.8 =⇒ P (R1T 0|ST 1) = 0.2
P (R2T 1|ST 1) = 0.8 · 0.8 + 0.2 · 0.2 = 0.68 =⇒ P (R2T 0|ST 1) = 0.32
P (ER1|ST 1) = P (R3T 1|ST 1) = 0.8 · 0.68 + 0.2 · 0.32 = 0.608

d. Tenemos que calcular P (ST 1|ER1). Usando la regla de Bayes,


P (ER1|ST 1)P (ST 1)
P (ST 1|ER1) =
P (ER1)

P (ER1|ST 1) fue calculada en el ı́tem anterior. Ahora,


P (ER1) = P (R3T 1) = P (R3T 1|R2T 1)P (R2T 1) + P (R3T 1|R2T 0)P (R2T 0)
P (R2T 1) = P (R2T 1|R1T 1)P (R1T 1) + P (R2T 1|R1T 0)P (R1T 0)
P (R1T 1) = P (R1T 1|ST 1)P (ST 1) + P (R1T 1|ST 0)P (ST 0)
Instanciando los valores
P (R1T 1) = 0.8 · 0.7 + 0.2 · 0.3 = 0.62 =⇒ P (R1T 0) = 0.38
P (R2T 1) = 0.8 · 0.62 + 0.2 · 0.38 = 0.572 =⇒ P (R2T 0) = 0.428
P (ER1) = P (R3T 1) = 0.8 · 0.572 + 0.2 · 0.428 = 0.5432

Finalmente,
0.608 · 0.7
P (ST 1|ER1) = = 0.7835
0.5432

4
3. Variables Aleatorias Discretas
Un click corresponde a un cliente que pasa del portal al sitio de la empresa. Defina como XA el número de
clientes que pasan desde el sitio A y como XB el número de clientes que pasan desde el sitio A. XA ∼ Poi(4)
y XB ∼ Poi(6).

a. Determine la probabilidad de que en una hora, 6 visitantes pasen desde el portal B al sitio de la empresa
6 −6
y que lo hagan 4 desde A. P (XB = 6) = 6 6!
e
= 0.161. Independientemente,

40 e−4 41 e−4 42 e−4 43 e−4


P (XA ≥ 4) = 1 − P (XA ≤ 3) = 1 − − − −
0! 1! 2! 3!
= 1 − 0.018 − 0.073 − 0.147 − 0.195
= 1 − 0.433 = 0.567

Por lo tanto, la probabilidad pedida es 0.161 × 0.567 = 0.09.


b. La probabilidad de que en una hora, 6 visitantes pasen desde el portal B al sitio de la empresa la
calculamos en (a) y era P (XB = 6) = 0.161. Sea CB el número de potenciales clientes provenientes de
B que compran el producto. Claramente, CB ∼ Bin(n = XB , p = 0.1). Por lo tanto,

P ((XB = 6) ∩ (CB ≥ 2)) = P (CB ≥ 2|XB = 6)P (XB = 6)

Además,

P (CB ≥ 2|XB = 6) = 1 − P (CB ≤ 1|XB = 6)


   
6 6
=1− (0.1)0 (0.9)6 − (0.1)1 (0.9)5
0 1
= 1 − 0.531 − 0.354 = 1 − 0.886 = 0.114

Entonces,

P ((XB = 6) ∩ (CB ≥ 2)) = 0.114 · 0.161 = 0.018

c. Sean HA (x) y HB (x) las sumas pagadas por la compañı́a a los portales A y B respectivamente durante
cada hora de operación. Éstas funciones dependen del número de clicks sobre la publicidad de la
compañı́a y se pueden definir como sigue:

100 · x si x < 4
HA (x) =
500 si x ≥ 4


150 · x si x < 4
HB (x) =
600 si x ≥ 4

Sea H(x) la suma total pagada por la compañı́a en publicidad. Claramente,

E[H(x)] = E[HA (x)] + E[HB (x)] .

En el sitio A, el número de clicks es una v.a XA ∼ Poi(4). Por lo tanto, el valor esperado de HA está
dado por
∞ 3 ∞
X 4x e−4 X 4x e−4 X 4x e−4
E[HA (x)] = H(x) · = 100x · + 500 ·
k! k! k!
k=0 k=0 k=4
1 −4 2 −4 3 −4
 
4 e 4 e 4 e
= 100 · 0 + 1 · +2· +3· + 500 · (1 − FA (3))
1 2 3!
= 100 · 1.025 + 500 · 0.567 = 385.868 ,

5
donde FA (3) la función de distribución de la v.a. correspondiente al portal A (Poisson con parámetro
4). Análogamente, en el sitio B, el número de clicks es una v.a. XB ∼ Poi(6). Por lo tanto, el valor
esperado de HB está dado por

X 6x e−6
E[HB (x)] = H(x) ·
k!
k=0
3 ∞
X 6x e−6 X 6x e−6
= 100x · + 500 ·
k! k!
k=0 k=4
61 e−6 62 e−6 63 e−6
 
= 150 0 + 1 · +2· +3· + 600 · (1 − FB (3)) = 150 · 0.4016 + 600 · 0.849 = 569.518 ,
1 2 3!

donde FB (3) la función de distribución de la v.a. correspondiente al portal B (Poisson con parámetro
6). Por lo tanto,

E[H(x)] = 385.868 + 569.518 = 955.386 .

Observaciones
• Cada ı́tem se evaluará con puntaje de 0 a 100. Su nota será el promedio entre estos ı́tems.

• Por favor escriba explı́citamente sus supuestos, utilizando un lenguaje y notación apropiados.
• Presente sus respuestas para cada pregunta en hojas separadas, indentificándolas con nombre y rol.
• Justifique todas sus respuestas. Un resultado sin contexto no será considerado.

• Si desea tener la posibilidad de recorregir alguna pregunta, responda con un lápiz de tinta indeleble.
• Éste es un acto solemne. Cualquier intento de copia será sancionado severamente.

RNA LATEX

También podría gustarte