Está en la página 1de 31

Formulario de Estadı́stica I

Tema 2 Sean x1 , x2 , . . . , xn los los n valores observados. La muestra ordenada (variables no categóricas nominales)
se denota por x(1) , x(2) , . . . , x(n) .
• Media aritmética: x(= n1 n
P
i=1 xi .
1
2
(x( n ) + x( n +1) ), si n es par,
• Mediana: M e = 2 2
x( n+1 ) , si n es impar.
2
• Moda: La moda es el valor xi que presenta una mayor frecuencia absoluta (o relativa).
• Cuartiles: Qk = x(k(n+1)/4) para k = 1, 2, 3.
• Percentiles: Pk = x(k(n+1)/100) para k = 1, 2, . . . , 99.
• Rango o amplitud: R = xmax − xmin .
• Rango intercuartı́lico: RIC P = Q3 − Q1 .
Varianza muestral: σ̂ 2 = n1 n 2
Pn
1
x2 − nx2 .

• i=1 (xi − x) = n
√ i=1 i
• Desviación tı́pica (o estándar) muestral: 2
Pn σ̂ = σ̂2 . 1 Pn
2 1 2 2

• Cuasivarianza muestral: s = n−1 i=1 (xi − x) = n−1 i=1 xi − nx .

• Cuasidesviación tı́pica muestral: s = s2 .
• Coeficiente de variación de Pearson: CV =Ps/|x|.
n 3
i=1 (xi −x)
• Coeficiente de asimetrı́a de Fisher: CA = ns3
.
Pn 4
i=1 (xi −x)
• Coeficiente de curtosis de Fisher: CC = ns4
− 3.

Tema 3 Sean (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) los n pares de valores observados !


para (X, Y ).
n n
1 X 1 X
• Covarianza: sxy = (xi − x) (yi − y) = xi yi − nx y
n − 1 i=1 n−1 i=1
sxy
• Coeficiente de correlación lineal de Pearson: r(x,y) =
sx sy

Tema 4 Sea Ω el espacio muestral asociado a cierto experimento aleatorio, B1 , . . . , Bk una partición de Ω, tal que
P (Bi ) 6= 0 para i = 1, . . . , k y A un suceso cualquiera.
• Ley de la probabilidad total:

P (A) = P (A ∩ B1 ) + . . . + P (A ∩ Bk ) = P (A|B1 ) P (B1 ) + . . . + P (A|Bk ) P (Bk ).

• Teorema de Bayes:

P (Bj ∩ A) P (A|Bj ) P (Bj )


P (Bj |A) = = , para j = 1, . . . , k.
P (A) P (A|B1 ) P (B1 ) + . . . + P (A|Bk ) P (Bk )

Esperanza y varianza de una variable aleatoria.


Sea X una v.a. que toma valores en un conjunto S. La esperanza y varianza de X se definen como:
 X

 x P (X = x), si X es una v.a. discreta,

x∈S
E(X) = Z


 x f (x) dx, si X es una v.a. continua.
S

 X

 (x − E(X))2 P (X = x), si X es una v.a. discreta,

x∈S
var(X) = Z
(x − E(X))2 f (x) dx,


 si X es una v.a. continua.
S

Tema 5 Algunos modelos de probabilidad.

Modelo X Conjunto S Función de probabilidad / densidad E(X) var(X)


Ber(p) {0, 1} P (X = 1) = p, P (X = 0) = 1 − p p p (1 − p)
P (X = x) = nx px (1 − p)n−x

B(n, p) {0, 1, . . . , n} np n p (1 − p)
λx
P ois(λ) N ∪ {0} P (X = x) = e−λ x!
λ λ
U (a, b) (a, b) f (x) = 1
b−a
(a + b)/2 (b − a)2 /12
+ −λ x
exp(λ) R f (x) = λ e 1/λ 1/λ2
f (x) = σ 2 π exp − 2 1σ2 (x − µ)2
1
σ2

N (µ, σ) R √ µ
TABLA 1: DISTRIBUCIÓN NORMAL

Áreas bajo la curva normal

Ejemplo:

X  P
Z
V

P [Z > 1] = 0.1587
P [Z > 1.96] = 0.0250

Desv.
normal 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
x
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121

0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611

1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681

1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233

2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064

2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010

2
Probabilidad

Probabilidad

El valor de la tabla para z El valor de la tabla para z


es el área bajo la curva es el área bajo la curva
de la normal estándar z de la normal estándar z
a la izquierda de z a la izquierda de z

TABLA A: Probabilidades de la normal estándar TABLA A: Probabilidades de la normal estándar (cont. )


z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

⫺3.4 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0002 0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
⫺3.3 .0005 .0005 .0005 .0004 .0004 .0004 .0004 .0004 .0004 .0003 0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
⫺3.2 .0007 .0007 .0006 .0006 .0006 .0006 .0006 .0005 .0005 .0005 0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
⫺3.1 .0010 .0009 .0009 .0009 .0008 .0008 .0008 .0008 .0007 .0007 0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
⫺3.0 .0013 .0013 .0013 .0012 .0012 .0011 .0011 .0011 .0010 .0010 0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
⫺2.9 .0019 .0018 .0018 .0017 .0016 .0016 .0015 .0015 .0014 .0014 0.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
⫺2.8 .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .0019 0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
⫺2.7 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .0026 0.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
⫺2.6 .0047 .0045 .0044 .0043 .0041 .0040 .0039 .0038 .0037 .0036 0.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
⫺2.5 .0062 .0060 .0059 .0057 .0055 .0054 .0052 .0051 .0049 .0048 0.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
⫺2.4 .0082 .0080 .0078 .0075 .0073 .0071 .0069 .0068 .0066 .0064 1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
⫺2.3 .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .0084 1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
⫺2.2 .0139 .0136 .0132 .0129 .0125 .0122 .0119 .0116 .0113 .0110 1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
⫺2.1 .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .0143 1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
⫺2.0 .0228 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .0183 1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
⫺1.9 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233 1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
⫺1.8 .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0301 .0294 1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
⫺1.7 .0446 .0436 .0427 .0418 .0409 .0401 .0392 .0384 .0375 .0367 1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
⫺1.6 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .0455 1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
⫺1.5 .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .0559 1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
⫺1.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681 2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
⫺1.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .0823 2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
⫺1.2 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .0985 2.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
⫺1.1 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .1170 2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
⫺1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .1379 2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
⫺0.9 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611 2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
⫺0.8 .2119 .2090 .2061 .2033 .2005 .1977 .1949 .1922 .1894 .1867 2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
⫺0.7 .2420 .2389 .2358 .2327 .2296 .2266 .2236 .2206 .2177 .2148 2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
⫺0.6 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .2451 2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
⫺0.5 .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .2776 2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
⫺0.4 .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121 3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
⫺0.3 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .3483 3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
⫺0.2 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .3859 3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
⫺0.1 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .4247 3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
⫺0.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .4641 3.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998
Examen Final de Estadı́stica I, 27 de junio de 2017.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, ADE-EEII.

NORMAS: 1) Usar cuadernillos separados para cada problema.


2) Realizar los cálculos con al menos dos cifras decimales significativas.
3) No se podrá abandonar el examen hasta transcurridos 30 minutos depués de haber empezado.
4) No está permitido salir del aula sin entregar el examen, aunque esté en blanco.

1. (3 puntos) Las elecciones generales del 2016 en España fueron un verdadero quebradero de cabeza
para los partidos tradicionales. El PP, partido que obtuvo el mayor porcentaje de votos a favor,
apenas obtuvo el 28.72% de los votos contabilizados. Algunos analistas se preguntan si el apoyo a
este partido dependió de la participación ciudadana, la cual miden en términos de concurrencia de
votantes el dı́a de las elecciones.

(a) (0.75 puntos) El diagrama de dispersión de p (porcentaje de participación por mesa electoral, eje
x) y v (porcentaje de votos a favor del PP, eje y) se muestra en la Figura 1. El coeficiente de
correlación entre estas variables es 0.26 Valore si existe una relación lineal o de otro tipo entre p
y v.

0.8

0.6

0.4

0.2

0
0 0.2 0.4 0.6 0.8 1

Figure 1: Diagrama de dispersión de p versus v.

(b) (0.75 puntos) La tabla adjunta muestra algunas medidas descriptivas de las variables bajo estudio.
Teniendo en cuenta la información disponible (gráfico de dispersión y tabla), deduzca si existen
mesas atı́picas, bien sea por valores extremos de participación o por votos a favor del PP. ¿Existen
mesas con porcentajes atipicamente pequeños de votos a favor?

Medidas media mediana cuasi desv-tip Q1 Q3


p 0.73 0.73 0.07 0.67 0.78
v 0.29 0.29 0.14 0.18 0.38
(c) (0.75 puntos) A continuación se muestran los histogramas de las variables p y v. Se pide que
conteste a las dos siguientes cuestiones:
• Compare los valores medianos y medios de cada una de las variables y a partir de ese análisis
valore si las distribuciones de p y v son simétricas.
• Ahora, considere los histogramas y valore de nuevo la asimetrı́a de las distribuciones.

10 4 10 4

2 2

1.5 1.5

1 1

0.5 0.5

0 0
0 0.5 1 0 0.5 1

Figure 2: Participación p (izquierda) y votos a favor por mesa v (derecha)

(d) (0.75 puntos) Los analistas del partido del PP sospechan que la caı́da de votos a favor se debió a la
falta de movilización. En ese sentido, aseguran que en las mesas con baja participación (≤ 70%,
según ellos), su porcentaje de votos a favor fue considerablemente más bajo del obtenido en las
mesas con alta participación (> 70%). ¿Es razonable esa idea? Justifique la respuesta utilizando
la información de la siguiente tabla:

p ≤ 0.70 p > 0.70


v ≤ 0.40 2239 9022
v > 0.40 14803 27686

2
2. (1.75 puntos) Una encuesta para medir el voto en la segunda vuelta en las elecciones presidenciales
francesas entre los candidatos Le Pen y Macron, encontró que el 40% de los votantes son menores
de 30 años y el 45% tienen entre 30 y 50 años. Por otro lado, el porcentaje de personas que tienen
intención de votar a Le Pen es del 20% entre las personas menores de 30 años, del 55% en las personas
entre 30 y 50 años y del 70% para las personas mayores de 50 años.

a) (0.5 puntos) ¿Cuál es la probabilidad de que una persona elegida al azar tenga intención de votar
a Le Pen y sea mayor de 30 años?
b) (0.5 puntos) Si una persona elegida al azar tiene intención de votar por Macron, ¿cuál es la
probabilidad de que el/ella tenga menos de 50 años?
c) (0.75 puntos) En el caso de los votantes mayores de 30 años, ¿qué porcentaje votará a Le Pen?

3. (1.5 puntos) El Estado emite bonos del Tesoro cuyo vencimiento fluctua entre 1 y 7 años. La función
de distribución de T , número de años hasta el vencimiento (vida residual), para un bono seleccionado
al azar, es




 0, t < 1,

 0.2, 1 ≤ t < 3,



FT (t) 0.7, 3 ≤ t < 5,

5 ≤ t < 7,



 0.8,


 1, t ≥ 7.

(a) (0.5 pts) Dibuje la función de distribución de T .


(b) (0.5 pts) Defina la función de probabilidad (o función masa) correspondiente.
(c) (0.5 pts) Calcule la probabilidad de que el número de años hasta el vencimiento de un bono
seleccionado al azar sea exactamente de 5 años. ¿Cuál es es la probabilidad de que T sea más de
4 años?

4. (1.5 puntos) Una determinada empresa de ventas online ha detectado que la probabilidad de que una
venta recibida sea fraudulenta es de 0.01. Si en una hora reciben 20 operaciones de venta y sabiendo
que se pueden realizar ventas las 24 horas del dı́a, conteste justificadamente a las siguientes cuestiones:

a) (0.75 pts) ¿Cuál es la probabilidad de que tenga al menos una operación fraudulenta en una hora
seleccionada al azar? Indique las hipótesis asumidas para obtener esta probabilidad.
b) (0.75 pts) La empresa de ventas ha contratado un seguro que cubre el coste de las ventas frau-
dulentas por el que paga una prima semanal global de 50 euros más 7 euros por cada operación

3
fraudulenta que reciba durante esa semana. En estas condiciones, calcula el coste semanal esperado
por la empresa por este concepto y su devsiación tı́pica.

5. (2.25 puntos) La duración, en minutos, en que los usuarios de un número de atención telefónica
consiguen obtener la información requerida se puede modelizar según una variable aleatoria de media
2 minutos y desviación tı́pica 1.9 minutos. Responda justificadamente a las siguientes cuestiones:

a) (0.75 pts) Se ha tomado una muestra de 100 tiempos y se han obtenido los siguientes gráficos:

¿Podemos suponer que la muestra sigue un modelo de probabilidad Normal? ¿Por qué?
b) (0.75 pts) Si es posible, calcule la probabilidad de que el tiempo medio de atención telefónica de 100
usuarios seleccionados al azar supere los dos minutos y medio. Comente por qué ha sido posible
o no calcular dicha probabilidad. ¿Podrı́a calcular la probabilidad requerida para una muestra
seleccionada al azar de 10 clientes?
c) (0.75 pts) Se han recogido los tiempos de atención de 100 usuarios seleccionados al azar obteniéndose
que 38 tuvieron una duración superior a 2 minutos, calcule un intervalo de confianza para la pro-
porción poblacional de duraciones superiores a 2 minutos a un 95% de nivel confianza.

4
Examen Final de Estadı́stica I, 17 de mayo de 2017.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, TUR, ADE-EEII.

NORMAS: 1) Realizar los cálculos con al menos dos cifras decimales significativas.
2) No se podrá abandonar el examen hasta transcurridos 30 minutos depués de haber empezado.
3) No está permitido salir del aula sin entregar el examen, aunque esté en blanco.

1. (3 pts) La siguiente tabla muestra los valores del Indice de Desarrollo Humano (IDH) para diferentes paı́ses de África,
América y Europa en el año 2015.
África 0,348 0,411 0,413 0,416 0,419 0,646 0,666 0,684 0,69 0,698 0,721 0,724 0,736 0,772 0,777
América 0,483 0,666 0,679 0,714 0,715 0,772 0,78 0,783 0,785 0,79 0,793 0,827 0,847 0,919 0,923
Europa 0,693 0,751 0,754 0,761 0,771 0,899 0,907 0,907 0,908 0,916 0,916 0,922 0,923 0,93 0,944

Responder a las siguientes cuestiones:


(a) (0,6 pts) Halle las medidas necesarias para justificar adecuadamente la veracidad o falsedad de cada una de las siguientes
afirmaciones:
1) El 50% de los paı́ses de África tiene un IDH que está por debajo del nivel alcanzado por cualquiera de los paı́ses de
Europa.
2) El 75% de los paı́ses de América tiene un IDH que está por encima del valor alcanzado por los paı́ses de África.
3) El 50% del los paı́ses europeos tiene un IDH que supera el IDH del 75% de los paı́ses americanos.
(b) (0,6 pts) Represente conjuntamente los diagramas de cajas de los tres continentes, determine la forma de cada dis-
tribución y verifique para cada uno de los continentes la existencia o no de datos atı́picos.
(c) (0,6 pts) ¿Qué medidas de centralidad y variabilidad resultan más adecuadas en cada caso? Obténgalas. Comente las
diferencias entre los tres continentes.
(d) (0,6 pts) El IDH se puede clasificar de la siguiente manera: Muy Alto [0.8, 1); Alto [0.7, 0.8); Medio [0.55, 0, 7) y Bajo
[0, 0.55). Construya la tabla de contingencia para la variable continente (X) y la variable IDH categorizada (Y ). Halle
sus distribuciones marginales.
(e) (0,6 pts) ¿Qué porcentaje de los paı́ses que tienen un IDH Alto o Muy alto pertenecen a Europa? De los paı́ses con un
IDH inferiores a 0.5, ¿qué porcentaje pertenece al continente Africano?
2. (2 pts) Una empresa ha diseñado la siguiente campaña para anunciar un producto a escala global mediante el envı́o masivo de
correos electrónicos (emails): Enviará cien mil emails a potenciales clientes no relacionados entre sı́ ofertando su producto,
que reporta un beneficio de 70 euros por unidad adquirida. La empresa asume que, en promedio, una de cada diez personas
que recibe el email comprará el producto. Responda a las siguientes preguntas, justificándolas adecuadamente.

(a) (0,7 pts) Especifique un modelo probabilı́stico para la variable aleatoria Y , que representa el beneficio que se obtendrá
con la campaña. Indique y justifique las hipótesis necesarias.
(b) (0,6 pts) Calcule la media, varianza y desviación tı́pica del beneficio Y .
(c) (0,7 pts) Calcule (de forma exacta o aproximada) la probabilidad de que el beneficio Y supere los 712000 euros.

3. (3 pts) Según los datos del INE, la distribución de hogares españoles en función del número de sus miembros viene dada
en la siguiente tabla. La tercera columna de la tabla refleja el porcentaje de hogares que disponen de lector de libros
electrónicos (e-book):

Hogares Número Porcentaje de hogares con e-book


de 1 o 2 miembros 7899565 18.60%
de 3 miembros 3847663 23.90%
de 4 o más miembros 4282595 29.30%

Conteste a las siguientes preguntas inicando claramente los sucesos con los que trabaja y los resultados que emplea en cada
caso.
(a) (0,6 pts) Calcule la probabilidad de que un hogar español seleccionado al azar no disponga de lector de libros electrónicos.
(b) (0,6 pts) Se selecciona un hogar español al azar y resulta que no dispone de e-book, ¿Cuál es la probabilidad de que
solo tenga 1 o 2 miembros?
(c) (0,6 pts) Elegido un hogar al azar, ¿Cuál es la probabilidad de que vivan en el mismo menos de 4 personas y no tengan
e-book?
(d) (0,6 pts) Entre los hogares con 3 o más miembros, ¿Cuántos disponen de lector de libros electrónicos?
(e) (0,6 pts) Una empresa proveedora de libros electrónicos diseña una campaña de promoción de e-books y para ello
selecciona una muestra aleatoria de 20 hogares, calcule la probabilidad de que más del 85% de los hogares seleccionados
no disponga de e-book.
4. (2 pts) A continuación, en la Tabla 1, se presentan los resultados del estudio realizado por el CIS sobre ”Actitudes y
Comportamientos Innovadores en la Sociedad Española”. A los encuestados se les pregunta por la importancia que asignan
a la innovación en distintos ámbitos o sectores (las fuentes de energı́a, las infraestructuras, el medio ambiente, la medicina,
la alimentación, la administración pública, la enseñanza, las empresas y los servicios sociales). Adicionalmente, con las
respuestas de los encuestados se construye el siguiente indicador global de la importancia de la innovación:
9
1X
I= Xi
9 i=1
El análisis descriptivo básico de I se muestra en la Tabla 2 a continuación:

(a) (0,6 pts) Explique cómo cree que se ha obtenido la estimación de la media de la variable I, es decir, i ≈ 8, 20.
(b) (0,7 pts) Calcule un intervalo de confianza del 95% para el nivel medio de importancia que se asigna a la innovación,
µI .
(c) (0,7 pts) Comente el ajuste de la variable I a la distribución normal. Justifique su respuesta basándose en los siguientes
gráficos.

2
Estadı́stica I Examen Extraordinario, 23 Junio 2016.
Grados en ADE, DER-ADE, ADE-INF, ADE-INT, FICO, ECO, ECO-DER, TUR.

REGLAS DEL EXAMEN: 1) Usar cuadernillos separados para cada problema. 2) Hacer los
cálculos con al menos dos decimales significativos. 3) No se puede abandonar el examen durante
los primeros 30 minutos. 4) No está permitido salir de la clase sin entregar el examen.

1. Se dispone de la siguiente información acerca de 10 empresas del Dow Jones: X1 =“sueldo de ejecutivo
mejor pagado (en millones de dólares)” y X2 =“precio de la acción (en dólares)”. Fuente: El Paı́s, 8 de
Mayo de 2016.

Tabla 1 / Table 1 Figura 1 / Figure 1


X1 X2
44,91 106,11
27,29 87,81
24,2 53,95
23,79 113,69
23,37 29,97
22,58 158,31
22,03 100,31
21 98
21,98 64,21
64 21 A
20,01 110,68
19,82 147,6
B
C

(a) (1 punto) Para la variable X2 , dibujar el diagrama de caja (box-plot) e identificar los atı́picos (si los
hubiere). Justificar la respuesta.
(b) (0,5 puntos) Determinar si X1 y X2 presentan el mismo tipo de asimetrı́a. Justificar la respuesta.
(c) (0,5 puntos) Determinar cuál de los diagramas de caja (A, B, C) corresponde a la variable X1 .
Justificar la respuesta.
(d) (0,5 puntos) Sabiendo que 1 euro = 1,14 dólares, obtener el sueldo medio de estos ejecutivos (en
millones de euros) y la varianza.

2. La cantidad de periódicos y revistas (expresada en decenas) que se venden semanalmente en un centro


comercial de cierta localidad puede representarse mediante una variable aleatoria con función de densidad:

k (x − 1)(3 − x), 1 ≤ x ≤ 3,
f (x) =
0, en caso contrario,

donde k es una constante adecuada.


(a) (0,5 puntos) Determinar el valor de la constante k para que f (x) sea realmente una función de densidad.
(b) (0,5 puntos) Obtener la función de distribución.
(c) (1 punto) Calcular la probabilidad de que en una semana cualquiera la cantidad de periódicos y revistas
vendidos supere la media.
(d) (0,5 puntos) Calcular la varianza de la cantidad de periódicos y revistas vendidos semanalmente.
3. Una ciudad de 3.5 millones de habitantes dispone de tres medios de transporte urbanos: metro, autobús
y tranvı́a. En general, en un dı́a laborable, el número de viajeros de metro asciende a 1.500.000, el de
autobús a 750.000 y los que viajan en tranvı́a son 450.000. Además se sabe que, de los viajeros de metro,
el 30% usa también autobús, el 10% usa también tranvı́a y el 5% utiliza también autobús y tranvı́a. De
los viajeros de autobús, sólo el 15% usa también tranvı́a. (Nota: Un habitante puede o no tomar algún
medio de transporte).

(a) (0,75 puntos) Calcular la probabilidad de que un habitante utilice solamente uno de los tres medios de
transporte en un dı́a laborable.
(b) (0,5 puntos) Calcular la probabilidad de que un habitante utilice por lo menos un medio de transporte
en un dı́a laborable.
(c) (0,75 puntos) Cuando en un dı́a laborable sólo se usa un medio de transporte, la probabilidad de
sufrir un retraso de más de 5 minutos es del 2%. Sin embargo, cuando se combina más de un medio
de transporte, esta probabilidad alcanza el 7%. Calcular la probabilidad que un habitante sufra un
retraso de más de 5 minutos en un dı́a laborable.
(d) (0,5 puntos) Utilizando la misma información del apartado (c) y sabiendo que un viajero ha sufrido
un retraso de más de 5 minutos, calcular la probabilidad de que haya utilizado más de un tipo de
transporte.

4. Sea X una v.a. que toma valores en el conjunto S = {2, 3, 5, 7}, con la siguiente función de probabilidad:

 0.10
 si x = 2,
 0.25 si x = 3,


P (X = x) = 0.35 si x = 5,
0.30 si x = 7,




0 en el resto de valores.

(a) (1 punto) Considerar una muestra aleatoria simple con la misma distribución que X, de tamanño
n = 150. Calcular la probabilidad de que la media muestral tome valores entre 4.6 y 5.0.
(b) (0.5 puntos) Comparar el resultado obtenido en el apartado (a) con la cota inferior que se obtendrı́a
utilizando la desigualdad de Chebyschev. ¿Es contradictorio el resultado? ¿Cuando es adecuado
utilizar la aproximación que porporciona la desigualdad de Chebyschev?
(c) (0.5 puntos) Sea Y una nueva v.a. que toma valor 1 si X < 5, y valor 0 en caso contrario. Determinar
el modelo de probabilidad que sigue Y , calcular su esperanza y varianza.
(d) (0.5 puntos) En una muestra de tamanño n = 250, X ha tomado valores menores que 5 en 75 ocasiones.
Obtener el intervalo de confianza para la media de Y al 98% de confianza.

2
Examen Final de Estadı́stica I, 26 de Mayo de 2016.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, TUR.

NORMAS: 1) Entregar cada problema en un cuadernillo distinto, aunque esté en blanco.


2) Realizar los cálculos con al menos dos cifras decimales significativas.
3) No se podrá abandonar el examen hasta transcurridos 30 minutos depués de haber empezado.
4) No está permitido salir del aula sin entregar el examen, aunque esté en blanco.

1. En las siguientes tablas se recoge información acerca de 10 empresas del IBEX 35. En concreto, se tienen tres
variables X1 =“retribución media del consejo de dirección”, X2 =“retribución media de la alta dirección”
y X3 =“gasto medio por empleado” (expresadas en millones de euros). Fuente: El Paı́s, 8 de Mayo de 2016.

Tabla 1 / Table 1
Empresa / Company X1 X2 X3 Figura 1 / Figure 1
BBVA 0,985 1,144 0,455
ACS 0,667 0,540 0,401
FCC 0,720 0,650 0,323
I dit
Inditex 1,270
1 270 1,730
1 730 0,231
0 231 A
Acciona 0,463 0,590 0,390
Santander 1,484 2,580 0,586
IAG 1,220 2,440 0,809
Iberdrola 0,920 1,979 0,894
Ferrovial 1,330 1,800 0,391
Telefónica 1,240 1,869 0,491 B

Tabla 2 / Table 2
X1 X2 X3
Media / Mean 1,030 0,497
Mediana / Median 1,765 0,428
Desv. típica / Standard dev. 0,333 0,756 0,210
Varianza / Variance 0,572 0,044
Q1 0,770 0,774 0,390
Q3 , 63
1,263 ,95
1,952

Responder a las siguientes cuestiones:

(a) (0,4 puntos) Completar los datos que faltan en la Tabla 2.


(b) (0,4 puntos) Respecto de la variable X2 , determinar la forma de su distribución. Justificar la respuesta.
(c) (0,4 puntos) ¿Cuál de las tres variables tiene mayor dispersión? Justificar la respuesta.
(d) (0,4 puntos) Determinar si la variable X3 tiene algún dato atı́pico. Justificar la respuesta.
(e) (0,4 puntos) Indicar a qué variables (X1 , X2 , X3 ) corresponden los diagramas de caja (box-plot) A y
B de la Figura 1. Justificar la respuesta.
(f) (0,5 puntos) Se sabe que la correlación entre X1 y X3 es 0,175 y, por otro lado, que la covarianza entre
X2 y X3 es de 0,093. ¿Es cierto que la relación lineal entre X3 y X1 es más fuerte que entre X3 y X2 ?
Justificar la respuesta.
2. Una empresa ofrece a cada uno de sus empleados la posibilidad de conseguir hasta 5 dı́as extra de vacaciones
en función de los objetivos alcanzados. Sea X la v.a. que mide el “número de dı́as extra de vacaciones”,
cuya función de distribución (o de probabilidad acumulada) es:

1
0,9
0,8
0,7
0,6
0,5
04
0,4
0,3
0,2
0,1
0
1 2 3 4 5

(a) (0,75 puntos) Escribir la función de probabilidad de X.


(b) (0,75 puntos) Calcular la esperanza de X y su desviación tı́pica.
(c) (0,5 puntos) Si un dı́a extra de vacaciones le cuesta a la empresa 100 euros, calcular el coste medio y
la varianza.
(d) (0,5 puntos) La empresa prevé que de 300 trabajadores, 1/3 consigan 4 dı́as extra de vacaciones y el
resto sólo 1 dı́a. Calcular el coste que le supone a la empresa (asumir que un dı́a extra son 100 euros
de coste).

3. El indicador AROPE mide el riesgo de padecer ciertos factores de vulnerabilidad social dentro del hogar.
A largo de 2014, de un total de 1.200.000 hogares atendidos por cierta ONG, solamente 156.000 no estaban
en situación de AROPE. Además, de los hogares que no estaban en situación de AROPE, el 84% tampoco
presentaban sobre-endeudamiento. Por otro lado, de los que sı́ estaban en situación de AROPE, el 40%
también presentaba sobre-endeudamiento.

(a) (0,5 puntos) Del total de hogares atendidos por esta ONG, calcular cuántos hogares presetan sobre-
endeudamiento.
(b) (0,75 puntos) Sabiendo que un hogar no tiene sobre-endeudamiento, determinar la probabilidad de que
esté en situación de AROPE.
(c) (0,5 puntos) Si en un dı́a cualquiera, un trabajador social de esta ONG visita 20 hogares, calcular la
probabilidad de que 5 de ellos no estén en situación de AROPE.
(d) (0,75 puntos) Si en un mes cualquiera se visitan 420 hogares, calcular la probabilidad de que por lo
menos 150 hogares estén en situación de AROPE y sobre-endeudamiento.
4. La retribución media de los directivos mejor pagados de las empresas españolas que cotizan en bolsa es de
2, 3 millones de euros anuales, con una desviación tı́pica de 0, 7. Se pide:

(a) (0,75 puntos) Calcular la probabilidad de que la retribución media anual de 100 de estos directivos
esté entre 2, 15 y 2, 45 millones de euros.
(b) (0,5 puntos) Si en lugar de 100 directivos se consideran solamente 50, sin realizar ningún cálculo
adicional, decidir si la probabilidad en (a) se incrementará o se reducirá. Justicar la respuesta.
(c) (0,5 puntos) Calcular la probabilidad de que la suma de retribuciones de 100 de estos directivos sea
mayor de 250 millones de euros.
(d) (0,75 puntos) Si para una muestra de 30 empresas españolas, la retribución media de los directivos
mejor pagados es de 2 millones de euros con una deviación tı́pica de 1, 4, calcular un intervalo de
confianza al 90% para la retribución media suponiendo normalidad. ¿Qué nivel de confianza tienes
en que la retribución media verdadera sea de 1, 5 millones de euros?

2
Estadı́stica I Examen Extraordinario, 23 Junio 2015.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, TUR.

REGLAS DEL EXAMEN: 1) Usar cuadernillos separados para cada problema. 2) Hacer los
cálculos con al menos dos decimales significativos. 3) No se puede abandonar el examen durante
los primeros 30 minutos. 4) No está permitido salir de la clase sin entregar el examen.

1. En las siguientes tablas se recoge información acerca del PIB y de la tasa de paro de las Comunidades
Autónomas españolas:

Tabla 1 Tabla 2
CCAA PIB Tasa de paro PIB Tasa de paro
Andalucía 13595.8 18.6 media 17530.7
Aragón 18766.0 6.6 mediana 16876.5
Asturias (Principado de) 15287.7 11.2 cuasi-desviación 3251.1
Balears (Illes) 20389.2 9.7 Q1 14834.7 9.3
Canarias 16832.7 11.4 Q3 20198.0
Cantabria 17425.7 10.6 Rango
Castilla y León 16920.4 11.1 intercuartílico 5363.3 1.9
Castilla-La Mancha 13978.5 10.1 percentil 85 21360.3 12.0
Cataluña 20783.7 10.1 percentil 15 14362.0
Comunidad Valenciana 16656.1 11.2
Extremadura 12240.6 17.4
Galicia 14683.7 12.7
Madrid (Comunidad de) 22968.7 7.4
Murcia (Región de) 14675.9 10.7
Navarra (Comunidad Foral) 22065.1 5.7
País Vasco 22444.5 9.5
Rioja (La) 19624.4 6.0
Ceuta y Melilla 16213.8 9.2

Responder a las siguientes cuestiones, justificando cada una de ellas:


(a) (0.5 puntos) Completar los datos que faltan en la Tabla 2.
(b) (0.5 puntos) ¿Cuál de las dos variables tiene mayor variación?
(c) (0.5 puntos) Determinar el grupo de Comunidades Autónomas formado por el 15% de las que tienen
mayor PIB.
(d) (0.5 puntos) Dibujar el diagrama de caja (box-plot) para la tasa de paro. ¿Qué forma presenta la
distribución?
(e) (0.5 puntos) A partir del box-plot anterior, determinar si hay atı́picos y/o atı́picos extremos. Identificar
de qué comunidades se trata.

Solución.
(a) En la Tabla 2 faltan algunos estadı́sticos descriptivos para la variable tasa de paro: media 10.5, mediana
10.3, cuasi-desviación tı́pica 3.4, Q3 = 11.2, P15 = 7.0.
(b) Puesto que las unidades de medida y el rango de valores son muy distintos para el PIB y la tasa de
paro, la cuasi-desviación tı́pica no es un buen descriptivo para comparar sus variabilidades. Es mejor
utilizar una medida adimensional, como el coeficiente de variación (CV). En este caso,
3251.1 3.4
CV (P IB) = = 0.19, CV (t.paro) = = 0.32,
17530.7 10.5
luego la variación de la tasa de paro es mayor.
(c) El grupo de CCAA formado por el 15% con mayor PIB son aquellas cuyo PIB sea superior al percentil
85, es decir superior a 21360.3. Hay tres CCAA que cumplen esta condición: Navarra, Paı́s Vasco y
Madrid.
(d) Diagrama de caja para la tasa de paro

18

16

14

12

10

tasa de paro

La distribución presenta una ligera asimetrı́a hacia la derecha, puesto que la media es ligerante superior
a la mediana. La posible causa de esta asimetrı́a son dos atı́picos extremos con tasas de paro superiores
a 17.
(e) Para la variable tasa de paro será un atı́co cualquier observación superior a Q3 + 1.5 × RI = 14.1 o
inferior a Q1 − 1.5 × RI = 6.4. Además, serán atı́picos extremos aquellas observaciones superiores a
Q3 + 3 × RI = 16.9 o inferiores a Q1 − 3 × RI = 3.6. Luego Navarra y La Rioja son atı́picos porque sus
tasas de paro son inferiores a 6.4 y Extremadura y Andalucı́a son atı́picos extremos porque sus tasas
de paro son superiores a 16.9.

2. La duración (en minutos) de cierto proceso de fabricación es una variable aleatoria X con función de
densidad  1
f (x) = 2 + c (1 − x), 1 ≤ x ≤ 2,
0, en caso contrario,
donde c es una constante adecuada.
(a) (0.5 puntos) Determinar el valor de la constante c para que f (x) sea realmente una función de densidad.
Dibujar la función de densidad.
(b) (0.75 puntos) ¿Cuál es la probabilidad de que el proceso de fabricación dure menos de 90 segundos?
(c) (0.75 puntos) Calcular la esperanza y la varianza de X.
(d) (0.5 puntos) Calcular exactamente la probabilidad P (|X − E(X)| ≥ 0.3). Comparar este resultado con
la cota superior que se obtendrı́a mediante la desigualdad de Chebyschev. ¿Es contradictorio el resul-
tado? ¿Cuando es adecuado utilizar la aproximación que porporciona la desigualdad de Chebyschev?
(Indicación: Si no has podido calcular la esperanza y varianza de X, puedes considerar E(X) = 1.583
y var(X) = 0.076).
Solución.

(a) Para que f (x) sea una función de densidad debe integrar 1 sobre su soporte, es decir,
2 2
x2
Z      
1 1 1 1
+ c (1 − x) dx = 1 ⇒ x+c x− =1⇒ +c − = 1 ⇒ c = −1,
1 2 2 2 1 2 2

de manera que la función de densidad es

x − 12 , 1 ≤ x ≤ 2,

f (x) =
0, en caso contrario.

2
2

1.5

0.5

0
0 1 2 3

(b) La probabilidad de que el proceso de fabricación dure menos de 90 segundos, es decir, menos de 1.5
minutos es Z 1.5    2 1.5
1 x x
P (X < 1.5) = x− dx = − = 0.375.
1 2 2 2 1
(c) La esperanza y varianza de X son:
+∞ 2 2
x3 x2
Z Z 

2 x 19
E(X) = x f (x) dx = x − dx = − = = 1.5833.
−∞ 1 2 3 4 1 12

Para calcular la varianza de X, utilizamos que var(X) = E(X 2 ) − (E(X))2 , donde


2 2
x2 x4 x3
Z   
31
E(X 2 ) = x3 − dx = − = = 2.5833,
1 2 4 6 1 12
2
luego var(X) = 31/12 − (19/12) = 11/144 = 0.0764.
(d) Para calcular P (|X − E(X)| ≥ 0.3) de forma exacta se usa de nuevo la función de densidad de X:

P (|X − E(X)| ≥ 0.3) = 1 − P (|X − E(X)| < 0.3) = 1 − P (−0.3 < X − E(X) < 0.3)
Z 1.8833  
1
= 1 − P (1.2833 < X < 1.8833) = 1 − x− dx
1.2833 2
 2 1.8833
x x
= 1− − = 0.35002,
2 2 1.2833

donde se ha utilizado que E(X) = 1.5833.


La aproximación que proporciona la desigualdad de Chebyschev es:
var(X) 0.0764
P (|X − E(X)| ≥ 0.3) ≤ = = 0.8489,
0.32 0.32
donde se observa que esta cota superior (0.8489) es mucho mayor que el valor exacto (0.35002).
Este resultado no es contradictorio, puesto que Chebyschev proporciona una cota superior, es decir,
que la probabilidad exacta siempre será menor que la aproximación mediante Chebyschev. Por este
motivo, se recomienda usar la desigualdad de Chevyschev para aproximar probabilidades de una v.a.
solamente cuando se desconozca la ley de probabilidad de dicha v.a.

3. Una agencia de viajes ofrece tres tipos de destinos: regional, nacional e internacional. En general, los
porcentajes de ventas suelen ser del 30% para regional, del 20% para nacional y del 50% para internacional
y las reclamaciones que suele recibir son del 1% para regional, del 1% para nacional y del 1.5% para
internacional.

3
(a) (0.5 puntos) Determinar el porcentaje de reclamaciones que recibe.
(b) (0.75 puntos) Determinar la probabilidad de que dada una reclamación, ésta sea debida a un destino
regional.
(c) (0.5 puntos) Determinar la probabilidad de que un cliente contrate un destino internacional y no emita
ninguna reclamación.
(d) (0.75 puntos) De un total de 10 clientes, determinar la probabilidad que 3 o más de ellos contraten un
destino internacional y no emitan ninguna reclamación.
Solución. Consideramos los siguientes sucesos Reg =“destino regional”, N ac =“destino nacional” e
Inter =“destino internacional”, con probabilidades P (Reg) = 0.30, P (N ac) = 0.20, P (Inter) = 0.50),
respectivamente. Además, consideramos los sucesos R =“el cliente emite reclamación” y R̄ =“el cliente no
emite reclamación”.

(a) El porcentaje de reclamaciones se obtiene aplicando el teorema de la probabilidad total:

P (R) = P (R|Reg) · P (Reg) + P (R|N ac) · P (N ac) + P (R|Inter) · P (Inter)


= 0.01 · 0.30 + 0.01 · 0.20 + 0.015 · 0.50 = 0.0125,

luego el porcentaje de reclamaciones es del 1.25%.


(b) Para obtener la probabilidad P (Reg|R) es necesario aplicar el teorema de Bayes:

P (R|Reg) · P (Reg) 0.01 · 0.30


P (Reg|R) = = = 0.24.
P (R) 0.0125

(c) La probabilidad de que un cliente contrate un destino internacional y no emita ninguna reclamación
se obtiene como la intersección de los sucesos Inter y R̄, es decir:

P (Inter ∩ R̄) = P (R̄|Inter) ·P (Inter) = 0.985 · 0.5 = 0.4925.


| {z }
1−P (R|Inter)

(d) Conisderemos la v.a. X =“número de clientes de un total de 10 que contratan destino internacional
y no emiten reclamación”, que puede modelarse según una ley Binomial Bin(10, 0.4925). Luego,
la probabilidad de que 3 o más clientes contraten un destino internacional y no emitan ninguna
reclamación es:

P (X ≥ 3) = 1 − P (X < 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2))
      
10 10 10
= 1− 0.49250 (1 − 0.4925)10 + 0.49251 (1 − 0.4925)9 + 0.49252 (1 − 0.4925)8
0 1 2
10 9 2 8
 
= 1 − 0.5075 + 10 · 0.4925 · 0.5075 + 45 · 0.4925 · 0.5075 = 1 − 0.0602 = 0.9398.

4. El salario semanal de trabajadores de producción no supervisada en la industria minera se supone que


tiene media y desviación tı́pica iguales a 630ey 35e, respectivamente. Se pide:

(a) (1 punto) Calcular la probabilidad de que el salario medio semanal de 100 de estos trabajadores esté
entre 600e y 660e.
(b) (0.5 puntos) Sin realizar ningún tipo de cálculo adicional, decidir si la probabilidad en (a) se incre-
mentará o se reducirá si el número de trabajadores es 200 en lugar de 100. Justica tu respuesta.
(c) (0.5 puntos) Calcular la probabilidad de que la suma de salarios de 100 trabajadores sea mayor de
70000e.
(d) (0.5 puntos) El gobierno sospecha que algunas de las compañı́as mineras están pagando a los tra-
bajadores de producción no supervisada un sueldo inferior al estipulado. Para comprobar esto, el
gobierno obtiene una muestra del salario semanal de 50 trabajadores y obtienen una media muestral
de 605e. Se pide obtener un intervalo de confianza al 90% para el salario medio suponiendo que dichos
salarios tienen una distribución Normal con desviación tı́pica 35. ¿Que nivel de confianza tienes en
que la media verdadera sea realmente 630e?

4
Solución:
 
(a) Puesto que n ≥ 30, por el CLT tenemos que X ∼ N 630, √35 100
= N (630, 3.5). Entonces, la
probabilidad requerida está dada por:
 
 −30 X 30
Pr 600 < X < 660 = Pr < < ' Pr (−8.57 < Z < 8.57) =
3.5 3.5 3.5
= Pr (Z < 8.57) − Pr (Z < −8.57) = 1 − 0 = 1,

donde Z ∼ N (0, 1).


(b) Puesto que 200 > 100, la varianza de X se espera que sea menor. Por lo tanto, la probabilidad de
que X esté en el intervalo (600, 660) deberı́a aumentará (aunque ya es 1).
(c) Queremos calcular la probabilidad siguiente:
100
!
X
Pr Xi > 70000
i=1

Esta cantidad es similar a:  


70000 
Pr X > = Pr X > 700
100
Entonces, como en a), por el TCL tenemos que X ∼ N (630, 3.5). Entonces, la probabilidad requerida
está dada por:
100
!  
X  X − 630 700 − 630
Pr Xi > 70000 = Pr X > 700 = Pr > '
i=1
3.5 3.5
' Pr (Z > 20) = 1 − Pr (Z ≤ 20) = 1 − 1 = 0

donde Z ∼ N (0, 1).


(d) El intervalo de confianza para la media está dado por:
 
35 35
605 − 1.65 √ , 605 + 1.65 √ = (596.8329, 613.1671)
50 50

En consecuencia, estamos más de un 90% seguros de que el salario mensual verdadero medio es menor
de 630e.

5
Examen Final de Estadı́stica I, 27 de Mayo de 2015.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER, TUR.

NORMAS: 1) Entregar cada problema en un cuadernillo distinto, aunque esté en blanco.


2) Realizar los cálculos con al menos dos cifras decimales significativas.
3) No se podrá abandonar el examen hasta transcurridos 30 minutos depués de haber empezado.
4) No está permitido salir del aula sin entregar el examen, aunque esté en blanco.

1. Se quiere determinar el impacto económico de los negocios de una gran compañia en las ventas totales
de pequeñas empresas. Para ello se obtiene una muestra de 15 de esas pequeñas empresas y se toman
los porcentajes del total de ventas anual de las 15 pequeñas empresas como resultado de las ventas a la
compañı́a:

27 12 14.9 1.2 0.1 1 0.1 5.3 7.6 5 1 1 3.2 3 7

(a) (0.5 puntos) Es la media muestral de los 15 porcentajes mayor que la mediana muestral? En caso
afirmativo, ¿qué sugiere este resultado? Justifica tus respuestas.
(b) (0.5 puntos) Calcular los tres cuartiles muestrales. Interpretarlos en términos de los porcentajes.
(c) (0.5 puntos) Calcular la cuasi-varianza y el coeficiente de variación de la muestra de 15 porcentajes.
(d) (1 punto) Dibujar un diagrama de caja de los datos e identificar los atı́picos (si hubiere). Justifica tu
respuesta.

Solución.

(a) La media muestral de los 15 porcentajes es x = 5.96, mientras que la mediana muestral es M =
3.2. Entonces, la media muestral es mayor que la mediana muestral. Este resultado sugiere que la
distribución de los datos es asimétrica a la derecha (asimetrı́a positiva), es decir, hay un número
reducido de pequeñas compañı́as para las que los porcentajes de ventas totales anuales a la gran
compañı́a son notablemente mayores que para el resto.
(b) Los cuartiles muestrales son Q1 = x(4) = 1, Q2 = x(8) = 3.2 y Q3 = x(12) = 7.6, respectivamente.
Entonces, el 25% de los porcentajes son menores que el 1%, el 50% de los porcentajes son menores
que el 3.2% y el 75% de los porcentajes son menores que el 7.6%. Consecuentemente, los tres cuartiles
muestrales dividen la muestra en cuatro sub-muestras que contienen respectivamente el mismo número
de porcentajes. En general, los porcentajes de ventas totales a la compañı́a para la mayorı́a de las
pequeñas empresas representa menos del 7.6%.
b2 = 53.2668, mientras que el coeficiente de variación muestral es
(c) La cuasi-varianza muestral es σ
CV = 1.2245.
(d) Para construir el diagrama de caja, necesitamos el rango intercuartı́lico que está dado por IQR =
Q3 −Q1 = 7.6−1 = 6.6. Más aún, para construir las barras del diagrama y para detectar atı́picos, si los
hay, necesitamos los valores Q1 −1.5IQR = 1−1.5×6.6 = −8.9 y Q3 +1.5IQR = 7.6+1.5×6.6 = 17.5.
Además, los valores máximo y mı́nimo en la muestra son 0.1 y 27, respectivamente. Entonces, hay un
sólo dato atı́pico ya que 17.5 < 27. El diagrama de caja aparece en la Figura 1.

2. Se realiza una encuesta a 500 personas estadounidenses acerca de su afiliación polı́tica y de su actitud
respecto a un plan nacional de salud. Las respuestas se disponen en una tabla de contingencias de acuerdo
a la afiliación polı́tica y la actitud como sigue:

Actitud
Afiliación Favor Indiferente Contrario Total
Demócrata 138 83 64 285
Republicano 64 67 84 215
Total 202 150 148 500

Dada la información previa, responder a las siguientes preguntas:


Diagrama de caja

0 5 10 15 20 25

(a) (1 punto) Obtener la distribución de frecuencias relativas conjunta de las dos variables y las distribu-
ciones de frecuencias relativas marginales.
(b) (0.5 puntos) Obtener la distribución condicional de Actitud dada Afiliación. ¿Qué actitud es más
frecuente entre Republicanos? Justifica tus respuestas.
(c) (0.5 puntos) Obtener la distribución condicional de Afiliación dada Actitud. ¿Qué afiliación polı́tica
es más favorable al plan nacional de salud? Justifica tus respuestas.
(d) (0.5 puntos) ¿Serı́a correcto decir que entre la gente que no se opone al plan de salud propuesto, la fre-
cuencia relativa de votantes Demócratas es mayor que la frecuencia relativa de votantes Republicanos?
Justifica tu respuesta.

Solución.

(a) La distribución de frecuencias relativa conjunta de las dos variables y las distribuciones de frecuencias
relativas marginales están dadas en la tabla siguiente:
Actitud
Afiliación Favor Indiferente Contrario Total
Demócrata 0.276 0.166 0.128 0.57
Republicano 0.128 0.134 0.168 0.43
Total 0.404 0.3 0.296 1
(b) La distribución condicional de Actitud dada Afiliación está dada por:
Actitud|Afiliación Favor Indiferente Contrario
f·|Democrata 0.4842105 0.2912281 0.2245614
f·|Republicano 0.2976744 0.3116279 0.3906977
Por lo tanto, la Actitud más frecuente entre Republicanos es Contrario.
(c) La distribución condicional de Afiliación dada Actitud está dada por:
Afiliación|Actitud f·|F avor f·|Indif erente f·|Contrario
Demócrata 0.6831683 0.5533333 0.4324324
Republicano 0.3168317 0.4466667 0.5675676
Por lo tanto, la Afiliación polı́tica con mayor Actitud favorable al plan de salud es Demócrata.
(d) La respuesta es Si. Notar que,
Afiliación|Actitud f·|N ocontraria f·|Contrario
Demócrata 0.6278409 0.4324324
Republicano 0.3721591 0.5675676

2
Por lo tanto, entre la gente que no se opone al plan de salud propuesto, la frecuencia relativa de
votantes Demócratas es mayor que la frecuencia relativa de votantes Republicanos.

3. El número de llamadas nocturnas a un servicio de emergencia de una empresa de calefacción y aire acondi-
cionado tiene probabilidades 0.05, 0.1, 0.15, 0.35, 0.2 y 0.15 para 0, 1, 2, 3, 4 y 5 llamadas por noche,
respectivamente.

(a) (0.5 puntos) Obtener la función de probabilidad del número de llamadas al servicio en una noche.
¿Cuál es la probabilidad de que el número de llamadas en una noche sea mayor de 3?
(b) (0.5 puntos) ¿Cuál es el número medio de llamadas por noche? ¿Y la varianza?
(c) (0.5 puntos) Suponiendo que el número de llamadas en noches diferentes sean independientes, ¿cuál
es el número medio de llamadas por semana? ¿y la varianza?
(d) (1 punto) Obtener la probabilidad (o una aproximación) de que el número de llamadas en un año
(365 dı́as) sea mayor que 1300.

Solución.

(a) La función de probabilidad del número de llamadas de emergencia, X, está dada por:


 0.05 x = 0
0.1 x = 1




0.15 x = 2

Pr (X = x) =

 0.35 x = 3
0.2 x = 4




0.15 x = 5

Por lo tanto, Pr (X > 3) = Pr (X = 4) + Pr (X = 5) = 0.2 + 0.15 = 0.35.


(b) La media está dada por:

E [X] = 0 × 0.05 + 1 × 0.1 + 2 × 0.15 + 3 × 0.35 + 4 × 0.2 + 5 × 0.15 = 3

mientras que la varianza está dada por:


2 2 2
V [X] = (0 − 3) × 0.05 + (1 − 3) × 0.1 + (2 − 3) × 0.15 +
2 2 2
+ (3 − 3) × 0.35 + (4 − 3) × 0.2 + (5 − 3) × 0.15 =
= 9 × 0.05 + 4 × 0.1 + 1 × 0.15 + 0 × 0.35 + 1 × 0.2 + 4 × 0.15 = 1.8

(c) La media y la varianza del número de llamadas de emergencia por semana, Y , coinciden con la media
de 7X y con siete veces la varianza de X. Entonces,

E [Y ] = 7 × E [X] = 7 × 3 = 21

mientras que
V [Y ] = 7 × V [X] = 7 × 1.8 = 12.6
(d) La media y la varianza del número de llamadas de emergencia por año, M , coinciden con la media de
365X y con 365 veces la varianza de X. Entonces,

E [M ] = 365 × E [X] = 365 × 3 = 1095

mientras que
V [M ] = 365 × V [X] = 365 × 1.8 = 657.
Por el TCL, tenemos que:
   
M − 1095 1300 − 1095 M − 1095
Pr (M > 1300) = Pr > = Pr > 7.997812 '
25.63201 25.63201 25.63201
' Pr (Z > 7.997812) = 1 − Pr (Z ≤ 7.997812) = 1 − 1 = 0,

donde Z ∼ N (0, 1).

3
4. El número de descargas por hora de cierta aplicación para móvil puede modelarse según una variable
aleatoria de media 100 y desviación tı́pica 20.

(a) (0.5 puntos) Dada una muestra de tamaño 100 se obtienen los siguientes gráficos para el número de
descargas por hora:
QQ Plot of Sample Data versus Standard Normal
180
35
160
30

Quantiles of Input Sample


140
25
120
20
100
15
80
10
60
5
40
0 −3 −2 −1 0 1 2 3
40 55 70 85 100 115 130 145 160 175 Standard Normal Quantiles

Razonar si el número de descargas por hora puede modelarse según una ley Normal.
(b) (0.75 puntos) Calcular la probabilidad (sin aproximar) de que en un dı́a (24 horas) la media de
descargas por hora esté comprendida entre 90 y 110, suponiendo que el número de descargas en cada
hora es una muestra aleatoria simple. ¿Qué otra hipótesis es necesario asumir?
(c) (0.75 puntos) Calcular la probabilidad aproximada de que en una semana (168 horas) el total de
descargas llegue a superar las 17000, suponiendo que el número de descargas en cada hora es una
muestra aleatoria simple. ¿Qué teorema es necesario aplicar para poder calcular esta probabilidad?
(d) (0.5 puntos) Se han controlado las descargas de la aplicación durante 40 horas obteniéndose una
media muestral de 99.5. Calcular el intervalo de confianza al 95% para la media de descargas por hora
(suponiendo σ = 20 y que el número de descargas en cada hora es una muestra aleatoria simple).

Solución:
(a) Atendiendo al histograma y al qq-plot parece que los datos no se alejan demasiado de la ley Normal.
(b) Si se supone que la v.a. X =“número de descargas por hora” sigue una ley N (100, 202 ), entonces
dadas n = 24 v.a. independientes y con la misma ley que X, la media muestral X̄n ∼ N (100, 202 /24).
Por tanto,

P (90 < X̄n < 110) = P (−2.45 < Z < 2.45) = 2 P (Z < 2.45) − 1 = 2 · 0.9929 − 1 = 0.9858,

donde Z ∼ N (0, 1). Para poder calcular esta probabilidad es necesario asumir que X tiene ley Normal.
(c) Dadas X1 , . . . , Xn , n = 168 v.a.Pindependientes y con la misma ley que X =“número de descargas
n
por hora”, consideramos la v.a. i=1 Xi = n X̄n . Puesto que n ≥ 30, el Teorema Central del Lı́mite
2
asegura que X̄n ∼ N (100, 20 /168). Entonces,
n
X
P( Xi > 17000) = P (n X̄n > 17000) = P (X̄n > 17000/168) ≈ P (Z > 0.77) = 0.2206,
i=1

donde Z ∼ N (0, 1).


(d) A partir de las descargas observadas en 40 horas (X1 , . . . , Xn v.a. i.i.d. con n = 40) se obtuvo una
media muestral de x̄n = 99.5. Suponiendo σ = 20, el intervalo de confianza al 95% para la media de
descargas es
√ √
x̄n ∓ z1−α/2 σ/ n = 99.5 ∓ 1.96 · 20/ 40 = 99.5 ∓ 6.20 = (93.3, 105.7).

4
Estadı́stica I Examen Extraordinario, 24 Junio 2014.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER.

REGLAS DEL EXAMEN: 1) Usar cuadernillos separados para cada problema. 2) Hacer los
cálculos con al menos dos decimales significativos. 3) No se puede abandonar el examen durante
los primeros 30 minutos. 4) No está permitido salir de la clase sin entregar el examen.

1. El siguiente conjunto de datos muestra el número de coches vendidos en un mes en 23 concesionarios


diferentes:

9 8 14 23 23 27 18 18 8 21 20 18 14 20 29 18 33 19 23 24 24 14 19

(a) (0.5 puntos) ¿Es la media de las ventas mensuales anteriores mayor de 20? ¿Y la mediana? ¿Es cierto
que la venta más frecuente durante el mes fue de 20 coches? Justificar las respuestas.
(b) (0.5 puntos) Calcular la cuasi-varianza muestral y el coeficiente de variación muestral para el conjunto
de datos.
(c) (1 punto) Dibujar un diagrama de caja para el conjunto de datos, obteniendo para ello las medidas
numéricas necesarias. ¿Es cierto que la forma de la distribución presenta una fuerte asimetrı́a a la
derecha? Justificar la respuesta.
(d) (0.5 puntos) Basándose en el diagrama de cajas realizado en el apartado anterior, ¿hay atı́picos en el
conjunto de datos? Justificar la respuesta.

Solución.

(a) La media muestral es x = 19.30. La mediana muestral es M = 19. La moda muestral es 18. Entonces,
la respuesta es NO para todas las preguntas.
b2 = 40.13043. El coeficiente de variación muestral es 0.3281.
(b) La cuasi-varianza muestral es σ
(c) Los cuartiles muestrales son Q1 = 14, Q2 = 19 y Q3 = 23. Entonces, el rango intercuartı́lico muestral
es IQR = 23 − 14 = 9. El diagrama de caja es:

10 15 20 25 30

La distribución es ligeramente asimétrica a la derecha. Por lo tanto, no es fuertemente asimétrica.


(d) Por un lado, tenemos que Q1 −1.5IQR = 14−1.5×9 = 0.5. Por otro lado, tenemos que Q3 +1.5IQR =
23 + 1.5 × 9 = 36.5. Como los valores mı́nimo y máximo en la muestra son 8 y 33, respectivamente,
y 0.5 < 8 y 36.5 > 33, concluimos que no hay datos atı́picos.
2. Un joven emprendedor abre un negocio en una ciudad. Según cierta información fiable sobre negocios
similares en dicha ciudad, se conoce que el 25% de ellos tienen ingresos anuales de hasta 1 millón de euros
(incluido), el 50% de ellos tienen ingresos anules entre 1 (no incluido) y 2 millones de euros (incluido), y
el resto tiene ingresos anules entre 2 (no incluido) y 3 millones de euros (incluido). Dada la información
anterior, y suponiendo que los negocios en cada una de las franjas de beneficio consideradas se distribuyen
uniformemente, se pide responder a las siguientes preguntas:

(a) (0.75 puntos) Obtener la función de distribución acumulada de los ingresos anuales (en millones de
euros).
(b) (0.25 puntos) Obtener la probabilidad de que los ingresos anules del negocio abierto por el joven
emprendedor estén entre 0.5 (no incluido) y 1.5 (incluido) millones de euros.
(c) (0.75 puntos) Calcular el valor esperado y la desviación tı́pica de los ingresos anuales (en millones de
euros).
(d) (0.75 puntos) Si el negocio tiene éxito, el joven emprendedor planea abrir otro negocio más pequeño
que el primero. Se sabe que los ingresos anuales de los negocios más pequeños son un cuarto de los
ingresos anuales de los negocios grandes. Entonces, ¿cuáles son los ingresos esperados del segundo
negocio? ¿y la desviación tı́pica?

Solución.

(a) Sea X los ingresos anuales del negocio (en millones de euros). Entonces, la función de densidad de X
está dada por:  1
x≤1
 41


2 1<x≤2
f (x) = 1
2<x≤3
 4


0 en otro caso
Por lo tanto, la función de distribución acumulada se puede calcular como:
• Para x ≤ 0,
F (x) = 0
• Para 0 < x ≤ 1, Z x
1 x
F (x) = dx =
0 4 4
• Para 1 < x ≤ 2,
Z 1 Z x  
1 1 1 1 1 1
F (x) = dx + dx = + (x − 1) = x−
0 4 1 2 4 2 2 2

• Para 2 < x ≤ 3,
Z 1 Z 2 Z x
1 1 1
F (x) = dx + dx + dx =
0 4 1 2 2 4
1 1 1 1
= + + (x − 2) = (x + 1)
4 2 4 4
• Para 3 < x,
F (x) = 1
En resumen, 
 0 x<0
x

0<x≤1


 4
1
x − 12

F (x) = 2 1<x≤2
1
(x + 1) 2<x≤3



 4
1 3≤x

2
(b) La probabilidad de que los ingresos anuales del negocio (en millones de euros) estén entre 0.5 y 1.5
millones de euros está dada por:
1 1 3
Pr (0.5 < x ≤ 1.5) = F (1.5) − F (0.5) = − = = 0.375
2 8 8

(c) La esperanza de X está dada por:


Z 3 Z 1 Z 2 Z 3
x x x
E [X] = xf (x) dx = dx + dx + dx =
0 0 4 1 2 2 4
2 |x=1 2 |x=2 2 |x=3
x x x 1 3 5 3
= + + = + + = = 1.5 millones de euros
8 |x=0 4 |x=1 8 |x=2 8 4 8 2

La varianza de X está dada por:


2
V [X] = E X 2 − E [X]
 

donde:
3 1 2 3
x2 x2 x2
Z Z Z Z
E X2 = x2 f (x) dx =
 
dx + dx + dx =
0 0 4 1 2 2 4
3 |x=1 3 |x=2 3 |x=3
x x x 1 7 19 17
= + + = + + =
12 |x=0 6 |x=1 12 |x=2 12 6 12 6

Entonces,
17 9 7
V [X] = − = ' 0.5833
6 4 12
q
7
y la desviación tı́pica es 12 ' 0.7637 millones de euros.
(d) Los ingresos anuales esperados del segundo negocio y su desviación tı́pica son un cuarto de las corre-
spondientes al primer negocio. Entonces, el valor esperado es 38 = 0.375 millones de euros, mientras
que la desviación tı́pica es 0.1909.

3. Cada dı́a un agente de ventas llama a 25 hogares independientes para intentar vender un nuevo producto,
ganando una comisión de 45 euros por venta. Basado en su experiencia, el agente realiza, en promedio,
una venta de cada seis llamadas en hogares con niños en edad escolar, y una venta de cada diez llamadas
en hogares sin niños en edad escolar. El agente desconoce por completo el tipo de hogar al que va a llamar,
pero sabe que el 30% de los hogares tienen niños en edad escolar. Se pide obtener:

(a) (0.5 puntos) La probabilidad de que se produzca una venta en una llamada cualquiera.
(b) (0.5 puntos) La probabilidad de que el número de ventas en un dı́a cualquiera sea 3 o menos de 3.
(c) (0.5 puntos) La media, varianza y desviación tı́pica de la comisión total por ventas en un dı́a.
(d) (1 punto) La probabilidad (o una aproximación de ella) de que el agente gane en una semana (5 dı́as
de trabajo) más de 1000 euros en comisiones por ventas.

Solución.

(a) Por la ley de probabilidad total, escribiendo “niños en edad escolar” como NEE, la probabilidad de
que una llamada resulte en una venta es:

Pr (Venta) = Pr (Venta|NEE) Pr (NEE) + Pr (Venta|No NEE) Pr (No NEE) =


1 3 1 7
= × + × = 0.12
6 10 10 10

3
(b) El número de ventas en un dı́a es N ∼ Bin (25, 0.12). Por lo tanto, la probabilidad de que el número
de ventas en un dı́a sea 3 o menos de 3 está dado por:
Pr (N ≤ 3) = Pr (N = 0) + Pr (N = 1) + Pr (N = 2) + Pr (N = 3) =
   
25 0 25 25 24
= 0.12 (1 − 0.12) + 0.121 (1 − 0.12) +
0 1
   
25 2 23 25 22
+ 0.12 (1 − 0.12) + 0.123 (1 − 0.12) =
2 3
= 1 × 0.0409 + 25 × 0.0056 + 300 × 0.0008 + 2300 × 0.0001 =
' 0.6475

(c) La media, varianza y desviación tı́pica de N están dadas por:


E [N ] = 25 × 0.12 = 3
V [N ] = 25 × 0.12 × 0.88 = 2.64

DT [N ] = 2.64 = 1.6248

Entonces, la media, varianza y desviación tı́pica de la comisión de ventas totales en un dı́a están dadas
por:
E [45N ] = 45 × E [N ] = 45 × 3 = 135 euros
V [45N ] = 452 × V [N ] = 5346 euros2
DT [45N ] = 45 × DT [N ] = 45 × 1.6248 = 73.116 euros

(d) El número de ventas en una semana es M ∼ Bin (125, 0.12). Entonces, la comisión total ganada en
una semana de trabajo es W = 45M . La media, varianza y desviación tı́pica de M está dada por:
E [M ] = 125 × 0.12 = 15
V [M ] = 125 × 0.12 × 0.88 = 13.2

DT [M ] = 13.2 = 3.6331
Usando el TCL, obtenemos que:
Pr (W > 1000) = Pr (45M > 1000) = Pr (M > 22.22) =
 
M − 15 22.22 − 15
= Pr > ' Pr (Z > 1.9872) =
3.6331 3.6331
= 1 − Pr (Z < 1.9872) = 1 − 0.9761 = 0.0239
donde Z ∼ N (0, 1).

4. Los clientes de un banco pueden ingresar o retirar dinero. Sea X la cuantia de una operación realizada por
un cliente donde el valor de X es positivo, si el dinero es ingresado, o negativo, si el dinero es retirado. Los
analistas del banco asumen que la esperanza y la desviación tı́pica de X son 0 y 100 euros, respectivamente.

(a) (1 punto) Calcular la probabilidad de que la media de 100 operaciones realizadas por clientes inde-
pendientes esté entre −3 and 3 euros.
(b) (0.5 puntos) Sin realizar ningún tipo de cálculo adicional, decidir si la probabilidad en el apartado (a)
será mayor o menor si el tamaño muestral aumenta. Justificar la respuesta.
(c) (0.5 puntos) Supongamos que 100 clientes visitan el banco un cierto dı́a. Calcular la probabilidad de
que la suma de operaciones al final de dicho dı́a sea positiva.
(d) (0.5 puntos) Incluso si el banco asume que el valor esperado de X es 0, los analistas del banco sospechan
que últimamente los clientes ingresan más dinero del que retiran. Para comprobar esta sospecha, los
analistas toman una muestra de 25 operaciones realizadas por clientes independientes y obtienen una
media muestral de 50 euros. Se pide obtener un intervalo de confianza al 90% para el valor esperado
suponiendo que la distribución de X es Gaussiana con desviación tı́pica 100. ¿Que nivel de confianza
tienes de que el valor esperado sea realmente mayor que 0?

4
Solución:
 
(a) Como n ≥ 30, por el TCL tenemos que X ∼ N 0, 100 √
n
= N (0, 10). Entonces, la probabilidad
requerida está dada por:
 
 −3 X 3
Pr −3 < X < 3 = Pr < < ' Pr (−0.3 < Z < 0.3) =
10 10 10
= Pr (Z < 0.3) − Pr (Z < −0.3) = 0.6179 − 0.3821 = 0.2358

donde Z ∼ N (0, 1).


(b) Si el tamaño muestral aumenta, la varianza de X decrece. Por lo tanto, la probabilidad de X de estar
en el intervalo (−3, 3) aumentará.
(c) Queremos calcular la siguiente probabilidad:
n
!
X
Pr Xi > 0
i=1

Esta probabilidad es equivalente a: 


Pr X > 0
 
Entonces, como en a), por el TCL tenemos que X ∼ N 0, 100

n
= N (0, 10). Entonces, la probabilidad
requerida está dada por:
n
!  
X  X
Pr Xi > 0 = Pr X > 0 = Pr > 0 ' Pr (Z > 0) = 0.5
i=1
10

donde Z ∼ N (0, 1).


(d) El intervalo de confianza para la media al 90% está dado por:
 
100 100
50 − 1.65 √ , 50 + 1.65 √ = (17, 83)
25 25

Consecuentemente, estamos más de un 90% seguros de que la media verdadera sea positiva.

5
Examen Final de Estadı́stica I, 26 de Mayo de 2014.
Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER.

NORMAS: 1) Entregar cada problema en un cuadernillo distinto, aunque esté en blanco.


2) Realizar los cálculos con al menos dos cifras decimales significativas.
3) No se podrá abandonar el examen hasta transcurridos 30 minutos depués de haber empezado.
4) No está permitido salir del aula sin entregar el examen, aunque esté en blanco.

1. En las siguientes tablas y gráficos se recoge información sobre las atenciones sanitarias no domiciliarias
atendidas a través del teléfono 112 de Protección Civil durante los últimos 180 dı́as en Pamplona. Para
cada dı́a se ha observado el tiempo medio de respuesta (en minutos) de las ambulancias para accidentes
con heridos y el número de accidentes atendidos según su tipologı́a (accidente de tráfico, laboral y otros).

Tabla 1: Tiempo medio de respuesta (en minutos)


(a) Global (b) de Lunes a Viernes (c) Sábado y Domingo
Tiempo medio respuesta Tiempo medio respuesta
Tiempo medio respuesta Tipo de accidente (de lunes a viernes) (sábado y domingo)
Media 13.9189854 Media 12.65007263 Media 20.26354953
Mediana Tipo día tráfico laboral
7.72569374 Mediana otros 7.43135166 Mediana 16.45645042
de Lunes
Desviación a Viernes
típica 111
14.12497499 Desviación 30 típica 150 12.75266538 Desviación típica 18.59931717
Sábado
Varianza de ylaDomingo
muestra 26
199.5149151 Varianza 3de la muestra 30 162.6304743 Varianza de la muestra 345.9345992
Curtosis 137
2.0083481110 Curtosis 33 180 2.762768312 Curtosis -0.193607802
Coeficiente de asimetría 1.52135364 Coeficiente de asimetría 1.650832286 Coeficiente de asimetría 0.858543921
Rango 65.1620149 Rango 61.09465423 Rango 64.99579226
Mínimo Tipo de accidente más0.02300493
frecuente / tipo de día
Mínimo 0.023004926 Mínimo 0.189227592
Máximo trafico laboral
65.1850198 Máximootros 61.11765915 Máximo 65.18501985
Suma Lunes a Viernes 0.74
2505.41738 0.06Suma 0.2 1 1897.510894 Suma 607.9064858
Sábado-Domingo
Tamaño muestral 0.8666667 0.0333333
180 Tamaño0.1 muestral 1 150 Tamaño muestral 30

Tabla 2: Número de accidentes atendidos Gráfico 2: Tiempo medio de respuesta según el tipo de dı́a
Tipo de accidente 70
Tipo día tráfico laboral otros
de Lunes a Viernes 111 9 30
60
Sábado y Domingo 26 1 3
e respuesta (minutos)

Gráfico 1: Tiempo medio de respuesta (global) 50


100

40
80

Tiempos medios de

30
60
Frequency

20
40

10
20

0
0

Lunes a Viernes Sábado-Domingo


0 10 20 30 40 50 60 70 n = 150 n = 30

tiempo respuesta (minutos)

Responde justificadamente a las siguientes cuestiones, indicando claramente las tablas y/o gráficos que
utilizas para tu razonamiento:

a) (0.5 puntos) Describe la forma de la distribución del tiempo medio de respuesta (global) e indica si hay
datos atı́picos. ¿Qué medida de centralización es más adecuada utilizar en este caso y por qué?
b) (0.75 puntos) Justifica si son ciertas o falsas las afirmaciones siguientes: [1] En más de la mitad de
los casos el tiempo medio de respuesta de las ambulancias durante los fines de semana es más de dos
veces superior al de los dı́as laborables. [2] En el 75% de los casos el tiempo medio de respuesta de las
ambulancias durante los fines de semana es superior a 30 minutos.
c) (0.5 puntos) Si tuvieras que dar un tiempo máximo de respuesta por debajo del cual pudieras garantizar
que se ha atendido el 75% de las emergencias de lunes a viernes, ¿qué tiempo darı́as?
d) (0.75 puntos) Obtén las distribuciones de la variable tipo de accidente condicionadas al tipo de dı́a y
determina en qué tipo de dı́a son más frecuentes los accidentes de tráfico.
Solución.
a) El Gráfico 1 es el histograma de la distribución de frecuencias absolutas de la variable tiempo medio de
respuesta (en minutos) (sin distinguir por tipo de dı́a). Se observa claramente que la distribución es
asimétrica (con asimetrı́a a la derecha, positiva).
Al tratarse de una distribución asimétrica es mejor dar la Mediana como medida de centralización. En
este caso, el tiempo mediano de respuesta (ver panel (a) de la Tabla 1) es de 7.7257 minutos.
De forma aproximada (a partir del Gráfico 1) puede llegar a intuirse la presencia de datos atı́picos. El
razonamiento serı́a el siguiente: El tercer cuartil está en la posición 135, que corresponde a un valor
situado entre 10 y 20, es decir, Q3 ∈ (10, 20). Por tanto, se deduce que Q3 < 20, al igual que RIC < 20.
Ası́, Q3 + 1.5 RIC < 50, con lo que cualquier dato superior a 50 puede ser considerado como atı́pico.
b) La afirmación [1] es cierta, puesto que la mediana del tiempo medio de respuesta de las ambulacias
durante los fines de semana es de 16.46, mientras que de lunes a viernes vale 7.43 (ver paneles (b) y (c)
de la Tabla 1 y también diagramas de caja del Gráfico 2). Sin embargo, la afirmación [2] es falsa, puesto
que en el diagrama de caja del Gráfico 2 se observa que, para los fines de semana, el tercer cuartil del
Tipo de accidente más frecuente
tiempo medio de respuesta es 31. Por tanto, el tiempo medio de repuesta es inferior a 31 minutos en el
75% de los casos. Tipo día trafico laboral otros
Lunes a Viernes 111 9 30 150
c) Nos están pidiendo el tercer cuartil de la 26
Sábado‐Domingo muestra: 1Q3 . En el3 diagrama
30 de cajas correspondiente se
aprecia que Q3 ≈ 18 minutos. 137 10 33 180
d) Para poder compararlas es más conveniente obtener las distribuciones condicionadas relativas (obtenidas
a partir de la Tabla 2), que son:

Tipo de accidente más frecuente / tipo de día
trafico laboral otros
Lunes a Viernes 0,74 0,06 0,2 1
Sábado‐Domingo 0,8666667 0,0333333 0,1 1

De ella se observa que los accidentes de tráfico son más frecuentes durante el fin de semana, con un
porcentaje del 86.67%.

2. Una empresa paga una cuota mensual de 175 euros en concepto de suscripción a un servicio de reparaciones.
Además, cada visita de un técnico para realizar una reparación en la empresa cuesta 350 euros. Se sabe
que la media de averı́as es de 9.5 al mes, con una desviación tı́pica de 2.
a) (0.5 puntos) Calcula el valor esperado y la varianza del coste mensual de las reparaciones (incluyendo
la cuota mensual).
b) (0.75 puntos) Utilizando la desigualdad de Chebyshev, da una cota para la probabilidad de que en un
mes determinado el coste de las reparaciones sea menor o igual que 2000 o mayor o igual que 5000 euros.
c) (0.75 puntos) Si se supone que el coste mensual sigue una distribución uniforme continua con la esperanza
y la varianza obtenidas en a), calcula de nuevo la probabilidad del apartado anterior.
d) (0.5 puntos) A qué se debe la diferencia entre los resultados obtenidos en los apartados b) y c)?
Solución.
a) X = número de averı́as al mes. E[X] = 9.5 y V ar[X] = 22 = 4.
Sea C = coste mensual de las reparaciones. Como C = 350X+175, entonces E[C] = 350·9.5+175 = 3500
y V ar[C] = 3502 · 4 = 490000.
b)

P (C ≤ 2000 ó C ≥ 5000) = P (C − 3500 ≤ −1500 ó C − 3500 ≥ 1500) = P (|C − 3500| ≥ 1500)


Des.Cheb. V ar[C] 490000
= P (|C − E[C]| ≥ 1500) ≤ = = 0.22.
15002 15002
2
(b−a)
c) Si C ∼ U (a, b), entonces E[C] = a+b
2 = 3500 y V ar[C] = 12 = 490000. Por tanto
) √ )
a+b  7000− 12·490000
2 = 3500 a = √7000 − b a = = 2287.56
(b−a)2 ⇔ ⇔ √ 2
12 = 490000 b−a = 12 · 490000 b = 12 · 490000 + 2287.56 = 4712.44

Es decir, C ∼ U (2287.56, 4712.44) por lo que P (C ≤ 2000 C ≥ 5000) = 0.


d) En el primer caso sólo contamos con los valores de la esperanza y la varianza, y la desigualdad de
Chebyshev proporciona una cota muy gruesa de la probabilidad que se quiere calcular. En el segundo
caso, al disponer de la distribución de la variable aleatoria podemos calcular la probabilidad de manera
exacta.

3. La función de densidad asociada a la duración en dı́as de un determinado producto es:



k (2 − x), si 0 < x < 2,
f (x) =
0, en otro caso,

para un cierto valor de k.


a) (0.5 puntos) Determinar el valor de la constante k.
b) (0.5 puntos) Si el producto solamente está en condiciones óptimas para su venta entre 12 horas y 48
horas después de haber sido producido, calcular la probabilidad de que el producto esté en condiciones
óptimas para su venta. (Considerar que un dı́a son 24 horas).
c) (0.75 puntos) Una determinada empresa tiene capacidad para producir 4 de estos productos cada dı́a.
¿Cuál es la probabilidad que no pueda vender todos los productos fabricados en el último dı́a?
d) (0.75 puntos) La empresa quebrará si no puede vender todos los productos fabricados en al menos 320
dı́as del año. Calcular la probabilidad de quiebra de la empresa. (Considerar que un año son 365 dı́as).
Solución:
R2   2
x2
a) 0 k (2 − x) dx = 1 ⇒ k 2x − =1 ⇒ k = 12 .

2
0
b) Sea X la v.a. que representa la duración en dı́as de cierto producto. Si el producto solamente está en
condiciones óptimas para su venta entre 12 horas y 48 horas después de haber sido producido, entonces
P (0.5 < X < 2) = 0.5625.
c) Sea Y la v.a. que cuenta el número de productos óptimos para la venta de un total de 4. Y ∼
B(4, 0.5625) y entonces, P (Y < 4) = 1 − P (Y = 4) = 0.899.
d) Sea T la v.a. que cuenta el número de dı́as de un total de 365 en que no se venden todos los productos
fabricados. T ∼ B(365, 0.899) que puede aproximarse por el TCL como N (328.46, 5.983) y, por tanto,
P (“quiebra00 ) = P (T > 320) = P (Z > −1.41) = 1 − 0.0808 = 0.9192, donde Z ∼ N (0, 1).
4. Los puntos anotados por un equipo de baloncesto a lo largo de un partido pueden modelarse según una
variable aleatoria de media 90 y desviación tı́pica 30.
(a) (0.5 puntos) Si tomamos una muestra de 35 partidos, calcular la probabilidad de que el puntuaje
promedio de dicho equipo esté entre 80 y 100 puntos.
(b) (0.75 puntos) Calcular un intervalo de confianza al 95% para la media de puntos anotados por partido.
Suponer que tomamos una muestra de 35 partidos y que la media muestral toma un valor de 85.
Interpretar el resultado.
(c) (0.75 puntos) Suponer ahora que, para el intervalo de confianza del apartado b), se quiere reducir su
longitud en un 10%. Determinar el tamaño muestral (número de partidos) para que eso suceda.
(d) (0.5 puntos) Suponer ahora que el equipo contrata a un nuevo entrenador con el que se espera reducir
la desviación tı́pica hasta 15 (sin cambiar la media). Si una temporada tiene 50 partidos, dibujar
(de forma aproximada) la función de densidad del puntuaje promedio de una temporada para ambos
entrenadores y comparar ambas curvas. Comentar los resultados.

Solution:
a) Puesto que n > 30, puede aplicarse elTLC, que asegura queX tiene una ley aproximadamente normal.
80−90 100−90

En concreto: P 80 < X < 100 = P 30/ √
35
< Z < 30/ √
35
= P (−1.97 < Z < 1.97) = 0.9512, donde
X̄−90
Z= √
30/ 35
sigue aproximadamente una distribucin N (0, 1).
b) En virtud del TLC, el intervalo de confianza es I.C.95% (µ) = x±1.96 √σn = 85±1.96 √3035 = [75.06, 94.94].
No serı́a correcto afirmar que con un 95% de probabilidad, el verdadero valor de la media está entre
[75.06, 94.94]. Sin embargo, sı́ podrı́amos afirmar que el 95% de las veces que construimos un I.C. del
modo anterior, encontraremos el verdadero valor de la media dentro de los mismos.
c) La longitud del intervalo es 2 × 1.96 × √σn1 . Por tanto, queremos un n2 tal que la nueva longitud del
intervalo sea 2 × 1.96 × √σn1 × 0.9. Por tanto, tenemos la siguiente relación:

σ σ n1 35
2 × 1.96 × √ × 0.9 = 2 × 1.96 × √ ⇒ n2 = = = 43.2 → n2 = 44.
n1 n2 0.92 0.92

d) Si dibujamos las funciones de densidad para el puntuaje promedio de un partido en una temporada,
i.e. para X, vemos que para ambos entrenadores la función está centrada en la misma media. Sin
embargo, el segundo entrenador tiene un promedio de puntuaje más estable, por lo que dará resultados
más homogéneos a lo largo de la temporada.

También podría gustarte