Está en la página 1de 92

ESTADÍSTICA

Grado en Ingeniería Informática

EJERCICIOS

Curso 2019/20

Departamento de Matemática Aplicada


Escuela de Ingeniería Informática de Valladolid
UNIVERSIDAD DE VALLADOLID
BLOQUE 1

INTRODUCCIÓN Y ANÁLISIS DE DATOS

3
1

Exploración y descripción de datos univariantes


1.1 La Tabla 1.1 muestra las quejas registradas, durante un año, sobre las características de la
comodidad de una línea aérea de bajo coste.
Construir la tabla estadística adecuada y el grá…co de sectores.

1.2 El número de accidentes de circulación en carretera por colisión con obstáculos fuera de la
calzada ocurridos en España durante 1990 fue de 7750 y se distribuyeron según indica la
Tabla 1.2.
Construir la tabla estadística adecuada y el grá…co de sectores.

1.3 Con los siguientes datos construir un diagrama de tallos y hojas: 38:75, 41:87, 43:79, 43:84,
39:17, 47:61, 44:19, 42:73, 41:00, 47:37, 43:18, 41:23, 39:30, 40:87, 44:44, 47:93, 42:91, 46:60,
44:94, 43:18.

1.4 El número de palabras de que constan los títulos de los veinte primeros capítulos de la obra
de “D. Quijote de la Mancha”son: 15, 15, 13, 12, 11, 19, 13, 28, 19, 14, 10, 13, 13, 14, 17, 16,
29, 21, 25 y 31.
(a) Construir la tabla estadística adecuada, el diagrama de barras y el diagrama de tallo y
hojas.
(b) Calcular las características de tendencia central, los cuartiles y los deciles.
(c) Calcular la desviación típica y el rango intercuartílico.
(d) Construir el diagrama de caja.
(e) Calcular los coe…cientes de asimetría de Bowley-Yule y Pearson.

1.5 En las últimas 18 semanas, un departamento de policía registró 4, 7, 3, 3, 9, 7, 5, 10, 5, 9, 8,


5, 5, 6, 3, 4, 8 y 7 asaltos a mano armada.
(a) Construir la tabla estadística adecuada.
(b) Construir el diagrama de barras y el diagrama de tallo y hojas.
(c) Calcular las características de tendencia central, los cuartiles y los deciles.
(d) Calcular la desviación típica y el rango intercuartílico.
(e) Construir el diagrama de caja.
(f) Calcular los coe…cientes de asimetría.

1.6 El tiempo entre llegadas de los autobuses a una determinada parada fue el siguiente (en
minutos): 63, 96, 65, 79, 33, 82, 58, 76, 98, 24, 48, 87, 74, 81, 98, 75, 94, 67, 97, 103, 71, 84,
61, 87, 61.
(a) Construir el diagrama de tallo y hojas.
(b) Agrupar y clasi…car los datos en clases.
(c) Realizar el histograma.
(d) Calcular las características de tendencia central con datos agrupados y sin agrupar.
Comparar los resultados obtenidos.
(e) Calcular los cuartiles (con los datos agrupados y sin agrupar).

5
6 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(f) Calcular la varianza, el recorrido y el recorrido intercuartílico.


(g) Construir el diagrama de caja.
(h) Calcular las características de asimetría.

1.7 Las puntuaciones obtenidas en un test de inteligencia por un grupo de personas aspirantes a
un puesto de trabajo se muestran en la Tabla 1.3

(a) Construir el diagrama de tallo y hojas.


(b) Agrupar y clasi…car los datos en clases.
(c) Realizar el histograma.
(d) Calcular las características de tendencia central con datos agrupados y sin agrupar.
(e) Calcular los cuartiles (con los datos agrupados y sin agrupar).
(f) Calcular la varianza, el recorrido y el recorrido intercuartílico.
(g) Construir el diagrama de caja.
(h) Calcular las características de asimetría.

1.8 En un centro de proceso de datos se han ido registrando, durante un año, el número de días
que cada nuevo programa informático funciona, seguido y sin fallar, la primera vez que se
instala. Los resultados obtenidos se muestran en la tabla siguiente.

Número de programas 2 6 10 5 10 3 2 2
Número de días 1 2 3 4 5 6 7 8

(a) Construir la tabla estadística adecuada y el diagrama de barras.


(b) Calcular las características de tendencia central, los cuartiles y los deciles.
(c) Calcular la desviación típica, el rango intercuartílico y los coe…cientes de asimetría.

1.9 La tabla siguiente muestra la distribución de los establecimientos de una ciudad según su
número de empleados:

Número de empleados 1 5 5 20 20 50 50 100 100 200


Número de establecimientos 317 79 33 12 5

(a) Realizar el histograma.


(b) Calcular las características de tendencia central, los cuartiles y los percentiles 10 y 75.
(c) Calcular la varianza, el recorrido y el recorrido intercuartílico.

1.10 Sea x una variable estadística que toma los valores xi con frecuencias ni (i = 1; :::; k). Sea x
su media, M ox su moda, xe su mediana y sx su desviación típica. Sea z la variable tipi…cada,
x x
z=
sx
Calcular las cuatro características anteriores para la variable estadística z.

1.11 Una compañía de seguros de automóviles paga por cada siniestro en media 800 euros con una
desviación típica de 400 euros.
(a) Obtener el intervalo centrado de la media que recogerá al menos las dos terceras partes
de los pagos.
(b) Calcular la proporción máxima de pagos que quedará fuera del intervalo [200; 1400].
Exploración y descripción de datos univariantes 7

(c) ¿Es posible que no haya ningún pago dentro del intervalo [360; 1240]?

1.12 La tabla siguiente muestra los resultados de un examen realizado por 200 alumnos.

Notas 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10
Núm. al. 8 19 26 33 31 28 22 14 12 7

Calcular:
(a) Media y desviación típica.
(b) La nota mínima para obtener las distintas cali…caciones si el profesor quiere que haya un
30 % de suspensos, un 40 % de aprobados, un 15 % de notables, un 10 % de sobresalientes
y un 5 % de matrículas de honor.

1.13 A cierto número de plazas convocadas por una empresa se presentaron 222 solicitudes. Una
tercera parte no se presentó al examen por diversas circunstancias y el resto obtuvo las
siguientes puntuaciones:

Puntuación 0 2 2 4 4 6 6 8 8 10
Número de personas 15 30 55 30 18

(a) ¿Con qué nota mínima se ha de admitir a los examinados si se quieren cubrir 37 puestos
de trabajo?
(b) ¿Qué porcentaje de los examinados obtuvo una nota mayor que 5 y se quedó sin plaza?

1.14 Una prestigiosa frutería tiene como norma clasi…car los mangos, según su tamaño de cara a
su venta, en superiores y normales. Los superiores son aquellos cuyo peso es superior a 450
g. De una partida, representativa de los mangos que recibe normalmente se ha obtenido los
siguientes resultados:

Peso (250; 300] (300; 350] (350; 400] (400; 450] (450; 500]
Núm. unid. 3 10 15 25 32
Peso (500; 550] (550; 600] (600; 700] (700; 800]
Núm. unid. 20 19 4 2

(a) Si decide retirar de la venta aquellos cuyo peso sea a lo sumo el del centil 5, ¿qué peso
máximo puede alcanzar un mango que no se vende al público?
(b) ¿En qué centil estará un mango que pesa 580 g?
(c) Un aristócrata exquisito ha acordado con el frutero quedarse con los mangos cuyo peso
sea superior a 625 g. ¿Qué porcentaje de mangos se destinará a este aristócrata?

1.15 En 1879 Michelson obtuvo los siguientes valores para la velocidad de la luz en el aire (se dan
los resultados restando 299.000 a los datos originales, en km/s, para facilitar su manejo): 850,
740, 900, 1.070, 930, 850, 950, 980, 980, 880, 1.000, 980, 930, 650, 760.
En 1882 Newcomb, utlizando otro procedimiento, obtuvo (restando de nuevo 299.000): 883,
816, 778, 796, 682, 711, 611, 599, 1.051, 781, 578, 796, 774, 820, 772. Se pide:
(a) Diagramas de tallo y hojas para ambas distribuciones.
(b) Diagramas de caja para las dos distribuciones.
(c) Medias y desviaciones típicas.
(d) ¿Qué conclusiones pueden extraerse?
8 Estadística (E.I.I. de Valladolid, Curso 2019/20)

1.16 Un experimento para investigar el tiempo de duración en horas de un componente electrónico


consiste en colocar las partes en una celda de prueba y utilizarlas durante 100 horas bajo
condiciones de temperatura elevada. Se prueban ocho componentes y se obtienen los siguientes
tiempos de fallo:
75 63 100+ 36 51 45 80 90
La observación “100+” indica que la unidad continúa funcionando después de 100 horas.
¿Existe alguna medida signi…cativa de centralización de estos datos que pueda calcularse a
partir de ellos? ¿Y de dispersión? ¿Cuáles son sus valores numéricos?

1.17 Un empresario con 748 empleados paga a éstos un total de 474 980 euros mensuales. Se sabe
que la desviación típica de esa variable es de 97:23 euros. Una subida del 10 % representa
para el empresario un incremento en la nómina del personal de 47 498 euros mensuales. La
subida se puede hacer llegar a los trabajadores según dos principios:
(i) Cada empleado percibe un aumento del 10 % en su remuneración.
(ii) Cada empleado percibe mensualmente un aumento lineal de 63:50 euros.
¿Cuál de los dos procedimientos es más favorable para la reducción de la variabilidad salarial?
Razonar la respuesta.

1.18 Sea x una variable estadística positiva, considerar la transformación y = 1=x. Estudiar la
relación entre los percentiles de ambas variables.

1.19 Una empresa de servicios realizó un estudio sobre el número de clientes que pagaron diaria-
mente al mediodía durante un mes. Los indicadores resultantes fueron los siguientes:

M edia = 29 M ediana = 28:5 M oda = 28


M {nimo = 20 Desviacion estandar = 3:6 P rimer cuartil = 26
T ercer cuartil = 32 Rango o recorrido = 17

(a) ¿A cuántos clientes atendió, durante el mediodía, más a menudo que cualquier otro
número? Razonar la respuesta.
(b) ¿En cuántos días hubo entre 26 y 32 clientes que pagaron al mediodía? Razonar la
respuesta.
(c) ¿Cuál fue el mayor número de clientes que pagaron durante cualquier hora del mediodía?
Razonar la respuesta.
(d) ¿Para cuántos de los treinta días (un mes) el número de clientes que pagaron está a
menos de tres desviaciones típicas de la media? Razonar la respuesta.

1.20 Se dispone de las siguientes observaciones de una variable estadística:


b a c a b d
con b < c < d y a = c + k.
(a) Calcular la mediana de la distribución si k = 0.
(b) Obtener la mediana de la distribución si k = d c.
(c) Utilizando los resultados de los apartados anteriores, calcular la mediana de la distribu-
ción para k 0.

1.21 Los alumnos de la asignatura Estadística Fundamental están distribuidos en dos grupos teóri-
cos, 1T y 2T . La información relativa a número de alumnos, cali…cación media y varianza de
cada grupo se muestra a continuación.
Exploración y descripción de datos univariantes 9

Grupo Núm. alumnos Calif. media Varianza


1T n1 x1 s21
2T n2 x2 s22

Probar las siguientes a…rmaciones:


(a) La cali…cación media global es la media ponderada de las cali…caciones medias de cada
grupo.
(b) Si x1 = x2 , entonces la varianza global es la media ponderada de las varianzas de cada
grupo.

1.22 Sea x una variable estadística positiva e y la nueva variable de…nida como

y = 13 (x + 2).

Demostrar que el coe…ciente de variación de y veri…ca la siguiente relación:

CVx
CVy = .
1 + x2

1.23 La puntuación media obtenida en una prueba de rendimiento es de 35 puntos y la desviación


estándar es de 6. ¿Por lo menos qué porcentaje de las puntuaciones están entre 23 y 47?

1.24 Se han obtenido los siguientes datos sobre el funcionamiento continuado de 100 páginas web
diseñadas por Webpa:

Días de funcionamiento 3 5 7 8 9 10 14 15 20
Número de páginas 2 3 15 8 7 12 22 27 4

(a) ¿Cuántas de las páginas observadas han funcionado más de 6 días y menos de 14?
(b) Calcular razonadamente el tercer decil y el percentil 96, explicando su signi…cado.

1.25 La Figura 1.1 muestra un conjunto desordenado de diagramas de caja e histogramas. Asociar
cada diagrama de caja a su respectivo histograma, justi…cando la respuesta.

1.26 Los datos de la tabla siguiente muestran el número de contratos realizados por la plantilla de
teleoperadores de una compañía de telefonía en el día de ayer.

xi 1 3 4 6 7 9
ni 5 10 15 10 6 4

(a) Calcular los percentiles 60, 80 y 95. Justi…car la respuesta.


(b) ¿Cuál es el número medio de contratos realizados por teleoperador? Justi…car la respues-
ta.
(c) ¿Cómo varían la media y la mediana si aumentamos una unidad las diez observaciones
más grandes? Razonar la respuesta.

1.27 La Figura 1.2 muestra un conjunto desordenado de diagramas de caja e histogramas. Asociar
cada diagrama de caja a su respectivo histograma, justi…cando la respuesta.

1.28 La siguiente tabla re‡eja el retraso, en minutos, que han experimentado los vuelos de la
compañía de bajo coste Aéreopepe el pasado año:
10 Estadística (E.I.I. de Valladolid, Curso 2019/20)

Retraso 0 10 10 20 20 40 40 60
Número de vuelos 160 240 280 120
(a) ¿Cuál es el retraso medio por vuelo? Justi…car la respuesta.
(b) Calcular, razonadamente, el retraso mínimo que puede experimentar un vuelo para estar
dentro del 42 % de los vuelos con mayor retraso.
(c) Supongamos que en la compañía aérea Viajesencillo, el retraso medio de los vuelos fue
de 15 minutos con una desviación típica de 12 minutos. ¿En cuál de las dos compañías
áereas el retraso es más homogéneo? Razonar la respuesta.
1.29 En la tabla siguiente se presenta una distribución de frecuencias de las puntuaciones obtenidas
en una prueba de programación.
Puntuación (3; 4] (4; 5] (5; 6] (6; 7] (7; 8] (8; 9] (9; 10]
Número de participantes 2 4 10 20 40 35 9
Determinar:
(a) La puntuación más alta alcanzada por el 20 % inferior de los participantes y la cali…cación
más baja obtenida por el 25 % superior de los participantes. Justi…car la respuesta.
(b) Los cuartiles de la distribución. Interpretar los resultados.

1.30 Se dispone de los siguientes datos sobre el gasto realizado durante una semana por los clientes
de un determinado establecimiento de consumibles informáticos:
Gasto (0; 70] (70; 100] (100; 120] (120; 200] (200; 300]
Número de clientes 8 3 4 3 2
Determinar:
(a) El gasto medio por cliente.
(b) El gasto mediano.
(c) El gasto mínimo por cliente del grupo en el que se encuentra el 75 % de los que más
gastan.

1.31 En la tabla siguiente se muestran los datos relativos al coste de alquiler (en cientos de euros)
de los locales destinados a tiendas de informática en una ciudad española:
Coste (0; 10] (10; 20] (20; 30] (30; 40] (40; 80]
Número de locales 8 12 48 8 4
(a) Calcular el coste medio de alquiler.
(b) Determinar el coste mediano y explicar su signi…cado.
(c) Calcular el primer cuartil de la distribución y explicar su signi…cado.
(d) Indicar cuál es el coste medio de alquiler si los alquileres aumentasen 40e. Razonar la
respuesta.
1.32 La distribución de las cali…caciones en un examen de Estadística de una muestra de 20
alumnos es la siguiente:
Cali…caciones (0; 2] (2; 4] (4; 6] (6; 8] (8; 10]
Núm. alumnos 1 6 5 7 1
(a) ¿Cuál es el porcentaje de alumnos en la muestra con cali…caciones inferiores a 2:8?
(b) ¿Entre qué cali…caciones se encuentra el 20 % de las cali…caciones centrales? Justi…car
la respuesta.
Exploración y descripción de datos univariantes 11

Tabla 1.1 Datos Ejercicio 1.1


Caract. comodidad línea aérea Número de quejas
Espacio insu…ciente entre piernas 719
Asientos incómodos 914
Pasillos estrechos 146
Compartimentos de equipajes insu…cientes 218
Sanitarios insu…cientes 58
Otras quejas 384

Tabla 1.2 Datos Ejercicio 1.2


Tipo de obstáculo Número de accidentes
Árbol 1168
Bordillo 604
Poste 1406
Murete o edi…cio 1723
Cuneta 878
Valla de defensa 1821
Otros 150

Tabla 1.3 Datos Ejercicio 1.7


Asp. Punt. Asp. Punt. Asp. Punt. Asp. Punt. Asp. Punt.
1 71 11 115 21 100 31 101 41 85
2 85 12 98 22 73 32 123 42 95
3 89 13 106 23 100 33 107 43 108
4 78 14 111 24 114 34 128 44 84
5 94 15 125 25 116 35 108 45 91
6 92 16 95 26 110 36 135 46 93
7 105 17 61 27 99 37 109 47 88
8 118 18 110 28 139 38 118 48 95
9 105 19 75 29 102 39 106 49 92
10 95 20 94 30 102 40 86 50 81
12 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(1) !( ) (a)

(2) !( ) (b)

(3) !( ) (c)
Figura 1.1 Grá…cos asociados al Ejercicio 1.25

(1) !( ) (a)

(2) !( ) (b)

(3) !( ) (c)
Figura 1.2 Grá…cos asociados al Ejercicio 1.27
2

Análisis de datos multidimensionales


2.1 La tabla siguiente muestra la distribución conjunta de las variables x = número de horas
semanales de clase e y = retribución mensual en decenas de euros de los profesores de un
determinado centro educativo. Calcular:

x
y 2 3 4 5 6 7 8
105 135 3 4 2
135 150 1 7 6 9
150 180 9 4 3 10 8
180 225 7 8 15 10
225 270 3 2 1
270 300 5 6 2

(a) Medias, medianas, desviaciones típicas y cuartiles para ambas variables.


(b) El porcentaje de profesores que:
(i) dan menos de 6 h/s y ganan más de 1 800 euros.
(ii) dan menos de 6 h/s y ganan más de 1 950 euros.
(c) El coe…ciente de correlación lineal entre x e y.

2.2 Para estudiar la elasticidad de un muelle, se le somete a cargas sucesivas (x) midiendo, en
cada caso, la longitud total adquirida (y). Se obtuvieron los datos siguientes:

x 0 16 18 20 25 28 33 35 38 41 45 51 56
y 18:2 18:9 19 19:1 19:3 19:5 19:7 19:8 19:9 20:1 20:2 20:5 20:8

¿Qué ley sigue el muelle?

2.3 Las notas obtenidas por 10 alumnos en Matemáticas y Música fueron:

Matemáticas 6:0 4:0 8:0 5:0 3:5 7:0 5:0 10:0 5:0 4:0
Música 6:5 4:5 7:0 5:0 4:0 8:0 7:0 10:0 6:0 5:0

(a) Calcular la covarianza, el coe…ciente de correlación, las rectas de regresión y las varianzas
residuales.
(b) ¿Cuál sería la nota esperada en Música de un alumno que haya obtenido un 8:3 en
Matemáticas?

2.4 Demostrar que si el coe…ciente de correlación es 1, entonces las dos rectas de regresión
coinciden.

2.5 Las rectas de regresión de dos variables estadísticas x e y son 2x + y = 7 y 2x + 3y = 13.


(a) Calcular los valores medios, los coe…cientes de regresión, el coe…ciente de correlación
lineal y la relación existente entre las varianzas.
(b) ¿Qué condición deben cumplir dos rectas cualquiera para ser de regresión? Razonar la
respuesta.

13
14 Estadística (E.I.I. de Valladolid, Curso 2019/20)

2.6 Suponiendo que una muestra de 5 familias tiene el siguiente ingreso y ahorro:

Ingreso (y) 16 000 22 000 18 000 12 000 12 000


Ahorro (s) 1 200 2 400 2 000 1 400 600

(a) Calcular y dibujar la recta de regresión para el ahorro s sobre el ingreso y.


(b) Interpretar la ordenada en el origen.
(c) Construir la regresión del consumo c sobre el ingreso y, siendo c = y s.
(d) ¿Qué se espera que consuma una familia cuyos ingresos son de 20 000?

2.7 En una cierta comarca se estudian cinco pueblos. En cada uno de ellos se cuentan el número
de nacimientos habidos a lo largo de un año (x) y el número de nidos de cigüeñas que hay
sobre los tejados de sus casas (y).

x 47 53 35 41 65
y 8 9 5 7 11

(a) Calcular el coe…ciente de correlación de x e y.


(b) Calcular las rectas de regresión de y sobre x y de x sobre y. Interpretar los resultados.

2.8 La siguiente tabla muestra los valores de la media y la desviación típica de dos variables así
como su coe…ciente de correlación lineal para dos muestras diferentes:

Muestra Núm. observ. x y sx sy rxy


1 600 5 12 2 3 0:6
2 400 7 10 3 4 0:7

Calcular:
(a) La recta de regresión de y sobre x en cada caso.
(b) Considerar la muestra que resulta de agrupar las dos muestras en una sola de tamaño
1000, calcular el coe…ciente de correlación lineal.

2.9 Sea 3x y = 10 la recta de regresión mínimo cuadrática de y sobre x. Sabiendo que el ajuste
es perfecto y que la media de x es 4 y la varianza de y es 9, calcular la media de la variable
y, la varianza de x y la recta de regresión de x sobre y.

2.10 Sean x e y dos variables estadísticas independientes con la siguiente tabla de frecuencias:

n 0 1 2 3
fx (n) 0:1 0:3 0:4 0:2
fy (n) 0:2 0:3 0:3 0:2

Calcular la tabla de frecuencias para la variable z = x + y.

2.11 Dada la siguiente distribución conjunta de las variables x e y:

y
x 1 0 1
3 2 1
1 18 + 18 18
3 7 2
1 18 18 + 18
Análisis de datos multidimensionales 15

(a) ¿Cuál es el rango de variación de ?


(b) Encontrar para que x e y sean independientes.
(c) Para el del apartado anterior, calcular f rfx = 1jy = 0g.

2.12 Cien clientes de la caja de ahorros “Caja Castilla, S.A.”fueron clasi…cados con respecto a las
variables estadísticas x = “número de tarjetas de crédito” e y = “número de operaciones el
mes anterior en cajeros de la red 5C”. Los datos obtenidos fueron:

y
x 0 1 2 3
1 8 7 4 1
2 10 35 26 9

(a) Calcular la distribución de frecuencias del número de operaciones en cajeros de la red


5C de los clientes que poseen dos tarjetas de crédito.
(b) ¿Son las variables x e y independientes? Razonar la respuesta.

2.13 La tabla siguiente muestra el número de estudiantes aprobados, suspensos y no presentados


de los matriculados en la asignatura de Estadística V:

c Aprobados Suspensos No Presentados


ni 120 60 60

Las frecuencias condicionadas f r(gjc), siendo g la variable estadística “grupo en el que se


encuentra matriculado el alumno” son las siguientes:

f r(g = M jc = A) = 0:50 f r(g = T jc = A) = 0:25 f r(g = N jc = A) = 0:25


f r(g = M jc = S) = 0:50 f r(g = T jc = S) = 0:50 f r(g = N jc = S) = 0
f r(g = M jc = N P ) = 0:75 f r(g = T jc = N P ) = 0:25 f r(g = N jc = N P ) = 0

(a) ¿Son las variables g y c independientes? Razonar la respuesta.


(b) Calcular la tabla de frecuencias conjunta.

2.14 Demostrar que:


(a) La distribución de frecuencias de los errores obtenidos al realizar la regresión lineal de y
sobre x tiene media cero.
(b) La distribución de frecuencias de las predicciones obtenidas al realizar la regresión lineal
de y sobre x tiene media y.
p
2.15 Sea x una variable estadística con media y varianza 12 2. Consideremos la variable
y = 1 2x.
(a) ¿Cuál es el coe…ciente de correlación entre x e y? Razonar la respuesta.
(b) Calcular la recta de regresión de x sobre y. Razonar la respuesta.

2.16 Se han realizado dos ajustes a la variable estadística bidimensional (x; y): uno lineal, y =
31:71 6:096x, con un coe…ciente de determinación R2 = 0:8859, y otro mediante una hipér-
bola equilátera, y = 0:00459 + 32:02=x, con un coe…ciente de determinación R2 = 0:9717.
(a) ¿Cuál de los dos ajustes es mejor? Razonar la respuesta.
(b) ¿Cuál es el coe…ciente de correlación lineal entre x e y? Justi…car la respuesta.
(c) ¿Qué porcentaje de la varianza de y es explicada por la recta de regresión lineal yjx?
16 Estadística (E.I.I. de Valladolid, Curso 2019/20)

2.17 Las rectas de regresión de la variable estadística bidimensional (x; y) son y = 4x + 2 e


y = 2x + 10. Sabiendo que sxy = 60:
(a) Identi…car cada una de las rectas de regresión. Justi…car la respuesta.
(b) ¿Qué porcentaje de la varianza de y es explicada por la recta de regresión lineal yjx?
(c) Calcular la varianza de x y la varianza de y.

2.18 El analista de ventas de una cadena de restaurantes piensa que el número de botellas de
cerveza que se venden cada noche (y) depende linealmente del coste medio de las cenas en los
restaurantes (x). En una muestra de 17 restaurantes ha observado los siguientes resultados:
xi = 433:5, x2i = 17004:25, yi = 272, xi yi = 9996.
(a) Calcular la recta de regresión de y sobre x.
(b) Interpretar la pendiente de la recta de regresión. ¿Es posible dar una interpretación
sensata a la ordenada en el origen de la recta de regresión? Razonar la respuesta.

2.19 Los datos siguientes muestran el precio por litro de un producto (x) y el número de litros
vendidos (y) en un determinado periodo de tiempo:

x 4 5 6 7 8 10 10
y 200 200 150 110 120 90 100

(a) Calcular la recta de regresión de y sobre x.


(b) ¿Demuestran los datos que la cantidad vendida del producto depende linealmente del
precio de venta? Razonar la respuesta.
(c) Interpretar el coe…ciente de regresión.

2.20 Es bien conocido que los virus informáticos poseen una gran capacidad de propagación. En
una red informática local se han recogido los siguientes datos sobre virus detectados:

T iempo en semanas 0 2 6 10 14
N umero de virus 2 6 18 110 540

(a) Calcular la ecuación del modelo exponencial y = a expfbxg.


Indicación: Tomar logaritmos en la expresión anterior para obtener un modelo lineal.
(b) ¿Es adecuado el modelo exponencial? Razonar la respuesta.

2.21 La empresa Fijosun ha instalado en su servidor de correo electrónico un sistema para la


detección y rechazo de spam. Con el …n de valorar la calidad del sistema, ha observado
durante un determinado día los buzones de correo de los ocho directivos de la empresa. Los
resultados obtenidos se muestran en la siguiente tabla:

N umero de spams enviados (x) 43 65 76 98 121 132 154 187


N umero de spams recibidos (y) 2 3 3 4 5 5 6 7

(a) Calcular la recta de regresión de y sobre x.


(b) ¿Es adecuado el modelo lineal para predecir el número de spams recibidos en función
del número de spams enviados? Justi…car la respuesta.
(c) Si a un directivo de la empresa se le enviasen 100 spams, ¿cuántos se espera que reciba?
Razonar la respuesta.
Análisis de datos multidimensionales 17

2.22 El número y de accesos realizados a una nueva página web después de x días de su estreno
viene dado en la siguiente tabla:

N umero de d{as (x) 1 2 3 4 5 6 7 8


N umero de accesos (y) 30 45 70 95 140 225 310 465

(a) Calcular la ecuación del modelo exponencial y = expfa + bxg que se ajusta a los datos.
Indicación: Tomar logaritmos en la expresión anterior para obtener un modelo lineal.
(b) ¿Es adecuado el modelo exponencial obtenido? Razonar la respuesta.

2.23 Un broker desea realizar una regresión lineal del precio (y) de las acciones de una empresa
con respecto al valor (x) del índice bursátil Oceanibex. Dispone de la siguiente información:
n = 20, xi = 2600, x2i = 370000, yi = 1100, yi2 = 61140 y xi yi = 147480:
(a) ¿Puede aceptarse una dependencia lineal entre las variables estadísticas x e y?
(b) En caso a…rmativo, predecir el precio de las acciones de la empresa si el valor del índice
Oceanibex es de 150 puntos.

2.24 Se pidió a 100 clientes de una compañía de ADSL que valoraran la calidad del servicio (x) y
su satisfación global (y). La información disponible es la siguiente: xi = 500, x2i = 3400,
yi = 520, yi2 = 3304 y xi yi = 3320.
(a) ¿Es adecuado el modelo lineal? Justi…car la respuesta.
(b) ¿Cuál es la satisfación global que debe esperarse si un cliente valora la calidad del servicio
con un 6? Razonar la respuesta.

2.25 Sean x e y las variables estadísticas que representan, en euros, la renta y el consumo en tele-
fonía mensual, respectivamente, de una muestra de familias españolas. Las rectas de regresión
correspondientes a estas variables son x = 15y y 2x 27y = 360. Calcular:
(a) La renta media y el consumo medio mensual en telefonía por familia. Justi…car la res-
puesta.
(b) Los coe…cientes de regresión de cada una de las rectas. Razonar la respuesta.
(c) El coe…ciente de correlación lineal. Justi…car la respuesta.

2.26 Sean x e y las variables estadísticas que representan, en euros, el salario bruto y el gasto en
ocio mensual, respectivamente, de una muestra de familias españolas. Las rectas de regresión
correspondientes a estas variables son x = 20y y 2x 37y = 240. Calcular:
(a) El salario bruto medio y el gasto medio mensual en ocio por familia. Justi…car la res-
puesta.
(b) Los coe…cientes de regresión de cada una de las rectas. Razonar la respuesta.
(c) El coe…ciente de correlación lineal. Justi…car la respuesta.

2.27 Sean x e y las variables estadísticas que representan las cali…caciones obtenidas en las asig-
naturas F undamentos de Inf ormatica y Ampliacion de Inf ormatica, respectivamente, por
los alumnos de primer curso en una titulación de ingeniería. Las rectas de regresión corres-
pondientes a estas variables son y = 0:9x 0:2 y x 1:7 = 0:9y. Calcular:
(a) La cali…cación media en cada una de las asignaturas. Justi…car la respuesta.
(b) El coe…ciente de correlación lineal. Justi…car la respuesta.
(c) La relación existente entre las dos varianzas. Razonar la respuesta.
18 Estadística (E.I.I. de Valladolid, Curso 2019/20)

2.28 Sean x e y dos variables estadísticas. Razonar si son posibles las siguientes situaciones:
(a) Una recta de regresión es y = 1 + 2x y el coe…ciente de correlación lineal de Pearson es
rxy = 0:8.
(b) Las dos rectas de regresión son 2x + y = 1 y 3x + 3y = 2.
(c) Una recta de regresión es 2y = x + 3 y la covarianza es sxy = 2:4.

2.29 La …gura siguiente muestra un conjunto de diagramas de dispersión de dos variables estadísti-
cas x e y. Indicar, justi…cando la respuesta, el coe…ciente de correlación aproximado asociado
a cada diagrama.

r r

r r

r r
Justi…cación:

2.30 Con datos correspondientes a las variables y = euros gastados en telecomunicaciones y x =


bene…cios en miles de euros, de una muestra de pequeñas empresas informáticas, se han
obtenido los siguientes indicadores: x = 18:2, y = 78:12, s2x = 12:25, s2y = 222:01 y sxy = 51:45.
(a) Calcular el coe…ciente de correlación lineal.
(b) Obtener la recta de regresión de y sobre x.
(c) Interpretar la pendiente de la recta de regresión calculada en el apartado anterior.

2.31 Se dispone de la siguiente información relativa a las variables x, ingresos diarios por servicio
de asesoramiento informático, e y, ingresos diarios por servicio de desarrollo de herramientas
informáticas, correspondientes a un grupo de consultoras: n = 40, xi = 100, x2i = 269:6,
yi = 400, yi2 = 4078:4 y xi yi = 1037:632:
(a) Calcular el coe…ciente de correlación lineal entre los ingresos diarios por servicio de
asesoramiento informático y por servicio de desarrollo de herramientas informáticas.
Análisis de datos multidimensionales 19

(b) ¿Son las variables x e y estadísticamente independientes? Razonar la respuesta.


(c) Calcular la recta de regresión de y sobre x. Interpretar la pendiente de la recta de
regresión.

2.32 En una muestra de 150 empresas del sector de tecnologías de la información se recogieron
datos sobre el número de trabajadores de la empresa, x, y la facturación anual (en millones
de euros), y. Se dispone de los siguientes indicadores: xi = 2100, x2i = 30000, yi = 1500,
yi2 = 15937:5 y xi yi = 21675:
(a) Calcular el coe…ciente de correlación lineal entre el número de trabajadores de la empresa
y la facturación anual.
(b) Calcular la recta que mejor aproxima la facturación en función del número de traba-
jadores. Razonar la respuesta.
(c) ¿Qué cantidad se espera que facture una empresa con 13 trabajadores. ¿Es …able esta
predicción? Razonar la respuesta.
BLOQUE 2

MODELOS DE PROBABILIDAD

21
3

Cálculo de probabilidades y variables aleatorias.


Conceptos básicos
3.1 Razonar si son verdaderas o falsas las siguientes a…rmaciones:
(a) Un suceso y su complementario pueden tener probabilidades cuyo producto sea uno.
(b) Si la suma de las probabilidades de dos sucesos es 1, son sucesos complementarios.
(c) Si en un experimento ocurre el resultado !, y ! 2 A, entonces ocurre el suceso A y sólo
él.
(d) Si dos sucesos son independientes también lo son sus complementarios.
(e) Si A y B son dos sucesos con intersección vacía, se veri…ca que PrfA\Bg = PrfAg PrfBg.

3.2 En una reunión de n personas (n 3), cada una lanza una moneda al aire. Si hay una cuyo
resultado di…ere de todos los demás, su propietario paga una cena a los demás. ¿Cuál es la
probabilidad de que esto ocurra?

3.3 Un jugador A lanza seis dados y gana si obtiene por lo menos un as. Otro jugador B lanza
doce dados, y gana si obtiene por lo menos dos ases. ¿Quién tiene mayor probabilidad de
ganar? ¿Cuál es la probabilidad de que el jugador A obtenga seis números diferentes?

3.4 Una fábrica de bujías para motores produce un 98 % de buenas y un 2 % de defectuosas.


Antes de enviarlas a los almacenes para su venta se someten a una veri…cación, en la que se
admiten como buenas las que lo son con una probabilidad de 0:95 y las que no lo son con una
probabilidad de 0:04. Si una bujía fue considerada como buena en dos veri…caciones realizadas
en las mismas condiciones e independientes, ¿cuál es la probabilidad de que sea realmente
buena?

3.5 Un inversor tiene la posibilidad de invertir en dos tipos de valores A y B a priori igualmente
favorables. La probabilidad de bene…cios en A es 0:6 y en B 0:8, pero con mayor bene…cio en
A que en B. Si la inversión obtiene bene…cios, está dispuesto a invertir en el mismo tipo de
valor. En cambio si no obtiene bene…cios, invertirá en el otro valor. ¿Cuál es la probabilidad de
que obtenga bene…cios en la segunda inversión? Sabiendo que obtuvo bene…cios en la segunda
inversión, ¿cuál es la probabilidad de que la primera inversión la hubiera efectuado en A?

3.6 Un test detecta la presencia de un cierto tipo B de bacterias en el agua con probabilidad 0:9
en el caso de haberlas. Si no las hay, detecta la ausencia con probabilidad 0:8. Sabiendo que
la probabilidad de que una muestra de agua contenga bacterias de tipo B es 0:2, calcular la
probabilidad:
(a) De que realmente haya presencia de bacterias cuando el test ha dado positivo.
(b) De que realmente haya presencia de bacterias cuando el test ha dado negativo.
(c) De que haya bacterias y el test haya dado positivo.
(d) De que haya bacterias o el test sea positivo.

3.7 Una empresa hace un pedido de alambre de dos tipos que llamaremos A y B. La experiencia
anterior sugiere que la probabilidad de que al menos uno de los dos tipos de alambre llegue
antes de una semana es de 0:8. Se estima también que si el alambre de tipo A llega antes de

23
24 Estadística (E.I.I. de Valladolid, Curso 2019/20)

una semana, la probabilidad de que el alambre de tipo B se reciba antes de una semana es
0:4. Además, se cree que si el alambre de tipo B llega antes de una semana, la probabilidad
de recibir el alambre de tipo A en dicho plazo es 0:6.
(a) ¿Cuál es la probabilidad de que el alambre de tipo B llegue antes de una semana?
(b) ¿Cuál es la probabilidad de que el alambre de tipo A llegue antes de una semana?
(c) ¿Cuál es la probabilidad de que los dos tipos de alambre lleguen antes de una semana?

3.8 Un conjunto electrónico consta de dos subsistemas A y B. A partir de una serie de pruebas se
han llegado a establecer las siguientes probabilidades: Prff alle Ag = 0:2, Prfsolo f alle Bg =
0:15 y Prff allen simultaneamente A y Bg = 0:15. Calcular las siguientes probabilidades:
(a) Prff alleAjha f allado Bg,
(b) Prfsolo f alle Ag,
(c) Prfno f alle ningunog,
teniendo en cuenta que se dan interacciones entre los dos subsistemas y que las probabilidades
calculadas y pedidas se re…eren a las probabilidades de fallo dentro de un periodo dado.

3.9 Se lanza un dado cinco veces y, en cada lanzamiento, se echa una bola a una urna inicialmente
vacía. Si sale un 1 o un 2 se echa una bola verde y, en caso contrario, se echa una bola roja.
A continuación se extraen de la urna dos bolas que resultan ser verde y roja. ¿Cuál es la
composición más probable de la urna?

3.10 De una urna que contiene 8 bolas rojas y 7 amarillas se realiza una extracción de dos bolas.
Si una de las bolas extraídas es amarilla, ¿cuál es la probabilidad de que la otra también lo
sea?

3.11 Un sistema consta de dos componentes A y B. La probabilidad de que la componente B


funcione correctamente durante cinco años es 0:9, la probabilidad de que al menos una de las
dos componentes funcione bien durante ese tiempo es 0:96 y la probabilidad de que las dos
componentes funciones también correctamente en cinco años es 0:75.
(a) Dado que la componente A funcionó correctamente en cinco años, ¿cuál es la probabilidad
de que la componente B también funcione durante ese periodo de tiempo?
(b) Sabiendo que la componente A falló antes de los cinco años, ¿cuál es la probabilidad de
que la componente B también falle antes de cinco años?
(c) ¿Cuál es la probabilidad de que sólo una de las dos componentes funciones correctamente
al cabo de cinco años?

3.12 En el comedor de la Escuela de Ingeniería Estadística se ha comprobado que el 35 por ciento


de todos los clientes pide un plato de legumbre y que el 50 por ciento son estudiantes. Además,
se ha observado que el 25 por ciento de todos los clientes que son estudiantes pide un plato
de legumbre.
(a) ¿Cuál es la probabilidad de que un cliente seleccionado al azar sea un estudiante y pida
un plato de legumbre?
(b) Si un cliente ha pedido un plato de legumbre, ¿cuál es la probabilidad de que sea un
estudiante?
(c) ¿Cuál es la probabilidad de que un cliente seleccionado aleatoriamente no pida un plato
de legumbre y no sea estudiante?
Cálculo de probabilidades y variables aleatorias. Conceptos básicos 25

3.13 El cinco por mil de todas las placas base fabricadas por una compañía son defectuosas.
La probabilidad de que una placa base defectuosa pase un test de control de calidad es
0:04 y la probabilidad de que una placa base que es correcta pase ese test de control es
0:95. Supongamos que el test de control de calidad se aplica en las mismas condiciones, e
independientemente, en dos ocasiones.
(a) ¿Cuál es la probabilidad de que se obtenga el mismo resultado en los dos controles?
(b) Si una placa base es dada por buena en ambas veri…caciones, ¿cuál es la probabilidad
de que realmente sea buena?

3.14 En un sistema de alarma, la probabilidad de que esta funcione habiendo peligro es 0:95 y la
de que funcione por error sin haber peligro es 0:03. Sabiendo que la probabilidad de que haya
peligro es 0:1, determinar:
(a) La probabilidad de que la alarma funcione.
(b) El porcentaje de veces que habiendo funcionado la alarma no haya peligro.
(c) La probabilidad de que haya peligro y la alarma no funcione.
(d) La probabilidad de que no habiendo funcionado la alarma haya peligro.

3.15 En una región determinada, el negocio de acceso a internet se reparte entre dos únicas com-
pañías, C y D, y dos únicas marcas de enrutadores, R y S. En esta región, la compañía C
tiene el 60 % de la cuota de mercado y la compañía D, el resto. El 70 % de los usuarios dispone
de un enrutador de la marca R y el 30 % dispone de enrutadores de ambas marcas. Además,
se sabe que la probabilidad de corte en el acceso es de 0:1 para los usuarios de la compañía
C, 0:15 para los de la compañía D y de 0:05 para los de la marca R.
(a) ¿Cuál es la probabilidad de que se produzca un corte en el acceso a internet?
(b) Si se sabe que a un usuario se le ha cortado la línea, ¿cuál es la probabilidad de que
disponga de un enrutador de la marca R?
(c) ¿Cuál es la probabilidad de que se le corte la línea a un usuario que no posee un enrutador
de la marca R?

3.16 Una compañía de publicidad utiliza tres servidores de correo, A, B y C, para enviar sus SMS.
De los enviados por A, el 3 % llega después de la hora garantizada de entrega, lo mismo ocurre
con el 2 % de los enviados por B y el 18 % de los de C. El 40 % de todos los SMS son enviados
por A, el 55 % por B y el 5 % restante son enviados por C.
(a) ¿Cuál es la probabilidad de que un SMS seleccionado al azar llegue tarde?
(b) Si un SMS seleccionado al azar llega tarde, ¿cuál es la probabilidad de que no haya sido
enviado por A?

3.17 El porcentaje de alcohol en un cierto producto es una variable aleatoria X cuya función de
densidad es

kx2 (1 x) si 0 < x < 1


f (x) =
0 en el resto

(a) Hallar el valor de k.


(b) Supongamos que el precio de venta depende del contenido de alcohol. Más concretamente,
si 1=3 < X < 2=3, el producto se vende a 1 euro por litro, y en los demás casos, a 0:70
euros por litro. Si el coste de producción es de 0:45 euros por litro, ¿cuál es el bene…cio
medio que se obtiene por la venta de un litro de dicho producto?
26 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(c) Calcular PrfjX E(X)j > 0:1g y compararlo con la cota que proporciona la desigualdad
de Chebychev.

3.18 La compañía petrolera que satisface la demanda mensual de petróleo de un cierto país, ofrece
dos opciones:
(i) El país deberá pagar 20$ por barril.
(ii) Si la demanda mensual no supera la cota del medio millón de barriles, el país deberá
pagar una cuota …ja de 15 millones de dólares. Si la demanda mensual supera el medio
millón de barriles, deberá pagar, además de la cuota …ja, 14$ por cada barril que supere
la cuota.
Se ha estimado que la demanda mensual de petróleo para el país, X, en millones de barriles,
tiene la siguiente función de densidad:
8
< x si 0 x 1
f (x) = 2 x si 1 x 2
:
0 en el resto

Sean Y y Z la cantidad mensual, en millones de dólares, que deberá pagar el país, si se decide
por la opción (i) y (ii), respectivamente.
(a) Expresar las variables Y y Z en función de la variable X.
(b) ¿Qué opción será más favorable para el país?
(c) Calcular la probabilidad de que el pago con la segunda opción sea superior al pago con
la primera opción.

3.19 Supongamos que la distribución de las notas de los alumnos en un examen de Estadística es
una variable aleatoria continua con función de densidad
8 x
>
> si 0 x 4
< a
10 x
f (x) =
> 20+a si 4 < x 10
>
:
0 en el resto

Calcular:
(a) El valor de a y la función de distribución de la v.a.
(b) Las probabilidades de aprobar y de obtener exactamente un cinco.
(c) Si se sabe que un alumno ha aprobado, ¿cuál es la probabilidad de que haya obtenido al
menos un 8?
(d) La varianza de la v.a.

3.20 El salario mensual, en miles de euros, de los trabajadores de una pequeña empresa es una
variable aleatoria con función de densidad:
8
< x 1 si 1 x < 2
f (x) = 3 x si 2 x < 3
:
0 en el resto

(a) Calcular el salario mínimo del 50 % de los trabajadores que más cobran.
(b) ¿Cuál es el salario máximo del 10 % de los trabajadores que menos cobran?
(c) Si se sabe que a partir del próximo año el salario mensual será mayor de 1500 euros para
todos los trabajadores, ¿cuál será entonces la distribución de los salarios el próximo año?
Cálculo de probabilidades y variables aleatorias. Conceptos básicos 27

3.21 El tiempo que tarda un teléfono móvil en conseguir comunicación puede ser modelado según
una v.a. con función de densidad
8
< 3=4 si 0 < t < 1
f (t) = a(2 t) si 1 t < 2
:
0 en el resto

(a) Determinar el valor de a y la función de distribución de la v.a.


(b) Calcular el rango intercuartílico y la mediana.

3.22 La vida útil de un determinado mecanismo se puede modelar según una variable aleatoria T ,
medida en unidades de 1000 horas, cuya función de densidad es

(1=10)e t=10 si t > 0


fT (t) =
0 en el resto

Como el mecanismo está sujeto a fallos inesperados, se venden con una garantía: si falla antes
de las 3000 horas se reemplaza sin coste alguno. Para un mecanismo que no falla en el periodo
de garantía la ganancia es de $5, mientras que para uno que tiene que ser sustituido se tiene
una pérdida de $1. Determinar la ganancia esperada.

3.23 Un armador de terminales de ordenador y modems utiliza componentes de dos proveedores.


La compañía A suministra el 80 % de las componentes y la compañía B el 20 % restante. Por
experiencias anteriores el armador sabe que el 5 % de los componentes suministrados por el
proveedor A tienen defecto y que el 15 % de las componentes de B tienen defecto.
(a) Se observa que de 30 componentes de un mismo proveedor, seleccionadas aleatoriamente,
3 tienen defecto. ¿Cuál de los dos proveedores es más probable que haya suministrado
esas 30 componentes?
(b) Si las componentes se almacenan mezcladas en contenedores, ¿cuál es la probabilidad de
que una elegida al azar sea defectuosa?
(c) Una vez montado un modem, su duración (en años) se distribuye con densidad

(x=8) expf x2 = g si x > 0


f (x) =
0 en el resto

(i) ¿Qué valor tiene ?


(ii) ¿Cuál es la probabilidad de que un modem dure más de 6 años?
(iii) Calcular la distribución de los modems que duran más de 6 años.
(iv) El precio de venta de estos modems es 80 euros y el coste de producción es 10 euros.
¿Cuál debe ser el periodo de garantía para que la ganancia esperada por unidad sea
65 euros, si se supone que cada modem que falla en el periodo de garantía se repone
sin coste para el comprador?

3.24 Una pregunta de un test tiene cinco respuestas, de las cuales solo una es correcta. La pro-
babilidad de que una persona sepa la respuesta es 0:7. En el caso de que sepa la respuesta,
contesta correctamente con probabiliad 0:95, mientras que si no sabe la respuesta contesta al
azar. Calcular:
(a) La probabilidad de que una persona elegida al azar conteste correctamente.
(b) La probabilidad de que una persona que ha contestado correctamente no conozca real-
mente la respuesta.
28 Estadística (E.I.I. de Valladolid, Curso 2019/20)

3.25 Una empresa que fabrica dos tipos de chips A y B utiliza para su elaboración tres máquinas:
M1 , M2 y M3 . La máquina M1 produce el 50 por ciento de los chips, la máquina M2 el 40 por
ciento y la máquina M3 el resto. El 40 por ciento de los chips que fabrica la máquina M1 son
de tipo A, uno de cada cuatro chips que produce la máquina M2 es de tipo B y, …nalmente,
el 20 por ciento de los chips elaborados por M3 son de tipo A.
(a) ¿Cuál es la probabilidad de que un chip elegido al azar sea del tipo A? Justi…car la
respuesta.
(b) ¿Cuál es la probabilidad de que un chip de tipo B haya sido fabricado en la máquina
M2 ? Razonar la respuesta.

3.26 Una tienda ha comercializado, en el último año, exclusivamente tres marcas de “tabletas”A,
B y C. El 80 por ciento de las ventas fueron de la marca A, de las cuales un 10 por ciento
eran de 7 pulgadas. De la marca B eran el 15 por ciento de las ventas, de las que un 6 por
ciento eran de 7 pulgadas. De la marca C solo comercializó el modelo de 7 pulgadas. Con
objeto de regalar un viaje a Paris, se elige al azar un cliente de entre los que compraron una
tableta en el último año.
(a) ¿Cuál es la probabilidad de que ese cliente comprara una tableta de 700 ? Razonar la
respuesta.
(b) El cliente seleccionado no compró una tableta de 700 , ¿cuál es la probabilidad de que
comprase la tableta de la marca A? Razonar la respuesta.

3.27 La tienda CuartilStock ofrece dos tipos de garantía para sus “tabletas”, la estándar y la
multirriesgo. La probabilidad de que un cliente adquiera la garantía estándar es de 0:8 y la
de que compre la multirriesgo es 0:2. Sabiendo que las garantías vendidas son independientes
y que en el último mes ha vendido 12 garantías para tabletas, calcular:
(a) La probabilidad de que haya vendido 3 garantías multirriesgo. Justi…car la respuesta.
(b) La probabilidad de que vendiese como máximo 3 garantías multirriesgo, sabiendo que
ha vendido al menos 6 garantías estándar. Razonar la respuesta.

3.28 El tiempo de retraso, en horas, de los autobuses que llegan a un campus universitario sigue
una variable aleatoria continua X cuya función de distribución es
8
< 0 si x < 1
F (x) = k arctan(x) + 4 si 1 x 1
:
1 si x > 1

Calcular:
(a) El valor de k. Justi…car la respuesta.
(b) La probabilidad de que un autobús llegue antes de la hora prevista.
(c) El tiempo esperado de retraso.
(d) La probabilidad de que el autobús llegue con menos de 15 minutos de retraso, sabiendo
que llega después del horario previsto.
(e) Un intervalo de tiempo centrado en la media para que la probabilidad de que el autobús
llegue en ese intervalo valga 2=3.

3.29 El error que se comete al medir la carga de la batería de un cierto modelo de tableta es una
variable aleatoria continua con función de densidad
Cálculo de probabilidades y variables aleatorias. Conceptos básicos 29

8
< kx(1 + x) si 1 x 0
f (x) = kx(1 x) si 0<x 1
:
0 en el resto

Calcular:
(a) El valor de k. Justi…car la respuesta.
(b) La función de distribución de la v.a. X.
(c) El error esperado. Razonar la respuesta.
(d) La probabilidad de que el error sea menor que 0:7 sabiendo que es mayor que 0:7.
(e) El valor de a para que el cincuenta por ciento del error esté en el intervalo [ a; a].
Justi…car la respuesta.
Indicación: Dibujar la función de densidad.

3.30 El 56 % de los empleados de un centro de proceso de datos son hombres. De entre los hombres,
un 40 % tiene contrato …jo y el resto temporal. De las mujeres, solamente un 25 % posee
contrato …jo, y el resto temporal.
(a) Calcular la proporción de empleados con contrato …jo.
(b) Se elige un empleado al azar y resulta tener contrato temporal. ¿Cuál es la probabilidad
de que se trate de una mujer?

3.31 La proporción X de startups tecnológicas que obtienen bene…cios el primer año de fun-
cionamiento es una variable aleatoria con función de densidad
k(1 x)7 si 0 x 1
f (x) =
0 en el resto

Calcular:
(a) El valor de k. Justi…car la respuesta.
(b) La probabilidad de que al menos la cuarta parte de las startups tecnológicas tengan
bene…cios el primer año.
(c) El porcentaje esperado de startups tecnológicas que tienen bene…cios el primer año.
(d) La proporción esperada de startups tecnológicas que no tienen bene…cios el primer año.
(e) La varianza de la variable Y = 100(1 X).

3.32 La proporción de personas que responde a una encuesta telefónica sobre la intención de voto
en las próximas elecciones es una variable aleatoria X con función de densidad

k(x2 + 12 ) si 0 x 1
f (x) =
0 en el resto

Calcular:
(a) El valor de k. Justi…car la respuesta.
(b) La función de distribución de la v.a. X. Utilizar F (x) para obtener la probabilidad de que
más del 25 % de las personas contactadas, pero menos del 75 % responda a esa encuesta.
(c) Pr fjX E(X)j > 0:1g y compararla con la cota que proporciona la desigualdad de
Chebychev.

3.33 En un canal de comunicación binario, el 40 % de las veces se transmite el valor 1; la proba-


bilidad de recibir correctamente un valor 0 transmitido es 0:90 y la probabilidad de recibir
correctamente el valor 1 transmitido es 0:95. Determinar:
30 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(a) La probabilidad de recibir el valor 1. Justi…car la respuesta.


(b) La probabilidad de que se haya transmitido el valor 1 si ese ha sido el valor recibido.
Razonar la respuesta.

3.34 La proporción de los accesos al servidor de un CPD que tiene como …nalidad la descarga de
…cheros es una variable aleatoria X con función de densidad

kx2 (1 x) si 0 x 1
f (x) =
0 en el resto

Calcular:
(a) El valor de k. Justi…car la respuesta.
(b) La función de distribución de la X. Justi…car la respuesta.
(c) La proporción esperada de accesos al servidor que realiza descarga de archivos. Justi…car
la respuesta.
(d) La proporción más frecuente de accesos al servidor que realiza descargas de …cheros.
Razonar la respuesta.
(e) El coe…ciente de variación de X.

3.35 La proporción X de alumnos que superan una determinada asignatura en la primera convo-
catoria es una variable aleatoria con función de distribución
8
>
> 0 si x < 0
<
kx2
F (x) = si 0 x 1
> 2
: 1+x
>
1 si x > 1

Calcular:
(a) El valor de k. Justi…car la respuesta.
(b) La mediana y la moda de la v.a. X.
1 1 3
(c) Pr X < 2 4 <X< 4 .
(d) La distribución de la v.a. Y = 1=X.

3.36 Un test detecta correctamente un troyano T con probabilidad 0:95 e identi…ca erróneamente
T con probabilidad 0:01. La experiencia anterior nos indica que el troyano T está presente en
los ordenadores que utilizan el sistema operativo X con una frecuencia del 0:2 %. Se elige al
azar un ordenador con dicho sistema operativo y se le aplica el test. Calcular:
(a) La probabilidad de que el test dé positivo.
(b) La probabilidad de que el ordenador esté realmente infectado por el troyano T si el test
ha dado positivo.

3.37 El tiempo que tarda en descargarse un archivo pdf en un smartphone con un navegador A es
una variable aleatoria X, mientras que el tiempo que tarda en descargarse con otro navegador
B es la variable aleatoria Y . Las dos variables vienen dadas en minutos y sus funciones de
densidad son, respectivamente,
k1 x si 0 x 1 k2 y 2 si 0 y 1
fX (x) = gY (y) =
0 en el resto 0 en el resto
Cálculo de probabilidades y variables aleatorias. Conceptos básicos 31

Se sabe que, en una determinada región, el 40 % de las descargas de archivos pdf desde los
smartphones se realizan con el navegador A, mientras que el resto usan el navegador B.
Calcular:
(a) Los valores k1 y k2 . Justi…car la respuesta.
(b) La media y la varianza del tiempo que tarda en descargarse un archivo pdf en un
smartphone utilizando el navegador B.
(c) El tiempo (en segundos) que es sobrepasado por el 36 % de las descargas de archivos pdf
en smartphones que utilizan el navegador A.
(d) La probabilidad de que un archivo pdf seleccionado al azar tarde en descargarse menos
de 15 segundos.
(e) La probabilidad de que se haya utilizado el navegador A si el archivo pdf ha tardado en
descargarse menos de 15 segundos.

3.38 La variable aleatoria discreta X, que representa el número de pruebas de evaluación continua
aprobadas por los alumnos de una determinada asignatura, tiene la siguiente función de
probabilidad:
xi 0 1 2 3 4
PrfX = xi g 0:12 a b c 0:24
Además, se sabe que PrfX 2g = 0:6 y PrfX > 1g = 0:72. Calcular:
(a) Los valores de a, b y c. Justi…car la respuesta.
(b) La media y la varianza de la v.a. X.
(c) La función de distribución de la va. X.
(d) Pr fjX 2j 1g.
(e) La distribución de la v.a. Y = (X 2)2 .

3.39 En una determinada región, el 80 % de los hogares tiene acceso a internet, el 45 % tiene
televisión por cable y el 35 % los dos servicios. Se elige un hogar al azar:
(a) Calcular la probabilidad de que tenga contratado al menos uno de los dos servicios.
(b) Si tiene contratado internet, ¿cuál es la probabilidad de que tenga contratado televisión
por cable?
(c) ¿Son los dos sucesos independientes? Justi…car la respuesta.

3.40 En un taller de reparación de productos informáticos, el tiempo (en horas) que se tarda en
reparar un ordenador es una variable aleatoria X con función de densidad
kx(1 x2 ) si 0 x 1
f (x) =
0 en el resto
Calcular:
(a) El valor k. Justi…car la respuesta.
(b) La media y la moda de la variable aleatoria X.
(c) El rango intercuartílico.
(d) Si la reparación de un ordenador tiene una duración superior a los 30 minutos, ¿cuál es
la probabilidad de que sea inferior a 45 minutos?
32 Estadística (E.I.I. de Valladolid, Curso 2019/20)

3.41 El tiempo T (en minutos) que tarda en imprimirse una tarea en la impresora del CPD de
una Escuela de Informática es una variable aleatoria continua con función de distribución
1 2ke 2t ke t si t > 0
F (t) =
0 en el resto
(a) Calcular el valor k. Justi…car la respuesta.
(b) ¿Cuál es el tiempo medio de impresión de una tarea?
(c) Una tarea lleva imprimiéndose 1 minuto, ¿cuál es la probabilidad de que no tarde más
de 2 minutos?
(d) ¿Cuánto tiempo debe durar la impresión de una tarea para que la tercera parte de los
tiempos de impresión de tareas tengan una duración superior a la suya?

3.42 Tres máquinas de cierta planta de ensamblaje, M1 , M2 y M3 , arman, respectivamente, el


30 %, 45 % y 25 % de los productos. Se sabe por experiencia que el 2 %, 3 % y 2 % de los
productos ensamblados por cada máquina, respectivamente, tienen defectos. Se elige al azar
un producto terminado:
(a) Calcular la probabilidad de que sea defectuoso.
(b) Si el producto está defectuoso, ¿cuál de las máquinas es más probable que haya ensam-
blado el producto? Justi…car la respuesta.

3.43 La demanda mensual de tinta para impresora es una variable aleatoria X con función de
densidad
8
>
> kx si 0 x 1
<
k si 1 x 3
f (x) =
>
> k(4 x) si 3 x 4
:
0 en el resto
Calcular:
(a) El valor de k.
(b) La función de distribución de la v.a. X.
(c) La probabilidad de que la demanda en un mes sea inferior a 3:5, sabiendo que en la
primera quincena se habían demandado ya 1:75 unidades.
(d) La demanda mensual media y la demanda mensual mediana.

3.44 El tiempo que tarda un programador en desarrollar un parche de actualización para un


determinado programa informático es una variable aleatoria X con función de densidad
x kx3 si 0 x 2
f (x) =
0 en el resto
Calcular:
(a) El valor k. Justi…car la respuesta.
(b) La función de distribución de la v.a. X.
(c) El valor medio y mediano del tiempo de desarrollo.
(d) Pr fjX E(X)j > 1=3g y la cota que proporciona la desigualdad de Chebychev.
4

Modelos unidimensionales de probabilidad


4.1 En una fábrica el número de accidentes por semana sigue una ley de P oisson con parámetro
= 2. Calcular la probabilidad de que:
(a) En una semana haya algún accidente.
(b) En dos semanas haya cuatro accidentes.
(c) En una semana haya dos accidentes, y en la siguiente otros dos.
(d) En una semana no haya más de tres accidentes, sabiendo que el lunes ha habido ya un
accidente.

4.2 Se formó un jurado de 6 personas de un grupo de 20 posibles miembros, de los cuales 8 eran
negros y 12 blancos. El jurado se seleccionó aleatoriamente pero sólo contenía un miembro
negro. ¿Hay motivos para dudar de la aleatoriedad de la selección?

4.3 Se eligen n números al azar, comprendidos entre 0 y 1. Sea X el mayor de esos números.
Calcular:
(a) Las funciones de densidad y de distribución de X.
(b) La esperanza y la varianza de X.

4.4 El coste de producción de una pieza es de 0:25 euros. El precio de venta depende del diámetro
interior de la pieza, que es una variable aleatoria X que sigue una distribución exponencial
de parámetro 1= . Si el diámetro es mayor que 3 o menor que 1 se desecha la pieza, y si el
diámetro está comprendido entre esos límites, se vende a 0:40 euros.
(a) Hallar el valor de que maximiza el bene…cio esperado.
(b) Con la máquina ajustada para dicho valor de , calcular la probabilidad de que entre 10
piezas producidas, se deseche a lo sumo una.

4.5 Una fábrica produce una pieza en dos calidades diferentes: el 60 % de la producción de ésta
es de calidad A. La duración en años de una pieza de calidad A es una variable aleatoria que
sigue una distribución exponencial de media uno. El 40 % restante de las piezas es de calidad
B. La duración de éstas es una variable aleatoria con distribución exponencial de media 0:5.
(a) Calcular la probabilidad de que una pieza de calidad A dure más de un año.
(b) Calcular la mediana de la distribución del tipo A.
(c) Si tomamos una pieza al azar de toda la producción, ¿cuál es la probabilidad de que
dure más de un año?
(d) Si tomamos una pieza al azar de toda la producción y observamos que dura más de un
año, ¿cuál es la probabilidad de que fuera de calidad A?

4.6 Cierta pieza tiene una distribución de vida exponencial con una vida media de 1000 horas.
(a) ¿Cuál es la probabilidad de que tal pieza dure al menos 500 horas?
(b) ¿Cuál es la probabilidad de que entre tres de tales piezas al menos una falle durante las
primeras 1000 horas?
(c) ¿Cuál es la probabilidad de que entre cuatro de tales piezas exactamente dos fallen
durante las primeras 600 horas?

33
34 Estadística (E.I.I. de Valladolid, Curso 2019/20)

4.7 Se ha estimado que el tiempo de vida, en horas, de una cierta componente electrónica sigue
una distribución exponencial de parámetro = 1=8. El departamento de control de calidad
decide rechazar todas las componentes que fallen en las tres primeras horas, y comercializar
el resto.
(a) Calcular la distribución del tiempo de vida de las componentes comercializadas.
(b) ¿Cuál es la probabilidad de que una componente no rechazada funcione durante más de
doce horas?
(c) Si cada componente de un lote que es rechazada tiene un coste de 5 euros y cada com-
ponente comercializada una ganancia de 10 euros, ¿cuál es la ganancia esperada para
cada componente?

4.8 La proporción de individuos de una población con renta superior a 30000 euros es de 0:01 %.
Calcular la probabilidad de que entre 10000 individuos consultados haya uno con ese nivel de
renta, suponiendo que todos los consultados responden.
Calcular ahora esa probabilidad de forma aproximada, ajustando a otro modelo de probabi-
lidad adecuado. Razonar la respuesta.
4.9 Se supone que el número de almendras en una determinada pasta sigue una ley de Poisson. Se
desea que la probabilidad de que una pasta seleccionada al azar tenga al menos una almendra
sea mayor que 0:9. Determinar el valor entero más pequeño de la media de la distribución
que asegure esa probabilidad.
4.10 En el grupo A habitualmente asisten a clase de Estadística 50 alumnos. El profesor de la asig-
natura ha estimado que la probabilidad de que durante una clase, un alumno esté hablando en
un momento determinado es 0:2. Dicho profesor debe detener la explicación cuando el murmu-
llo es excesivo, lo cual ocurre si más del 96 % de los asistentes está hablando simultáneamente.
Sabiendo que el profesor ha parado su explicación por el murmullo, calcular la probabilidad
de que algún alumno esté callado.
4.11 Un inspector veri…ca 30 cables de embrague de un pedido de gran tamaño para ver si están
dentro de los límites de tolerancia de tensión especi…cados. Si aparece más de uno fuera de
los límites establecidos, entonces el pedido completo se rechaza; en otro caso, se acepta. Se
supone que el 8 % de los cables en el pedido completo están fuera del rango preestablecido.
(a) ¿Qué ley sigue la variable aleatoria X = número de cables fuera de los límites establecidos
de los 30 inspeccionados?
(b) ¿Cuál es la probabilidad de que el pedido sea rechazado?
(c) ¿Es posible aproximar la distribución de probabilidad del apartado (a) a otro modelo de
probabilidad? Justi…car la respuesta.
(d) Calcular la probabilidad de que el pedido sea rechazado con ese nuevo modelo de pro-
babilidad.
Nota: La suposición de un pedido de gran tamaño es equivalente a que el proceso de muestreo
se pueda tratar como si fuera con reemplazamiento.
4.12 Para realizar un trabajo de estadística, un alumno tiene la opción de elegir dos temas, T1 y T2 .
Si elige el tema T1 , pedirá dos libros a través del préstamo interbibliotecario, pero si selecciona
T2 pedirá cuatro libros. El alumno piensa que para realizar un buen trabajo necesita al menos
la mitad de los libros solicitados para cualquiera de los temas elegidos. Si la probabilidad de
que un libro solicitado a través del sistema de préstamo interbibliotecario llegue a tiempo
es 0:9 y los libros llegan independientemente unos de otros, ¿qué tema debe seleccionar el
alumno para maximizar la probabilidad de hacer un buen trabajo? y ¿cuál si la probabilidad
de llegada es sólo de 0:5 en vez de 0:9?
Modelos unidimensionales de probabilidad 35

4.13 Según una estimación reciente, el 55 por ciento de los estudiantes que comienza sus estudios
de Ingeniería Financiera se gradúa a los cuatro años.
(a) ¿Cuál es la probabilidad de que a los cuatro años se licencien exactamente tres estudian-
tes de una muestra de cinco?
(b) ¿Cuál es la probabilidad de que la mayoría de una muestra de cinco estudiantes se gradúe
a los cuatro años?
(c) Se eligen al azar 80 estudiantes que comienzan sus estudios de Ingeniería Financiera.
Calcular la media y la desviación típica de la proporción de esos 80 estudiantes que se
graduará a los cuatro años. Razonar la respuesta.

4.14 El tiempo de reparación de unas impresoras tiene una distribución aproximadamente expo-
nencial, con media 22 minutos.
(a) El coste de reparación es de 20 euros por cada media hora o fracción. ¿Cuál es la
probabilidad de que una reparación cueste 40 euros?
(b) Para efectuar una programación, ¿cuánto tiempo se debe asignar a cada reparación para
que la probabilidad de que cualquier tiempo de reparación mayor que el tiempo asignado
sea solamante de 0:1?

4.15 Determinar el número de ensayos que deben realizarse para que la desviación de la frecuencia
relativa de aparición del suceso A respecto a su probabilidad no supere en valor absoluto a
0:02 con probabilidad 0:99.

4.16 Una fábrica produce lotes de 10000 piezas. Sea p la probabilidad de defectuosas en un lote.
Sabiendo que un lote es aceptado si el número de defectuosas es menor o igual a 40, ¿cuál
debe ser el valor de p para que el lote sea aceptado con probabilidad 0:92?

4.17 Los pesos de los tabiques de adobe utilizados para construcción tienen una distribución normal
con una media de tres libras y desviación típica de 0:25 libras. Suponiendo que los pesos de
los tabiques son independientes y que se toma al azar una muestra de 20:
(a) ¿Cuál es la probabilidad de que todos los tabiques de la muestra tengan un peso mayor
que 2:75 libras?
(b) ¿Cuál es la probabilidad de que el tabique más pesado tenga un peso mayor que 3:75
libras?

4.18 En una gasolinera de autopista la cantidad de litros que se sirven por automóvil está normal-
mente distribuida. Se ha observado que el 21:19 % de las veces la cantidad es superior a 44
litros y que el 11:51 % es inferior a 34 litros. Se quiere conocer:
(a) La esperanza y la desviación típica de la cantidad de litros servida por automóvil. Cal-
cular la probabilidad de que un coche pida a lo sumo 47 litros.
(b) Si en una hora llegan a la gasolinera 25 coches, ¿cuál es la probabilidad de que el número
de litros servidos sea mayor que 1060? ¿Cuál es la probabilidad de que el número medio
de litros sea menor de 38:6?
(c) En otra gasolinera de autopista de la misma empresa, el número de litros servidos por
automóvil sigue una distribución N (39:5; 4). Si en una hora llegan 36 coches a esta
segunda gasolinera, calcular la probabilidad de que la diferencia del número medio de
litros por automóvil entre la primera y la segunda gasolinera esté entre 1 y 1 litros.
36 Estadística (E.I.I. de Valladolid, Curso 2019/20)

4.19 El tiempo que tarda una máquina en perforar un material de tipo 1 se distribuye según una
v.a. normal con media 2 y desviación típica 0:5, un material de tipo 2 según una normal de
media 3 y desviación típica 0:1 y un material de tipo 3 según una variable normal de media
4 y desviación típica 2. El 20 % de las placas perforadas por esa máquina durante la semana
pasada fueron del tipo 1 y el 70 % del resto fueron de tipo 2.
(a) Calcular la probabilidad de que la máquina tarde más de tres unidades de tiempo en
perforar una placa elegida al azar.
(b) Una placa es rechazada si se ha tardado más de tres unidades de tiempo en ser perforada.
Sea X el número de placas rechazadas de un lote de 100, calcular la probabilidad de
rechazar más de 40 sabiendo que el número de placas rechazadas es mayor de 20 y menor
de 60.
(c) Si se ha tardado más de tres unidades de tiempo en perforar una placa elegida al azar,
¿con qué tipo de material es más probable que esté fabricada?

4.20 Una planta de distribución de agua mineral envasa su producto en botellas de vidrio cuyo
peso medio es de 500 gramos y su desviación típica tiene 50 gramos. La máquina automática
vierte en las botellas una cantidad de agua mineral que es una variable aleatoria de media
1000 gramos y desviación típica 40 gramos. Las botellas se envasan en cajas de 12 unidades
y el peso de las cajas tiene una media de 2500 gramos y una desviación típica de 500 gramos.
Suponiendo que todas las poblaciones citadas obedecen a distribuciones normales y son inde-
pendientes:
(a) Determinar la distribución de la v.a. “Peso de las cajas llenas”.
(b) Si la probabilidad de que un envase de vidrio sea defectuoso es 0:05, ¿cuál es la distribu-
ción de la v.a. “Número de envases defectuosos en una caja”?

4.21 Una empresa dispone de tres líneas de envasado automático de botellas de un refresco de
cola. Los contenidos de las botellas envasados por las líneas 1, 2 y 3 son, respectivamente,
variables aleatorias independientes X1 , X2 y X3 con 1 = 998 ml, 2 = 1000 ml, 3 = 1001
ml, 1 = 1:5 ml, 2 = 0:8 ml y 3 = 0:5 ml. Se utilizan dos tipos de cajas, CA y CB , con
6 botellas por caja, de manera que en las cajas CA se colocan 2 botellas de la línea 1, 3
de la 2 y 1 de la 3, mientras que en la caja CB se colocan 2 botellas de la línea 1 y 4 de
la línea 3. Una botella se considera defectuosa si contiene menos de 999 ml y una caja se
considera inaceptable si contiene alguna botella defectuosa. Suponiendo distribución normal
en los contenidos de refresco:
(a) ¿Cuál es la probabilidad de tener un contenido total de refresco de una caja tipo CB
superior al contenido de una caja tipo CA ?
(b) ¿Cuál es el contenido total mínimo que puede garantizarse para una caja CA con un
riesgo de error del 2 %?
(c) Si se toman al azar 150 botellas de la línea 1, ¿cuál es la probabilidad de tener al menos
100 defectuosas?
(d) ¿Cuál es la probabilidad de tener entre 10 cajas de tipo CB tomadas al azar al menos
una inaceptable?

4.22 El tiempo que emplea una famosa banda de rock en los conciertos, incluyendo los bises,
se supone que sigue una distribución normal de media 120 minutos y desviación típica 20
minutos.
(a) ¿En qué proporción de conciertos estuvo esta banda en el escenario entre una hora y
tres cuartos y dos horas y cuarto?
Modelos unidimensionales de probabilidad 37

(b) ¿Qué cantidad de minutos es superada en el 3 % de los conciertos? Razonar la respuesta.


(c) Si la próxima temporada va a realizar una gira por un país y van a celebrar 25 conciertos,
¿cuál es la probabilidad de que el tiempo medio que empleen en esos conciertos sea
inferior a 110 minutos?
(d) Si en esta temporada han actuado en 16 ocasiones, ¿cuál es la probabilidad de que la
diferencia entre los tiempos medios entre las dos temporadas sea inferior a 10 minutos?
Justi…car la respuesta.

4.23 Una máquina de empaquetado de azúcar deposita en cada paquete una media de 1030 g, con
una desviación típica de 40 g. El peso medio del envase vacío y su desviación típica no se
conocen, pero se sabe que el 27:43 % de los envases pesa menos de 102 g y el 13:57 % más de
153 g. Suponiendo que las distribuciones son normales e independientes, determinar:
(a) La media y la varianza del peso del envase vacío.
(b) La distribución del peso de los paquetes llenos.
(c) Si los paquetes se colocan en cajas de 52 unidades, cuyo peso se distribuye según una
ley normal de media 6:5 Kg y desviación típica 600 g, ¿cuál es la distribución del peso
de las cajas llenas?
(d) La probabilidad de que una caja vacía pese más que 6 paquetes de azúcar.

4.24 El tiempo que tarda una persona en rellenar un impreso de solicitud de subvención a la
compra de una vivienda sigue una distribución normal que tiene una media de 10 minutos y
una desviación típica de 3 minutos.
(a) ¿Cuál es la probabilidad de que una persona elegida al azar tarde menos de 8:5 minutos
en rellenar el impreso?
(b) ¿Cuál es la probabilidad de que una persona elegida aleatoriamente tarde entre 7 y 13
minutos en rellenar el impreso?
(c) El cinco por ciento de todas las personas tarda más de x minutos en rellenar el impreso.
¿Cuál es el valor de x?
(d) De cuatro personas elegidas aleatoriamente, ¿cuál es la probabilidad de que exactamente
dos de ellas tarden más de 6 minutos en rellenar el impreso?

4.25 La capacidad de un DVD virgen se distribuye según una ley normal con media 4:7 GB y
desviación típica 0:12 GB. Un disco se considera defectuoso si su capacidad es menor de 4:52
GB.
(a) ¿Cuál es la proporción de DVDs defectuosos?
(b) Si tomamos 10 DVDs, ¿cuál es la probabilidad de que ninguno sea defectuoso?
(c) Si se seleccionan aleatoriamente 625 DVDs, ¿cuál es la probabilidad de que al menos 60
sean defectuosos? ¿Y de que la capacidad promedio sea inferior a 4:69 GB? Justi…car la
respuesta.
(d) La máquina que fabrica los DVDs se puede ajustar para modi…car la capacidad media
de los discos y que solo el 0:1 % de los DVDs sean defectuosos. En este caso, ¿cuál es la
capacidad media de los DVDs?

4.26 El tiempo que tarda en fallar un componente electrónico tipo A sigue una distribución normal
que tiene una media de 60 meses y una desviación estándar de 4 meses.
(a) ¿Qué proporción de componentes tipo A tardan en fallar entre 54 y 62 meses?
38 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(b) El veinte por ciento de todas las componentes tarda más de x meses en fallar. ¿Cuál es
el valor de x?

4.27 Se sabe que una de cada cuatro personas que entran en la gran tienda de electrodomésticos
CuartilRecord realizará al menos una compra.
(a) Si se selecciona una muestra de ocho personas, ¿cuál es la probabilidad de que
(i) dos o más realicen al menos una compra?
(ii) a lo más siete hagan al menos una compra?
(b) En una muestra de 192 personas, ¿cuál es la probabilidad aproximada de que
(i) 47 o más realicen al menos una compra? Justi…car la respuesta.
(ii) a lo más 70 realicen al menos una compra? Justi…car la respuesta.

4.28 Una compañía que fabrica microprocesadores produce el 5 % de defectuosos. El tiempo de


vida de un microprocesador es una variable aleatoria con distribución exponencial de media
1 año para los microprocesadores defectuosos, y de media 5 años para los no defectuosos.
(a) ¿Cuál es la probabilidad de que falle un solo microprocesador defectuoso en 2 años?
Justi…car la respuesta.
(b) ¿Y de que fallen no más de dos microprocesadores defectuosos en 4 años? Razonar la
respuesta.
(c) Calcular la probabilidad de que un microprocesador elegido al azar dure menos de 3
años.
(d) Si un procesador elegido al azar ha fallado antes de los tres años, ¿cuál es la probabilidad
de que no sea defectuoso?

4.29 El fabricante de las fuentes de alimentación utilizadas en los ordenadores P ear espera que el
1 % de estas no funcionen bien durante el periodo de garantía de dos años.
(a) En una muestra de diez fuentes de alimentación, ¿cuál es la probabilidad de que
(i) ninguna funcione mal durante el periodo de garantía?
(ii) al menos dos funcionen mal durante el periodo de garantía?
(b) En una muestra de cien fuentes de alimentación, ¿cuál es la probabilidad aproximada de
que
(i) ninguna funcione mal durante el periodo de garantía? Justi…car la respuesta.
(ii) al menos dos funcionen mal durante el periodo de garantía?

4.30 Dos ordenadores, que trabajan independientemente, son utilizados para dar servicio a una
pequeña red informática que funciona diariamente de siete de la mañana a once de la noche.
Los ordenadores se encuentran ubicados en la misma sala, de manera que si uno de los
ordenadores se avería, sus tareas pueden pasar al otro ordenador y continuar el servicio. Sea
Ti , i = 1; 2, el tiempo que ha prestado servicio el ordenador i hasta que se avería. Se sabe que
T1 tiene una distribución exponencial con media 1 = 120 horas y T2 sigue una ley normal
de media 2 = 20 horas y 2 = 3 horas.
(a) A las siete de la mañana de un día cualquiera, ¿cuál de los dos tiene más probabilidad
de no tener avería en esa jornada? Justi…car la respuesta.
(b) Cuál es la probabilidad de que los dos ordenadores terminen la jornada sin averiarse?
(c) ¿Cuál es la probabilidad de que la red funcione durante toda la jornada?
Modelos unidimensionales de probabilidad 39

(d) Sabiendo que a las tres de la tarde los dos ordenadores siguen funcionando correctamente,
¿cuál es el ordenador que tiene más probabilidad de terminar la jornada sin averiarse?
Justi…car la respuesta.

4.31 El tiempo de vida útil del disco duro Ealpha sigue una distribución normal de media ocho
años y desviación típica quince meses.
(a) ¿Qué porcentaje de discos duros tiene una vida útil entre 7 y 10 años?
(b) El quince por ciento de todos los discos duros tiene una vida útil de más de x meses.
¿Cuál es el valor de x?

4.32 Una base de datos recibe dos tipos de consultas de acuerdo a dos procesos de P oisson inde-
pendientes entre sí. Las consultas de lectura llegan a una tasa media de diez cada segundo y
las de escritura a una tasa media de seis cada segundo.
(a) ¿Cuál es la probabilidad de que el tiempo entre dos consultas de escritura consecutivas
sea mayor que 0:3 segundos? Razonar la respuesta.
(b) ¿Cuál es la probabilidad de que durante un intervalo de tiempo de dos segundos lleguen
como mucho tres consultas de escritura? Justi…car la respuesta.
(c) ¿Cuál es la probabilidad de que durante un intervalo de 0:5 segundos lleguen como
mínimo tres consultas (de lectura o escritura)? Razonar la respuesta.
(d) ¿Cuál es la probabilidad aproximada de que se produzcan al menos mil consultas durante
el próximo minuto? Justi…car la respuesta.

4.33 Sea T una variable aleatoria continua que representa la duración (en años) de un microproce-
sador. Denominaremos función de …abilidad del microprocesador a R(t) = PrfT > tg (por
tanto, R(t) representa la probabilidad de que el microprocesador funcione después del tiempo
t). Supongamos que T tiene una distribución exponencial de media 15 años.
(a) Calcular la …abilidad del microprocesador. Razonar la respuesta.
(b) Considerar los sistemas que se muestran en la …gura siguiente en el que se supone que
las duraciones de los microprocesadores idénticos son independientes. ¿Cuál de los dos
sistemas tiene mayor probabilidad de seguir funcionando después de 15 años? Justi…car
la respuesta.

4.34 Los usuarios del correo electrónico de una determinada universidad reciben una media de 5
mensajes spam al día. Suponiendo que los mensajes de spam son idependientes unos de otros
y que la media es constante. Calcular:
(a) La probabilidad de recibir más de un mensaje spam en un día.
(b) De forma aproximada (utilizando el Teorema Central del Límite) la probabilidad de que
en un año (365 días) se reciban menos de 1800 mensajes spam. Justi…car la respuesta.

4.35 Una página web recibe por término medio 10 accesos por minuto. Suponiendo que los accesos
a la página web son idependientes unos de otros y que la media es constante. Calcular:
(a) La probabilidad de que se produzcan más de dos accesos en un minuto.
40 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(b) De forma aproximada (utilizando el Teorema Central del Límite) la probabilidad de que
en una hora se produzcan a lo sumo 550 accesos a la página web. Justi…car la respuesta.

4.36 Un grupo de antiguos alumnos de Ingeniería Informática está preparando a los estudiantes de
primer curso de Grado en Ingeniería Industrial para un examen práctico de Programación.
El tiempo que emplea cada estudiante en la realización de una práctica tipo se supone que
tiene una distribución normal de media 1 hora y desviación típica 30 minutos. Calcular:
(a) La probabilidad de que un estudiante utilice más de dos horas y media en terminan la
práctica. Razonar la respuesta.
(b) La probabilidad aproximada de que más de 2 estudiantes de los 200 que han realizado
la prueba invirtieran más de dos horas y media en la realización de la práctica. Justi…car
la respuesta.

4.37 Las cali…caciones medias de los estudiantes de una facultad de informática siguen una dis-
tribución normal de media 5:4 y una desviación típica de 1:2.
(a) Se elige aleatoriamente un estudiante de ese centro universitario, ¿cuál es la probabilidad
de que tenga una cali…cación media de más de 6:0? ¿Y de que tenga una cali…cación media
de entre 4:5 y 5:7?
(b) ¿Cuál es la cali…cación media mínima necesaria para que la cali…cación media de un
estudiante esté entre el 10 por ciento más alto de la facultad?
(c) Se eligen aleatoriamente 300 estudiantes de esa facultad. ¿Cuál es la probabilidad de que
al menos 60 de estos estudiantes tengan una cali…cación media de más de 6:0?
(d) Se eligen aleatoriamente cuatro estudiantes de esa facultad. ¿Cuál es la probabilidad de
que al menos dos de ellos tengan una cali…cación media de más de 6:0?

4.38 El garaje de un hotel posee un total de 15 plazas de aparcamiento. El número de clientes


que solicitan plaza en él sigue una distribución de Poisson de media diez por día. Calcular,
justi…cando las respuestas:
(a) La probabilidad de que en un día soliciten plaza más de 10 clientes.
(b) La probabilidad de que en un día el aparcamiento se encuentre completo.
(c) La probabilidad del apartado (b) de forma aproximada (utilizando el Teorema Central
del Límite).

4.39 El tiempo de autonomía de las baterías utilizadas en un determinado dispositivo móvil es


una variable aleatoria normal con media 10 horas y una desviación típica de 30 minutos. El
proveedor de estas baterías considera defectuosas aquellas baterías cuya autonomía esté fuera
del intervalo 10 0:95 horas.
(a) ¿Qué proporción de las baterías producidas son defectuosas?
(b) Se eligen aleatoriamente 15 de esas baterías. ¿Cuál es la probabilidad de que al menos
una de ellas sea defectuosa? Justi…car la respuesta.
(c) Se eligen aleatoriamente 300 de esas baterías. ¿Cuál es la probabilidad de que al menos
10 de ellas sean defectuosas? Razonar la respuesta.
(d) Si se hacen cambios para reducir la variabilidad, ¿cuál debe ser el valor de para que
solamente se produzca el 1 % de baterias defectuosas? Razonar la respuesta.

4.40 El tiempo que tarda en ejecutarse un proceso en un ordenador sigue una distribución nor-
mal de media 15 milisegundos. Se sabe que el 37:6 % de los procesos tarda más de 15:79
milisegundos. Calcular:
Modelos unidimensionales de probabilidad 41

(a) La desviación típica del tiempo de ejecución.


(b) La probabilidad de que un proceso tarde en ejecutarse más de 17 milisegundos.
(c) Un proceso se considera e…ciente si tarda menos de 13:75 milisegundos en ejecutarse.
¿Cuál es la proporción de procesos e…cientes?

4.41 La línea 2 de la fábrica de ordenadores portátiles Husar se encarga de ensamblar en la base


cuatro componentes: el disco duro, la memoria RAM, el ventilador y la batería. Los pesos
de esos cuatro componentes son independientes y están normalmente distribuidos con las
siguientes medias y desviaciones típicas (en gramos):

Componente Disco duro M emoria RAM V entilador Bater{a


M edia 155 65 85 295
Desv:t{pica 3 1 2 2:5
(a) ¿Cuál es la probabilidad de que el peso de las cuatro piezas ensambladas en un ordenador
portátil sea mayor de 609 gramos? Justi…car la respuesta.
(b) ¿Cuál es la probabilidad de que en una muestra aleatoria de 10 ordenadores portátiles,
en al menos dos de ellos el peso de las cuatro piezas ensambladas sea inferior a 590
gramos? Razonar la respuesta.

4.42 El peso de unas baterías externas para smartphones se distribuye normalmente. Se sabe que
un 12:1 % de las baterías pesan menos de 276:6 g y un 11:9 % más de 323:6 g.
(a) Calcular la media y la varianza de la distribución.
(b) Si las baterías se empaquetan en cajas de 25 unidades, ¿cuál es la probabilidad de que
una caja pese más de 7:58 kg? Justi…car la respuesta.
(c) Se toman al azar cinco cajas de baterías, ¿cuál es la probabilidad de que al menos dos
de las cajas pesen más de 7:58 kg? Razonar la respuesta.
(d) Si se toman al azar cincuenta cajas de baterías, ¿cuál es la probabilidad de que al menos
trece de las cajas pesen más de 7:58 kg? Razonar la respuesta.

4.43 La cantidad de folios que demanda mensualmente un juzgado sigue una distribución normal
de media 2000 y desviación típica 300. Calcular:
(a) La probabilidad de que un mes demande más de 2500 folios.
(b) La demanda mínima de folios que requiere el 30 % de los meses que más folios necesita.
(c) Número medio de veces que requiere más de 2500 folios, en un total de 2:5 años.

4.44 El tiempo de vida últil T de cierto tipo de componente electrónico tiene aproximadamente
una distribución normal, con una media de 17 años y una desviación estándar de 3 años.
(a) Calcular la probabilidad de que el tiempo de vida útil de una componente de ese tipo
elegida al azar sea inferior a los 11 años.
(b) Se dispone de un lote de 300 componentes de ese tipo. Calcular la probabilidad de que
por lo menos 8 de ellos tengan un tiempo de vida inferior a 11 años.

4.45 Uno de los parámetros de calidad fundamentales en la fabricación de un determinado com-


ponente electrónico es su peso, que es una variable aleatoria P que sigue una distribución
normal. Se sabe que un 11:9 % de los componentes pesan menos de 57:64 gramos y un 13:35 %
pesan más de 62:22 gramos.
42 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(a) Calcular la media y la desviación típica del peso de los componentes.


(b) Un componente se considera defectuoso si su peso di…ere de la media en más de 4 gramos.
¿Cuál es el porcentaje de componentes defectuosos que se fabrican?
(c) Los componentes se comercializan en paquetes de 8 unidades. Si un paquete contiene 1 o
más componentes defectuosos, se retira del mercado. ¿Cuál es la proporción de paquetes
que se retiran del mercado?
(d) Un cliente ha realizado un pedido de 200 paquetes. ¿Cuál es la probabilidad de que en
el pedido haya menos de 50 paquetes no aptos para la venta? Justi…car la respuesta.
BLOQUE 3

INFERENCIA ESTADÍSTICA

43
5

Introducción al muestreo y a la estimación estadística


5.1 Las cali…caciones de los estudiantes que realizan un examen de ingreso en la Facultad de Inge-
niería Financiera siguen una distribución normal que tiene una media de 42 y una desviación
típica de 10. Se toma una muestra aleatoria simple de 25 cali…caciones.
(a) Calcular la probabilidad de que la media muestral de las cali…caciones sea superior a 45.
(b) Determinar la probabilidad de que la media muestral de las cali…caciones esté compren-
dida entre 40 y 45.
(c) La probabilidad de que la media muestral de las cali…caciones sea superior a x es 0:1,
¿cuál es el valor de x?
(d) La probabilidad de que la desviación típica muestral de las cali…caciones sea superior a
y es 0:05, ¿qué valor tiene y?

5.2 La duración de las reparaciones de una impresora sigue una distribución normal que tiene
una media de 38 minutos y una desviación típica de 6 minutos.
(a) ¿Qué proporción de reparaciones tienen una duración entre 28:4 y 40:4 minutos?
(b) Se toma una muestra aleatoria simple de la duración de 9 reparaciones de impresoras.
(i) ¿Cuál es la probabilidad de que la media muestral de la duración de las reparaciones
sea de más de 42 minutos?
(ii) La probabilidad de que la media muestral de la duración de las reparaciones sea de
menos de x minutos es 0:25. ¿Cuál es el valor de x?
(iii) La probabilidad de que la desviación típica muestral de la duración de las repara-
ciones sea de más de y minutos es 0:1. ¿Qué valor tiene y?

5.3 Para estimar la media de una población se considera el estimador aX. Encontrar el valor de
a que minimice el error cuadrático medio.

5.4 Los defectos en una placa fotográ…ca siguen una distribución de P oisson. Se estudian siete
placas encontrando 3, 5, 2, 1, 2, 3, 4 defectos. Calcular:

(a) Una estimación centrada para .


(b) Una estimación puntual insesgada de la varianza del estimador.

5.5 Calcular el valor de k para el cual b = kX es un estimador insesgado del parámetro de la


v.a. X cuya función de densidad es:
1
f (x; ) = si 0 < x <

Considerando ahora una m.a.s. de tamaño n, calcular un estimador insesgado de . ¿Cuál es


su varianza?

5.6 En un experimento de Bernouilli se observan los valores x1 ; x2 ; :::; xn en n ensayos indepen-


dientes. Se proponen los siguientes estadísticos como estimadores del parámetro p:
1 Pn 1 Pn
T1 = n i=1 Xi T2 = n+2 (1 + i=1 Xi )

45
46 Estadística (E.I.I. de Valladolid, Curso 2019/20)

¿Son estimadores insesgados de p?

5.7 Supóngase que se tiene una muestra aleatoria simple de tamaño 2n proveniente de una
población denotada por X, y que E(X) = y V ar(X) = 2 . Sean
1 P2n 1 Pn
X 1 = 2n i=1 Xi y X 2 = n i=1 Xi

dos estimadores de . ¿Cuál de los dos es mejor estimador de ? Justifícar la elección.

5.8 En una población N ( ; ) se toma una m.a.s. de tamaño 3 y se consideran los siguientes
estimadores de la media poblacional:

T = 0:65X1 + 0:25X2 S = 2X3 X1 R = (X1 + X2 + X3 ) =3

Determinar cuál de estos estimadores es mejor desde el punto de vista del sesgo y la e…ciencia.

5.9 Sea X1 ; X2 ; X3 una m.a.s. de una población exponencial con media . Considerar los siguientes
estimadores de :

T1 = X T2 = X1 T3 = (X1 + X2 )=2

(a) ¿Cuáles de los tres estimadores son insesgados?


(b) De los estimadores insesgados, ¿cuál es el más e…ciente?

5.10 Sea X1 ; X2 una m.a.s. de una población con media 0 y varianza 2. Considerar los siguientes
estimadores de 2 :

T1 = (X12 + 2X22 )=3 T2 = (2X12 + 3X22 )=5

(a) ¿Son insesgados?


(b) ¿Cuál de los dos estimadores es preferible?

5.11 Sea X una v.a. N ( ; ). Consideremos X1 ; X2 ; :::; Xn una m.a.s. de X. Sabiendo que V ar(Sc2 ) =
2 4 =(n 1), deducir cuál de los siguientes estimadores es preferible (menor error cuadrático
medio): S 2 o Sc2 .
2
5.12 (a) Sea b un estimador insesgado del parámetro con V ar(b) > 0. Demostrar que b es
2
un estimador sesgado de , y determinar su sesgo.
(b) Sea X1 ; :::; Xn una muestra aleatoria simple de una población de P oisson de parámetro
. Indicar un estimador T insesgado para y determinar el sesgo de T 2 como estimador
de 2 .

5.13 Sea X1 ; X2 una muestra aleatoria simple de una población X con distribución N ( ; ). Para
estimar 2 se consideran los estimadores T1 = X12 y T2 = X1 X2 . ¿Cuál de los dos estimadores
es preferible en el sentido de la insesgadez?

5.14 Sea X1 ; X2 ; :::; Xm ; Xm+1 ; :::; Xm+n una m.a.s de una población normal de media y varianza
2 . Se desea estimar , pero sólo se dispone de las medias

1 Pm 1 Pm+n
X1 = m i=1 Xi y X 2 = n i=m+1 Xi

Se considera el estimador b( ) = X 1 + (1 )X 2 , donde 0 < < 1.


Probar que para cualquier valor de , b( ) es un estimador insesgado para e indicar, además,
para qué valor de de…ne el mejor estimador de todos ellos.
Introducción al muestreo y a la estimación estadística 47

5.15 Sea X1 ; X2 ; :::; Xn una m.a.s. de una v.a. X con distribución de Rayleigh
x x2
f (x; ) = expf 2 g si x > 0

Sabiendo
P 2 que E(X 2 ) = 2 , determinar un estimador insesgado para con base el estadístico
Xi .

5.16 Los datos siguientes representan el precio de venta (en miles de euros) en una muestra aleatoria
simple de ocho viviendas:

192 183 212 227 209 196 202 190

(a) Calcular una estimación puntual insesgada del precio medio de venta.
(b) Determinar una estimación puntual insesgada de la varianza de la media muestral.
(c) Hallar una estimación puntual insesgada de la proporción de viviendas con un precio de
venta inferior a 192500 euros.

5.17 Una muestra aleatoria simple del número de pasajeros por vuelo (X) registrados entre las
ciudades de Montefea y Felmonte ha proporcionado los siguientes datos: n = 12, xi = 293,
x2i = 8097.
(a) Calcular una estimación puntual insesgada del número medio de pasajeros por vuelo.
(b) Calcular una estimación insesgada de la varianza del número de pasajeros por vuelo.
(c) Hallar una estimación puntual insesgada de la varianza de la media muestral.

5.18 Sea (X1 ; X2 ) una muestra aleatoria simple de una población con media y varianza 2.

Considerar los tres estimadores de :

b1 = (X1 + X2 )=2 b2 = (X1 + 3X2 )=4 b3 = (X1 + 2X2 )=3

(a) Probar que los tres estimadores son insegados.


(b) ¿Cuál de los tres estimadores es más e…ciente? Razonar la respuesta.

5.19 Sea X1 ; X2 ; X3 una m.a.s. de una población X de media y varianza 2. Considerar los
siguientes estimadores de :

b1 = (X1 + X2 + X3 )=3 y b2 = (X1 + 2X2 + 3X3 )=6

(a) ¿Son insesgados?


(b) ¿Cuál de los estimadores insesgados es más e…ciente?

5.20 Sea X1 ; X2 ; :::; X5 una m.a.s. de una población X N ( ; ). Calcular la probabilidad de que
se encuentre entre X 2S.
P10 2
5.21 Sea X1 ; X2 ; :::; X10 una m.a.s. de una población X N (0; 3) e Y = i=1 Xi . Calcular:
(a) PrfY 90g
(b) x= PrfY < xg = 0:8
(c) Percentiles de orden 10 y 90 de la v.a. Y .

5.22 El tiempo T que tarda en ejecutarse un algoritmo es una v.a. con distribución normal de media
y varianza 2 . Sean T1 ; T2 ; :::; Tn y X1 ; X2 ; :::; Xn dos m.a.s. de los tiempos de ejecución de
ese algoritmo. ¿De qué tamaño deben ser ambas muestras para que la probabilidad de que
los tiempos medios di…eran no más de unidades sea 0:99?
48 Estadística (E.I.I. de Valladolid, Curso 2019/20)

5.23 Sea X1 ; X2 ; :::; X5 una m.a.s. de una población que tiene media y varianza 2. Considerar
los siguientes estimadores de :

b1 = (X1 + X2 + X3 + X4 + X5 )=5 y b2 = (X1 + 3X5 X3 )=3

(a) ¿Son insesgados? Justi…car la respuesta.


(b) ¿Cuál de los estimadores insesgados es más e…ciente? Razonar la respuesta.

5.24 Se sabe que, en una determinada universidad, el 75 % de los estudiantes de último curso acepta
una oferta de trabajo antes de graduarse. Se ha observado que los salarios de estos estudiantes
sigue una distribución normal que tiene una media de 14500 euros y una desviación típica de
2000 euros.
(a) ¿Cuál es la probabilidad de que a lo sumo el 65 % de una muestra aleatoria simple de
80 estudiantes de último curso acepte una oferta? Justi…car la respuesta.
(b) ¿Cuál es la probabilidad de que el salario medio de una m.a.s. de nueve estudiantes de
último curso que aceptan una oferta fuese de más de 15000 euros? Razonar la respuesta.
(c) Se elige al azar un estudiante de último curso, ¿cuál es la probabilidad de que haya
aceptado una oferta de trabajo con un salario de más de 15000 euros? Justi…car la
respuesta.
(d) Se toma una m.a.s. de 25 estudiantes de último curso que aceptan una oferta. ¿Cuál es
la probabilidad de que la desviación típica muestral de sus salarios sea de más de 2400
euros? Razonar la respuesta.

5.25 Una tienda de productos informáticos vende tres marcas diferentes de impresoras. Sean X1 ; X2
y X3 las v.a. que representan el volumen mensual de ventas (en cientos de euros) para cada
una de las marcas. Sabiendo que las v.a. son independientes y normalmente distribuidas con
medias respectivas 8, 12 y 15, y varianzas 4, 8 y 13, respectivamente:
(a) Calcular la probabilidad de que en un mes particular el volumen total de ventas para
las tres marcas de impresora supere los 3600 euros. Justi…car la respuesta.
(b) Calcular la probabilidad de que en un mes particular la suma de los volúmenes de ventas
de la primera y la tercera marca supere en más del doble el volumen de ventas de la
segunda marca.
(c) Se consideran diez tiendas de este tipo cuyos volúmenes de ventas son independientes.
(i) ¿Cuál es la probabilidad de que haya más de una tienda en la que la suma de los
volúmenes de ventas de la primera y la tercera marca supere en más del doble el
volumen de ventas de la segunda marca? ¿Y de que no haya más de dos? Justi…car
la respuesta.
(ii) Calcular la probabilidad de que la desviación típica muestral de las ventas totales
sea de más de 400 euros.

5.26 El tiempo X que transcurre desde que se ordena imprimir un documento hasta que comienza
la impresión del mismo es una v.a. con media y varianza 2 . Sean X1 ; X2 ; X3 una m.a.s. de
X y b1 = X1 +X32 +X3 , b2 = X1 +2X62 +3X3 y b3 = 2X1 +X
2
2 X3
tres estimadores del parámetro :
(a) ¿Son insesgados? Justi…car la respuesta.
(b) ¿Cuál de los estimadores insesgados es más e…ciente? Razonar la respuesta.

5.27 En un determinado periodo de tiempo, el rendimiento porcentual de un cierto tipo de fondos


de inversión siguió una distribución normal de media 12:8 y desviación típica 6. Se tomó una
m.a.s. de dieciséis de esos fondos.
Introducción al muestreo y a la estimación estadística 49

(a) ¿Cuál es la probabilidad de que el rendimiento muestral medio sea de más del 17 %?
Razonar la respuesta.
(b) ¿Cuál es la probabilidad de que el rendimiento muestral medio esté comprendido entre
el 11 y el 15:5 %?
(c) La probabilidad de que la media muestral del rendimiento porcentual sea de menos de
x es 0:25. ¿Cuál es el valor de x?
(d) La probabilidad de que la desviación típica muestral del rendimiento porcentual sea de
más de y es 0:1. ¿Qué valor tiene y?

5.28 En una muestra aleatoria de 120 componentes electrónicos, se encontraron 9 defectuosos.


(a) Dar una estimación puntual insesgada de la proporción de componentes electrónicos que
no estén defectuosos. Justi…car la respuesta.
(b) Se desea construir un sistema seleccionando al azar tres de estos compenentes y conec-
tándolos en serie. Sabiendo que la conexión en serie implica que el sistema funciona
siempre y cuando ningún componente esté defectuoso, estimar la proporción de todos
los sistemas que funcionan de manera adecuada.
Indicación: Expresar Prfel sistema funcionag en función de la probabilidad de que un
componente funcione adecuadamente.

5.29 El tiempo de vida, en años, de una componente electrónica es una variable aleatoria con
distribución normal de media 7 y desviación típica 0:8. Calcular:
(a) La probabilidad de que la vida media de una muestra aleatoria de 16 de esas componentes
esté comprendida entre 6:5 y 7:25 años. Razonar la respuesta.
(b) El valor de x a la izquierda del cual caería el 12:5 % de las vidas medias calculadas de
muestras aleatorias de tamaño 25.
(c) El valor de y a la izquierda del cual caería el 5 % de la desviación típica muestral del
tiempo de vida de muestras aleatorias de tamaño 25.
(d) ¿Qué tamaño muestral sería necesario para que Prf6:9 X 7:1g = 0:98?

5.30 El tiempo T que tarda en ejecutarse un algoritmo de optimización se supone que es una
variable aleatoria con la distribución de Erlang de parámetro > 0
t t=
f (t; ) = 2e si t > 0

Sea T1 ; T2 ; :::; Tn una m.a.s. de T . Sabiendo que E(T ) = 2 y V ar(T ) = 2 2 , determinar:


(a) Un estimador puntual insesgado para . Justi…car la respuesta.
2
(b) Un estimador puntual insesgado para . Razonar la respuesta.

5.31 El tiempo que tarda en ejecutarse una determinada tarea en una computadora es una variable
aleatoria normal de media 10 segundos y desviación típica 0:5 segundos.
(a) ¿Cuál es la probabilidad de que una tarea dure más de 11 segundos?
(b) Si la tarea lleva ejecutándose 11 segundos, ¿cuál es la probabilidad de que …nalice durante
la décima de segundo siguiente? Justi…car la respuesta.
(c) Se toma una m.a.s. de 100 tareas, ¿cuál es la probabilidad de que al menos 3 de ellas
tarden en ejecutarse más de 11 segundos? Razonar la respuesta.
(d) Se toma una m.a.s. de 25 tareas, ¿cuál es la probabilidad de que el tiempo medio de
ejecución sea inferior a 9:9 segundos? Justi…car la respuesta.
50 Estadística (E.I.I. de Valladolid, Curso 2019/20)

5.32 El tiempo de lectura de un registro en una base de datos es una v.a. normal de media 3
milisegundos y desviación típica 0:45. Se toma una m.a.s. de 81 registros.
(a) ¿Cuál es la probabilidad de que el tiempo de lectura de un registro esté fuera del intervalo
2:82 0:45?
(b) ¿Cuál es la probabilidad de que al menos 25 registros tarden en leerse más de 3:27
milisegundos? Razonar la respuesta.
(c) ¿Cuál es la probabilidad de que el tiempo total de lectura de los 81 registros supere los
250 milisegundos? Justi…car la respuesta.
(d) ¿Cuál es la probabilidad de que el tiempo medio de lectura de los 81 registros sea inferior
a 2:85 milisegundos? Razonar la respuesta.
(e) La probabilidad de que la desviación típica muestral del tiempo de lectura sea de más
de y milisegundos es 0:2. ¿Qué valor tiene y?

5.33 El tiempo de vida X de una batería se considera que es una variable aleatoria con función de
densidad 2
f (x; ) = 2 ( x) si 0 < x <
2
Sea X1 ; X2 ; :::; Xn una m.a.s. de X. Sabiendo que E(X) = =3 y E(X 2 ) = =6, determinar:

(a) Un estimador puntual insesgado para , b. Justi…car la respuesta.


Indicación: Utilizar el método de los momentos.
(b) La varianza del estimador b. Razonar la respuesta.

5.34 El libro de texto recomendado en la asignatura Filosofía de la Seguridad Informática tiene


un precio alto en las librerías cercanas al campus universitario, por lo que los alumnos ma-
triculados en la asignatura están considerando la compra en el portal de subastas electrónicas
i-compra. Basándonos en subastas anteriores, podemos suponer que el precio pagado en una
subasta por ese libro de texto tiene una distribución aproximadamente normal con una media
de 108 e y una desviación estándar de 12 e.
(a) ¿Cuál es la probabilidad de que en una subasta seleccionada al azar el precio pagado
por ese libro esté entre 84 e y 126 e? Justi…car la respuesta.
(b) Determinar el precio máximo pagado por ese libro en el 90 % de las subastas celebradas.
Justi…car la respuesta.
(c) Si el día anterior a la …nalización de la subasta la puja máxima era de 120 e, ¿cuál es la
probabilidad de que el precio …nalmente pagado supere los 132 e? Justi…car la respuesta.
(d) Supongamos que existen 10 portales de subastas electrónicas independientes en los que
se subasta ese libro y que el precio pagado tiene las mismas características en cada uno
de ellos. Calcular la probabilidad de que en al menos dos portales se pague más de 120
e por el libro. Justi…car la respuesta.
(e) Se toma una m.a.s. de 9 subastas de ese libro, ¿cuál es la probabilidad de que el precio
medio pagado sea inferior a 99 e? Justi…car la respuesta.

5.35 El espesor X de un disco óptico es una variable aleatoria con distribución normal de media
y varianza 2 . Sea X1 ; X2 ; :::; Xn , con n > 4, una m.a.s. de X. Se consideran los siguientes
estimadores de :

1 Pn 1 X1 + X2 1 Pn
b1 = Xi y b 2 = + Xi
n i=1 2 2 n 2 i=3
Introducción al muestreo y a la estimación estadística 51

(a) ¿Son insesgados? Justi…car la respuesta.


(b) ¿Cuál de los estimadores insesgados es el más e…ciente? Justi…car la respuesta.

5.36 Los diodos láser utilizados en una línea de montaje de unidades de disco óptico son sumin-
istrados por dos proveedores A y B. La duración de estos diodos se puede considerar que está
normalmente distribuida. El proveedor A suministra una tercera parte de los diodos láser,
los cuales tienen una duración media de 12000 horas con desviación típica de 300 horas. Los
diodos suministrados por B tienen una duración media de 12500 horas y una desviación típica
de 140 horas.
(a) ¿Cuál es la probabilidad de que un diodo láser seleccionado al azar tenga una duración
entre 12360 y 12780 horas? Justi…car la respuesta.
(b) Se han comprado 100 diodos al proveedor A y 50 al proveedor B. ¿Cuál es la probabilidad
de que la duración media de los 50 diodos suministrados por B no supere en más de 400
horas a la duración media de los 100 suministrados por A? Razonar la respuesta.

5.37 Sean X1 , X2 y X3 los tiempos de duración de tres componentes importantes de un orde-


nador. Se considera que son v.a. normales independientes con valores esperados 1 , 2 y 3
y varianzas 21 , 22 y 23 , respectivamente.
(a) Si = = = 60 y 2 = 2 = 2 = 12, calcular:
1 2 3 1 2 3
(i) PrfX1 + X2 + X3 201g.
(ii) Pr 58 X 62 .
(b) Si = 40, = 50, = 60, 2 = 10, 2 = 11 y 2 = 15, calcular:
1 2 3 1 2 3
(i) Pr fX1 + X2 2X3 + 6g.
(ii) El valor de x para que Pr fX1 + X2 + X3 xg = 0:15.

5.38 El tiempo que tarda en descargarse un archivo multimedia en un teléfono móvil es una variable
aleatoria X con media y varianza 2 . Sea X1 ; X2 ; :::; Xn una m.a.s. de X.
2 2
(a) Probar que X es un estimador sesgado para y determinar su sesgo.
2
(b) Obtener el valor de para que el estimador X S 2 sea insesgado para 2. Justi…car
la respuesta.

5.39 El peso de una base de refrigeración para ordenador portátil se distribuye según una ley
normal con media 1:5 Kg y desviación típica 150 g. Se toma una muestra aleatoria simple de
36 bases de refrigeración.
(a) Calcular la probabilidad de que la media muestral de los pesos sea superior a 1540
gramos.
(b) Determinar la probabilidad de que el peso medio de las bases de regrigeración esté
comprendido entre 1:45 y 1:54 kilogramos.
(c) La probabilidad de que el peso medio de las bases de refrigeración sea inferior a x Kg es
0:08, ¿cuál es el valor de x?
(d) La probabilidad de que la desviación típica muestral de los pesos sea de más de y Kg es
0:2, ¿qué valor tiene y?
6

Estimación con…dencial
6.1 Sea X una v.a. N ( ; 5). Calcular el tamaño muestral mínimo para que con una probabilidad
de 0:95 el intervalo [X 1; X + 1] contenga al parámetro .

6.2 Sea p la proporción de familias que poseen un determinado electrodoméstico. Se desea cons-
truir un intervalo de con…anza para tal proporción para lo cual se toma una muestra de
tamaño 200. De las 200 familias encuestadas, 157 resultaron ser poseedoras del electrodomés-
tico. Calcular un intervalo de con…anza para p al 90 %; 95 % y 99 %. Comentar los resultados.

6.3 Se prueba un nuevo tipo de munición para estimar la dispersión de su alcance. En un expe-
rimento se hicieron 17 disparos y se calculó la desviación típica de los 17 alcances obtenidos,
resultando ser 4:5. Suponiendo que la población de los alcances de este tipo de munición es
normal, hallar un intervalo estimador de al nivel de con…anza del 99 %.

6.4 Se está investigando el alcance de un nuevo tipo de cartuchos para mortero. Los alcances
observados en metros, para 16 cartuchos seleccionados aleatoriamente se muestran a conti-
nuación. Se considera que el alcance se distribuye normalmente.

2216 2225 2318 2250 2237 2301 2255 2238


2249 2281 2275 2300 2204 2263 2295 2217

(a) Construir un intervalo de con…anza del 95 % con respecto al alcance medio.


(b) Construir un intervalo bilateral de con…anza del 95 % con respecto al alcance medio
considerando que = 34.
(c) ¿Cuál puede ser la razón de que la longitud del segundo intervalo sea menor que la del
primero?

6.5 Los alumnos de Estadística de una Facultad de Informática desean saber si se emplea el
mismo tiempo resolviendo los problemas con calculadora o utilizando un paquete estadístico
para ordenador. Siete alumnos utilizaron solamente la calculadora y otros siete el paquete
estadístico. Los tiempos observados, en minutos, fueron los siguientes:

Calculadora 58 65 70 85 69 74 69
Paquete estadístico 45 56 68 45 63 69 52

Suponiendo normalidad en los datos:


(a) Construir una intervalo de con…anza del 95 % para el cociente de varianzas.
(b) ¿Se puede aceptar la igualdad de varianzas?
(c) Utilizando su respuesta al apartado anterior, determinar el intervalo de con…anza del
95 % para la diferencia de tiempo medio de resolución de los problemas.

6.6 Una fábrica de quesos controla periódicamente la cantidad de materia grasa en la composición
del queso en porciones normal y bajo en calorías. Para ello toma una muestra de tamaño diez
de cada tipo de queso y observa el porcentaje de materia grasa que contiene. Se supone
distribución normal del porcentaje de materia grasa.

53
54 Estadística (E.I.I. de Valladolid, Curso 2019/20)

Normal 50:0 49:4 51:0 50:0 52:0 48:0 49:0 47:8 50:0 49:8
Bajo en calorías 36:0 35:3 35:5 34:4 37:5 36:7 35:5 36:2 35:6 37:3

(a) Construir un intervalo de con…anza del 95 % para la diferencia de los porcentajes medios
de materia grasa.
(b) ¿Se puede considerar que ambos quesos tienen el mismo porcentaje medio de grasa?
Razonar la respuesta.
(c) En una inspección se analizaron 50 muestras de queso en porciones normal y se observó
que el 68 % tenían un porcentaje de materia grasa inferior al 50 por ciento. ¿Cuál será
el intervalo de con…anza del 99 % para la proporción de quesos con un porcentaje de
materia grasa inferior al 50 %?
6.7 Una compañía se dispone a comercializar un nuevo programa informático y estudia la conve-
niencia de lanzar una campaña publicitaria previa. Con el …n de conocer si el porcentaje de
personas que comprarían el nuevo programa aumentaría con esa campaña, se llevaron a cabo
dos encuestas distintas. La primera encuesta se realizó sobre 100 personas que no habían visto
la campaña publicitaria, de las cuales 20 se mostraron interesadas en la compra del producto.
En la segunda encuesta, las 100 personas visualizaron previamente la publicidad antes de
responder si comprarían el programa, resultando que un total de 25 personas a…rmaron su
intención de adquirir el programa.
(a) Construir un intervalo de con…anza del 90 % para la proporción de personas que com-
prarían el producto tras haber visto la publicidad.
(b) Calcular el tamaño muestral mínimo para asegurar una precisión de 0:05 en la estimación
de la proporción del apartado (a), suponiendo que no se tiene estimación de p.
(c) Construir un intervalo de con…anza del 90 % para la diferencia de proporciones de compra
entre personas que han visto la publicidad y que no la han visto.
(d) ¿Se puede aceptar la efectividad de la campaña publicitaria?
(e) Si las dos encuestas hubiesen sido realizadas al mismo grupo de personas (antes y después
de la visualización de la publicidad), ¿sería válido el intervalo de con…anza calculado en
(c)? Razonar la respuesta.

6.8 Sea X una variable aleatoria continua con E(X) = y V ar(X) = 2 .


(a) Considerar X1 ; X2 ; :::; Xn una m.a.s. de tamaño n de la variable X. Aplicar la desigual-
dad de Chebychev para obtener un IC de nivel al menos (1 1=k 2 ) para .
(b) Sabiendo que = 1, obtener el tamaño muestral mínimo para que el IC calculado en el
apartado anterior permita concluir con una con…anza de al menos el 75 % que X estima
el parámetro con un error inferior a > 0. Razonar la respuesta.

6.9 Sea X1 ; X2 ; :::; Xn una m.a.s. de una población X con distribución normal de media y
varianza conocida 2o .
(a) ¿Cuál es la distribución de X?
(b) Sea Xf una futura observación de la población X, ¿cuál es la distribución de Xf X?
(c) Utilizando el resultado del apartado anterior, determinar un intervalo centrado en X en
el que se encontrará Xf con probabilidad 1 .

6.10 La compañía de productos dietéticos Biowoman está preocupada por la calidad de sus pro-
ductos; por tal motivo, ha enviado un inspector a sus dos fábricas para detectar anomalías en
los envases de Adelgac{n. En la primera fábrica, situada en la ciudad de Cidasol, encontró 30
cajas defectuosas de 1000 inspeccionadas; en la segunda fábrica, situada en P alona, detectó
40 defectuosas de 1500 inspeccionadas.
Estimación con…dencial 55

(a) Calcular un intervalo de con…anza del 95 % para la diferencia de proporciones de envases


defectuosos en las fábricas de Cidasol y P alona.
(b) ¿Se puede a…rmar que la proporción de envases defectuosos es mayor en la fábrica de
Cidasol que en la de P alona? Razonar la respuesta.
(c) ¿Cuál debe ser el tamaño muestral mínimo para estimar la diferencia de proporciones
con un error menor de 0:01 y un nivel de con…anza del 99 %? (Suponer que se toman
muestras de igual tamaño en ambas ciudades y utilizar las estimaciones del enunciado).

6.11 El número de fallos que se han producido en un sistema durante una unidad de tiempo son
los siguientes:

Número de fallos 0 1 2 3 4 5 6
Frecuencia 39 48 39 16 5 1 1

Suponiendo que el número de fallos por unidad de tiempo se distribuye según una ley de
P oisson:
(a) Calcular una estimación puntual insesgada del parámetro de la distribución.
(b) Calcular un intervalo de con…anza de nivel al menos 0:95 para el parámetro de la dis-
tribución.
(c) Calcular ahora un intervalo de con…anza de nivel aproximado 0:95 para el parámetro de
la distribución utilizando el TCL.

6.12 Sea X (Y ) el número de plantas de marihuana en un área de 1 m2 de una región Rx (Ry ).


Sabiendo que el número de plantas de marihuana en un área de 1 m2 tiene una distribución
de P oisson:
(a) Determinar un IC de nivel aproximado 1 (muestras grandes) para E(X) E(Y ).
(b) Utilizar el resultado del apartado anterior para calcular un IC del 95 % para E(X) E(Y )
si los datos obervados fueron los siguientes:

Frecuencia
Número de plantas 0 1 2 3 4 5 6 7
Región Rx 28 40 28 17 8 2 1 1
Región Ry 14 25 30 18 49 2 1 1

(c) ¿Se puede aceptar que las densidades de planta de marihuana son iguales en las dos
regiones? Justi…car la respuesta.
6.13 Una muestra de nueve componentes electrónicos suministrados por un proveedor A ha dado
una vida media de 21860 horas con una desviación típica de 980 horas. Otra muestra tam-
bién de nueve piezas del proveedor B ha proporcionado una media de 20040 horas con una
desviación típica de 1140 horas. Suponiendo normalidad:
(a) Calcular un IC de nivel 0:95 para la desviación típica de la vida de las componentes
suministradas por el proveedor B.
(b) Calcular un IC del 90 % para la diferencia de vidas medias.
(c) ¿Se puede aceptar que las componentes de los dos proveedores tienen la misma vida
media? Justi…car la respuesta.

6.14 Una compañía de telefonía móvil realiza una encuesta para conocer la proporción de clientes
satisfechos con un determinado servicio. En la población de Cuesta Abajo con una muestra
de 150 personas se han obtenido 114 clientes satisfechos, mientras que en la población de
Rampa Arriba se obtuvieron 80 personas satisfechas de 100 entrevistadas.
56 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(a) Calcular un IC de nivel 0:95 para la proporción de clientes satisfechos en cada una de
las poblaciones.
(b) ¿Se puede aceptar que las proporciones de personas satisfechas son las mismas en ambas
poblaciones? Razonar la respuesta.
(c) ¿Cuántas personas de cada población deben seleccionarse si se desea estimar la diferencia
de proporciones con una precisión del 1 % y un nivel de con…anza del 95 %? (Suponer
m = n y utilizar las estimaciones del enunciado).

6.15 Sea X1 ; X2 ; :::; Xn una m.a.s. de una distribución uniforme en el intervalo [0; ]. Sabiendo que
8
< xn 1
f (x; ) = n n si 0 x
: 0 en el resto

es la función de densidad del estadístico X(n) = maxfX1 ; X2 ; :::; Xn g:


n o
X(n)
(a) Probar que Pr 1=n 1 =1 y utilizar este resultado para deducir un IC
de nivel 1 para .
(b) Si el tiempo que tarda en cargarse una determinada página Web está uniformemente
distribuido y los tiempos observados fueron: 42, 35, 17, 12 y 24, calcular un IC del 95 %
para utilizando el resultado del apartado anterior.

6.16 El número mensual de accidentes laborales que se han producido en una fábrica durante los
últimos diez años son los siguientes:

Número de accidentes 0 1 2 3 4
Frecuencia 42 31 29 12 6

Suponiendo que el número mensual de accidentes laborales se distribuye según una ley de
P oisson:
(a) Calcular un IC de nivel al menos 0:95 para la media poblacional.
(b) Construir un IC de nivel aproximado 0:9 para el parámetro poblacional utilizando el
TCL.
(c) ¿Se puede aceptar que la tasa media de accidentes laborales por mes es inferior a 1:4?
Razonar la respuesta.

6.17 Los datos siguientes muestran el desgaste de los tacones de los zapatos utilizados por 10
mujeres. Los tacones fueron fabricados con dos materiales diferentes, un material estándar
(A) y un material más económico (B).

Mujer 1 2 3 4 5 6 7 8 9 10
Material A 13:2 8:2 10:9 14:3 10:7 6:6 9:5 10:8 8:8 13:3
Material B 14:0 8:8 11:2 14:2 11:8 6:4 9:8 11:3 9:3 13:6

Suponiendo que las poblaciones siguen una distribución normal:


(a) Calcular un IC de nivel 0:9 para la desviación típica del desgaste de los tacones fabricados
con el material B.
(b) Calcular un IC del 95 % para la diferencia entre las medias poblacionales.
(c) ¿Se puede aceptar que, en media, los dos tipos de materiales tienen el mismo desgaste?
Razonar la respuesta.
Estimación con…dencial 57

6.18 Se examinan durante 1 mes 150 libros electrónicos de una misma marca y se anota el número
de fallos por libro. Los datos obtenidos fueron:

Número de fallos 0 1 2 3
Frecuencia 15 22 44 69

Suponiendo que el número de fallos por mes de un libro electrónico tiene una distribución de
P oisson con parámetro :
(a) Calcular una estimación insesgada para .
(b) Calcular un IC de nivel aproximado 0:94 para .
(c) El fabricante del libro a…rma que la tasa mensual de fallo es inferior a 2:3. ¿Es correcta
esta a…rmación? Razonar la respuesta.

6.19 En una planta industrial se ha estudiado el rendimiento de un determinado producto tras


producir 10 unidades utilizando un método estándar de producción (A) y otras 10 unidades
con un nuevo método (B). Se obtuvieron los siguientes resultados:


etodo A 89:7 81:4 84:5 84:8 87:3 79:7 85:1 81:7 83:7 84:5

etodo B 84:7 86:1 83:2 91:9 86:3 79:3 82:6 89:1 83:7 88:5

Suponiendo normalidad en la distribución del rendimiento:


(a) Calcular un IC del 95 % para la diferencia entre los rendimientos medios de los dos
métodos de producción.
(b) ¿Se puede admitir que el método B da mayor rendimiento que el método estándar?
Razonar la respuesta.

6.20 Una organización de consumidores está interesada en conocer si existen diferencias entre las
proporciones de televisores con tecnología LED que necesitan reparación al menos una vez
durante el periodo de garantía de las marcas A y B. De una muestra de 270 televisores nuevos
de la marca A, 110 necesitaron reparación, mientras que de 140 televisiores de la marca B,
solamente la necesitaron 50.
(a) Estimar con una con…anza del 95 % la proporción de televisores de cada una de las
marcas que precisan reparación durante el periodo de garantía.
(b) ¿Puede concluirse, con un nivel de con…anza del 95 %, que la proporción de televisores
que precisan reparación durante el periodo de garantía es la misma en ambas marcas?
Razonar la respuesta.

6.21 Un profesor de Álgebra desea comparar la rapidez de ejecución de dos algoritmos para invertir
matrices de gran tamaño. Como el tiempo de resolución de los algoritmos depende de las
características de cada matriz, se generaron aleatoriamente once matrices y se invirteron
mediante los dos algoritmos, obteniéndose los resultados que aparecen en la tabla siguiente.

Matriz 1 2 3 4 5 6 7 8 9 10 11
Algoritmo A 4:1 5:6 3:9 1:2 3:8 6:9 4:4 2:4 3:1 8:6 2:1
Algoritmo B 4:7 5:8 4:7 1:7 3:8 7:7 4:9 3:1 2:8 9:2 2:6

Suponiendo normalidad en los tiempos de ejecución de los algoritmos:


(a) Calcular un IC de nivel 0:9 para la desviación típica del tiempo de ejecución del algoritmo
A.
58 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(b) Calcular un IC del 95 % para la diferencia entre los tiempos medios de ejecución.
(c) ¿Se puede aceptar que, en media, los dos algoritmos tienen la misma velocidad? Razonar
la respuesta.

6.22 En un estudio sobre los hábitos de fumador para personas zurdas y diestras, una mues-
tra aleatoria de 600 zurdos reveló que 135 de estos fumaban, mientras que en una muestra
aleatoria de 1000 diestros, 178 de estos fumaban.
(a) Estimar con una con…anza del 98 % la proporción de zurdos que fuman.
(b) Calcular un IC del 98 % para la proporción de personas diestras que fuman.
(c) ¿Puede concluirse, con un nivel de con…anza del 98 %, que la proporción de zurdos que
fuman es mayor que la correspondiente para las personas diestras? Razonar la respuesta.

6.23 Un fabricante desea comparar el tiempo promedio de vida de su pantalla LED con la de su
más cercano competidor. Los tiempos que tardaron en fallar 9 pantallas LED de cada marca
fueron los siguientes:

Marca A 52 44 50 49 51 46 58 50 48
Marca B 50 51 48 53 55 55 60 56 56

Suponiendo normalidad en la distribución del tiempo de vida:


(a) Calcular un IC del 98 % para la diferencia entre los tiempos medios de vida de las dos
marcas.
(b) ¿Se puede admitir que la marca B tiene un tiempo medio de vida mayor que el corres-
pondiente a la marca A? Razonar la respuesta.

6.24 En diez centros de proceso de datos y en un periodo de veinte meses, el número de paradas no
programadas por centro y mes debido a problemas de software se dan en la tabla siguiente.

Número de paradas 0 1 2 3 4
Frecuencia 109 65 22 3 1

Suponiendo que el número de paradas no programadas por mes de un centro de proceso de


datos tiene una distribución de P oisson con parámetro :
(a) Calcular una estimación insesgada para . Justi…car la respuesta.
(b) Calcular un IC de nivel aproximado 0:95 para utilizando el TCL.
(c) ¿Se puede concluir que la tasa mensual de paradas no programadas en esos centros de
proceso de datos es inferior a 1? Razonar la respuesta.

6.25 Una empresa comercializadora de productos informáticos desea estimar la proporción de


consumidores que piensa comprar una “tableta” durante los próximos cuatro meses. ¿De
qué tamaño debe ser la muestra para que el error de muestreo sea como máximo del 5 % con
un nivel de con…anza del 99 %?
6.26 Un artículo publicado en una revista de investigación estudia los errores de software en aviones
comerciales que pueden transmitir información errónea a la tripulación. Se seleccionaron 900
aviones al azar y se encontró que 4 de ellos tenían errores de software que podían mostrar
información falsa a la tripulación.
(a) Utilizando la información del enunciado para obtener una estimación preliminar de la
proporción p de aviones que tienen ese tipo de errores informáticos, ¿de qué tamaño debe
ser la muestra para que el error de muestreo sea como máximo de 0:005 con un nivel de
con…anza del 99 %? Justi…car la respuesta.
Estimación con…dencial 59

(b) Calcular el tamaño muestral mínimo para asegurar una precisión del 1 % en la estimación
con…dencial del 94 % de la proporción p, si no se tiene una estimación inicial de p.

6.27 Se sabe, por experiencias anteriores, que la cali…cación obtenida por los ingenieros infor-
máticos en una determinada prueba psicológica sigue una distribución normal. A partir de
una m.a.s. de 16 ingenieros informáticos que realizaron la prueba se ha obtenido el siguiente
intervalo de con…anza del 95 % para : [6:9852; 8:0148]. Calcular:
(a) Una estimación puntual insesgada para . Razonar la respuesta.
(b) Una estimación puntual insesgada para 2. Justi…car la respuesta.
(c) Un IC de nivel 0:9 para . Justi…car la respuesta.

6.28 Se desea estimar la proporción de personas partidarias de endurecer las penas por delitos de
corrupción política, p, con una precisión del 2 % y una con…anza del 96 %.
(a) ¿Cuál debe ser el tamaño de la muestra elegida? Razonar la respuesta.
(b) Si se sospecha que p está contenida en el intervalo [0:8; 0:9], ¿al menos cuántas personas
deben ser encuestadas? Justi…car la respuesta.

6.29 Un consultor informático desea analizar sus ingresos diarios, que supone tienen una distribu-
ción normal. En una m.a.s. de 12 días ha obtenido unos ingresos medios de 225 euros, con
una desviación típica de 45 euros.
(a) Estimar los ingresos diarios medios con una con…anza del 98 %.
(b) Por estudios anteriores, se puede suponer que la desviación típica de los ingresos diarios
es = 50 euros.
(i) ¿Cuál es ahora la respuesta del apartado (a)?
(ii) ¿Cuál debe ser el tamaño muestral mínimo si deseamos una precisión de 15 euros
en la estimación del apartado anterior?

6.30 Un determinado programa de traducción automática, que traduce del ruso al japonés, es
utilizado para traducir un texto de 1575 palabras. La traducción propuesta por el programa
es comprobada por un …lólogo, que considera correcta la traducción de 1197 palabras. Se
desea conocer cuál es la proporción de palabras traducidas incorrectamente por el programa.
(a) Estimar la proporción de interés con una con…anza aproximada del 90 %:
(b) ¿Puede ocurrir que la proporción verdadera de traducciones incorrectas no pertenezca
al IC calculado en el apartado anterior? Razonar la respuesta.
(c) Calcular el tamaño muestral mínimo para estimar la proporción con un nivel de con…anza
del 95 % y una precisión del 1 % (utilizar la estimación de la proporción dada en el
enunciado).

6.31 El tiempo de un programa informático tiene una distribución normal de media y varianza
6:25. Se toma una m.a.s. de 25 tiempos de ejecución del programa y se obtiene una media de
45 segundos.

(a) Construir un intervalo de con…anza para al 95 %.


(b) Calcular el tamaño muestral mínimo para que la longitud del intervalo calculado en el
apartado anterior disminuya en 1 segundo.

6.32 Para averiguar la e…cacia de un nuevo sistema de aprendizaje de técnicas estadísticas se han
observado las cali…caciones de 9 estudiantes antes de seguir el sistema y después, obteniéndose
los siguientes resultados:
60 Estadística (E.I.I. de Valladolid, Curso 2019/20)

Estudiante 1 2 3 4 5 6 7 8 9 xi x2i
Antes 52:5 54:0 50:8 54:4 53:5 52:0 53:0 53:4 50:7 474:3 25009:55
Después 53:1 54:5 51:6 54:5 53:9 55:0 52:5 53:3 51:3 479:7 25581:71

Suponiendo que ambas cali…caciones se distribuyen normalmente:


(a) Calcular un IC del 95 % para la desviación típica de las cali…caciones después de seguir
el nuevo sistema de aprendizaje.
(b) Obtener un intervalo de con…anza del 95 % para la mejoría media que se experimenta
después de seguir el nuevo sistema de aprendizaje. Razonar la respuesta.
(c) ¿Se puede aceptar que el nuevo sistema de aprendizaje de técnicas estadísticas aumenta
la cali…cación media de un estudiante? Justi…car la respuesta.

6.33 El error X que se comete en la medición del tiempo de ejecución de un algoritmo es una v.a.
con distribución normal de media y varianza 2 . Se toma unaPm.a.s. de 40 errores
P 2 en los
tiempos de medición y se obtuvieron los siguientes indicadores: xi = 1:6 y xi = 8.
(a) Construir un intervalo de con…anza para al 95 %.
(b) Por estudios anteriores, se puede suponer que la media de X es = 0. ¿Cuál es ahora
la respuesta al apartado anterior?
7

Pruebas de hipótesis
7.1 El lenguaje Pascal es un lenguaje de programación de alto nivel ampliamente utilizado. Un
experimentador está interesado en encontrar la proporción de variables utilizadas en Pascal
que son vectoriales, en contraste con las variables escalares, menos e…cientes en términos
de ejecución. Se seleccionan veinte variables tomadas aleatoriamente de un conjunto de pro-
gramas en Pascal, y se cuenta el número de variables vectoriales, que denotaremos por X.
Deseamos contrastar la hipótesis de que Pascal es un lenguaje más e…ciente que Algol, en el
que el 20 % de las variables son vectoriales. Es decir, queremos contrastar H0 : p = 0:2 frente
a H1 : p > 0:2, donde p es la proporción de variables vectoriales en un programa de Pascal.
(a) Encontrar para la región crítica C1 = fX 8g.
(b) Encontrar para la región crítica C2 = fX 5g.
(c) Encontrar para la región crítica C1 si p = 0:5.
(d) Encontrar para la región crítica C2 si p = 0:5.
(e) ¿Cuál de las dos regiones críticas, C1 o C2 es más deseable si se quiere minimizar la
probabilidad de error de tipo I? ¿Y la de tipo II?
(f) Encontrar la región crítica de la forma X a en la que sea aproximadamente igual a
0:01.
(g) Para la región crítica del apartado (f), encontrar la potencia del test si p = 0:4.
(h) Para la región crítica del apartado (f), encontrar la potencia del test si p = 0:7.

7.2 El tiempo de vida de un átomo radiactivo se puede suponer que es una variable aleatoria X
con función de densidad:
e x si x > 0 y > 0
f (x; ) =
0 en el resto

Se desea realizar el contraste H0 : = 2 frente a H1 : = 1.


(a) Si se elige como región crítica C = fX 1g, ¿cuáles son los valores de y ?
(b) Calcular una región crítica de nivel 0:25.

7.3 Considerar dos monedas: una tiene dos caras (C2 ); la otra tiene una cara en cada lado pero
está sesgada y la probabilidad de cara es 3=4. Se elige una moneda al azar. Para determinar
si la moneda seleccionada era C2 , se tira n veces la moneda y se anota el resultado. Sea X el
número de cruces obtenidas, entonces si X = 0 se acepta la hipótesis de que la moneda es C2 .
(a) Establecer hipótesis nula, hipótesis alternativa y región crítica.
(b) Para n = 4, calcular las probabilidades de error tipo I y tipo II.
(c) Encontrar el menor n para que PrfError tipo IIg 0:05.

7.4 Existen dos hipótesis sobre la distribución de una variable aleatoria discreta que toma los
valores 1, 2, 3 y 4:

X = xi 1 2 3 4
H0 : PrfX = xi g 0:1 0:2 0:3 0:4
H1 : PrfX = xi g 0:4 0:3 0:2 0:1

61
62 Estadística (E.I.I. de Valladolid, Curso 2019/20)

Se toma una m.a.s. de tamaño 2 y se decide rechazar la hipótesis nula si el valor muestral
obtenido es (1; 1) o (1; 2) o (2; 1).
(a) ¿Cuál es el nivel de signi…cación del contraste?
(b) Calcular la potencia del contraste.

7.5 Para contrastar la hipótesis H0 : = 1 frente a la alternativa H1 : = 2 se dispone de una


sola observación de una población de P oisson. Se decide rechazar H0 si X 4.
(a) Calcular el nivel del test.
(b) Calcular la probabilidad de error tipo II.

7.6 Sea el promedio de nivel de radioactividad en el agua para consumo. El nivel 5 se considera
como la línea divisoria entre agua segura y no segura.
(a) ¿Qué debe probarse: H0 : = 5 frente a H1 : > 5 o H0 : = 5 frente a H1 : < 5?
Razonar la respuesta.
(b) ¿Qué representa para el contraste elegido en el apartado anterior los errores de tipo I y
de tipo II?

7.7 Calcular el tamaño muestral mínimo para que el contraste en una población normal con
varianza conocida 2o de H0 : = o frente a H1 : = o + ( > 0) tenga probabilidades
de error tipo I y tipo II iguales a .

7.8 Sea un contraste de hipótesis cuya hipótesis nula establece que la batería de un marcapasos
tiene una vida media de 300 días y donde la hipótesis alternativa especi…ca que la vida media
de dicha batería es inferior a 300 días.
(a) Explicar el signi…cado de los errores tipo I y tipo II en este problema.
(b) ¿Son correctas las hipótesis elegidas? Justi…car la respuesta.

7.9 Se tienen dos m.a.s. independientes de poblaciones normales con desviación típica conocida
o , de las que se sospecha que tienen la misma media, y que ésta es o . Un estadístico realiza
en primer lugar el contraste de la media para la primera muestra H0 : = o frente a la
alternativa H1 : 6= o y la acepta a nivel . A continuación realiza el mismo contraste para
la segunda muestra, y también lo acepta al mismo nivel . A la vista de estos resultados el
estadístico concluye que al nivel las dos muestras tienen la misma media. ¿Es correcto el
razonamiento del estadístico? Demostrarlo en caso a…rmativo, o dar un contraejemplo en caso
contrario.

7.10 Un grupo de municipios rurales de una determinada región solicitó ayudas económicas al
gobierno de la nación, argumentando que en dicha región el número medio de tormentas
destructivas semanales era relativamente alto. Con objeto de tomar una decisión al respec-
to, el gobierno encargó a sus técnicos que realizaran un contraste de hipótesis de la forma
H0 : o frente a H1 : > o , puesto que, en base a su experiencia, el gabinete considera
que el número de tormentas semanales con esas características es una variable aleatoria con
distribución de P oisson de parámetro ; el gobierno está dispuesto a conceder la ayuda so-
licitada solamente en el caso de que ese número medio sea mayor que 2.
Con este propósito, los técnicos gubernamentales consultaron al servicio meteorológico na-
cional observando en 30 semanas una media de 2:5 tormentas destructivas semanales en dicha
zona.
Como ese gobierno es muy estricto en la concesión de determinadas ayudas, …jó como nivel de
signi…cación = 0:01, con objeto de conceder la ayuda solamente en el caso de que hubiera
una gran evidencia en contra de una situación de normalidad, representada por H0 .
Pruebas de hipótesis 63

(a) Estudiar si el gobierno concedió la ayuda.


(b) Si la ayuda también fue solicitada al gobierno autónomo, menos estricto en dicha con-
cesión de fondos públicos, que …jó un nivel de signi…cación = 0:1, ¿concedería esta
ayuda?

7.11 Se supone que en un determinado proceso de fabricación a lo sumo el 5 % de las piezas fabri-
cadas son defectuosas. Para una muestra de tamaño 100, el número de defectuosas obtenidas
fue diez. Probar la hipótesis nula al nivel de signi…cación 0:05.
El gerente de la fábrica …ja que la probabilidad de detener el proceso para ajustarlo cuando
realmente no es necesario es 0:01 mientras que la probabilidad de no detener el proceso, cuan-
do la proporción verdadera de piezas defectuosas es 0:1 es 0:05. ¿Qué tamaño de muestra se
debe obtener como mínimo para satisfacer estos objetivos?

7.12 Se ensaya el efecto de un tipo de fertilizante sobre la producción de trigo, con riego y sin riego.
Dadas veinte parcelas, todas con la misma extensión, se eligen al azar e independientemente
unas de otras, diez parcelas para riego y diez donde no se va a regar. Las producciones
obtenidas por las veinte parcelas fueron:

Parcelas con riego (X) 46 110 70 54 60 120 82 76 37 28


Parcelas sin riego (Y ) 42 87 75 50 48 108 80 67 40 25

(a) Suponiendo que la producción de trigo en ambos casos sigue una distribución normal,
¿puede aceptarse que el efecto sobre la producción del fertilizante aplicado con riego
supera al del fertilizante aplicado sin riego? Considere = 0:05.
(b) Repetir el apartado anterior sin la hipótesis de normalidad, utilizando el programa
Statgraphics.

7.13 Un fabricante desea comparar el proceso de armado común para uno de sus productos con
un método que supuestamente reduce el tiempo de armado. Se seleccionan aleatoriamente
ocho trabajadores de la planta de armado y se les pidió que armaran las unidades con ambos
procesos. Los datos siguientes son los tiempos observados (en minutos):

Trabajador 1 2 3 4 5 6 7 8
Proceso actual 38 32 41 35 42 32 45 37
Proceso propuesto 30 32 34 37 35 26 38 32

(a) Suponiendo normalidad en las muestras anteriores y tomando = 0:05, ¿existe alguna
razón para creer que el tiempo de armado para el proceso actual es mayor que el método
propuesto en más de dos minutos?
(b) Calcular el p valor asociado al contraste anterior.
(c) Resolver, utilizando el programa Statgraphics, los dos apartados anteriores si lo único
que se puede suponer sobre la distribución de los tiempos es que es simétrica.

7.14 Una compañía supone que una llamada telefónica logra acelerar más que una carta el cobro
de cuentas morosas. Dos grupos de morosos fueron contactados por sendos métodos y se
registró el tiempo transcurrido (en días) entre el envío de la carta o la llamada telefónica y
la recepción del pago.

Carta 10 8 9 11 11 14 10
Teléfono 7 4 5 4 8 6 9
64 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(a) Suponiendo normalidad en ambas muestras y tomando = 0:025, ¿debe concluir la com-
pañía que las cuentas morosas se cobran más rápidamente con las llamadas telefónicas
que enviando cartas?
(b) Resolver, utilizando el programa Statgraphics, el apartado anterior si no podemos
suponer normalidad en los tiempos transcurridos.

7.15 En el almacén de un distribuidor de jamón se registraron los siguientes datos en la comparación


de residuos de ácido sórbico (en partes por millón) en jamón inmediatamente después de
sumergirlo en una solución ácida y 60 días después de almacenado:

Jamón 1 2 3 4 5 6 7 8
Antes de almacenar 224 270 400 444 590 660 1400 680
Después de almacenar 116 96 239 329 437 597 689 576

(a) Suponiendo normalidad en ambas muestras, ¿se tiene su…ciente evidencia al nivel =
0:05 como para a…rmar que el periodo de almacenamiento disminuye las concentraciones
residuales de ácido sórbico?
(b) Resolver, utilizando el programa Statgraphics, el apartado anterior si no se puede ad-
mitir la hipótesis de normalidad.

7.16 En un estudio sobre la fertilidad de las mujeres casadas, se seleccionaron dos grupos de mujeres
sin hijos con edades comprendidas entre los 25 y 29 años. Un grupo fue seleccionado entre las
mujeres casadas que llevaban casadas menos de dos años (grupo A) y el otro entre las que
llevaban casadas cinco años (grupo B). Se les preguntó si alguna vez habían plani…cado tener
un hijo y contestaron a…rmativamente 240 de 300 mujeres del grupo A y 288 de 400 mujeres
del grupo B.
(a) Construir un intervalo de con…anza al nivel 0:95 para la diferencia de las proporciones
anteriores.
(b) ¿Se puede concluir al nivel 0:05 que la proporción de mujeres del grupo A que plani…caron
tener un hijo, es signi…cativamente distinta a las del grupo B?
(c) Calcular el p valor asociado al contraste anterior.

7.17 El número de llamadas por minuto solicitadas a una centralita telefónica, en un determinado
periodo de tiempo fueron:

Núm. llamadas/minuto 0 1 2 3 4 5 6 7
Frecuencia 6 18 32 35 17 10 2 0

Suponiendo que la variable número de llamadas por minuto se distribuye según una ley de
P oisson:
(a) ¿Se puede aceptar, con un nivel de error del 5 %, que el número medio de llamadas por
minuto es superior a 2:5?
(b) ¿Cuál debe ser el tamaño muestral mínimo si se desea que el test de nivel 0:05 rechace
con probabilidad 0:99 la hipótesis nula si el valor de la media es 3?

7.18 Un determinado medicamento es efectivo para aliviar cierta dolencia en el 60 % de los casos.
Los resultados experimentales sobre un nuevo medicamento administrado a una muestra de
144 personas que sufrían esa dolencia muestran 100 casos con alivio de la misma.
(a) Plantear un contraste de hipótesis para decidir si el nuevo medicamento es más efectivo.
(b) Resolver el contraste anterior a nivel = 0:05.
Pruebas de hipótesis 65

(c) ¿Cuál es la potencia del test utilizado para resolver el apartado (b) si el porcentaje de
alivio con el nuevo medicamento es del 70 %?
(d) ¿Con qué tamaño muestral mínimo la potencia anterior superará el 95 %?

7.19 Un concesionario de automóviles tiene dos establecimientos de venta al público, A y B. Sean


X e Y el número de coches vendidos diariamente en A y B, respectivamente. Durante 100 días
se han contabilizado los coches vendidos en cada uno de los establecimientos, obteniéndose:

X
Y 0 1 2 3
0 5 6 6 5
1 8 10 12 10
2 7 10 10 11

¿Podemos suponer que las ventas del establecimento A son independientes de las del estable-
cimiento B?

7.20 En un estudio sobre la caries dental de niños de cuatro zonas geográ…cas con distintos niveles
de ‡úor en el agua, se tomó una muestra de 120 niños en cada zona, obteniéndose los siguientes
resultados:

Zona A B C D
Niños sin caries 48 18 40 54

(a) ¿Se puede aceptar al nivel = 0:05 que la proporción de niños con caries es la misma
en las cuatro zonas?
(b) Calcular un intervalo de con…anza al nivel 95 % para pA pD , siendo pA y pD las
proporciones de niños con caries en las zonas A y D, respectivamente.
(c) Realizar el contraste bilateral de igualdad entre la proporción de niños con caries en las
zonas A y D, al nivel de signi…cación = 0:05.
(d) Calcular el p valor asociado al contraste del apartado (c).

7.21 Entre los alumnos de 2o curso de una Facultad, se escogen 100 al azar, resultando los siguientes
datos referentes a los años, X, que llevan en la Facultad.

Núm. de años 2 (2; 4] (4; 6] >6


Núm. de alumnos 47 32 16 5

Se supone que X sigue una distribución de P areto con función de densidad:


2
x3
si x 1
f (x) =
0 en el resto

(a) Contrastar la suposición de que X sigue esa distribución de P areto a partir de los datos
anteriores, al nivel = 0:01.
(b) A continuación, se eligen aleatoriamente a 50 alumnos de toda la Facultad y se obtienen
los siguientes datos sobre el número de años que llevan en ella:

Núm. de años 2 (2; 4] >4


Núm. de alumnos 10 22 18
66 Estadística (E.I.I. de Valladolid, Curso 2019/20)

Construir a partir de estos datos y los anteriores una tabla de contingencia y plantear
en ella el contraste que se considere adecuado. Resolverlo al nivel = 0:05.

7.22 Se sospecha que una máquina de servir cafés no funciona correctamente, porque muchos
clientes se quejan de que cae mucho azúcar en el vaso. Para analizar el contenido de azúcar se
tomaron 10 muestras de café a lo largo del día, midiendo el contenido de azúcar en gramos.
Los resultados obtenidos fueron: 9:7, 11:4, 9:3, 8:0, 10:2, 9:9, 8:2, 10:5, 9:7, 10:1:
(a) Contrastar la hipótesis de que los valores anteriores provienen de una variable aleatoria
con distribución normal, al nivel = 0:01.
(b) En un estudio más completo, se observaron 72 muestras de café al azar recogidas a lo
largo de un día, en las que se midió su cantidad de azúcar y se anotó el periodo del
día en que fue tomada, habiéndose dividido el día en tres periodos: mañana, mediodía y
tarde-noche. Se clasi…caron estos valores según estas dos variables, resultando la tabla:

Periodo
Cantidad de azúcar Mañana Mediodía Tarde-noche
9:5 7 10 7
(9:5; 10:5] 10 7 13
> 10:5 7 3 8

Plantear el contraste que se considere adecuado para la tabla de valores anterior y


resolverlo al nivel = 0:05.

7.23 La asignatura de Estadística es impartida por tres profesores en otros tantos grupos. Las
cali…caciones obtenidas por los alumnos se clasi…can en la siguiente tabla:

Cali…cación
Grupo Suspenso Aprobado Notable Sobresaliente
A 15 26 24 12
B 20 24 27 9
C 12 30 28 16

(a) ¿Son signi…cativamente distintas las cali…caciones en cada grupo?


(b) El profesor del grupo A dice que la distribución de probabilidad asociada a la cali…cación
de un alumno en esa asignatura está dada por PrfSuspensog = 0:2, PrfAprobadog = 0:3,
PrfNotableg = 0:3 y PrfSobresalienteg = 0:2, ¿es aceptable dicha hipótesis con los datos
obtenidos por los alumnos de este profesor? Razonar la respuesta.
(c) ¿Se puede aceptar que el porcentaje de suspensos en los grupos A y B son iguales?
Razonar la respuesta.

7.24 Las preguntas de un examen de tipo test se ordenan en dos formas diferentes. En orden
creciente de di…cultad (test A), y en orden decreciente (test B). Un curso de 20 alumnos se
divide al azar en dos grupos iguales. Al primer grupo se le somete al test A, y al segundo, al
test B. Las puntuaciones obtenidas han sido las siguientes:

Primer grupo 83 82 95 92 91 60 89 69 71 72
Segundo grupo 75 62 70 73 52 63 48 80 76 74

(a) Suponiendo desconocida la distribución de las puntuaciones, ¿se puede aceptar, a nivel
0:05, que la diferente ordenación de las preguntas (test A y test B) no in‡uye en las
puntuaciones? (utilizar el programa Statgraphics).
Pruebas de hipótesis 67

(b) ¿Puede admitirse al nivel 0:05 que las puntuaciones del test A siguen una distribución
normal?
(c) Suponiendo que ambas puntuaciones se distribuyen normalmente, ¿podemos a…rmar que
el test A proporciona puntuaciones más elevadas a un nivel 0:05?

7.25 La empresa Oso-Antivirus ha diseñado una vacuna para reducir los efectos de los virus in-
formáticos. Se toma una m.a.s. de seis ordenadores infectados, y se determina el grado de
contagio (en unas determinadas unidades) antes y después del tratamiento. Los resultados
fueron:

Ordenador 1 2 3 4 5 6
Antes 217 252 229 200 209 213
Después 209 241 230 208 206 211

(a) Suponiendo que la distribución es simétrica, ¿es efectiva la vacuna? (considerar = 0:05
y utilizar el programa Statgraphics).
(b) ¿Se puede admitir que el grado de contagio antes de la vacuna se distribuye según una
ley normal? Razonar la respuesta.
(c) Repetir el apartado (a) suponiendo normalidad en la distribución del grado de contagio.

7.26 Una compañía que vende licencias de un nuevo producto informático de e comercio a…rma
que las empresas que lo utilizan obtienen, en media, durante el primer año un rendimiento
(X) de más del 10 por ciento de sus inversiones iniciales. Una m.a.s. de diez de esas empre-
sas proporcionaron los siguientes datos: n = 10, xi = 101:8, x2i = 1037:32. Suponiendo
normalidad en los rendimientos:
(a) Plantear el contraste de hipótesis adecuado para este problema.
(b) Calcular el p valor del contraste e interpretar los resultados.
(c) Resolver al nivel del 1 % el contraste del apartado (a). Interpretar el resultado.

7.27 Un fabricante de aplicaciones informáticas está desarrollando un nuevo programa estadístico


y desea valorar este nuevo producto comparando los tiempos de procesamiento con los del
paquete estadístico líder del mercado. De una base de datos estadística extrae una m.a.s. de
10 proyectos y obtiene los siguientes tiempos de procesamiento:

Proyecto 1 2 3 4 5 6 7 8 9 10
Paquete líder 15 11 26 21 11 15 39 18 19 25
Nuevo paquete 9 5 22 16 10 9 41 19 14 25

(a) ¿Puede aceptarse, a nivel = 0:05, que el tiempo de procesamiento con el paquete líder
tiene distribución normal? Razonar la respuesta.
(b) Suponiendo distribución normal en los tiempos de procesamiento, calcular un IC de nivel
0:98 para la diferencia de tiempos medios de procesamiento.
(c) ¿Se puede aceptar que el nuevo paquete estadístico es más rápido que el paquete líder
del mercado? Razonar la respuesta.

7.28 El gerente de una compañía proveedora de servicios ADSL desea conocer cómo es su cuo-
ta de mercado en dos comunidades autónomas. De una m.a.s. de 800 consumidores de la
primera comunidad autónoma, 258 declaran tener contratado el servicio con esta compñía.
En la segunda comunidad autónoma, 260 de 700 consumidores declaran que tienen el servicio
contratado.
68 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(a) Construir un IC de nivel 0:95 para las cuotas de mercado de la compañía en cada una
de las comunidades autónomas.
(b) ¿Se puede aceptar que las cuotas de mercado son iguales en ambas comunidades autóno-
mas? Razonar la respuesta.

7.29 Una fabrica de cartuchos de tinta para impresoras tiene dos máquinas de llenado con los que
se pretender cargar cartuchos iguales. Para comparar ambas máquinas, se realiza el siguiente
experimento. Se llenan diez cartuchos con la primera máquina y se obtiene un contenido
medio por cartucho de 29 ml y una varianza de 1 ml2 . Se llenan otros diez cartuchos con la
segunda máquina, obteniéndose un contenido medio por cartucho de 30 ml y una varianza de
1:1 ml2 . Suponiendo normalidad en el contenido de tinta de cada cartucho:
(a) Calcular un IC del 95 % para la varianza poblacional del contenido de tinta de los
cartuchos cargados con la primera máquina.
(b) ¿Se puede aceptar que la segunda máquina introduce más tinta en los cartuchos que la
primera máquina? Justi…car la respuesta.

7.30 Una empresa de investigaciones sociológicas ha realizado un estudio para conocer el grado de
aceptación de las nuevas medidas …scales aprobadas por el gobierno. De una muestra de 200
españoles con edades entre 25 y 34 años, el 40 % de ellos se ha mostrado a favor, mientras que
de una muestra de 300 españoles con edad entre 35 y 44 años, el porcentaje correspondiente
fue del 35 %.
(a) Calcular un IC de nivel 0:96 para las proporciones poblacionales de personas que no
están a favor de las medidas …scales del gobierno en cada grupo de edad.
(b) ¿Se puede aceptar que las proporciones poblacionales de personas a favor de las medidas
…scales son iguales en ambos grupos de edad? Justi…car la respuesta.
(c) De una nueva muestra de 400 españoles con edad entre 45 y 64 años, el 67:5 % se mostró
en contra de las medidas del gobierno.
(i) Para estudiar si el grado de aceptación de las medidas …scales del gobierno es el
mismo en los tres grupos de edad, ¿qué tipo de contraste se debe utilizar? Escribir
las hipótesis a contrastar.
(ii) ¿Qué decisión se debe tomar en el contraste anterior al nivel ) = 0:05? Justi…car
la respuesta.

7.31 Un fabricante de baterías para ordenadores portátiles a…rma que sus productos tienen una
vida media de 1469 días. Un cliente obtuvo una muestra de 32 de esas baterías y encontró
que la vida media era de 1446:9 días con una desviación estándar de 82 días. Suponiendo
normalidad en la vida de las baterías:
(a) Al nivel de signi…cación del 5 %, ¿puede concluirse que la vida media de esas baterías es
menor que la indicada por el fabricante? Justi…car la respuesta.
(b) Calcular una estimación con…dencial al 99 % para el tiempo medio de vida de las baterías.
Razonar la respuesta.

7.32 Se pidió a una m.a.s. de diez estudiantes que valoraran (a ciegas) la calidad de dos aplicaciones
informáticas, una amateur y otra profesional. Las valoraciones realizadas fueron las siguientes:

Estudiante 1 2 3 4 5 6 7 8 9 10
Apl. amateur 10 5 8 5 8 6 3 3 6 1
Apl. profesional 8 5 5 6 8 6 5 6 4 3
Pruebas de hipótesis 69

(a) Plantear un contraste de hipótesis que permita decidir si la puntuación de la aplicación


amateur sigue una distribución normal.
(b) Resolver el contraste anterior y tomar una decisión con un nivel de signi…cación del 10 %.

Supongamos a partir de ahora que las puntuaciones de las aplicaciones están normalmente
distribuidas.

(c) Calcular un IC del 95 % para la varianza poblacional de la puntuación de la aplicación


profesional.
(d) ¿Se puede aceptar que la puntuación media de la aplicación profesional es superior a
la puntuación media de la aplicación amateur, con un nivel de signi…cación del 5 %?
Justi…car la respuesta.

7.33 El departamento de recursos humanos de una empresa de tecnología informática ha realizado


un estudio para determinar si la especialidad de los ingenieros informáticos in‡uye en su
rendimiento. Las especialidades examinadas fueron ingeniería del software (Sof t), ingeniería
de computadores (Comp), tecnología de la información y computación. Se tomaron cuatro
m.a.s. de empleados (una por especialidad) con una experiencia superior a los dos años. Los
resultados obtenidos fueron los siguientes:

Valoración
Especialidad Excelente Bueno Medio
Ing. software (Sof t) 22 17 11
Ing. de computadores (Comp) 20 13 7
Tecn. información 10 4 6
Computación 8 14 18

(a) Plantear el contraste de hipótesis que permita resolver la cuestión planteada.


(b) Resolver el contraste y tomar una decisión con un nivel de signi…cación del 5 %.
(c) Calcular un IC de nivel 0:94 para la proporción poblacional de empleados “excelentes”
con la especialidad Sof t. Hacer lo mismo con los empleados que poseen la especialidad
Comp.
(d) ¿Se puede aceptar que las proporciones poblacionales de empleados “excelentes” son
iguales en los que poseen las especialidades Sof t y Comp. Justi…car la respuesta.

7.34 El número de errores sintácticos por página de código (X) recogidos en una m.a.s. son los
siguientes:

X 0 1 2 3
ni 100 60 30 10

(a) ¿Se puede admitir que el número de errores sintácticos por página se distribuye según
una ley de P oisson? Justi…car la respuesta.

Suponiendo a partir de ahora que el número de errores sintácticos por página se distribuye
según una ley de P oisson:
(b) Calcular un intervalo de con…anza de nivel al menos 0:95 para el número medio de errores
sintácticos por página, justi…cando la respuesta.
(c) ¿Se puede admitir, como asegura el programador, que el número medio de errores sin-
tácticos es 0:65, o mayor como sospecha el ingeniero informático? Razonar la respuesta.
70 Estadística (E.I.I. de Valladolid, Curso 2019/20)

7.35 Se dispone de una m.a.s de doce cartuchos de tinta para impresora de la marca A y de otra
m.a.s. también de doce cartuchos de tinta de la marca B. En la muestra de la marca A se ha
obtenido una capacidad media de 85 ml con una desviación típica de 4 ml, mientras que en
la muestra de la marca B los resultados obtenidos son de 81 ml con una desviación típica de
5 ml. Suponiendo que el contenido de tinta de los cartuchos sigue una distribución normal:
(a) Obtener un IC de nivel 0:95 para la desviación típica del contenido de tinta de los
cartuchos de la marca B.
(b) Obtener un IC de nivel 0:9 para el contenido medio de tinta de los cartuchos de cada
una de las marcas.
(c) ¿Se puede admitir, con un nivel de signi…cación del 5 %, que el contenido medio de tinta
de los cartuchos de la marca A es superior en más de 2 ml al de la marca B? Justi…car
la respuesta.

7.36 Un fabricante de cierta marca de ordenadores portátiles a…rma que ha aparecido en el mercado
un nuevo chip con mayor …abilidad. Antes de determinar si los utiliza o no en sus ordenadores,
realiza un experimento con 100 chips de la marca que actualmente utiliza y con 300 de la
nueva marca. Durante la prueba, fallaron dos de los chips de cada una de las marcas.
(a) ¿Puede aceptarse, al nivel del 1 %, que son mejores los chips de la nueva marca? Justi…car
la respuesta.
(b) Obtener el p valor del contraste planteado en el apartado anterior. ¿Qué decisión debe
tomarse al nivel de signi…cación del 10 %?

7.37 Una empresa de seguridad para equipos informáticos asegura que el tiempo medio en acudir a
una llamada de emergencia de alguno de sus clientes se distribuye según una variable aleatoria
normal de media a lo más de 15:5 minutos y desviación típica no superior a 1:8 minutos. En
los dos últimos años se han tomado muestras de estos tiempos de respuesta y se han obtenido
los siguientes resultados:

Año Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic xi x2i
2012 15 17 14 16 14 16 14 14 15 16 15 15 181 2741
2013 16 16 17 18 18 20 20 17 17 20 18 18 215 3875

(a) Plantear y contrastar, con un nivel de signi…cación del 5 % y tomando todos los datos,
la hipótesis de que la varianza cumple las especi…caciones de la empresa.
(b) Plantear y contrastar, con un nivel de signi…cación del 1 % y tomando todos los datos,
la hipótesis de que el tiempo medio de respuesta a una emergencia cumple las especi…-
caciones de la empresa.
(c) A …nales del año 2012 se produjo un ERE en la empresa. ¿Se puede admitir, con un
nivel de signi…cación del 10 %, que este hecho no ha afectado a los tiempos medios de
respuesta a una emergencia?

7.38 El número X de accesos por minuto a una página web recogidos en una m.a.s. son los siguien-
tes:

X 0 1 2 3 4
ni 29 37 21 11 2

(a) Realizar un contraste de bondad de ajuste para decidir, con un nivel de signi…cación del
5 %, si se puede aceptar que X se distribuye según una ley de Poisson.
Pruebas de hipótesis 71

Suponiendo a partir de ahora que el número de accesos por minuto se distribuye según una
ley de P oisson:
(b) Calcular un intervalo de con…anza de nivel al menos 0:95 para el número medio de
accesos por minuto, justi…cando la respuesta.
(c) ¿Se puede admitir que el número medio de accesos por minuto es al menos 1:5 como
asegura el proveedor del alojamiento, o menor como sospecha el propietario de la página
web? Razonar la respuesta.

7.39 Se lanza una moneda 300 veces.


(a) Si se ha obtenido cara en 165 ocasiones, ¿debemos suponer, con un nivel de signi…cación
del 1 %, que la moneda está sesgada a favor de las caras?
(b) Calcular el p valor asociado al contraste del apartado anterior.
(c) Si se obtiene una proporción de caras del 55 %, ¿cuál debe ser el número mínimo de
tiradas para rechazar la hipótesis nula en el contraste planteado en el apartado (a)?
Justi…car la respuesta.

7.40 Una empresa posee dos servidores de correo para gestionar las direcciones profesionales de sus
empleados. Con el …n de distribuir los servidores en función de la utilización de los mismos,
desea estudiar el número de correos que se reciben en cada uno de ellos. Por ese motivo, se
seleccionaron al azar ocho direcciones de correo en cada servidor y se registraron los e mails
recibidos a lo largo de un mes:

Servidor A 180 190 178 173 164 167 162 186


Servidor B 172 179 167 186 202 196 178 192

(a) Plantear un contraste de hipótesis que permita decidir si el número de correos recibidos
en una dirección de correo gestionada por el servidor A sigue una distribución normal.
(b) Resolver el contraste anterior y tomar una decisión con un nivel de signi…cación del 5 %.

Supongamos a partir de ahora que el número de correos recibidos durante un mes en una
dirección de correo de la empresa están normalmente distribuidas.
(c) ¿Se puede aceptar que el número medio de correos recibidos en una dirección es menor
en los gestionados por el servidor A que en los gestionados por B, con un nivel de
signi…cación del 5 %?

7.41 Una máquina de llenado de cartuchos de tinta se ajusta para que la cantidad de tinta se
distribuya de forma normal, con una media de 15 mililitros y una desviación típica de 0:8
mililitros. La máquina se inspecciona periódicamente tomando una muestra de 16 cartuchos
y calculando se contenido medio. Si este contenido medio está en el intervalo [14:6; 15:4], se
considera que la máquina opera de manera correcta; en otro caso, se concluye que 6= 15
mililitros. Calcular:
(a) La probabilidad de cometer un error de tipo I.
(b) La probabilidad de cometer un error de tipo II cuando = 15:45 mililitros.

7.42 En relación con el ejercicio 4.39, supongamos que se han realizado cambios en la línea de
producción con el …n de reducir la variabilidad del sistema. Después de esto, se toma una
muestra aleatoria de 30 baterías y se obtiene una desviación típica igual a 0:2. ¿Hay evidencia
de que se ha reducido ? Justi…car la respuesta.
72 Estadística (E.I.I. de Valladolid, Curso 2019/20)

7.43 Se ha realizado un estudio, en las tres provincias de una comunidad autónoma, para comparar
la opinión de los a…liados de un determinado partido político respecto al candidato a la
presidencia de la comunidad. En la tabla siguiente se presentan las respuestas de 80 a…liados
seleccionados al azar en cada una de las provincias:

Provincia
Opinión A B C
A favor 75 68 64
En contra 5 12 16

(a) Plantear el contraste de hipótesis que permita resolver la cuestión planteada.


(b) Resolver el contraste del apartado (a) utilizando un nivel de signi…cación del 5 %.
(c) Calcular un intervalo de con…anza de nivel 0:95 para pA pB , siendo pA y pB las pro-
porciones de a…liados favorables al candidato en las provincias A y B, respectivamente.
¿Puede aceptarse al nivel = 0:05 que la proporción de a…liados favorables al candidato
es la misma en las provincias A y B? Razonar la respuesta.

7.44 Se ha realizado un estudio sobre la capacidad de almacenamiento de los teléfonos móviles con
8 GB de memoria interna de dos marcas, Cherry y P lum. Para una muestra de 10 teléfonos
de la marca Cherry, la capacidad media fue de 8:1 GB, con una desviación estándar de
0:25. Para una muestra de 10 teléfonos de la marca P lum, la capacidad media fue de 7:6
Gb, con una desviación estándar de 0:4. Suponiendo distribución normal en la capacidad de
almacenamiento:
(a) Calcular un intervalo de con…anza del 99 % para la diferencia entre las capacidades
medias de almacenamiento de las dos marcas de teléfonos. Justi…car la respuesta.
(b) ¿Proporcionan los datos evidencia su…ciente para concluir que la capacidad media de
almacenamiento de la marca Cherry excede a la de la marca P lum en más de 0:42 GB?
Formular y probar las hipótesis adecuadas.

7.45 El número X de estudiantes que llegan por minuto a un servicio de reprografía de un centro
universitario recogidos en una m.a.s. son los siguientes:

X 0 1 2 3 4
ni 42 39 27 9 3

(a) Realizar un contraste de bondad de ajuste para decidir, con un nivel de signi…cación del
1 %, si se puede aceptar que X se distribuye según una ley de Poisson.

Suponiendo a partir de ahora que el número de accesos por minuto se distribuye según una
ley de Poisson:
(b) Calcular un intervalo de con…anza de nivel al menos 0:98 para el número medio de
accesos por minuto, justi…cando la respuesta.
(c) ¿Se puede admitir que el número medio de estudiantes que llegan por minuto es al menos
1:25 como asegura el gestor del servicio de reprografía, o menor? Tomar una decisión
con un nivel de signi…cación del 10 %, utilizando para ello el p valor.

7.46 Se ha realizado un estudio para determinar si hay diferencia entre los programas informáti-
cos elaborados en dos países A y B. Los datos siguientes resumen el número de defectos
encontrados en 100 000 líneas de código de un cierto tipo de software:
Pruebas de hipótesis 73

País Tamaño de muestra xi x2i


A 16 768 37184
B 16 696 30564

Suponiendo distribución normal en el número de defectos por 100 000 líneas de código:

(a) Calcular un intervalo de con…anza de nivel 0:9 para la desviación típica del número de
defectos en 100 000 líneas de código de los programas elaborados en el país A.
(b) Los autores del estudio indicaron que los programas creados en el país B tenían un
número medio de defectos más pequeño que los programas elaborados en el país A.
¿Puede concluirse que esta diferencia es estadísticamente signi…cativa? Formular y pro-
bar las hipótesis apropiadas a un nivel 0:05.

7.47 Un fabricante a…rma que por lo menos el 95 % de los chips que vende a una determinada
…rma cumple con las especi…caciones solicitadas. En una m.a.s. de 400 chips, 30 no cumplen
con las especi…caciones.

(a) Plantear el contraste de hipótesis que permita resolver la cuestión planteada.


(b) Calcular el p valor aproximado asociado al contraste del apartado anterior.
(c) Resolver el contraste del apartado (a) utilizando un nivel de signi…cación del 5 %.

7.48 El número de accesos por minuto a un servidor web han sido los siguientes:

Núm. de accesos 0 1 2 3 4
Frecuencia 92 73 29 5 1

(a) ¿Se puede admitir que el número de accesos por minuto al servidor web se distribuye
según una ley de Poisson? Razonar la respuesta.
(b) Calcular un intervalo de con…anza de nivel al menos 0.95 para el parámetro de la
distribución.
(c) Construir un intervalo de con…anza de nivel aproximado 0.9 para la media poblacional
utilizando el TCL.
(d) ¿Se puede admitir, con un error del 10 %, que el número medio de accesos por minutos
es, como asegura el responsable del mantenimiento del servidor, al menos 0:85 o menor?
Razonar la respuesta.

7.49 Se desea elegir entre dos tipos de baterías para ordenadores portátiles. Por este motivo, se
midió el tiempo de duración con una sola carga de dos tipos de baterías. Para una muestra
de 16 baterías de la marca A, el tiempo medio fue de 22 horas con una desviación típica de
1 hora. Para una muestra también de 16 baterías de la marca B, el tiempo medio obtenido
fue de 23 horas, con una varianza de 0:625. Suponiendo distribución normal en el tiempo de
duración con una sola carga de las baterías:

(a) Calcular un intervalo de con…anza del 95 % para el tiempo medio de duración con una
sola carga de las baterías de cada una de las dos marcas.
(b) ¿Se puede admitir, con un nivel de signi…cación del 5 %, que el tiempo medio de duración
con una sola carga de las baterías de la marca B es superior en más de 45 minutos al
tiempo medio de las baterías de la marca A? Razonar la respuesta.
74 Estadística (E.I.I. de Valladolid, Curso 2019/20)

7.50 En un estudio sobre seguridad informática se analizó la gravedad de los errores de software
y la experiencia del equipo que desarrolló dicho software. Para ello se seleccionaron muestras
aleatorias de programas con errores, la primera de 50 programas con errores graves, la segunda
de 150 programas con errores moderados y la última de 150 programas con errores leves. Los
resultados recogidos fueron los siguientes:

Experiencia
Error Muy Experto Experto Poco Experto Sin Experiencia
Grave 0 5 9 36
Moderado 3 27 36 84
Leve 4 31 18 97
(a) Plantear el contraste de hipótesis adecuado que permita resolver la cuestión planteada.
(b) Resolver el contraste del apartado (a) utilizando un nivel de signi…cación del 5 %.
(c) Sea p1 (p2 ) la probabilidad de que un programa con un error Moderado (Leve) haya sido
realizado por un equipo Sin Experiencia. ¿Puede aceptarse con un nivel de con…anza del
95 % que p2 es mayor que p1 ? Razonar la respuesta.

7.51 Se ha realizado un estudio sobre los tiempos de ejecución de dos heurísticas para resolver
el problema del agente viajero. De un banco de pruebas se seleccionaron aleatoriamente
40 conjuntos de datos, que fueron divididos (también aleatoriamente) en dos subconjuntos
de 20. El primero de estos subconjuntos fue ejecutado con la heurística A y se obtuvo un
tiempo medio de 21 segundos, con una varianza de 2:2. El otro subconjunto se ejecutó con la
heurística B, resultando un tiempo medio de 25 segundos, con una varianza de 3. Suponiendo
distribución normal en los tiempos de ejecución de esas heurísticas:
(a) Calcular un intervalo de con…anza del 90 % para la desviación típica del tiempo de
ejecución de la heurística A.
(b) ¿Proporcionan los datos evidencia su…ciente, al nivel de signi…cación del 5 %, para con-
cluir que el tiempo medio de ejecución de la heurística B es superior en más de 3 segundos
al tiempo medio de ejecución de la heurística A? Formular y probar las hipótesis ade-
cuadas.

7.52 El responsable de una tienda de productos informáticos piensa que su tienda tiene el doble
de clientes los viernes y sábados que cualquier otro día de la semana (la tienda no abre los
domingos). Es decir, la probabilidad de que un cliente visite la tienda en viernes es 2=8, la
probabilidad de que un cliente visite la tienda un sábado es 2=8, mientras que la probabilidad
de que un cliente visite la tienda en cada uno de los restantes días de la semana es 1=8.
Durante una semana seleccionada al azar, se observaron los siguientes datos:
Día Lunes Martes Miércoles Jueves Viernes Sábado
Número de clientes 95 110 120 80 190 205
(a) Plantear el contraste de hipótesis que permita determinar si es válida la distribución
supuesta por el responsable de la tienda.
(b) Resolver el contraste del apartado (a) utilizando un nivel de signi…cación del 5 %.

7.53 El número de fallos por semana en un centro tecnológico ocasionados por problemas de
hardware han sido los siguientes:
Núm. de fallos 0 1 2
Frecuencia 531 63 6
Pruebas de hipótesis 75

(a) ¿Se puede admitir que el número de fallos por semana ocasionados por problemas de
hardware se distribuye según una ley de Poisson? Razonar la respuesta.
(b) Calcular un intervalo de con…anza de nivel al menos 0:9 para el parámetro de la dis-
tribución.
(c) Construir un intervalo de con…anza de nivel aproximado 0:95 para la media poblacional
utilizando el TCL.
(d) ¿Se puede admitir que el número medio de fallos por semana ocasionados por problemas
de hardware es a lo más 0:1? Razonar la respuesta.
7.54 Una profesora decidió ejecutar dos ligeras variaciones del mismo examen. Antes de repartir
los exámenes, barajó los dos exámenes juntos para asegurarse de que cada estudiante recibía
una versión aleatoria. En la tabla siguiente se muestran algunos indicadores que resumen los
resultados obtenidos.
Examen Tamaño de muestra xi x2i
A 20 130 858:26
B 20 120 730:42
Suponiendo que ambas cali…caciones se distribuyen normalmente:
(a) Calcular un intervalo de con…anza del 98 % para la cali…cación media de cada uno de los
dos exámenes.
(b) Al prever las quejas de los estudiantes que realizaron el examen B, la profesora quiere
determinar si la diferencia observada entre los dos exámenes es tan grande que pro-
porciona evidencia de que el grado de di…cultad de dichos exámenes (en promedio) es
distinto. Plantear y resolver el contraste de hipótesis, con un nivel de signi…cación del
2 %, para solucionar la cuestión planteada. Justi…car la respuesta.

7.55 Un artículo periodístico informaba sobre el apoyo mayoritario de los ciudadanos al nuevo
plan sanitario regional. Más concretamente, el artículo decía que siete de cada diez votantes
del partido A respaldaban el plan, mientras que entre los votantes del partido B, el 41:96 %
estaban a favor de la nueva legislación, el 52:04 % en contra y el 6 % se abstuvo. Se encuestó
a 820 votantes del partido A y a 784 del partido B.
(a) Un politólogo a…rmó en televisión que la mayoría de los votantes del partido B se oponían
al nuevo plan sanitario. ¿Proporcionan los datos evidencia su…ciente para apoyar esta
a…rmación? Justi…car la respuesta.
(b) Utilizando la información del enunciado, ¿de qué tamaño debe ser la muestra para esti-
mar la proporción de votantes del partido B que se oponen al nuevo plan sanitario con
una precisión del 1:5 % y una con…anza del 98 %? Justi…car la respuesta.
(c) Construir un intervalo de con…anza del 95 % para la diferencia de proporciones de par-
tidarios del nuevo plan sanitario entre los votantes de los dos partidos políticos. Inter-
pretar el resultado obtenido en el contexto del problema.
(d) ¿Se puede admitir, con un nivel de con…anza del 95 %, que el porcentaje de votantes del
partido A favorables al plan es superior en más del 25 % al porcentaje de votantes del
partido B? Justi…car la respuesta.

7.56 Un ingeniero informático ha desarrollado una nueva aplicación para móviles con la que asegura
que se acelera la descarga de archivos multimedia. Con el …n de comprobar el funcionamiento
de dicha aplicación, se seleccionaron aleatoriamente diez archivos multimedia y se midió el
tiempo de descarga sin la aplicación y con la aplicación. Los tiempos obtenidos (en segundos)
fueron los siguientes:
76 Estadística (E.I.I. de Valladolid, Curso 2019/20)

Archivo multimedia 1 2 3 4 5 6 7 8 9 10
Sin la aplicación 20 15 17 24 17 19 19 24 22 23
Con la aplicación 14 16 18 18 19 20 21 21 21 22
(a) Plantear un contraste de hipótesis que permita decidir si el tiempo de descarga sin la
aplicación sigue una distribución normal.
(b) Resolver el contraste anterior y tomar una decisión con un nivel de signi…cación del 10 %.

Supongamos a partir de ahora que los tiempos de descarga de los archivos multimedia están
normalmente distribuidos.

(c) Calcular un IC del 95 % para la varianza poblacional del tiempo de descarga con la
aplicación.
(d) ¿Se puede aceptar que la nueva aplicación reduce el tiempo medio de descarga de archivos
multimedia, con un nivel de signi…cación del 5 %? Justi…car la respuesta.

7.57 El tiempo en segundos que un trabajo espera en la cola de una impresora es una variable
aleatoria T con función de densidad
( 1
si 0 < t <
f (t; ) =
0 en el resto

Se desea probar la hipótesis H0 : = 10 frente a la alternativa H1 : = 7:5.


(a) Si se elige como región crítica C1 = fT 4g, ¿cuáles son los valores de y ?
(b) Encontrar y para la región crítica C2 = fT > 4g.
(c) ¿Cuál de las dos regiones críticas, C1 o C2 , es mejor para resolver el contraste? Justi…car
la respuesta.

7.58 El número de mensajes por hora que se han enviado al boletín electrónico Hojilla Estadística
han sido los siguientes:
Núm. de mensajes 0 1 2 3 4
Frecuencia 70 89 51 23 7
(a) ¿Se puede admitir que el número de mensajes por hora enviadoa al boletín Hojilla
Estadística se distribuye según una ley de Poisson? Razonar la respuesta.
(b) Calcular un intervalo de con…anza de nivel al menos 0:92 para el parámetro de la
distribución.
(c) Construir un intervalo de con…anza de nivel aproximado 0:98 para la media poblacional
utilizando el TCL.
(d) ¿Se puede admitir que el número medio de mensajes por hora que se envían al boletín
Hojilla Estadística es al menos 1:3? Razonar la respuesta.

7.59 Se ha medido la resistencia a la compresión de dos muestras de cajas para P C: una de cajas
fabricadas con acero y silicio, y la otra de cajas elaboradas con acero y aluminio. Los datos
obtenidos fueron los siguientes:

Material Tamaño muestral Media Varianza


Acero-silicio 10 807 729
Acero-aluminio 10 757 1681

Suponiendo que la resistencia a la compresión se distribuye normalmente:


Pruebas de hipótesis 77

(a) Calcular una cota inferior de nivel 0:95 para la resistencia media de las cajas fabricadas
con acero y aluminio.
(b) ¿Se puede admitir, a nivel = 0:05, que las cajas de acero y silicio tienen una resistencia
media a la compresión mayor que la correspondiente a las cajas de acero y aluminio?
Razonar la respuesta.

7.60 De una muestra de 160 mujeres, 55 manifestaron conocer la “Estrategia Regional para la
Igualdad de Oportunidades entre Hombres y Mujeres”, mientras que una muestra de 192
hombres indicó que solamente 60 decían conocer tales medidas.
(a) Calcular un IC de nivel 0:95 para la proporción de mujeres que dicen conocer la estrategia
regional. Hacer lo mismo con la proporción de hombres.
(b) ¿Se puede aceptar que hay alguna diferencia entre las proporciones de mujeres y de
hombres que dicen conocer las medidas? Razonar la respuesta.
(c) ¿Cuántas personas de cada sexo deben seleccionarse (suponer m = n) si se desea estimar
la diferencia de proporciones con una precisión del 5 % y un nivel de con…anza del 99 %?
(utilizar las estimaciones del enunciado).

7.61 Una empresa de montaje de ordenadores está utilizando dos tipos de fuentes de alimentación A
y B. Con el …n de saber si la proporción de fuentes defectuosas es la misma, se ha seleccionado
una muestra aleatoria de tamaño 200 de cada tipo de fuente de alimentación. Se encontraron 4
defectuosas en la muestra proveniente de las fuentes tipo A y 6 defectuosas en la que proviene
de las fuentes tipo B.
(a) ¿Se puede admitir, con un nivel de signi…cación del 5 %, que la proporción de fuentes
defectuosas de tipo A es inferior a la correspondiente proporción de las de tipo B?
Justi…car la respuesta.
(b) Calcular el p valor del contraste planteado en el apartado anterior. ¿Qué decisión debe
tomarse al nivel de signi…cación del 10 %?
(c) ¿Puede concluirse al nivel 0:05 que las proporciones de fuentes defectuosas son distintas?
Razonar la respuesta.

7.62 Una pequeña industria de productos tecnológicos necesita comprar un determinado chip.
Actualmente, existen dos proveedores que comercializan ese tipo de chip. Con el …n de conocer
cuál de los dos proveedores distribuye el chip de mayor calidad, compra 300 chips a cada uno
de los proveedores y los clasi…ca en tres categorías: buenos, con defectos leves y con defectos
graves. Los resultados obtenidos se muestran en la siguiente tabla:
Proveedor Buenos Def. Leves Def. Graves
A 285 8 7
B 279 10 11
(a) Plantear el contraste de hipótesis adecuado para este problema.
(b) Calcular el p valor del contraste e interpretar los resultados.
(c) Sea pA (pB ) la probabilidad de que un chip suministrado por el proveedor A (B) sea
bueno. ¿Puede aceptarse con un nivel de con…anza del 90 % que pA es mayor que pB ?
Razonar la respuesta.

7.63 Una universidad ha desarrollando una nueva herramienta informática (AnP ) para detectar el
grado de originalidad de las tesis doctorales que allí se de…enden y desea compararla con un
programa detector de plagio comercial (P la). De las tesis defendidas en los últimos diez años
en esa universidad extrae una m.a.s. de 10 y obtiene los siguientes porcentajes de coincidencia
con otros textos:
78 Estadística (E.I.I. de Valladolid, Curso 2019/20)

Tesis 1 2 3 4 5 6 7 8 9 10 xi x2i
P la 9 4 7 4 7 5 2 2 4 1 45 261
AnP 8 3:5 5 3:5 5 5 2:5 3 3 2 40:5 191:75

Suponiendo normalidad en el porcentaje de coincidencia:


(a) Calcular un IC del 90 % para la desviación típica del porcentaje de coincidencia que
detecta la nueva herramienta informática.
(b) Obtener un intervalo de con…anza del 98 % para la diferencia de porcentajes medios de
coincidencia. Razonar la respuesta.
(c) ¿Se puede aceptar que el porcentaje medio de coincidencias detectado por la nueva
herramienta es inferior al porcentaje medio detectado por el programa P la? Razonar la
respuesta.

7.64 El número de consultas realizadas a una base de datos en un minuto fueron los siguientes:
Núm. de consultas 0 1 2 3 4
Frecuencia 49 77 47 19 8
(a) ¿Se puede admitir que el número de consultas realizadas a la base de datos se distribuye
según una ley de Poisson? Razonar la respuesta.
Suponiendo a partir de ahora que el número de consultas realizadas a la base de datos se
distribuye según una ley de Poisson:
(b) Calcular un intervalo de con…anza de nivel al menos 0:896 para el parámetro de la
distribución.
(c) Construir un intervalo de con…anza de nivel aproximado 0:99 para la media poblacional
utilizando el TCL.
(d) ¿Se puede admitir que el número medio de consultas por minuto realizadas a la base de
datos es inferior a 1:5? Razonar la respuesta.

7.65 Se desea comparar el tiempo que tardan dos programas A y B en encontrar y eliminar archivos
duplicados. Para ello se seleccionaron dos muestras aleatorias e independientes de quince
ordenadores portátiles, todos con las mismas características. Los datos obtenidos fueron los
siguientes:

Programa Tamaño de muestra ti t2i


A 15 1440 138615
B 15 1305 113775

Suponiendo distribución normal en el tiempo de ejecución de los programas de detección y


eliminación de archivos duplicados:
(a) Obtener un IC de nivel 0:95 para la desviación típica del tiempo de ejecución del pro-
grama A.
(b) Obtener un IC de nivel 0:9 para el tiempo medio que tardan en ejecutarse cada uno de
los programas.
(c) ¿Se puede admitir, con un nivel de signi…cación del 10 %, que el tiempo medio que tarda
en ejecutarse el programa A es superior en más de 7 u.t. al del programa B? Justi…car
la respuesta.
BLOQUE 4

MODELOS DE REGRESIÓN

79
8

Regresión lineal y no lineal


8.1 El presidente de la cadena de grandes almacenes OLIE quiere desarrollar un modelo que
sirva para predecir las ventas totales de las nuevas tiendas que desea abrir. Se dispone de los
siguientes datos de renta por hogar (X) y ventas al por menor (Y ):

Renta Ventas Renta Ventas


9098 5492 11307 5907
9138 5540 11432 6124
9094 5305 11449 6186
9282 5507 11697 6224
9229 5418 11871 6496
9347 5320 12018 6718
9525 5538 12523 6921
9756 5692 12053 6471
10282 5871 12088 6394
10662 6157 12215 6555
11019 6342 12494 6755

(a) ¿El diagrama de dispersión respalda la utilización del modelo de regresión lineal simple?
(b) Calcular los estimadores puntuales de los coe…cientes del modelo de regresión lineal.
(c) Calcular una estimación puntual de las ventas al por menor cuando la renta por hogar
es 11500.
(d) Calcular un estimador puntual de la varianza del modelo.
(e) Estimar la desviación estándar de los parámetros del modelo.
(f) Calcular un IC de nivel 0:95 para 0.
(g) Calcular un IC de nivel 0:95 para 1.
(h) ¿Aporta información relevante la renta para explicar la variabilidad de las ventas?
(i) Calcular un intervalo de con…anza del 95 % para las ventas al por menor esperadas
cuando la renta es de 12000.
(j) Calcular un intervalo de predicción para las ventas futuras cuando la renta es de 12000.

8.2 Una cadena de tiendas de consumibles informáticos desea conocer cómo afectan los gastos
publicitarios en las ventas. Para ello se introdujeron diferentes cambios relativos a los gastos
en publicidad en comparación con el año anterior en ocho localidades y se observaron los
cambios que experimentaron las ventas. Los datos se muestran en la siguiente tabla.

Incr. gastos publicitarios ( %) 0 4 14 10 9 8 6 1


Aumento de las ventas ( %) 2:4 7:2 10:3 9:1 10:2 4:1 7:6 3:5

(a) Calcular los estimadores por mínimos cuadrados de la regresión lineal del aumento de
las ventas con respecto al incremento de los gastos publicitarios.
(b) Calcular un IC de nivel 0:90 para la pendiente de la recta de regresión poblacional.
(c) Realizar una prueba de utilidad del modelo, basada en el p valor.

81
82 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(d) Calcular un intervalo de predicción del 95 % para el incremento de las ventas si los gastos
publicitarios aumentan un 5 %.

8.3 El proveedor nacional de ordenadores de la marca EDIS está preocupado por las ventas en el
próximo ejercicio ante la previsible subida de los tipos de interés. Desea realizar un análisis
de regresión para poder predecir las ventas de su empresa en función de la variación de los
tipos de interés. Los resultados obtenidos con Statgraphics son los siguientes:
Coe…cientes
M {nimos Cuadrados Estandar Estad{stico
P arametro Estimado Error T V alor P
Intercepto 66:637 6:24461 10:6711 0:0000
Pendiente 19:317 0:908669 21:2586 0:0000

Análisis de Varianza
F uente Suma de Cuadrados Gl Cuadrado M edio Razon F V alor P
Modelo 493833 1 493833 451:93 0:0000
Residuo 172651 158 1092:73
Total (Corr.) 666484 159

(a) ¿Qué porcentaje de la variación observada de las ventas se puede atribuir al modelo de
regresión considerado?
(b) ¿Cuál es el valor del coe…ciente de correlación lineal muestral?
(c) ¿Es útil el modelo de regresión? Razonar la respuesta.
(d) Estimar las ventas promedio cuando se produce una subida del 2 % en los tipos de interés,
ofreciendo información acerca de la precisión.

8.4 El departamento de gestión catastral de la Consejería de Hacienda de una comunidad autóno-


ma desea conocer la relación existente entre el valor de mercado de las viviendas habituales de
pequeñas ciudades, Y (en miles de euros), y el tamaño de la vivienda, X (en m2 ). Basándose
en una muestra de 75 viviendas, se obtuvieron los siguientes resultados:
xi = 6853:3334; yi = 15067:548; xi yi = 1386120:1; x2i = 627533:34; yi2 = 3139677:9
(a) Calcular las estimaciones por mínimos cuadrados de los parámetros del modelo de re-
gresión lineal simple (el intercepto y la pendiente).
(b) Obtener el estimador de la varianza de los errores.
(c) Construir la tabla ANOVA.
(d) ¿Se puede admitir con un nivel de signi…cación del 1 % que la variable Y depende lineal-
mente de la variable X? Justi…car la respuesta.

8.5 Los resultados siguientes se obtuvieron de un estudio de análisis de regresión para investigar
la relación existente entre la tasa de muertes en accidentes de trá…co por 10000 habitantes (Y )
y el porcentaje de camiones en el total del parque automovilístico (X) de varias provincias
españolas.
n = 49; xi = 808:840; yi = 8:55331; x2i = 15067:1; xi yi = 157:903; yi2 = 1:80185
(a) Calcular la recta de regresión estimada.
(b) ¿Cuál es la estimación de la tasa de muertes en accidentes de trá…co cuando el porcentaje
de camiones en el total del parque automovilístico es igual a 15:5?
(c) Estimar la cantidad en que se espera que la tasa de muertes por accidente cambie cuando
el porcentaje de camiones del parque automovilístico disminuye en 2.
Regresión lineal y no lineal 83

(d) Realizar una prueba de utilidad del modelo. Justi…car la respuesta.


(e) Calcular un intervalo de con…anza del 95 % para la tasa esperada de muertes cuando el
porcentaje de camiones es igual a 20.
(f) Obtener un intervalo de pronóstico del 98 % para tasa futura de muertes por accidente
cuando el porcentaje de camiones es igual a 20.

8.6 Los datos siguientes se re…eren a una investigación que se realizó para estudiar la relación
entre el salario de los empleados de una empresa Y (en miles de euros) y la puntuación que
una compañía auditora otorgó a cada empleado.

Salario 27 15 71 35 8 60 3 10 10
Puntuación 36 34 255 103 4 555 6 60 96

(a) Calcular la recta de regresión estimada.


(b) ¿Proporcionan los datos evidencia de que el salario medio crece con la puntuación de la
empresa auditora? Justi…car la respuesta.
(c) Obtener un intervalo de con…anza del 95 % para el salario medio de un empleado cuando
la puntuación que otorga la compañía auditora es de 150 puntos.

8.7 Con una muestra aleatoria de 42 alumnos de la asignatura Informática Estadística, se estimó
el modelo de regresión lineal simple Y = 0 + 1 X + , donde Y es la cali…cación …nal de los
alumnos y X es la cali…cación en un examen realizado a mitad del curso. Las estimaciones
por mínimos cuadrados obtenidas fueron b 0 = 0:685045 y b 1 = 0:883324. La suma total de
cuadrados y la suma de los cuadrados de los errores fueron: SST = 184:071 y SSE = 38:887.
(a) Calcular e interpretar el coe…ciente de determinación.
(b) Contrastar a un nivel del 5 % la hipótesis nula de que la pendiente de la recta de regresión
poblacional es 0 frente a la alternativa bilateral.
(c) Hallar un intervalo de con…anza del 95 % para la pendiente de la recta de regresión
poblacional.

8.8 A una muestra aleatoria simple de 25 estudiantes de segundo curso de la Universidad Francisco
de Quevedo se les pidió que valoraran su satisfacción en los estudios (X) en una escala de 0
a 10. Se les preguntó también por el número de días lectivos que estos alumnos no acudieron
al centro educativo (Y ) el curso pasado. La estimación de la recta de regresión por mínimos
cuadrados que se obtuvo fue yb = 25:2 2:4x. Además, x = 6, Sxx = 130 y SSE = 322:4.
(a) Contrastar a un nivel del 10 % la hipótesis nula de que la satisfacción en los estudios no
produce un efecto lineal en el absentismo frente a la alternativa bilateral.
(b) Un alumno tiene un nivel de satisfacción de 4 en sus estudios. Calcular un intervalo al
90 % del número de días que este alumno no acudiría a su centro educativo en un curso.

8.9 Un distribuidor de productos informáticos desea saber cómo afecta el precio de un determi-
nado artículo a las ventas del mismo. Con una muestra aleatoria de ocho semanas obtuvo los
datos de la tabla siguiente.

Precio 19:2 20:5 19:7 21:3 20:8 19:9 17:8 17:2


Ventas 254 147 186 124 111 157 292 352

(a) Calcular un intervalo de con…anza del 95 % de la variación esperada de las ventas provo-
cada por una subida del precio de una unidad monetaria.
84 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(b) ¿Se puede admitir al nivel del 5 % que las ventas no dependen linealmente del precio del
artículo? Razonar la respuesta.

8.10 Supongamos que en el modelo lineal Y = 0 + 1 X + se multiplica la variable independiente


X por una constante 6= 0.
(a) ¿Cómo afecta a las estimaciones por mínimos cuadrados de los parámetros 0 y 1 del
modelo?
(b) ¿Cambia la estimación de la varianza del modelo?
(c) ¿Qué cambios experimenta el coe…ciente de determinación?

8.11 En el modelo de regresión lineal Y = 0 + 1 X + supongamos que la variable Y se reemplaza


por Y , donde 6= 0 es una constante.
(a) ¿Cómo afecta a las estimaciones por mínimos cuadrados de los parámetros 0 y 1 del
modelo?
(b) ¿Cambia la estimación de la varianza del modelo?
(c) ¿Qué cambios experimenta el coe…ciente de determinación?

8.12 Con el …n de conocer cómo afecta el precio X de una memoria USB en sus ventas Y (en
decenas de unidades), la empresa distribuidora …ja diferentes precios en diez localidades de
la región. Se dispone de la siguiente información:
n = 10; xi = 112; x2i = 1278; yi = 406; yi2 = 16596; xi yi = 4498
(a) Estimar la regresión lineal de las ventas con respecto al precio.
(b) ¿Qué efecto sería de esperar que produjera una subida del precio de 2 u.m.?
(c) Calcular e interpretar el coe…ciente de determimación.

8.13 El responsable de ventas de una tienda de productos informáticos desea conocer la relación
existente entre el número de folletos publicitarios repartidos semanalmente, X, y el bene…cio
en cientos de euros por las ventas a domicilio, Y . Por ese motivo, durante veinte semanas se
registraron los datos de ambas variables. Se dispone de la siguiente información:
n = 20; xi = 12730; x2i = 8501100; yi = 3515; yi2 = 622523; xi yi = 2279470
(a) Estimar la regresión lineal de las ventas con respecto al número de folletos.
(b) Calcular un IC del 95 % para la pendiente de la regresión lineal.
(c) ¿Puede a…rmarse que la venta del producto depende linealmente del número de folletos
publicitarios repartidos? Razonar la respuesta.
(d) Calcular el error estándar del modelo.
(e) Estimar el valor del bene…cio esperado (en cientos de euros) para aquellas semanas en las
que se repartan 550 folletos publicitarios. Calcular, además, un IC del 95 % para dicha
estimación.
(f) Calcular un intervalo de predicción del 95 % para el bene…cio (en cientos de euros) de
una semana futura en la que se repartan 550 folletos publicitarios.
(g) Calcular e interpretar el coe…ciente de determinación. Compararlo con el coe…ciente de
determinación ajustado.

8.14 El responsable de la gestión de una sala informática de un centro universitario desea realizar
un estudio sobre la ocupación de la sala en las horas centrales del día. Por este motivo ha
tomado una muestra aleatoria de diez días y ha registrado la ocupación de la sala en esas
horas del día, así como el número de trabajos diferentes (de entrega obligatoria) cuya fecha
límite vence a lo más en dos días. Los resultados obtenidos fueron los siguientes:
Regresión lineal y no lineal 85

Núm. trabajos 5 23 7 26 25 14 19 0 4 10
Núm. puestos ocupados 21 65 19 72 75 39 67 11 12 24

(a) Estimar la regresión lineal del número de puestos ocupados con respecto al número de
trabajos.
(b) Interpretar el signi…cado de las estimaciones del intercepto y la pendiente en este pro-
blema.
(c) Calcular un IC del 95 % de la ocupación media de la sala cuando el número de trabajos
cuya fecha límite vence en a lo más dos días es de 18.
(d) Una vez realizada la estimación, se han borrado los valores de la variable respuesta y se
ha perdido el valor del cuarto residuo. ¿Cuál es su valor, si el resto de los residuos son
los siguientes? Justi…car la respuesta.
Residuos (ei ) 3:1 1:9 4:3 ???? 2:6 3:4 11 6:7 3:2 7:5
(e) ¿Es útil el modelo? Justi…car la respuesta.
(f) Calcular e interpretar el coe…ciente de determinación.

8.15 El gabinete de estudios económicos de la universidad de Villana desea investigar si existe


relación entre la antigüedad (en años) de los servidores de correo que utilizan sus diferentes
unidades docentes y los costes de mantenimiento (en euros) de los mismos. Con una muestra
seleccionada al azar de catorce servidores se obtuvieron los siguientes datos:
n = 14; xi = 72; x2i = 476; yi = 2163; yi2 = 366311; xi yi = 12677
(a) Suponiendo una relación lineal entre las variables, estimar los coe…cientes de regresión
del coste de mantenimiento (Y ) sobre la antigüedad (X).
(b) Interpretar el signi…cado de la ordenada en el origen y de la pendiente en este problema.
(c) Al nivel de signi…cación del 1 %, ¿existe evidencia de que haya una relación lineal entre
el coste de mantenimiento y la antigüedad? Justi…car la respuesta.

8.16 En un estudio para analizar la relación entre el incremento salarial el último año X (en
porcentaje) y la evaluación de la docencia Y (en una escala de 0 a 10) se han recogido datos
de 30 profesores universitarios. Los datos obtenidos fueron:
xi = 77:4; x2i = 419:142; yi = 180; yi2 = 1130; xi yi = 566:7
(a) Estimar la regresión lineal de la evaluación de la docencia con respecto al incremento
salarial el último año.
(b) ¿Es útil el modelo? Justi…car la respuesta.
(c) Interpretar el signi…cado de la estimaciones del intercepto y la pendiente en este proble-
ma.
(d) Calcular un IC del 95 % de evaluación media de la docencia cuando el incremento salarial
el último año es del 5 %.
(e) Calcular e interpretar el coe…ciente de determinación.

8.17 Se ha realizado un estudio para analizar la relación existente entre el número de páginas de
un trabajo que se imprime en una impresora, X, y el tiempo de impresión del mismo, Y . Los
datos obtenidos fueron los siguientes:
n = 82; xi = 408; x2i = 2818; yi = 4321:7; yi2 = 296397; xi yi = 28362:5
(a) Estimar la regresión lineal del tiempo de impresión con respecto al número de páginas.
86 Estadística (E.I.I. de Valladolid, Curso 2019/20)

M SR 2
(b) Sea F el estadístico de contraste de la tabla ANOVA (es decir, F = M SE ) y R el coe…-
2 SSR
ciente de determinación del modelo de regresión lineal (es decir, R = SST ). Demostrar
2
que F = 1 RR2 (n 2).
(c) ¿Existe evidencia muestral de que el tiempo de impresión de un trabajo depende lineal-
mente del número de páginas del mismo? Justi…car la respuesta.
(d) Calcular un IC del 90 % para el tiempo medio de impresión para aquellos trabajos que
constan de 6 páginas.
(e) Calcular un intervalo de predicción del 90 % para el tiempo de impresión de un trabajo
futuro que tiene 6 páginas.
(f) Calcular e interpretar el coe…ciente de determinación.

8.18 Los profesores del área de informática de un determinado centro universitario desean estudiar
si existe relación entre las cali…caciones de las asignaturas Fundamentos de Informática (X)
y Ampliación de Informática (Y ). Con una muestra seleccionada al azar de 32 estudiantes se
obtuvieron los siguientes datos:
n = 32; xi = 162; x2i = 1046; yi = 206; yi2 = 1406; xi yi = 1158
(a) Estimar los coe…cientes de regresión lineal de Y sobre X.
(b) Interpretar el signi…cado de la pendiente de la recta de regresión en este problema.
(c) Calcular el coe…ciente de correlación entre X e Y . Justi…car la respuesta.
(d) Al nivel de signi…cación del 1 %, ¿existe evidencia de que haya una relación lineal entre
las cali…caciones de las dos asignaturas consideradas? Razonar la respuesta.

8.19 Una empresa de ventas on-line ha realizado un estudio para analizar la relación existente
entre el número de visitas diarias recibidas, X, y las ventas diarias realizadas, Y . Los datos
obtenidos fueron los siguientes:
n = 30; xi = 12900; x2i = 5693760; yi = 660; yi2 = 14870; xi yi = 290348
(a) Estimar la regresión lineal de las ventas diarias con respecto al número diario de visitas.
(b) Calcular un IC del 95 % para la pendiente de la regresión lineal.
(c) ¿Puede a…rmarse que las ventas diarias realizadas dependen linealmente del número de
visitas recibidas? Razonar la respuesta.
(d) Calcular una estimación del error estándar del modelo.
(e) Estimar el valor de las ventas esperadas los días en que se reciban 450 visitas. Además,
calcular un IC del 95 % para dicha estimación.
(f) Calcular un intervalo de predicción del 95 % para las ventas de un día futuro en el que
se reciban 450 visitas.
(g) Calcular e interpretar el coe…ciente de determinación. Compararlo con el coe…ciente de
determinación ajustado.

8.20 En un departamento universitario se ha estudiado la relación existente entre las cali…caciones


en una asignatura avanzada de estadística (Y ) y una asignatura básica de cálculo de proba-
bilidades (X). Los datos obtenidos con una muestra de 40 estudiantes fueron los siguientes:
n = 40; xi = 300; x2i = 2340; yi = 220; yi2 = 1254; xi yi = 1707
(a) Estimar la regresión lineal de la cali…cación en estadística avanzada con respecto a la
cali…cación en cálculo de probabilidades.
(b) Calcular un IC del 95 % para la varianza del error.
Regresión lineal y no lineal 87

(c) Calcular un IC del 95 % para el intercepto de la regresión lineal. ¿Puede admitirse, con
un nivel de signi…cación del 5 %, que no existe término independiente en el modelo de
regresión lineal? Justi…car la respuesta.
(d) ¿Puede a…rmarse, con un nivel de signi…cación del 1 %; que las cali…caciones en estadís-
tica avanzada dependen linealmente de las cali…caciones en cálculo de probabilidades?
Razonar la respuesta.
(e) Calcular un IC del 95 % para la cali…cación media en estadística avanzada dada una
cali…cación de 7 en cálculo de probabilidades.
(f) ¿Para qué cali…cación en cálculo de probabilidades la longitud del intervalo del apartado
(e) sería mínima? Razonar la respuesta.
(g) Calcular e interpretar el coe…ciente de determinación.

8.21 Se seleccionó una muestra aleatoria de n = 20 estudiantes y se observaron los valores de Y =


cali…cación en el examen …nal y X = cali…cación en un examen realizado a mitad del curso.
Se obtuvieron los siguientes datos:
P P 2 P P 2 P
xi = 120 xi = 755 yi = 128 yi = 831 xi yi = 787:25
(a) Estimar los coe…cientes de regresión lineal de Y sobre X.
(b) Calcular un IC del 95 % para la varianza del error.
(c) Al nivel de signi…cación del 2 %, ¿existe evidencia de que haya una relación lineal entre
las cali…caciones de los dos exámenes considerados? Razonar la respuesta.

8.22 Una compañía auditora ha realizado un estudio para analizar la relación existente entre la
inversión anual en mejora de la calidad de las empresas tecnológicas, X, y la valoración que
esas empresas han obtenido en el informe anual, Y . Se dispone de la siguiente información:
P P P P P
n = 25; xi = 2225; x2i = 198588; yi = 1875; yi2 = 140788; xi yi = 167160
(a) Estimar la regresión lineal de la valoración con respecto a la inversión en mejora de la
calidad. Interpretar el signi…cado de la estimación del intercepto en este problema.
(b) Calcular un IC del 95 % para la pendiente de la regresión lineal.
(c) ¿Existe evidencia muestral de que la valoración en el informe anual depende linealmente
de la inversión en mejora de la calidad? Justi…car la respuesta.
(d) Calcular una estimación del error estándar del modelo.
(e) Calcular un IC del 98 % para la valoración media de aquellas empresas que invierten en
calidad 89 u.m.
(f) Calcular un intervalo de predicción del 98 % para la valoración de una empresa tecnoló-
gica que invierte en calidad 89 u.m.
(g) Calcular e interpretar el coe…ciente de determinación.

8.23 Una empresa de ingeniería utiliza dos técnicas en el proceso de selección de su personal. La
primera prueba consiste en una entrevista personal de dos horas, mientras que en la segunda
se realiza un examen escrito de una hora como máximo. Las cali…caciones obtenidas con una
muestra de 20 candidatos fueron las siguientes:
P P P P P
n = 20; xi = 1660; x2i = 139752; yi = 1020; yi2 = 53060; xi yi = 86064;
donde X e Y representan las cali…caciones en la primera y segunda prueba, respectivamente.
(a) Estimar la regresión lineal de la cali…cación en la segunda prueba con respecto a la
cali…cación en la entrevista personal. Interpretar el signi…cado de la pendiente en este
problema.
88 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(b) Calcular un IC del 98 % para la varianza del error.


(c) ¿Puede admitirse que la cali…cación en la segunda prueba depende linealmente de la
cali…cación en la entrevista? Razonar la respuesta.
(d) Construir la tabla ANOVA.
(e) Calcular un IC del 95 % para la cali…cación media en la prueba escrita dada una cali…-
cación de 85 puntos en la entrevista.
(f) Demostrar que el estadístico T1 = b 1 =b b también puede calcularse como
1

p
r n 2
p ,
1 r2
siendo r el coe…ciente de correlación muestral entre X e Y .

8.24 En un estudio sobre el tiempo que tarda en ejecutarse una determinada aplicación en el
entorno iOS (X) y en el entorno Android (Y ), se han recogido los siguientes datos referidos
a 52 …cheros de datos seleccionados al azar:
P P 2 P P 2 P
xi = 343:2; xi = 2340:12; yi = 322:4; yi = 2052:88; xi yi = 2187:84
(a) Estimar la regresión lineal del tiempo de ejecución de la aplicación en el entorno Android
con respecto al tiempo de ejecución en el entorno iOS.
(b) Interpretar el signi…cado de la pendiente de la recta de regresión en este problema.
(c) Al nivel de signi…cación del 1 %, ¿existe evidencia de que haya una relación lineal entre
los tiempos de ejecución de la aplicación en los dos entornos? Razonar la respuesta.

8.25 En un estudio sobre el salario (Y ) y la experiencia en su puesto de trabajo (X) de los


empleados de una empresa de telecomunicaciones, se recopilaron los siguientes datos
P P 2 P P 2 P
n = 40; xi = 528; xi = 10818; yi = 2000; yi = 127124; xi yi = 35934
(a) Estimar la regresión lineal del salario con respecto a la experiencia.
(b) Interpretar el signi…cado de las estimaciones del intercepto y la pendiente en este pro-
blema.
(c) Calcular un IC del 95 % para el intercepto.
(d) ¿Puede a…rmarse que el salario de los empleados depende linealmente de la experiencia
en el puesto de trabajo que desempeñan? Razonar la respuesta.
(e) Estimar el salario esperado de los empleados que tienen una experiencia en su puesto de
trabajo de 13 unidades de tiempo. Además, calcular un intervalo de con…anza del 90 %
para dicha estimación.
(f) La Figura 8.1 muestra el diagrama de residuos de la regresión lineal. ¿Es adecuado el
modelo lineal? Razonar la respuesta.

8.26 Se ha realizado un estudio para analizar la relación entre la inversión realizada (X) y el be-
ne…cio obtenido (Y ) en pequeñas empresas del ámbito tecnológico. La información disponible
es la siguiente:
P P 2 P P 2 P
n = 52; xi = 1404; xi = 57502; yi = 1560; yi = 69402; xi yi = 61667
(a) Estimar la regresión lineal del bene…cio con respecto a la inversión realizada.
(b) Interpretar el signi…cado de las estimaciones del intercepto y la pendiente en este pro-
blema.
(c) Calcular un IC del 95 % para la varianza del error.
Regresión lineal y no lineal 89

(d) Construir la tabla de coe…cientes estimados.


(e) ¿Puede a…rmarse, con un nivel de signi…cación del 5 %, que no existe término indepen-
diente en el modelo de regresión lineal? Razonar la respuesta.
(f) ¿Existe evidencia muestral de que el bene…cio depende linealmente de la inversión rea-
lizada? Justi…car la respuesta.
(g) La Figura 8.2 muestra el diagrama de residuos de la regresión lineal. ¿Es adecuado el
modelo lineal? Razonar la respuesta.

8.27 En un experimento sobre el uso de una nueva herramienta informática para el aprendizaje
del álgebra lineal en una asignatura básica de Matemáticas, se registraron las cali…caciones
en un examen parcial (X) y en el examen …nal de la asignatura (Y ) de un grupo de veinte
estudiantes seleccionados al azar. La información disponible es la siguiente:
P P 2 P P 2 P
xi = 176; xi = 1568; yi = 156; yi = 1238; xi yi = 1392
(a) Estimar la regresión lineal de la cali…cación …nal con respecto a la cali…cación en el
examen parcial.
(b) Al nivel de signi…cación del 1 %, ¿existe evidencia de que la cali…cación en el examen
…nal está linealmente relacionada con la cali…cación en el examen parcial? Razonar la
respuesta.

8.28 En un estudio sobre la relación entre las edades de los esposos (X) y esposas (Y ) en una
muestra aleatoria de 40 parejas casadas en Fridonia, donde las edades de ambos compañeros
son menores de 63 años, se recopilaron los siguientes datos
P P 2 P P 2 P
n = 40; xi = 1520; xi = 64214; yi = 1480; yi = 60262; xi yi = 62145
(a) Calcular las estimaciones por mínimos cuadrados de los parámetros del modelo de re-
gresión lineal simple (el intercepto y la pendiente).
(b) Interpretar el signi…cado de la estimación de la pendiente en este problema.
(c) Calcular un IC del 95 % para la varianza del error.
(d) ¿Puede a…rmarse que la edad de la esposa depende linealmente de la edad del marido?
Razonar la respuesta.
(e) Calcular e interpretar el coe…ciente de determinación.
(f) Estimar la edad esperada de la esposa de un hombre casado de Fridonia que tiene 53
años. Además, calcular un intervalo de con…anza del 95 % para dicha estimación.
(g) ¿Sería prudente utilizar el modelo lineal desarrollado en el apartado (a) para predecir
la edad de la esposa de un hombre casado de Fridonia que tiene 79 años? Razonar la
respuesta.

8.29 Se ha realizado un estudio para analizar la relación entre la cali…cación media en Bachillerato
(X) y la puntuación en la prueba de admisión al Máster en Gestión de Empresas Tecnológicas
y Éticas (Y ). La información disponible es la siguiente:
P P 2 P P 2 P
n = 32; xi = 264; xi = 2205:7; yi = 227:2; yi = 1630:72; xi yi = 1895:11
(a) Estimar la regresión lineal de la puntuación en la prueba de admisión al Máster con
respecto a la cali…cación media en Bachillerato.
(b) Interpretar el signi…cado de las estimaciones del intercepto y la pendiente en este pro-
blema.
(c) Calcular un IC del 95 % para la pendiente de la regresión lineal.
90 Estadística (E.I.I. de Valladolid, Curso 2019/20)

(d) ¿Puede a…rmarse, con un nivel de signi…cación del 5 %, que la puntuación en la prueba
de admisión al Máster depende linealmente de la cali…cación media en el Bachillerato?
Razonar la respuesta.
(e) Estimar la puntuación esperada en la prueba de admisión al Máster de aquellos can-
didatos que tienen una cali…cación media en Bachillerato de 8:25. Calcular, además, un
IC del 90 % para dicha estimación.
(f) Calcular un intervalo de predicción del 90 % para la puntuación futura en la prueba de
admisión al Máster de un candidato que tiene una cali…cación media en Bachillerato de
8:25.
(g) Calcular e interpretar el coe…ciente de determinación.

8.30 De un estudio sobre la demanda (Y ) de un modelo de impresora en una determinada región


española y el precio unitario de venta de dicho modelo (X), se ha obtenido la siguiente
información:
P P 2 P P 2 P
n = 35; xi = 5180; xi = 3366640; yi = 3920; yi = 5:6 105 ; xi yi = 1100160
(a) Estimar la regresión lineal de la demanda con respecto al precio unitario de venta del
modelo de impresora.
(b) Al nivel de signi…cación del 1 %, ¿existe evidencia de que la demanda del modelo de
impresora está linealmente relacionada con el precio unitario de venta de dicho modelo?
Razonar la respuesta.

8.31 El técnico informático de la Escuela de Informática Financiera está interesado en estudiar


la relación existente entre el tiempo que tarda en imprimirse un trabajo (Y ) y el número de
páginas del trabajo (X). La información disponible es la siguiente:
P P 2 P P 2 P
n = 40; xi = 240; xi = 1768; yi = 2400; yi = 163148; xi yi = 16696
(a) Calcular las estimaciones por mínimos cuadrados de los parámetros del modelo de re-
gresión lineal simple.
(b) Interpretar el signi…cado de la estimación de la pendiente en este problema.
(c) Calcular un IC del 95 % para la varianza del error.
(d) ¿Puede a…rmarse que el tiempo que tarda en imprimirse un trabajo depende linealmente
del número de páginas del trabajo? Razonar la respuesta.
(e) Calcular e interpretar el coe…ciente de determinación.
(f) Estimar el tiempo esperado de impresión de un trabajo de 5 páginas. Además, calcular
un intervalo de con…anza del 98 % para dicha estimación.

8.32 El delegado local de empleo de una determinada población catalana desea estudiar si existe
relación entre el número de personas que acuden diariamente a la o…cina de empleo de Lago
Blanco (X) y las que lo hacen el día siguiente a la de Meseta Azul (Y ). Con una muestra
seleccionada al azar de 40 días se obtuvieron los siguientes datos:
P P 2 P P 2 P
n = 40; xi = 1920; xi = 113152; yi = 3520; yi = 386352; xi yi = 205696
(a) Estimar los coe…cientes de regresión lineal de Y sobre X.
(b) Dar una interpretación sensata a la estimación del intercepto en este problema.
(c) Calcular un IC del 98 % para el error estándar del modelo.
(d) ¿Puede a…rmarse que no existe término independiente en el modelo de regresión lineal?
Razonar la respuesta.
Regresión lineal y no lineal 91

(e) ¿Es útil el modelo? Justi…car la respuesta.


(f) Calcular un intervalo de predicción del 99 % para el número de personas que acudirán
mañana a la o…cina de empleo de Meseta Azul si hoy han ido 48 personas a la o…cina
de Lago Blanco.
(g) Calcular e interpretar el coe…ciente de determinación.

8.33 En una determinada universidad, se ha realizado un estudio para analizar la relación existente
entre la edad (en años) de los equipos informáticos (X) y el número anual de averías de los
mismos (Y ). Los datos obtenidos fueron los siguientes:
P P 2 P P 2 P
n = 36 xi = 180 xi = 3204 yi = 18 yi = 10:6 xi yi = 147:6
(a) Estimar la regresión lineal del número anual de averías con respecto a la edad de los
equipos.
(b) ¿Existe evidencia muestral de que el número de averías de los equipos informáticos
depende linealmente de la edad de los mismos? Justi…car la respuesta.

8.34 Con el objetivo de determinar si la duración de las llamadas realizadas a través de una
operadora de telefonía móvil virtual (Y ) está relacionada con el número de llamadas realizadas
en las 72 horas anteriores (X), se han recopilado los siguientes datos:
P P P P P
n = 62; xi = 967:2; x2i = 15097:92; yi = 1091:2; yi2 = 19215:72; xi yi = 17032:32
(a) Estimar la regresión lineal de la duración de las llamadas con respecto al número de
llamadas realizadas en las 72 horas anteriores. Interpretar el signi…cado de la estimación
del intercepto en este problema.
(b) Calcular un IC del 90 % para la pendiente de la regresión lineal.
(c) ¿Existe evidencia muestral de que la duración de las llamadas depende linealmente del
número de llamadas realizadas en las 72 horas anteriores? Justi…car la respuesta.
(d) Calcular una estimación del error estándar del modelo.
(e) Calcular un IC del 95 % para la duración media de una llamada de un cliente que ha
realizado 15 llamadas en las 72 horas anteriores.
(f) Calcular un intervalo de predicción del 95 % para la duración de una llamada futura si
el cliente realizó 15 llamadas en las 72 horas anteriores.
(g) Calcular e interpretar el coe…ciente de determinación.

8.35 Se ha realizado un estudio para conocer si existe una relación entre la renta familiar disponible
(en miles de euros), X, y el consumo en telefonía móvil mensual de las familias españolas (en
euros), Y . Los datos recogidos son los siguientes:
P P P P P
n = 52; xi = 62:4; x2i = 89:88; yi = 6448; yi2 = 799952; xi yi = 7812:6
(a) Estimar la regresión lineal del consumo en telefonía móvil mensual con respecto a la
renta familiar disponible.
(b) ¿Existe evidencia muestral de que el consumo mensual en telefonía móvil depende li-
nealmente de la renta familiar disponible? Justi…car la respuesta.
(c) Calcular un IC del 90 % para el consumo mensual medio en telefonía móvil de las familias
que tienen una renta disponible de 1600 euros.
(d) Calcular un intervalo de predicción del 90 % para el consumo futuro en telefonía móvil
cuando la renta familiar disponible es de 1800 euros.
(e) Calcular e interpretar el coe…ciente de determinación. Calcular también el coe…ciente de
determinación ajustado.
92 Estadística (E.I.I. de Valladolid, Curso 2019/20)

Figura 8.1 Grá…co asociado al Ejercicio 8.25

Figura 8.2 Grá…co asociado al Ejercicio 8.26

También podría gustarte