Documentos de Académico
Documentos de Profesional
Documentos de Cultura
iii
ÍNDICE GENERAL
3. Probabilidad 67
3.1. Técnicas de recuento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2. Espacios muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.3. Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.4. Probabilidad condicionada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.5. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.6. Cuestionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.6.1. Cuestionario Tema3: 16 de Abril 2018. . . . . . . . . . . . . . . . . . . . . . . . . 73
3.6.2. Cuestionario Tema3: 1 de Abril 2019. Modelo A. . . . . . . . . . . . . . . . . . . . 75
3.6.3. Cuestionario Tema3: 1 de Abril 2019. Modelo B. . . . . . . . . . . . . . . . . . . . 77
3.6.4. Cuestionario Tema3: 4 de Abril 2019. Modelo C. . . . . . . . . . . . . . . . . . . . 79
3.6.5. Cuestionario Tema3: 4 de Abril 2019. Modelo D. . . . . . . . . . . . . . . . . . . . 81
iv
Estadı́stica
C. Formulario 149
Profesores de la asignatura:
Los profesores de la asignatura:
David Romero: pantaleon.romero@uchceu.es
Marı́a Jovanı́: maria.jovani@uchceu.es
1
ÍNDICE GENERAL
2
Capı́tulo 1
Ejemplo 1.1. Algunas descripciones de algunas poblaciones en las que se consideran muestras de algunos
individuos para realizar estudios estadı́sticos.
1. Todos los votantes inscritos en un paı́s cuando nuestro objeto de estudio son los resultados de las
próximas elecciones
2. Todas las familias que viven en una ciudad.
3. Todas las reclamaciones que recibe en un año dado una compañı́a de seguros médicos.
4. Todos los peces que habitan en un rı́o cuando el objeto es estudiar si la contaminación está afectando
a los peces del rı́o.
El muestreo aleatorio simple es un método que se emplea para seleccionar una muestra de n objetos
de una población en el que cada miembro de la población se elige estrictamente al azar, cada miembro
de la población se elige con la misma probabilidad y todas las muestras posibles de un tamaño dado, n,
tienen la misma probabilidad de ser seleccionadas. La muestra resultante se denomina muestra aleatoria.
3
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Se necesita estudiar estadı́stica no para hacer afirmaciones sobre la muestra sino, para extraer con-
clusiones sobre la población en general. Por ejemplo, cuando se encuesta a un conjunto de votantes a la
salida de un colegio electoral, el objetivo es predecir qué candidato obtendrá más votos. La estadı́stica es
el estudio de cómo se toman decisiones sobre la población cuando la información procede de una muestra.
Cualitativas Son las variables que expresan distintas cualidades, que no pueden ser medidas con núme-
ros. Dentro de ellas podemos distinguir:
Nominal Presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo,
si a un jugador de baloncesto se le asigna el número “20” y a otro el número “10”, no se extrae
la conclusión que uno sea el doble mejor que el otro. Otro ejemplo son estado civil, género,
nacionalidad, . . . Si se asignan números para codificar estas respuestas, estos no determinan
ningún orden.
Ordinales La variable puede tomar distintos valores ordenados siguiendo una escala establecida ,
por ejemplo, la valoración de satisfacción con el servicio del comedor de la universidad: (1: muy
insatisfecho, 2: moderadamente insatisfecho, 3: ninguna opinión, 4: moderadamente satisfecho,
5: muy satisfecho).
Discreta es aquella que puede tener un número finito de valores o en el caso de ser infinito,
al menos, que sea posible contarlos. Sin embargo, el tipo más frecuente es el que produce
una respuesta que proviene de un proceso de recuento. Por ejemplo, el número de alumnos
matriculados en una clase o el número de hermanos que tiene cada individuo toma valores
aislados, es decir, no admite valores intermedios entre dos valores especı́ficos. Por ejemplo: El
número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Continua es aquella que puede tomar cualquier valor de un intervalo dado de números reales y
normalmente proviene de un proceso de medición (no de recuento). Por ejemplo, la altura, el
peso, el tiempo, la distancia o la temperatura.
4
Estadı́stica
n 1 100
Totales n 1 100
a primera columna (llamada clases o grupos) que contiene todas las posibles respuestas de dicha variable.
Las columnas siguientes representan la siguiente información:
Frecuencia absoluta Es el número de veces que aparece un determinado valor de la variable. Se repre-
senta por fi . En algunos libros de texto nos la encontraremos representada por ni .
Frecuencia absoluta acumulada Es la suma de la frecuencia absoluta de un valor de la variable con
todos los anteriores. Se representa por Fi .
Frecuencia relativa Es el cociente entre la frecuencia absoluta y el tamaño de la muestra n. Se re-
presenta por hi . Al multiplicarla por 100obtenemos el porcentaje de individuos que presentan esta
caracterı́stica y que denotamos por hi %.
Frecuencia relativa acumulada Es la suma de la frecuencia relativa de un valor de la variable con to-
dos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta acumulada
y el número total de datos. Se representa por Hi .
Por último, la tabla concluye con las frecuencias relativas y relativas acumuladas en tantos por cien (hi %
y Hi %).
Ejemplo 1.3. En un banco se considera una muestra aleatoria de 50 clientes y se le pregunta sobre el
número de tarjetas de créditos.
alumno 1 2 3 4 ........ 48 49 50
nº de tarjetas de crédito 3 0 1 0 ........ 0 2 1
5
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
nº de tarjetas fi Fi hi Hi hi % Hi %
0 21 21 0.42 0.42 42 42
1 8 29 0.16 0.58 16 58
2 10 39 0.20 0.78 20 78
3 4 43 0.08 0.86 8 86
4 6 49 0.12 0.98 12 98
5 1 50 0.02 1 2 100
Totales 50 1 100
En cuántos intervalos distribuiremos los datos (clases o grupos). Para lo que usaremos el Cuadro1.1
De qué amplitud deben ser los intervalos para ello tenga en cuenta las siguientes reglas:
Tanto k como w deben redondearse al alza, posiblemente al siguiente número entero mayor.
3. Los intervalos (clases) deben ser inclusivos y no solaparse.
Cuadro 1.1: Número de intervalos a dividir la muestra para una variable cuantitativa
En definitiva la tabla de frecuencias tendrı́a una estructura similar a la de una variable cualitativa
sólo que con una columna más, que recogerı́a el punto medio de los intervalos. Esta columna recibe el
nombre de marca de clase (xi ).
clases xi fi Fi hi Hi hi % Hi %
n 1 100
Totales n 1 100
6
Estadı́stica
Ejemplo 1.4. Se desea estudiar el ı́ndice de obesidad de los jóvenes de entre 18 y 25 años. Para ello se
extrae una muestra representativa de la población de tamaño 500 y se anota el peso de cada individuo.
La variable de estudio es una variable cuantitativa continua. Como el tamaño muestral es n = 500,
deberı́amos distribuir los datos entre 8 y 10 intervalos. En nuestro caso vamos a considerar 10 intervalos.
Imaginemos que la persona con menor peso ha sido un individuo con 42,7 Kg. y la persona con mayor
peso pesa 112,5 Kg. Redondeando, consideramos que el rango de peso oscila entre 40 y 120 Kg. Ası́, la
amplitud de los intervalos serı́a:
120 − 40
w= =8
10
peso (Kg.) xi fi Fi hi Hi hi % Hi %
[40, 48[ 44 26 26 0.052 0.052 5.2 5.2
[48, 56[ 52 200 226 0.400 0.452 40 45.2
[56, 64[ 60 150 376 0.300 0.752 30 75.2
[64, 72[ 68 50 426 0.100 0.852 10 85.2
[72, 80[ 76 20 446 0.040 0.892 4 89.2
[80, 88[ 84 21 467 0.042 0.934 4.2 93.4
[88, 96[ 92 20 487 0.040 0.974 4 97.4
[96, 104[ 100 10 497 0.020 0.994 2 99.4
[104, 112[ 108 0 497 0 0.994 0 99.4
[112, 120] 116 3 500 0.006 1 0.6 100
Totales 500 1 100
1.5.1. Media
La media poblacional, µ, es un parámetro que viene dado por:
N
X
xi
i=1 x1 + x2 + . . . + xN
µ= = ,
N N
donde N es el tamaño de la población. ¡Cuidado: La media de la población es habitualmente desco-
nocida. Habitualmente se aproxima por la media muestral, que veremos a continuación.
Si el conjunto de datos procede de una muestra de tamaño n, entonces la media muestral, x, es un
estadı́stico que viene dado por:
7
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
n
X
xi
i=1 x1 + x2 + . . . + xn
x= = ,
n n
1.5.2. Mediana
La mediana es la observación que ocupa el lugar central de un conjunto de observaciones ordenadas
en sentido ascendente. Se calcula distinguiendo según el tamaño muestral sea par o impar.
Si el tamaño muestral, n, impar, la mediana es la observación que se encuentra en el centro.
Si el tamaño de la muestra, n es un número par, la mediana es la media de las dos observaciones
que se encuentran en el centro.
1.5.3. Moda
La moda, si existe, es el valor que aparece con más frecuencia.
1.5.4. Reflexiones:
¿Cuál es la mejor medida para describir la tendencia central de los datos: la media, la mediana o la
moda?. Depende del contexto. Uno de los factores que influye en la decisión es el tipo de datos, cualitativos,
cuantitativos discretos o cuantitativos continuos. La media generalmente es la medida preferida para
describir datos continuos, pero no datos cualitativos.
Ejemplo 1.5. Si en una encuesta con posibles respuestas: 1(totalmente en desacuerdo), 2(moderada-
mente en desacuerdo), 3(ninguna opinión), 4(moderadamente de acuerdo) y 5(totalmente de acuerdo),
dos personas contestan 1 y 5. La media, 3, no describirı́a la realidad.
Ejemplo 1.6. Si estudiamos la variable sexo: 1(hombre) y 2(mujer), la media de la muestra 1,1,2,2,2
es 1.6 que no ofrece una buena información, sin embargo la moda 2 indica que hay más mujeres que
hombres.
Luego los datos cualitativos se describen, generalmente, mejor mediante la mediana y la moda.
El director de unos grandes almacenes tiene interés en saber cuántas reclamaciones recibe el depar-
tamento de atención al cliente sobre la calidad de los aparatos eléctricos que venden. Los registros de un
periodo de 5 semanas muestran el siguiente número de reclamaciones:
13, 15, 8, 16 y 8
1. Calcula el número medio de reclamaciones semanales.
2. Calcula el número mediano de reclamaciones semanales.
3. Calcula la moda.
13 + 15 + 8 + 16 + 8
1. x = = 12.
5
2. Para calcular la mediana, se ordenan los datos de menor a mayor (8, 8, 13, 15 y 16). Como hay 5
datos la mediana será el dato que está en la posición tercera. Me = 13.
3. Mo = 8.
8
Estadı́stica
(1 − γ) · x(k) + γ · x(k+1)
donde:
k es el mayor entero que es menor o igual que (n − 1) · 100p
+ 1.
γ es la parte decimal de (n − 1) · 100 + 1, es decir, γ = (n − 1) · p + 1 − k
p
Ejercicio 1.1. Los siguientes datos reflejan el número de llamadas diarias recibidas por un servicio de
comida a domicilio:
78 64 62 53 83 51 51 58 45 51 69 47 54 45 62 67 69 51 51 64 45 72 58 74 54 42 67 59 57 78
Percentil al 20 %: Calculamos el valor que nos sirve para determinar la posición del percentil:
p
(n − 1) · + 1 = 29 · 0,2 + 1 = 6,8
100
luego, la parte entera es k = 6 y la decimal γ = 0,8. Con estos números calculamos el 20-percentil
9
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
P45 = (1 − γ) · x(k) + γ · x(k+1) = (1 − 0,05) · x(14) + 0,05 · x(15) = 0,95 · 57 + 0,05 · 58 = 57,05
P70 = (1 − γ) · x(k) + γ · x(k+1) = (1 − 0,30) · x(21) + 0,30 · x(22) = 0,70 · 64 + 0,30 · 67 = 64,9
El rango intercuartı́lico (RIC) mide la dispersión que hay en el 50 por ciento central de los datos; es
la diferencia entre la observación Q3 , tercer cuartil o percentil 75 y la observación Q1 , primer cuartil o
percentil 25.
RIC=Q3 − Q1
donde Q3 y Q1 son los percentiles 75 y 25 calculados según la forma vista en la sección de medidas
de localización. Recuerde que el primer paso es tener los datos ordenados en sentido ascendente.
Aunque el rango y el rango intercuartı́lico miden la dispersión de los dato, ambas medias sólo tiene en
cuenta dos de los valores de los datos. Serı́a deseable disponer de una medida que promedie la distancia
de cada uno de los valores y la media.
10
Estadı́stica
Ejercicio 1.2. Se considera una muestra aleatoria de ocho empresas estadounidenses. Los beneficios
por acción, de cada empresa, han experimentado este año las siguientes variaciones porcentuales en
comparación con el año pasado:
0% 0% 8.1 % 13.6 % 19.4 % 20.7 % 10.0 % 14.2 %
Solución: La variación porcentual media de los beneficios por acción de esta muestra es:
n
1X 0 + 0 + 8,1 + ... + 14,2
x= xi = =10.75, es decir 10.75 %
n i=1 8
Para calcular la variación porcentual mediana de los beneficios por acción se ordenan los valores de
forma ascendente:
Me= 10,0+13,6
2 11.8 por ciento.
Mo=0 %. Fijaros que la tasa porcentual modal no es un buen representante del centro de estos datos.
Para calcular el tercer cuartil se calcula la posición (n − 1)p/100 + 1 = (8 − 1)75/100 + 1 = 6,25, con
lo que k = 6 y γ = 0,25, con lo que Q1 = (1 − 0,25)x(6) + 0,25x(7) = 0,75 · 14,2 + 0,25 · 19,4 = 15,5.
Ejercicio 1.3. Se ha analizado una muestra de 20 lotes de un producto quı́mico para hallar la concen-
tración de impurezas. Los resultados obtenidos son:
11
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Solución: Para llevar a cabo los cálculos construiremos una tabla de frecuencias:
Clase xi fi xi fi (xi − x) (xi − x)2 fi (xi − x)2
0<2 1 2 2 -4.6 21.16 42.32
2<4 3 3 9 -2.6 6.76 20.28
4<6 5 6 30 -0.6 0.36 2.16
6<8 7 5 35 1.4 1.96 9.8
8 < 10 9 4 36 3.4 11.56 46.24
Suma 20 112 120.8
Medidas de centralización:
Pk
n= i=1 fi = 20
Pk
xi fi
x= i=1
n = 112
20 = 5,6
Para calcular la mediana se calcula la posición del dato central (pos(Q2 )=0.5(n+1)=10.5). Como n
es par se toman los datos que están en la posición 10 y 11 y se calcula su media. M e ≈ 5
Moda: Mo=5
Para calcular el primer cuartil se calcula la estimación de posición (n − 1)p/100 + 1 = (20 − 1)25/100 +
1 = 5,75 con lo que k = 5 y γ = 0,75, con lo que Q1 = (1 − 0,75)x(5) + 0,75x(6) = 0,25 · 3 + 0,75 · 5 = 4,5.
Medidas de dispersión:
rango= 9 − 1 = 8.
12
Estadı́stica
Ejemplo 1.7. El Orlando Sentinel enumera anualmente las principales empresas de Florida central. La
siguiente tabla muestra la distribución de frecuencias de las cinco empresas que tenı́an el mayor número
de asalariados en esta zona en 2003.
Empresas (clases) Nº de asalariados (fi ) (hi %)
Disney World 51600 4572
Florida Hospital 19283 17.08
Publix Supermarkets Inc. 14995 13.28
Wal-Mart Stores Ind. 14995 13.28
Universal Orlando 12000 10.63
Disney World
50000
40000
Nº de asalariados
30000
20000
Florida Hospital
Universal Orlando
10000
Wal−Mart Stores
Publix Supermark.
0
Empresas
Figura 1.2: Diversas formas de representar datos del ejemplo 1.7. A la izquierda en el gráfico de barras se
muestra el número de asalariados en las cinco principales empresas de Florida en 2003. A la izquierda el
gráfico de tarta hace énfasis en el porcentaje de asalariados en las cinco principales empresas de Florida
en el 2003.
13
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Una ojiva, llamada a veces gráfico de frecuencia acumuladas, es una lı́nea que conecta puntos que son
el porcentaje acumulado de las observaciones situadas por debajo del lı́mite superior de cada intervalo en
una distribución de frecuencias acumuladas.
Ejemplo 1.8. Se considera la siguiente tabla de frecuencias sobre el uso del teléfono móvil (en minutos)
de una muestra de 110 observaciones. Pare estos datos se muestra en la Figura 1.3 su histograma y su
ojiva.
14
Estadı́stica
● ●
5 10 15 20 25 30 35 40
100
30
80
25
20
% acumulado
60
frecuencias
15
40
10
20
5
0
220 240 260 280 300 230 240 250 260 270 280 290 300
(b) Histograma del ejemplo 1.8. (c) Ojiva del ejemplo 1.8.
15
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Ejercicio 1.6. De los 100 trabajadores de una empresa han llegado a trabajar 10 minutos pronto 23,
5 minutos pronto 15, en su hora 22, 5 minutos tarde 17, y el resto 10 minutos tarde. Forma la tabla de
frecuencias absolutas y relativas.
Ejercicio 1.7. En Villanueva de Arriba el 40 % de las familias tienen un solo hijo, el 35 % dos hijos, el
11 % ninguno y el resto más de dos. Sabiendo que en el pueblo viven 1100 familias, forma la tabla de
frecuencias relativas, absolutas y acumuladas.
Ejercicio 1.8. Se realiza un trabajo en la asignatura de lengua en una clase formada por 40 alumnos. 2
alumnos realizan el trabajo en un folio, 5 en 2 folios, 6 en 3 folios, y el resto en 4 folios. Forma la tabla
de frecuencias absolutas y relativas.¿Crees que el profesor ha recomendado un número determinado de
folios?.
Ejercicio 1.9. En una universidad se ha realizado una encuesta a 200 alumnos de la licenciatura de
documentación. El 32 % afirma que está muy contento con la universidad, el 40 % está contento, el 23 %
no está contento, y el resto muy descontento. Forma la tabla de frecuencias absolutas, relativas y absolutas,
y explica si crees que la universidad lo está haciendo bien.
Ejercicio 1.10. El número de hermanos de 40 alumnos es:
3 4 2 3 4 3 4 4 4 2 3 4 4 3 4 1 2 3 5 4
2 2 2 5 3 4 4 6 2 6 4 3 2 1 2 3 2 4 3 1
16
Estadı́stica
Ejercicio 1.11. Las horas de sol registradas en el mes de enero de 2008 en 50 estaciones meteorológicas
es:
83 82 78 72 107 93 72 85 98 71 76 75
83 72 126 102 67 112 99 155 118 150 129 119 148
181 151 167 156 180 173 149 80 131 121 110 200
162 214 176 186 187 186 141 212 186 199 198 219 200
Construye una tabla de frecuencias completa. Calcula los percentiles al 20 %,40 %,60 %, el Rango In-
tercuartı́lico y los cuartiles Q1 , Q2 , Q3
Ejercicio 1.12. Diez economistas recibieron el encargo de predecir el crecimiento porcentual que expe-
rimentar el ı́ndice de precios de consumo para el próximo año. Sus predicciones fueron
3.6 3.1 3.9 3.7 3.5 3.7 3.4 3.0 3.7 3.4
Ejercicio 1.13. Una cadena de grandes almacenes eligió aleatoriamente 10 establecimientos situados en
una región. Tras examinar los datos de ventas, observó que ese año se habı́an conseguido en las Navidades
los siguientes aumentos porcentuales de las ventas en dólares con respecto al año anterior:
10.2 3,1 5.9, 7.0 3.7 2.9 6.8 7.3 8.2 4.3
Ejercicio 1.14. Los porcentajes de la remuneración total correspondientes al pago de pluses de una
muestra de 12 altos ejecutivos son los siguientes:
15.8 17.3 28.4 18.2 15.0 24.7 13.1 10.2 29.3 34.7 16.9 25.3
c. Interpreta el percentil al 40 % y 60 %
17
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Ejercicio 1.15. Un fabricante de radios portátiles obtuvo una muestra de 50 radios de la producción
de una semana. Las radios se examinaron minuciosamente y el número de defectos encontrados fue el
siguiente:
Número de defectos 0 1 2 3
Número de radios 12 15 17 6
Con ayuda de una tabla de frecuencias haz un análisis descriptivo de los datos completo. Interpreta
y representa el diagrama de cajas asociado.
Ejercicio 1.16. Se ha pedido a una muestra de 20 analistas financieros que hagan una predicción de los
beneficios por acción que obtendrá una empresa el próximo año. La tabla adjunta resume los datos:
Predicción ($ por acción) [9.95,10.45[ [10.45,10.95[ [10.95,11.45[ [11.45,11.95[ [11.95,12.45]
Número de analistas 2 8 6 3 1
Ejercicio 1.17. Comestibles Gilera anuncia que los clientes tienen que esperar menos de 1 minuto para
pagar si utilizan la caja rápida. Los tiempos de espera (en segundos) de una muestra de 25 clientes son:
11 12 14 16 17 18 18 19 19 21 22 22 22
24 26 28 29 29 30 31 32 33 34 40 42
Calcula el resumen de los cinco números (máximo,mı́nimo,Q1 ,Q2 ,Q3 ).
Ejercicio 1.18. La demanda diaria, en unidades de un producto, durante 30 dı́as de trabajo es:
38 35 76 58 48 59
67 63 33 69 53 51
28 25 36 32 61 57
49 78 48 42 72 52
47 66 58 44 44 56
A 1 2 3 4 5 6
B 1 1 1 6 6 6
C -13 2 3 4 5 20
Calcular la media y la varianza para cada conjunto de datos. ¿Qué se puede concluir?. Representa e
interpreta el diagrama de cajas.
18
Estadı́stica
Ejercicio 1.20. La siguiente tabla muestra las ventas, en miles de dolares, de 20 vendedores de una
compañı́a de ordenadores.
Ejercicio 1.25. A un grupo de 30 personas se les ha tomado el número de pulsaciones por minuto (ritmo
cardı́aco) obteniéndose los siguientes resultados:
87 85 61 51 64 75 80 70 69 82
80 79 82 74 92 76 72 73 63 65
67 71 88 76 68 73 70 76 71 86
Representa gráficamente esta distribución, usando un diagrama de cajas, barras y de sectores.
19
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
1.11. Cuestionarios
1.11.1. Cuestionario Tema1 y Tema2: 12 de Marzo 2018.
Cuestión 1.1
Completa la siguiente tabla relativa a la marca que usa un grupo de alumnos del CEU de teléfono móvil.
Marca fi hi hi %
Apple 16 %
Samsung 12 0,48
LG 3
Sony 20 %
Shen Wai 0,04
Total
20
Estadı́stica
Cuestión 1.5
¿Qué medida de las siguientes NO está relacionada con una medida de tendencia central.
a) Media muestral.
b) Moda.
c) Varianza.
d) Mediana.
En una empresa de congelados, la demanda diaria, en lotes de producto, durante 30 dı́as de trabajo es:
38, 35, 76, 58, 48, 59, 67, 63, 33, 69
53, 51, 28, 25, 36, 32, 61, 57, 49, 78
48, 42, 72, 52, 47, 66, 58, 44, 44, 56
Dibuja el diagrama de cajas de esa distribución de datos:
Cuestión 1.6
21
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
En la tabla se recoge el éxito en un examen de los alumnos dependiendo del tiempo dedicado al estudio
···=
Cuestión 1.8
¿Cuál es la frecuencia de aprobar el examen condicionado a que estudio poco tiempo el examen?
···=
Cuestión 1.9
···=
Los siguientes datos se refieren a la demanda de un producto (en miles de unidades) y su precio (en
centavos) en cinco mercados diferentes:
22
Estadı́stica
Cuestión 1.10
¿Cuál es el pronóstico para estimar la demanda cuando el precio del producto es de 12 centavos?
a) 2352
b) 85,89
c) 81,86
d) Ninguna de las anteriores.
23
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Cuestión 2.1
Dada las siguientes variables, clasifı́calas respectivamente de forma correcta: Número de preguntas acertadas
en un test, gravedad de un infarto (leve, moderado, fuerte) y grupo sanguı́neo
a) Ordinal, nominal y continua
b) Discreta, ordinal y nominal
c) Continua, nominal y ordinal
d) Ninguna de las anteriores.
Cuestión 2.2
Se ha recogido información sobre el grado de satisfacción de los clientes de una determinada sucursal bancaria.
Las respuestas se han codificado según los siguientes códigos:
0: muy desfavorable, 1:desfavorable, 2:favorable y 3: muy favorable.
Se ha preguntado a un total de 50 clientes y las respuestas han sido las siguientes:
Cuestión 2.3
01301123003332120302100232221122030220330301222021
¿Qué porcentaje de clientes han tenido sólo un grado de satisfacción favorable con el servicio?
a) 32 %
b) 28 %
c) 22 %
d) Ninguna de las anteriores.
Los siguientes datos corresponden al número de llamadas de teléfono registradas en una empresa durante los
10 dı́as de preparación de material para una feria de muestras:
Cuestión 2.4
24
Estadı́stica
Cuestión 2.5
En años recientes, como consecuencia de las bajas tasas de interés, muchos propietarios de casas refi-
nanciarion sus créditos. Linda Lahey es agente hipotecaria de Down River Federal Savings and Loan. A
continuación aparecen las sumas refinanciadas de 20 préstamos a los que les dio curso la semana pasada.
Los datos se expresan en miles de dólares y se encuentran ordenados de menor a mayor.
59,2, 59,5, 61,6, 65,5, 66,6, 72,9, 74,8, 77,3, 79,2, 83,7, 85,6, 85,8, 86,6, 87,0, 87,1, 90,2, 93,3, 98,6,
100,2, 100,7.
Cuestión 2.7
Q1 =
Cuestión 2.8
Me =
25
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Cuestión 2.9
Q3 =
Cuestión 2.10
Se ha realizado una encuesta en 30 hogares en la que se pregunta el número de individuos que conviven en
el domicilio habitualmente. Las respuestas obtenidas son las siguientes:
Cuestión 3.1
4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 6, 6, 2, 3, 3, 3, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
¿Qué porcentaje de hogares tienen como mucho 4 individuos en el hogar?
a) 73,33 %
b) 16,67 %
c) 56,67 %
d) Ninguna de las anteriores es correcta.
26
Estadı́stica
Cuestión 3.2
Si queremos estudiar la variabilidad o dispersión de las observaciones respecto a media, ¿qué descriptivo serı́a
el adecuado?
a) La mediana
b) La desviación tı́pica
c) El primer y el tercer cuartil
d) Ninguna de las anteriores.
Cuestión 3.3
Dada las siguientes variables, clasifı́calas respectivamente de forma correcta: Gravedad de un infarto (leve,
moderado, fuerte), grupo sanguı́neo y número de preguntas acertadas en un test
a) Ordinal, nominal y continua
b) Continua, nominal y ordinal
c) Ordinal y nominal y discreta.
d) Ninguna de las anteriores.
Verizon estudia la cantidad de minutos que consumen sus clientes que cuentan con un plan tarifario para
teléfono celular. Una muestra aleatoria de 12 clientes arroja la siguiente cantidad de minutos empleados del
mes anterior:
Cuestión 3.4
90, 77, 94, 89, 119, 112, 91, 110, 92, 100, 113, 83
¿Cuál de los siguientes valores corresponde a la media muestral?.
a) 97,5
b) 98,82
c) 106,36
d) Ningua de las anteriores.
Una muestra de familias que ha contratado los servicios de la United Bell Phone Company reveló que cada
familia recibió la siguiente cantidad de llamadas la semana pasada.
Cuestión 3.5
52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 5
¿Cuál de los siguientes datos corresponde a la varianza muestral?. (la media redondearla a dos decimales).
a) 188,25
b) 154,56
c) 164,86
d) Ninguna de las anteriores es correcta.
27
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Una muestra de familias que ha contratado los servicios de la United Bell Phone Company reveló que cada
familia recibió la siguiente cantidad de llamadas la semana pasada.
Cuestión 3.6
52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 5
¿Cuál de los siguientes datos corresponde a la desviación muestral?. (la media redondearla a dos decimales).
a) 12, 84
b) 13, 72
c) 12, 43
d) Ninguna de las anteriores es correcta.
Se han tomado muestras a 20 viviendas del nivel de cobre en el agua corriente, obteniendo los siguientes
resultados en mg/l:
0.10 0.30 0.34 0.36 0.42 0.42 0.45 0.48
0.50 0.52 0.55 0.58 0.62 0.63 0.64 0.65
0.65 0.66 0.69 0.70
Cuestión 3.7
Q1 =
Cuestión 3.8
Me =
Cuestión 3.9
Q3 =
28
Estadı́stica
29
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Una entidad financiera está haciendo un estudio sobre la inversión, en miles de euros, que realizan las familias
para comprar su primera vivienda. Para ello, ha seleccionado de forma aleatoria una muestra de 200 familias.
Inversión montearia fi
[0, 50[ 10
[50, 100[ 20
Los datos obtenidos se muestran en la siguiente tabla: [100, 150[ 70 ¿Cuál es la variable
[150, 200[ 50
[200, 250[ 30
Cuestión 4.1
[250, 300[ 20
estudiada?
a) tipos de familia que invierten en una primera vivienda.
b) cantidad de dinero que invierten las familias en una primera vivienda
c) cantidad de dinero que las familias estarı́an dispuestas a invertir
d) Ninguna de las anteriores.
Cuestión 4.2
Se han tomado muestras a 20 viviendas del nivel de cobre en el agua corriente, obteniendo los siguientes
resultados en mg/l:
0.72 0.73 0.74 0.74 0.75 0.76 0.77 0.78
0.81 0.83 0.85 0.86 0.88 0.9 0.94 0.98
1.04 1.12 1.16 1.24
Cuestión 4.4
30
Estadı́stica
Cuestión 4.5
————————————
Cuestión 4.7
Q1 =
Cuestión 4.8
Me =
Cuestión 4.9
Q3 =
31
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
32
Estadı́stica
Cuestión 5.1
Clasifica los siguientes caracteres estadı́sticos según sean cualitativos, variables discretas o variables continuas:
(Marca de los coches, peso de los coches, número de coches vendidos de las diferentes marcas) respectivamente:
a) Discreta, Continua, cualitativo.
b) Cualitativo, continua, discreta.
c) Continua, Discreta, cualitativo.
d) Ninguna de las anteriores es correcta.
El número de veces que han ido al cine en el último mes los alumnos de una clase es:
Cuestión 5.2
2, 3, 0, 1, 5, 3, 2, 1, 0, 0, 2, 1, 2, 3, 5, 0, 5, 4, 1, 1, 1, 2, 0, 1, 2
¿Qué porcentaje de alumnos de dicha clase fueron como mucho tres veces al cine?’
a) 21 %
b) 12 %
c) 84 %
d) Ninguna de las respuestas anteriores es correcta.
Cuestión 5.3
Los siguientes datos corresponden al número de llamadas de teléfono registradas en una empresa durante los
20 dı́as de preparación de material para una feria de muestras:
Cuestión 5.4
15 15 15 15 15 16 16 16 17 20
¿Cuál es el valor de la moda?
20 20 21 21 22 22 22 25 25 25
a) 15
b) 20
c) 19,5
d) Ninguna de las anteriores.
Cuestión 5.5
33
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Cuestión 5.6
Q1 =
Cuestión 5.8
Me =
Cuestión 5.9
Q3 =
34
Estadı́stica
35
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
36
Capı́tulo 2
En el capı́tulo anterior se han estudiado medidas y gráficos para describir una única variable. Sin
embargo, cuando se llevan a cabo estudios empresariales y económicos, se dispone de información relativa
a distintas variables. En este caso no sólo es necesario describir cada una de las variables por separado
sino detectar posibles relaciones entre las variables aprovechando la información conjunta disponible. Este
capı́tulo se centra en la descripción de las relaciones entre dos variables. Ejemplos de relaciones entre dos
variables serán: ¿cómo varı́a la mortalidad infantil en los paı́ses en vı́as de desarrollo cuando aumenta la
renta per cápita?, ¿cómo aumenta la publicidad las ventas?, ¿cuánto varı́a la cantidad vendida cuando
varı́a el precio?, etc...
X\Y y1 y2 .... yc
x1 f1,1 f1,2 f1,c
x2 f2,1 f2,2 f2,c
Ejemplo 2.1 (X e Y variables cualitativas). El medallero de los Juegos Olı́mpicos de Pekı́n 2008 de
los cinco pases que obtuvieron más medallas de oro fueron:
37
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
Edad \ C. Agresiva 0 1 2 3 4 5
[2,4[ 1
[4,6[ 2 2
[6,8[ 3 3 1 2
[8,10] 2 3 1
Ejemplo 2.3 (X e Y variables cuantitativas). Un estudio nutricional sobre una muestra de 20 jóvenes
revela los siguientes datos sobre su estatura y su peso.
Estatura 164 175 165 170 178 157 167 172 177 160
Peso 53 62 48 60 52 63 54 60 55 70
Estatura 168 160 164 174 170 182 161 171 173 193
Peso 63 51 50 80 65 63 60 62 63 86
38
Estadı́stica
Ejemplo 2.4. Cálculo de las distribuciones marginales de las variables del ejemplo 2.3:
¿Qué tanto por ciento de los alumnos de pelo moreno son chicas?.
Solución: La pregunta efectuada, corresponde a una distribución condicionada. Primero calculamos las
distribiciones marginales. La condición en este caso es ser moreno, de tal forma que nos restringimos a la
primera columna de la tabla en la que participan 9 alumnos y calculamos
5
fchica|morena = = 0,56
9
39
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
Ejemplo 1 Ejemplo 2
100 140 180 220
50
40
Y
30
20
30 40 50 60 30 40 50 60
X X
Ejemplo 3 Ejemplo 4
6000
50
4000
40
Y
Y
30
2000
20
25 30 35 40 30 40 50 60
X X
Figura 2.1: Diferentes tipos de diagramas de dispersión. Ejemplo 1: Asociación lineal positiva; Ejemplo
2: Asociación lineal negativa; Ejemplo 3: Ausencia de asociación; Ejemplo 4: Asociación no lineal.
Un diagrama de dispersión es capaz de caracterizar varios aspectos de las variables que lo componen,
como por ejemplo el rango en que varı́an cada una de las variables, la posible asociación de los datos y
una indicación de los casos atı́picos.
40
Estadı́stica
2.5. Covarianza
La covarianza es una medida de asociación lineal que indica el grado de relación que existe entre dos
variables estadı́sticas. Por tanto mide el sentido de la relación lineal. Un valor positivo de la covarianza
indica una relación lineal directa o creciente, es decir, cuando los valores de una variable crecen los
valores de la otra variable también crecen y viceversa. Un valor negativo indica una relación lineal inversa
o decreciente, es decir, si una variable crece la otra decrece y viceversa.
La covarianza muestral tiene la siguiente expresión:
n
1 X
cov(X, Y ) = sXY = (xi − x)(yi − y),
n − 1 i=1
donde xi e yi son los valores observados de las variables X e Y, x e y son las medias muestrales y n
es el tamaño de la muestra.
Cuanto más cerca se encuentra r de +1 más cerca se encuentran los datos de alinearse sobre una
recta ascendente (que indica una relación lineal positiva).
Cuanto más cerca se encuentra r de −1 más cerca se encuentran los datos de alinearse sobre una
recta descendente (que indica una relación lineal negativa).
Cuando r = 0, no existe ninguna relación lineal entre X e Y , pero eso no quiere decir necesariamente
que no exista ningún tipo de relación entre las variables
Ejemplo 2.6. Una compañı́a de seguros considera que el número de vehı́culos (y) que circulan por una
determinada autopista a más de 120 km/h , puede ponerse en función del número de accidentes (x) que
ocurren en ella. Durante 5 dı́as obtuvo los siguientes resultados:
Accidentes 5 7 2 1 9
Vehı́culos 15 18 10 8 20
Solución:
n
1 X
sXY = (xi − x)(yi − y) = 17,05
n − 1 i=1
41
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
Ejercicio 2.1. Risin Hills Manufacturing Inc. desea estudiar la relación entre el número de trabajadores,
X, y el número de mesas producidas, Y , en su planta de Redwood Falls. La empresa ha tomado una
muestra aleatoria de 10 horas de producción. En la tabla se muestran las observaciones recogidas. Analiza
brevemente la relación entre el número de trabajadores y el número de mesas producidas por hora.
Solución:
n
1 X 962,4
sXY = (xi − x)(yi − y) = = 106,93
n − 1 i=1 9
42
Estadı́stica
2. El elemento de la población al que le corresponde el dato atı́pico es homogéneo con respecto a los
demás.
Si existe un error de medida conviene eliminar el dato y si el elemento es distinto de los demás por
alguna razón objetiva conviene también suprimirlo del cálculo del coeficiente de correlación.
2.0
7
1.8
6
1.6
5
4
1.4
3
1.2
2
1.0
1
1 2 3 4 5 6 2 4 6 8 10
Ejemplo 1 Ejemplo2
En el ejemplo 2 de la Figura 2.2 se muestra otro caso de heterogeneidad. En este caso el gráfico indica
que la relación entre las variables es distinta para los elementos de las dos zonas de puntos y si calculamos
un coeficiente de correlación para todos los datos obtendremos un valor muy pequeño. Sin embargo, si
obtenemos los coeficientes para los dos grupos de puntos separadamente, encontraremos que dentro de
cada grupo hay una relación fuerte.
La conclusión fundamental de este análisis es que un coeficiente de correlación es el resumen de
la relación presente en el gráfico de dispersión. Conviene, pues, asegurarse mirando este gráfico que el
coeficiente es un buen resumen del mismo. Tratar de interpretar un coeficiente de correlación sin haber
visto previamente el gráfico de las variables puede ser peligroso.
43
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
Ejemplo 2.7. Un estudio muestra que hay una correlación negativa entre la ansiedad de un estudiante
antes de una prueba y la nota que obtiene el estudiante en una prueba. Pero no podemos decir que la
ansiedad causa una nota más baja en la prueba; podrı́a haber otras razones el estudiante quizá no estudió
bien, entonces aquı́ la correlación no implica causalidad.
Hay una correlación positiva entre el número de horas que que el estudiante emplea y la calificación
que obtiene. Aquı́, sı́ hay causalidad; si el estudiante pasa más tiempo estudiando, tendrá una calificación
más alta.
En este apartado estudiaremos otra manera de expresar la relación lineal entre dos variables continuas: la
recta de regresión. Esta recta describe la forma en la que varı́a la media de una variable en función de los valores
de la otra. Las relaciones entre variables sociales son, en general, relaciones estadı́sticas, es decir, relaciones que
determinan lo que va a ocurrir en promedio.
Este método permite describir por medio de un modelo matemático el comportamiento y la probable relación
entre dos variables,ası́ como extraer inferencias que dan lugar a que la regresión lineal sea útil para:
Explicar un fenómeno
Realizar una predicción
Controlar un proceso
Supongamos que en tenemos dos variables con las que queremos describir un fenómeno. Queremos precisar la
relación matemática que existe entre las dos variables que la forman. En concreto queremos expresar mediante
una relación cómo depende una de ellas (variable dependiente) de la otra (variable independiente). Normalmente
se elige como y la variable dependiente y como x la independiente.
En aquellos casos en que el coeficiente de correlación lineal sea “cercano” a +1 o a −1, tiene sentido considerar
la ecuación de la recta que “mejor se ajusta” a la nube de puntos (recta de mı́nimos cuadrados), puesto que el
coeficiente de correlación mide la relación lineal de ambas variables. Uno de los principales usos de dicha recta será
el de predecir o estimar los valores de Y que obtendrı́amos para distintos valores de X. Estos conceptos quedarán
representados en lo que llamamos diagrama de dispersión.
Pero, ¿cuál es la recta que mejor se ajusta sobre la nube de puntos? Evidentemente, esta pregunta no tendrı́a
respuesta si no se establece un criterio de ajuste.
El concepto de recta de regresión surge de manera natural si observamos que la existencia de una relación entre
las variables permite obtener mejores predicciones de la variable dependiente cuando conocemos el valor de la
variable independiente. Consideremos, por ejemplo, que se pretende prever la estatura de una persona seleccionada
al azar de la población española conociendo la distribución de estaturas en la población. Naturalmente se desea
que la predicción sea lo mejor posible, es decir que el error que pueda cometerse al predecir sea lo más pequeño
posible. Si definimos el error de predicción por
44
Estadı́stica
Lo deseable es, escoger la predicción que condujese al menor error posible, esto se consigue a través del método
de mı́nimos cuadrados.
yb = b0 + b1 x
Esta ecuación depende de dos constantes o parámetros, b0 y b1 , que deben calcularse a partir de los datos
observados. El parámetro b1 es el más importante. Se denomina pendiente de la recta y nos dice cuánto
aumenta la media de la variable dependiente cuando la independiente aumenta en una unidad.
El parámetro b0 se denomina ordenada en el origen y representa el valor de la media de la variable
dependiente cuando la independiente es cero. En muchos problemas no tiene sentido considerar un valor cero para
x: por ejemplo, es absurdo preguntarse cuál es el valor de la estatura cuando el peso es cero.
Para hallar b0 y b1 a partir de los datos se define el error de predicción o residuo de la recta, que es el error
que cometemos al predecir cada uno de los valores observados de la variable dependiente y.
La recta se calcula imponiendo la condición de que el error promedio, definido como la raı́z cuadrada de la
suma de los cuadrados de los errores al calcular la distancia de cada punto con la recta, sea mı́nimo. Este criterio
se denomina mı́nimos cuadrados.
Pn
[yi − (b1 xi + b0 )]2
mı́n i=1
n
Como resultado de aplicar este criterio se obtiene que la pendiente b1 viene dada por la ecuación
Cov(x, y)
b1 = ,
s2x
es decir, la pendiente de la recta resulta de estandarizar la covarianza de manera que tenga las unidades apropiadas
de aumento en y por unidad de aumento x. Observemos que si la covarianza es cero también lo es la pendiente
de la recta, que es la medida básica de la asociación, ya que si b1 = 0, no hay relación entre las variables. Es
importante resaltar que la pendiente está muy relacionada con el coeficiente de correlación ya que se verifica que
sy
b1 = r
sx
El segundo parámetro, b0 , ordenada en el origen de la recta, indica su posición concreta y se calcula mediante
b0 = y − b1 x
Indica que la recta debe pasar por el punto (x,y), es decir, por el centro de los datos.
Ejemplo 2.8. Calculemos la recta de regresión a partir de las estaturas de 10 padres y la de sus hijos respecti-
vamente, expresadas en metros.
Padre (X) 1.70 1.77 1.68 1.75 1.80 1.75 1.69 1.72 1.71 1.73
Hijo (Y) 1.74 1.78 1.72 1.77 1.78 1.77 1.71 1.76 1.73 1.74
Solución:
x = 1,73 m.
y = 1,75 m
Si restamos a cada variable su media, obtenemos la siguiente tabla:
45
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
(xi − x) -0.03 0.04 -0.05 0.02 0.07 0.02 -0.04 -0.01 -0.02 0.00
(yi − y) -0.01 0.03 -0.03 0.02 0.03 0.02 -0.04 -0.01 -0.02 -0.01
Cov(x, y) 0,00078
r= = = 0,9
sx · sy 0,0358 · 0,0241
Concluimos que hay una fuerte relación lineal positiva entre las variables y que por lo tanto tiene sentido construir
una recta de regresión para predecir valores de las estaturas de los hijos en función de las estaturas de los padres.
Cov(x, y) 0,00078
b1 = = = 0,609
s2x 0,03582
46
Estadı́stica
Ejercicio 2.4. Para realizar un estudio de consumo se encuesta a una muestra de 20 personas sobre el número
de tarjetas que poseen y el número de compras semanales que hacen con ellas. Los datos obtenidos son:
N de tarjetas 0 2 3 1 2 2 3 4 2 2
N de compras semanales 0 4 1 3 2 3 3 2 4 1
N de tarjetas 1 3 4 2 2 4 3 3 1 1
N de compras semanales 4 3 1 2 3 1 1 3 2 2
Ejercicio 2.5. Indicar cuál de las dos variables en los pares siguiente es la dependiente y si la relación es positiva
o negativa.
x 2 3 4 5 6
y 3 7 8 13 14
47
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
a. sumamos 3 a la variable x.
Ejercicio 2.7. Un estudiante que busca piso ha tomado los siguientes datos de los precios de alquiler semanal y
de la superficie de los pisos en metros cuadrados.
Calcula el coeficiente de correlación entre ambas variables. ¿Podemos concluir que la relación es lineal?
Ejercicio 2.8. Una encuesta de salarios entre licenciados proporciona los siguientes datos:
Edad 28 28 32 35 38 44 49 52 58 62 66 70
Salario 2.2 2.2 3.8 4.2 4.2 5.3 7.3 6.4 6.7 5.3 6.0 5.1
Construir un diagrama de dispersión e indica si la relación parece ser lineal. Calcula el coeficiente de correlación
entre ambas variables.
Ejercicio 2.9. Una encuesta de salarios entre licenciados proporciona los datos siguiente:
Edad 28 28 32 35 38 44 49 52 58 62 66 70
Salario 2.2 2.2 3.8 4.2 4.2 5.3 7.3 6.4 6.7 5.3 6.0 5.1
Construir un diagrama de dispersión e indica si la relación parece ser lineal. Calcula el coeficiente de correlación
entre ambas variables. Ajusta una recta de regresión a la relación entre salarios y edad
Ejercicio 2.10. La tabla siguiente indica la puntuación obtenida en un test de lenguaje (x) y en otro de in-
teligencia (y) por un grupo de personas. Construir una recta de regresión para prever el resultado del test de
inteligencia conocido el resultado del test de lenguaje.
x 72 86 92 87 46 56 88 90
y 77 89 92 88 43 63 88 97
Ejercicio 2.11. La siguiente tabla indica la proporción de votos obtenidos por dos partidos polı́ticos en sucesivas
elecciones. Calcular la recta de regresión para prever el resultado del partido x conociendo el resultado del partido
y.
x 20 22 25 28 17 22 27
y 40 30 27 41 42 43 37
Ejercicio 2.12. Una juguetera ha examinado la evolución reciente de las ventas de su muñeco ”Qco”. (en millones
de euros) junto con los gastos de publicidad de ese muñeco (en millones de euros), obteniéndose los siguientes
resultados:
48
Estadı́stica
a. ¿Se puede afirmar que al aumentar los gastos en publicidad se incrementaron las ventas?. Interpreta el
resultado.
b. Estudia si será adecuado un ajuste lineal para explicar las ventas en función de los gastos. Interpreta el
resultado.
c. Calcula la recta de regresión correspondiente e interpreta los coeficientes del ajuste.
d. Si para el año 2010 aumentásemos los gastos de publicidad en un 1 % respecto al año anterior, ¿en qué
porcentaje se espera que varı́en las ventas, según el modelo lineal?. Comenta el resultado.
Ejercicio 2.13. Se han observado, en varios modelos de automóviles, los datos de potencia del motor, en caballos,
y la aceleración, medida en el número de segundos necesarios para acelerar de 0 a 100 Km./h. La tabla adjunta
refleja los valores obtenidos:
a. Estudia razonadamente, según los datos anteriores, si la aceleración de un vehı́culo está relacionada lineal-
mente con su potencia.
b. Determina la recta de regresión que explique la aceleración de un vehı́culo en función de su potencia.
Interpreta los resultados.
c. Determina qué aceleración media le corresponderá a un vehı́culo con una potencia de 95 caballos. Y a uno
con una potencia de 200 caballos. Y a uno con una potencia de 90 caballos. Comenta los resultados.
49
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
2.9. Cuestionarios
2.9.1. Cuestionario Tema1 y Tema2: 12 de Marzo 2018.
Cuestión 1.1
Completa la siguiente tabla relativa a la marca que usa un grupo de alumnos del CEU de teléfono móvil.
Marca fi hi hi %
Apple 16 %
Samsung 12 0,48
LG 3
Sony 20 %
Shen Wai 0,04
Total
50
Estadı́stica
Cuestión 1.5
¿Qué medida de las siguientes NO está relacionada con una medida de tendencia central.
a) Media muestral.
b) Moda.
c) Varianza.
d) Mediana.
En una empresa de congelados, la demanda diaria, en lotes de producto, durante 30 dı́as de trabajo es:
38, 35, 76, 58, 48, 59, 67, 63, 33, 69
53, 51, 28, 25, 36, 32, 61, 57, 49, 78
48, 42, 72, 52, 47, 66, 58, 44, 44, 56
Dibuja el diagrama de cajas de esa distribución de datos:
Cuestión 1.6
51
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
En la tabla se recoge el éxito en un examen de los alumnos dependiendo del tiempo dedicado al estudio
···=
Cuestión 1.8
¿Cuál es la frecuencia de aprobar el examen condicionado a que estudio poco tiempo el examen?
···=
Cuestión 1.9
···=
Los siguientes datos se refieren a la demanda de un producto (en miles de unidades) y su precio (en centavos)
en cinco mercados diferentes:
52
Estadı́stica
Cuestión 1.10
¿Cuál es el pronóstico para estimar la demanda cuando el precio del producto es de 12 centavos?
a) 2352
b) 85,89
c) 81,86
d) Ninguna de las anteriores.
53
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
¿Qué frecuencia de autobuses son puntuales? (escribir la notación correctamente además del resultado)
¿Qué frecuencia de autobuses de la zona B van con retraso? (escribir la notación correctamente además del
Cuestión 2.3
resultado)
Indica la frecuencia de autobuses que son de la zona A y además son puntuales: (escribir la notación
Cuestión 2.4
De los autobuses que pasan por la zona A, ¿qué frecuencia son puntuales? (escribir la notación correctamente
Cuestión 2.5
54
Estadı́stica
Un equipo de baloncesto está probando un nuevo programa de estiramiento para reducir las lesiones durante
la liga. Los datos a continuación muestran la cantidad diaria de minutos haciendo ejercicios de estiramiento y la
Minutos 0 30 10 15 5 25 35 40
cantidad de lesiones a lo largo de la liga:
Lesiones 4 1 2 2 3 1 0 1
ŷ =
Cuestión 2.9
Si un equipo que realizaba sesiones de estiramento de 30 minutos aumenta en 7 minutos, ¿cuál serı́a la
cantidad de lesiones que tendrá?
ŷ =
55
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
Cuestión 2.10
Una compañı́a ha realizado un estudio de sus ventas totales (en miles de euros) en las 50 provincias de
España según su renta provincial. A partir de los datos obtenidos se ha obtenido la siguiente información:
X = 250,27 SX = 42,58 Y = 435,55 SY = 22,81 SXY = 969,45
Calcula la recta de regresión ŷ =
Se desea estudiar la puntualidad de los autobuses que pasan por dos zonas distintas de la ciudad, zona A y
zona B. Por la zona A pasan a lo largo del dı́a 40 autobuses, de los cuales 25 son puntuales, mientras que por la
zona B pasan 60 autobuses de los cuales puntuales son 20.
56
Estadı́stica
¿Qué frecuencia de autobuses van con retraso? (escribir la notación correctamente además del resultado)
Cuestión 3.2
¿Qué frecuencia de autobuses de la zona B son puntuales?(escribir la notación correctamente además del
resultado)
Cuestión 3.3
Indica la frecuencia de autobuses que son de la zona B y además son puntuales: (escribir la notación
correctamente además del resultado)
Cuestión 3.4
De los autobuses que pasan por la zona A, ¿qué porcentaje van con retraso? (escribir la notación correcta-
mente además del resultado)
Cuestión 3.5
Se muestran a continuación los datos sobre el número de pasajeros que llegan a un aeropuerto por hora (X)
y el tiempo total de espera, en minutos, (Y ):
57
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
ŷ =
Cuestión 3.9
58
Estadı́stica
Cuestión 3.10
Una compañı́a ha realizado un estudio de sus ventas totales (en miles de euros) en las 33 provincias de
España según su renta provincial. A partir de los datos obtenidos se ha obtenido la siguiente información:
X = 240,1 SX = 42,58 Y = 430 SY = 22,81 SXY = 969,45
Calcula la recta de regresión ŷ =
59
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
¿Qué frecuencia de trabajadores realizó un curso de F.A.? (escribir la notación correctamente además de
Cuestión 4.2
indicar el resultado)
¿Qué porcentaje de trabajadores no realizaron ningún curso? (escribir la notación correctamente además de
Cuestión 4.3
indicar el resultado)
Cuestión 4.4
De los trabajadores que realizaron 2 cursos de P.I., ¿qué frecuencia realizaron 2 cursos de F.A.? (escribir la
Cuestión 4.5
En la siguiente tabla se recoge la evolución del IPC (ı́ndice de precios al consumo) y el precio del barril de
petróleo (Brent) durante el segundo semestre del 2017.
IPC ( %) Precio del barril ($)
2.4 71.54
2.2 77.01
2.2 70.73
2.7 76.87
3.6 82.50
4.1 90.16
60
Estadı́stica
ŷ =
Cuestión 4.9
Si el valor del IPC es del 3 %, ¿Cuál serı́a la estimación del precio del barril durante el segundo semestre del
2017?
ŷ =
Cuestión 4.10
En cierto paı́s, el tipo de interés y el ı́ndice de la Bolsa en los últimos seis meses vienen dados por los
siguientes datos:
X = 6,53, SX = 1,12
Y = 140,17, SY = 14,48
SXY = −15,01
Calcula la recta de regresión ŷ =
61
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
¿Qué porcentaje de trabajadores realizaron algún curso de F.A.? (escribir la notación correctamente además
Cuestión 5.2
de indicar el resultado)
62
Estadı́stica
¿Qué porcentaje de trabajadores no realizaron ningún curso? (escribir la notación correctamente además de
Cuestión 5.3
indicar el resultado)
Calcula la distribución de la asistencia a los cursos de P.I.: (escribir la notación correctamente además de
Cuestión 5.4
indicar el resultado)
De los trabajadores que realizaron 2 cursos de F.A., ¿qué porcentaje realizaron 2 cursos de P.I.? (escribir la
Cuestión 5.5
Una asesorı́a laboral, con despachos en Castellón y Valencia, está estudiando si existe relación entre el número
total de expedientes de regulación de empleo realizados en estas dos ciudades. Los siguientes datos corresponden
al número de expedientes tramitados entre 2003 y 2010:
Caste. 30 40 50 60 70 100 90 80
Valen. 70 80 90 75 110 200 160 150
63
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
Cuestión 5.7
Razona si existe algún tipo de relación entre estas variables y, en caso de haberla, de qué tipo es:
Cuestión 5.8
Calcula la recta de regresión que permita predecir el número de expedientes tramitados en Valencia en
función de número de expedientes tramitados en Castellón:
ŷ =
En una muestra de 150 empresas del sector de servicios (con un mı́nimo de 10 trabajadores) se recogen datos
sobre el número de trabajadores de la empresa (X) y la facturación (Y) anual en millones de euros. Los resultados
se muestran resumidos en los siguientes estadı́sticos:
X = 16 SX = 3
Y = 114 SY = 26
SXY = 40
Cuestión 5.9
Calcula la recta de regresión que ayude a explicar la facturación en función del número de trabajadores
ŷ =
Cuestión 5.10
¿Cuál serı́a la facturación esperada de una empresa del sector de servicios que tenga 8 trabajadores?
Exprésalo en las unidades adecuadas.
ŷ =
64
Estadı́stica
6 r = 0,9317
7 r es positivo y cercano a 1 por ello la relación es lineal y la recta es creciente
8 y = −1,13 + 1,82x
9 ŷ = 42,96 + 4,44x
10 ŷ = 78,48
65
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
66
Capı́tulo 3
Probabilidad
Los experimentos, que al repetirlos en igualdad de condiciones, producen siempre el mismo resultados son
experimentos determinı́sticos. Por ejemplo, siempre que dejamos caer un objeto, cae con una aceleración de 9.8
m/s2 .
En otros experimentos, aun manteniendo las mismas condiciones de experimentación, los resultados varı́an,
como en el caso del lanzamiento de una moneda o un dado. A estos experimentos, cuyo resultado no se puede
predecir, se les llama aleatorios.
El conjunto formado por todos los resultados posibles de un experimento se llama espacio muestral, E. Por
ejemplo, el espacio muestral del lanzamiento de una moneda es E = {cara, cruz}. El espacio muestral del lanza-
miento de un dado es E = {1, 2, 3, 4, 5, 6}.
A cada uno de los resultados posibles obtenidos al realizarse un experimento se le llama suceso elemental.
Un suceso está formado por sucesos elementales. Por ejemplo, el suceso obtener un número par en el lanza-
miento de un dado es A = {2, 4, 6}.
Hay dos sucesos especiales, que son el suceso seguro, que siempre ocurre. Por ejemplo, el suceso obtener menos
de un 7 en el lanzamiento de un dado se representa por B = {1, 2, 3, 4, 5, 6} y es seguro porque coincide con el
espacio muestral. Y el suceso imposible, que es aquel que no contiene ningún suceso elemental y que se denota
por el conjunto vacı́o ∅. Por ejemplo, obtener menos de un 1 en el lanzamiento de un dado es ∅.
El suceso contrario a uno dado A, contiene los sucesos elementales que están en el espacio muestral y que no
están en A. Se representa por A. Por ejemplo, si consideramos el suceso múltiplos de 3 en el lanzamiento de un
dado, A = {3, 6} entonces A = {1, 2, 4, 5}.
Cuando dos sucesos A y B tienen algún suceso elemental común, se llaman compatibles y significa que tienen
la posibilidad de ocurrir simultáneamente. Por el contrario, si dos sucesos A y B no tienen ningún suceso elemental
en común se dicen incompatibles. Por ejemplo, los suceso A={2,4,6} y B={3,6} son compatibles porque tienen
el suceso elemental 6 en común. Sin embargo, los sucesos A={2,4,6} y C={1,3,5} son incompatibles, ya que no
tienen ningún suceso elemental común.
67
CAPÍTULO 3. PROBABILIDAD
Intersección
Dados dos sucesos A y B del espacio muestral E, se llama suceso intersección, y se escribe A ∩ B, al suceso
formado por todos los sucesos elementales comunes de A y B. El suceso intersección ocurre cuando sucede A y B
a la vez.
Por ejemplo, si A = {1, 2, 4} y B = {4, 5} entonces A ∩ B = {4}
Diferencia
Dados dos sucesos A y B del espacio muestral E, se llama diferencia y se escribe A − B, al suceso formado
por los sucesos elementales de A que no son de B. El suceso A − B ocurre cuando sucede A y no sucede B.
Por ejemplo, si A = {1, 2, 4} y B = {4, 5} entonces A − B = {1, 2} y B − A = {5}.
3.3. Probabilidad.
(Se corresponde con la sección 8.4 del libro Haeussler (2008))
En el lanzamiento de una moneda repetidamente, unas veces aparece cara y otras cruz. Del mismo modo, en
el lanzamiento de un dado varias veces, pueden aparecer las distintas caras {1, 2, 3, 4, 5, 6}. En ninguno de estos
experimentos se puede predecir el resultado.
Si llamamos fi al número de veces que aparece cara y n al número total de lanzamientos, el cociente fni tiende
a 21 cuando n es grande.
Si llamamos fi al número de veces que aparece una determinada cara de un dado y n al número total de
lanzamientos, el cociente fni tiende a 16 cuando n es grande.
Los fenómenos lanzamiento de un dado, lanzamiento de una moneda, la duración de las bombillas de un lote
de fabricación o el nacimiento de un bebe (niña o niño) son fenómenos aleatorios.
Los fenómenos aleatorios tienen las siguientes caracterı́sticas comunes:
Son fenómenos que, repetidos de una forma indefinida y en igualdad de condiciones, pueden presentar
resultados distintos en cada uno de ellos.
No pueden predecirse.
Repitiendo una experiencia o fenómeno aleatorio n veces y anotando el número de veces el número de veces,
fi , que aparece un resultado determinado, el cociente fni tiende a aproximarse a un valor fijo. El valor fijo
al que tiende el cociente fni se denomina probabilidad del suceso.
Cuando en un experimento aleatorio todos los sucesos elementales tienen la misma probabilidad de ocurrir,
se denomina equiprobables. Cuando esto ocurre, se puede aplicar la regla de Laplace:
0 ≤ P (A) ≤ 1
P (E) = 1
68
Estadı́stica
Ejercicio 3.1. ¿Qué probabilidad tiene una pareja de tener al menos dos varones en un embarazo de trillizos?
Solución: Según las configuraciones ya vistas en el ejercicio B.1 las posibles configuraciones con dos varones son:
VVV,VVH,VHV,HVV
P(al menos dos varones)=P(VVV)+P(VVH)+P(VHV)+P(HVV)= 81 + 18 + 18 + 81 = 48
La idea básica de la probabilidad condicionada es que a la hora de calcular la probabilidad de que ocurra
cualquier suceso puede influir que este dependa de que haya ocurrido antes otro suceso con el que está relacionado.
Por ejemplo, imaginemos que en un proceso en el que se analizan muestras de policarbonato plástico, se exami-
nan 49 muestras para determinar su resistencia a las rayaduras y a los golpes, obteniendo los siguientes resultados:
Si nos preguntaramos por la probabilidad de que una muestra escogida al azar fuera resistente a las raya-
duras deberı́amos plantear P (B) = 44 49
, siguiendo el planteamiento de la regla de Laplace. Sin embargo, si el
interés fuera el cálculo de la probabilidad de que una muestra escogida al azar fuera resistente a las rayaduras
sabiendo que es resistente a los golpes, el planteamiento cambiarı́a para incorporar esta información, de manera
que especificarı́amos P(B|A)= 40 42
En definitiva, se define la probabilidad de un suceso B condicionada a la ocurrencia de un suceso A y se
denota por P (B|A):
P (A ∩ B)
P (B|A) =
P (A)
De este modo, podemos considerar que P (A ∩ B) = P (B|A)P (A). Si la probabilidad de que ocurra B sabiendo
que ha ocurrido A, no modifica la probabilidad de B, se tendrı́a que P (A ∩ B) = P (B)P (A). En ese caso se dice
que A y B son independientes.
Por ejemplo, en el lanzamiento de una moneda 2 veces consecutivas. El resultado del primer lanzamiento no
modifica el resultado del segundo lanzamiento, por lo que P (B|A) = P (B) y P (A ∩ B) = P (B)P (A)
69
CAPÍTULO 3. PROBABILIDAD
En las situaciones en las que se cumple el teorema de la probabilidad total, podrı́amos calcular la probabilidad
condicionada incorporando el resultado del teorema:
P (A ∩ B) P (A ∩ B)
P (B|A) = = Pn
P (A) i=1
P (A|Bi )P (Bi )
Ejercicio 3.2. Se consideran dos urnas: la urna A contiene 6 bolas rojas y 4 bolas blancas; la urna B contiene 4
bolas rojas y 8 bolas blancas. Se lanza un dado y si se obtiene un número menor que 3, se extrae una bola de la
urna A; si el resultado es 3 o más, se extrae la bola de la urna B. Calcula la probabilidad de que al extraer una
bola al azar, esta provenga de la urna A sabiendo que es de color blanco.
B A P (A ∩ Blanca)
P (A|Blanca) = =
P (Blanca)
Blanca Roja Blanca Roja P (A ∩ Blanca)
=
P (Blanca|A)P (A) + P (Blanca|B)P (B)
2 4
· 10
= 6
= 0,23
4
10
· 2
6
+ 128
· 4
6
70
Estadı́stica
Determina:
a. A ∪ B, A ∩ B, A − B, B − A.
b. C ∪ F , C∩B.
c. ¿Son compatibles los sucesos C y D?.Justifica la respuesta
Ejercicio 3.4. Seleccionamos una carta de una baraja de 20 cartas que contiene 10 cartas rojas numeradas del
1 al 10 y 10 cartas azules numeradas del 1 al 10. Sean los sucesos
A= salir una carta par.
B= salir una carta azul.
C= salir una carta menor o igual a 5.
Definir:
a. E. d. A ∪ B ∪ C.
b. A ∪ B ∪ C. e. A ∩ (B ∪ C).
c. B ∩ C. f. A ∪ B ∪ C.
a. B ∪ C. c. A ∪ C.
b. B ∩ C. d. A ∩ C.
Ejercicio 3.6. Si la probabilidad de que un estudiante A suspenda un cierto examen es 0,5, la probabilidad de
que un estudiante B suspenda el mismo examen es 0,2 y la probabilidad de que ambos suspendan es 0,1.
a. ¿Cuál es la probabilidad de que al menos uno de los dos estudiantes suspenda el examen?. (Sol.: 0.6)
b. ¿Cuál es la probabilidad de que ninguno suspenda el examen?.(Sol.: 0.4)
c. ¿Cual es la probabilidad de que sólo uno suspenda el examen?. (Sol.: 0.5)
Ejercicio 3.7. Una empresa que fabrica camisetas posee tres máquinas, A, B y C, producen el 45 %, 30 % y
25 %, respectivamente, del total de las piezas producidas en la fábrica. Los porcentajes de producción defectuosa
de estas máquinas son del 3 %, 4 % y 5 % respectivamente.
a. Seleccionamos una camiseta al azar; calcular la probabilidad de que salga defectuosa. (Sol.: 0.038)
b. Tomamos, al azar, una camiseta y resulta ser defectuosa; calcula la probabilidad de haber sido producida
por la máquina B.(Sol.: 0.3158)
71
CAPÍTULO 3. PROBABILIDAD
Ejercicio 3.8. Un Doctor dispone de tres equipos electrónicos para realizar ecografı́as. El uso que le da a cada
equipo es de 25 % al primero, 35 % el segundo en y 40 % el tercero. Se sabe que los aparatos tienen probabilidades
de error de 1 %, 2 % y 3 % respectivamente. Un paciente busca el resultado de una ecografı́a y observa que tiene
un error. Determine la probabilidad de que se haya usado el primer aparato.(Sol.: 0.1163)
Ejercicio 3.9. Dos máquinas M1 y M2 han fabricado respectivamente 100 y 200 piezas. Se ha comprobado que
M1 produce un 5 % de piezas defectuosas y M2 produce un 6 %. Tomando una de las piezas fabricadas se pide
calcular:
1. Probabilidad de que sea defectuosa.(Sol.: 0.0567)
2. Sabiendo que es defectuosa, probabilidad de que proceda de M1.(Sol.: 0.2945)
Ejercicio 3.10. Una empresa produce piezas defectuosas con probabilidad 0,04. Posteriormente las somete a
un control de calidad que no es totalmente fiable, pues la probabilidad de que el mismo califique a un pieza
como buena siendo realmente defectuosa es de 0,05 y de que la califique como defectuosa siendo correcta es de
0,02. ¿Cuál es la probabilidad de que una pieza que el control la ha calificado como defectuosa, sea realmente
correcta?.(Sol.: 0.3357)
Ejercicio 3.11. Una compañı́a dedicada al transporte público explota tres lı́neas periféricas de una gran ciudad
de forma que el 50 % de los autobuses cubren el servicio de la primera lı́nea, el 30 % cubren el de la segunda y el
resto el de la tercera. Se sabe que la probabilidad de que se averı́e diariamente un autobús es de 2 % en la primera
lı́nea, 4 % en la segunda y un 1 % en la tercera. Determine:
1. Probabilidad de que un autobús sufra una averı́a un determinado dı́a. (Sol.: 0.022)
2. Sabiendo que un autobús ha sufrido una averı́a, probabilidad de que preste servicio en la primera lı́nea.(Sol.:
0.2727)
72
Estadı́stica
3.6. Cuestionarios
3.6.1. Cuestionario Tema3: 16 de Abril 2018.
En un grupo de amigos el 80 % están casados. Entre los casados, el 75 % tiene trabajo. Finalmente, un
5 % no están casados y tampoco tiene trabajo. Si uno no tiene trabajo, ¿qué probabilidad hay de que esté
casado?INDICAD CÁLCULOS.
Cuestión 1.1
Cuestión 1.2
Una lı́nea de autobuses utiliza 8 autobuses. Tenemos que averiguar cuántas formas se puede hacer una viaje
de ida y vuelta teniendo en cuenta que el autobús de ida ha de ser distinto que el de vuelta.
a) 56
b) 64
c) 28
d) Ninguna de las anteriores.
Cuestión 1.3
Una lı́nea de autobuses utiliza 8 autobuses. Tenemos que averiguar cuántas formas se puede hacer una viaje
de ida y vuelta teniendo en cuenta que es indiferente que el autobús de ida sea el mismo o distinto.
a) 64
b) 28
c) 56
d) Ninguna de las anteriores.
aprobaron las dos asignaturas. Elegido un estudiante de la clase al azar, calcula la probabilidad de que haya
aprobado alguna de las dos asignaturas.
a) 0,42
b) 0,85
c) 0,38
d) Ninguna de las anteriores.
73
CAPÍTULO 3. PROBABILIDAD
Una empresa de confección tiene 3 proveedores de hilos. Cada uno de ellos suministra el 40 %, 30 % y 30 %
respectivamente. El director de la producción de la empresa observa un porcentaje de hilos defectuosos
Cuestión 1.5
En una semana de Operación Triunfo, quedan 9 participantes y se desea realizar una prueba por grupos de
4. ¿Cuántos grupos distintos se podráin firmar?
a) 36
b) 6561
c) 84
d) Ninguna de las anteriores
Cuestión 1.8
74
Estadı́stica
La irregularidad del corte de productos de papel aumenta a medida que las hojas de la cuchilla se desgastan.
Sólo el 1 % de productos cortados con cuchillas nuevas tienen cortes irregulares, el 3 % de los cortados con
cuchillas de filo promedio exhiben irregularidades y el 5 % de los cortados con cuchillas desgastadas presentan
irregularidades. Si el 25 % de las cuchillas utilizadas en el proceso de corte son nuevas, el 60 % tiene un filo
Cuestión 2.1
promedio y el 15 % de las cuchillas están desgastadas. ¿cuál es la probabilidad de que los productos tengan
cortes irregulares?.
a) 0,018
b) 0,09
c) 0,028
d) Ninguna de las anteriores es correcta.
Cuestión 2.2
Dadas las siguientes probabilidades: P (A) = 0,4, P (B) = 0,3 y P (A|B) = 0,1. ¿Cuánto vale la probabilidad
de P (A ∪ B)?.
a) 0.03
b) 0.67
c) 0.7
d) Ninguna de las anteriores es correcta.
Cuestión 2.3
El software para detectar fraude en las tarjetas telefónicas utilizadas por los consumidores, registra todos
los dı́as el número de áreas metropolitanas donde se originan todas las llamadas. Se tiene que el 1 % de los
usuarios legı́timos hacen al dı́a llamadas que se originan en dos o más áreas metropolitanas. Sin embargo, el
30 % de los usuarios fraudulentos hacen al dı́a llamadas desde dos o más áreas metropolitanas. La proporción
Cuestión 2.4
de usuarios fraudulentos es 1 %. Si el mismo usuario hace en un dı́a dos o más llamadas desde dos o más
áreas metropolitanas, ¿cuál es la probabilidad de que sea un usuario fraudulento?.
a) 0,23
b) 0,003
c) 0,01
d) Ninguna de las anteriores es correcta.
75
CAPÍTULO 3. PROBABILIDAD
Cuestión 2.5
En un concurso literario se seleccionan 12 relatos cortos como finalistas, ¿cómo se podrı́an distribuir 4 premios
iguales entre los 12 participantes?.
a) 20736
b) 495
c) 11880
d) Ninguna de las anteriores.
Cuestión 2.6
Si se publicara el libro anterior con los 4 relatos con más votos recibidos por el jurado, teniendo en cuenta
que no hay ningún empate, ¿cuántas ediciones diferentes (del libro) podrı́amos tener?
a) 20736
b) 495
c) 11880
d) Ninguna de las anteriores.
Cuestión 2.7
¿Cuántas palabras (con o sin significado) de 4 letras se pueden construir con las letras de la palabra LUCAS?
a) 1024
b) 120
c) 625
d) Ninguna de las anteriores.
Cuestión 2.8
¿Cuántos números, de 6 cifras diferentes y que acaben en 5, se pueden formar con los dı́gitos 1, 2, 3, 4, 5 y 6?
a) 3125
b) 120
c) 720
d) Ninguna de las anteriores.
76
Estadı́stica
Las muestras de vidrio de un laboratorio se colocan en empaques pequeños y ligeros o en empaques pesados
y grandes. Suponga que el 2 % y el 1 % de las muestras enviadas en empaques pequeños y grandes, respec-
tivamente, se rompen durante el trayecto a su destino. Si el 60 % de las muestras se envı́an en empaques
Cuestión 3.1
grandes, y el 40 % en empaques pequeños, ¿cuál es la probabilidad de que las muestras de vidrio se rompan
durante el envı́o?.
a) 0,0003
b) 0,03
c) 0,014
d) Ninguna de las anteriores.
Cuestión 3.2
Dadas las siguientes probabilidades: P (A) = 0,3, P (B) = 0,6 y P (A|B) = 0,2. ¿Cuánto vale la probabilidad
de P (A ∪ B)?.
a) 0,12
b) 0,9
c) 0,78
d) Ninguna de las anteriores es correcta.
Cuestión 3.3
El software para detectar fraude en las tarjetas telefónicas utilizadas por los consumidores, registra todos
los dı́as el número de áreas metropolitanas donde se originan todas las llamadas. Se tiene que el 1 % de los
usuarios legı́timos hacen al dı́a llamadas que se originan en dos o más áreas metropolitanas. Sin embargo, el
30 % de los usuarios fraudulentos hacen al dı́a llamadas desde dos o más áreas metropolitanas. La proporción
Cuestión 3.4
de usuarios fraudulentos es 1 %. Si el mismo usuario hace en un dı́a varias llamadas desde dos o más áreas
metropolitanas, ¿cuál es la probabilidad de que sea un usuario legı́timo?.
a) 0,77
b) 0,23
c) 0,0099
d) Ninguna de las anteriores es correcta.
77
CAPÍTULO 3. PROBABILIDAD
Cuestión 3.5
En un concurso para seleccionar el cártel de unas fiestas populares se han presentado 10 candidaturas, antes
de la elección final se seleccionan como finalistas 3 de ellas, ¿cuántas selecciones distintas se pueden realizar?
a) 120
b) 720
c) 1000
d) Ninguna de las anteriores.
Cuestión 3.6
Si en el caso anterior directamente se selecciona de las 10 candidaturas, ganador, finalista y premio especial,
¿cuántas selecciones distintas se pueden realizar?
a) 120
b) 720
c) 1000
d) Ninguna de las anteriores.
Cuestión 3.7
¿Cuántas palabras (con o sin significado) de 6 letras diferentes y que empiecen por A se pueden construir
con las letras de la palabra LUCANO?
a) 120
b) 720
c) 600
d) Ninguna de las anteriores.
78
Estadı́stica
Los clientes se encargan de evaluar los diseños preliminares de varios productos. En el pasado, el 95 % de
los productos con mayor éxito en el mercado recibieron buenas evaluaciones, el 60 % de los productos con
éxito moderado recibieron buenas evaluaciones, y el 10 % de productos de escaso éxito recibieron buenas
evaluaciones. Además, el 40 % de los productos han tenido mayor éxito, el 35 % un éxito moderado, y el 25 %
Cuestión 4.1
escaso éxito. Si un nuevo diseño obtiene una buena evaluación, ¿cuál es la probabilidad de que se convierta
en un producto de mayor éxito?.
a) 0,95
b) 0,38
c) 0,62
d) Ninguna de las anteriores es correcta.
Cuestión 4.2
Dadas las siguientes probabilidades P (A) = 0,1, P (B) = 0,2 y P (A ∪ B) = 0,03, ¿Cuál es la probabilidad de
P (A ∩ B)?.
a) 0,1
b) No se puede calcular con estos datos.
c) 0,27
d) Ninguna de las anteriores es correcta.
Cuestión 4.3
La probabilidad de que falle un conector eléctrico que se mantiene seco durante el perı́odo de garantı́a, es
1 %. Si el conector se humedece, la probabilidad de fallar durante el perı́odo de garantı́a es 5 %. Si el 90 % de
Cuestión 4.4
los conectores se mantienen secos, y el 10 % se humedecen, ¿qué probabilidad de conectores fallará durante
el perı́odo de garantı́a?.
a) 0,06
b) 0,014
c) 0,0005
d) Ninguna de las anteriores es correcta.
79
CAPÍTULO 3. PROBABILIDAD
Cuestión 4.5
En una clase con 25 niños, se acuerda seleccionar 3 alumnos para formar un grupo de trabajo, ¿cuántos
grupos de trabajo se pueden formar?
a) 13800
b) 2300
c) 230
d) Ninguna de las anteriores.
En una clase con 25 niños, se acuerda seleccionar 3 alumnos para formar un grupo de trabajo, un alumno
Cuestión 4.6
será el encargado de la pizarra, otro el encargado del silencio y el tercero el encargado del material, ¿cuántos
grupos de trabajo se pueden formar?
a) 13800
b) 2300
c) 230
d) Ninguna de las anteriores.
Cuestión 4.7
¿Cuántos números de 5 cifras, que empiecen por 3, se pueden formar con los números impares?
a) 256
b) 625
c) 120
d) Ninguna de las anteriores.
Cuestión 4.8
¿Cuántas palabras, de 6 letras distintas y que empiecen por V, se pueden construir con las letras de la palabra
MOTIVA?
a) 720
b) 120
c) 3125
d) Ninguna de las anteriores.
80
Estadı́stica
Los clientes se encargan de evaluar los diseños preliminares de varios productos. En el pasado, el 95 % de
los productos con mayor éxito en el mercado recibieron buenas evaluaciones, el 60 % de los productos con
éxito moderado recibieron buenas evaluaciones, y el 10 % de productos de escaso éxito recibieron buenas
evaluaciones. Además, el 40 % de los productos ha tenido mayor éxito, el 35 % un éxito moderado, y el 25 %
Cuestión 5.1
escaso éxito. Si un producto obtiene una buena evaluación, ¿cuál es la probabilidad de que se convierta en
un producto de éxito moderado?.
a) 0,6
b) 0,34
c) 0,62
d) Ninguna de las anteriores es correcta.
Cuestión 5.2
Dadas las siguientes probabilidades P (A) = 0,4, P (B) = 0,3 y P (A ∪ B) = 0,01, ¿Cuál es la probabilidad de
P (A ∩ B)?.
a) 0,69
b) No se puede calcular con estos datos.
c) 0,27
d) Ninguna de las anteriores es correcta.
Cuestión 5.3
Si P (A|B) = P (A) y P (B|A) = P (B), entonces los sucesos reciben el nombre de:
a) Los sucesos A y B son independientes.
b) Los sucesos A y B son mutuamente excluyentes.
c) El suceso A condiciona al suceso B y viceversa.
d) Ninguna de las anteriores es correcta.
Suponga que el 2 % de los rollos de tela de algodón son defectuosos, al igual que el 3 % de los rollos de tela
Cuestión 5.4
de nylon. De los rollos utilizados para el fabricante, 70 % son de algodón y 30 % son de nylon. ¿Cuál es la
probabilidad de que al seleccionar al azar uno de los rollos éste sea defectuoso?
a) 0,23
b) 0,05
c) 0,0006
d) Ninguna de las anteriores es correcta.
81
CAPÍTULO 3. PROBABILIDAD
Cuestión 5.5
En la misma liga se realiza un reparto en 4 grupos (en cada grupo habrá 3 equipos) para jugar una liguilla
previa¿cuántos posibles grupos habrı́an?
a) 1320
b) 495
c) 220
d) Ninguna de las anteriores.
Cuestión 5.7
¿Cuántos números de 5 cifras distintas, que empiecen por 3, se pueden formar con los números impares?
a) 256
b) 120
c) 60
d) Ninguna de las anteriores.
Cuestión 5.8
¿Cuántas palabras (con o sin significado) de 4 letras, se pueden construir con las letras de la palabra MOTIV?
a) 625
b) 120
c) 256
d) Ninguna de las anteriores.
82
Capı́tulo 4
Una variable aleatoria, X, es un rasgo o caracterı́stica de los elementos de una población que toma valores
numéricos, xi , determinados por el resultado de un experimento aleatorio ,es decir, no conocemos ni podemos
predecir el resultado del experimento. Se dice que la variable es discreta si no puede tomar más que una cantidad
numerable de valores.
Ejemplo 4.1. Las siguientes cantidades pueden ser consideradas variables aleatorias:
1. El número de artı́culos defectuosos de una muestra de artı́culos.
2. El número de clientes que llegan a la caja de un supermercado en una hora.
3. El número de errores detectados en las cuentas de una empresa.
4. El número de reclamaciones en una póliza de seguro médico en un año.
La función de probabilidad, P(x), de una variable aleatoria discreta debe satisfacer las dos propiedades si-
guientes:
P1 0 ≤ P (x) ≤ 1 para cualquier valor x.
P2 La probabilidades individuales suman 1, es decir,
X
P (x) = 1.
x
La función de probabilidad acumulada, F (x0 ), de una variable aleatoria, X, expresa la probabilidad de que X
no tenga un valor superior a x0 , como una función de x0 . Es decir,
F (x0 ) = P (X ≤ x0 )
83
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
Ejemplo 4.2. Serrano Motor, S.A., es un concesionario de automóviles de una pequeña ciudad. Basándose en un
análisis de su historial de ventas, sus directivos saben que en un dı́a cualquiera el número de automóviles en exis-
tencias puede oscilar entre 0 y 5. ¿Cómo puede utilizarse la función de probabilidad para planificar las existencias?
x P (x) F (x)
0 0.15 0.15
1 0.30 0.45
2 0.20 0.65
3 0.20 0.85
4 0.10 0.95
5 0.05 1.00
Por ejemplo, si sólo hay cuatro automóviles en existencias, Serrano Motor podrı́a satisfacer las necesidades
de los clientes de un automóvil el 95 % de las veces. Si sólo hay 2 automóviles en existencias podrı́a satisfacer las
necesidades de los clientes en un 65 % de las veces o lo que es lo mismo no se satisfarı́an las necesidades del 35 %
de los clientes ((1 − 0,65) × 100).
Ejemplo 4.3. En una revisión de unos libros de texto se observó que el 81 % de las páginas no tenı́a ninguna
errata, que el 17 % contenı́a una errata y que el 2 % restante contenı́a dos erratas. Utilizamos la variable aleatoria
X para representar el número de erratas que hay en una página elegida aleatoriamente en uno de estos libros; sus
valores posibles son 0, 1 y 2 y la función de probabilidad es
Si nos limitamos a calcular la media de los posibles valores de la variable, obtenemos un promedio de 1 errata,
sin embargo basta una breve reflexión para darse cuenta que la medida del punto central es absurda, ya que no
hemos prestado atención al hecho de que el 81 % de las páginas no tiene erratas, mientras que el 2 % tienen 2
erratas.
Para obtener una media sensata del punto central, ponderamos los distintos valores posibles de la variable por
las probabilidades de que ocurran.
El valor esperado, E(X), de una variable aleatoria discreta, X, se define como:
X
E(X) = µ = x P (x)
x
84
Estadı́stica
donde la notación indica que el sumatorio abarca todos los valores posibles de X. El valor esperado de una
variable aleatoria también se llama media y se representa por medio del sı́mbolo µ.
De este resultado se deduce que, si se analiza un gran número de páginas, es de esperar que haya una media
de 0.21 erratas por página.
4.1.3. Varianza
Para medir la dispersión de la distribución de probabilidad de una variable aleatoria discreta, X, se calcula el
valor medio que tomará la función (X − µ)2 en un número muy grande de pruebas repetidas. A este valor se le
llama varianza y se calcula como:
X
σ 2 = E[(X − µ)2 ] = (x − µ)2 P (x)
x
La desviación tı́pica, σ, es la raı́z cuadrada positiva de la varianza. Esta cantidad mantiene las unidades
originales de medición.
El concepto de varianza puede ser útil para comparar las dispersiones de distribuciones de probabilidad.
Consideramos, por ejemplo, que el rendimiento de una inversión en un año es una variable aleatoria. Aunque dos
inversiones tengan los mismos rendimientos esperados, son muy diferentes si las varianzas de estos rendimientos son
muy diferentes. Si la varianza es mayor, es más probable que los rendimientos sean considerablemente diferentes
de la media que si la varianza es pequeña. En este contexto, la varianza del rendimiento puede guardar relación
con el concepto de riesgo de una inversión: cuanto mayor es la varianza, mayor es el riesgo.
σY = |b|σX
Ejemplo 4.5. Un contratista está interesado en saber cuál es el coste total de un proyecto para el que pretende
presentar una oferta. Estima que los materiales costarán 25000 euros y su trabajo 900 euros al dı́a. Si el proyecto
tarda en realizarse X dı́as, el coste laboral total será de 900X euros y el coste total del proyecto será C = 25.000
+ 900 X. El contratista estima unas probabilidades subjetivas de la duración probable del proyecto.
Duración X (dı́as) 10 11 12 13 14
Probabilidad 0.1 0.3 0.3 0.2 0.1
85
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
y la varianza
X
σx2 = E[(X − µ)2 ] = (x − µ)2 P (x) = (10 − 11,9)2 (0,1) + (11 − 11,9)2 (0,3) + ... + (14 − 11,9)2 (0,1) = 1,29 dı́as2 .
x
Consideremos que se realizan n veces un experimento aleatorio y que cada experimento sólo tiene dos posibles
resultados (éxito o fracaso). Los experimentos o pruebas se realizan de forma independiente, con lo que el resultado
de cada prueba no influyen en el resultado de las demás. La probabilidad de obtener éxito en cada experimento
es p, con lo cual la probabilidad de fracaso es 1 − p. Si se considera X la variable que recoge el número de éxitos
en los n experimentos, sus posibles respuestas varı́an entre 0 y n. A la distribución del número de éxitos se le
llama distribución binomial, Bin(n,p), y su función de probabilidad permite calcular la probabilidad de obtener
exactamente k éxitos en n pruebas:
n k n!
P (X = k) = p (1 − p)n−k = pk (1 − p)n−k , para k = 0, 1, 2, ..., n.
k k!(n − k)!
Se puede demostrar que si X sigue una distribución binomial (X ∼Bin(n,p)), su valor esperado y varianza
son µ = E(X) = n p y σ 2 = Var(X) = n p (1 − p), respectivamente.
Ejercicio 4.1. Un director de producción sabe que el 5 % de los componentes producidos en un determinado
proceso de producción tiene algún defecto. Se examinan seis de estos componentes, cuyas caracterı́sticas puede
suponerse que son independientes entre sı́.
1. ¿Cuál es la probabilidad de que ninguno de estos componentes tenga un defecto?.
2. ¿Cuál es la probabilidad de que uno de estos componentes tenga un defecto?
3. ¿Cuál es la probabilidad de que al menos dos de estos componentes tengan un defecto?.
86
Estadı́stica
6
a) P(X=0)= 0,050 (1 − 0,05)6−0 = 6!
0,050 (1 − 0,05)6−0 = 0,7351
0 0!(6−0)!
6
b) P(X=1)= 0,051 (1 − 0,05)6−1 = 1!(6−1)!
6!
0,051 (1 − 0,05)6−1 = 0,2321
1
c) P(X≥2)=1-P(X<2)=1-(P(X=0)+P(X=1))=1-(0.7351+0.2321)=0.0179.
La distribución hipergeométrica.
Supongamos que se elige una muestra aleatoria de n objetos de un grupo de N objetos, de los cuales E
son éxitos y por lo tanto N − E son fracasos. La distribución del número de éxitos, X, en la muestra se llama
distribución hipergeométrica, Hg(E,N ,n). Su función de probabilidad es:
E N-E
k n-k
P (X = k) =
N
n
Se puede demostrar que si X sigue una distribución hipergeométrica (X ∼Hg(E,N ,n)), su media y varianza
E(N −E)
son E(X) = nEN
y Var(X) = N 2 (N −1)
Ejemplo 4.6. Una empresa recibe un envı́o de 20 artı́culos. Como es caro inspeccionarlos todos, tiene la polı́tica
de comprobar una muestra aleatoria de 6 artı́culos de ese envı́o y, si no hay más de 1 artı́culo defectuoso en la
muestra, no comprueba el resto. ¿Cuál es la probabilidad de que un envı́o de 5 artı́culos defectuosos no se someta
a una comprobación adicional?
Solución: Si se identifica “artı́culo defectuoso” con “éxito” en este ejemplo, el envı́o contiene N = 20 artı́culos, de
los cuales E = 5 son defectuosos (éxitos). La muestra seleccionada tiene n = 6 artı́culos y para que no se someta a
inspección el lote completo, como mucho debemos encontrar 1 artı́culo defectuoso en la muestra, es decir k = 0 o 1
éxitos en la muestra. Si llamamos X al número de éxitos en la muestra, X sigue una distribución hipergeométrica
(X ∼Hg(5,20,6)) y la probabilidad de interés en el problema serı́a:
E N-E E N-E
0 n-0 1 n-1
P (X ≤ 1) = P (X = 0) + P (X = 1) = + =
N N
n n
5 20-5 5 20-5
0 6-0 1 6-1 1 · 5005 5 · 3003
= + = + = 0,516
20 20 38760 38760
6 6
87
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
Se dice que X sigue una distribución de probabilidad de Poisson (X ∼Po(λ)) si tiene la función de probabilidad:
e−λ λk
P (X = k) = , k = 0, 1, 2, ...
k!
donde P (X = k) es la probabilidad de k éxitos en un tiempo o un espacio dados, dado λ, λ es el número de
éxitos esperado por unidad de tiempo o espacio; λ > 0 y e ∼ = 2,71828 es la base de los logaritmos naturales.
La media y varianza de la distribución de probabilidad de Poisson son µ = E(X) = λ y σ 2 = E[(X − µ)2 ] = λ,
respectivamente.
La suma de n variables aleatorias de Poisson con media λ también es una variable aleatoria de Poisson de
media n λ.
La distribución de Poisson es una importante distribución de probabilidad para algunas aplicaciones, como
por ejemplo:
1. El número de fallos de un gran sistema informático en un dı́a determinado.
2. El número de pedidos de sustitución de una pieza recibidos por una empresa en un mes dado.
3. El número de barcos que llegan a una terminal de carga durante un periodo de 6 horas.
4. El número de camiones de reparto que llegan a un almacén central en una hora.
5. El número de clientes que llegan a tomar un vuelo cada 15 minutos entre las 3 y las 6 de la tarde durante
los dı́as de la semana.
6. El número de clientes que llegan a una caja en el supermercado local durante un determinado intervalo de
tiempo.
Ejercicio 4.2. Andrés Gutiérrez, director de un centro informático, informa de que su sistema informático ha
experimentado tres fallos de componentes en los 100 últimos dı́as.
1. ¿Cuál es la probabilidad de que no haya ningún fallo en un dı́a dado?
2. ¿Cuál es la probabilidad de que haya uno o más fallos de componentes en un dı́a dado?
3. ¿Cuál es la probabilidad de que haya al menos dos fallos en un periodo de tres dı́as?
Solución: Un sistema informático moderno tiene un gran número de componentes, cada uno de los cuales puede
fallar y provocar ası́ un fallo del sistema informático. Para calcular la probabilidad de que haya fallos utilizando
la distribución de Poisson, supongamos que cada uno de los millones de componentes tiene la misma pequeñı́si-
ma probabilidad de fallar. Supongamos también que el primer fallo no afecta a la probabilidad de que haya un
segundo fallo (en algunos casos, estos supuestos pueden no cumplirse, en cuyo caso se utilizarı́an distribuciones
más complejas). La experiencia dice que el número esperado de fallos al dı́a es 3/100, es decir, λ = 0,03.
−0,03 0
1. P(ningún fallo en un dı́a dado)=P(X=0|λ = 0,03)= e 0!
λ
= 0,970446
2. La probabilidad de que haya al menos un fallo es el complementario de la probabilidad de que haya 0 fallos:
e−λ λk e−0,03 λ0
P (X ≥ 1) = 1 − P (X = 0) = 1 − k!
=1− 0!
= 1 − 0,970446 = 0,029554
3. EJEMPLO DE CAMBIO DE λ
P(al menos dos fallos en un periodo de 3 dı́as)=P (X ≥ 2|λ = 0,09), donde la media en un periodo de 3
dı́as es λ = 3(0,03)=0.09:
Se ha observado que la distribución de Poisson es especialmente útil en los problemas de listas de espera o
de colas. Algunos ejemplos son el número de clientes que llegan a una caja de un supermercado, el número de
camiones de reparto que llegan a un almacén central, el número de personas que se presentan a embarcar en un
vuelo, el número de estudiantes que aguardan a comprar libros de texto en la librerı́a universitaria, etc. En la
práctica, a menudo es posible representar los procesos de llegada de este tipo por medio de una distribución de
Poisson.
88
Estadı́stica
Ejercicio 4.3. Los clientes llegan a una fotocopiadora con una tasa media de dos cada 5 minutos. Supón que
estas llegadas son independientes, que la tasa de llegada es constante y que este problema sigue un modelo de
Poisson, donde X representa el número de clientes que llegan en un periodo de 5 minutos y la media λ = 2. Halla
la probabilidad de que lleguen más de dos clientes en un periodo de 5 minutos.
Solución:
e−2 20 e−2 21 e−2 22
P (X > 2) = 1 − P (X ≤ 2) = 1 − (P (X = 0) + P (X = 1) + P (X = 2)) = 1 − ( + + )=
0! 1! 2!
= 1 − (0,1353 + 0,2707 + 0,2707) = 0,32335
e−np · (np)k
P (X = k) = , para k = 0, 1, 2, ...
k!
Puede demostrarse que cuando en una distribución binomial n ≥ 20 y p ≤ 0,05 los valores obtenidos de las
probabilidades calculadas con un modelo binomial y con un modelo de Poisson son los mismos.
Ejercicio 4.4. Un analista ha predicho que el 3.5 % de todas las pequeñas empresas quebrará el próximo año.
Suponiendo que la predicción del analista es correcta, estima la probabilidad de que el próximo año quiebren al
menos 3 pequeñas empresas de una muestra aleatoria de 100 empresas.
Solución: Consideremos que X es el número de empresas que quiebran y que el concepto de “éxito”, en este
caso, significa la quiebra. La probabilidad de éxito serı́a p = 0,035. El problema se puede modelizar según una
distribución binomial X ∼Bin(n =100,p =0.035). Teniendo en cuenta que n p = 3,5 ≤ 7 y que n = 100 es grande,
podrı́amos resolver el cálculo de probabilidades aproximándolas con una distribución de Poisson con λ = n p = 3,5
P (X ≥ 3) = 1 − P (X < 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2)) =
e 3,50
−3,5
e−3,5 3,51 e−3,5 3,52
=1−( + + ) = = 1 − (0,030197 + 0,1056895 + 0,1849566) = 0,6791569
0! 1! 2!
Si la probabilidad se calcula con el modelo binomial se obtendrı́a P (X ≥ 3) = 0,684093.
89
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
Ejercicio 4.6. El número de ordenadores vendidos al dı́a en una tienda viene definido por la siguiente distribución
de probabilidad:
X 0 1 2 3 4 5 6
P(x) 0.05 0.10 0.20 0.20 0.20 0.15 0.10
a. ¿P(3≤x≤6)? c. ¿P(x≤4)?
b. ¿P(x>3)? d. d) ¿P(2<x≤5)?
Ejercicio 4.7. Una compañı́a aérea te ha pedido que estudies los retrasos de los vuelos que se registraron en un
aeropuerto la semana de antes de las Navidades. La variable aleatoria X es el número de vuelos retrasados por hora.
X 0 1 2 3 4 5 6 7 8 9
P(x) 0.10 0.08 0.07 0.15 0.12 0.08 0.10 0.12 0.08 0.10
c. ¿Cuál es la probabilidad de que haya entre tres y siete (inclusive) vuelos retrasados?
Ejercicio 4.8. Un concesionario de automóviles apunta la proporción de automóviles nuevos vendidos que se han
devuelto varias veces para que se corrijan los defectos durante el periodo de garantı́a. La tabla adjunta muestra
los resultados:
Num. de devoluciones 0 1 2 3 4
Proporción 0.28 0.36 0.23 0.09 0.04
Ejercicio 4.9. El director de una fábrica está considerando la posibilidad de sustituir una máquina de produc-
ción. El historial de la máquina indica la siguiente distribución de probabilidad del número de averı́as registradas
en una semana.
Num. de averı́as 0 1 2 3 4
Probabilidad 0.10 0.26 0.42 0.16 0.06
b. Se estima que cada averı́a le cuesta a la empresa 1500 euros de producción perdida. Halla la media y des-
viación tı́pica del coste semanal de averı́as de esta máquina.
90
Estadı́stica
Ejercicio 4.10. Un polı́tico cree que el 25 % de todos los macroeconomistas que ocupan altos cargos apoyarán
firmemente una propuesta que desea presentar. Supongamos que esta creencia es correcta y que se seleccionan
cinco marcroeconomistas aleatoriamente.
a. ¿Cuál es la probabilidad de que al menos uno de los cinco apoye firmemente la propuesta?.
Ejercicio 4.11. Una empresa instala calefacciones centrales y ha observado que en el 15 % de todas las instala-
ciones es necesario volver para hacer algunas modificaciones. Supón que esta semana se han hecho 10 instalaciones
de calefacción.
a. ¿Cuál es la probabilidad de que sea necesario volver en todos estos casos?
c. ¿Cuál es la probabilidad de que sea necesario volver en más de uno de estos casos?
Ejercicio 4.12. Los clientes llegan a una caja registradora ocupada a una tasa media de tres por minuto. Si las
llegadas siguen una distribución de Poisson, halla la probabilidad de que en un minuto dado lleguen dos clientes
o menos.
Ejercicio 4.13. El número de accidentes que se producen en una fábrica tiene una distribución de Poisson con
una media de 2.6 al mes.
1. ¿Cuál es la probabilidad de que haya menos de dos accidentes en un mes dado?
Ejercicio 4.14. Hacienda ha informado de que el 5.5 % de todos los contribuyentes comete errores al rellenar los
impresos de declaración de la renta. Si se eligen aleatoriamente 100 declaraciones, ¿cuál es la probabilidad de que
menos de 3 contengan errores?
Ejercicio 4.15. Una empresa tiene 250 computadores personales. La probabilidad de que uno cualquiera de ellos
necesite una reparación en una semana dada es 0.01. Halla la probabilidad de que menos de 4 de los computadores
personales necesiten una reparación en una semana dada.
Ejercicio 4.16. Supongamos que la probabilidad de tener una unidad defectuosa en una lı́nea de ensamblaje es
de 0.05. Si el conjunto de unidades terminadas constituye un conjunto de ensayos independientes:
Ejercicio 4.17. En un estudio sobre el medio ambiente, cada muestra de aire tiene un 10 % de posibilidades de
contener una molécula rara. Supón que las muestras extraı́das son independientes con respecto a la presencia de
la molécula rara. Calcula la probabilidad de que en 18 muestras, como mucho 2 contengan la molécula rara.
Ejercicio 4.18. Un lote contiene 100 piezas de un proveedor de tuberı́a local y 200 unidades de un proveedor de
tuberı́a del estado vecino. Si se seleccionan cuatro piezas al azar y sin reemplazo,
i. ¿cuál es la probabilidad de que todas sean del proveedor local?
91
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
ii. ¿Cuál es la probabilidad de que dos o más piezas de la muestra sean del proveedor local?
iii. ¿Cuál es la probabilidad de que al menos una pieza de la muestra sea del proveedor local?
Ejercicio 4.19. Un fabricante de faros para coches informa que en un envı́o de 4000 faros a un distribuidor, 500
tenı́an un ligero defecto. Si se compran al distribuidor 20 faros elegidos al azar. ¿Cuál es la probabilidad de que
haya exactamente dos con defecto?
92
Estadı́stica
4.5. Cuestionarios
La variable aleatoria X=número de hijos por familia de una ciudad, tiene la siguiente distribución de proba-
bilidad.
X 0 1 2 3 4 5 6
P(x) 0.47 0.3 0.1 0.06 0.04 0.02 0.01
Cuestión 0.1
El 8 % de los registros contables de una empresa presentan algún problema, si un auditor toma una muestra
de 70 registros, ¿cuál es la probabilidad de que existan como mucho 2 registros con problemas?.
a) 0, 02
b) 0, 08
c) 0, 92
d) Ninguna de las anteriores.
Cuestión 0.4
A un banco llegan en promedio 5 personas por minuto en un dı́a de ”quincena”. ¿Cuál es la probabilidad de
que lleguen más de 3 personas por minuto?
a) 0, 88
b) 0, 96
c) 0, 14
d) Ninguna de las anteriores.
93
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
Todos los dı́as se seleccionan de manera aleatoria 12 unidades de un proceso de manufactura, con el propósito
de verificar el porcentaje de unidades defectuosas en la producción. Con base a informaciones anteriores se
sabe que la probabilidad de tener una pieza defectuosa es 0,05. La gerencia ha decidido detener la producción
Cuestión 0.5
cada vez que una muestra de 12 unidades tenga dos o más defectuosas. ¿Cuál es la probabilidad de que en
cualquier dı́a la producción se detenga?.
a) 0, 12
b) 0, 88
c) 0, 99
d) Ninguna de las anteriores.
Cuestión 0.6
De un grupo de 10 personas se sabe que siete practican el fútbol y tres el básquetbol. Si se toma una muestra
aleatoria de tres de estas personas. Calcular la probabilidad de que exactamente dos practiquen fútbol.
a) 1, 45 · 10−3
b) 0, 47
c) 0, 53
d) Ninguna de las anteriores.
Según estudio realizado por la EMT de Valencia, el promedio de personas que llegan a la parada
Cuestión 0.7
.Albereda”para subir a la lı́nea de autobuses 94, es de 8 personas cada 10 minutos. ¿Cuál es la probabi-
lidad de que no llegue nadie a esa parada para coger el autobús 94 durante un periodo de 10 minutos?.
a) 3, 35 · 10−4
b) No se puede calcular.
c) 2, 68 · 10−3
d) Ninguna de las anteriores.
Cuestión 0.8
Un furgón contenı́a 20 computadoras electrónicas grandes, 2 de las cuales estaban defectuosas. Si se seleccio-
nan al azar tres computadoras del furgón, ¿cuál será la probabilidad de que dos de ellas tenga desperfectos?
a) 0, 05
b) 0, 27
c) 0, 02
d) Ninguna de las anteriores.
94
Estadı́stica
Una empresa produce artı́culos de cristal muy delicados. A pesar de las medidas de protección que se llevan
a cabo en el proceso de entrega, se estima que un 1 % de los artı́culos se rompen durante su transporte. Si se
Cuestión 0.1
realiza la entrega de un pedido de 20 artı́culos, ¿cuál es la probabilidad de que al menos 2 artı́culos lleguen
rotos a su lugar de destino?
a) 0.98
b) 0.82
c) 0.02
d) Ninguna de las anteriores es correcta.
Cuestión 0.2
Una compañı́a telefónica recibe llamadas a razón de 4 por minuto. Calcular la probabilidad de recibir 2
llamadas en un minuto.
a) 0.15
b) 0.09
c) 0.5
d) Ninguna de las anteriores es correcta.
Una compañı́a de seguros estima que el 40 % de los hogares contratan una póliza completa. La compañı́a
decide realizar una encuesta en una ciudad concreta, y selecciona 10 hogares al azar. Calcula el número
Cuestión 0.3
esperado de hogares con póliza completa. ¿Cuál es la probabilidad de que exactamente 5 hogares tengan
póliza completa?
a) 4 y 0.20
b) 5 y 0.40
c) 4 y 0.40
d) Ninguna de las anteriores es correcta.
Supongamos que tenemos una baraja de cartas españolas, dicha baraja consta de 40 cartas, y también sabemos
Cuestión 0.4
que hay 10 oros en la baraja. Si extraemos 8 cartas de la baraja (sin devolverlas), cuál es la probabilidad de
obtener 4 oros:
a) 0.17
b) 0.07
c) 0.03
d) Ninguna de las anteriores es correcta.
95
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
X 30 40 50 60
P(X) 0.4 0.2 0.1 0.3
a) 36 y 161 respectivamente
b) 43 y 161 respectivamente
c) 43 y 12.69 respectivamente
d) Ninguna de las anteriores es correcta.
Cuestión 0.6
En una entrevista de trabajo se presentan 16 candidatos, de los cuales 10 tienen un doble grado, si se
seleccionan 3 candidatos, cuál es la probabilidad de que exactamente uno tenga un doble grado:
a) 0.036
b) 0.27
c) 0.21
d) Ninguna de las anteriores es correcta.
Y = 2000x
Cuestión 0.7
En una empresa el término medio de accidentes es de 3 por mes. Calcular la probabilidad de que como mucho
ocurran 2 accidentes en un mes.
a) 0.98
b) 0.42
c) 0.2
d) Ninguna de las anteriores es correcta.
96
Estadı́stica
Una compañı́a telefónica recibe llamadas a razón de 3 por minuto. Calcular la probabilidad de no recibir
llamadas en un minuto.
a) 0.15
b) 0.09
c) 0.05
d) Ninguna de las anteriores es correcta.
Una empresa produce artı́culos de cristal muy delicados. A pesar de las medidas de protección que se llevan
a cabo en el proceso de entrega, se estima que un 3 % de los artı́culos se rompen durante su transporte. Si se
Cuestión 0.2
realiza la entrega de un pedido de 15 artı́culos, ¿cuál es la probabilidad de que al menos 2 artı́culos lleguen
rotos a su lugar de destino?
a) 0.92
b) 0.63
c) 0.08
d) Ninguna de las anteriores es correcta.
trabajadores para una inspección de seguridad indica la probabilidad de que 3 trabajadores no usen calzado
de seguridad:
a) 0.42
b) 0.03
c) 0.35
d) Ninguna de las anteriores es correcta.
97
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
Cuestión 0.4
En una urna tenemos 20 objetos, de los cuales 8 son defectuosos, si se seleccionan 6 objetos al azar, cuál es
la probabilidad de que 4 sean defectuosos:
a) 0.03
b) 0.05
c) 0.16
d) Ninguna de las anteriores es correcta.
Una compañı́a de seguros estima que el 20 % de los hogares contratan una póliza completa. La compañı́a
decide realizar una encuesta en una ciudad concreta, y selecciona 10 hogares al azar. Calcula el número
Cuestión 0.5
esperado de hogares con póliza completa. ¿Cuál es la probabilidad de que exactamente 4 hogares tengan
póliza completa?
a) 4 y 0.09
b) 2 y 0.09
c) 2 y 0.12
d) Ninguna de las anteriores es correcta.
Y = 2x + 4
Cuestión 0.6
En una empresa el término medio de accidentes es de 1 por mes. Calcular la probabilidad de que como mucho
ocurran 3 accidentes en un mes.
a) 0.98
b) 0.92
c) 0.06
d) Ninguna de las anteriores es correcta.
98
Estadı́stica
X 1 2 3 4
P(X) 0.3 0.25 0.15 0.3
a) 2 y 1.55 respectivamente
b) 2.5 y 1.25 respectivamente
c) 2.5 y 1.55 respectivamente
d) Ninguna de las anteriores es correcta.
X 10 12 14 15 17 20
P(X) 0.1 0.3 0.25 0.14 0.06 0.15
a) 17.6 y 8.83 respectivamente
b) 14.22 y 8.83 respectivamente
c) 14.22 y 2.97 respectivamente
d) Ninguna de las anteriores es correcta.
Cuestión 0.2
Si un banco recibe en promedio de 6 cheques sin fondo por dı́a, ¿cuál es la probabilidad de que reciba cuatro
cheques sin fondo en un dı́a dado?.
a) 0.1
b) 0.13
c) 0.3
d) Ninguna de las anteriores.
99
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
Una empresa dedicada a la venta de maquinaria ofrece a sus clientes dos formas de pago: ”pago al contado.o
Cuestión 0.3
”pagado aplazado”. Se sabe que el 10 % de los clientes utilizan el ”pago al contado”. Si en un mes se vendieran
6 máquinas, determinar la probabilidad de que al menos 2 fueran vendidas al contado.
a) 0.88
b) 0.35
c) 0.12
d) Ninguna de las anteriores es correcta.
Cuestión 0.4
En un taller se averı́an una media de 2 máquinas a la semana. ¿Calcular la probabilidad de que como mı́nimo
haya una averı́a en una semana?.
a) 0.86
b) 0.59
c) 0.27
d) Ninguna de las anteriores.
Cuestión 0.5
Tenemos un saco con 20 bolas, de las cuales 5 son amarillas. Si se extraen aleatoriamente y sin sustitución
10 bolas, cuál es la probabilidad de que 2 de ellas sean amarillas
a) 0.35
b) 0.07
c) 0.14
d) Ninguna de las anteriores es correcta.
Diez frigorı́ficos han sido devueltos a un distribuidor debido a la presencia de un ruido agudo cuando está en
funcionamiento. De los 10 frigorı́ficos devueltos, 4 tenı́an el compresor defectuoso y los restantes tenı́an otro
Cuestión 0.6
tipo de problema. Si se examina al azar 5 de éstos frigorı́ficos, indicar la probabilidad de que ninguno tenga
el compresor defectuoso.
a) 0.12
b) 0.24
c) 0.02
d) Ninguna de las anteriores es correcta.
El 5 % de los clientes de una entidad bancaria son morosos. Si se elige al azar una muestra de 20 clientes:
Cuestión 0.7
¿Cuál es el valor esperado de clientes morosos?, ¿Cuál es la probabilidad de encontrar al menos 1 cliente
moroso?
a) 2 y 0.64
b) 1 y 0.64
c) 1 y 0.36
d) Ninguna de las anteriores es correcta.
100
Estadı́stica
Y =x+2
Cuestión 0.8
Una empresa dedicada a la venta de maquinaria ofrece a sus clientes dos formas de pago: ”pago al contado.o
Cuestión 0.1
”pagado aplazado”. Se sabe que el 15 % de los clientes utilizan el ”pago al contado”. Si en un mes se vendieran
6 máquinas, determinar la probabilidad de que al menos 2 fueran vendidas al contado.
a) 0.38
b) 0.22
c) 0.78
d) Ninguna de las anteriores es correcta.
Cuestión 0.2
En un taller se averı́an una media de 5 máquinas a la semana. ¿Calcular la probabilidad de que como mı́nimo
haya una averı́a en una semana?.
a) 0.96
b) 0.99
c) 0.27
d) Ninguna de las anteriores.
101
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
El 3 % de los clientes de una entidad bancaria son morosos. Si se elige al azar una muestra de 30 clientes:
Cuestión 0.3
¿Cuál es el valor esperado de clientes morosos?, ¿Cuál es la probabilidad de encontrar al menos 1 cliente
moroso?
a) 1 y 0.40
b) 0.9 y 0.40
c) 0.9 y 0.60
d) Ninguna de las anteriores es correcta.
Cuestión 0.4
Si un banco recibe en promedio de 2 cheques sin fondo por dı́a, ¿cuál es la probabilidad de que no reciba
cheques sin fondo en un dı́a dado?.
a) 0.14
b) 0.27
c) 0.3
d) Ninguna de las anteriores.
X 0 1 2 3 4
P(X) 0.3 0.25 0.25 0.1 0.1
a) 2.5 y 1.65 respectivamente
b) 1.45 y 1.29 respectivamente
c) 1.45 y 1.65 respectivamente
d) Ninguna de las anteriores es correcta.
Cuestión 0.6
Una máquina ha fabricado 20 piezas, y sabemos que 2 de ellas son defectuosas. Se está preparando un pedido
de 15 piezas, calcula la probabilidad de que no haya ninguna defectuosa.
a) 0.53
b) 0.95
c) 0.05
d) Ninguna de las anteriores es correcta.
Cuestión 0.7
Tenemos una urna con 12 bolas, de las cuales 9 son azules, si se extraen sin reemplazo 8 bolas indicar la
probabilidad que haya 6 canicas azules.
a) 0.51
b) 0.31
c) 0.05
d) Ninguna de las anteriores es correcta.
102
Estadı́stica
Y = 3x + 2
Cuestión 0.8
103
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
104
Capı́tulo 5
Recordemos en el tema anterior estudiamos las variables aleatorias discretas y estas solo podı́an tomar una
cantidad numerable de valores xi y cada uno de estos valores tenı́a asociada una probabilidad, es decir disponı́amos
de una función P (X), a la que llamábamos función de distribución de probabilidad, que a cada valor de la variable
aleatoria le asignaba su probabilidad.
Ejemplo 5.1. Supongamos que se ha revisado una gran colección de libros para hacer un estudio sobre la
probabilidad de encontrar erratas al consultar una página elegida al azar. Si X representa el número de erratas
en una determinada página, transcurrido el estudio se obtienen los siguientes resultados:
Nótese que en este caso P (X) es realmente una función de distribución de probabilidades porque cumple las
dos propiedades pertinentes:
1. 0 ≤ P (X = xi ) ≤ 1 para cualquier valor xi .
P4
2. Las probabilidades individuales suman 1, es decir, i=1
P (X = xi ) = 1.
0.5
0.4
Probabilidad
0.3
0.2
0.1
0 1 2 3
Figura 5.1: Probabilidades de que haya un número determinado de erratas en una página.
Las variables aleatorias continuas no toman una cantidad numerable de valores xi , sino que toman una
infinidad de valores correspondientes a los puntos del intervalo de una recta. Algunos ejemplos de variables
aleatorias continuas son: la estatura, el peso, la temperatura o el tiempo de vida de un producto.
Hay una diferencia esencial entre variables discretas y continuas: la probabilidad de que una variable discreta
tome un valor concreto es mayor o igual a 0, pero la probabilidad de que una variable aleatoria continua tome
un valor concreto es siempre 0. Por ejemplo, la probabilidad de que salga exactamente un 1 al lanzar un dado
es 1/6=0.1667, lo mismo que que salga un 2, un 3, etc. En cambio, la probabilidad de que una persona mida
105
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
exactamente 180 cm es cero, porque podrı́amos distinguir entre infinidad de valores próximos a una estatura de 180
cm. Por ejemplo, ¿cómo podemos asegurar que alguien mide exactamente 180 y no 180.0000000000000000000001?.
Ahora bien, la probabilidad (o proporción de personas) que miden entre 150 cm y 200 cm no es cero. Por este
motivo, trabajaremos con las variables continuas de distinta forma a como lo hacı́amos con las variables discretas
(como vemos, ya no podemos dar todos los posibles valores y sus probabilidades).
frecuencias relativas
frecuencias relativas
densidad
Figura 5.2: Histogramas de frecuencias relativas para tamaños de muestra cada vez más grandes.
Las propiedades que cumple la función de densidad de una variable continua se asemejan a las propiedades
de la función de distribución de probabilidad de una variable discreta:
Z ∞
1. El área bajo la función de densidad es 1, es decir f (x) dx=1.
−∞
2. La probabilidad de que la variable continua X tome valores en un intervalo [a, b], con −∞ ≤ a ≤ b ≤ ∞, es
igual al área bajo la función de densidad entre los puntos a y b, es decir
Z b
P (a ≤ X ≤ b) = f (x) dx y 0 ≤ P (a ≤ X ≤ b) ≤ 1.
a
106
Estadı́stica
1.0
0.8
0.6
0.4
0.2
0.0
a b
La función de distribución acumulada, F (x), de una variable aleatoria continua X expresa la probabilidad de
que X tome valores menores o iguales que x, es decir
F (x) = P (X ≤ x)
Como consecuencia de esta definición, la probabilidad de que la variable continua X tome valores entre a y b
se puede expresarla como P (a ≤ X ≤ b) = F (b) − F (a).
f(x) F(x)
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
x x
107
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
0, si x < 0
(
f (x) = 0,5x, si 0 ≤ x ≤ 2
0, si x > 2
1. Comprueba que f(x) es una función de densidad.
2. Calcula P (X ≤ 0,75).
3. Calcula P (X ≤ 1,25).
4. Calcula P (0,75 ≤ X ≤ 1,25).
Solución:
Z 0 Z ∞
R∞ R2 2 2 2
1. −∞
f (x)dx = 0 dx + 0
0,5x dx + 0 dx = [0,5 x2 ]20 = 0,5 22 − 0,5 02 = 1 Por lo tanto, f (x) es una
−∞
| {z } | 2 {z }
0 0
función de densidad.
2. Considerando la función de distribución de probabilidad acumulada:
0, si x < 0
2
F (x) = 0,5 x2 , si 0 ≤ x ≤ 2
1, si x > 2
1.0
1.0
0.8
0.8
0.8
0.6
0.6
0.6
f(x)
f(x)
f(x)
P(X<1.25) P(0.75<X<1.25)
0.4
0.4
0.4
P(X<0.75)
0.2
0.2
0.2
0.0
0.0
0.0
−2 −1 0 1 2 3 −2 −1 0 1 2 3 −2 −1 0 1 2 3
x x x
Diremos que xp (un valor posible de la variable X ) es el percentil p.100 ó percentil p de la variable X si hay
un p1̇00 % de valores de X menores o iguales que xp .
108
Estadı́stica
Asimismo, si g(X) es cualquier función de la variable aleatoria X, el valor esperado E(g(X)) de esta función
es el valor medio obtenido en “infinitas” pruebas. El cálculo serı́a similar al que planteamos para funciones de
variables aleatorias discretas:
Z
µg(X) = E(g(X)) = g(x) · f (x) dx,
109
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
σY = |b|σX
En el caso especial en que a= −µ
σX
X
y b= σ1X , la nueva variable aleatoria Y es la variable aleatoria estandarizada
de X:
X − µX
Y =
σX
En este caso,
X − µX −µX 1
µY = E(Y ) = E( ) = a + bµX = + · µX = 0
σX σX σX
X − µX 1 2 2
σY2 = V ar( ) = b2 σ X
2
=( ) σX = 1
σX σX
Ejercicio 5.2. El propietario de un piso estima que dentro del rango de temperaturas probables, su factura de
calefacción de enero, Y , será Y = 290 − 5T (en euros), donde T representa la temperatura media del mes, en
grados. Si la temperatura media de enero puede representarse mediante una variable aleatoria que tiene una media
de 24 grados y una desviación tı́pica de 4 grados, halla la media y desviación tı́pica de la factura de la calefacción
de enero de este propietario.
Solución: La variable aleatoria T tiene una media µT = 24 y una desviación tı́pica σT = 4. Por lo tanto, la
factura esperada de la calefacción es
µY = E(290 − 5T ) = 290 − 5µT = 290 − 5 · 24 = 170 e.
Como la probabilidad de que un valor de X esté en cualquier zona es la misma, la función de densidad tiene
la misma altura en todos los puntos del intervalo (a, b):
1
(
, si a ≤ x ≤ b
f (x) = b−a
0, en caso contrario.
1/(b−a)
a b
Figura 5.6: Función de densidad de una variable aleatoria X que sigue una distribución uniforme entre a y b
(X∼Un(a,b)).
110
Estadı́stica
La Función de Probabilidad Acumulada de una variable aleatoria X que sigue una distribución uniforme entre
a y b (X∼Un(a,b)) puede calcularse, directamente, utilizando:
0,
x≤a
x−a
F (x) = , a <x<b
b−a
1,
x≥b
El valor esperado o media, E(X), de una variable aleatoria X que sigue una distribución uniforme entre a y
b es el punto medio entre estos dos valores, es decir µ = E(X) = a+b
2
.
Solución: La distancia (en kilómetros) a la que surge cualquier grieta puede representarse por medio de una
variable aleatoria distribuida uniformemente: X∼Un(0,2).
La probabilidad de que surja una grieta entre 0.5 kilómetros y 1.5 en el oleoducto es el área situada debajo
de la función de densidad entre x = 0,5 y x = 1,5:
f(x)
0.5
0 0.5 1 1.5 2
Kilómetros
111
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
a+b 0+2
µ= = =1
2 2
√ √ √
b−a 2−0 2 12 2 12 3
σ= √ = √ = = =
12 12 12 12 3
La distribución normal es la distribución de probabilidad que más se utiliza para modelizar variables aleatorias
continuas en el ámbito de la economı́a y las aplicaciones empresariales.
Algunas de las razones por las que se utiliza frecuentemente son:
1. La distribución normal es una aproximación muy buena de la distribución de probabilidad de una amplia
variedad de variables aleatorias continuas. Por ejemplo, las dimensiones de las piezas y el peso de los
paquetes de alimentos siguen con frecuencia una distribución normal, por lo que tiene muchas aplicaciones
en el control de calidad. Las ventas o la producción a menudo siguen una distribución normal, por lo que
esta tiene una gran cantidad de aplicaciones en el marketing y en la gestión de la producción. Las pautas de
los precios de las acciones y de los bonos también se analizan utilizando la distribución normal en grandes
modelos informáticos de contratación financiera. Los modelos económicos utilizan la distribución normal
para algunas medidas económicas.
2. Las distribuciones de las medias muestrales siguen una distribución normal, si el tamaño de la muestra es
“grande”.
3. La distribución de probabilidad normal ha llevado a tomar buenas decisiones empresariales en algunas
aplicaciones.
La función de densidad de una variable aleatoria continua X que sigue una distribución normal N(µ,σ) es:
1 −
(x−µ)2
f (x) = √ ,
e 2σ 2
2πσ 2
donde µ y σ son números tales que −∞ < µ < ∞ y 0 < σ < ∞. Además e y π son las constantes e = 2,71828...
y π = 3,14159...
0.4 2
f (x) = √1 e−(1/2)x
2π
0.3
0.2
0.1
0
-3 -2 -1 0 1 2 3
112
Estadı́stica
0.05
0.04
0.03
0.02
0.01
0
20 40 60 80
0.1
0.08
0.06
0.04
0.02
0
20 40 60 80
Al igual que hemos visto en los apartados anteriores, la probabilidad de que una variable aleatoria X ∼ N(µ, σ)
tome valores en un intervalo [a, b], se corresponde con el área situada bajo la función de densidad entre a y b,
como muestra la Figura 5.10. Hasta ahora, el cálculo de esta probabilidad lo hemos resulto utilizando la función
de distribución acumulada F (x), de tal manera que:
a b
Figura 5.10: Función de densidad normal. El área sombreada indica P (a < X < b).
113
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
X −µ
Z=
σ
Este importante resultado nos permite utilizar la tabla de la función de distribución acumulada de una normal
estándar para calcular las probabilidades de cualquier variable normalmente distribuida.
Veamos como utilizar esta tabla para calcular las probabilidades de una normal estándar. La tabla propor-
ciona los valores F (z) = P (Z ≤ z) correspondientes a los valores no negativos de z. Por ejemplo, P (Z ≤ 1,25) =
F (1,25) = 0,8944.
Los valores de la función de distribución acumulada correspondiente a los valores negativos de Z pueden
deducirse utilizando la simetrı́a de la función de densidad. Por ejemplo:
.
Calculemos, por ejemplo, las siguientes probabilidades usando la tabla:
1. P (Z < 1,63) = 0,9484
2. P (Z < 0,14) = 0,5557
3. P (Z > 1,90) = 1 − P (Z < 1,90) = 1 − 0,9713 = 0,0287
4. P (Z > 2,5) = 1 − P (Z < 2,50) = 1 − 0,9938 = 0,0062
5. P (1,21 < Z < 1,94) = P (Z < 1,94) − P (Z < 1,21) = 0,9738 − 0,8869 = 0,0869
Veamos cómo podemos calcular los percentiles a partir de la tabla. Recordemos que si P (X < 1,00) = 0,8413,
entonces:X = 1 es el percentil 84,13. Ası́ pues, si queremos saber cuál es el percentil 0,8413, buscamos la proba-
bilidad 0.8413 en la zona de la tabla donde están las probabilidades y observamos el valor que le corresponde, 1.
Ejercicio 5.3. Una empresa produce bombillas cuya duración sigue una distribución normal que tiene una
media de 1200 horas y una desviación tı́pica de 250 horas. Si elegimos una bombilla aleatoriamente, ¿cuál es la
probabilidad de que dure entre 900 y 1300 horas? y ¿cuál es el percentil 0,6554?
Solución:
900 − 1200 X − 1200 1300 − 1200
P (900 < X < 1300) = P ( < < ) = P (−1,2 < Z < 0,4) =
250 250 250
= F (0,4) − F (−1,2) = F (0,4) − (1 − F (1,2)) = 0,6554 − (1 − 0,8849) = 0,5403.
Por lo tanto, la probabilidad de que una bombilla dure entre 900 y 1300 horas es aproximadamente de 0.54.
Para calcular el percentil 0,6554 de X:
X − 1200 x0 − 1200
P (X < x0 ) = 0, 6554 =⇒ P ( < ) = 0,6554
250 250
114
Estadı́stica
En términos de Z:
P (Z < z0 ) = 0,6554 =⇒ z0 = 0,4
Como
x0 − 1200
z0 = = 0,4
250
despejando x0 tenemos que x0 = 1300
Ejercicio 5.4. Un grupo muy numeroso de estudiantes obtiene unas calificaciones de 0 a 100 puntos, que siguen
una distribución normal con media 60 puntos y una desviación tı́pica de 15 puntos. ¿Qué proporción de los
estudiantes obtiene una calificación de entre 85 y 95 puntos?
Solución:
85 − 60 X − 60 95 − 60
P (85 < X < 95) = P ( < < )) = P (1,67 < Z < 2,33) =
15 15 15
= F (2,33) − F (1,67) = 0,9901 − 0,9525 = 0,0376.
Es decir, el 3.76 por ciento de los estudiantes obtuvo una calificación comprendida entre 85 y 95.
115
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
116
Estadı́stica
En este apartado veremos cómo puede utilizarse la distribución normal como aproximación de las variables
aleatorias discretas binomiales y proporcionales que se emplean frecuentemente en el mundo empresarial y en la
economı́a.
En el tema anterior vimos que una variable aleatoria binomial, X ∼ Bin(n, p), expresaba el número de éxitos k
ocurridos en n experimentos en los que la probabilidad de éxito es p y por lo tanto, la probabilidad de fracaso es
1 − p. Vimos que en ese caso, el valor esperado y la varianza de la variable aleatoria eran:
E(X) = µ = np
Var(X) = σ 2 = np(1 − p)
La representación de una distribución binomial cuando p = 0,5 y n = 100, muestra que la distribución bino-
mial tiene la misma forma que la normal, como se puede ver en la Figura 5.11. Esta es una evidencia visual de que
la distribución binomial puede aproximarse con una distribución normal de la misma media y varianza siempre
que se cumpla esta relación entre las distribuciones. Una regla para calcular si existe una relación evidente entre
la distribución binomial y la distribución normal es que se cumpla np(1 − p) > 9.
0.08
0.06
p(x)
0.04
0.02
0.00
35 40 45 50 55 60
Número de éxitos
La metodologı́a para resolver el cálculo de probabilidades serı́a similar a la que hemos visto en el apartado
anterior. Supongamos que X ∼ Bin(n, p), con esperanza µ = n p y con varianza σ 2 = n p (1 − p) > 9. Entonces
podemos considerar que X ∼ N(µ = n p, σ 2 = n p (1 − p)). Para hallar la probabilidad de que el número de éxitos
se encuentre entre a y b, inclusive, harı́amos lo siguiente:
a−µ X −µ b−µ a − np b − np
P (a ≤ X ≤ b) ' P ( ≤ ≤ ) = P(p ≤Z≤ p ),
σ σ σ np(1 − p) np(1 − p)
donde Z se distribuye según una normal estándar N(0,1).
Ejemplo 5.3. Una vendedora se pone en contacto por teléfono con posibles clientes en un intento de averiguar si
es probable que merezca la pena ir a su casa a verlos. Su experiencia sugiere que en el 40 % de los contactos iniciales
acaba yendo a casa del cliente. Si se pone en contacto con 100 personas por teléfono, ¿cuál es la probabilidad de
que vaya a ver a entre 45 y 50 personas?
117
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
Solución: Si X es el número de personas a las que va a ver la vendedora, X sigue una distribución binomial
Bin(n = 100, p = 0,4). Como np(1 − p) = 24 > 9, X se puede aproximar con una distribución normal N(40, 24), ya
que E(X) = np = 1000,4 = 40 y Var(X) = np(1 − p) = 100 · 0,4 · 0,6 = 24. Por lo tanto, X se puede transformar
en Z ∼ N(0, 1).
45 − 100 · 0,4 50 − 100 · 0,4
P (45 ≤ X ≤ 50) ' P ( √ ≤Z≤ √ )=
100 · 0,4 · 0,6 100 · 0,4 · 0,6
= P (1,02 ≤ Z ≤ 2,04) = F (2,04) − F (1,02) = 0,9793 − 0,8461 = 0,1332
0.05
0.00
0 5 10 15
118
Estadı́stica
Ejercicio 5.5. El tiempo que se dedica a atender al público en el mostrador de información de una biblioteca
puede representarse mediante una distribución exponencial que tiene un tiempo medio de atención de 5 minutos.
¿Cuál es la probabilidad de que el tiempo de atención al público sea de más de 10 minutos?
¿Cuál es el percentil 25?
Solución: Sea t el tiempo de atención en minutos. La tasa de atención es λ= 15 =0.2 por minuto y la función de
densidad es
f (t) = 0,2 · e−0,2t
La probabilidad que buscamos es:
Una variable aleatoria continua X, sigue una distribución ji cuadrado con n grados de libertad, si su función
de probabilidad es la siguiente:
1 x n
f (X) = n e 2 X ( 2 −1)
2 2 Γ( n2 )
Esta función está definidad para x > 0.
Supongamos que Z1 , Z2 ,..., Zk son variables aleatorias normales tipificadas N (0, 1) independientes entre sı́, la
suma cuadrática de todas ellas es una variable aleatoria X, que se distribuye según una χ2 con n grados de libertad.
El valor esperado de una distribución ji cuadrado con n grados de libertad es n y su varianza es 2n.
En el cálculo de probabilidades sobre distribuciones ji cuadrado con n grados de libertad, lo más frecuente
es que se desee conocer el área entre la curva y el eje de abcisas para valores de la variable mayores que un
valor determinado. Al área que queda a la derecha de un valor determinado se le denomina α y representa la
probabilidad de obtener un valor de la variable mayor que el indicado, el área a la izquierda se le denomina 1 − α.
El cálculo de probabilidades correspondientes a variables que siguen distribuciones ji cuadrado se realiza
consultando tablas estadı́sticas. Hay varios tipos de tablas, es por ello que antes de consultarla se recomienda
observar con qué tipo de tabla estamos trabajando. La tabla que empleamos nosotros está basada en la función
de distribución acumulativa.
La primera columna indica los grados de libertad, y la primera fila nos indica el área que queda a la izquierda
del valor que aparece en la tabla. Por ejemplo, para n = 1 grados de libertad y p = 0,95 está el valor 3.8415, esto
significa que el 95 % de los valores de variables aleatorias que se distribuyen según una ji cuadrado con un grado
de libertad tienen valores menores de 3.8415, la probabilidad de obtener un valor mayor a 3.8415 es de 0.05. Esto
lo podemos expresar de las siguientes formas:
χ21;0,05 = 3,8415,
P (χ21 < 3,8415) = 0,95,
P (χ21 > 3,8415) = 0,05.
119
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
0, si t < 0
(
f (t) = 2, si 0 ≤ t ≤ 1/2
1, si t > 1/2
Comprueba que es una función de densidad y calcula su función de distribución. Además, calcula la siguientes
probabilidades
b. P (X > −20)
e. Calcula P (1,75 ≤ X ≤ 2,25)
c. P (0,1 ≤ X ≤ 0,75)
0, si x < 1
x − 1, si 1 ≤ x ≤ 2
f (x) =
−x + 3, si 2 ≤ x ≤ 3
0, si x > 3
a. Comprueba que f (x) es una función de densidad. f. Calcula la probabilidad P (≤ X ≤ 2,8)
b. Obtén la función de distribución. g. Calcula p(X ≤ 1,5)
c. Calcula la probabilidad P (X ≤ 1,5)
d. Calcula la probabilidad P (X ≥ 2,8) h. Calcula p(1,75 ≤ X ≤ 2,25)
e. Calcula la probabilidad P (X ≤ 2,8)
1 + x , si 0 ≤ x ≤ 3
2
f (x) = m
0, en otro caso.
Averigua el valor de m para que f (x) sea una función de densidad. Obtén la función de distribución. Calcula
las siguientes probabilidades, para el m obtenido en el apartado anterior:
a. P (X ≤ 1)
c. P (X > 1)
b. P (1 ≤ X ≤ 2)
Ejercicio 5.9. Supongamos que la duración en minutos de las llamadas telefónicas sigue una distribución dada
por la función:
F (x) = 1 − e−x/3
Calcular la probabilidad de que la duración de una llamada cualquiera sea:
1. superior a 6 minutos.
2. inferior a 10 minutos.
3. igual a 6 minutos.
Ejercicio 5.10. Sea una variable X que sigue una distribución uniforme con parámetros a = −2 y b = 4,5, es
decir X ∼ U n(a = −2, b = 4,5). Calcula su función de distribución de probabilidad acumulada y después calcula
estas probabilidades utilizando dicha función de probabilidad acumulada:
120
Estadı́stica
Ejercicio 5.11. Siendo Z ∼ N (0, 1) calculad las siguientes probabilidades. Representad la variable y cada
probabilidad.
a. P (Z < 0) g. P (1 ≤ Z ≤ 2)
b. P (Z < 1) h. P (−1 ≤ Z ≤ 1)
c. P (Z ≤ 1)
i. P (−2 ≤ Z ≤ 2)
d. P (Z > 1)
e. P (Z < 2) j. P (−3 ≤ Z ≤ 3)
f. P (Z < 3) k. P (Z > 3)
Ejercicio 5.12. Sea X ∼ N (20, 5), representad gráficamente la variable y calculad y dibujad las siguientes
probabilidades.
Ejercicio 5.14. Una empresa produce bombillas cuya duración sigue una distribución normal que tiene una
media de 1200 horas y una desviación tı́pica de 250 horas. Si elegimos una bombilla aleatoriamente, ¿cuál es la
probabilidad de que dure entre 900 y 1300 horas?
Ejercicio 5.15. Un autor recibe de una editorial un contrato, según el cual recibe una cantidad fija de 10000
euros más 1.50 euros por cada ejemplar que se venda de su libro. Su incertidumbre sobre las ventas totales del
libro pueden representarse por medio de un variable aleatoria que tiene una media de 30 000 y una desviación
tı́pica de 8000. Halla la media y la desviación tı́pica de la cantidad total de dinero que recibirá.
Ejercicio 5.16. Una organización benéfica solicita donaciones por teléfono. Los empleados reciben 60 euros más
un 20 % del dinero que generan las llamadas cada semana. La cantidad de dinero generada en una semana puede
concebirse como una variable aleatoria que tiene una media de 700 euros y una desviación tı́pica de 130 euros.
Halla la media y la desviación tı́pica de la remuneración total de un empleado en una semana.
Ejercicio 5.17. Se sabe que la cantidad de dinero que gastan los estudiantes en libros de texto en un año en una
universidad sigue una distribución normal que tiene una media de 380 euros y una varianza de 2500 euros.
a. ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste menos de 400 euros en libros de
texto en un año?
b. ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste más de 360 euros en libros de
texto en un año?
c. Explica gráficamente por qué las respuestas de los apartados (a) y (b) son iguales.
d. ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste entre 300 euros y 400 euros en
libros?
121
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
Ejercicio 5.18. Una compañı́a de alquiler de automóviles ha observado que la probabilidad de que un automóvil
necesite una reparación en un mes cualquiera dado es 0.2. La compañı́a tiene 900 automóviles. Idea: Usa para
los cálculos la aproximación normal a la binomial.
a. ¿Cuál es la probabilidad de que más de 200 automóviles necesiten una reparación en un mes determinado?
b. ¿Cuál es la probabilidad de que menos de 175 automóviles necesiten una reparación en un mes determinado?
Ejercicio 5.19. La duración de una determinada marca de neumáticos sigue una distribución normal que tiene
una media de 35 000 kilómetros y una desviación tı́pica de 4000 kilómetros.
i. ¿Qué proporción de estos neumáticos tiene una duración de más de 38 000 kilómetros?
ii. ¿Qué proporción de estos neumáticos tiene una duración de menos de 38 000 kilómetros?
iii. ¿Qué proporción de estos neumáticos tiene una duración de entre 32 000 y 38 000 kilómetros?
Ejercicio 5.20. Se encuesta a una muestra de 100 obreros de una gran empresa para saber qué piensa de un
nuevo plan de trabajo propuesto. Si el 60 % de todos los obreros de esta empresa es partidario de este nuevo plan,
¿cuál es la probabilidad de que menos de 50 de los miembros de la muestra sea partidario del plan?. Idea: Usa
para los cálculos la aproximación normal a la binomial.
Ejercicio 5.21. Una vendedora de perfumes quiere averiguar si tiene sentido vender perfumes a domicilio. Su
experiencia sugiere que en el 40 % de los clientes están de acuerdo. Si se pone en contacto con 100 personas por
teléfono, ¿cuál es la probabilidad de que vaya a ver a entre 45 y 50 personas?
Ejercicio 5.22. Tras un test de cultura general se observa que las puntuaciones obtenidas siguen una distribu-
ción N (65, 18). Se desea clasificar a los examinados en tres grupos (de baja cultural general, de cultura general
aceptable, de excelente cultura general) de modo que hay en el primero un 20 % la población, un 65 % el segundo
y un 15 % en el tercero. ¿Cuáles han de ser las puntuaciones que marcan el paso de un grupo al otro?.
Ejercicio 5.23. El salario mensual de un vendedor se distribuye de manera uniforme entre 120 euros, que es su
sueldo base, y 780 euros. ¿Cuál es la probabilidad de que en un mes cualquiera gane más de 550 euros?. ¿Y de
qué gane menos de 700 euros?
Ejercicio 5.24. El personal de una importante compañı́a usa una terminal para realizar sus pedidos internacio-
nales. Si el tiempo que cada comercial gasta en una sesión en la terminal tiene una distribución exponencial con
media de 36 minutos, calcular la probabilidad de que utilice la terminal 30 minutos o menos.
Ejercicio 5.25. Sabiendo que la clase de Estadı́stica comienza a las 10 horas y que el profesor que imparte dicha
asignatura emplea en el trayecto de su casa a la Facultad entre 15 y 20 minutos de forma uniforme, calcular a
qué hora debe salir de casa para que pueda llegar puntualmente a dar su clase con una probabilidad del 99 %.
Ejercicio 5.26. Un componente eléctrico tiene una vida media de 8 años. Si su vida útil se distribuye en forma
exponencial. ¿Cuál debe ser el tiempo de garantı́a que se debe otorgar, si se desea reemplazar a lo más el 15 % de
los componentes que fallen dentro de este perı́odo?
Ejercicio 5.27. Dada una distribución uniforme X en un intervalo [2, 7], indicad cuál es el valor esperado de
dicha variable.
Ejercicio 5.28. Dada una distribución uniforme X en un intervalo [2, 7], indicad cuál es la varianza de dicha
variable.
122
Estadı́stica
5.8. Cuestionarios
Las ventas diarias de una librerı́a siguen una distribución uniforme entre los 600 y los 1000 euros. Calcular
la probabilidad de que un dı́a la cifra de ventas supere los 900 euros.
a) 0,5
b) 0,25
c) 0,75
d) Ninguna de las anteriores.
El tiempo de retraso de un determinado vuelo de una compañı́a área sigue una distribución normal de media
Cuestión 1.2
10 minutos y desviación tı́pica 5 minutos. ¿Cuál es el tiempo mı́nimo de retraso del 2,5 % de los vuelos que
más se retrasan?.
a) 19,8 minutos
b) 0,2 minutos
c) 1,96 minutos
d) Ninguna de las anteriores.
Una máquina debe llenar botes de jalea con gramos de producto, pero no lo hace exactamente. Los pesos
Cuestión 1.3
reales de contenido siguen una ley normal. Si la media es de 300 gramos y una desviación de 4 gramos. ¿qué
proporción de botes tendrán menos de 308 gramos?.
a) 0,9772
b) 97,72 %
c) 2 %
d) Ninguna de las anteriores.
El tiempo de funcionamiento de una bombilla de distribuye como exponencial con una media de 10 dı́as.
Cuestión 1.4
¿Cuál es la probabilidad de que una bombilla funcione más de 10 dı́as? SI ES NECESARIO REDONDEAR
AL SEGUNDO DECIMAL.
a) 0,37
b) 0,63
c) 0,96
d) Ninguna de las anteriores.
123
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
Cuestión 1.5
El tiempo máximo que se puede reservar una sala de conferencias grande de cierta empresa son 4 horas. Con
mucha frecuencia tienen conferencias extensas y breves. De echo se sabe que la duración X de una conferencia
Cuestión 1.6
tiene una distribución uniforme en el intervalo [0, 4]. Si la probabilidad de que una conferencia dure como
mucho un determinado tiempo es 0,9, ¿cuál es el valor de ese tiempo?.
a) No se puede calcular.
b) 7,6 horas
c) 3,6 horas
d) Ninguna de las anteriores.
Cuestión 1.7
En un experimento de laboratorio se utiliza cierto material. Sabiendo que la duración media de un átomo de
Cuestión 1.8
esta materia es de 140 dı́as y sigue una distribución exponencial, ¿cuántos dı́as transcurrirán hasta que haya
desaparecido el 90 % de este material? SI ES NECESARIO REDONDEAR AL SEGUNDO DECIMAL.
a) No se puede calcular porque de negativo.
b) 322,36
c) 677,08
d) Ninguna de las anteriores.
124
Estadı́stica
Se sabe que la estatura en centı́metros de los alumnos matriculados en primero de esta Universidad sigue
una distribución normal de media 175 cm y desviación tı́pica de 8 cm. Calcula la probabilidad de que un
Cuestión 2.1
a) 0.63
b) 0.16
c) 0.34
d) Ninguna de las anteriores es correcta.
Cuestión 2.2
Dado el enunciado anterior, calcula el valor que deja por debajo el 95 % de los alumnos
a) 161.84
b) 188.16
c) 191.01
d) Ninguna de las anteriores es correcta.
El tiempo de revisión del motor de un avión sigue una distribución exponencial con media 22 minutos.
Cuestión 2.3
a) 1
b) 0.37
c) 0.63
d) Ninguna de las anteriores es correcta.
El tiempo de vida de una lámpara especial sigue una distribución exponencial con media 100 horas. ¿Cuántas
Cuestión 2.4
horas como máximo transcurrirán para el 10 % de las lámparas que menos duran?
a) 10.54 horas
b) No se puede calcular.
c) 230.62 horas
d) Ninguna de las anteriores es correcta.
125
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
El ingreso semanal, en euros, de un pequeño comercio sigue una distribución uniforme entre los valores 5,000
Cuestión 2.5
y 10,000 euros. Calcula la probabilidad de que una semana se ingrese entre 7.000 y 8.000 euros.
a) 0.20
b) 0.33
c) 0.67
d) Ninguna de las anteriores es correcta.
Cuestión 2.6
Dado el enunciado anterior, ¿cuál es el ingreso semanal máximo que alcanzan el 90 % de las semanas?
a) 7500
b) 9500
c) 9000
d) Ninguna de las anteriores es correcta.
El ingreso semanal, en euros, de un pequeño comercio sigue una distribución uniforme entre los valores 5,000
Cuestión 2.7
y 10,000 euros. Calcula la desviación tı́pica de los ingresos semanales de este comercio.
a) 866.03
b) 7500
c) 1443.38
d) Ninguna de las anteriores es correcta.
Una empresa se dedica a poner máquinas expendedoras de bebidas en distintos hospitales. El alquiler del
espacio que utiliza le cuesta 100 euros diarios y gana 1.4 euros por cada bebida vendida. Si las ventas de
bebidas diarias tienen un valor esperado de 150 y una desviación tı́pica de 30, ¿Cuál es el beneficio diario
Cuestión 2.8
a) 130
b) 210
c) 110
d) Ninguna de las anteriores es correcta.
126
Estadı́stica
Las calificaciones de los alumnos que se presentan al examen de estadı́stica se distribuye normalmente con
Cuestión 3.1
una media de 6.5 y una varianza de 4. Calcula la probabilidad de que las calificaciones estén comprendidas
entre 5 y 7.5 puntos
a) 0.25
b) 0.46
c) 0.08
d) Ninguna de las anteriores es correcta.
Cuestión 3.2
Dado el enunciado anterior, calcula el valor que deja por encima el 95 % de las calificaciones
a) 0.12
b) 3.21
c) 9.79
d) Ninguna de las anteriores es correcta.
El tiempo de revisión del motor de un avión sigue una distribución exponencial con media 15 minutos.
Cuestión 3.3
a) 7,18 · 10−66
b) 0.49
c) 0.51
d) Ninguna de las anteriores es correcta.
127
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
El tiempo de vida de una lámpara especial sigue una distribución exponencial con media 75 horas. ¿Cuántas
Cuestión 3.4
horas como máximo transcurrirán para el 15 % de las lámparas que menos duran?
a) No se puede calcular
b) 2,17 · 10−3
c) 12.19
d) Ninguna de las anteriores es correcta.
El ingreso semanal, en euros, de un pequeño comercio sigue una distribución uniforme entre los valores 6,000
Cuestión 3.5
y 9,000 euros. Calcula la probabilidad de que una semana se ingrese entre 7.000 y 8.000 euros.
a) 0.20
b) 0.33
c) 0.67
d) Ninguna de las anteriores es correcta.
Cuestión 3.6
Dado el enunciado anterior, ¿cuál es el ingreso semanal máximo que alcanzan el 80 % de las semanas?
a) 8400
b) 7500
c) 7200
d) Ninguna de las anteriores es correcta.
El ingreso semanal, en euros, de un pequeño comercio sigue una distribución uniforme entre los valores 6,000
Cuestión 3.7
y 9,000 euros. Calcula la desviación tı́pica de los ingresos semanales de este comercio.
a) 866.03
b) 7500
c) 1443.38
d) Ninguna de las anteriores es correcta.
128
Estadı́stica
Una empresa se dedica a poner máquinas expendedoras de bebidas en distintos hospitales. El alquiler del
espacio que utiliza le cuesta 150 euros diarios y gana 1.4 euros por cada bebida vendida. Si las ventas de
bebidas diarias tienen un valor esperado de 160 y una desviación tı́pica de 40, ¿Cuál es el beneficio diario
Cuestión 3.8
a) 130
b) 280
c) 210
d) Ninguna de las anteriores es correcta.
Se sabe que el peso medio en kilos de los alumnos varones matriculados en primero de esta Universidad
sigue una distribución normal de media 74 kg y desviación tı́pica de 6 kg. Calcula la proporción de alumnos
Cuestión 4.1
a) 16 %
b) 84 %
c) 68 %
d) Ninguna de las anteriores es correcta.
Cuestión 4.2
Dado el enunciado anterior, calcula el valor que deja por debajo el 97.5 % de los pesos de los alumnos varones
a) 83.87
b) 85.76
c) 64.24
d) Ninguna de las anteriores es correcta.
129
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
El tiempo de vida media de un marcapasos sigue una distribución exponencial con media 16 años. Calcular
la probabilidad de que una persona a la que se ha implantado un marcapasos se le deba de implantar otro
Cuestión 4.3
antes de 20 años.
a) 0.71
b) 0.29
c) 1
d) Ninguna de las anteriores es correcta.
El tiempo de vida media de un marcapasos sigue una distribución exponencial con media 16 años. Calcular
Cuestión 4.4
a) 1.69
b) 36.84
c) No se puede calcular
d) Ninguna de las anteriores es correcta.
Una empresa cervecera familiar ha estimado que la demanda diaria de sus clientes sigue una distribución
uniforme entre 100 y 150 litros. Calcula la probabilidad de que la demanda de un dı́a cualquiera esté entre
Cuestión 4.5
130 l. y 140 l.
a) 0.20
b) 0.80
c) 0.60
d) Ninguna de las anteriores es correcta.
Dado el enunciado anterior, ¿qué cantidad deberán tener disponibles cada dı́a para satisfacer la demanda
Cuestión 4.6
a) 45 l.
b) 145 l.
c) 100 l.
d) Ninguna de las anteriores es correcta.
130
Estadı́stica
Una empresa cervecera familiar ha estimado que la demanda diaria de sus clientes sigue una distribución
Cuestión 4.7
uniforme entre 100 y 150 litros. Calcula la desviación tı́pica de la demanda diaria de estos clientes.
a) 14.43
b) 208,33
c) 125
d) Ninguna de las anteriores es correcta.
Una empresa se dedica a poner máquinas expendedoras de periódicos en distintas calles de una ciudad. El
alquiler del espacio que utiliza le cuesta 100 euros diarios y gana 0.4 euros por cada periódico vendido. Si
las ventas diarias de periódicos tienen un valor esperado de 600 y una desviación tı́pica de 100, ¿Cuál es el
Cuestión 4.8
a) 500
b) 240
c) 140
d) Ninguna de las anteriores es correcta.
Se sabe que el número de horas que los alumnos dedican a estudiar estadı́stica el dı́a antes del examen sigue
una distribución normal de media 10 horas y desviaci’on tı́pica de 5.25 horas. Calcula la probabilidad de
Cuestión 5.1
a) 0.29
b) 0.86
c) 0.68
d) Ninguna de las anteriores es correcta.
131
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
Cuestión 5.2
Dado el enunciado anterior, calcula el valor que deja por debajo el 95 % de los alumnos
a) 18.64
b) 9.56
c) 20.29
d) Ninguna de las anteriores es correcta.
El tiempo de vida media de un marcapasos sigue una distribución exponencial con media 10 años. Calcular
la probabilidad de que una persona a la que se ha implantado un marcapasos se le deba de implantar otro
Cuestión 5.3
antes de 13 años.
a) 0.73
b) 0.27
c) 1
d) Ninguna de las anteriores es correcta.
El tiempo de vida media de un marcapasos sigue una distribución exponencial con media 10 años. Calcular
Cuestión 5.4
a) No se puede calcular.
b) 29,96 años
c) 0.51 años
d) Ninguna de las anteriores es correcta.
Una empresa cervecera familiar ha estimado que la demanda diaria de sus clientes sigue una distribución
uniforme entre 160 y 200 litros. Calcula la probabilidad de que la demanda de un dı́a cualquiera esté entre
Cuestión 5.5
175 l. y 185 l.
a) 0.63
b) 0.38
c) 0.25
d) Ninguna de las anteriores es correcta.
132
Estadı́stica
Dado el enunciado anterior, ¿qué cantidad deberán tener disponibles cada dı́a para satisfacer la demanda
Cuestión 5.6
a) 192 l.
b) 190 l.
c) 180 l.
d) Ninguna de las anteriores es correcta.
Una empresa cervecera familiar ha estimado que la demanda diaria de sus clientes sigue una distribución
Cuestión 5.7
uniforme entre 160 y 200 litros. Calcula la desviación tı́pica de la demanda diaria de estos clientes.
a) 133.33
b) 180
c) 11.55
d) Ninguna de las anteriores es correcta.
Una empresa se dedica a poner máquinas expendedoras de periódicos en distintas calles de una ciudad. El
alquiler del espacio que utiliza le cuesta 130 euros diarios y gana 0.5 euros por cada periódico vendido. Si
las ventas diarias de periódicos tienen un valor esperado de 600 y una desviación tı́pica de 100, ¿Cuál es el
Cuestión 5.8
a) 300
b) 170
c) 470
d) Ninguna de las anteriores es correcta.
133
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
134
Apéndice A
d 4
Ejemplo A.1. Consideremos la función f (x) = 4x3 , es posible obtenerla por derivación como: [x ] = 4x3 ;
dx
por lo tanto, una primitiva de f es F (x) = x . Como la derivada de cualquier constante es cero, se sigue que las
4
siguientes funciones también son primitivas de f (x) = 4x3 : F1 (x) = x4 − 7, F2 (x) = x4 + 1, F3 (x) = x4 + 91.
Teorema A.1. Dadas dos primitivas de una misma función f , F1 (x) y F2 (x), en un intervalo (a, b), éstas se
diferencian en una constante, es decir, F1 (x) = F2 (x) + C para todo x ∈ (a, b).
Al conjunto de todas las funcionesZ primitivas de una función f (F (x) + C) se le llama integral indefinida o
anti–derivada de f y se denota como f (x)dx.
(x + a)r+1
Z
(x + a)r dx = + C.
r+1
(x + a)r+1 1
Demostración. La derivada de es (r + 1)(x + a)r = (x + a)r .
r+1 r+1
Z
Ejemplo A.2. Calcula 5x7 + 2x2 + 7x1/3 dx.
Combinando la linealidad (teorema A.2) y integral indefinida de la potencia (teorema A.3), se tiene que
135
APÉNDICE A. INTRODUCCIÓN A LAS INTEGRALES
√ √
Z
Ejemplo A.3. Calcular x−1−1 x − 1 + 1 dx
√ √ √
Realizamos el producto del integrando con anterioridad a la integración: x−1−1 x − 1 + 1 = ( x − 1)2 −
x2
Z Z
12 = x − 2. La integración es ahora inmediata: x dx − 2 dx = − 2x + C.
2
Z √
3
x−5+2
Ejemplo A.4. Calcula dx.
3
Z √
x−5+2 1 2 1 2
3
Z Z Z
dx = ( (x − 5)1/3 + ) dx = (x − 5)1/3 dx + dx =
3 3 3 3 3
1 (x − 5)1/3+1 2 1 2
= + x + C = (x − 5)4/3 + x + C.
3 1/3 + 1 3 4 3
x3 x2 1
F (x) = −4 + C = x3 − 2x2 + C.
3 2 3
Como F (0) = C, podemos determinar el valor de C, ya que en la expresión anterior F (0) = C, con lo que C = 2
1
y la función buscada es F (x) = x2 − 2x2 + 2.
3
Ejemplo A.6. En una empresa que manufactura harina el coste fijo de producción es 1000e por año donde el
coste fijo de producción son todos los gastos que permanecen constantes independientemente de la producción. Si
Q es la producción en kilo y C es el coste de producción medido en euros, el coste en materias primas (trigo) es de
0,2e por kilo producido y el marginal del coste de la mano de obra varı́a como 0,1Q−0,9 . Por tanto, el marginal
del coste de producción viene dado por
dC
= 0,2 + 0,1Q−0,9
dQ
Determina con estos datos el coste según la producción.
La función de coste es una primitiva de 0,2 + 0,1Q−0,9 , con lo que hay una constante A tal que
Q0,1
C(Q) = 0,2Q + 0,1 + A.
0,1
En este caso hemos llamado a la constante de integración A para no confundirla con el coste. Como los costes en
ausencia de producción valen 1000e tenemos que C(0) = 1000, luego A = 1000 y la función de costo es
136
Estadı́stica
y x=a x=b
y = f (x)
Z b
f (x) dx
a
x
a b
Figura A.1: El área de la superficie sombreada define la integral de función f (x) en intervalo [a, b].
Ejemplo A.7. El área Zde un rectángulo de base b = 3 y altura h = 2, que es b · h = 2 · 3 = 6, se puede identificar
3
con la integral definida 2 dx. En el primer panel de la figura A.2 aparece dicha superficie sombreada.
0
Z 4
Ejemplo A.8. La integral definida x dx es el área de un triángulo cuya base y altura valen 4, por lo que
0
4
1 42
Z
x dx = 4·4= = 8.
0
2 2
Ejemplo A.9. La función f (x) = 1 − |x| en el intervalo [−1, 1] está definida por trozos como
1+x si − 1 ≤ x < 0;
f (x) =
1−x si 0 ≤ x ≤ 1.
Z 1
La integral definida (1 − |x|) dx es el área del triángulo sombreado en el tercer panel de la figura A.2. Como
−1
se
Z trata de un triángulo cuya base mide dos unidades y su altura una, el área de dicho triángulo vale uno, ası́
1
(1 − |x|) dx = 1.
−1
Z 1
π p
Ejemplo A.10. La integral definida 1 − x2 dx es
, pues la superficie que aparece sombreada en el cuarto
−1
2
panel de la figura A.2 es la mitad de un cı́rculo de radio uno.
Z b
La integral definida f (x) dx de una función acotada cualquiera (puede ser negativa) se define por
a
Z b Z b Z b
f (x) dx = máx{f (x), 0} dx − máx{−f (x), 0} dx
a a a
donde ambos términos tienen sentido porque las funciones máx{f (x), 0} y máx{−f (x), 0} son funciones no nega-
tivas. Vea la figura A.3 donde aparece un ejemplo gráfico de estas funciones.
137
APÉNDICE A. INTRODUCCIÓN A LAS INTEGRALES
y
y
4 y
y
2 1
Z 3
1
Z 4
1
2 dx Z 1
Z
x dx
p
(1 − |x|) dx 1 − x2 dx
0 x 0 x −1 x −1 x
3 4 −1 1 −1 1
Figura A.2: Gráficas de las funciones definidas en los ejemplos A.7, A.8, A.9 y A.10
y y y
y = f (x) y = max{f (x), 0}
y = max{−f (x), 0}
x x x
Figura A.3: La definición de la integral para una función no necesariamente positiva separa el intervalo
de definición de la integral en el trozo donde la función está por encima del eje de abscisa y en el trozo
que está por debajo del eje de abscisa.
Z 3
Ejemplo A.11. Calcular x dx.
−2
La superficie por encima del eje de abscisa es un triángulo cuya base y altura valen 3 y, por consiguiente, el área
de dicho triángulo es 9/2. Por debajo del eje de abscisa la superficie es un triángulo cuyo base y altura son 2 y,
por tanto, su área es 2. El valor de la integral
3
9 5
Z
x dx = −2= .
−2
2 2
Z b Z a
Si b < a se define la integral definida por f (x) dx = − f (x) dx.
a b
4. f (x) dx = 0.
a
138
Estadı́stica
Z b Z b
5. Si f es integrable en [a, b], y f (x) ≤ g(x) para x con a ≤ x ≤ b y f (x) dx ≤ g(x) dx
a a
Z b Z b
6. La variable de integración es muda, f (x) dx = f (t) dt.
a a
Todas estas propiedades son intuitivas dado que la integral no es más que el área comprendida entre la gráfica
de la función y el eje de abscisas.
y y
1 1
Z 3 Z 3
f (x) dx f (s) ds
1 1
x x
1 2 3 1 2 3
Z b Z b
Figura A.4: El valor de f (x) dx y de f (t) dt es el mismo porque las dos expresiones representan el
a a
área de la misma superficie.
Se denomina diámetro de la partición ∆ = {x0 , x1 , x2 , . . . , xN } al mayor de los valores |xi −xi−1 | con i = 1, . . . , N ,
es decir,
diam(∆) = máx |xi − xi−1 | = máx{x1 − x0 , x2 − x1 , . . . , xN − xN −1 }.
i=1,...,N
Dada una función f definida en [a, b] y una partición ∆ = {x0 , x1 , x2 , . . . , xN } en [a, b] se dice que un valor S es
una suma integral de f y ∆ si existen ci en el intervalo [xi−1 , xi ] para i = 1, . . . , N tales que
N
X
S= f (ci ) (xi − xi−1 ).
i=1
Como se puede observar en la figura A.5 la suma integral consiste en la suma del área de los rectángulos con
base xi −xi−1 y altura f (ci ). Resulta bastante intuitivo que dada una partición con diámetro pequeño cualesquiera
de sus sumas integrales se aproximan bastante al verdadero valor de la integral definida. Esta idea se enuncia de
forma rigurosa en el teorema A.5
Teorema A.5. Si f es una función acotada con un número finito de discontinuidades, entonces para todo > 0
existe un δ > 0 tal que para toda suma integral, S, de f y partición ∆ de [a, b] con diam(∆) < δ se verifica que
Z b
|S − f (x) dx| < .
a
139
APÉNDICE A. INTRODUCCIÓN A LAS INTEGRALES
x
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12
Figura A.5: La suma del área de los rectángulos sombreados es una suma integral para la partición
∆ = {x0 , x1 , x2 , . . . , xN } y la función f .
Z
Ejemplo A.13. Calcular x(x2 + 1)7 dx
Denominamos u a la expresión que está elevada a la séptima, u = x2 + 1 y du = 2x dx. Despejando x dx = du/2.
Tenemos que
1 u8
Z Z Z
du
x(x2 + 1)7 dx = (x2 + 1)7 x dx = u7 = +C
2 2 8
x2 + 1
Z
sustituyendo u por la expresión que la definı́a, tenemos que x(x2 + 1)7 dx = + C.
16
140
Estadı́stica
cada subintervalo [ti−1 , ti ] medimos el valor de la acción en un momento arbitrario ci . La aproximación al valor
N
1 X T
medio viene dada por la media de los valores de la acción en dichos momentos, f (ci ), pero como es la
N N
i=1
distancia entre dos puntos consecutivos de la partición tenemos que
N N N
1 X 1 X T 1 X
f (ci ) = f (ci ) = f (ci )(ti − ti−1 )
N T N T
i=1 i=1 i=1
Por consiguiente, dicha aproximación al valor medio es una suma integral de f para la partición ∆ dividida por
T . La aproximación obtenida mejora conforme aumentemos el número de puntos de la partición ∆. Por tanto, el
valor medio en el lı́mite es la integral definida en [0, T ] dividida por la longitud del intervalo, T .
Por todas las consideraciones anteriores se define el valor medio de un función en el intervalo [a, b] como
b
1
Z
hf i = f (x) dx.
b−a a
Ejemplo A.14. Calcular el valor medio de la función f (x) = 1 − |x| en el intervalo [−1, 1].
Z 1
En el ejemplo A.9 vimos que (1 − |x|) dx = 1. Por tanto,
−1
1
1 1
Z
hf i = (1 − |x|) dx = .
1 − (−1) −1
2
Teorema A.6. Si f es continua en el intervalo [a, b], existe c ∈ (a, b) tal que hf i = f (c) o lo que es equivalente
Z b
f (x) dx = f (c)(b − a)
a
Demostración. La función f continua en [a, b] alcanza su máximo y su mı́nimo por el teorema de Weierstrass. Sean
cm y cM los puntos donde se alcanzan el mı́nimo y el máximo respectivamente. Por tanto, f (cm ) ≤ f (x) ≤ f (cM )
para todo x en el intervalo [a, b]. Utilizando la propiedad de monotonı́a de la integración (teorema A.4 apartado
5) se tiene que
Z b Z b Z b
f (cm )(b − a) = f (cm ) dx ≤ f (x) dx ≤ f (cM ) dx = f (cM )(b − a).
a a a
b
1
Z
Por el teorema del valor intermedio al ser f continua, existe c tal que f (c) = f (x) dx.
b−a a
141
APÉNDICE A. INTRODUCCIÓN A LAS INTEGRALES
x+h
1
Z
Por el teorema A.6 para cada h existe un ch entre x y x + h tal que f (t) dt = f (ch ). Cuando h tiende a
h x
cero, f (ch ) tiende a f (x) por continuidad y, por tanto, A0 (x) = f (x).
y y
A ∆A A dA
x x
x x + dx x x + dx
x
1
Z
Ejemplo A.15. Derivar la función F (x) = dt.
1
t
1
Por el teorema A.7 tenemos que F 0 (x) = .
x
x2 +1
1
Z
Ejemplo A.16. Derivar la función F (x) = dt.
x2
t+1
y
1 1
Z
Si llamamos G(y) = dt con el teorema A.7 sabemos que G0 (y) = .
0
t+1 y+1
x2 +1 x2 +1 0
1 1 1
Z Z Z
F (x) = dt = dt + dt
x2
t+1 0
t+1 x2
t+1
x2 +1 x2
1 1
Z Z
= dt − dt = G(x2 + 1) − G(x2 ).
0
t+1 0
t+1
Regla de Barrow
Una consecuencia del teorema fundamental del cálculo integral es la conocida regla de Barrow. Si F (x) es una
primitiva de una función continua f (x), se tiene que existe una constante C tal que
Z x
F (x) = f (t) dt + C
a
142
Estadı́stica
y, finalmente, Z b Z a Z b
F (b) − F (a) = f (t) dt + C − f (t) dt + C = f (t) dt.
a a a
Dicha fórmula sigue siendo correcta aunque f no sea continua en todos sus puntos.
Z 3
Ejemplo A.17. Calcular (x − 2)4 dx.
1
(x − 2)5
Como es una primitiva de (x − 2)4 , tenemos que
5
3 3
(x − 2)5 (3 − 2)5 (1 − 2)5 1 2
Z
−1
(x − 2)4 dx = = − = − =
1
5 1
5 5 5 5 5
√
Ejemplo A.18. Calcula el valor medio de f (x) = 2x + 1 en el intervalo [0, 1].
1 3/2 1
1
Z 1 Z 1
1 1/2 √ (x + )
hf i = (2x + 1)1/2 = 21/2 (x + ) dx = 2 2 =
1−0 0 0
2 3/2
0
√ (3/2)3/2 (1/2)3/2 √ 1
= 2 − = 3− .
3/2 3/2 3
143
APÉNDICE A. INTRODUCCIÓN A LAS INTEGRALES
144
Apéndice B
Técnicas de recuento.
El análisis combinatorio estudia las diversas configuraciones de las agrupaciones con los elementos de un
conjunto dependiendo de si en estas configuraciones se pueden repetir elementos o si el orden de los elementos es
determinante. La forma más sencilla y gráfica de contar es el diagrama de árbol, pero tiene el inconveniente de
que sólo es posible su utilización en el caso de que los resultados posibles sean pocos. Otra forma de contar es el
análisis combinatorio del experimento, cuyas posibilidades son permutaciones, variaciones y combinaciones.
Un diagrama de árbol es un gráfico en el que están reflejados todos los posibles resultados de un experimento.
Es una técnica muy sencilla y clara, pero sólo es posible su aplicación cuando el número de resultados posibles es
pequeño.
Ejercicio B.1. ¿Qué probabilidad tiene una pareja de tener al menos dos varones en un embarazo de trillizos?
VVV, VVH,VHV,VHH,HVV,HVH,HHV,HHH
Padres
V H
V H V H
V H V H V H V H
Son agrupaciones que se forman seleccionando algunos (no todos) los elementos del conjunto y cada agrupación
se distingue de otra según el orden de los elementos en la agrupación. Imaginemos que disponemos de n elementos
y queremos hacer agrupaciones de m elementos,.
145
APÉNDICE B. TÉCNICAS DE RECUENTO.
Si permitimos repeticiones de alguno o de todos los m elementos, las agrupaciones diferentes se cuentan como
variaciones con repetición:
V Rn,m = nm
Si exigimos que las agrupaciones se formen con m elementos diferentes, las agrupaciones diferentes se cuentan
como variaciones sin repetición con m ≤ n:
Vn,m = n · (n − 1) · (n − 2) · · · (n − m + 1)
En el libro de denotan por n Pm .
Ejercicio B.2. ¿Cuántos números de tres cifras se pueden formar con las nueve cifras significativas del sistema
decimal? ¿Cuántos de estos números de tres cifras tienen todas las cifras diferentes?
Ejercicio B.3. En una encuesta de una lista de 10 partidos polı́ticos se pide hacer una lista de 4 por orden de
preferencia. ¿Cuántas posibles respuestas se pueden dar?
V10,4 = 10 · 9 · 8 · 7 = 5040
Por su especial interés se denominan permutaciones a las variaciones sin repeticiones en las que seleccionan
todos los elementos del conjunto en un determinado orden. El número de agrupaciones distintas para un conjunto
con n elementos es
Pn = n! = Vn,n = 1 · 2 · 3 · · · (n − 1) · · · n
Al sı́mbolo de exclamación le denominaremos factorial. Leemos n! como “el factorial de n”
Ejercicio B.4. ¿Cuántas palabras distintas, con o sin significado, se pueden formar con las letras de la palabra
DISCO?
Solución: P5 = 5! = 5 · 4 · 3 · 2 · 1 = 120
Por definición consideraremos 0! = 1. Con la definición de los factoriales se tiene que Vn,m = n!/(n − m)!
B.3. Combinaciones
(Se corresponde con la sección 8.2 del libro Haeussler (2008))
Son agrupaciones que se forman seleccionando algunos (no todos) elementos del conjunto total, de manera que
dos agrupaciones son iguales si contienen los mismos elementos, aunque sea en diferente orden. Si consideramos
un conjunto de n elementos, el número de agrupaciones diferentes con m elementos son:
Vn,m n!
Cn,m = =
Pm m!(n − m)!
Al número Cn,m también se denota por .
n
m
Ejercicio B.5. Imagina que 10 personas acuden a una entrevista de trabajo para cubrir 3 puestos de adminis-
trativo. ¿De cuantas formas diferentes se pueden contratar a 3 personas?
146
Estadı́stica
V10,3
Solución: C10,3 = P3
= 10·9·8
3·2·1
= 120
Teorema B.1 (Propiedades básicas de los números combinatorios). Se verifican las siguientes propiedades
1. Cn,m + Cn,m+1 = Cn+1,m+1
Pn
2. j=1
Cn,j = Cn,0 + Cn,1 + Cn,2 + · · · + Cn,n−1 + Cn,n = 22 n
(SI) (NO)
¿Intervienen todos Combinaciones
los elementos?
(SI) (NO)
Permutaciones ¿Se pueden repetir?
(SI) (NO)
Variaciones Variaciones
con repetición sin repetición
Ejercicio B.7. Un grupo de debate está formado por 3 chicos y 2 chicas. Hallar el número de formas que en que
pueden sentarse en una fila. (Sol.: 120)
Ejercicio B.8. Una bolsa contiene cinco bolas rojas y seis bolas blancas.
a. Hallar el número de formas en que se pueden sacar cuatro bolas de la bolsa.
b. Hallar el número de formas en que se pueden sacar cuatro bolas rojas y dos blancas.
Ejercicio B.9. ¿De cuántas maneras pueden sentarse 10 personas en un banco si hay 4 sitios disponibles? (Sol.:
5040)
Ejercicio B.10. ¿Cuántos números de 4 dı́gitos se pueden formar con las cifras 1, 2, . . . , 9
a. Permitiendo repeticiones. (Sol.: 6561)
b. Sin repeticiones. (Sol.: 3024)
c. Si el último dı́gito ha de ser 1 y no se permiten repeticiones (Sol.: 336)
147
APÉNDICE B. TÉCNICAS DE RECUENTO.
Ejercicio B.11. En un grupo de 10 amigos, ¿de cuántas maneras diferentes pueden distribuirse sus fechas de
cumpleaños durante el año?
Ejercicio B.12. Un alumno tiene que elegir 7 de las 10 preguntas de un examen. ¿De cuántas maneras puede
elegirlas? ¿Y si las 4 primeras son obligatorias?(Sol.: 120; 20)
Ejercicio B.13. Una lı́nea de ferrocarril tiene 25 estaciones. ¿Cuántos billetes diferentes habrá que imprimir si
cada billete lleva impresas las estaciones de origen y destino?.(Sol.: 600)
148
Apéndice C
Formulario
Estadı́stica descriptiva
Media Desviación
v tı́pica
n
X uXn
(xi − x)2
u
xi u
x1 + x2 + ... + xn
t
i=1 i=1
X= = S=
n n n−1
Frecuencia condicionada
fi,j
fi|j =
f·,j
Probabilidad
Variaciones con repetición Variaciones sin repetición m ≤ n
V Rn,m = nm Vn,m = n(n − 1)(n − 2) · (n − m + 1)
Permutaciones Combinaciones
V
Pn = n! Cn,m = Pn,m
m
Probabilidad de la ∪ Probabilidad condicionada
P (A ∩ B)
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) P (B|A) =
P (A)
149
APÉNDICE C. FORMULARIO
150
Apéndice D
Tablas estadı́sticas
151
Tabla de probabilidades de la distribución N(0,1)
[P (Z < z)]
Apéndice E
Problema E.2. Todos los alumnos: 1,5 puntos En el proceso de fabricación del último modelo de móviles
NEWMOV, se ha detectado que el 1 % presentan algún tipo de defecto y son devueltos. Realiza los cálculos
con 4 cifras decimales.
Si se dan las condiciones necesarias para realizar una aproximación de una distribución a otra,
utilizadla.
1. Si se acaba de enviar un pedido de 20 móviles a una empresa, ¿cuál es la probabilidad de que tengan que
devolver más de 2 móviles?
2. Si ayer se envió un pedido de 500 móviles, ¿cuál es la probabilidad de que tengan que devolver al menos 2
móviles?
Problema E.3. Todos los alumnos: 2 puntos Las ventas semanales de una librerı́a siguen una distribución Normal
de media 3000 euros y una desviación tı́pica de 400 euros.
1. ¿Cuál es la probabilidad de que la cifra de ventas de una semana supere los 4000 euros?
2. ¿Cuál es la probabilidad de obtener una venta semanal entre 2000 y 3000 euros?
3. ¿Cuál es el valor de la venta semanal (euros) que solo es superado por el 25 % de las ventas semanales?
153
En la siguiente tabla se muestran los datos de 1508 matrileños donde podemos ver dos variables: X= nivel
educativo e Y=situación laboral
Empleado Parado Inactivo
Primaria 95 6 315
Indicar cuál es la frecuencia de las personas paradas
Secundaria 393 28 257
Post-secundaria 317 8 89
Cuestión 1.1
a) 28
b) 28/678
c) 28/42
d) Ninguna de las anteriores
Sean las variables estadı́sticas bidimensionales (X, Y ) donde X=PIB per cápita (en miles de dólares) e
Y=Tasa natural de crecimiento demográfico de 162 paı́ses del mundo. Conocemos los siguientes datos:
Cuestión 1.2
a) −0,23
b) −0,73
c) 22,22
d) Ninguna de las anteriores.
En un safari se sabe que el número medio de leones que se pueden ver en un dı́a es de 5 leones. Calcula la
Cuestión 1.3
a) 0.27
b) 0.74
c) 0.44
d) Ninguna de las anteriores.
Los voltajes que se asumen para cierto aparato eléctrico varı́an entre 6 voltios y 12 voltios. Se sabe que estos
voltajes se distribuyen de forma uniforme. Calcular la probabilidad de que el nivel de voltaje se encuentre
Cuestión 1.4
a) 0.41
b) 0.25
c) 0.12
d) Ninguna de las anteriores.
El 42 % de la población activa de cierto paı́s está formada por mujeres. Se sabe que un 24 % de las mujeres
y un 16 % de los hombres están en el paro. ¿Cuál es la probabilidad de que una persona elegida al azar de la
Cuestión 1.5
a) 0,19
b) 0,4
c) 0,58
d) Ninguna de las anteriores.
A partir del enunciado de la cuestión anterior, supongamos ahora que se elige un adulto al azar para rellenar
Cuestión 1.6
un formulario y se observa que no tiene trabajo. ¿Cuál es la probabilidad de que la persona elegida sea mujer?
a) 0,1
b) 0,24
c) 0,53
d) Ninguna de las anteriores.
Un dado simétrico tiene tres caras iguales con una puntuación de 6 en cada cara, en otras dos de las caras
la puntuación es de 5 en cada una y en la cara restante la puntuación es de 1. La función de probabilidad
X P (X = x)
1 1/6
asociada es: ¿Cuál es el valor esperado para esta variable?
Cuestión 1.7
5 2/6
6 3/6
a) 3,5
b) 4,83
c) 5
d) Ninguna de las anteriores.
Cuestión 1.8
Las calificaciones de una determinada asignatura tomando valores: suspenso, aprobado, notable, etc...es una
variable · · ·
a) variable aleatoria cuantitativa continua
b) variable aleatoria cualitativa ordinal
c) variable aleatoria cualitativa nominal
d) Ninguna de las anteriores.
Las calificaciones de una determinada asignatura tomando valores: suspenso, aprobado, notable, etc...es una
variable · · ·
a) variable aleatoria cuantitativa continua
b) variable aleatoria cualitativa nominal
c) variable aleatoria cualitativa ordinal
d) Ninguna de las anteriores.
Un dado simétrico tiene tres caras iguales con una puntuación de 6 en cada cara, en otras dos de las caras
la puntuación es de 5 en cada una y en la cara restante la puntuación es de 1. La función de probabilidad
X P (X = x)
1 1/6
asociada es: ¿Cuál es el valor esperado para esta variable?
Cuestión 1.2
5 2/6
6 3/6
a) 3,5
b) 5
c) 4,83
d) Ninguna de las anteriores.
El 42 % de la población activa de cierto paı́s está formada por mujeres. Se sabe que un 24 % de las mujeres
y un 16 % de los hombres están en el paro. ¿Cuál es la probabilidad de que una persona elegida al azar de la
Cuestión 1.3
a) 0,4
b) 0,19
c) 0,58
d) Ninguna de las anteriores.
A partir del enunciado de la cuestión anterior, supongamos ahora que se elige un adulto al azar para rellenar
Cuestión 1.4
un formulario y se observa que no tiene trabajo. ¿Cuál es la probabilidad de que la persona elegida sea mujer?
a) 0,1
b) 0,53
c) 0,24
d) Ninguna de las anteriores.
Los voltajes que se asumen para cierto aparato eléctrico varı́an entre 6 voltios y 12 voltios. Se sabe que estos
voltajes se distribuyen de forma uniforme. Calcular la probabilidad de que el nivel de voltaje se encuentre
Cuestión 1.5
a) 0.25
b) 0.41
c) 0.12
d) Ninguna de las anteriores.
En un safari se sabe que el número medio de leones que se pueden ver en un dı́a es de 5 leones. Calcula la
Cuestión 1.6
a) 0.74
b) 0.44
c) 0.27
d) Ninguna de las anteriores.
Sean las variables estadı́sticas bidimensionales (X, Y ) donde X=PIB per cápita (en miles de dólares) e
Y=Tasa natural de crecimiento demográfico de 162 paı́ses del mundo. Conocemos los siguientes datos:
Cuestión 1.7
a) −0,73
b) −0,23
c) 22,22
d) Ninguna de las anteriores.
En la siguiente tabla se muestran los datos de 1508 matrileños donde podemos ver dos variables: X= nivel
Empleado Parado Inactivo
Primaria 95 6 315
educativo e Y=situación laboral Indicar cuál es la
Secundaria 393 28 257
Post-secundaria 317 8 89
Cuestión 1.8
a) 28/678
b) 28
c) 28/42
d) Ninguna de las anteriores
Problema E.6. (Alumnos sin evaluación continua); 1,75 PUNTOS El propietario de una librerı́a ha decidido
regalar un libro en Navidad a sus mejores clientes. Ha escogido 15 libros de cocina y 15 de viajes, todos del mismo
tamaño y los ha envuelto con un mismo papel, de modo que no puede distinguir de qué tipo es cada libro. Si lleva
10 libros regalados,
1. ¿Cuál es la probabilidad de que la mitad sean de viajes?
2. ¿Cuál es la probabilidad de que haya regalado entre 3 y 5 libros de viajes?
Problema E.7. (Alumnos sin evaluación continua); 1.75 PUNTOS El tiempo de revisión del motor de un avión
sigue una distribución exponencial de media 25 minutos.
3. ¿Cuál es el tiempo de revisión de un motor solo superado por el 10 % de los tiempos de revisión de motores?
1. Calcular la probabilidad de que uno de estos accidentes no tenga resultado nefasto. (0,75 puntos)
2. Si se produce una accidente sin resultado nefasto, calcular la probabilidad de que la causa de dicho accidente
sea la ingesta excesiva de alcohol. (0,75 puntos)
Problema E.9. Todos los alumnos: 1,5 puntos Una central telefónica recibe una media de 2 llamadas por minuto.
Si la centralita tiene una capacidad para atender a lo sumo 4 llamadas por minuto.
1. ¿Cuál es la probabilidad de que en un minuto determinado no sea posible dar lı́nea a todos los clientes?
(0,75 puntos)
2. ¿Cuál es la probabilidad de que en un minuto determinado sea posible darle lı́nea a lo sumo a un cliente?(0,75
puntos)
Problema E.10. Todos los alumnos: 2 puntos Varios test de inteligencia dieron una puntuación que sigue una
ley normal con media 100 y desviación tı́pica 15.
1. Determinar el porcentaje de población que obtendrı́a un coeficiente entre 95 y 110. (0,75 puntos)
2. Determinar el porcentaje de población que obtendrı́a un coeficiente mı́nimo de 97. (0,5 puntos)
NE NO SE SO
Compra la marca 80 110 85 95
No compra la marca 120 90 115 105
Cuestión 2.2
Indicad cuál es la frecuencia de las personas que compran la marca sabiendo que son del SE.
a) 85
b) 0,43
c) 0,23
d) Ninguna de las anteriores.
Cuestión 2.3
El percentil 35 de la muestra: 15, 10, 35, 30, 50, 40, 25, 20, 45 es:
a) 3,8
b) 24
c) 38
d) Ninguna de las anteriores.
En una muestra de familias se han analizado las variables renta anual (X) y ahorro anual (Y), medidas
ambas en miles de euros. Conocemos los siguientes datos: rXY = 0, 85, X = 22, Y = 2,19, SX 2
= 0,93,
SY = 0,15. Indicad cuál es la recta de regresión que deberı́amos utilizar para predecir el ahorro anual de una
2
Cuestión 2.4
a) Y = −5, 51 + 0, 35X
b) X = −5, 51 + 0, 35Y
c) Y = 0, 35 − 5, 51X
d) Ninguna de las anteriores.
La demanda de un cierto item es una variable aleatoria que se distribuye como sigue:
Cuestión 2.5
Nº unidades demandadas 1 2 3 4
Calcula la varianza de la variable.
Probabilidad 0.25 0.45 0.15 0.15
a) 3.6
b) 0.96
c) 2.2
d) Ninguna de las anteriores.
Una tienda de música tiene en el almacén 20 guitarras en stock, de las cuales, 3 son defectuosas. Un cliente
Cuestión 2.6
a) 0.34
b) 0.23
c) 0.13
d) Ninguna de las anteriores.
Un grupo musical recibe una oferta de una promotora musical para un festival con las siguientes condiciones,
el grupo recibirá una cantidad fija de 50000? más 6? por entrada vendida. Se sabe que el número de entradas
vendidas se puede representar por medio de una variable aleatoria de media 10000 y desviación tı́pica de
Cuestión 2.7
2500. Calcula la desviación tı́pica de la cantidad total de dinero que recibirá el grupo.
a) 15000
b) 110000
c) 122
d) Ninguna de las anteriores.
Sea X la cantidad de tiempo (en minutos) que un empleado de correos pasa con su cliente. Se sabe que el
tiempo tiene una distribución exponencial con una cantidad de tiempo promedio igual a cuatro minutos.
Cuestión 2.8
Calcula la probabilidad de que un empleado de correos pase entre cuatro y cinco minutos con un cliente
seleccionado al azar.
a) 0.71
b) 0.08
c) 0.63
d) Ninguna de las anteriores.
Una tienda de música tiene en el almacén 20 guitarras en stock, de las cuales, 3 son defectuosas. Un cliente
Cuestión 2.1
a) 0.13
b) 0.34
c) 0.23
d) Ninguna de las anteriores.
La demanda de un cierto item es una variable aleatoria que se distribuye como sigue:
Cuestión 2.2
Nº unidades demandadas 1 2 3 4
Calcula la varianza de la variable.
Probabilidad 0.25 0.45 0.15 0.15
a) 3.6
b) 2.2
c) 0.96
d) Ninguna de las anteriores.
Un grupo musical recibe una oferta de una promotora musical para un festival con las siguientes condiciones,
el grupo recibirá una cantidad fija de 50000? más 6? por entrada vendida. Se sabe que el número de entradas
vendidas se puede representar por medio de una variable aleatoria de media 10000 y desviación tı́pica de
Cuestión 2.3
2500. Calcula la desviación tı́pica de la cantidad total de dinero que recibirá el grupo.
a) 110000
b) 122
c) 15000
d) Ninguna de las anteriores.
Sea X la cantidad de tiempo (en minutos) que un empleado de correos pasa con su cliente. Se sabe que el
tiempo tiene una distribución exponencial con una cantidad de tiempo promedio igual a cuatro minutos.
Cuestión 2.4
Calcula la probabilidad de que un empleado de correos pase entre cuatro y cinco minutos con un cliente
seleccionado al azar.
a) 0.08
b) 0.71
c) 0.63
d) Ninguna de las anteriores.
El gerente de una empresa quiere saber si la distribución de su marca es igual en las 4 grandes áreas de
distribución del producto: NE, NO, SE, SO. En la siguiente tabla se muestran los resultados de una encuesta
realizada a 800 personas donde podemos ver dos variables: X= si el encuestado compra o no su marca e Y=
área del paı́s de la persona encuestada.
NE NO SE SO
Compra la marca 80 110 85 95
No compra la marca 120 90 115 105
Cuestión 2.5
Indicad cuál es la frecuencia de las personas que compran la marca sabiendo que son del SE.
a) 0,43
b) 85
c) 0,23
d) Ninguna de las anteriores.
Cuestión 2.6
En una muestra de familias se han analizado las variables renta anual (X) y ahorro anual (Y), medidas
ambas en miles de euros. Conocemos los siguientes datos: rXY = 0, 85, X = 22, Y = 2,19, SX 2
= 0,93,
SY = 0,15. Indicad cuál es la recta de regresión que deberı́amos utilizar para predecir el ahorro anual de una
2
Cuestión 2.7
a) X = −5, 51 + 0, 35Y
b) Y = 0, 35 − 5, 51X
c) Y = −5, 51 + 0, 35X
d) Ninguna de las anteriores.
Cuestión 2.8
El percentil 35 de la muestra: 15, 10, 35, 30, 50, 40, 25, 20, 45 es:
a) 3,8
b) 38
c) 24
d) Ninguna de las anteriores.
Problema E.13. (Alumnos sin evaluación continua); 1,75 PUNTOS Imaginemos que un 80 % de personas en el
mundo han visto el partido de la final del último mundial de futbol. Tras el evento, 4 amigos se reúnen a cenar:
1. ¿Cuál es la probabilidad de que 3 de ellos hayan visto el mundial? (0,75 puntos)
2. ¿Cuál es la probabilidad de que como mucho lo haya visto uno el mundial? (0,75 puntos)
3. Este problema, ¿se podrı́a aproximar por una Poisson? Razonar la respuesta. (0,25 puntos)
Problema E.14. (Alumnos sin evaluación continua); 1.75 PUNTOS Sabemos que un autobús pasa cada 10
minutos. Consideramos la variable del tiempo de espera en la parada del autobús como una distribución uniforme
en el intervalo [0, 10]. Calcular:
1. La probabilidad de esperar menos de 2 minutos. (0,5 puntos)
2. La probabilidad de esperar como mı́nimo 5 minutos. (0,5 puntos)
3. Calcular el tiempo máximo que hay que esperar en el 35 % de las ocaciones que menos tiempo se espera.
(0,75 puntos)
Problema E.16. (Todos los alumnos: 1,5 puntos) Sabemos que el 90 % de los estudiantes que toman un curso
elemental de estadı́stica aprueban. ¿Cuál es la probabilidad de que al menos 3 estudiantes en una clase de 15
estudiantes no aprueben el curso?
Problema E.17. (Todos los alumnos: 2 puntos) En una empresa de marketing, el tiempo de vida de un ordenador
personal sigue una distribución normal de media 4 años y desviaciń tı́pica 0.5 años.
Una compa ñı́a de seguros estudió la relación existente entre el ingreso familiar X y el montante de los seguros
de vida de los padres Y. En base a una muestra de 18 familias se obtuvo la siguiente información (en miles
de euros):
X=35.90 SX =55.25
Cuestión 1.1
Supongamos que el consumo de yogures en una guarderı́a varı́a de forma uniforme entre 6 y 10 litros diarios.
¿Cuántos litros deberı́an beberse para que sobre como máximo un 10 %?.
a) 9,6 litros
b) 3,6 litros
c) 6,4 litros
d) Ninguna de las anteriores.
Cuestión 1.3
En una asignatura de primer curso de una titulación universitaria, asisten a clase regularmente 210 alumnos
de los 300 que hay matriculados. Además se sabe que aprueban el 80 % de los alumnos que asisten a clase y el
Cuestión 1.5
15 % de los que no asisten. Calcular la probabilidad de que elegido al azar un alumno matriculado y resulta
que ha aprobado.
a) 0,56
b) 0,045
c) 0,605
d) Ninguna de las anteriores.
Cuestión 1.6
En una carrera de velocidad compiten diez atletas. ¿De cuántas maneras distintas podrı́a estar formado el
podio? (el podio lo forman el primer, el segundo y el tercer clasificado)
a) 720
b) 1000
c) 120
d) Ninguna de las anteriores.
Cuestión 1.7
Una variable aleatoria discreta contabiliza el número de coches que pasan a través de un cierto punto en una
carretera cada hora. ¿Qué tipo de distribución sigue?.
a) Binomial
b) Poisson
c) Hipergeométrica
d) Ninguna de las anteriores.
Cuestión 1.8
Una urna contiene 100 bolas de las que 60 son blancas y 40 negras. Se extraen 35 bolas al azar. Hallar la
probabilidad de que 30 sean negras.
a) 4,23 · 10−12
b) 6,01 · 10−22
c) 0,423
d) Ninguna de las anteriores.
Problema E.19. (Alumnos sin evaluación continua: modelo B)1,5 puntos
Cuestión 1.1
Una urna contiene 100 bolas de las que 60 son blancas y 40 negras. Se extraen 35 bolas al azar. Hallar la
probabilidad de que 30 sean negras.
a) 6,01 · 10−22
b) 0,423
c) 4,23 · 10−12
d) Ninguna de las anteriores.
Cuestión 1.2
Una variable aleatoria discreta contabiliza el número de coches que pasan a través de un cierto punto en una
carretera cada hora. ¿Qué tipo de distribución sigue?.
a) Poisson
b) Binomial
c) Hipergeométrica
d) Ninguna de las anteriores.
Cuestión 1.3
En una carrera de velocidad compiten diez atletas. ¿De cuántas maneras distintas podrı́a estar formado el
podio? (el podio lo forman el primer, el segundo y el tercer clasificado)
a) 1000
b) 120
c) 720
d) Ninguna de las anteriores.
En una asignatura de primer curso de una titulación universitaria, asisten a clase regularmente 210 alumnos
de los 300 que hay matriculados. Además se sabe que aprueban el 80 % de los alumnos que asisten a clase y el
Cuestión 1.4
15 % de los que no asisten. Calcular la probabilidad de que elegido al azar un alumno matriculado y resulta
que ha aprobado.
a) 0,605
b) 0,56
c) 0,045
d) Ninguna de las anteriores.
X 0 1 2
Cuestión 1.5
Una compañı́a de seguros estudió la relación existente entre el ingreso familiar X y el montante de los seguros
de vida de los padres Y. En base a una muestra de 18 familias se obtuvo la siguiente información (en miles
de euros):
X=35.90 SX =55.25
Cuestión 1.6
Supongamos que el consumo de yogures en una guarderı́a varı́a de forma uniforme entre 6 y 10 litros diarios.
¿Cuántos litros deberı́an beberse para que sobre como máximo un 10 %?.
a) 3,6 litros
b) 6,4 litros
c) 9,6 litros
d) Ninguna de las anteriores.
Cuestión 1.8
Problema E.20. (Alumnos sin evaluación continua: 1,75 PUNTOS) Un servicio dedicado a la reparación de
electrodomésticos recibe por término medio 4 llamadas diarias. Determinar la probabilidad de que reciba un dı́a
más de 5 llamadas.
Problema E.21. (Alumnos sin evaluación continua: 1.75 PUNTOS) Se sabe que la duración (en horas) de la
baterı́a de un determinado modelo de cámaras digitales sigue una distribución exponencial de media 15 horas.
1. ¿Cuál es la probabilidad de que una baterı́a funcione más de 15 horas?
2. Calcular la duración mı́nima (que superan el / del) 50 % de las baterı́as de mayor duración.
E.2.2. Examen convocatoria julio 2018.
Problema E.22. (Todos los alumnos: 1,5 puntos) Para hacer un estudio sobre el uso que se hace de Internet
para comprar productos, se ha llevado a cabo una encuesta y se ha construido esta tabla, en la que X recoge la
edad de las personas encuestadas e Y el número de compras que realizan por internet durante 3 meses:
Se ha pedido a una muestra de 50 analistas financieros que hagan una predicción de los beneficios por acción
Cuestión 2.2
que obtendrá la empresa de energı́as renovables SoleMı́o el próximo año. La predicción mı́nima es de 20
euros/acción y la máxima de 70. Los cuartiles son 30, 40 y 50. Señala cuál de estas afirmaciones es verdadera:
a) El 25 % predice unos beneficios superiores a 30 euros/acción o entre 30 y 70 euros/acción.
b) El 25 % predice unos beneficios inferiores a 50 euros/acción o entre 20 y 50 euros/acción.
c) El 25 % predice unos beneficios superiores a 50 euros/acción o entre 50 y 70 euros/acción
d) Ninguna de las anteriores.
Cuestión 2.3
En la edición de unos libros de texto, se detectó que el 2 % eran defectuosos. Si se envió un pedido de 10000
libros a unos almacenes, hallar el número esperado y desviación tı́pica de libros defectuosos respectivamente.
a) 200, 196
b) 200, 14
c) 20000, 1960000
d) Ninguna de las anteriores.
Cuestión 2.4
Si un banco recibe en promedio 10 cheques por hora, ¿cuál es la probabilidad de que lleguen como máximo
2 en una hora?
a) 4,99 · 10−4
b) 2,27 · 10−3
c) 2,77 · 10−3
d) Ninguna de las anteriores.
Supongamos que el tiempo de respuesta de una terminal conectada en lı́nea es una v.a. X con distribución
Cuestión 2.5
exponencial con promedio igual a 5 segundos. Calcular la probabilidad de que el tiempo de respuesta sea
mayor de 10 segundos
a) 0,865
b) 0,135
c) 1,93 · 10−22
d) Ninguna de las anteriores.
Cuestión 2.6
En una Administración se utilizan 5 sı́mbolos para clasificar los expedientes, de manera que los 2 primeros son
letras y los 3 últimos son números. Suponiendo que hay 25 letras, ¿cuántos expendientes podrán clasificar?
a) 53130
b) 300
c) 625000
d) Ninguna de las anteriores.
Se sabe que en un hospital determinado llegan pacientes a la sala de urgencias a razón de 5 cada hora y se
Cuestión 2.7
desea calcular la probabilidad de que lleguen exactamente 5 personas en 1 hora. Para realizar los cálculos,
necesitamos saber que distribución sigue la variable considerada:
a) Exponencial
b) Poisson
c) Hipergeométrica
d) Ninguna de las anteriores.
En un grupo de 200 propietarios de automóviles, 27 tienen solo un Mazda, 71 tienen solo un Toyota, 7 ambas
Cuestión 2.8
marcas y los restantaes otras marcas. Se desea entrevistar a un propietario elegido aleatoriamente de entre
los 200. Estima la probabilidad de que el entrevistado posea un Mazda o un Toyota.
a) 0,56
b) 0,525
c) 0,49
d) Ninguna de las anteriores.
En una Administración se utilizan 5 sı́mbolos para clasificar los expedientes, de manera que los 2 primeros son
letras y los 3 últimos son números. Suponiendo que hay 25 letras, ¿cuántos expendientes podrán clasificar?
a) 300
b) 2300
c) 53130
d) Ninguna de las anteriores.
Se sabe que en un hospital determinado llegan pacientes a la sala de urgencias a razón de 5 cada hora y se
Cuestión 2.2
desea calcular la probabilidad de que lleguen exactamente 5 personas en 1 hora. Para realizar los cálculos,
necesitamos saber que distribución sigue la variable considerada:
a) Hipergeométrica
b) Poisson
c) Exponencial
d) Ninguna de las anteriores.
Cuestión 2.3
Si un banco recibe en promedio 10 cheques por hora, ¿cuál es la probabilidad de que lleguen como máximo
2 en una hora?
a) 2, 77 · 10−3
b) 2, 27 · 10−3
c) 4, 99 · 10−4
d) Ninguna de las anteriores.
Se ha pedido a una muestra de 50 analistas financieros que hagan una predicción de los beneficios por acción
Cuestión 2.4
que obtendrá la empresa de energı́as renovables SoleMı́o el próximo año. La predicción mı́nima es de 20
euros/acción y la máxima de 70. Los cuartiles son 30, 40 y 50. Señala cuál de estas afirmaciones es verdadera:
a) El 25 % predice unos beneficios superiores a 30 euros/acción o entre 30 y 70 euros/acción.
b) El 25 % predice unos beneficios inferiores a 50 euros/acción o entre 20 y 50 euros/acción.
c) El 25 % predice unos beneficios superiores a 50 euros/acción o entre 50 y 70 euros/acción.
d) Ninguna de las anteriores.
Supongamos que el tiempo de respuesta de una terminal conectada en lı́nea es una v.a. X con distribución
Cuestión 2.5
exponencial con promedio igual a 5 segundos. Calcular la probabilidad de que el tiempo de respuesta sea
mayor de 10 segundos
a) 0,135
b) 0,865
c) 1,93 · 10−22
d) Ninguna de las anteriores.
En un grupo de 200 propietarios de automóviles, 27 tienen solo un Mazda, 71 tienen solo un Toyota, 7 ambas
Cuestión 2.6
marcas y los restantaes otras marcas. Se desea entrevistar a un propietario elegido aleatoriamente de entre
los 200. Estima la probabilidad de que el entrevistado posea un Mazda o un Toyota.
a) 0,56
b) 0,525
c) 0,49
d) Ninguna de las anteriores.
Cuestión 2.7
En la edición de unos libros de texto, se detectó que el 2 % eran defectuosos. Si se envió un pedido de 10000
libros a unos almacenes, hallar el número esperado y desviación tı́pica de libros defectuosos.
a) 200, 196
b) 200, 14
c) 20000, 1960000
d) Ninguna de las anteriores.
Problema E.28. (Alumnos sin evaluación continua); 1.75 PUNTOS En una cierta fábrica se fabrican cada dı́a
una media de 40 mil metros de cable. Unos dı́as más, otros dı́as menos. Aunque el mı́nimo seguro que siempre
es 30 mil metros. La variable aleatoria que recoge el número de metros de cable fabricados en un dı́a siguen una
distribución uniforme continua.¿Qué porcentaje de dı́as se fabrican más de 34 mil metros de cable?.