Está en la página 1de 175

Estadı́stica

del grado de Dirección de Empresa y Marketing.

Departamento de Matemáticas, Fı́sica y Ciencias Tecnológicas


ii
Índice general

1. Análisis descriptivo de datos 3


1.1. ¿Por qué estudiar estadı́stica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Población y muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3. Clasificación de variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.1. Clasificación de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4. Tablas de frecuencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1. Tabla de frecuencia para variables cualitativas o cuantitativas discretas . . . . . . 5
1.4.2. Tablas de frecuencia para variables cuantitativas continuas . . . . . . . . . . . . . 6
1.5. Medidas de centralización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5.1. Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5.2. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.3. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.4. Reflexiones: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.6. Medidas de localización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6.1. Percentil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6.2. Otras medidas de localización. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.7. Medidas de dispersión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7.1. Rango y rango intercuartı́lico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7.2. Varianza poblacional y muestral, desviación tı́pica . . . . . . . . . . . . . . . . . . 10
1.8. Gráficos para describir variables cualitativas y cuantitativas discretas. . . . . . . . . . . . 12
1.9. Gráficos para describir variables cuantitativas continuas. . . . . . . . . . . . . . . . . . . . 13
1.10. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.11. Cuestionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.11.1. Cuestionario Tema1 y Tema2: 12 de Marzo 2018. . . . . . . . . . . . . . . . . . . 20
1.11.2. Cuestionario Tema1: 18 de Febrero 2019. Modelo A. . . . . . . . . . . . . . . . . . 23
1.11.3. Cuestionario Tema1: 18 de Febrero 2019. Modelo B. . . . . . . . . . . . . . . . . . 26
1.11.4. Cuestionario Tema1: 21 de Febrero 2019. Modelo C. . . . . . . . . . . . . . . . . . 29
1.11.5. Cuestionario Tema1: 21 de Febrero 2019. Modelo D. . . . . . . . . . . . . . . . . . 32

2. Análisis bivariante de datos 37


2.1. Distribución conjunta de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2. Distribuciones marginales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.3. Distribuciones condicionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4. Diagrama de dispersión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.5. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.6. El coeficiente de correlación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.6.1. Correlación y heterogeneidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.6.2. Correlación y causalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.7. Recta de Regresión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.7.1. Cálculo de la recta de regresión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

iii
ÍNDICE GENERAL

2.8. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47


2.9. Cuestionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.9.1. Cuestionario Tema1 y Tema2: 12 de Marzo 2018. . . . . . . . . . . . . . . . . . . 50
2.9.2. Cuestionario Tema2: 11 de Marzo 2019. Modelo A. . . . . . . . . . . . . . . . . . . 53
2.9.3. Cuestionario Tema2: 11 de Marzo 2019. Modelo B. . . . . . . . . . . . . . . . . . . 56
2.9.4. Cuestionario Tema2: 11 de Marzo 2019. Modelo C. . . . . . . . . . . . . . . . . . . 59
2.9.5. Cuestionario Tema2: 11 de Marzo 2019. Modelo D. . . . . . . . . . . . . . . . . . . 62

3. Probabilidad 67
3.1. Técnicas de recuento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2. Espacios muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.3. Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.4. Probabilidad condicionada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.5. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.6. Cuestionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.6.1. Cuestionario Tema3: 16 de Abril 2018. . . . . . . . . . . . . . . . . . . . . . . . . 73
3.6.2. Cuestionario Tema3: 1 de Abril 2019. Modelo A. . . . . . . . . . . . . . . . . . . . 75
3.6.3. Cuestionario Tema3: 1 de Abril 2019. Modelo B. . . . . . . . . . . . . . . . . . . . 77
3.6.4. Cuestionario Tema3: 4 de Abril 2019. Modelo C. . . . . . . . . . . . . . . . . . . . 79
3.6.5. Cuestionario Tema3: 4 de Abril 2019. Modelo D. . . . . . . . . . . . . . . . . . . . 81

4. Variable aleatoria discreta 83


4.1. Variables aleatorias discretas. Esperanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.1.1. Distribuciones de probabilidad de variables aleatorias discretas. . . . . . . . . . . . 83
4.1.2. Valor esperado o esperanza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.1.3. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.2. La distribución binomial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.3. La distribución de Poisson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.3.1. Aproximación de la distribución binomial utilizando la distribución de Poisson. . . 89
4.4. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.5. Cuestionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.6. Cuestionario Tema 4: 7 de Mayo 2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.7. Cuestionario Tema 4: 6 de Mayo 2019. Modelo A. . . . . . . . . . . . . . . . . . . . . . . . 95
4.8. Cuestionario Tema 4: 6 de Mayo 2019. Modelo B. . . . . . . . . . . . . . . . . . . . . . . . 97
4.9. Cuestionario Tema 4: 10 de Mayo 2019. Modelo C. . . . . . . . . . . . . . . . . . . . . . . 99
4.10. Cuestionario Tema 4: 10 de Mayo 2019. Modelo D. . . . . . . . . . . . . . . . . . . . . . . 101

5. Variable aleatoria continua 105


5.1. Variables aleatorias continuas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.1.1. Función de densidad de probabilidad y función de distribución acumulada. . . . . 106
5.1.2. Percentiles de una variable aleatoria continua. . . . . . . . . . . . . . . . . . . . . . 108
5.1.3. Propiedades de las variables aleatorias continuas. . . . . . . . . . . . . . . . . . . . 109
5.1.4. Media y varianza de funciones lineales de una variable aleatoria. . . . . . . . . . . 109
5.2. La distribución uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.3. La distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.3.1. La distribución normal estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5.4. La distribución normal como aproximación de la distribución binomial. . . . . . . . . . . . 117
5.5. La distribución exponencial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.6. La distribución ji cuadrado, χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
5.8. Cuestionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5.8.1. 28 de mayo del 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

iv
Estadı́stica

5.8.2. Cuestionario Tema 5: 24 de mayo del 2019. Modelo A. . . . . . . . . . . . . . . . . 125


5.8.3. Cuestionario Tema 5: 24 de mayo del 2019. Modelo B. . . . . . . . . . . . . . . . . 127
5.8.4. Cuestionario Tema 5: 30 de mayo del 2019. Modelo C. . . . . . . . . . . . . . . . . 129
5.8.5. Cuestionario Tema 5: 24 de mayo del 2019. Modelo D. . . . . . . . . . . . . . . . . 131

A. Introducción a las integrales 135


A.1. Primitivas e integral indefinida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
A.2. Integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
A.3. Cambio de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
A.4. La integral como media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
A.5. Teorema fundamental del cálculo integral . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
A.6. Ejercicios propuestos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

B. Técnicas de recuento. 145


B.1. Diagrama de árbol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
B.2. Variaciones y permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
B.3. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
B.4. Resumen del análisis combinatorio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
B.5. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

C. Formulario 149

D. Tablas estadı́sticas 151

E. Exámenes finales de cursos anteriores 153


E.1. Curso académico 18-19 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
E.1.1. Examen convocatoria junio 2019. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
E.1.2. Examen convocatoria julio 2019. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
E.2. Curso académico 17-18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
E.2.1. Examen convocatoria mayo 2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
E.2.2. Examen convocatoria julio 2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

Profesores de la asignatura:
Los profesores de la asignatura:
David Romero: pantaleon.romero@uchceu.es
Marı́a Jovanı́: maria.jovani@uchceu.es

1
ÍNDICE GENERAL

2
Capı́tulo 1

Análisis descriptivo de datos

1.1. ¿Por qué estudiar estadı́stica?


Cada vez es más frecuente que para hacer una valoración inteligente de los acontecimientos actuales,
necesitemos asimilar e interpretar una cantidad considerable de datos. Afirmaciones como “el ı́ndice de
precios de consumo subió un 0,8 % el mes pasado” o “el 98 % de los pacientes de un estudio clı́nico no
experimentó ningún efecto secundario significativo con un nuevo medicamento contra el cáncer de mama”
necesitan procesar previamente un gran volumen de datos. Las técnicas estadı́sticas permiten resumir,
describir y valorar la información recogida para ayudar posteriormente en la toma de decisiones.
La estadı́stica, como disciplina dentro de las matemáticas es muy amplia y para ser más concretos nos
vamos a centrar en dos partes fundamentales: La estadı́stica descriptiva, está formada por los métodos
gráficos y numéricos que se utilizan para resumir y procesar los datos y transformarlos en información y
la estadı́stica inferencial constituye la base para hacer predicciones, previsiones y estimaciones que se
utilizan para transformar la información en el conocimiento.

1.2. Población y muestra


Una población es el conjunto completo de todos los objetos que interesan a un investigador. El tamaño
de la población, N , puede ser muy grande o incluso infinito. Una muestra es un subconjunto observado
de valores poblacionales que tiene un tamaño muestral que viene dado por n.

Ejemplo 1.1. Algunas descripciones de algunas poblaciones en las que se consideran muestras de algunos
individuos para realizar estudios estadı́sticos.
1. Todos los votantes inscritos en un paı́s cuando nuestro objeto de estudio son los resultados de las
próximas elecciones
2. Todas las familias que viven en una ciudad.
3. Todas las reclamaciones que recibe en un año dado una compañı́a de seguros médicos.
4. Todos los peces que habitan en un rı́o cuando el objeto es estudiar si la contaminación está afectando
a los peces del rı́o.

El muestreo aleatorio simple es un método que se emplea para seleccionar una muestra de n objetos
de una población en el que cada miembro de la población se elige estrictamente al azar, cada miembro
de la población se elige con la misma probabilidad y todas las muestras posibles de un tamaño dado, n,
tienen la misma probabilidad de ser seleccionadas. La muestra resultante se denomina muestra aleatoria.

3
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

Se necesita estudiar estadı́stica no para hacer afirmaciones sobre la muestra sino, para extraer con-
clusiones sobre la población en general. Por ejemplo, cuando se encuesta a un conjunto de votantes a la
salida de un colegio electoral, el objetivo es predecir qué candidato obtendrá más votos. La estadı́stica es
el estudio de cómo se toman decisiones sobre la población cuando la información procede de una muestra.

1.3. Clasificación de variables.


Una variable es una caracterı́stica que puede ser medida y que puede adoptar valores diferentes para
cada uno de los elementos que constituyen la población de estudio. Los datos son los valores de la variable
para cada elemento de la muestra.

Ejemplo 1.2. Ejemplos de variables son:


1. Grado de cocción de una chuleta: cruda, muy hecha, etc.
2. Color de una pieza: rojo, verde, blanco, etc.

3. Número de piezas defectuosas: 0, 1, 2, 3, etc.


4. Peso al nacer de un niño: 3,3 Kg, 2,7 Kg, etc.

1.3.1. Clasificación de variables


Las variables son de diferentes tipos y dependiendo de su carácter deberemos tratarlas de formas
distintas. Aquı́ presentamos una clasificación básica de estas:

Cualitativas Son las variables que expresan distintas cualidades, que no pueden ser medidas con núme-
ros. Dentro de ellas podemos distinguir:

Nominal Presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo,
si a un jugador de baloncesto se le asigna el número “20” y a otro el número “10”, no se extrae
la conclusión que uno sea el doble mejor que el otro. Otro ejemplo son estado civil, género,
nacionalidad, . . . Si se asignan números para codificar estas respuestas, estos no determinan
ningún orden.
Ordinales La variable puede tomar distintos valores ordenados siguiendo una escala establecida ,
por ejemplo, la valoración de satisfacción con el servicio del comedor de la universidad: (1: muy
insatisfecho, 2: moderadamente insatisfecho, 3: ninguna opinión, 4: moderadamente satisfecho,
5: muy satisfecho).

Cuantitativas Es la que se expresa mediante un número procedentes de una medición o un recuento .


Por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Discreta es aquella que puede tener un número finito de valores o en el caso de ser infinito,
al menos, que sea posible contarlos. Sin embargo, el tipo más frecuente es el que produce
una respuesta que proviene de un proceso de recuento. Por ejemplo, el número de alumnos
matriculados en una clase o el número de hermanos que tiene cada individuo toma valores
aislados, es decir, no admite valores intermedios entre dos valores especı́ficos. Por ejemplo: El
número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Continua es aquella que puede tomar cualquier valor de un intervalo dado de números reales y
normalmente proviene de un proceso de medición (no de recuento). Por ejemplo, la altura, el
peso, el tiempo, la distancia o la temperatura.

4
Estadı́stica

sexo : 1(masculino), 2(f emenino)


 

  nominales
cualitativas



calidad : 1(malo), 2(medio), 3(bueno)

ordinales

 

variables
nž de hijos : 0, 1, 2, ...

 discretas




cuantitativas



peso : 51,3, 60,2, 72, ...

continuas
 

Figura 1.1: Esquema de clasificación de las variables

1.4. Tablas de frecuencias.


La forma más simple de organizar y presentar los datos presentes en una muestra son las tablas de
frecuencias que nos permiten organizar y resumir los datos ası́ como obtener una información preeliminar
necesaria para los que administran y toman decisiones.

1.4.1. Tabla de frecuencia para variables cualitativas o cuantitativas discretas


Cuando la variable de estudio es una variable cualitativa o cuantitativa discreta y los datos se recogen
a partir de una muestra de tamaño n, se resumen en una tabla de frecuencia con la siguiente forma:
clases fi Fi hi Hi hi % Hi %

n 1 100
Totales n 1 100
a primera columna (llamada clases o grupos) que contiene todas las posibles respuestas de dicha variable.
Las columnas siguientes representan la siguiente información:
Frecuencia absoluta Es el número de veces que aparece un determinado valor de la variable. Se repre-
senta por fi . En algunos libros de texto nos la encontraremos representada por ni .
Frecuencia absoluta acumulada Es la suma de la frecuencia absoluta de un valor de la variable con
todos los anteriores. Se representa por Fi .
Frecuencia relativa Es el cociente entre la frecuencia absoluta y el tamaño de la muestra n. Se re-
presenta por hi . Al multiplicarla por 100obtenemos el porcentaje de individuos que presentan esta
caracterı́stica y que denotamos por hi %.
Frecuencia relativa acumulada Es la suma de la frecuencia relativa de un valor de la variable con to-
dos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta acumulada
y el número total de datos. Se representa por Hi .
Por último, la tabla concluye con las frecuencias relativas y relativas acumuladas en tantos por cien (hi %
y Hi %).

Ejemplo 1.3. En un banco se considera una muestra aleatoria de 50 clientes y se le pregunta sobre el
número de tarjetas de créditos.

alumno 1 2 3 4 ........ 48 49 50
nº de tarjetas de crédito 3 0 1 0 ........ 0 2 1

Los datos serı́an resumidos en una tabla como la siguiente:

5
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

nº de tarjetas fi Fi hi Hi hi % Hi %
0 21 21 0.42 0.42 42 42
1 8 29 0.16 0.58 16 58
2 10 39 0.20 0.78 20 78
3 4 43 0.08 0.86 8 86
4 6 49 0.12 0.98 12 98
5 1 50 0.02 1 2 100
Totales 50 1 100

1.4.2. Tablas de frecuencia para variables cuantitativas continuas


Cuando la variable de estudio es cuantitativa continua y los datos se recogen a partir de una muestra
de tamaño n, para construir la tabla de frecuencias es necesario decidir en primera lugar:

En cuántos intervalos distribuiremos los datos (clases o grupos). Para lo que usaremos el Cuadro1.1

De qué amplitud deben ser los intervalos para ello tenga en cuenta las siguientes reglas:

1. Decidir el número, k, de intervalos (clases).


2. Los intervalos (clases) deben ser de la misma amplitud, w:

(nº mayor - nº menor)


w = amplitud de los intervalos =
nº de intervalos

Tanto k como w deben redondearse al alza, posiblemente al siguiente número entero mayor.
3. Los intervalos (clases) deben ser inclusivos y no solaparse.

Tamaño de la muestra Nº de intervalos


Menos de 50 5-7
De 50 a 100 7-8
De 101 a 500 8-10
De 501 a 1000 10-11
De 1001 a 5000 11-14
Más de 5000 14-20

Cuadro 1.1: Número de intervalos a dividir la muestra para una variable cuantitativa

En definitiva la tabla de frecuencias tendrı́a una estructura similar a la de una variable cualitativa
sólo que con una columna más, que recogerı́a el punto medio de los intervalos. Esta columna recibe el
nombre de marca de clase (xi ).

clases xi fi Fi hi Hi hi % Hi %

n 1 100
Totales n 1 100

6
Estadı́stica

Ejemplo 1.4. Se desea estudiar el ı́ndice de obesidad de los jóvenes de entre 18 y 25 años. Para ello se
extrae una muestra representativa de la población de tamaño 500 y se anota el peso de cada individuo.

individuo 1 2 3 4 ........ 498 499 500


peso (Kg.) 50.1 62.3 58.1 49.5 ........ 43.7 72.4 103.3

La variable de estudio es una variable cuantitativa continua. Como el tamaño muestral es n = 500,
deberı́amos distribuir los datos entre 8 y 10 intervalos. En nuestro caso vamos a considerar 10 intervalos.
Imaginemos que la persona con menor peso ha sido un individuo con 42,7 Kg. y la persona con mayor
peso pesa 112,5 Kg. Redondeando, consideramos que el rango de peso oscila entre 40 y 120 Kg. Ası́, la
amplitud de los intervalos serı́a:
120 − 40
w= =8
10

La tabla de frecuencias quedarı́a del siguiente modo:

peso (Kg.) xi fi Fi hi Hi hi % Hi %
[40, 48[ 44 26 26 0.052 0.052 5.2 5.2
[48, 56[ 52 200 226 0.400 0.452 40 45.2
[56, 64[ 60 150 376 0.300 0.752 30 75.2
[64, 72[ 68 50 426 0.100 0.852 10 85.2
[72, 80[ 76 20 446 0.040 0.892 4 89.2
[80, 88[ 84 21 467 0.042 0.934 4.2 93.4
[88, 96[ 92 20 487 0.040 0.974 4 97.4
[96, 104[ 100 10 497 0.020 0.994 2 99.4
[104, 112[ 108 0 497 0 0.994 0 99.4
[112, 120] 116 3 500 0.006 1 0.6 100
Totales 500 1 100

1.5. Medidas de centralización


Las medidas de centralización suministran información numérica sobre una observación “tı́pica” de
los datos. En este apartado analizamos la media, la moda y la simetrı́a de los datos.

1.5.1. Media
La media poblacional, µ, es un parámetro que viene dado por:

N
X
xi
i=1 x1 + x2 + . . . + xN
µ= = ,
N N
donde N es el tamaño de la población. ¡Cuidado: La media de la población es habitualmente desco-
nocida. Habitualmente se aproxima por la media muestral, que veremos a continuación.
Si el conjunto de datos procede de una muestra de tamaño n, entonces la media muestral, x, es un
estadı́stico que viene dado por:

7
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

n
X
xi
i=1 x1 + x2 + . . . + xn
x= = ,
n n

1.5.2. Mediana
La mediana es la observación que ocupa el lugar central de un conjunto de observaciones ordenadas
en sentido ascendente. Se calcula distinguiendo según el tamaño muestral sea par o impar.
Si el tamaño muestral, n, impar, la mediana es la observación que se encuentra en el centro.
Si el tamaño de la muestra, n es un número par, la mediana es la media de las dos observaciones
que se encuentran en el centro.

1.5.3. Moda
La moda, si existe, es el valor que aparece con más frecuencia.

1.5.4. Reflexiones:
¿Cuál es la mejor medida para describir la tendencia central de los datos: la media, la mediana o la
moda?. Depende del contexto. Uno de los factores que influye en la decisión es el tipo de datos, cualitativos,
cuantitativos discretos o cuantitativos continuos. La media generalmente es la medida preferida para
describir datos continuos, pero no datos cualitativos.

Ejemplo 1.5. Si en una encuesta con posibles respuestas: 1(totalmente en desacuerdo), 2(moderada-
mente en desacuerdo), 3(ninguna opinión), 4(moderadamente de acuerdo) y 5(totalmente de acuerdo),
dos personas contestan 1 y 5. La media, 3, no describirı́a la realidad.

Ejemplo 1.6. Si estudiamos la variable sexo: 1(hombre) y 2(mujer), la media de la muestra 1,1,2,2,2
es 1.6 que no ofrece una buena información, sin embargo la moda 2 indica que hay más mujeres que
hombres.

Luego los datos cualitativos se describen, generalmente, mejor mediante la mediana y la moda.
El director de unos grandes almacenes tiene interés en saber cuántas reclamaciones recibe el depar-
tamento de atención al cliente sobre la calidad de los aparatos eléctricos que venden. Los registros de un
periodo de 5 semanas muestran el siguiente número de reclamaciones:
13, 15, 8, 16 y 8
1. Calcula el número medio de reclamaciones semanales.
2. Calcula el número mediano de reclamaciones semanales.
3. Calcula la moda.
13 + 15 + 8 + 16 + 8
1. x = = 12.
5

2. Para calcular la mediana, se ordenan los datos de menor a mayor (8, 8, 13, 15 y 16). Como hay 5
datos la mediana será el dato que está en la posición tercera. Me = 13.
3. Mo = 8.

8
Estadı́stica

1.6. Medidas de localización


1.6.1. Percentil
La idea del Percentil p con 1 < p < 100 (Pp ) se aplica a datos de tipo cuantitativos (x1 , x2 , . . . , xn )
y su objetivo es estimar el valor que deja por debajo de él el p % de los datos y el (100 − p) % por debajo
de él. Hay diversas fórmulas para calcular los percentiles, describimos una de las más populares que usan,
por ejemplo, Excel y R:
El primer paso es ordenar la secuencia de los datos cuantitativos: x(1) , x(2) , . . . , x(n) . Cuando el subı́ndi-
ce se escribe entre paréntesis entenderemos que se trata de la secuencia ordenada.
El p-percentil se calcula con la fórmula

(1 − γ) · x(k) + γ · x(k+1)

donde:
k es el mayor entero que es menor o igual que (n − 1) · 100p
+ 1.
γ es la parte decimal de (n − 1) · 100 + 1, es decir, γ = (n − 1) · p + 1 − k
p

1.6.2. Otras medidas de localización.


Las medidas de localización resumen entre qué cantidades oscilan los valores del banco de datos.
Mı́nimo: Es el valor más pequeño del banco de datos.
Percentil 25 o primer cuartil (P25 o Q1 ) : Ordenando el banco de datos de forma ascendente, es
el valor que deja por debajo de él el 25 % de los datos.
Percentil 50 o segundo cuartil (P50 o Q2 ) : Ordenando el banco de datos de forma ascendente, es
el valor que deja por debajo de él el 50 % de los datos.
Percentil 75 o tercer cuartil (P75 o Q3 ) : Ordenando el banco de datos de forma ascendente, es el
valor que deja por debajo de él el 75 % de los datos.
Máximo: Es el valor más grande del banco de datos.
El resumen de los cinco números se refiere a las cinco medidas descriptivas: mı́nimo, primer
cuartil, mediana, tercer cuartil y máximo:

Mı́nimo < Q1 < Mediana < Q3 < Máximo

Ejercicio 1.1. Los siguientes datos reflejan el número de llamadas diarias recibidas por un servicio de
comida a domicilio:
78 64 62 53 83 51 51 58 45 51 69 47 54 45 62 67 69 51 51 64 45 72 58 74 54 42 67 59 57 78

Calcula el percentil 20 %, percentil 45 %, percentil 70 %.

Solución: El primer paso es ordenar la muestra:


42 45 45 45 47 51 51 51 51 51 53 54 54 57 58 58 59 62 62 64 64 67 67 69 69 72 74 78 78 83

El tamaño de la muestra es n = 30.

Percentil al 20 %: Calculamos el valor que nos sirve para determinar la posición del percentil:
p
(n − 1) · + 1 = 29 · 0,2 + 1 = 6,8
100
luego, la parte entera es k = 6 y la decimal γ = 0,8. Con estos números calculamos el 20-percentil

P20 = (1 − γ) · x(k) + γ · x(k+1) = (1 − 0,8) · x(6) + 0,8 · x(7) = 0,2 · 51 + 0,8 · 51 = 51

9
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

Percentil al 45 %: Procedemos de la misma forma buscando la posición del percentil


p
(n − 1) · + 1 = 29 · 0,45 + 1 = 14,05
100
luego, la parte entera es k = 14 y la decimal γ = 0,05. Con estos números calculamos el 45-percentil

P45 = (1 − γ) · x(k) + γ · x(k+1) = (1 − 0,05) · x(14) + 0,05 · x(15) = 0,95 · 57 + 0,05 · 58 = 57,05

Percentil al 70 %: En el último la posición del percentil viene determinada por:


p
(n − 1) · + 1 = 29 · 0,70 + 1 = 21,3
100
luego, la parte entera es k = 14 y la decimal γ = 0,05. Con estos números calculamos el 70-percentil

P70 = (1 − γ) · x(k) + γ · x(k+1) = (1 − 0,30) · x(21) + 0,30 · x(22) = 0,70 · 64 + 0,30 · 67 = 64,9

1.7. Medidas de dispersión.


La media no es por sı́ sola una descripción completa o suficiente de los datos. En este apartado veremos
descriptivos que miden la variabilidad o dispersión de las observaciones con respecto a la media, como por
ejemplo el rango, el rango intercuartı́lico, la varianza, la desviación tı́pica y el coeficiente de variación.

1.7.1. Rango y rango intercuartı́lico


El rango es la diferencia entre la observación mayor y la menor.

El rango intercuartı́lico (RIC) mide la dispersión que hay en el 50 por ciento central de los datos; es
la diferencia entre la observación Q3 , tercer cuartil o percentil 75 y la observación Q1 , primer cuartil o
percentil 25.

RIC=Q3 − Q1

donde Q3 y Q1 son los percentiles 75 y 25 calculados según la forma vista en la sección de medidas
de localización. Recuerde que el primer paso es tener los datos ordenados en sentido ascendente.
Aunque el rango y el rango intercuartı́lico miden la dispersión de los dato, ambas medias sólo tiene en
cuenta dos de los valores de los datos. Serı́a deseable disponer de una medida que promedie la distancia
de cada uno de los valores y la media.

1.7.2. Varianza poblacional y muestral, desviación tı́pica


La varianza poblacional, σ 2 , es la suma de los cuadrados de las diferencias entre cada observación y
la media poblacional dividida por el tamaño de la población, N :
PN
i=1 (xi − µ)2
σ =
2
N
La varianza muestral, s , es la suma de los cuadrados de las diferencias entre cada observación y la
2

media muestral dividida por el tamaño de la muestra, n, menos 1:


Pn
(xi − x)2
s = i=1
2
n−1

10
Estadı́stica

La desviación tı́pica poblacional, σ, es la raı́z cuadrada (positiva) de la varianza poblacional:


s
PN

i=1 (xi − µ)
2
σ= σ = 2
N
La desviación tı́pica muestral, s, es la raı́z cuadrada (positiva) de la varianza muestral:
sP
√ n
i=1 (xi − x)
2
s = s2 =
n−1
La desviación tı́pica se mide en las mismas unidades que la variable de donde proceden los datos y
describe la dispersión media entorno a la media.

Ejercicio 1.2. Se considera una muestra aleatoria de ocho empresas estadounidenses. Los beneficios
por acción, de cada empresa, han experimentado este año las siguientes variaciones porcentuales en
comparación con el año pasado:
0% 0% 8.1 % 13.6 % 19.4 % 20.7 % 10.0 % 14.2 %

Realiza un análisis descriptivo de los datos.

Solución: La variación porcentual media de los beneficios por acción de esta muestra es:
n
1X 0 + 0 + 8,1 + ... + 14,2
x= xi = =10.75, es decir 10.75 %
n i=1 8
Para calcular la variación porcentual mediana de los beneficios por acción se ordenan los valores de
forma ascendente:

0% 0% 8.1 % 10.0 % 13.6 % 14.2 % 19.4 % 20.7 %

Me= 10,0+13,6
2 11.8 por ciento.

Mo=0 %. Fijaros que la tasa porcentual modal no es un buen representante del centro de estos datos.

Para calcular el primer cuartil se calcula la estimación de posición (n−1)p/100+1 = (8−1)25/100+1 =


2,75 con lo que k = 2 y γ = 0,75, con lo que Q1 = (1 − 0,75)x(2) + 0,75x(3) = 6,075.

Para calcular el tercer cuartil se calcula la posición (n − 1)p/100 + 1 = (8 − 1)75/100 + 1 = 6,25, con
lo que k = 6 y γ = 0,25, con lo que Q1 = (1 − 0,25)x(6) + 0,25x(7) = 0,75 · 14,2 + 0,25 · 19,4 = 15,5.

rango= 20,7 − 0 = 20,7.


rango intercuartı́lico
Pn RIC= 15,5 − 6,075 = 9,425.
s2 = n−1
1
i=1 (x i − x)2
= 432,45 = 61,78
√ √ 7
s = s = 61,78 = 7,86
2

Ejercicio 1.3. Se ha analizado una muestra de 20 lotes de un producto quı́mico para hallar la concen-
tración de impurezas. Los resultados obtenidos son:

Porcentaje de impurezas 0<2 2<4 4<6 6<8 8 < 10


Lotes 2 3 6 5 4

Calcula todas las medidas de centralización y dispersión que conozcas.

11
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

Solución: Para llevar a cabo los cálculos construiremos una tabla de frecuencias:
Clase xi fi xi fi (xi − x) (xi − x)2 fi (xi − x)2
0<2 1 2 2 -4.6 21.16 42.32
2<4 3 3 9 -2.6 6.76 20.28
4<6 5 6 30 -0.6 0.36 2.16
6<8 7 5 35 1.4 1.96 9.8
8 < 10 9 4 36 3.4 11.56 46.24
Suma 20 112 120.8

Medidas de centralización:
Pk
n= i=1 fi = 20
Pk
xi fi
x= i=1
n = 112
20 = 5,6

Para calcular la mediana se calcula la posición del dato central (pos(Q2 )=0.5(n+1)=10.5). Como n
es par se toman los datos que están en la posición 10 y 11 y se calcula su media. M e ≈ 5

Moda: Mo=5

Para calcular el primer cuartil se calcula la estimación de posición (n − 1)p/100 + 1 = (20 − 1)25/100 +
1 = 5,75 con lo que k = 5 y γ = 0,75, con lo que Q1 = (1 − 0,75)x(5) + 0,75x(6) = 0,25 · 3 + 0,75 · 5 = 4,5.

Para calcular el tercer cuartil se calcula la estimación de posición (n−1)p/100+1 = (20−1)75/100+1 =


15,25 con lo que k = 15 y γ = 0,25, con lo que Q3 = (1 − 0,25)x(15) + 0,25x(16) = 0,75 · 7 + 0,25 · 7 = 7.

Medidas de dispersión:

rango= 9 − 1 = 8.

rango intercuartı́lico RIC= 7 − 4,5 = 2,5.


k
1 X 120,8
s2 = fi (xi − x)2 = = 6,3579
n − 1 i=1 19
√ √
s = s2 = 6,3579 = 2,52

1.8. Gráficos para describir variables cualitativas y cuantitativas


discretas.
Las variables cualitativas y cuantitativas discretas pueden describirse utilizando gráficos de barras,
gráficos de tarta y diagramas Pareto. Estos gráficos son utilizados habitualmente por los directivos y
analistas de mercado para describir los datos procedentes de encuestas y de cuestionarios.
Si el objetivo es llamar la atención sobre la frecuencia de cada categorı́a lo más adecuado es trazar
un gráfico de barras, en el que la altura de un rectángulo representa esta frecuencia. Lo habitual es que
cada rectángulo esté separado por un espacio en blanco para distinguir cada categorı́a.
Si el objetivo es hacer hincapié en la proporción de las frecuencias de cada categorı́a, el gráfico adecuado
es el gráfico de tarta. El cı́rculo (o “tarta”) representa la proporción total y los sectores ( o “trozos de

12
Estadı́stica

la tarta”) que lo parten tienen un área proporcional a la frecuencia de cada categorı́a.

Ejemplo 1.7. El Orlando Sentinel enumera anualmente las principales empresas de Florida central. La
siguiente tabla muestra la distribución de frecuencias de las cinco empresas que tenı́an el mayor número
de asalariados en esta zona en 2003.
Empresas (clases) Nº de asalariados (fi ) (hi %)
Disney World 51600 4572
Florida Hospital 19283 17.08
Publix Supermarkets Inc. 14995 13.28
Wal-Mart Stores Ind. 14995 13.28
Universal Orlando 12000 10.63

Disney World
50000
40000
Nº de asalariados

30000
20000

Florida Hospital
Universal Orlando
10000

Wal−Mart Stores
Publix Supermark.
0

Disney World Florida Hosp. Publix Superm. Wal−Mart Universal Orlando

Empresas

Figura 1.2: Diversas formas de representar datos del ejemplo 1.7. A la izquierda en el gráfico de barras se
muestra el número de asalariados en las cinco principales empresas de Florida en 2003. A la izquierda el
gráfico de tarta hace énfasis en el porcentaje de asalariados en las cinco principales empresas de Florida
en el 2003.

1.9. Gráficos para describir variables cuantitativas continuas.


El diagrama de cajas de una variable consiste en la representación gráfica del resumen de los cinco
números. Se compone de un rectángulo o caja que representa el rango intercuartı́lico y dos segmentos
o bigotes en cada extremo de la caja que tienen una longitud de, como máximo, 1.5 veces el rango
intercuartı́lico, según sea el valor del mı́nimo o máximo. Si hay datos más allá de estos segmentos se
señalan en el gráfico con puntos a estos valores se les denomina valores atı́picos
En este apartado presentamos brevemente histogramas, ojivas y diagramas de tallo y hojas que resu-
men y describen datos numéricos.
Un histograma es un gráfico formado por barras verticales construidas sobre una linea recta horizontal
delimitada por los intervalos de la variable estudiada. Los intervalos corresponden a los construidos en
una tabla de frecuencias. La altura de cada barra es proporcional al número de observaciones que hay en
ese intervalo. El número de observaciones puede indicarse encima de las barras.

13
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

Una ojiva, llamada a veces gráfico de frecuencia acumuladas, es una lı́nea que conecta puntos que son
el porcentaje acumulado de las observaciones situadas por debajo del lı́mite superior de cada intervalo en
una distribución de frecuencias acumuladas.

Ejemplo 1.8. Se considera la siguiente tabla de frecuencias sobre el uso del teléfono móvil (en minutos)
de una muestra de 110 observaciones. Pare estos datos se muestra en la Figura 1.3 su histograma y su
ojiva.

Uso del móvil (en min.) fi Hi %


[220, 230[ 5 4.5
[230, 240[ 8 11.8
[240, 250[ 13 23.6
[250, 260[ 22 43.6
[260, 270[ 32 72.7
[270, 280[ 13 84.5
[280, 290[ 10 93.6
[290, 300] 7 100

14
Estadı́stica

● ●

5 10 15 20 25 30 35 40

(a) Diagrama de cajas.

100
30

80
25
20

% acumulado

60
frecuencias

15

40
10

20
5
0

220 240 260 280 300 230 240 250 260 270 280 290 300

Minutos consumidos (abril) Minutos consumidos (abril)

(b) Histograma del ejemplo 1.8. (c) Ojiva del ejemplo 1.8.

Figura 1.3: Varios ejemplos de representaciones gráficas de datos.

15
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

1.10. Ejercicios propuestos


Ejercicio 1.4. Clasifica los siguientes caracteres estadı́sticos según sean cualitativos, variables discretas
o variables continuas:
Marca de los coches.
Peso de los coches.
Número de coches vendidos de las diferentes marcas
Ejercicio 1.5.
Clasifica las siguientes variables:

a. Sexo. h. Número de calzado.

b. Nacionalidad. i. Número de vecinos de un edificio.

c. Edad. j. Número de horas que ves la televisión.


k. Temperatura.
d. Número de hermanos.
l. Dı́as de la semana.
e. Color de pelo.
m. Dı́a del mes.
f. Calificación en una asignatura (del 0 al 10).
n. Mes del año.
g. Estatura.

Ejercicio 1.6. De los 100 trabajadores de una empresa han llegado a trabajar 10 minutos pronto 23,
5 minutos pronto 15, en su hora 22, 5 minutos tarde 17, y el resto 10 minutos tarde. Forma la tabla de
frecuencias absolutas y relativas.
Ejercicio 1.7. En Villanueva de Arriba el 40 % de las familias tienen un solo hijo, el 35 % dos hijos, el
11 % ninguno y el resto más de dos. Sabiendo que en el pueblo viven 1100 familias, forma la tabla de
frecuencias relativas, absolutas y acumuladas.
Ejercicio 1.8. Se realiza un trabajo en la asignatura de lengua en una clase formada por 40 alumnos. 2
alumnos realizan el trabajo en un folio, 5 en 2 folios, 6 en 3 folios, y el resto en 4 folios. Forma la tabla
de frecuencias absolutas y relativas.¿Crees que el profesor ha recomendado un número determinado de
folios?.
Ejercicio 1.9. En una universidad se ha realizado una encuesta a 200 alumnos de la licenciatura de
documentación. El 32 % afirma que está muy contento con la universidad, el 40 % está contento, el 23 %
no está contento, y el resto muy descontento. Forma la tabla de frecuencias absolutas, relativas y absolutas,
y explica si crees que la universidad lo está haciendo bien.
Ejercicio 1.10. El número de hermanos de 40 alumnos es:

3 4 2 3 4 3 4 4 4 2 3 4 4 3 4 1 2 3 5 4
2 2 2 5 3 4 4 6 2 6 4 3 2 1 2 3 2 4 3 1

a. Construye una tabla de frecuencias completa.


b. ¿Cuántos alumnos tienen 5 o más hermanos? Cuántos 3 o menos?
c. ¿Qué porcentaje de alumnos pertenecen a una familia numerosa?

16
Estadı́stica

Ejercicio 1.11. Las horas de sol registradas en el mes de enero de 2008 en 50 estaciones meteorológicas
es:
83 82 78 72 107 93 72 85 98 71 76 75
83 72 126 102 67 112 99 155 118 150 129 119 148
181 151 167 156 180 173 149 80 131 121 110 200
162 214 176 186 187 186 141 212 186 199 198 219 200

Construye una tabla de frecuencias completa. Calcula los percentiles al 20 %,40 %,60 %, el Rango In-
tercuartı́lico y los cuartiles Q1 , Q2 , Q3

Ejercicio 1.12. Diez economistas recibieron el encargo de predecir el crecimiento porcentual que expe-
rimentar el ı́ndice de precios de consumo para el próximo año. Sus predicciones fueron

3.6 3.1 3.9 3.7 3.5 3.7 3.4 3.0 3.7 3.4

a. Calcula la media, mediana y moda muestrales.

b. Calcula todas las medidas de dispersión que conozcas.

c. Calcula los percentiles al 10 % y 60 %.

d. Representa el diagrama de cajas.

Ejercicio 1.13. Una cadena de grandes almacenes eligió aleatoriamente 10 establecimientos situados en
una región. Tras examinar los datos de ventas, observó que ese año se habı́an conseguido en las Navidades
los siguientes aumentos porcentuales de las ventas en dólares con respecto al año anterior:
10.2 3,1 5.9, 7.0 3.7 2.9 6.8 7.3 8.2 4.3

a. Calcula el aumento porcentual medio de las ventas en dólares.

b. Calcula la mediana y moda muestrales.

c. Describe la dispersión de los datos.

d. Representa e interpreta el diagrama de cajas.

Ejercicio 1.14. Los porcentajes de la remuneración total correspondientes al pago de pluses de una
muestra de 12 altos ejecutivos son los siguientes:

15.8 17.3 28.4 18.2 15.0 24.7 13.1 10.2 29.3 34.7 16.9 25.3

a. Describe la tendencia central de los datos.

b. Calcula distintas medidas de dispersión.

c. Interpreta el percentil al 40 % y 60 %

17
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

Ejercicio 1.15. Un fabricante de radios portátiles obtuvo una muestra de 50 radios de la producción
de una semana. Las radios se examinaron minuciosamente y el número de defectos encontrados fue el
siguiente:

Número de defectos 0 1 2 3
Número de radios 12 15 17 6
Con ayuda de una tabla de frecuencias haz un análisis descriptivo de los datos completo. Interpreta
y representa el diagrama de cajas asociado.

Ejercicio 1.16. Se ha pedido a una muestra de 20 analistas financieros que hagan una predicción de los
beneficios por acción que obtendrá una empresa el próximo año. La tabla adjunta resume los datos:
Predicción ($ por acción) [9.95,10.45[ [10.45,10.95[ [10.95,11.45[ [11.45,11.95[ [11.95,12.45]
Número de analistas 2 8 6 3 1

Describe estadı́sticamente la tabla de resultados.

Ejercicio 1.17. Comestibles Gilera anuncia que los clientes tienen que esperar menos de 1 minuto para
pagar si utilizan la caja rápida. Los tiempos de espera (en segundos) de una muestra de 25 clientes son:
11 12 14 16 17 18 18 19 19 21 22 22 22
24 26 28 29 29 30 31 32 33 34 40 42
Calcula el resumen de los cinco números (máximo,mı́nimo,Q1 ,Q2 ,Q3 ).

Ejercicio 1.18. La demanda diaria, en unidades de un producto, durante 30 dı́as de trabajo es:

38 35 76 58 48 59
67 63 33 69 53 51
28 25 36 32 61 57
49 78 48 42 72 52
47 66 58 44 44 56

a. Construir las distribuciones de frecuencia relativa y de frecuencia acumulada.

b. Con la distribución acumulada, determina los tres cuartiles.

c. Calcula la media, mediana, moda y desviación tı́pica.

d. Representa un diagrama de cajas.

Ejercicio 1.19. A continuación se presentan 3 conjuntos de datos:

A 1 2 3 4 5 6
B 1 1 1 6 6 6
C -13 2 3 4 5 20

Calcular la media y la varianza para cada conjunto de datos. ¿Qué se puede concluir?. Representa e
interpreta el diagrama de cajas.

18
Estadı́stica

Ejercicio 1.20. La siguiente tabla muestra las ventas, en miles de dolares, de 20 vendedores de una
compañı́a de ordenadores.

40.2 29.3 35.6 88.2 42.9


26.9 28.7 99.8 35.6 37.8
44.2 32.3 55.2 50.6 25.4
31.7 36.8 45.2 25.1 39.7

Calcula la media, mediana, desviación tı́pica y el recorrido intercuartı́lico. Representa e interpreta


diagrama de cajas.
Ejercicio 1.21. La siguiente muestra representa la edad de un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Representa un diagrama de sectores, de barras y de cajas. Interpreta los resultados.
Ejercicio 1.22. El número de faltas de ortografı́a que cometieron un grupo de estudiantes en un dictado
fue:
0 3 1 2 0 2 1 3 0 4
0 1 1 4 3 5 3 2 4 1
5 0 2 1 0 0 0 0 2 1
2 1 0 0 3 0 5 3 2 1
Representa un diagrama de barras y de cajas. Interpreta los resultados.
Ejercicio 1.23. Las urgencias atendidas durante un mes en un centro de salud fueron:
1532164223
4351015336
2463243215
Representa un diagrama de barras y de cajas. Interpreta los resultados.
Ejercicio 1.24. En una maternidad se han tomado los pesos (en kilogramos) de 50 recién nacidos:
2.8 3.2 3.8 2.5 2.7 3.7 1.9 2.6 3.5 2.3
3.0 2.6 1.8 3.3 2.9 2.1 3.4 2.8 3.1 3.9
2.9 3.5 3.0 3.1 2.2 3.4 2.5 1.9 3.0 2.9
2.4 3.4 2.0 2.6 3.1 2.3 3.5 2.9 3.0 2.7
2.9 2.8 2.7 3.1 3.0 3.1 2.8 2.6 2.9 3.3
Determina la variable y de qué tipo es. Representa un histograma.

Ejercicio 1.25. A un grupo de 30 personas se les ha tomado el número de pulsaciones por minuto (ritmo
cardı́aco) obteniéndose los siguientes resultados:
87 85 61 51 64 75 80 70 69 82
80 79 82 74 92 76 72 73 63 65
67 71 88 76 68 73 70 76 71 86
Representa gráficamente esta distribución, usando un diagrama de cajas, barras y de sectores.

19
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

1.11. Cuestionarios
1.11.1. Cuestionario Tema1 y Tema2: 12 de Marzo 2018.
Cuestión 1.1

La altura de los alumnos de Marketing del CEU es una variable:


a) Cualitativa nominal
b) Cualitativa ordinal
c) Cuantitativa discreta
d) Cuantitativa continua.

En un partido de baloncesto, se tiene la siguiente anotación en los jugadores de un equipo: 0,2,4,5,8,10,10,15,38.


Cuestión 1.2

Indica cuál es el valor de la media muestral.


a) 11,5
b) 10,22
c) 6
d) Ninguna de las anteriores.
Cuestión 1.3

Indica cuál es el valor de la varianza muestral.


a) 129,70
b) 115,28
c) 11,39
d) Ninguna de las anteriores.
Cuestión 1.4

Completa la siguiente tabla relativa a la marca que usa un grupo de alumnos del CEU de teléfono móvil.
Marca fi hi hi %
Apple 16 %
Samsung 12 0,48
LG 3
Sony 20 %
Shen Wai 0,04
Total

20
Estadı́stica
Cuestión 1.5

¿Qué medida de las siguientes NO está relacionada con una medida de tendencia central.
a) Media muestral.
b) Moda.
c) Varianza.
d) Mediana.

En una empresa de congelados, la demanda diaria, en lotes de producto, durante 30 dı́as de trabajo es:
38, 35, 76, 58, 48, 59, 67, 63, 33, 69
53, 51, 28, 25, 36, 32, 61, 57, 49, 78
48, 42, 72, 52, 47, 66, 58, 44, 44, 56
Dibuja el diagrama de cajas de esa distribución de datos:
Cuestión 1.6

21
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

En la tabla se recoge el éxito en un examen de los alumnos dependiendo del tiempo dedicado al estudio

Poco tiempo Suficiente Mucho


Aprobado 20 50 30
Suspendo 40 20 0
Cuestión 1.7

¿Cuál es la frecuencia marginal de los alumnos que suspenden el examen?

···=
Cuestión 1.8

¿Cuál es la frecuencia de aprobar el examen condicionado a que estudio poco tiempo el examen?

···=
Cuestión 1.9

¿Cuál es la frecuencia de estudiar suficiente tiempo condicionado a que suspendió el examen?

···=

Los siguientes datos se refieren a la demanda de un producto (en miles de unidades) y su precio (en
centavos) en cinco mercados diferentes:

Precio (X) Demanda (Y)


20 22
16 41
10 120
11 89
14 56

22
Estadı́stica
Cuestión 1.10

¿Cuál es el valor del coeficiente de correlación?.


a) −0, 95
b) −0, 006
c) −0, 76
d) Ninguna de las anteriores.
Cuestión 1.11

Indica la ecuación de la recta de regresión.


a) ŷ = −7, 39x + 170, 54
b) ŷ = 196, 77x − 9, 24
c) ŷ = −9,24x + 196, 81
d) Ninguna de las anteriores.
Cuestión 1.12

¿Cuál es el pronóstico para estimar la demanda cuando el precio del producto es de 12 centavos?
a) 2352
b) 85,89
c) 81,86
d) Ninguna de las anteriores.

Soluciones Cuestionario 12 de marzo 2018


Número cuestión Respuesta correcta
1 d
2 b
3 a
4 4, 0.16, 48 %, 0.12, 12 %, 5, 0.2, 1, 4 %, 25, 1, 100
5 c
6 Q1 = 42,5, Q2 = 51,5, Q3 = 60,5, LI = 15,5, LS = 87,5
7 fS,. = 60
f
8 fA|P = fA,P.,P
= 20
60
fS,SU
9 fSU |S = fS,. = 20
60
10 a
11 c
12 b

1.11.2. Cuestionario Tema1: 18 de Febrero 2019. Modelo A.

23
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Cuestión 2.1

Dada las siguientes variables, clasifı́calas respectivamente de forma correcta: Número de preguntas acertadas
en un test, gravedad de un infarto (leve, moderado, fuerte) y grupo sanguı́neo
a) Ordinal, nominal y continua
b) Discreta, ordinal y nominal
c) Continua, nominal y ordinal
d) Ninguna de las anteriores.
Cuestión 2.2

¿Cómo representarı́as la variable color de ojos de una muestra de alumnos?


a) Histograma o diagrama de sectores
b) Diagrama de caja
c) Diagrama de barras o diagrama de sectores
d) Ninguna de las anteriores.

Se ha recogido información sobre el grado de satisfacción de los clientes de una determinada sucursal bancaria.
Las respuestas se han codificado según los siguientes códigos:
0: muy desfavorable, 1:desfavorable, 2:favorable y 3: muy favorable.
Se ha preguntado a un total de 50 clientes y las respuestas han sido las siguientes:
Cuestión 2.3

01301123003332120302100232221122030220330301222021
¿Qué porcentaje de clientes han tenido sólo un grado de satisfacción favorable con el servicio?
a) 32 %
b) 28 %
c) 22 %
d) Ninguna de las anteriores.

Los siguientes datos corresponden al número de llamadas de teléfono registradas en una empresa durante los
10 dı́as de preparación de material para una feria de muestras:
Cuestión 2.4

25, 16, 20, 15, 16, 17, 22, 21, 17, 25


¿Cuál de los siguientes valores corresponde al valor de la media muestral?.
a) 18,5
b) 19,4
c) 8,6
d) Ninguna de las anteriores es correcta.

24
Estadı́stica
Cuestión 2.5

De la cuestión anterior, ¿qué valor corresponde al valor de la varianza muestral?.


a) 18,5
b) 19,4
c) 8,64
d) Ninguna de las anteriores es correcta.
Cuestión 2.6

De la cuestión anterior, ¿qué valor corresponde al valor de la desviación muestral?


a) 2,94
b) 4,3
c) 4,4
d) Ninguna de las anteriores es correcta.

En años recientes, como consecuencia de las bajas tasas de interés, muchos propietarios de casas refi-
nanciarion sus créditos. Linda Lahey es agente hipotecaria de Down River Federal Savings and Loan. A
continuación aparecen las sumas refinanciadas de 20 préstamos a los que les dio curso la semana pasada.
Los datos se expresan en miles de dólares y se encuentran ordenados de menor a mayor.

59,2, 59,5, 61,6, 65,5, 66,6, 72,9, 74,8, 77,3, 79,2, 83,7, 85,6, 85,8, 86,6, 87,0, 87,1, 90,2, 93,3, 98,6,
100,2, 100,7.
Cuestión 2.7

Dado el enunciado anterior indica la posición del primer cuartil y su valor.


pos =

Q1 =
Cuestión 2.8

Dado el enunciado anterior indica la posición de la mediana y su valor.


pos =

Me =

25
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Cuestión 2.9

Dado el enunciado anterior indica la posición del tercer cuartil y su valor.


pos =

Q3 =
Cuestión 2.10

Traza el diagrama de cajas del enunciado anterior.

Soluciones Cuestionario 18 de febrero 2019. Modelo A.

Número cuestión Respuesta correcta


1 b
2 c
3 a
4 b
5 d
6 d
7 pos=5.75 y Q1 = 71,325
8 pos=10.5 y Q2 = 84,65
9 pos=15.25 y Q3 = 87,875
10

1.11.3. Cuestionario Tema1: 18 de Febrero 2019. Modelo B.

Se ha realizado una encuesta en 30 hogares en la que se pregunta el número de individuos que conviven en
el domicilio habitualmente. Las respuestas obtenidas son las siguientes:
Cuestión 3.1

4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 6, 6, 2, 3, 3, 3, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
¿Qué porcentaje de hogares tienen como mucho 4 individuos en el hogar?
a) 73,33 %
b) 16,67 %
c) 56,67 %
d) Ninguna de las anteriores es correcta.

26
Estadı́stica
Cuestión 3.2

Si queremos estudiar la variabilidad o dispersión de las observaciones respecto a media, ¿qué descriptivo serı́a
el adecuado?
a) La mediana
b) La desviación tı́pica
c) El primer y el tercer cuartil
d) Ninguna de las anteriores.
Cuestión 3.3

Dada las siguientes variables, clasifı́calas respectivamente de forma correcta: Gravedad de un infarto (leve,
moderado, fuerte), grupo sanguı́neo y número de preguntas acertadas en un test
a) Ordinal, nominal y continua
b) Continua, nominal y ordinal
c) Ordinal y nominal y discreta.
d) Ninguna de las anteriores.

Verizon estudia la cantidad de minutos que consumen sus clientes que cuentan con un plan tarifario para
teléfono celular. Una muestra aleatoria de 12 clientes arroja la siguiente cantidad de minutos empleados del
mes anterior:
Cuestión 3.4

90, 77, 94, 89, 119, 112, 91, 110, 92, 100, 113, 83
¿Cuál de los siguientes valores corresponde a la media muestral?.
a) 97,5
b) 98,82
c) 106,36
d) Ningua de las anteriores.

Una muestra de familias que ha contratado los servicios de la United Bell Phone Company reveló que cada
familia recibió la siguiente cantidad de llamadas la semana pasada.
Cuestión 3.5

52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 5
¿Cuál de los siguientes datos corresponde a la varianza muestral?. (la media redondearla a dos decimales).
a) 188,25
b) 154,56
c) 164,86
d) Ninguna de las anteriores es correcta.

27
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

Una muestra de familias que ha contratado los servicios de la United Bell Phone Company reveló que cada
familia recibió la siguiente cantidad de llamadas la semana pasada.
Cuestión 3.6

52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 5
¿Cuál de los siguientes datos corresponde a la desviación muestral?. (la media redondearla a dos decimales).
a) 12, 84
b) 13, 72
c) 12, 43
d) Ninguna de las anteriores es correcta.

Se han tomado muestras a 20 viviendas del nivel de cobre en el agua corriente, obteniendo los siguientes
resultados en mg/l:
0.10 0.30 0.34 0.36 0.42 0.42 0.45 0.48
0.50 0.52 0.55 0.58 0.62 0.63 0.64 0.65
0.65 0.66 0.69 0.70
Cuestión 3.7

Dado el enunciado anterior indica la posición del primer cuartil y su valor.


pos =

Q1 =
Cuestión 3.8

Dado el enunciado anterior indica la posición de la mediana y su valor.


pos =

Me =
Cuestión 3.9

Dado el enunciado anterior indica la posición del tercer cuartil y su valor.


pos =

Q3 =

28
Estadı́stica

Traza el diagrama de cajas del enunciado anterior.


Cuestión 3.10

Soluciones Cuestionario 18 de febrero 2019. Modelo B.

Número cuestión Respuesta correcta


1 a
2 b
3 c
4 a
5 c
6 a
7 pos=5.75 y Q1 = 0,42
8 pos=10.5 y Q2 = 0,535
9 pos=15.25 y Q3 = 0,6425
10

1.11.4. Cuestionario Tema1: 21 de Febrero 2019. Modelo C.

29
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

Una entidad financiera está haciendo un estudio sobre la inversión, en miles de euros, que realizan las familias
para comprar su primera vivienda. Para ello, ha seleccionado de forma aleatoria una muestra de 200 familias.
Inversión montearia fi
[0, 50[ 10
[50, 100[ 20
Los datos obtenidos se muestran en la siguiente tabla: [100, 150[ 70 ¿Cuál es la variable
[150, 200[ 50
[200, 250[ 30
Cuestión 4.1

[250, 300[ 20
estudiada?
a) tipos de familia que invierten en una primera vivienda.
b) cantidad de dinero que invierten las familias en una primera vivienda
c) cantidad de dinero que las familias estarı́an dispuestas a invertir
d) Ninguna de las anteriores.
Cuestión 4.2

¿De qué tipo de variable es el objeto de estudio?.


a) Cualitativa nominal.
b) Cualitativa ordinal.
c) Cuantitativa discreta.
d) Cuantitativa continua.
Cuestión 4.3

¿Qué porcentaje de familias se gastan más de 150000 euros?


a) 25 %
b) 50 %
c) 75 %
d) Ninguna de las anteriores es correcta.

Se han tomado muestras a 20 viviendas del nivel de cobre en el agua corriente, obteniendo los siguientes
resultados en mg/l:
0.72 0.73 0.74 0.74 0.75 0.76 0.77 0.78
0.81 0.83 0.85 0.86 0.88 0.9 0.94 0.98
1.04 1.12 1.16 1.24
Cuestión 4.4

¿Cuál es el valor del media muestral de los datos anteriores?.


a) 0,84
b) 0.74
c) 0.88
d) Ninguna de las anteriores es correcta.

30
Estadı́stica
Cuestión 4.5

A partir de los datos anteriores. ¿Cuál es el valor de la varianza muestral?


a) 0.15 mg/l
b) 0.02 (mg/l)2
c) 0.15 (mg/l)2
d) Ninguna de las anteriores.
Cuestión 4.6

A partir de los datos de la cuestión 5. Calcula el valor de la desviación muestral:

————————————
Cuestión 4.7

Dado el enunciado anterior indica la posición del primer cuartil y su valor.


pos =

Q1 =
Cuestión 4.8

Dado el enunciado anterior indica la posición de la mediana y su valor.


pos =

Me =
Cuestión 4.9

Dado el enunciado anterior indica la posición del tercer cuartil y su valor.


pos =

Q3 =

31
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

Traza el diagrama de cajas del enunciado anterior.


Cuestión 4.10

Soluciones Cuestionario 21 de febrero 2019. Modelo C.

Número cuestión Respuesta correcta


1
2
3
4
5
6
7 pos= y Q1 =
8 pos= y Q2 =
9 pos= y Q3 =
10

1.11.5. Cuestionario Tema1: 21 de Febrero 2019. Modelo D.

32
Estadı́stica
Cuestión 5.1

Clasifica los siguientes caracteres estadı́sticos según sean cualitativos, variables discretas o variables continuas:
(Marca de los coches, peso de los coches, número de coches vendidos de las diferentes marcas) respectivamente:
a) Discreta, Continua, cualitativo.
b) Cualitativo, continua, discreta.
c) Continua, Discreta, cualitativo.
d) Ninguna de las anteriores es correcta.

El número de veces que han ido al cine en el último mes los alumnos de una clase es:
Cuestión 5.2

2, 3, 0, 1, 5, 3, 2, 1, 0, 0, 2, 1, 2, 3, 5, 0, 5, 4, 1, 1, 1, 2, 0, 1, 2
¿Qué porcentaje de alumnos de dicha clase fueron como mucho tres veces al cine?’
a) 21 %
b) 12 %
c) 84 %
d) Ninguna de las respuestas anteriores es correcta.
Cuestión 5.3

Si la variable es cualitativa, ¿cómo la representarı́as?


a) Histograma o diagrama de sectores.
b) Diagrama de barras o diagrama de sectores.
c) Diagrama de caja.
d) Ninguna de las anteriores.

Los siguientes datos corresponden al número de llamadas de teléfono registradas en una empresa durante los
20 dı́as de preparación de material para una feria de muestras:
Cuestión 5.4

15 15 15 15 15 16 16 16 17 20
¿Cuál es el valor de la moda?
20 20 21 21 22 22 22 25 25 25
a) 15
b) 20
c) 19,5
d) Ninguna de las anteriores.
Cuestión 5.5

¿A partir de los datos anteriores, ¿cuál es el valor de la media muestral?


a) 20,00
b) 19,15
c) 20,25
d) Ninguna de las anteriores es correcta.

33
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS
Cuestión 5.6

¿A partir de los datos anteriores, ¿cuál es el valor de la varianza muestral?


a) 13,50
b) 12,83
c) 3,67
d) Ninguna de las anteriores es correcta.
Cuestión 5.7

Dado el enunciado anterior indica la posición del primer cuartil y su valor.


pos =

Q1 =
Cuestión 5.8

Dado el enunciado anterior indica la posición de la mediana y su valor.


pos =

Me =
Cuestión 5.9

Dado el enunciado anterior indica la posición del tercer cuartil y su valor.


pos =

Q3 =

34
Estadı́stica

Traza el diagrama de cajas del enunciado anterior.


Cuestión 5.10

Soluciones Cuestionario 21 de febrero 2019. Modelo D.


Número cuestión Respuesta correcta
1
2
3
4
5
6
7 pos= y Q1 =
8 pos= y Q2 =
9 pos= y Q3 =
10

35
CAPÍTULO 1. ANÁLISIS DESCRIPTIVO DE DATOS

36
Capı́tulo 2

Análisis bivariante de datos

En el capı́tulo anterior se han estudiado medidas y gráficos para describir una única variable. Sin
embargo, cuando se llevan a cabo estudios empresariales y económicos, se dispone de información relativa
a distintas variables. En este caso no sólo es necesario describir cada una de las variables por separado
sino detectar posibles relaciones entre las variables aprovechando la información conjunta disponible. Este
capı́tulo se centra en la descripción de las relaciones entre dos variables. Ejemplos de relaciones entre dos
variables serán: ¿cómo varı́a la mortalidad infantil en los paı́ses en vı́as de desarrollo cuando aumenta la
renta per cápita?, ¿cómo aumenta la publicidad las ventas?, ¿cuánto varı́a la cantidad vendida cuando
varı́a el precio?, etc...

2.1. Distribución conjunta de frecuencias


En muchas ocasiones para describir un fenómeno necesitamos definir más de una variable para poste-
riormente estudiar la dependencia o relación entre ambas. Para describir la información de dos variables
que explican un mismo problema necesitamos, emplear las tablas de contingencia o bien la distribución
conjunta de frecuencias.
Las tablas de doble entrada o tablas de contingencia, son útiles para resumir la información de dos
variables X e Y . La tabla tendrá tantas filas (r) como respuestas posibles tenga X y tantas columnas
(c) como respuestas posibles tenga Y. En el caso que alguna de las variables sea continua, los datos
se agruparán en intervalos según se vio en el captulo anterior. La combinación de respuestas posibles
de las dos variables determina las celdas de la tabla y en ellas se enumera el número de observaciones
correspondientes a las dos variables conjuntamente, es decir fi,j que representará la frecuencia absoluta
de las respuestas xi e yj de las variables X e Y, respectivamente.

X\Y y1 y2 .... yc
x1 f1,1 f1,2 f1,c
x2 f2,1 f2,2 f2,c

xr fr,1 fr,2 fr,c

Ejemplo 2.1 (X e Y variables cualitativas). El medallero de los Juegos Olı́mpicos de Pekı́n 2008 de
los cinco pases que obtuvieron más medallas de oro fueron:

37
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

Pases \ Medalla Oro Plata Bronce


China 51 21 28
Estados Unidos 36 38 36
Rusia 23 21 28
Reino Unido 19 13 15
Alemania 16 10 15

Ejemplo 2.2 (X variable cuantitativa e Y variable cualitativa). En la siguiente tabla se indica la


edad (en años) de 20 niños junto con su conducta agresiva (evaluada en una escala de 0 a 5).
Edad 6 6,4 5 4,3 6,5 7 3 7 7,4 7,8 10 8,2 8,5 9,1 8,9 5,3 4 6 7,2 9,3
C. A. 1 0 3 4 2 3 5 0 0 3 2 1 3 2 2 4 3 1 1 1

La tabla de doble entrada que resume estos datos es:

Edad \ C. Agresiva 0 1 2 3 4 5
[2,4[ 1
[4,6[ 2 2
[6,8[ 3 3 1 2
[8,10] 2 3 1

Ejemplo 2.3 (X e Y variables cuantitativas). Un estudio nutricional sobre una muestra de 20 jóvenes
revela los siguientes datos sobre su estatura y su peso.

Estatura 164 175 165 170 178 157 167 172 177 160
Peso 53 62 48 60 52 63 54 60 55 70

Estatura 168 160 164 174 170 182 161 171 173 193
Peso 63 51 50 80 65 63 60 62 63 86

La tabla de doble entrada que resume estos datos es:

Estatura \ Peso [45,55[ [55,65[ [65,75[ [75,85[ [85,95[


[150,160[ 1
[160,170[ 5 4 1 1
[170,180[ 1 4 1
[180,190[ 1
[190,200[ 1

2.2. Distribuciones marginales.


De estas tablas de doble entrada (contingencia), es posible extraer la información correspondiente a
cada una de las variables (independientemente de la otra), que le llamaremos distribuciones marginales.
Este nombre deriva del hecho de que las frecuencias de la distribución marginal se obtienen sumando en el
margen de la derecha o inferior de la tabla de contingencia de las correspondientes frecuencias conjuntas.
Estas dos distribuciones pueden calcularse a partir de la distribución conjunta sumando por filas y
por columnas dando lugar a las distribuciones marginales, es decir
c
X
fi,. = fi,j
j=1

38
Estadı́stica

representa la distribución marginal de la variable X y


r
X
f.,j = fi,j
i=1

representa la distribución marginal de la variable Y.


X\Y y1 y2 .... yc fi.
x1 f1,1 f1,2 f1,c f1,.
x2 f2,1 f2,2 f2,c f2,.

xr fr,1 fr,2 fr,c fr,.


f.j f.,1 f.,2 f.,c n

Ejemplo 2.4. Cálculo de las distribuciones marginales de las variables del ejemplo 2.3:

Estatura \ Peso [45,55[ [55,65[ [65,75[ [75,85[ [85,95[ fi.


[150,160[ 1 1
[160,170[ 5 4 1 1 11
[170,180[ 1 4 1 6
[180,190[ 1 1
[190,200[ 1 1
f.j 6 10 2 1 1 20

2.3. Distribuciones condicionadas


Las distribuciones condicionales surgen al poner una restricción o condición a una de las dos variables,
con lo cual nuestra ”mirada”se focaliza en el comportamiento de la otra variable en el subconjunto de
datos (subpoblación) que cumple esa condición.
La expresión de la frecuencia condicionada es:
fi,j
fi|j =
f·,j

Ejemplo 2.5. Consideramos la clasificación de 20 alumnos según su color de pelo y su sexo:

Sexo \ Pelo Moreno Castaño Rubio fi.


Chica 5 2 4 11
Chico 4 5 9
f.j 9 7 4 20

¿Qué tanto por ciento de los alumnos de pelo moreno son chicas?.

Solución: La pregunta efectuada, corresponde a una distribución condicionada. Primero calculamos las
distribiciones marginales. La condición en este caso es ser moreno, de tal forma que nos restringimos a la
primera columna de la tabla en la que participan 9 alumnos y calculamos
5
fchica|morena = = 0,56
9

39
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

es decir del total de alumnos morenos el 56 % son chicas.

2.4. Diagrama de dispersión.


La distribución conjunta de dos variables puede expresarse gráficamente mediante un diagrama de
dispersión. Este diagrama se construye representando cada elemento observado por un punto en el plano
de manera que sus coordenadas sobre los dos ejes cartesianos sean los valores que toman las dos variables
en ese elemento. Este gráfico proporciona una buena descripción de la relación entre las dos variables.
En la figura 2.1 se presentan varios ejemplos de diagramas de dispersión. En el ejemplo 1 de la figura 2.1
se aprecia que cuando aumenta el valor de la variable X, también aumenta el valor de la variable Y ,
además los puntos tienden a colocarse siguiendo un lı́nea por lo que se dice que ambas variables tienen
una relación lineal positiva. En el ejemplo 2 de la figura 2.1, los puntos también se disponen de forma
lineal pero esta vez cuando X aumenta, Y disminuye, por lo que se dice que las variables tienen una
relación lineal negativa. La nube de puntos del ejemplo 3 de la figura 2.1 no muestra ninguna tendencia
entre las dos variables. Decimos entonces que las variables son independientes y que el conocimiento de
una de ellas no proporciona información sobre el valor de la otra. Por último, en el ejemplo 4 de la
figura 2.1 se observa que las variables están relacionadas pero esta relación no es lineal.

Ejemplo 1 Ejemplo 2
100 140 180 220

50
40
Y

30
20

30 40 50 60 30 40 50 60

X X

Ejemplo 3 Ejemplo 4
6000
50

4000
40
Y

Y
30

2000
20

25 30 35 40 30 40 50 60

X X

Figura 2.1: Diferentes tipos de diagramas de dispersión. Ejemplo 1: Asociación lineal positiva; Ejemplo
2: Asociación lineal negativa; Ejemplo 3: Ausencia de asociación; Ejemplo 4: Asociación no lineal.

Un diagrama de dispersión es capaz de caracterizar varios aspectos de las variables que lo componen,
como por ejemplo el rango en que varı́an cada una de las variables, la posible asociación de los datos y
una indicación de los casos atı́picos.

40
Estadı́stica

2.5. Covarianza
La covarianza es una medida de asociación lineal que indica el grado de relación que existe entre dos
variables estadı́sticas. Por tanto mide el sentido de la relación lineal. Un valor positivo de la covarianza
indica una relación lineal directa o creciente, es decir, cuando los valores de una variable crecen los
valores de la otra variable también crecen y viceversa. Un valor negativo indica una relación lineal inversa
o decreciente, es decir, si una variable crece la otra decrece y viceversa.
La covarianza muestral tiene la siguiente expresión:
n
1 X
cov(X, Y ) = sXY = (xi − x)(yi − y),
n − 1 i=1

donde xi e yi son los valores observados de las variables X e Y, x e y son las medias muestrales y n
es el tamaño de la muestra.

2.6. El coeficiente de correlación.


El coeficiente de correlación muestral nos da una medida estandarizada de la relación lineal entre dos
variables. Generalmente es una medida más útil, ya que indica tanto el sentido como el grado de relación.
La covarianza y el coeficiente de correlación correspondiente tienen el mismo signo (ambos son positivos
o ambos son negativos).
El coeficiente de correlación muestral, r, se calcula como:
sXY
r= ,
sX sY
donde sXY es la covarianza entre las dos variables y sX y sY son las desviaciones tı́picas muestrales
de X e Y , respectivamente. √
En la práctica existe una relación lineal si: |r| ≥ 2/ n

El coeficiente de correlación varı́a entre −1 y +1

Cuanto más cerca se encuentra r de +1 más cerca se encuentran los datos de alinearse sobre una
recta ascendente (que indica una relación lineal positiva).

Cuanto más cerca se encuentra r de −1 más cerca se encuentran los datos de alinearse sobre una
recta descendente (que indica una relación lineal negativa).

Cuando r = 0, no existe ninguna relación lineal entre X e Y , pero eso no quiere decir necesariamente
que no exista ningún tipo de relación entre las variables

Ejemplo 2.6. Una compañı́a de seguros considera que el número de vehı́culos (y) que circulan por una
determinada autopista a más de 120 km/h , puede ponerse en función del número de accidentes (x) que
ocurren en ella. Durante 5 dı́as obtuvo los siguientes resultados:

Accidentes 5 7 2 1 9
Vehı́culos 15 18 10 8 20

Calcula el coeficiente de correlación lineal.

Solución:
n
1 X
sXY = (xi − x)(yi − y) = 17,05
n − 1 i=1

41
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

(asociación lineal positiva)


sXY
r= = 0,995
sX sY
2
|0,995| ≥ √ ∼ = 0,89442
5
La covarianza es positiva tenemos correlación directa. Al aumentar la velocidad aumentará el número
de accidentes. Además como r está cercano a 1 podemos decir que están los datos se alinean sobre una
recta ascendente.

Ejercicio 2.1. Risin Hills Manufacturing Inc. desea estudiar la relación entre el número de trabajadores,
X, y el número de mesas producidas, Y , en su planta de Redwood Falls. La empresa ha tomado una
muestra aleatoria de 10 horas de producción. En la tabla se muestran las observaciones recogidas. Analiza
brevemente la relación entre el número de trabajadores y el número de mesas producidas por hora.

xi yi (xi − x) (xi − x)2 (yi − y) (yi − y)2 (xi − x)(yi − y)


12 20 -9.3 86.49 -21.2 449.44 197.16
30 60 8.7 75.69 18.8 353.44 163.56
15 27 -6.3 39.69 -14.2 201.64 89.46
24 50 2.7 7.29 8.8 77.44 23.76
14 21 -7.3 53.29 -20.2 408.04 147.46
18 30 -3.3 10.89 -11.2 125.44 36.96
28 61 6.7 44.89 19.8 392.04 132.66
26 54 4.7 22.09 12.8 163.84 60.16
19 32 -2.3 5.29 -9.2 84.64 21.16
27 57 5.7 32.49 15.8 249.64 90.06
213 412 378.1 2505.6 962.4

Solución:
n
1 X 962,4
sXY = (xi − x)(yi − y) = = 106,93
n − 1 i=1 9

(asociación lineal positiva)


sXY 106,93
r= =√ √ = 0,989
sX sY 42,01 278,4
2
|0,989| ≥ √ ∼ = 0,64
10
Llegamos a la conclusión de que existe una estrecha relación positiva entre el número de trabajadores
y el número de mesas producidas por hora.

2.6.1. Correlación y heterogeneidad.


Cuando se estudia la relación entre dos variables es importante asegurarse de que los elementos
estudiados son homogéneos respecto a dichas variables. Por ejemplo, la figura 2.2 presenta dos casos
frecuentes de heterogeneidad. En el ejemplo 1 hay un dato atı́pico o discordante con el resto, que modifica
el signo de la correlación. Puede comprobarse que si el punto con coordenadas (6,1), del ejemplo 1, no
existiese, el coeficiente de correlación será positivo, mientras que su presencia hace la correlación negativa.
Ante una situación de este estilo conviene asegurarse que:

42
Estadı́stica

1. No se ha cometido un error de medida o de transcripción del dato.

2. El elemento de la población al que le corresponde el dato atı́pico es homogéneo con respecto a los
demás.

Si existe un error de medida conviene eliminar el dato y si el elemento es distinto de los demás por
alguna razón objetiva conviene también suprimirlo del cálculo del coeficiente de correlación.

2.0
7

1.8
6

1.6
5
4

1.4
3

1.2
2

1.0
1

1 2 3 4 5 6 2 4 6 8 10

Ejemplo 1 Ejemplo2

Figura 2.2: Dos casos frecuentes de heterogeneidad.

En el ejemplo 2 de la Figura 2.2 se muestra otro caso de heterogeneidad. En este caso el gráfico indica
que la relación entre las variables es distinta para los elementos de las dos zonas de puntos y si calculamos
un coeficiente de correlación para todos los datos obtendremos un valor muy pequeño. Sin embargo, si
obtenemos los coeficientes para los dos grupos de puntos separadamente, encontraremos que dentro de
cada grupo hay una relación fuerte.
La conclusión fundamental de este análisis es que un coeficiente de correlación es el resumen de
la relación presente en el gráfico de dispersión. Conviene, pues, asegurarse mirando este gráfico que el
coeficiente es un buen resumen del mismo. Tratar de interpretar un coeficiente de correlación sin haber
visto previamente el gráfico de las variables puede ser peligroso.

2.6.2. Correlación y causalidad


Hemos visto que un coeficiente de correlación alto entre dos variables indica que los elementos obser-
vados toman valores relacionados entre sı́, pero no permite concluir la existencia de ninguna relación de
causalidad de una variable respecto de otra. Por ejemplo, si consideramos el número de matrimonios men-
suales en una ciudad y la temperatura media mensual registrada, el coeficiente de correlación entre ambas
variables es muy alto. Sin embargo, es obvio que no existe una relación causal entre ambas variables: ni
es probable que un aumento de los matrimonios eleve la temperatura media del mes, ni es esperable que
una ola de calor cause una avalancha de matrimonios. La razón del alto coeficiente de correlación es que
los matrimonios tienden a producirse en verano por diversos motivos.
Por otra parte, si no encontramos correlación entre dos variables tampoco podemos deducir que no
exista relación lineal entre ellas. En primer lugar, si las observaciones tienen un rango de variación pequeño
y existen otros factores que producen variabilidad es posible que no veamos causalidad aunque exista.

43
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

Por ejemplo, consideremos la relación entre el tamaño de un apartamento y su precio de alquiler en un


conjunto de pisos de una gran ciudad. Supongamos que tomamos una muestra de pisos entre 80 y 100 m2 .
Como el tamaño de estos pisos es bastante homogéneo, su precio dependerá de su localización y de otros
factores. En consecuencia, el coeficiente de correlación ente precio y tamaño ser pequeño. Sin embargo, no
podemos concluir que el tamaño del piso no influye en su precio. Si tomásemos una muestra que incluyese
pisos pequeños y grandes la relación entre estas dos variables aparecerá claramente.
Resumiendo, la dependencia que existe entre dos variables puede deducirse de un gráfico de dispersión,
que es la herramienta más completa para juzgar la relación entre ellas. Una medida resumen de este gráfico,
que es útil para medir la relación lineal entre dos variables, es la covarianza, que se expresa en unidades
que son el producto de la variables. Al convertirla en una medida adimensional de la relación lineal, que
no depende de las unidades de medida, se obtiene el coeficiente de correlación, que puede interpretarse
como la varianza entre variables estandarizadas.

Ejemplo 2.7. Un estudio muestra que hay una correlación negativa entre la ansiedad de un estudiante
antes de una prueba y la nota que obtiene el estudiante en una prueba. Pero no podemos decir que la
ansiedad causa una nota más baja en la prueba; podrı́a haber otras razones el estudiante quizá no estudió
bien, entonces aquı́ la correlación no implica causalidad.
Hay una correlación positiva entre el número de horas que que el estudiante emplea y la calificación
que obtiene. Aquı́, sı́ hay causalidad; si el estudiante pasa más tiempo estudiando, tendrá una calificación
más alta.

2.7. Recta de Regresión


(Se corresponde con la sección 17.9 del libro Haeussler (2008))

En este apartado estudiaremos otra manera de expresar la relación lineal entre dos variables continuas: la
recta de regresión. Esta recta describe la forma en la que varı́a la media de una variable en función de los valores
de la otra. Las relaciones entre variables sociales son, en general, relaciones estadı́sticas, es decir, relaciones que
determinan lo que va a ocurrir en promedio.
Este método permite describir por medio de un modelo matemático el comportamiento y la probable relación
entre dos variables,ası́ como extraer inferencias que dan lugar a que la regresión lineal sea útil para:
Explicar un fenómeno
Realizar una predicción
Controlar un proceso
Supongamos que en tenemos dos variables con las que queremos describir un fenómeno. Queremos precisar la
relación matemática que existe entre las dos variables que la forman. En concreto queremos expresar mediante
una relación cómo depende una de ellas (variable dependiente) de la otra (variable independiente). Normalmente
se elige como y la variable dependiente y como x la independiente.
En aquellos casos en que el coeficiente de correlación lineal sea “cercano” a +1 o a −1, tiene sentido considerar
la ecuación de la recta que “mejor se ajusta” a la nube de puntos (recta de mı́nimos cuadrados), puesto que el
coeficiente de correlación mide la relación lineal de ambas variables. Uno de los principales usos de dicha recta será
el de predecir o estimar los valores de Y que obtendrı́amos para distintos valores de X. Estos conceptos quedarán
representados en lo que llamamos diagrama de dispersión.
Pero, ¿cuál es la recta que mejor se ajusta sobre la nube de puntos? Evidentemente, esta pregunta no tendrı́a
respuesta si no se establece un criterio de ajuste.
El concepto de recta de regresión surge de manera natural si observamos que la existencia de una relación entre
las variables permite obtener mejores predicciones de la variable dependiente cuando conocemos el valor de la
variable independiente. Consideremos, por ejemplo, que se pretende prever la estatura de una persona seleccionada
al azar de la población española conociendo la distribución de estaturas en la población. Naturalmente se desea
que la predicción sea lo mejor posible, es decir que el error que pueda cometerse al predecir sea lo más pequeño
posible. Si definimos el error de predicción por

error de predicción = valor observado - valor previsto

44
Estadı́stica

Lo deseable es, escoger la predicción que condujese al menor error posible, esto se consigue a través del método
de mı́nimos cuadrados.

2.7.1. Cálculo de la recta de regresión.


Consideremos y a la variable dependiente y x a la variable independiente. Para calcular la recta de regresión
supongamos que los datos que observamos en el diagrama de dispersión se pueden explicar a través de una recta
de la forma:

yb = b0 + b1 x
Esta ecuación depende de dos constantes o parámetros, b0 y b1 , que deben calcularse a partir de los datos
observados. El parámetro b1 es el más importante. Se denomina pendiente de la recta y nos dice cuánto
aumenta la media de la variable dependiente cuando la independiente aumenta en una unidad.
El parámetro b0 se denomina ordenada en el origen y representa el valor de la media de la variable
dependiente cuando la independiente es cero. En muchos problemas no tiene sentido considerar un valor cero para
x: por ejemplo, es absurdo preguntarse cuál es el valor de la estatura cuando el peso es cero.
Para hallar b0 y b1 a partir de los datos se define el error de predicción o residuo de la recta, que es el error
que cometemos al predecir cada uno de los valores observados de la variable dependiente y.

residuo = error de predicción = valor observado - valor de la recta.

La recta se calcula imponiendo la condición de que el error promedio, definido como la raı́z cuadrada de la
suma de los cuadrados de los errores al calcular la distancia de cada punto con la recta, sea mı́nimo. Este criterio
se denomina mı́nimos cuadrados.
 Pn
[yi − (b1 xi + b0 )]2

mı́n i=1
n
Como resultado de aplicar este criterio se obtiene que la pendiente b1 viene dada por la ecuación

Cov(x, y)
b1 = ,
s2x
es decir, la pendiente de la recta resulta de estandarizar la covarianza de manera que tenga las unidades apropiadas
de aumento en y por unidad de aumento x. Observemos que si la covarianza es cero también lo es la pendiente
de la recta, que es la medida básica de la asociación, ya que si b1 = 0, no hay relación entre las variables. Es
importante resaltar que la pendiente está muy relacionada con el coeficiente de correlación ya que se verifica que
sy
b1 = r
sx
El segundo parámetro, b0 , ordenada en el origen de la recta, indica su posición concreta y se calcula mediante

b0 = y − b1 x
Indica que la recta debe pasar por el punto (x,y), es decir, por el centro de los datos.

Ejemplo 2.8. Calculemos la recta de regresión a partir de las estaturas de 10 padres y la de sus hijos respecti-
vamente, expresadas en metros.

Padre (X) 1.70 1.77 1.68 1.75 1.80 1.75 1.69 1.72 1.71 1.73
Hijo (Y) 1.74 1.78 1.72 1.77 1.78 1.77 1.71 1.76 1.73 1.74

Solución:

x = 1,73 m.
y = 1,75 m
Si restamos a cada variable su media, obtenemos la siguiente tabla:

45
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

(xi − x) -0.03 0.04 -0.05 0.02 0.07 0.02 -0.04 -0.01 -0.02 0.00
(yi − y) -0.01 0.03 -0.03 0.02 0.03 0.02 -0.04 -0.01 -0.02 -0.01

(−0,03)(−0,01) + ... + (0,00)(−0,01)


sxy = Cov(x, y) = =0.00078 m2
9
r
(−0,03)2 + (−0,04)2 + ... + (−0,02)2 + (0,00)2
sx = =0.0358 m
9
r
(−0,01)2 + (0,03)2 + ... + (−0,02)2 + (−0,01)2
sy = =0.0241 m
9

Cov(x, y) 0,00078
r= = = 0,9
sx · sy 0,0358 · 0,0241
Concluimos que hay una fuerte relación lineal positiva entre las variables y que por lo tanto tiene sentido construir
una recta de regresión para predecir valores de las estaturas de los hijos en función de las estaturas de los padres.

Cov(x, y) 0,00078
b1 = = = 0,609
s2x 0,03582

b0 = y − b1 x = 1,75 − 0,609 · 1,73 = 0,696


La recta de regresión es:
yb = 0,696 + 0,609x
Importante: la recta es una buena predictora únicamente en el rango de estaturas de padres
[1,68, 1,80].Fuera de este rango no se pueden obtener conclusiones.
La predicción obtenida con estos datos de la estatura de un descendiente de un hombre de 1,75 es:

yb = 0,696 + 0,609 · 1,75 = 1,76


mientras que para un padre de 1,72 metros, esta estatura es

yb = 0,696 + 0,609 · 1,72 = 1,74

46
Estadı́stica

2.8. Ejercicios propuestos


Ejercicio 2.2. Hemos seleccionado 10 alumnos, a los que hemos estudiado el número de asignaturas aprobadas
en el primer cuatrimestre (X) y el número de asignaturas aprobadas en el segundo cuatrimestre. Calcular las
distribuciones marginales.
X 3242125232
Y 2543344323
Ejercicio 2.3. Tres subcontratistas, A, B y C suministraron 58, 70 y 72 piezas, respectivamente, a una empresa.
De las piezas suministradas por el subcontratista A, sólo 4 estaban defectuosas. De las piezas suministradas por
el B, 60 estaban bien; de las piezas suministradas por el C, sólo 6 estaban defectuosas.
a. Realiza una tabla cruzada de datos (distribución conjunta).

b. Calcula las distribuciones marginales.

c. ¿Qué porcentaje de piezas defectuosas suministró el contratista A?

d. De las piezas en buen estado, ¿qué porcentaje fueron suministradas por C?

Ejercicio 2.4. Para realizar un estudio de consumo se encuesta a una muestra de 20 personas sobre el número
de tarjetas que poseen y el número de compras semanales que hacen con ellas. Los datos obtenidos son:

N de tarjetas 0 2 3 1 2 2 3 4 2 2
N de compras semanales 0 4 1 3 2 3 3 2 4 1

N de tarjetas 1 3 4 2 2 4 3 3 1 1
N de compras semanales 4 3 1 2 3 1 1 3 2 2

a. Calcula la distribución conjunta de las dos variables.


b. Halla la distribución marginal de la variable ”N de compras semanales”. ¿Cuál es el promedio y desviación
tı́pica del número de compras semanales pagadas con tarjeta?.
c. Obtén la distribución del número de tarjetas de crédito que poseen las personas de dicho estudio. ¿Cuál es
el número más frecuente de tarjetas de crédito?
d. Calcula la distribución del número de compras semanales pagadas con tarjetas de crédito que realizan las
personas que poseen tres tarjetas.

Ejercicio 2.5. Indicar cuál de las dos variables en los pares siguiente es la dependiente y si la relación es positiva
o negativa.

a. potencia de un coche y precio.

b. peso de una persona y su estatura.

c. consumo de tabaco y duración de vida.

Ejercicio 2.6. Calcular el coeficiente de correlación para los datos de la tabla.

x 2 3 4 5 6
y 3 7 8 13 14

Describir cómo cambiará este coeficiente si:

47
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

a. sumamos 3 a la variable x.

b. sumamos 3 a ambas variables.

c. multiplicamos la variable x por 2.

Ejercicio 2.7. Un estudiante que busca piso ha tomado los siguientes datos de los precios de alquiler semanal y
de la superficie de los pisos en metros cuadrados.

superficie 60 60 80 90 100 110 120


precio 70 85 80 90 85 110 115

Calcula el coeficiente de correlación entre ambas variables. ¿Podemos concluir que la relación es lineal?

Ejercicio 2.8. Una encuesta de salarios entre licenciados proporciona los siguientes datos:

Edad 28 28 32 35 38 44 49 52 58 62 66 70
Salario 2.2 2.2 3.8 4.2 4.2 5.3 7.3 6.4 6.7 5.3 6.0 5.1

Construir un diagrama de dispersión e indica si la relación parece ser lineal. Calcula el coeficiente de correlación
entre ambas variables.

Ejercicio 2.9. Una encuesta de salarios entre licenciados proporciona los datos siguiente:

Edad 28 28 32 35 38 44 49 52 58 62 66 70
Salario 2.2 2.2 3.8 4.2 4.2 5.3 7.3 6.4 6.7 5.3 6.0 5.1

Construir un diagrama de dispersión e indica si la relación parece ser lineal. Calcula el coeficiente de correlación
entre ambas variables. Ajusta una recta de regresión a la relación entre salarios y edad

Ejercicio 2.10. La tabla siguiente indica la puntuación obtenida en un test de lenguaje (x) y en otro de in-
teligencia (y) por un grupo de personas. Construir una recta de regresión para prever el resultado del test de
inteligencia conocido el resultado del test de lenguaje.

x 72 86 92 87 46 56 88 90
y 77 89 92 88 43 63 88 97

Calcula la recta de regresión e interpreta los resultados.

Ejercicio 2.11. La siguiente tabla indica la proporción de votos obtenidos por dos partidos polı́ticos en sucesivas
elecciones. Calcular la recta de regresión para prever el resultado del partido x conociendo el resultado del partido
y.

x 20 22 25 28 17 22 27
y 40 30 27 41 42 43 37

Calcula la recta de regresión e interpreta los resultados.

Ejercicio 2.12. Una juguetera ha examinado la evolución reciente de las ventas de su muñeco ”Qco”. (en millones
de euros) junto con los gastos de publicidad de ese muñeco (en millones de euros), obteniéndose los siguientes
resultados:

48
Estadı́stica

Año 2003 2004 2005 2006 2007 2008 2009


Ventas (millones de euros) 126 135 156 156 150 150 180
Gastos Publicidad (millones de euros) 20 25 30 32.5 35 32 34

a. ¿Se puede afirmar que al aumentar los gastos en publicidad se incrementaron las ventas?. Interpreta el
resultado.
b. Estudia si será adecuado un ajuste lineal para explicar las ventas en función de los gastos. Interpreta el
resultado.
c. Calcula la recta de regresión correspondiente e interpreta los coeficientes del ajuste.
d. Si para el año 2010 aumentásemos los gastos de publicidad en un 1 % respecto al año anterior, ¿en qué
porcentaje se espera que varı́en las ventas, según el modelo lineal?. Comenta el resultado.

Ejercicio 2.13. Se han observado, en varios modelos de automóviles, los datos de potencia del motor, en caballos,
y la aceleración, medida en el número de segundos necesarios para acelerar de 0 a 100 Km./h. La tabla adjunta
refleja los valores obtenidos:

Potencia (en caballos) 50 75 90 100 120 150


Aceleración (en m/s2 ) 15 12 10.5 10 9 8

a. Estudia razonadamente, según los datos anteriores, si la aceleración de un vehı́culo está relacionada lineal-
mente con su potencia.
b. Determina la recta de regresión que explique la aceleración de un vehı́culo en función de su potencia.
Interpreta los resultados.
c. Determina qué aceleración media le corresponderá a un vehı́culo con una potencia de 95 caballos. Y a uno
con una potencia de 200 caballos. Y a uno con una potencia de 90 caballos. Comenta los resultados.

49
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

2.9. Cuestionarios
2.9.1. Cuestionario Tema1 y Tema2: 12 de Marzo 2018.
Cuestión 1.1

La altura de los alumnos de Marketing del CEU es una variable:


a) Cualitativa nominal
b) Cualitativa ordinal
c) Cuantitativa discreta
d) Cuantitativa continua.

En un partido de baloncesto, se tiene la siguiente anotación en los jugadores de un equipo: 0,2,4,5,8,10,10,15,38.


Cuestión 1.2

Indica cuál es el valor de la media muestral.


a) 11,5
b) 10,22
c) 6
d) Ninguna de las anteriores.
Cuestión 1.3

Indica cuál es el valor de la varianza muestral.


a) 129,70
b) 115,28
c) 11,39
d) Ninguna de las anteriores.
Cuestión 1.4

Completa la siguiente tabla relativa a la marca que usa un grupo de alumnos del CEU de teléfono móvil.
Marca fi hi hi %
Apple 16 %
Samsung 12 0,48
LG 3
Sony 20 %
Shen Wai 0,04
Total

50
Estadı́stica
Cuestión 1.5

¿Qué medida de las siguientes NO está relacionada con una medida de tendencia central.
a) Media muestral.
b) Moda.
c) Varianza.
d) Mediana.

En una empresa de congelados, la demanda diaria, en lotes de producto, durante 30 dı́as de trabajo es:
38, 35, 76, 58, 48, 59, 67, 63, 33, 69
53, 51, 28, 25, 36, 32, 61, 57, 49, 78
48, 42, 72, 52, 47, 66, 58, 44, 44, 56
Dibuja el diagrama de cajas de esa distribución de datos:
Cuestión 1.6

51
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

En la tabla se recoge el éxito en un examen de los alumnos dependiendo del tiempo dedicado al estudio

Poco tiempo Suficiente Mucho


Aprobado 20 50 30
Suspendo 40 20 0
Cuestión 1.7

¿Cuál es la frecuencia marginal de los alumnos que suspenden el examen?

···=
Cuestión 1.8

¿Cuál es la frecuencia de aprobar el examen condicionado a que estudio poco tiempo el examen?

···=
Cuestión 1.9

¿Cuál es la frecuencia de estudiar suficiente tiempo condicionado a que suspendió el examen?

···=

Los siguientes datos se refieren a la demanda de un producto (en miles de unidades) y su precio (en centavos)
en cinco mercados diferentes:

Precio (X) Demanda (Y)


20 22
16 41
10 120
11 89
14 56

52
Estadı́stica
Cuestión 1.10

¿Cuál es el valor del coeficiente de correlación?.


a) −0, 95
b) −0, 006
c) −0, 76
d) Ninguna de las anteriores.
Cuestión 1.11

Indica la ecuación de la recta de regresión.


a) ŷ = −7, 39x + 170, 54
b) ŷ = 196, 77x − 9, 24
c) ŷ = −9,24x + 196, 77
d) Ninguna de las anteriores.
Cuestión 1.12

¿Cuál es el pronóstico para estimar la demanda cuando el precio del producto es de 12 centavos?
a) 2352
b) 85,89
c) 81,86
d) Ninguna de las anteriores.

Soluciones Cuestionario 12 de marzo 2018


Número cuestión Respuesta correcta
1 d
2 b
3 a
4 4, 0.16, 48 %, 0.12, 12 %, 5, 0.2, 1, 4 %, 25, 1, 100
5 c
6 Q1 = 42,5, Q2 = 51,5, Q3 = 60,5, LI = 15,5, LS = 87,5
7 fS,. = 60
f
8 fA|P = fA,P.,P
= 20
60
fS,SU
9 fSU |S = fS,.
= 20
60
10 a
11 c
12 b

2.9.2. Cuestionario Tema2: 11 de Marzo 2019. Modelo A.


Se desea estudiar la puntualidad de los autobuses que pasan por dos zonas distintas de la ciudad, zona A y
zona B. Por la zona A pasan a lo largo del dı́a 40 autobuses, de los cuales 15 van con retraso, mientras que por
la zona B pasan 60 autobuses de los cuales van con retraso 40.

53
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

Realiza la tabla de contigencia:


Cuestión 2.1
Cuestión 2.2

¿Qué frecuencia de autobuses son puntuales? (escribir la notación correctamente además del resultado)

¿Qué frecuencia de autobuses de la zona B van con retraso? (escribir la notación correctamente además del
Cuestión 2.3

resultado)

Indica la frecuencia de autobuses que son de la zona A y además son puntuales: (escribir la notación
Cuestión 2.4

correctamente además del resultado)

De los autobuses que pasan por la zona A, ¿qué frecuencia son puntuales? (escribir la notación correctamente
Cuestión 2.5

además del resultado)

54
Estadı́stica

Un equipo de baloncesto está probando un nuevo programa de estiramiento para reducir las lesiones durante
la liga. Los datos a continuación muestran la cantidad diaria de minutos haciendo ejercicios de estiramiento y la
Minutos 0 30 10 15 5 25 35 40
cantidad de lesiones a lo largo de la liga:
Lesiones 4 1 2 2 3 1 0 1

Calcula el valor del coeficiente de correlación


r=
Cuestión 2.6
Cuestión 2.7

¿cuál es el sentido de la relación?. Explica su interpretación.


Cuestión 2.8

Calcula la recta de regresión

ŷ =
Cuestión 2.9

Si un equipo que realizaba sesiones de estiramento de 30 minutos aumenta en 7 minutos, ¿cuál serı́a la
cantidad de lesiones que tendrá?
ŷ =

55
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
Cuestión 2.10

Una compañı́a ha realizado un estudio de sus ventas totales (en miles de euros) en las 50 provincias de
España según su renta provincial. A partir de los datos obtenidos se ha obtenido la siguiente información:
X = 250,27 SX = 42,58 Y = 435,55 SY = 22,81 SXY = 969,45
Calcula la recta de regresión ŷ =

Soluciones Cuestionario 11 de marzo 2019. Modelo A.

Número cuestión Respuesta correcta


Puntual Retraso
1 A 25 15
B 20 40
2 f·,P U N T U AL = 45
fB,RET RASO 40
3 fRET RASO|B = =
fB,· 60
4 fA,P U N T U ALES = 25
fP U N T U AL,A 25
5 fP U N T U AL|A = =
fA,· 40
6 r = −0,91
7 r es negativo y cercano a −1 por ello la relación es lineal y la recta es decreciente
8 y = −0,08x + 3,35
9 ŷ = −0,08 · 37 + 3,35 = 0,39
10 ŷ = 302,91 + 0,53x

2.9.3. Cuestionario Tema2: 11 de Marzo 2019. Modelo B.

Se desea estudiar la puntualidad de los autobuses que pasan por dos zonas distintas de la ciudad, zona A y
zona B. Por la zona A pasan a lo largo del dı́a 40 autobuses, de los cuales 25 son puntuales, mientras que por la
zona B pasan 60 autobuses de los cuales puntuales son 20.

Realiza la tabla de contigencia


Cuestión 3.1

56
Estadı́stica

¿Qué frecuencia de autobuses van con retraso? (escribir la notación correctamente además del resultado)
Cuestión 3.2

¿Qué frecuencia de autobuses de la zona B son puntuales?(escribir la notación correctamente además del
resultado)
Cuestión 3.3

Indica la frecuencia de autobuses que son de la zona B y además son puntuales: (escribir la notación
correctamente además del resultado)
Cuestión 3.4

De los autobuses que pasan por la zona A, ¿qué porcentaje van con retraso? (escribir la notación correcta-
mente además del resultado)
Cuestión 3.5

Se muestran a continuación los datos sobre el número de pasajeros que llegan a un aeropuerto por hora (X)
y el tiempo total de espera, en minutos, (Y ):

57
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

Número pasajeros Tiempo espera


105 44
511 214
401 193
622 299
330 143
211 112
332 155
332 131

Calcula el valor del coeficiente de correlación


r=
Cuestión 3.6

¿cuál es el sentido de la relación?. Explica su interpretación.


Cuestión 3.7
Cuestión 3.8

Calcula la recta de regresión

ŷ =
Cuestión 3.9

Si el número de pasajeros fuese 200, ¿cuál serı́a el tiempo de espera estimado?


ŷ =

58
Estadı́stica
Cuestión 3.10

Una compañı́a ha realizado un estudio de sus ventas totales (en miles de euros) en las 33 provincias de
España según su renta provincial. A partir de los datos obtenidos se ha obtenido la siguiente información:
X = 240,1 SX = 42,58 Y = 430 SY = 22,81 SXY = 969,45
Calcula la recta de regresión ŷ =

Soluciones Cuestionario 11 de marzo 2019. Modelo B.


Número cuestión Respuesta correcta
Puntual Retraso
1 A 25 15
B 20 40
2 f·,RET RASO = 55
fB,P U N T U AL 20
3 fP U N T U AL|B = =
fB,· 60
4 fB,P U N T U AL = 20
fRET RASO,A 15
5 %fRET RASO|A = % = · 100 = 37,5 %
fA,· 40
6 r = 0,98
7 r es positivo y cercano a 1 por ello la relación es lineal y la recta es creciente
8 y = 0,46x − 2,44
9 ŷ = 89,56
10 ŷ = 302,75 + 0,53x

2.9.4. Cuestionario Tema2: 11 de Marzo 2019. Modelo C.


Una empresa ha ofrecido a sus trabajadores 2 cursos de formación administrativa (F.A.) y 2 cursos de perfec-
cionamiento de idiomas (P.I.), en el último año, y desea estudiar el grado de implicación de sus trabajadores para
planificar los cursos del próximo año.
De los que no realizaron ningún curso de F.A., 3 tampoco hicieron ningún P.I. y 7 solo 1 P.I. De los que
realizaron solo 1 F.A., 9 no realizaron ningún PI, 11 solo 1 P.I. y los 5 restantes los 2 P.I. De los que realizaron
los 2 cursos de F.A., 14 no hicieron ningún curso de P.I., 12 realizaron 1 de P.I. y 4 hicieron los 2 de P.I.

Realiza la tabla de contigencia


Cuestión 4.1

59
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

¿Qué frecuencia de trabajadores realizó un curso de F.A.? (escribir la notación correctamente además de
Cuestión 4.2

indicar el resultado)

¿Qué porcentaje de trabajadores no realizaron ningún curso? (escribir la notación correctamente además de
Cuestión 4.3

indicar el resultado)
Cuestión 4.4

Calcula la distribución de la asistencia a los cursos de F.A..: (escribir la notación correctamente)

De los trabajadores que realizaron 2 cursos de P.I., ¿qué frecuencia realizaron 2 cursos de F.A.? (escribir la
Cuestión 4.5

notación correctamente además del resultado)

En la siguiente tabla se recoge la evolución del IPC (ı́ndice de precios al consumo) y el precio del barril de
petróleo (Brent) durante el segundo semestre del 2017.
IPC ( %) Precio del barril ($)
2.4 71.54
2.2 77.01
2.2 70.73
2.7 76.87
3.6 82.50
4.1 90.16

60
Estadı́stica

Calcula el valor del coeficiente de correlación


r=
Cuestión 4.6
Cuestión 4.7

¿cuál es el sentido de la relación?. Explica su interpretación.


Cuestión 4.8

Calcula la recta de regresión

ŷ =
Cuestión 4.9

Si el valor del IPC es del 3 %, ¿Cuál serı́a la estimación del precio del barril durante el segundo semestre del
2017?
ŷ =
Cuestión 4.10

En cierto paı́s, el tipo de interés y el ı́ndice de la Bolsa en los últimos seis meses vienen dados por los
siguientes datos:
X = 6,53, SX = 1,12
Y = 140,17, SY = 14,48
SXY = −15,01
Calcula la recta de regresión ŷ =

61
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

Soluciones Cuestionario 11 de marzo 2019. Modelo C.


Número cuestión Respuesta correcta
PI=0 PI=1 PI=2
FA=0 3 7 0
1
FA=1 9 11 5
FA=2 14 12 4
2 fF A=1,· = 25
3 4,61 %
FA fi,·
0 3=f0,·
4
1 25=f1,·
2 30=f2,·
5 fF A=2|P I=2 = 94
6 r = 0,93
7 r es positivo y cercano a 1 por ello la relación es lineal y la recta es creciente
8 y = 53,89 + 8,46x
9 ŷ = 79,27
10 ŷ = 218,33 − 11,97x

2.9.5. Cuestionario Tema2: 11 de Marzo 2019. Modelo D.


Una empresa ha ofrecido a sus trabajadores 2 cursos de formación administrativa (F.A.) y 2 cursos de perfec-
cionamiento de idiomas (P.I.), en el último año, y desea estudiar el grado de implicación de sus trabajadores para
planificar los cursos del próximo año.
De los que no realizaron ningún curso de F.A., 5 tampoco hicieron ningún P.I. y 6 solo 1 P.I. De los que
realizaron solo 1 F.A., 12 no realizaron ningún PI, 15 solo 1 P.I. y los 8 restantes los 2 P.I. De los que realizaron
los 2 cursos de F.A., 10 no hicieron ningún curso de P.I., 15 realizaron 1 de P.I. y 5 hicieron los 2 de P.I.

Realiza la tabla de contigencia


Cuestión 5.1

¿Qué porcentaje de trabajadores realizaron algún curso de F.A.? (escribir la notación correctamente además
Cuestión 5.2

de indicar el resultado)

62
Estadı́stica

¿Qué porcentaje de trabajadores no realizaron ningún curso? (escribir la notación correctamente además de
Cuestión 5.3

indicar el resultado)

Calcula la distribución de la asistencia a los cursos de P.I.: (escribir la notación correctamente además de
Cuestión 5.4

indicar el resultado)

De los trabajadores que realizaron 2 cursos de F.A., ¿qué porcentaje realizaron 2 cursos de P.I.? (escribir la
Cuestión 5.5

notación correctamente además de indicar el resultado)

Una asesorı́a laboral, con despachos en Castellón y Valencia, está estudiando si existe relación entre el número
total de expedientes de regulación de empleo realizados en estas dos ciudades. Los siguientes datos corresponden
al número de expedientes tramitados entre 2003 y 2010:
Caste. 30 40 50 60 70 100 90 80
Valen. 70 80 90 75 110 200 160 150

Calcula el valor del coeficiente de correlación


r=
Cuestión 5.6

63
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS
Cuestión 5.7

Razona si existe algún tipo de relación entre estas variables y, en caso de haberla, de qué tipo es:
Cuestión 5.8

Calcula la recta de regresión que permita predecir el número de expedientes tramitados en Valencia en
función de número de expedientes tramitados en Castellón:

ŷ =

En una muestra de 150 empresas del sector de servicios (con un mı́nimo de 10 trabajadores) se recogen datos
sobre el número de trabajadores de la empresa (X) y la facturación (Y) anual en millones de euros. Los resultados
se muestran resumidos en los siguientes estadı́sticos:
X = 16 SX = 3
Y = 114 SY = 26
SXY = 40
Cuestión 5.9

Calcula la recta de regresión que ayude a explicar la facturación en función del número de trabajadores
ŷ =
Cuestión 5.10

¿Cuál serı́a la facturación esperada de una empresa del sector de servicios que tenga 8 trabajadores?
Exprésalo en las unidades adecuadas.
ŷ =

64
Estadı́stica

Soluciones Cuestionario 11 de marzo 2019. Modelo D.


Número cuestión Respuesta correcta
PI=0 PI=1 PI=2
FA=0 5 6 0
1
FA=1 12 15 8
FA=2 10 15 5
2 85,53 %
3 4,61 %
PI fi,·
0 27=f·,0
4
1 36=f·,1
2 13=f·,2
5 fP I=2|F A=2 = 30 5

6 r = 0,9317
7 r es positivo y cercano a 1 por ello la relación es lineal y la recta es creciente
8 y = −1,13 + 1,82x
9 ŷ = 42,96 + 4,44x
10 ŷ = 78,48

65
CAPÍTULO 2. ANÁLISIS BIVARIANTE DE DATOS

66
Capı́tulo 3

Probabilidad

3.1. Técnicas de recuento


3.2. Espacios muestrales
(Se corresponde con la sección 8.3 del libro Haeussler (2008))

Los experimentos, que al repetirlos en igualdad de condiciones, producen siempre el mismo resultados son
experimentos determinı́sticos. Por ejemplo, siempre que dejamos caer un objeto, cae con una aceleración de 9.8
m/s2 .
En otros experimentos, aun manteniendo las mismas condiciones de experimentación, los resultados varı́an,
como en el caso del lanzamiento de una moneda o un dado. A estos experimentos, cuyo resultado no se puede
predecir, se les llama aleatorios.
El conjunto formado por todos los resultados posibles de un experimento se llama espacio muestral, E. Por
ejemplo, el espacio muestral del lanzamiento de una moneda es E = {cara, cruz}. El espacio muestral del lanza-
miento de un dado es E = {1, 2, 3, 4, 5, 6}.
A cada uno de los resultados posibles obtenidos al realizarse un experimento se le llama suceso elemental.
Un suceso está formado por sucesos elementales. Por ejemplo, el suceso obtener un número par en el lanza-
miento de un dado es A = {2, 4, 6}.
Hay dos sucesos especiales, que son el suceso seguro, que siempre ocurre. Por ejemplo, el suceso obtener menos
de un 7 en el lanzamiento de un dado se representa por B = {1, 2, 3, 4, 5, 6} y es seguro porque coincide con el
espacio muestral. Y el suceso imposible, que es aquel que no contiene ningún suceso elemental y que se denota
por el conjunto vacı́o ∅. Por ejemplo, obtener menos de un 1 en el lanzamiento de un dado es ∅.
El suceso contrario a uno dado A, contiene los sucesos elementales que están en el espacio muestral y que no
están en A. Se representa por A. Por ejemplo, si consideramos el suceso múltiplos de 3 en el lanzamiento de un
dado, A = {3, 6} entonces A = {1, 2, 4, 5}.
Cuando dos sucesos A y B tienen algún suceso elemental común, se llaman compatibles y significa que tienen
la posibilidad de ocurrir simultáneamente. Por el contrario, si dos sucesos A y B no tienen ningún suceso elemental
en común se dicen incompatibles. Por ejemplo, los suceso A={2,4,6} y B={3,6} son compatibles porque tienen
el suceso elemental 6 en común. Sin embargo, los sucesos A={2,4,6} y C={1,3,5} son incompatibles, ya que no
tienen ningún suceso elemental común.

Operaciones con sucesos


Unión
Dados dos sucesos A y B del espacio muestral E, se llama suceso unión, y se escribe A ∪ B, al suceso formado
por todos los sucesos elementales de A y de B, sin repetir los sucesos comunes, si es que los hay. El suceso unión
ocurre cuando sucede A o B o ambos.
Por ejemplo, si A = {1, 2, 4} y B = {4, 5} entonces A ∪ B = {1, 2, 4, 5}.

67
CAPÍTULO 3. PROBABILIDAD

Intersección
Dados dos sucesos A y B del espacio muestral E, se llama suceso intersección, y se escribe A ∩ B, al suceso
formado por todos los sucesos elementales comunes de A y B. El suceso intersección ocurre cuando sucede A y B
a la vez.
Por ejemplo, si A = {1, 2, 4} y B = {4, 5} entonces A ∩ B = {4}

Diferencia
Dados dos sucesos A y B del espacio muestral E, se llama diferencia y se escribe A − B, al suceso formado
por los sucesos elementales de A que no son de B. El suceso A − B ocurre cuando sucede A y no sucede B.
Por ejemplo, si A = {1, 2, 4} y B = {4, 5} entonces A − B = {1, 2} y B − A = {5}.

3.3. Probabilidad.
(Se corresponde con la sección 8.4 del libro Haeussler (2008))

En el lanzamiento de una moneda repetidamente, unas veces aparece cara y otras cruz. Del mismo modo, en
el lanzamiento de un dado varias veces, pueden aparecer las distintas caras {1, 2, 3, 4, 5, 6}. En ninguno de estos
experimentos se puede predecir el resultado.
Si llamamos fi al número de veces que aparece cara y n al número total de lanzamientos, el cociente fni tiende
a 21 cuando n es grande.
Si llamamos fi al número de veces que aparece una determinada cara de un dado y n al número total de
lanzamientos, el cociente fni tiende a 16 cuando n es grande.
Los fenómenos lanzamiento de un dado, lanzamiento de una moneda, la duración de las bombillas de un lote
de fabricación o el nacimiento de un bebe (niña o niño) son fenómenos aleatorios.
Los fenómenos aleatorios tienen las siguientes caracterı́sticas comunes:
Son fenómenos que, repetidos de una forma indefinida y en igualdad de condiciones, pueden presentar
resultados distintos en cada uno de ellos.
No pueden predecirse.
Repitiendo una experiencia o fenómeno aleatorio n veces y anotando el número de veces el número de veces,
fi , que aparece un resultado determinado, el cociente fni tiende a aproximarse a un valor fijo. El valor fijo
al que tiende el cociente fni se denomina probabilidad del suceso.
Cuando en un experimento aleatorio todos los sucesos elementales tienen la misma probabilidad de ocurrir,
se denomina equiprobables. Cuando esto ocurre, se puede aplicar la regla de Laplace:

N ž de casos f avorables al suceso


P robabilidad =
N ž de casos posibles
.
En general, una función de probabilidad, P, definida en un espacio muestral E satisface los siguientes principios:
1. A cada suceso, A, del espacio muestral E le corresponde un número real P (A) comprendido entre 0 y 1,

0 ≤ P (A) ≤ 1

2. La probabilidad del suceso seguro E es la unidad:

P (E) = 1

3. Si A1 , A2 , ..., An son sucesos incompatibles:

P (A1 ∪ A2 ∪ ... ∪ An ) = P (A1 ) + P (A2 ) + ... + P (An )


Como consecuencia de estos tres principios básicos se deduce que:
Si A es el suceso contrario a A, P (A) = 1 − P (A), ya que A ∪ A = E entonces
P (A ∪ A) = P (A) + P (A) = P (E) = 1.
Por ejemplo, en el lanzamiento de un dado, si A=sacar un 1 y A= no sacar 1,
P(A)=1-P(A)=1- 15 = 45

68
Estadı́stica

1. La probabilidad del suceso imposible, ∅, es cero, ya que ∅ = E.


2. Si A yB son dos sucesos cualesquiera, P (A ∪ B) = P (A) + P (B) − P (A ∩ B).
Por ejemplo, consideremos que en el lanzamiento de un dado, A= sacar número par={2,4,6} y B= sacar
múltiplo de 3= {3,6}, entonces A∪B={2,3,4,6} y A∩B={6}.
P(A∪B)=P(A)+P(B)-P(A∩B)= 36 + 26 − 61 = 46
• La suma de las probabilidades de todos los sucesos elementales de un espacio muestral E es siempre 1.
Por ejemplo, en el lanzamiento de un dado, E={1,2,3,4,5,6}.
P(1)+P(2)+P(3)+P(4)+P(5)+P(6)= 16 + 16 + 16 + 16 + 16 + 61 =1.

Ejercicio 3.1. ¿Qué probabilidad tiene una pareja de tener al menos dos varones en un embarazo de trillizos?

Solución: Según las configuraciones ya vistas en el ejercicio B.1 las posibles configuraciones con dos varones son:
VVV,VVH,VHV,HVV
P(al menos dos varones)=P(VVV)+P(VVH)+P(VHV)+P(HVV)= 81 + 18 + 18 + 81 = 48

3.4. Probabilidad condicionada.


(Se corresponde con la sección 8.5, 8.6 y 8.7 del libro Haeussler (2008))

La idea básica de la probabilidad condicionada es que a la hora de calcular la probabilidad de que ocurra
cualquier suceso puede influir que este dependa de que haya ocurrido antes otro suceso con el que está relacionado.
Por ejemplo, imaginemos que en un proceso en el que se analizan muestras de policarbonato plástico, se exami-
nan 49 muestras para determinar su resistencia a las rayaduras y a los golpes, obteniendo los siguientes resultados:

Resistentes a los golpes (A) No resistentes a los golpes (A)


Resistentes a las rayaduras (B) 40 4
No resistentes a las rayaduras(B) 2 3

Si nos preguntaramos por la probabilidad de que una muestra escogida al azar fuera resistente a las raya-
duras deberı́amos plantear P (B) = 44 49
, siguiendo el planteamiento de la regla de Laplace. Sin embargo, si el
interés fuera el cálculo de la probabilidad de que una muestra escogida al azar fuera resistente a las rayaduras
sabiendo que es resistente a los golpes, el planteamiento cambiarı́a para incorporar esta información, de manera
que especificarı́amos P(B|A)= 40 42
En definitiva, se define la probabilidad de un suceso B condicionada a la ocurrencia de un suceso A y se
denota por P (B|A):

P (A ∩ B)
P (B|A) =
P (A)
De este modo, podemos considerar que P (A ∩ B) = P (B|A)P (A). Si la probabilidad de que ocurra B sabiendo
que ha ocurrido A, no modifica la probabilidad de B, se tendrı́a que P (A ∩ B) = P (B)P (A). En ese caso se dice
que A y B son independientes.
Por ejemplo, en el lanzamiento de una moneda 2 veces consecutivas. El resultado del primer lanzamiento no
modifica el resultado del segundo lanzamiento, por lo que P (B|A) = P (B) y P (A ∩ B) = P (B)P (A)

Teorema de la probabilidad total


Sea B1 , B2 , ..., Bi , ..., Bn un conjunto de sucesos mutuamente excluyentes, y tales que la probabilidad de cada
uno de ellos es distinta de cero. Sea A un suceso cualquiera del que se conocen las probabilidades condicionales
P(A|Bi ). Entonces, la probabilidad P(A) viene dada por la expresión:
n
X n
X
P (A) = P (A|Bi )P (Bi ) = P (A ∩ Bi )
i=1 i=1

69
CAPÍTULO 3. PROBABILIDAD

En las situaciones en las que se cumple el teorema de la probabilidad total, podrı́amos calcular la probabilidad
condicionada incorporando el resultado del teorema:

P (A ∩ B) P (A ∩ B)
P (B|A) = = Pn
P (A) i=1
P (A|Bi )P (Bi )

Ejercicio 3.2. Se consideran dos urnas: la urna A contiene 6 bolas rojas y 4 bolas blancas; la urna B contiene 4
bolas rojas y 8 bolas blancas. Se lanza un dado y si se obtiene un número menor que 3, se extrae una bola de la
urna A; si el resultado es 3 o más, se extrae la bola de la urna B. Calcula la probabilidad de que al extraer una
bola al azar, esta provenga de la urna A sabiendo que es de color blanco.

Solución: Las distintas posibilidades se representan en el siguiente diagrama de árbol:

B A P (A ∩ Blanca)
P (A|Blanca) = =
P (Blanca)
Blanca Roja Blanca Roja P (A ∩ Blanca)
=
P (Blanca|A)P (A) + P (Blanca|B)P (B)
2 4
· 10
= 6
= 0,23
4
10
· 2
6
+ 128
· 4
6

70
Estadı́stica

3.5. Ejercicios propuestos


Ejercicio 3.3. Considerando el experimento de lanzar 2 dados, obtén el espacio muestral y escribe los siguientes
sucesos:
A = suma de puntos igual a 7.
B = diferencia de puntos igual a 1.
C = igual puntuación en cada dado.
D = suma de puntos distinta de 7.
E = diferencia de puntos igual a 3.

Determina:
a. A ∪ B, A ∩ B, A − B, B − A.
b. C ∪ F , C∩B.
c. ¿Son compatibles los sucesos C y D?.Justifica la respuesta

Ejercicio 3.4. Seleccionamos una carta de una baraja de 20 cartas que contiene 10 cartas rojas numeradas del
1 al 10 y 10 cartas azules numeradas del 1 al 10. Sean los sucesos
A= salir una carta par.
B= salir una carta azul.
C= salir una carta menor o igual a 5.
Definir:

a. E. d. A ∪ B ∪ C.
b. A ∪ B ∪ C. e. A ∩ (B ∪ C).
c. B ∩ C. f. A ∪ B ∪ C.

Ejercicio 3.5. Se inspeccionan 4 componentes y se definen los siguientes sucesos:


a. A= “Las cuatro componentes son defectuosas”.
b. B=“Exactamente dos componentes funcionan correctamente”.
c. C= “A lo sumo tres componentes son defectuosa”.
Determina:

a. B ∪ C. c. A ∪ C.
b. B ∩ C. d. A ∩ C.

Calcula las probabilidades de los sucesos anteriores

Ejercicio 3.6. Si la probabilidad de que un estudiante A suspenda un cierto examen es 0,5, la probabilidad de
que un estudiante B suspenda el mismo examen es 0,2 y la probabilidad de que ambos suspendan es 0,1.
a. ¿Cuál es la probabilidad de que al menos uno de los dos estudiantes suspenda el examen?. (Sol.: 0.6)
b. ¿Cuál es la probabilidad de que ninguno suspenda el examen?.(Sol.: 0.4)
c. ¿Cual es la probabilidad de que sólo uno suspenda el examen?. (Sol.: 0.5)

Ejercicio 3.7. Una empresa que fabrica camisetas posee tres máquinas, A, B y C, producen el 45 %, 30 % y
25 %, respectivamente, del total de las piezas producidas en la fábrica. Los porcentajes de producción defectuosa
de estas máquinas son del 3 %, 4 % y 5 % respectivamente.
a. Seleccionamos una camiseta al azar; calcular la probabilidad de que salga defectuosa. (Sol.: 0.038)
b. Tomamos, al azar, una camiseta y resulta ser defectuosa; calcula la probabilidad de haber sido producida
por la máquina B.(Sol.: 0.3158)

71
CAPÍTULO 3. PROBABILIDAD

Ejercicio 3.8. Un Doctor dispone de tres equipos electrónicos para realizar ecografı́as. El uso que le da a cada
equipo es de 25 % al primero, 35 % el segundo en y 40 % el tercero. Se sabe que los aparatos tienen probabilidades
de error de 1 %, 2 % y 3 % respectivamente. Un paciente busca el resultado de una ecografı́a y observa que tiene
un error. Determine la probabilidad de que se haya usado el primer aparato.(Sol.: 0.1163)

Ejercicio 3.9. Dos máquinas M1 y M2 han fabricado respectivamente 100 y 200 piezas. Se ha comprobado que
M1 produce un 5 % de piezas defectuosas y M2 produce un 6 %. Tomando una de las piezas fabricadas se pide
calcular:
1. Probabilidad de que sea defectuosa.(Sol.: 0.0567)
2. Sabiendo que es defectuosa, probabilidad de que proceda de M1.(Sol.: 0.2945)

Ejercicio 3.10. Una empresa produce piezas defectuosas con probabilidad 0,04. Posteriormente las somete a
un control de calidad que no es totalmente fiable, pues la probabilidad de que el mismo califique a un pieza
como buena siendo realmente defectuosa es de 0,05 y de que la califique como defectuosa siendo correcta es de
0,02. ¿Cuál es la probabilidad de que una pieza que el control la ha calificado como defectuosa, sea realmente
correcta?.(Sol.: 0.3357)

Ejercicio 3.11. Una compañı́a dedicada al transporte público explota tres lı́neas periféricas de una gran ciudad
de forma que el 50 % de los autobuses cubren el servicio de la primera lı́nea, el 30 % cubren el de la segunda y el
resto el de la tercera. Se sabe que la probabilidad de que se averı́e diariamente un autobús es de 2 % en la primera
lı́nea, 4 % en la segunda y un 1 % en la tercera. Determine:
1. Probabilidad de que un autobús sufra una averı́a un determinado dı́a. (Sol.: 0.022)
2. Sabiendo que un autobús ha sufrido una averı́a, probabilidad de que preste servicio en la primera lı́nea.(Sol.:
0.2727)

72
Estadı́stica

3.6. Cuestionarios
3.6.1. Cuestionario Tema3: 16 de Abril 2018.

En un grupo de amigos el 80 % están casados. Entre los casados, el 75 % tiene trabajo. Finalmente, un
5 % no están casados y tampoco tiene trabajo. Si uno no tiene trabajo, ¿qué probabilidad hay de que esté
casado?INDICAD CÁLCULOS.
Cuestión 1.1
Cuestión 1.2

Una lı́nea de autobuses utiliza 8 autobuses. Tenemos que averiguar cuántas formas se puede hacer una viaje
de ida y vuelta teniendo en cuenta que el autobús de ida ha de ser distinto que el de vuelta.
a) 56
b) 64
c) 28
d) Ninguna de las anteriores.
Cuestión 1.3

Una lı́nea de autobuses utiliza 8 autobuses. Tenemos que averiguar cuántas formas se puede hacer una viaje
de ida y vuelta teniendo en cuenta que es indiferente que el autobús de ida sea el mismo o distinto.
a) 64
b) 28
c) 56
d) Ninguna de las anteriores.

En el último semestre, en primer curso aprobaron matemáticas el 60 % y contabilidad el 63 %, el 38 %


Cuestión 1.4

aprobaron las dos asignaturas. Elegido un estudiante de la clase al azar, calcula la probabilidad de que haya
aprobado alguna de las dos asignaturas.
a) 0,42
b) 0,85
c) 0,38
d) Ninguna de las anteriores.

73
CAPÍTULO 3. PROBABILIDAD

Una empresa de confección tiene 3 proveedores de hilos. Cada uno de ellos suministra el 40 %, 30 % y 30 %
respectivamente. El director de la producción de la empresa observa un porcentaje de hilos defectuosos
Cuestión 1.5

diferente según los proveedores, un 1 %, 2 % y 3 % respectivamente., ¿cuál es la probabilidad de confeccionar


sin hilo defectuoso?.
a) 0,0109
b) 0,981
c) 0,06
d) Ninguna de las anteriores.
Cuestión 1.6

Si P (A ∪ B) = 0,8, P (A) = 0,6 y P (B) = 0,4, ¿cuánto vale P (A|B)?


a) 0
b) 0,2
c) 0,5
d) Ninguna de las anteriores.
Cuestión 1.7

En una semana de Operación Triunfo, quedan 9 participantes y se desea realizar una prueba por grupos de
4. ¿Cuántos grupos distintos se podráin firmar?
a) 36
b) 6561
c) 84
d) Ninguna de las anteriores
Cuestión 1.8

Dos sucesos A y B son independientes si:


a) P (A ∩ B) = P (A)P (B)
b) P (A|B) = P (B)
c) P (A ∩ B) = 0
d) Ninguna de las anteriores.

Soluciones Cuestionario 16 de abril 2018


Número cuestión Respuesta correcta
1 P (C|T ) = 0,8
2 a
3 a
4 b
5 b
6 c
7 d
8 a

74
Estadı́stica

3.6.2. Cuestionario Tema3: 1 de Abril 2019. Modelo A.

La irregularidad del corte de productos de papel aumenta a medida que las hojas de la cuchilla se desgastan.
Sólo el 1 % de productos cortados con cuchillas nuevas tienen cortes irregulares, el 3 % de los cortados con
cuchillas de filo promedio exhiben irregularidades y el 5 % de los cortados con cuchillas desgastadas presentan
irregularidades. Si el 25 % de las cuchillas utilizadas en el proceso de corte son nuevas, el 60 % tiene un filo
Cuestión 2.1

promedio y el 15 % de las cuchillas están desgastadas. ¿cuál es la probabilidad de que los productos tengan
cortes irregulares?.
a) 0,018
b) 0,09
c) 0,028
d) Ninguna de las anteriores es correcta.
Cuestión 2.2

Dadas las siguientes probabilidades: P (A) = 0,4, P (B) = 0,3 y P (A|B) = 0,1. ¿Cuánto vale la probabilidad
de P (A ∪ B)?.
a) 0.03
b) 0.67
c) 0.7
d) Ninguna de las anteriores es correcta.
Cuestión 2.3

Si A y B son dos sucesos incompatibles, entonces se cumple que:


a) P (A ∩ B) = P (A)P (B)
b) P (A ∪ B) = 0
c) P (A ∪ B) = P (A) + P (B)
d) Ninguna de las anteriores es correcta.

El software para detectar fraude en las tarjetas telefónicas utilizadas por los consumidores, registra todos
los dı́as el número de áreas metropolitanas donde se originan todas las llamadas. Se tiene que el 1 % de los
usuarios legı́timos hacen al dı́a llamadas que se originan en dos o más áreas metropolitanas. Sin embargo, el
30 % de los usuarios fraudulentos hacen al dı́a llamadas desde dos o más áreas metropolitanas. La proporción
Cuestión 2.4

de usuarios fraudulentos es 1 %. Si el mismo usuario hace en un dı́a dos o más llamadas desde dos o más
áreas metropolitanas, ¿cuál es la probabilidad de que sea un usuario fraudulento?.
a) 0,23
b) 0,003
c) 0,01
d) Ninguna de las anteriores es correcta.

75
CAPÍTULO 3. PROBABILIDAD
Cuestión 2.5

En un concurso literario se seleccionan 12 relatos cortos como finalistas, ¿cómo se podrı́an distribuir 4 premios
iguales entre los 12 participantes?.
a) 20736
b) 495
c) 11880
d) Ninguna de las anteriores.
Cuestión 2.6

Si se publicara el libro anterior con los 4 relatos con más votos recibidos por el jurado, teniendo en cuenta
que no hay ningún empate, ¿cuántas ediciones diferentes (del libro) podrı́amos tener?
a) 20736
b) 495
c) 11880
d) Ninguna de las anteriores.
Cuestión 2.7

¿Cuántas palabras (con o sin significado) de 4 letras se pueden construir con las letras de la palabra LUCAS?
a) 1024
b) 120
c) 625
d) Ninguna de las anteriores.
Cuestión 2.8

¿Cuántos números, de 6 cifras diferentes y que acaben en 5, se pueden formar con los dı́gitos 1, 2, 3, 4, 5 y 6?
a) 3125
b) 120
c) 720
d) Ninguna de las anteriores.

Soluciones Cuestionario 1 de abril 2019. Modelo A.


Número cuestión Respuesta correcta
1 c
2 b
3 c
4 a
5 b
6 c
7 c
8 b

76
Estadı́stica

3.6.3. Cuestionario Tema3: 1 de Abril 2019. Modelo B.

Las muestras de vidrio de un laboratorio se colocan en empaques pequeños y ligeros o en empaques pesados
y grandes. Suponga que el 2 % y el 1 % de las muestras enviadas en empaques pequeños y grandes, respec-
tivamente, se rompen durante el trayecto a su destino. Si el 60 % de las muestras se envı́an en empaques
Cuestión 3.1

grandes, y el 40 % en empaques pequeños, ¿cuál es la probabilidad de que las muestras de vidrio se rompan
durante el envı́o?.
a) 0,0003
b) 0,03
c) 0,014
d) Ninguna de las anteriores.
Cuestión 3.2

Dadas las siguientes probabilidades: P (A) = 0,3, P (B) = 0,6 y P (A|B) = 0,2. ¿Cuánto vale la probabilidad
de P (A ∪ B)?.
a) 0,12
b) 0,9
c) 0,78
d) Ninguna de las anteriores es correcta.
Cuestión 3.3

Si A y B son dos sucesos independientes, entonces se cumple que:


a) P (A ∩ B) = P (A)P (B)
b) P (A ∪ B) = 0
c) P (A ∪ B) = P (A) + P (B)
d) Ninguna de las anteriores es correcta.

El software para detectar fraude en las tarjetas telefónicas utilizadas por los consumidores, registra todos
los dı́as el número de áreas metropolitanas donde se originan todas las llamadas. Se tiene que el 1 % de los
usuarios legı́timos hacen al dı́a llamadas que se originan en dos o más áreas metropolitanas. Sin embargo, el
30 % de los usuarios fraudulentos hacen al dı́a llamadas desde dos o más áreas metropolitanas. La proporción
Cuestión 3.4

de usuarios fraudulentos es 1 %. Si el mismo usuario hace en un dı́a varias llamadas desde dos o más áreas
metropolitanas, ¿cuál es la probabilidad de que sea un usuario legı́timo?.
a) 0,77
b) 0,23
c) 0,0099
d) Ninguna de las anteriores es correcta.

77
CAPÍTULO 3. PROBABILIDAD
Cuestión 3.5

En un concurso para seleccionar el cártel de unas fiestas populares se han presentado 10 candidaturas, antes
de la elección final se seleccionan como finalistas 3 de ellas, ¿cuántas selecciones distintas se pueden realizar?
a) 120
b) 720
c) 1000
d) Ninguna de las anteriores.
Cuestión 3.6

Si en el caso anterior directamente se selecciona de las 10 candidaturas, ganador, finalista y premio especial,
¿cuántas selecciones distintas se pueden realizar?
a) 120
b) 720
c) 1000
d) Ninguna de las anteriores.
Cuestión 3.7

¿De cuántas formas puede contestar un alumno 10 preguntas de falso o verdadero?


a) 45
b) 90
c) 1024
d) Ninguna de las anteriores.
Cuestión 3.8

¿Cuántas palabras (con o sin significado) de 6 letras diferentes y que empiecen por A se pueden construir
con las letras de la palabra LUCANO?
a) 120
b) 720
c) 600
d) Ninguna de las anteriores.

Soluciones Cuestionario 1 de abril 2019. Modelo B.


Número cuestión Respuesta correcta
1 c
2 c
3 a
4 a
5 a
6 b
7 c
8 a

78
Estadı́stica

3.6.4. Cuestionario Tema3: 4 de Abril 2019. Modelo C.

Los clientes se encargan de evaluar los diseños preliminares de varios productos. En el pasado, el 95 % de
los productos con mayor éxito en el mercado recibieron buenas evaluaciones, el 60 % de los productos con
éxito moderado recibieron buenas evaluaciones, y el 10 % de productos de escaso éxito recibieron buenas
evaluaciones. Además, el 40 % de los productos han tenido mayor éxito, el 35 % un éxito moderado, y el 25 %
Cuestión 4.1

escaso éxito. Si un nuevo diseño obtiene una buena evaluación, ¿cuál es la probabilidad de que se convierta
en un producto de mayor éxito?.
a) 0,95
b) 0,38
c) 0,62
d) Ninguna de las anteriores es correcta.
Cuestión 4.2

Dadas las siguientes probabilidades P (A) = 0,1, P (B) = 0,2 y P (A ∪ B) = 0,03, ¿Cuál es la probabilidad de
P (A ∩ B)?.
a) 0,1
b) No se puede calcular con estos datos.
c) 0,27
d) Ninguna de las anteriores es correcta.
Cuestión 4.3

Si P (A ∩ B) = P (A) + P (B), entonces los sucesos reciben el nombre de:


a) Los sucesos A y B son independientes.
b) Los sucesos A y B son mutuamente excluyentes.
c) El suceso A condiciona al suceso B y viceversa.
d) Ninguna de las anteriores es correcta.

La probabilidad de que falle un conector eléctrico que se mantiene seco durante el perı́odo de garantı́a, es
1 %. Si el conector se humedece, la probabilidad de fallar durante el perı́odo de garantı́a es 5 %. Si el 90 % de
Cuestión 4.4

los conectores se mantienen secos, y el 10 % se humedecen, ¿qué probabilidad de conectores fallará durante
el perı́odo de garantı́a?.
a) 0,06
b) 0,014
c) 0,0005
d) Ninguna de las anteriores es correcta.

79
CAPÍTULO 3. PROBABILIDAD
Cuestión 4.5

En una clase con 25 niños, se acuerda seleccionar 3 alumnos para formar un grupo de trabajo, ¿cuántos
grupos de trabajo se pueden formar?
a) 13800
b) 2300
c) 230
d) Ninguna de las anteriores.

En una clase con 25 niños, se acuerda seleccionar 3 alumnos para formar un grupo de trabajo, un alumno
Cuestión 4.6

será el encargado de la pizarra, otro el encargado del silencio y el tercero el encargado del material, ¿cuántos
grupos de trabajo se pueden formar?
a) 13800
b) 2300
c) 230
d) Ninguna de las anteriores.
Cuestión 4.7

¿Cuántos números de 5 cifras, que empiecen por 3, se pueden formar con los números impares?
a) 256
b) 625
c) 120
d) Ninguna de las anteriores.
Cuestión 4.8

¿Cuántas palabras, de 6 letras distintas y que empiecen por V, se pueden construir con las letras de la palabra
MOTIVA?
a) 720
b) 120
c) 3125
d) Ninguna de las anteriores.

Soluciones Cuestionario 4 de abril 2019. Modelo C.


Número cuestión Respuesta correcta
1 c
2 c
3 d
4 b
5 b
6 a
7 b
8 b

80
Estadı́stica

3.6.5. Cuestionario Tema3: 4 de Abril 2019. Modelo D.

Los clientes se encargan de evaluar los diseños preliminares de varios productos. En el pasado, el 95 % de
los productos con mayor éxito en el mercado recibieron buenas evaluaciones, el 60 % de los productos con
éxito moderado recibieron buenas evaluaciones, y el 10 % de productos de escaso éxito recibieron buenas
evaluaciones. Además, el 40 % de los productos ha tenido mayor éxito, el 35 % un éxito moderado, y el 25 %
Cuestión 5.1

escaso éxito. Si un producto obtiene una buena evaluación, ¿cuál es la probabilidad de que se convierta en
un producto de éxito moderado?.
a) 0,6
b) 0,34
c) 0,62
d) Ninguna de las anteriores es correcta.
Cuestión 5.2

Dadas las siguientes probabilidades P (A) = 0,4, P (B) = 0,3 y P (A ∪ B) = 0,01, ¿Cuál es la probabilidad de
P (A ∩ B)?.
a) 0,69
b) No se puede calcular con estos datos.
c) 0,27
d) Ninguna de las anteriores es correcta.
Cuestión 5.3

Si P (A|B) = P (A) y P (B|A) = P (B), entonces los sucesos reciben el nombre de:
a) Los sucesos A y B son independientes.
b) Los sucesos A y B son mutuamente excluyentes.
c) El suceso A condiciona al suceso B y viceversa.
d) Ninguna de las anteriores es correcta.

Suponga que el 2 % de los rollos de tela de algodón son defectuosos, al igual que el 3 % de los rollos de tela
Cuestión 5.4

de nylon. De los rollos utilizados para el fabricante, 70 % son de algodón y 30 % son de nylon. ¿Cuál es la
probabilidad de que al seleccionar al azar uno de los rollos éste sea defectuoso?
a) 0,23
b) 0,05
c) 0,0006
d) Ninguna de las anteriores es correcta.

81
CAPÍTULO 3. PROBABILIDAD
Cuestión 5.5

En una liga con 12 equipos, ¿cuántos partidos habrá?


a) 66
b) 132
c) 1320
d) Ninguna de las anteriores.
Cuestión 5.6

En la misma liga se realiza un reparto en 4 grupos (en cada grupo habrá 3 equipos) para jugar una liguilla
previa¿cuántos posibles grupos habrı́an?
a) 1320
b) 495
c) 220
d) Ninguna de las anteriores.
Cuestión 5.7

¿Cuántos números de 5 cifras distintas, que empiecen por 3, se pueden formar con los números impares?
a) 256
b) 120
c) 60
d) Ninguna de las anteriores.
Cuestión 5.8

¿Cuántas palabras (con o sin significado) de 4 letras, se pueden construir con las letras de la palabra MOTIV?
a) 625
b) 120
c) 256
d) Ninguna de las anteriores.

Soluciones Cuestionario 4 de abril 2019. Modelo D.


Número cuestión Respuesta correcta
1 b
2 a
3 a
4 d
5 b
6 c
7 d
8 a

82
Capı́tulo 4

Variable aleatoria discreta

4.1. Variables aleatorias discretas. Esperanza


(Se corresponde con la sección 9.1 del libro Haeussler (2008))

Una variable aleatoria, X, es un rasgo o caracterı́stica de los elementos de una población que toma valores
numéricos, xi , determinados por el resultado de un experimento aleatorio ,es decir, no conocemos ni podemos
predecir el resultado del experimento. Se dice que la variable es discreta si no puede tomar más que una cantidad
numerable de valores.

Ejemplo 4.1. Las siguientes cantidades pueden ser consideradas variables aleatorias:
1. El número de artı́culos defectuosos de una muestra de artı́culos.
2. El número de clientes que llegan a la caja de un supermercado en una hora.
3. El número de errores detectados en las cuentas de una empresa.
4. El número de reclamaciones en una póliza de seguro médico en un año.

4.1.1. Distribuciones de probabilidad de variables aleatorias discretas.


Supongamos que X es una variable aleatoria discreta y que x es uno de sus valores posibles. La probabilidad de
que la variable X tome el valor especı́fico x se representa por P (X = x). La función de distribución de probabilidad,
P (x), de una variable aleatoria discreta, X, expresa la probabilidad de que X tome el valor x, como una función
de x. Es decir,

P (x) = P (X = x), para todos los valores de x

La función de probabilidad, P(x), de una variable aleatoria discreta debe satisfacer las dos propiedades si-
guientes:
P1 0 ≤ P (x) ≤ 1 para cualquier valor x.
P2 La probabilidades individuales suman 1, es decir,
X
P (x) = 1.
x

La función de probabilidad acumulada, F (x0 ), de una variable aleatoria, X, expresa la probabilidad de que X
no tenga un valor superior a x0 , como una función de x0 . Es decir,

F (x0 ) = P (X ≤ x0 )

83
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

Ejemplo 4.2. Serrano Motor, S.A., es un concesionario de automóviles de una pequeña ciudad. Basándose en un
análisis de su historial de ventas, sus directivos saben que en un dı́a cualquiera el número de automóviles en exis-
tencias puede oscilar entre 0 y 5. ¿Cómo puede utilizarse la función de probabilidad para planificar las existencias?

x P (x) F (x)
0 0.15 0.15
1 0.30 0.45
2 0.20 0.65
3 0.20 0.85
4 0.10 0.95
5 0.05 1.00

Por ejemplo, si sólo hay cuatro automóviles en existencias, Serrano Motor podrı́a satisfacer las necesidades
de los clientes de un automóvil el 95 % de las veces. Si sólo hay 2 automóviles en existencias podrı́a satisfacer las
necesidades de los clientes en un 65 % de las veces o lo que es lo mismo no se satisfarı́an las necesidades del 35 %
de los clientes ((1 − 0,65) × 100).

Relación entre la función de probabilidad y la función de probabilidad acumulada


Sea X una variable aleatoria que tiene la función de probabilidad P (x) y la función de probabilidad acumulada
F (x0 ). Podemos
P demostrar que
F (x0 ) = x≤x0 P (x)
donde la notación implica que el sumatorio abarca todos los valores posibles de x que son menores o iguales
que x0 .

Propiedades de las funciones de probabilidad acumulada de las variables aleatorias discretas.


Sea X una variable aleatoria discreta que tiene una función de probabilidad acumulada F (x0 ). Se puede
demostrar que:
1. 0 ≤ F (x0 ) ≤ 1 para todo número x0 .
2. Si x0 y x1 son dos números tales que x0 ≤ x1 , entonces F (x0 ) ≤ F (x1 ).

4.1.2. Valor esperado o esperanza.


Antes de introducir el concepto de valor esperado de una variable aleatoria discreta consideremos el siguiente
ejemplo:

Ejemplo 4.3. En una revisión de unos libros de texto se observó que el 81 % de las páginas no tenı́a ninguna
errata, que el 17 % contenı́a una errata y que el 2 % restante contenı́a dos erratas. Utilizamos la variable aleatoria
X para representar el número de erratas que hay en una página elegida aleatoriamente en uno de estos libros; sus
valores posibles son 0, 1 y 2 y la función de probabilidad es

P(0)=0.81, P(1)=0.17, P(2)=0.02

Si nos limitamos a calcular la media de los posibles valores de la variable, obtenemos un promedio de 1 errata,
sin embargo basta una breve reflexión para darse cuenta que la medida del punto central es absurda, ya que no
hemos prestado atención al hecho de que el 81 % de las páginas no tiene erratas, mientras que el 2 % tienen 2
erratas.

Para obtener una media sensata del punto central, ponderamos los distintos valores posibles de la variable por
las probabilidades de que ocurran.
El valor esperado, E(X), de una variable aleatoria discreta, X, se define como:
X
E(X) = µ = x P (x)
x

84
Estadı́stica

donde la notación indica que el sumatorio abarca todos los valores posibles de X. El valor esperado de una
variable aleatoria también se llama media y se representa por medio del sı́mbolo µ.

Ejemplo 4.4. Respecto al ejemplo 4.3 anterior


X
µ = E(X) = xP (x) = (0)(0,81) + (1)(0,17) + (2)(0,02) = 0,21
x

De este resultado se deduce que, si se analiza un gran número de páginas, es de esperar que haya una media
de 0.21 erratas por página.

4.1.3. Varianza
Para medir la dispersión de la distribución de probabilidad de una variable aleatoria discreta, X, se calcula el
valor medio que tomará la función (X − µ)2 en un número muy grande de pruebas repetidas. A este valor se le
llama varianza y se calcula como:
X
σ 2 = E[(X − µ)2 ] = (x − µ)2 P (x)
x
La desviación tı́pica, σ, es la raı́z cuadrada positiva de la varianza. Esta cantidad mantiene las unidades
originales de medición.
El concepto de varianza puede ser útil para comparar las dispersiones de distribuciones de probabilidad.
Consideramos, por ejemplo, que el rendimiento de una inversión en un año es una variable aleatoria. Aunque dos
inversiones tengan los mismos rendimientos esperados, son muy diferentes si las varianzas de estos rendimientos son
muy diferentes. Si la varianza es mayor, es más probable que los rendimientos sean considerablemente diferentes
de la media que si la varianza es pequeña. En este contexto, la varianza del rendimiento puede guardar relación
con el concepto de riesgo de una inversión: cuanto mayor es la varianza, mayor es el riesgo.

Media y varianza de funciones lineales de una variable aleatoria.


El concepto de esperanza no se limita a la propia variable aleatoria, X, sino que puede aplicarse a cualquier
función de la variable aleatoria, g(X). Consideramos que X es una variable aleatoria cuya función de probabilidad
es P (x) y sea g(X) una función de X. El valor esperado de la función g(X) se define como:
X
E(g(X)) = g(x)P (x)
x
De todo el conjunto de posibles funciones de la variable aleatoria X, sólo vamos a considerar el conjunto
de funciones lineales g(X) = a + b X, con a y b números fijos constantes. En este caso, a partir de la variable
aleatoria X, podemos considerar una nueva variable aleatoria Y = a + b X que para cada valor x de X, tome el
valor y = a + b x. Se cumplen las siguientes propiedades:
Sea X una variable aleatoria de media, µX y varianza σX
2
y sean a y b unos números fijos contantes cualesquiera.
Definamos la variable aleatoria Y como a + b X. Entonces, la media, la varianza y la desviación tı́pica de son:

µY = E(a + bX) = a + bE(X) = a + bµX

σY2 = V ar(a + bX) = b2 σX


2

σY = |b|σX

Ejemplo 4.5. Un contratista está interesado en saber cuál es el coste total de un proyecto para el que pretende
presentar una oferta. Estima que los materiales costarán 25000 euros y su trabajo 900 euros al dı́a. Si el proyecto
tarda en realizarse X dı́as, el coste laboral total será de 900X euros y el coste total del proyecto será C = 25.000
+ 900 X. El contratista estima unas probabilidades subjetivas de la duración probable del proyecto.

Duración X (dı́as) 10 11 12 13 14
Probabilidad 0.1 0.3 0.3 0.2 0.1

85
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

1. Calcula la media y la varianza de la duración X.


2. Calcula la media, la varianza y desviación tı́pica del coste total C.

Solución: Del primer apartado tenemos que la media es


X
µX = E(X) = xP (x) = (10)(0,1) + (11)(0,3) + (12)(0,3) + (13)(0,2) + (14)(0,1) = 11,9 dı́as
x

y la varianza
X
σx2 = E[(X − µ)2 ] = (x − µ)2 P (x) = (10 − 11,9)2 (0,1) + (11 − 11,9)2 (0,3) + ... + (14 − 11,9)2 (0,1) = 1,29 dı́as2 .
x

En el segundo apartado para el coste total, tenemos

µC = E(25,000 + 900X) = (25,000 + 900µX ) = 25,000 + (900)(11,9) = 35,710 eur.

y la varianza y desviación tı́pica:


p
2
σC = Var(25,000 + 900X) = (900)2 σX
2
= (810,000)(1,29) = 1044,9 e2 σC = 1044,9 = 1022,20

Hay tres casos especiales de la función lineal Y = a + b, X:


1. Y = a, es decir b = 0. En este caso, E(Y ) = E(a) = a y Var(Y ) = Var(a) = 0.
2. Y = b X, es decir a = 0. En este caso, E(Y ) = E(b X) = b µX y Var(Y ) = Var(b X) = b2 σX
2
.
−µX
3. Y = X−µX
σX
= σX
+ 1
σX
X. E(Y ) = E( X−µ
σX
X
)= −µ
σX
X
+ 1
σX
µX = 0. V ar(Y ) = V ar( X−µ
σX
X
)= σ12 σX
2
= 1.
X

4.2. La distribución binomial.


(Se corresponde con la sección 9.2 del libro Haeussler (2008))

Consideremos que se realizan n veces un experimento aleatorio y que cada experimento sólo tiene dos posibles
resultados (éxito o fracaso). Los experimentos o pruebas se realizan de forma independiente, con lo que el resultado
de cada prueba no influyen en el resultado de las demás. La probabilidad de obtener éxito en cada experimento
es p, con lo cual la probabilidad de fracaso es 1 − p. Si se considera X la variable que recoge el número de éxitos
en los n experimentos, sus posibles respuestas varı́an entre 0 y n. A la distribución del número de éxitos se le
llama distribución binomial, Bin(n,p), y su función de probabilidad permite calcular la probabilidad de obtener
exactamente k éxitos en n pruebas:

n  k n!
P (X = k) = p (1 − p)n−k = pk (1 − p)n−k , para k = 0, 1, 2, ..., n.
k k!(n − k)!
Se puede demostrar que si X sigue una distribución binomial (X ∼Bin(n,p)), su valor esperado y varianza
son µ = E(X) = n p y σ 2 = Var(X) = n p (1 − p), respectivamente.

Ejercicio 4.1. Un director de producción sabe que el 5 % de los componentes producidos en un determinado
proceso de producción tiene algún defecto. Se examinan seis de estos componentes, cuyas caracterı́sticas puede
suponerse que son independientes entre sı́.
1. ¿Cuál es la probabilidad de que ninguno de estos componentes tenga un defecto?.
2. ¿Cuál es la probabilidad de que uno de estos componentes tenga un defecto?
3. ¿Cuál es la probabilidad de que al menos dos de estos componentes tengan un defecto?.

Solución: Se considera que X es el número de componentes defectuosas. X ∼Bin(n=6,p=0.05).

86
Estadı́stica

6 
a) P(X=0)= 0,050 (1 − 0,05)6−0 = 6!
0,050 (1 − 0,05)6−0 = 0,7351
0 0!(6−0)!

6 
b) P(X=1)= 0,051 (1 − 0,05)6−1 = 1!(6−1)!
6!
0,051 (1 − 0,05)6−1 = 0,2321
1
c) P(X≥2)=1-P(X<2)=1-(P(X=0)+P(X=1))=1-(0.7351+0.2321)=0.0179.

La distribución hipergeométrica.

Supongamos que se elige una muestra aleatoria de n objetos de un grupo de N objetos, de los cuales E
son éxitos y por lo tanto N − E son fracasos. La distribución del número de éxitos, X, en la muestra se llama
distribución hipergeométrica, Hg(E,N ,n). Su función de probabilidad es:

E  N-E 
k n-k
P (X = k) =
N 
n
Se puede demostrar que si X sigue una distribución hipergeométrica (X ∼Hg(E,N ,n)), su media y varianza
E(N −E)
son E(X) = nEN
y Var(X) = N 2 (N −1)

Ejemplo 4.6. Una empresa recibe un envı́o de 20 artı́culos. Como es caro inspeccionarlos todos, tiene la polı́tica
de comprobar una muestra aleatoria de 6 artı́culos de ese envı́o y, si no hay más de 1 artı́culo defectuoso en la
muestra, no comprueba el resto. ¿Cuál es la probabilidad de que un envı́o de 5 artı́culos defectuosos no se someta
a una comprobación adicional?

Solución: Si se identifica “artı́culo defectuoso” con “éxito” en este ejemplo, el envı́o contiene N = 20 artı́culos, de
los cuales E = 5 son defectuosos (éxitos). La muestra seleccionada tiene n = 6 artı́culos y para que no se someta a
inspección el lote completo, como mucho debemos encontrar 1 artı́culo defectuoso en la muestra, es decir k = 0 o 1
éxitos en la muestra. Si llamamos X al número de éxitos en la muestra, X sigue una distribución hipergeométrica
(X ∼Hg(5,20,6)) y la probabilidad de interés en el problema serı́a:

E  N-E  E  N-E 
0 n-0 1 n-1
P (X ≤ 1) = P (X = 0) + P (X = 1) = + =
N  N 
n n
5  20-5  5  20-5 
0 6-0 1 6-1 1 · 5005 5 · 3003
= + = + = 0,516
20  20  38760 38760
6 6

4.3. La distribución de Poisson.


La distribución de Poisson se utiliza para hallar la probabilidad de variables aleatorias discretas que se ca-
racterizan por contar el número de ocurrencias o de éxitos de un suceso en un intervalo continuo dado como el
tiempo, la superficie o la longitud.
La distribución de Poisson se basa en ciertos supuestos:
Supongamos que un intervalo está dividido en un gran número de subintervalos de manera que la probabilidad
de que ocurra un suceso de cualquier subintervalo es muy pequeña. Los supuestos de la distribución de Poisson
son los siguientes:
1. La probabilidad de que ocurra un suceso es constante en todos los subintervalos.
2. No puede haber más de una ocurrencia en cada subintervalo.
3. Las ocurrencias son independientes; es decir, las ocurrencias en intervalos que no se solapan son indepen-
dientes entre sı́.

87
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

Se dice que X sigue una distribución de probabilidad de Poisson (X ∼Po(λ)) si tiene la función de probabilidad:

e−λ λk
P (X = k) = , k = 0, 1, 2, ...
k!
donde P (X = k) es la probabilidad de k éxitos en un tiempo o un espacio dados, dado λ, λ es el número de
éxitos esperado por unidad de tiempo o espacio; λ > 0 y e ∼ = 2,71828 es la base de los logaritmos naturales.
La media y varianza de la distribución de probabilidad de Poisson son µ = E(X) = λ y σ 2 = E[(X − µ)2 ] = λ,
respectivamente.
La suma de n variables aleatorias de Poisson con media λ también es una variable aleatoria de Poisson de
media n λ.
La distribución de Poisson es una importante distribución de probabilidad para algunas aplicaciones, como
por ejemplo:
1. El número de fallos de un gran sistema informático en un dı́a determinado.
2. El número de pedidos de sustitución de una pieza recibidos por una empresa en un mes dado.
3. El número de barcos que llegan a una terminal de carga durante un periodo de 6 horas.
4. El número de camiones de reparto que llegan a un almacén central en una hora.
5. El número de clientes que llegan a tomar un vuelo cada 15 minutos entre las 3 y las 6 de la tarde durante
los dı́as de la semana.
6. El número de clientes que llegan a una caja en el supermercado local durante un determinado intervalo de
tiempo.

Ejercicio 4.2. Andrés Gutiérrez, director de un centro informático, informa de que su sistema informático ha
experimentado tres fallos de componentes en los 100 últimos dı́as.
1. ¿Cuál es la probabilidad de que no haya ningún fallo en un dı́a dado?
2. ¿Cuál es la probabilidad de que haya uno o más fallos de componentes en un dı́a dado?
3. ¿Cuál es la probabilidad de que haya al menos dos fallos en un periodo de tres dı́as?

Solución: Un sistema informático moderno tiene un gran número de componentes, cada uno de los cuales puede
fallar y provocar ası́ un fallo del sistema informático. Para calcular la probabilidad de que haya fallos utilizando
la distribución de Poisson, supongamos que cada uno de los millones de componentes tiene la misma pequeñı́si-
ma probabilidad de fallar. Supongamos también que el primer fallo no afecta a la probabilidad de que haya un
segundo fallo (en algunos casos, estos supuestos pueden no cumplirse, en cuyo caso se utilizarı́an distribuciones
más complejas). La experiencia dice que el número esperado de fallos al dı́a es 3/100, es decir, λ = 0,03.

−0,03 0
1. P(ningún fallo en un dı́a dado)=P(X=0|λ = 0,03)= e 0!
λ
= 0,970446
2. La probabilidad de que haya al menos un fallo es el complementario de la probabilidad de que haya 0 fallos:

e−λ λk e−0,03 λ0
P (X ≥ 1) = 1 − P (X = 0) = 1 − k!
=1− 0!
= 1 − 0,970446 = 0,029554

3. EJEMPLO DE CAMBIO DE λ
P(al menos dos fallos en un periodo de 3 dı́as)=P (X ≥ 2|λ = 0,09), donde la media en un periodo de 3
dı́as es λ = 3(0,03)=0.09:

P (X ≥ 2) = 1 − P (X ≤ 1) = 1 − (P (X = 0) + P (X = 1)) = 1 − (0,913921 + 0,082254) = 0,003815

Se ha observado que la distribución de Poisson es especialmente útil en los problemas de listas de espera o
de colas. Algunos ejemplos son el número de clientes que llegan a una caja de un supermercado, el número de
camiones de reparto que llegan a un almacén central, el número de personas que se presentan a embarcar en un
vuelo, el número de estudiantes que aguardan a comprar libros de texto en la librerı́a universitaria, etc. En la
práctica, a menudo es posible representar los procesos de llegada de este tipo por medio de una distribución de
Poisson.

88
Estadı́stica

Ejercicio 4.3. Los clientes llegan a una fotocopiadora con una tasa media de dos cada 5 minutos. Supón que
estas llegadas son independientes, que la tasa de llegada es constante y que este problema sigue un modelo de
Poisson, donde X representa el número de clientes que llegan en un periodo de 5 minutos y la media λ = 2. Halla
la probabilidad de que lleguen más de dos clientes en un periodo de 5 minutos.

Solución:
e−2 20 e−2 21 e−2 22
P (X > 2) = 1 − P (X ≤ 2) = 1 − (P (X = 0) + P (X = 1) + P (X = 2)) = 1 − ( + + )=
0! 1! 2!
= 1 − (0,1353 + 0,2707 + 0,2707) = 0,32335

4.3.1. Aproximación de la distribución binomial utilizando la distribución de


Poisson.
Consideremos que X es el número de éxitos resultante de n pruebas independiente, cada una con una probabi-
lidad de éxito p. La distribución del número de éxitos, X, es una binomial de media n p. Si el número de pruebas,
n, es grande y n p ≤ 7, es posible utilizar como aproximación la distribución de Poisson, en la que λ = n p. La
función de probabilidad de la distribución aproximada es,

e−np · (np)k
P (X = k) = , para k = 0, 1, 2, ...
k!
Puede demostrarse que cuando en una distribución binomial n ≥ 20 y p ≤ 0,05 los valores obtenidos de las
probabilidades calculadas con un modelo binomial y con un modelo de Poisson son los mismos.

Ejercicio 4.4. Un analista ha predicho que el 3.5 % de todas las pequeñas empresas quebrará el próximo año.
Suponiendo que la predicción del analista es correcta, estima la probabilidad de que el próximo año quiebren al
menos 3 pequeñas empresas de una muestra aleatoria de 100 empresas.

Solución: Consideremos que X es el número de empresas que quiebran y que el concepto de “éxito”, en este
caso, significa la quiebra. La probabilidad de éxito serı́a p = 0,035. El problema se puede modelizar según una
distribución binomial X ∼Bin(n =100,p =0.035). Teniendo en cuenta que n p = 3,5 ≤ 7 y que n = 100 es grande,
podrı́amos resolver el cálculo de probabilidades aproximándolas con una distribución de Poisson con λ = n p = 3,5

P (X ≥ 3) = 1 − P (X < 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2)) =
e 3,50
−3,5
e−3,5 3,51 e−3,5 3,52
=1−( + + ) = = 1 − (0,030197 + 0,1056895 + 0,1849566) = 0,6791569
0! 1! 2!
Si la probabilidad se calcula con el modelo binomial se obtendrı́a P (X ≥ 3) = 0,684093.

89
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

4.4. Ejercicios propuestos


Ejercicio 4.5. ¿Cuál es la función de probabilidad del número de caras cuando se lanzan independientemente 2
monedas al aire? Asume que la moneda no está trucada y que cada cara tiene un 50 % de probabilidades de salir.

Ejercicio 4.6. El número de ordenadores vendidos al dı́a en una tienda viene definido por la siguiente distribución
de probabilidad:

X 0 1 2 3 4 5 6
P(x) 0.05 0.10 0.20 0.20 0.20 0.15 0.10
a. ¿P(3≤x≤6)? c. ¿P(x≤4)?
b. ¿P(x>3)? d. d) ¿P(2<x≤5)?

Ejercicio 4.7. Una compañı́a aérea te ha pedido que estudies los retrasos de los vuelos que se registraron en un
aeropuerto la semana de antes de las Navidades. La variable aleatoria X es el número de vuelos retrasados por hora.

X 0 1 2 3 4 5 6 7 8 9
P(x) 0.10 0.08 0.07 0.15 0.12 0.08 0.10 0.12 0.08 0.10

a. ¿Cuál es la distribución de probabilidad acumulada?

b. ¿Cuál es la probabilidad de que haya cinco o más vuelos retrasados?

c. ¿Cuál es la probabilidad de que haya entre tres y siete (inclusive) vuelos retrasados?

Ejercicio 4.8. Un concesionario de automóviles apunta la proporción de automóviles nuevos vendidos que se han
devuelto varias veces para que se corrijan los defectos durante el periodo de garantı́a. La tabla adjunta muestra
los resultados:

Num. de devoluciones 0 1 2 3 4
Proporción 0.28 0.36 0.23 0.09 0.04

a. Calcula la función de probabilidad acumulada.

b. Halla la media del número de devoluciones de un automóvil en periodo de garantı́a.

c. Halla la varianza del número de devoluciones en periodo de garantı́a.

Ejercicio 4.9. El director de una fábrica está considerando la posibilidad de sustituir una máquina de produc-
ción. El historial de la máquina indica la siguiente distribución de probabilidad del número de averı́as registradas
en una semana.

Num. de averı́as 0 1 2 3 4
Probabilidad 0.10 0.26 0.42 0.16 0.06

a. Halla la media y la desviación tı́pica del número de averı́as semanales.

b. Se estima que cada averı́a le cuesta a la empresa 1500 euros de producción perdida. Halla la media y des-
viación tı́pica del coste semanal de averı́as de esta máquina.

90
Estadı́stica

Ejercicio 4.10. Un polı́tico cree que el 25 % de todos los macroeconomistas que ocupan altos cargos apoyarán
firmemente una propuesta que desea presentar. Supongamos que esta creencia es correcta y que se seleccionan
cinco marcroeconomistas aleatoriamente.
a. ¿Cuál es la probabilidad de que al menos uno de los cinco apoye firmemente la propuesta?.

b. ¿Cuál es la probabilidad de que la mayorı́a de los cinco apoye firmemente la propuesta?.

Ejercicio 4.11. Una empresa instala calefacciones centrales y ha observado que en el 15 % de todas las instala-
ciones es necesario volver para hacer algunas modificaciones. Supón que esta semana se han hecho 10 instalaciones
de calefacción.
a. ¿Cuál es la probabilidad de que sea necesario volver en todos estos casos?

b. ¿Cuál es la probabilidad de que no sea necesario volver en ninguno de estos casos?

c. ¿Cuál es la probabilidad de que sea necesario volver en más de uno de estos casos?

Ejercicio 4.12. Los clientes llegan a una caja registradora ocupada a una tasa media de tres por minuto. Si las
llegadas siguen una distribución de Poisson, halla la probabilidad de que en un minuto dado lleguen dos clientes
o menos.

Ejercicio 4.13. El número de accidentes que se producen en una fábrica tiene una distribución de Poisson con
una media de 2.6 al mes.
1. ¿Cuál es la probabilidad de que haya menos de dos accidentes en un mes dado?

2. ¿Cuál es la probabilidad de que haya más de tres accidentes?

Ejercicio 4.14. Hacienda ha informado de que el 5.5 % de todos los contribuyentes comete errores al rellenar los
impresos de declaración de la renta. Si se eligen aleatoriamente 100 declaraciones, ¿cuál es la probabilidad de que
menos de 3 contengan errores?

Ejercicio 4.15. Una empresa tiene 250 computadores personales. La probabilidad de que uno cualquiera de ellos
necesite una reparación en una semana dada es 0.01. Halla la probabilidad de que menos de 4 de los computadores
personales necesiten una reparación en una semana dada.

Ejercicio 4.16. Supongamos que la probabilidad de tener una unidad defectuosa en una lı́nea de ensamblaje es
de 0.05. Si el conjunto de unidades terminadas constituye un conjunto de ensayos independientes:

a. ¿Cuál es la probabilidad de que entre diez unidades dos se encuentren defectuosas?

b. ¿Y de que a lo sumo dos se encuentren defectuosas?

c. ¿Cuál es la probabilidad de que por lo menos una se encuentre defectuosa?

Ejercicio 4.17. En un estudio sobre el medio ambiente, cada muestra de aire tiene un 10 % de posibilidades de
contener una molécula rara. Supón que las muestras extraı́das son independientes con respecto a la presencia de
la molécula rara. Calcula la probabilidad de que en 18 muestras, como mucho 2 contengan la molécula rara.

Ejercicio 4.18. Un lote contiene 100 piezas de un proveedor de tuberı́a local y 200 unidades de un proveedor de
tuberı́a del estado vecino. Si se seleccionan cuatro piezas al azar y sin reemplazo,
i. ¿cuál es la probabilidad de que todas sean del proveedor local?

91
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

ii. ¿Cuál es la probabilidad de que dos o más piezas de la muestra sean del proveedor local?
iii. ¿Cuál es la probabilidad de que al menos una pieza de la muestra sea del proveedor local?

Ejercicio 4.19. Un fabricante de faros para coches informa que en un envı́o de 4000 faros a un distribuidor, 500
tenı́an un ligero defecto. Si se compran al distribuidor 20 faros elegidos al azar. ¿Cuál es la probabilidad de que
haya exactamente dos con defecto?

92
Estadı́stica

4.5. Cuestionarios

4.6. Cuestionario Tema 4: 7 de Mayo 2018.

La variable aleatoria X=número de hijos por familia de una ciudad, tiene la siguiente distribución de proba-
bilidad.
X 0 1 2 3 4 5 6
P(x) 0.47 0.3 0.1 0.06 0.04 0.02 0.01
Cuestión 0.1

¿Cuál es el valor esperado y la varianza de esta variable?


a) 1 y 2, 74 respectivamente.
b) 1/6 y 1, 74 respectivamente.
c) 1 y 1, 74 respectivamente.
d) Ninguna de las anteriores.
Cuestión 0.2

¿ Cuál es la varianza de la variable aleatoria Y = 5x + 7 si el valor esperado de X es 2 y la varianza de X es


1?.
a) 25
b) 5
c) 2
d) Ninguna de las anteriores.
Cuestión 0.3

El 8 % de los registros contables de una empresa presentan algún problema, si un auditor toma una muestra
de 70 registros, ¿cuál es la probabilidad de que existan como mucho 2 registros con problemas?.
a) 0, 02
b) 0, 08
c) 0, 92
d) Ninguna de las anteriores.
Cuestión 0.4

A un banco llegan en promedio 5 personas por minuto en un dı́a de ”quincena”. ¿Cuál es la probabilidad de
que lleguen más de 3 personas por minuto?
a) 0, 88
b) 0, 96
c) 0, 14
d) Ninguna de las anteriores.

93
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

Todos los dı́as se seleccionan de manera aleatoria 12 unidades de un proceso de manufactura, con el propósito
de verificar el porcentaje de unidades defectuosas en la producción. Con base a informaciones anteriores se
sabe que la probabilidad de tener una pieza defectuosa es 0,05. La gerencia ha decidido detener la producción
Cuestión 0.5

cada vez que una muestra de 12 unidades tenga dos o más defectuosas. ¿Cuál es la probabilidad de que en
cualquier dı́a la producción se detenga?.
a) 0, 12
b) 0, 88
c) 0, 99
d) Ninguna de las anteriores.
Cuestión 0.6

De un grupo de 10 personas se sabe que siete practican el fútbol y tres el básquetbol. Si se toma una muestra
aleatoria de tres de estas personas. Calcular la probabilidad de que exactamente dos practiquen fútbol.
a) 1, 45 · 10−3
b) 0, 47
c) 0, 53
d) Ninguna de las anteriores.

Según estudio realizado por la EMT de Valencia, el promedio de personas que llegan a la parada
Cuestión 0.7

.Albereda”para subir a la lı́nea de autobuses 94, es de 8 personas cada 10 minutos. ¿Cuál es la probabi-
lidad de que no llegue nadie a esa parada para coger el autobús 94 durante un periodo de 10 minutos?.
a) 3, 35 · 10−4
b) No se puede calcular.
c) 2, 68 · 10−3
d) Ninguna de las anteriores.
Cuestión 0.8

Un furgón contenı́a 20 computadoras electrónicas grandes, 2 de las cuales estaban defectuosas. Si se seleccio-
nan al azar tres computadoras del furgón, ¿cuál será la probabilidad de que dos de ellas tenga desperfectos?
a) 0, 05
b) 0, 27
c) 0, 02
d) Ninguna de las anteriores.

Soluciones Cuestionario 7 de mayo 2018


Número cuestión Respuesta correcta
1 c
2 a
3 b
4 d
5 a
6 c
7 a
8 c

94
Estadı́stica

4.7. Cuestionario Tema 4: 6 de Mayo 2019. Modelo A.

Una empresa produce artı́culos de cristal muy delicados. A pesar de las medidas de protección que se llevan
a cabo en el proceso de entrega, se estima que un 1 % de los artı́culos se rompen durante su transporte. Si se
Cuestión 0.1

realiza la entrega de un pedido de 20 artı́culos, ¿cuál es la probabilidad de que al menos 2 artı́culos lleguen
rotos a su lugar de destino?
a) 0.98
b) 0.82
c) 0.02
d) Ninguna de las anteriores es correcta.
Cuestión 0.2

Una compañı́a telefónica recibe llamadas a razón de 4 por minuto. Calcular la probabilidad de recibir 2
llamadas en un minuto.
a) 0.15
b) 0.09
c) 0.5
d) Ninguna de las anteriores es correcta.

Una compañı́a de seguros estima que el 40 % de los hogares contratan una póliza completa. La compañı́a
decide realizar una encuesta en una ciudad concreta, y selecciona 10 hogares al azar. Calcula el número
Cuestión 0.3

esperado de hogares con póliza completa. ¿Cuál es la probabilidad de que exactamente 5 hogares tengan
póliza completa?
a) 4 y 0.20
b) 5 y 0.40
c) 4 y 0.40
d) Ninguna de las anteriores es correcta.

Supongamos que tenemos una baraja de cartas españolas, dicha baraja consta de 40 cartas, y también sabemos
Cuestión 0.4

que hay 10 oros en la baraja. Si extraemos 8 cartas de la baraja (sin devolverlas), cuál es la probabilidad de
obtener 4 oros:
a) 0.17
b) 0.07
c) 0.03
d) Ninguna de las anteriores es correcta.

95
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

Dada la siguiente función de distribución, calcular el valor esperado y la varianza.


Cuestión 0.5

X 30 40 50 60
P(X) 0.4 0.2 0.1 0.3
a) 36 y 161 respectivamente
b) 43 y 161 respectivamente
c) 43 y 12.69 respectivamente
d) Ninguna de las anteriores es correcta.
Cuestión 0.6

En una entrevista de trabajo se presentan 16 candidatos, de los cuales 10 tienen un doble grado, si se
seleccionan 3 candidatos, cuál es la probabilidad de que exactamente uno tenga un doble grado:
a) 0.036
b) 0.27
c) 0.21
d) Ninguna de las anteriores es correcta.

Calcula la varianza de la de la variable aleatoria

Y = 2000x
Cuestión 0.7

si el valor esperado de de X es 1 y la varianza de X es 1.74:


a) 2000
b) 2368.18
c) 6960000
d) Ninguna de las anteriores es correcta.
Cuestión 0.8

En una empresa el término medio de accidentes es de 3 por mes. Calcular la probabilidad de que como mucho
ocurran 2 accidentes en un mes.
a) 0.98
b) 0.42
c) 0.2
d) Ninguna de las anteriores es correcta.

96
Estadı́stica

Soluciones Cuestionario 6 de Mayo 2019. Modelo A.

Número cuestión Respuesta correcta


1 c
2 a
3 a
4 b
5 b
6 b
7 c
8 b

4.8. Cuestionario Tema 4: 6 de Mayo 2019. Modelo B.


Cuestión 0.1

Una compañı́a telefónica recibe llamadas a razón de 3 por minuto. Calcular la probabilidad de no recibir
llamadas en un minuto.
a) 0.15
b) 0.09
c) 0.05
d) Ninguna de las anteriores es correcta.

Una empresa produce artı́culos de cristal muy delicados. A pesar de las medidas de protección que se llevan
a cabo en el proceso de entrega, se estima que un 3 % de los artı́culos se rompen durante su transporte. Si se
Cuestión 0.2

realiza la entrega de un pedido de 15 artı́culos, ¿cuál es la probabilidad de que al menos 2 artı́culos lleguen
rotos a su lugar de destino?
a) 0.92
b) 0.63
c) 0.08
d) Ninguna de las anteriores es correcta.

Entre 20 trabajadores de la construcción, se sabe que 5 no usaban calzado de seguridad, si se seleccionan 10


Cuestión 0.3

trabajadores para una inspección de seguridad indica la probabilidad de que 3 trabajadores no usen calzado
de seguridad:
a) 0.42
b) 0.03
c) 0.35
d) Ninguna de las anteriores es correcta.

97
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
Cuestión 0.4

En una urna tenemos 20 objetos, de los cuales 8 son defectuosos, si se seleccionan 6 objetos al azar, cuál es
la probabilidad de que 4 sean defectuosos:
a) 0.03
b) 0.05
c) 0.16
d) Ninguna de las anteriores es correcta.

Una compañı́a de seguros estima que el 20 % de los hogares contratan una póliza completa. La compañı́a
decide realizar una encuesta en una ciudad concreta, y selecciona 10 hogares al azar. Calcula el número
Cuestión 0.5

esperado de hogares con póliza completa. ¿Cuál es la probabilidad de que exactamente 4 hogares tengan
póliza completa?
a) 4 y 0.09
b) 2 y 0.09
c) 2 y 0.12
d) Ninguna de las anteriores es correcta.

Calcula la varianza de la de la variable aleatoria

Y = 2x + 4
Cuestión 0.6

si el valor esperado de de X es 4.8 y la varianza de X es 3.76:


a) 13.6
b) 15.04
c) 3.88
d) Ninguna de las anteriores es correcta.
Cuestión 0.7

En una empresa el término medio de accidentes es de 1 por mes. Calcular la probabilidad de que como mucho
ocurran 3 accidentes en un mes.
a) 0.98
b) 0.92
c) 0.06
d) Ninguna de las anteriores es correcta.

98
Estadı́stica

Dada la siguiente función de distribución, calcular el valor esperado y la varianza.


Cuestión 0.8

X 1 2 3 4
P(X) 0.3 0.25 0.15 0.3
a) 2 y 1.55 respectivamente
b) 2.5 y 1.25 respectivamente
c) 2.5 y 1.55 respectivamente
d) Ninguna de las anteriores es correcta.

Soluciones Cuestionario 6 de Mayo 2019. Modelo B.

Número cuestión Respuesta correcta


1 c
2 c
3 c
4 d
5 b
6 b
7 a
8 d

4.9. Cuestionario Tema 4: 10 de Mayo 2019. Modelo C.

Dada la siguiente función de distribución, calcular el valor esperado y la varianza.


Cuestión 0.1

X 10 12 14 15 17 20
P(X) 0.1 0.3 0.25 0.14 0.06 0.15
a) 17.6 y 8.83 respectivamente
b) 14.22 y 8.83 respectivamente
c) 14.22 y 2.97 respectivamente
d) Ninguna de las anteriores es correcta.
Cuestión 0.2

Si un banco recibe en promedio de 6 cheques sin fondo por dı́a, ¿cuál es la probabilidad de que reciba cuatro
cheques sin fondo en un dı́a dado?.
a) 0.1
b) 0.13
c) 0.3
d) Ninguna de las anteriores.

99
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

Una empresa dedicada a la venta de maquinaria ofrece a sus clientes dos formas de pago: ”pago al contado.o
Cuestión 0.3

”pagado aplazado”. Se sabe que el 10 % de los clientes utilizan el ”pago al contado”. Si en un mes se vendieran
6 máquinas, determinar la probabilidad de que al menos 2 fueran vendidas al contado.
a) 0.88
b) 0.35
c) 0.12
d) Ninguna de las anteriores es correcta.
Cuestión 0.4

En un taller se averı́an una media de 2 máquinas a la semana. ¿Calcular la probabilidad de que como mı́nimo
haya una averı́a en una semana?.
a) 0.86
b) 0.59
c) 0.27
d) Ninguna de las anteriores.
Cuestión 0.5

Tenemos un saco con 20 bolas, de las cuales 5 son amarillas. Si se extraen aleatoriamente y sin sustitución
10 bolas, cuál es la probabilidad de que 2 de ellas sean amarillas
a) 0.35
b) 0.07
c) 0.14
d) Ninguna de las anteriores es correcta.

Diez frigorı́ficos han sido devueltos a un distribuidor debido a la presencia de un ruido agudo cuando está en
funcionamiento. De los 10 frigorı́ficos devueltos, 4 tenı́an el compresor defectuoso y los restantes tenı́an otro
Cuestión 0.6

tipo de problema. Si se examina al azar 5 de éstos frigorı́ficos, indicar la probabilidad de que ninguno tenga
el compresor defectuoso.
a) 0.12
b) 0.24
c) 0.02
d) Ninguna de las anteriores es correcta.

El 5 % de los clientes de una entidad bancaria son morosos. Si se elige al azar una muestra de 20 clientes:
Cuestión 0.7

¿Cuál es el valor esperado de clientes morosos?, ¿Cuál es la probabilidad de encontrar al menos 1 cliente
moroso?
a) 2 y 0.64
b) 1 y 0.64
c) 1 y 0.36
d) Ninguna de las anteriores es correcta.

100
Estadı́stica

Calcula la varianza de la de la variable aleatoria

Y =x+2
Cuestión 0.8

si el valor esperado de de X es 2.5 y la varianza de X es 1.55:


a) 1.55
b) 1.25
c) 4.5
d) Ninguna de las anteriores es correcta.

Soluciones Cuestionario 10 de Mayo 2019. Modelo C.

Número cuestión Respuesta correcta


1 b
2 b
3 c
4 a
5 a
6 c
7 b
8 a

4.10. Cuestionario Tema 4: 10 de Mayo 2019. Modelo D.

Una empresa dedicada a la venta de maquinaria ofrece a sus clientes dos formas de pago: ”pago al contado.o
Cuestión 0.1

”pagado aplazado”. Se sabe que el 15 % de los clientes utilizan el ”pago al contado”. Si en un mes se vendieran
6 máquinas, determinar la probabilidad de que al menos 2 fueran vendidas al contado.
a) 0.38
b) 0.22
c) 0.78
d) Ninguna de las anteriores es correcta.
Cuestión 0.2

En un taller se averı́an una media de 5 máquinas a la semana. ¿Calcular la probabilidad de que como mı́nimo
haya una averı́a en una semana?.
a) 0.96
b) 0.99
c) 0.27
d) Ninguna de las anteriores.

101
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

El 3 % de los clientes de una entidad bancaria son morosos. Si se elige al azar una muestra de 30 clientes:
Cuestión 0.3

¿Cuál es el valor esperado de clientes morosos?, ¿Cuál es la probabilidad de encontrar al menos 1 cliente
moroso?
a) 1 y 0.40
b) 0.9 y 0.40
c) 0.9 y 0.60
d) Ninguna de las anteriores es correcta.
Cuestión 0.4

Si un banco recibe en promedio de 2 cheques sin fondo por dı́a, ¿cuál es la probabilidad de que no reciba
cheques sin fondo en un dı́a dado?.
a) 0.14
b) 0.27
c) 0.3
d) Ninguna de las anteriores.

Dada la siguiente función de distribución, calcular el valor esperado y la varianza.


Cuestión 0.5

X 0 1 2 3 4
P(X) 0.3 0.25 0.25 0.1 0.1
a) 2.5 y 1.65 respectivamente
b) 1.45 y 1.29 respectivamente
c) 1.45 y 1.65 respectivamente
d) Ninguna de las anteriores es correcta.
Cuestión 0.6

Una máquina ha fabricado 20 piezas, y sabemos que 2 de ellas son defectuosas. Se está preparando un pedido
de 15 piezas, calcula la probabilidad de que no haya ninguna defectuosa.
a) 0.53
b) 0.95
c) 0.05
d) Ninguna de las anteriores es correcta.
Cuestión 0.7

Tenemos una urna con 12 bolas, de las cuales 9 son azules, si se extraen sin reemplazo 8 bolas indicar la
probabilidad que haya 6 canicas azules.
a) 0.51
b) 0.31
c) 0.05
d) Ninguna de las anteriores es correcta.

102
Estadı́stica

Calcula la varianza de la de la variable aleatoria

Y = 3x + 2
Cuestión 0.8

si el valor esperado de de X es 1.25 y la varianza de X es 1.75:


a) 5.75
b) 3.97
c) 15.75
d) Ninguna de las anteriores es correcta.

Soluciones Cuestionario 10 de Mayo 2019. Modelo D.


Número cuestión Respuesta correcta
1 b
2 b
3 c
4 a
5 c
6 a
7 a
8 c

103
CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

104
Capı́tulo 5

Variable aleatoria continua

5.1. Variables aleatorias continuas.


(Se corresponde con la sección 16.1 del libro Haeussler (2008))

Recordemos en el tema anterior estudiamos las variables aleatorias discretas y estas solo podı́an tomar una
cantidad numerable de valores xi y cada uno de estos valores tenı́a asociada una probabilidad, es decir disponı́amos
de una función P (X), a la que llamábamos función de distribución de probabilidad, que a cada valor de la variable
aleatoria le asignaba su probabilidad.

Ejemplo 5.1. Supongamos que se ha revisado una gran colección de libros para hacer un estudio sobre la
probabilidad de encontrar erratas al consultar una página elegida al azar. Si X representa el número de erratas
en una determinada página, transcurrido el estudio se obtienen los siguientes resultados:

P(X=0)=0.5, P(X=1)=0.3, P(X=2)=0.1, P(X=3)=0.1

Nótese que en este caso P (X) es realmente una función de distribución de probabilidades porque cumple las
dos propiedades pertinentes:
1. 0 ≤ P (X = xi ) ≤ 1 para cualquier valor xi .
P4
2. Las probabilidades individuales suman 1, es decir, i=1
P (X = xi ) = 1.
0.5
0.4
Probabilidad

0.3
0.2
0.1

0 1 2 3

X = Nº de erratas en una página

Figura 5.1: Probabilidades de que haya un número determinado de erratas en una página.

Las variables aleatorias continuas no toman una cantidad numerable de valores xi , sino que toman una
infinidad de valores correspondientes a los puntos del intervalo de una recta. Algunos ejemplos de variables
aleatorias continuas son: la estatura, el peso, la temperatura o el tiempo de vida de un producto.
Hay una diferencia esencial entre variables discretas y continuas: la probabilidad de que una variable discreta
tome un valor concreto es mayor o igual a 0, pero la probabilidad de que una variable aleatoria continua tome
un valor concreto es siempre 0. Por ejemplo, la probabilidad de que salga exactamente un 1 al lanzar un dado
es 1/6=0.1667, lo mismo que que salga un 2, un 3, etc. En cambio, la probabilidad de que una persona mida

105
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

exactamente 180 cm es cero, porque podrı́amos distinguir entre infinidad de valores próximos a una estatura de 180
cm. Por ejemplo, ¿cómo podemos asegurar que alguien mide exactamente 180 y no 180.0000000000000000000001?.
Ahora bien, la probabilidad (o proporción de personas) que miden entre 150 cm y 200 cm no es cero. Por este
motivo, trabajaremos con las variables continuas de distinta forma a como lo hacı́amos con las variables discretas
(como vemos, ya no podemos dar todos los posibles valores y sus probabilidades).

5.1.1. Función de densidad de probabilidad y función de distribución acumu-


lada.
Supongamos que tenemos un conjunto de mediciones de una variable aleatoria continua y que representamos
sus frecuencias relativas mediante un histograma para describir su distribución. Cuanto mayor sea el número de
mediciones, menos irregular se verá el contorno del histograma. Cuando el número de mediciones es muy grande
y la amplitud de clases o intervalos se reduce, el histograma se parece cada vez más a una curva como la que
aparece en la última viñeta de la Figura 5.2. Esta curva describe la distribución de probabilidad de la variable
aleatoria continua y la llamaremos función de densidad de probabilidad f (x).
frecuencias relativas

frecuencias relativas
frecuencias relativas

densidad

Figura 5.2: Histogramas de frecuencias relativas para tamaños de muestra cada vez más grandes.

Las propiedades que cumple la función de densidad de una variable continua se asemejan a las propiedades
de la función de distribución de probabilidad de una variable discreta:
Z ∞
1. El área bajo la función de densidad es 1, es decir f (x) dx=1.
−∞

2. La probabilidad de que la variable continua X tome valores en un intervalo [a, b], con −∞ ≤ a ≤ b ≤ ∞, es
igual al área bajo la función de densidad entre los puntos a y b, es decir
Z b
P (a ≤ X ≤ b) = f (x) dx y 0 ≤ P (a ≤ X ≤ b) ≤ 1.
a

106
Estadı́stica

1.0
0.8
0.6
0.4
0.2
0.0

a b

Figura 5.3: P (a ≤ X ≤ b) es el área sombreada por debajo de la función de densidad f(x).

La función de distribución acumulada, F (x), de una variable aleatoria continua X expresa la probabilidad de
que X tome valores menores o iguales que x, es decir

F (x) = P (X ≤ x)
Como consecuencia de esta definición, la probabilidad de que la variable continua X tome valores entre a y b
se puede expresarla como P (a ≤ X ≤ b) = F (b) − F (a).

f(x) F(x)
1.0
1.0

0.8
0.8

0.6
0.6

0.4
0.4

0.2
0.2

0.0
0.0

x x

Figura 5.4: Función de densidad y función de distribución acumulada.

107
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

Ejercicio 5.1. Consideremos la siguiente función:

0, si x < 0
(
f (x) = 0,5x, si 0 ≤ x ≤ 2
0, si x > 2
1. Comprueba que f(x) es una función de densidad.
2. Calcula P (X ≤ 0,75).
3. Calcula P (X ≤ 1,25).
4. Calcula P (0,75 ≤ X ≤ 1,25).

Solución:
Z 0 Z ∞
R∞ R2 2 2 2
1. −∞
f (x)dx = 0 dx + 0
0,5x dx + 0 dx = [0,5 x2 ]20 = 0,5 22 − 0,5 02 = 1 Por lo tanto, f (x) es una
−∞
| {z } | 2 {z }
0 0
función de densidad.
2. Considerando la función de distribución de probabilidad acumulada:

 0, si x < 0
2
F (x) = 0,5 x2 , si 0 ≤ x ≤ 2
1, si x > 2

P (X ≤ 0,75) = F (0,75) = 0,140625


3. P (X ≤ 1,25) = F (1,25) = 0,390625
4. P (0,75 ≤ X ≤ 1,25) = F (1,25) − F (0,75) = 0,390625 − 0,140625 = 0,25
1.0

1.0

1.0
0.8

0.8

0.8
0.6

0.6

0.6
f(x)

f(x)

f(x)

P(X<1.25) P(0.75<X<1.25)
0.4

0.4

0.4

P(X<0.75)
0.2

0.2

0.2
0.0

0.0

0.0

−2 −1 0 1 2 3 −2 −1 0 1 2 3 −2 −1 0 1 2 3

x x x

Figura 5.5: Gráficas ejercicio

5.1.2. Percentiles de una variable aleatoria continua.


Consideremos la función de distribución acumulada de una variable aleatoria continua X: F (x) y sea x0 un
valor de dicha variable X. Entonces:
F (x0 ) = P (X ≤ x0 )
Recordemos que F (x0 ) es una probabilidad, es decir, un valor entre 0 y 1 que expresa la probabilidad de que X
tome valores menores o iguales que x0 .

Diremos que xp (un valor posible de la variable X ) es el percentil p.100 ó percentil p de la variable X si hay
un p1̇00 % de valores de X menores o iguales que xp .

108
Estadı́stica

Supongamos, por ejemplo, que:


F (10) = P (X ≤ 10) = 0,50
• Esto significa que hay un 50 % de valores de X menores o iguales que 10
• Podemos decir que X = 10 es el percentil 50 o percentil 0.50 de la variable X
• Notad que el percentil 50 o percentil 0.50 es conocido como mediana
• Se denota: X0,50 = 10
F (14) = P (X ≤ 14) = 0,95
• Esto significa que hay un 95 % de valores de X menores o iguales que 15
• Podemos decir que X=15 es el percentil 95 (ó 0.95) de la variable X
• Se denota: X0,95 = 15
F (5) = P (X ≤ 5) = 0,25
• El 25 % de valores de X son menores o iguales que 5
• X = 5 es el percentil 25 (ó 0.25) de la variable X
• Se denota: X0,25 = 5

5.1.3. Propiedades de las variables aleatorias continuas.


Supongamos que durante N réplicas de un experimento aleatorio se obtienen resultados que pueden represen-
tarse mediante una variable aleatoria continua X. El valor esperado, E(X), de la variable aleatoria es la media
de los valores obtenidos, cuando el número de réplicas tiende a infinito y se calcula como:
Z
µX = E(X) = x · f (x) dx,

donde f (x) es la función de densidad de X.

Asimismo, si g(X) es cualquier función de la variable aleatoria X, el valor esperado E(g(X)) de esta función
es el valor medio obtenido en “infinitas” pruebas. El cálculo serı́a similar al que planteamos para funciones de
variables aleatorias discretas:
Z
µg(X) = E(g(X)) = g(x) · f (x) dx,

donde f (x) es la función de densidad de X.


La varianza de una variable aleatoria continua X, representada por σX 2
, es la esperanza del cuadrado del la
diferencia entre la variable aleatoria y su media, (X − µX )2 , y mide la dispersión de la distribución, es decir:
2
σX = E[(X − µX )2 ] = E(X 2 ) − µ2X
Por último, la desviación tı́pica de X, σX , es la raı́z cuadrada de la varianza.

5.1.4. Media y varianza de funciones lineales de una variable aleatoria.


De todo el conjunto de posibles funciones de la variable aleatoria X, consideramos el conjunto de funciones
lineales g(X) = a + bX, con a y b números fijos constantes. En este caso, a partir de la variable aleatoria X,
podemos considerar una nueva variable aleatoria Y = a + bX que para cada valor x de X, tome el valor y = a + bx.
Se cumplen las siguientes propiedades:
Sea X una variable aleatoria de media, µX y varianza σX
2
y sean a y b unos números fijos contantes cualesquie-
ra. Definamos la variable aleatoria Y como a+b X. Entonces, la media, la varianza y la desviación tı́pica de Y son:

µY = E(a + bX) = a + bE(X) = a + bµX

σY2 = V ar(a + bX) = b2 σX


2

109
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

σY = |b|σX
En el caso especial en que a= −µ
σX
X
y b= σ1X , la nueva variable aleatoria Y es la variable aleatoria estandarizada
de X:
X − µX
Y =
σX
En este caso,

X − µX −µX 1
µY = E(Y ) = E( ) = a + bµX = + · µX = 0
σX σX σX
X − µX 1 2 2
σY2 = V ar( ) = b2 σ X
2
=( ) σX = 1
σX σX

Ejercicio 5.2. El propietario de un piso estima que dentro del rango de temperaturas probables, su factura de
calefacción de enero, Y , será Y = 290 − 5T (en euros), donde T representa la temperatura media del mes, en
grados. Si la temperatura media de enero puede representarse mediante una variable aleatoria que tiene una media
de 24 grados y una desviación tı́pica de 4 grados, halla la media y desviación tı́pica de la factura de la calefacción
de enero de este propietario.

Solución: La variable aleatoria T tiene una media µT = 24 y una desviación tı́pica σT = 4. Por lo tanto, la
factura esperada de la calefacción es
µY = E(290 − 5T ) = 290 − 5µT = 290 − 5 · 24 = 170 e.

Por último, la desviación tı́pica es


σY = | − 5|σT = 5 · 4 = 20 e.

5.2. La distribución uniforme.


Supongamos que una variable aleatoria X expresa un número elegido al azar entre los puntos a y b, entonces
se dice que X sigue una distribución uniforme entre a y b (X ∼Un(a,b)).

Como la probabilidad de que un valor de X esté en cualquier zona es la misma, la función de densidad tiene
la misma altura en todos los puntos del intervalo (a, b):

1
(
, si a ≤ x ≤ b
f (x) = b−a
0, en caso contrario.
1/(b−a)

a b

Figura 5.6: Función de densidad de una variable aleatoria X que sigue una distribución uniforme entre a y b
(X∼Un(a,b)).

110
Estadı́stica

La Función de Probabilidad Acumulada de una variable aleatoria X que sigue una distribución uniforme entre
a y b (X∼Un(a,b)) puede calcularse, directamente, utilizando:

 0,
x≤a

x−a
F (x) = , a <x<b
b−a
 1,

x≥b
El valor esperado o media, E(X), de una variable aleatoria X que sigue una distribución uniforme entre a y
b es el punto medio entre estos dos valores, es decir µ = E(X) = a+b
2
.

La desviación tı́pica viene dada por σ = b−a



12
que, como es natural, crece al aumentar la distancia entre los
puntos a y b.

Ejemplo 5.2. Un equipo de reparación es responsable de un tramo de un oleoducto de 2 kilómetros de largo. La


distancia (en kilómetros) a la que surge cualquier grieta puede representarse por medio de una variable aleatoria
distribuida uniformemente, con una función de densidad de probabilidad f (x) = 0,5.
Halla la función de distribución acumulada y la probabilidad de que surja cualquier grieta entre 0.5 kilómetros
y 1.5 en este tramo del oleoducto. Calcula el percentil 0,25.
Por último, averigua la distancia media a la que surgen grietas en el oleoducto y su desviación tı́pica.

Solución: La distancia (en kilómetros) a la que surge cualquier grieta puede representarse por medio de una
variable aleatoria distribuida uniformemente: X∼Un(0,2).

La función de distribución acumulada se calcula en base a la función de densidad:


Z x Z x
F (x) = f (y)dy = 0,5dy = [0,5y]x0 = 0,5x, para 0 ≤ x ≤ 2
0 0
También podemos utilizar la fórmula anterior:

x≤0  0,

x−0
F (x) = = 0,5x, 0 < x < 2
2−0
 1, x≥2

La probabilidad de que surja una grieta entre 0.5 kilómetros y 1.5 en el oleoducto es el área situada debajo
de la función de densidad entre x = 0,5 y x = 1,5:
f(x)

0.5

0 0.5 1 1.5 2

Kilómetros

Figura 5.7: P (0,5 ≤ X ≤ 1,5).

P (0,5 ≤ X ≤ 1,5) = F (1,5) − F (0,5) = 0,5 · 1,5 − 0,5 · 0,5 = 0,5

111
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

Cálculo del percentil 25:


El percentil 25 es el valor de la variable X que deja a su izquierda el 25 % de los valores de la variable X
x0 =? tal que P (X ≤ x0 ) = 0,2500, es decir: F (x0 ) = 0,2500
Como F (x0 ) = 0,5x0 , tenemos que 0,5x0 = 0,2500
Por lo tanto: x0 = 0,50
Ası́ pues, el percentil 25 es x0,25 = 0,50
En este caso, la distancia media a la que surgen grietas en el oleoducto y su desviación tı́pica son:

a+b 0+2
µ= = =1
2 2
√ √ √
b−a 2−0 2 12 2 12 3
σ= √ = √ = = =
12 12 12 12 3

5.3. La distribución normal


(Se corresponde con la sección 16.2 del libro Haeussler (2008))

La distribución normal es la distribución de probabilidad que más se utiliza para modelizar variables aleatorias
continuas en el ámbito de la economı́a y las aplicaciones empresariales.
Algunas de las razones por las que se utiliza frecuentemente son:
1. La distribución normal es una aproximación muy buena de la distribución de probabilidad de una amplia
variedad de variables aleatorias continuas. Por ejemplo, las dimensiones de las piezas y el peso de los
paquetes de alimentos siguen con frecuencia una distribución normal, por lo que tiene muchas aplicaciones
en el control de calidad. Las ventas o la producción a menudo siguen una distribución normal, por lo que
esta tiene una gran cantidad de aplicaciones en el marketing y en la gestión de la producción. Las pautas de
los precios de las acciones y de los bonos también se analizan utilizando la distribución normal en grandes
modelos informáticos de contratación financiera. Los modelos económicos utilizan la distribución normal
para algunas medidas económicas.
2. Las distribuciones de las medias muestrales siguen una distribución normal, si el tamaño de la muestra es
“grande”.
3. La distribución de probabilidad normal ha llevado a tomar buenas decisiones empresariales en algunas
aplicaciones.
La función de densidad de una variable aleatoria continua X que sigue una distribución normal N(µ,σ) es:

1 −
(x−µ)2
f (x) = √ ,
e 2σ 2
2πσ 2
donde µ y σ son números tales que −∞ < µ < ∞ y 0 < σ < ∞. Además e y π son las constantes e = 2,71828...
y π = 3,14159...

0.4 2
f (x) = √1 e−(1/2)x

0.3

0.2

0.1

0
-3 -2 -1 0 1 2 3

Figura 5.8: Función de densidad de una distribución normal con µ = 0 y σ = 1.

112
Estadı́stica

Si X ∼ N(µ, σ), se cumplen las siguientes propiedades:


1. E(X) = µ.
2. Var(X) = E[(X − µ)2 ] = σ 2 .
3. Desviación Tı́pica(X)=σ.
4. La forma de la función de densidad es una curva simétrica en forma de campana centrada en la media, µ,
como se ve en la Figura 5.8.
5. Dos funciones de densidad con la misma desviación tı́pica y distintas medias producen gráficas idénticas
pero desplazadas (primera gráfica de la Figura 5.9).
6. Dos funciones de densidad con la misma media y distinta desviación tı́pica producen gráficas centradas en
torno a la media común pero la que tiene mayor desviación tı́pica se corresponde con una campana más
baja y con mayor dispersión (segunda gráfica de la Figura 5.9).

0.05
0.04
0.03
0.02
0.01
0
20 40 60 80
0.1
0.08
0.06
0.04
0.02
0
20 40 60 80

Figura 5.9: Efectos de µ y σ en la función de densidad de una variable aleatoria normal.

Al igual que hemos visto en los apartados anteriores, la probabilidad de que una variable aleatoria X ∼ N(µ, σ)
tome valores en un intervalo [a, b], se corresponde con el área situada bajo la función de densidad entre a y b,
como muestra la Figura 5.10. Hasta ahora, el cálculo de esta probabilidad lo hemos resulto utilizando la función
de distribución acumulada F (x), de tal manera que:

P (a < X < b) = F (b) − F (a)


Sin embargo, en el caso de la distribución normal, no disponemos de una expresión algebraica para la función
de distribución acumulada F (x). La metodologı́a para resolver probabilidades en este caso se basa en dos pasos:
1. Convertir X ∼ N(µ, σ) en Z ∼ N(0, 1).
2. Utilizar la tabla de la función de distribución acumulada de la normal N(0, 1).

a b

Figura 5.10: Función de densidad normal. El área sombreada indica P (a < X < b).

113
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

5.3.1. La distribución normal estándar


Una variable aleatoria normal Z que tiene media 0 y varianza 1, N(0, 1), se dice que sigue una distribución
normal estándar.
Cualquier variable aleatoria normal X ∼ N(µ, σ) se puede convertir en una variable normal estándar Z
utilizando la siguiente transformación:

X −µ
Z=
σ
Este importante resultado nos permite utilizar la tabla de la función de distribución acumulada de una normal
estándar para calcular las probabilidades de cualquier variable normalmente distribuida.

Veamos como utilizar esta tabla para calcular las probabilidades de una normal estándar. La tabla propor-
ciona los valores F (z) = P (Z ≤ z) correspondientes a los valores no negativos de z. Por ejemplo, P (Z ≤ 1,25) =
F (1,25) = 0,8944.

Los valores de la función de distribución acumulada correspondiente a los valores negativos de Z pueden
deducirse utilizando la simetrı́a de la función de densidad. Por ejemplo:

P (Z ≤ −1,25) = 1 − P (Z ≤ 1,25) = 1 − F (1,25) = 1 − 0,8944 = 0,1056

.
Calculemos, por ejemplo, las siguientes probabilidades usando la tabla:
1. P (Z < 1,63) = 0,9484
2. P (Z < 0,14) = 0,5557
3. P (Z > 1,90) = 1 − P (Z < 1,90) = 1 − 0,9713 = 0,0287
4. P (Z > 2,5) = 1 − P (Z < 2,50) = 1 − 0,9938 = 0,0062
5. P (1,21 < Z < 1,94) = P (Z < 1,94) − P (Z < 1,21) = 0,9738 − 0,8869 = 0,0869
Veamos cómo podemos calcular los percentiles a partir de la tabla. Recordemos que si P (X < 1,00) = 0,8413,
entonces:X = 1 es el percentil 84,13. Ası́ pues, si queremos saber cuál es el percentil 0,8413, buscamos la proba-
bilidad 0.8413 en la zona de la tabla donde están las probabilidades y observamos el valor que le corresponde, 1.

Si queremos calcular el Percentil 90


Buscamos la probabilidad 0.9000 en la zona de la tabla donde están las probabilidades
el valor 0.9000 exacto NO aparece
consideramos los más cercanos a 0.9000: 0.8897 y 0.9015
F(1.28)=0.8897 y F(1.29)=0.9015
consideramos la media entre 1.28 y 1.29 como una aproximación al percentil 90:
percentil 90: Z0,90 = 1,285

Ejercicio 5.3. Una empresa produce bombillas cuya duración sigue una distribución normal que tiene una
media de 1200 horas y una desviación tı́pica de 250 horas. Si elegimos una bombilla aleatoriamente, ¿cuál es la
probabilidad de que dure entre 900 y 1300 horas? y ¿cuál es el percentil 0,6554?

Solución:
900 − 1200 X − 1200 1300 − 1200
P (900 < X < 1300) = P ( < < ) = P (−1,2 < Z < 0,4) =
250 250 250
= F (0,4) − F (−1,2) = F (0,4) − (1 − F (1,2)) = 0,6554 − (1 − 0,8849) = 0,5403.

Por lo tanto, la probabilidad de que una bombilla dure entre 900 y 1300 horas es aproximadamente de 0.54.
Para calcular el percentil 0,6554 de X:

X − 1200 x0 − 1200
P (X < x0 ) = 0, 6554 =⇒ P ( < ) = 0,6554
250 250

114
Estadı́stica

En términos de Z:
P (Z < z0 ) = 0,6554 =⇒ z0 = 0,4
Como
x0 − 1200
z0 = = 0,4
250
despejando x0 tenemos que x0 = 1300

Ejercicio 5.4. Un grupo muy numeroso de estudiantes obtiene unas calificaciones de 0 a 100 puntos, que siguen
una distribución normal con media 60 puntos y una desviación tı́pica de 15 puntos. ¿Qué proporción de los
estudiantes obtiene una calificación de entre 85 y 95 puntos?

Solución:
85 − 60 X − 60 95 − 60
P (85 < X < 95) = P ( < < )) = P (1,67 < Z < 2,33) =
15 15 15
= F (2,33) − F (1,67) = 0,9901 − 0,9525 = 0,0376.

Es decir, el 3.76 por ciento de los estudiantes obtuvo una calificación comprendida entre 85 y 95.

115
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

Tabla de la distribución normal estándar acumulada.


P (Z ≤ z) donde Z ∼ N (0, 1)

116
Estadı́stica

5.4. La distribución normal como aproximación de la distribu-


ción binomial.
(Se corresponde con la sección 16.3 del libro Haeussler (2008))

En este apartado veremos cómo puede utilizarse la distribución normal como aproximación de las variables
aleatorias discretas binomiales y proporcionales que se emplean frecuentemente en el mundo empresarial y en la
economı́a.
En el tema anterior vimos que una variable aleatoria binomial, X ∼ Bin(n, p), expresaba el número de éxitos k
ocurridos en n experimentos en los que la probabilidad de éxito es p y por lo tanto, la probabilidad de fracaso es
1 − p. Vimos que en ese caso, el valor esperado y la varianza de la variable aleatoria eran:

E(X) = µ = np
Var(X) = σ 2 = np(1 − p)
La representación de una distribución binomial cuando p = 0,5 y n = 100, muestra que la distribución bino-
mial tiene la misma forma que la normal, como se puede ver en la Figura 5.11. Esta es una evidencia visual de que
la distribución binomial puede aproximarse con una distribución normal de la misma media y varianza siempre
que se cumpla esta relación entre las distribuciones. Una regla para calcular si existe una relación evidente entre
la distribución binomial y la distribución normal es que se cumpla np(1 − p) > 9.
0.08
0.06
p(x)

0.04
0.02
0.00

35 40 45 50 55 60

Número de éxitos

Figura 5.11: Distribución binomial con n = 100 y p = 0,5.

La metodologı́a para resolver el cálculo de probabilidades serı́a similar a la que hemos visto en el apartado
anterior. Supongamos que X ∼ Bin(n, p), con esperanza µ = n p y con varianza σ 2 = n p (1 − p) > 9. Entonces
podemos considerar que X ∼ N(µ = n p, σ 2 = n p (1 − p)). Para hallar la probabilidad de que el número de éxitos
se encuentre entre a y b, inclusive, harı́amos lo siguiente:

a−µ X −µ b−µ a − np b − np
P (a ≤ X ≤ b) ' P ( ≤ ≤ ) = P(p ≤Z≤ p ),
σ σ σ np(1 − p) np(1 − p)
donde Z se distribuye según una normal estándar N(0,1).

Ejemplo 5.3. Una vendedora se pone en contacto por teléfono con posibles clientes en un intento de averiguar si
es probable que merezca la pena ir a su casa a verlos. Su experiencia sugiere que en el 40 % de los contactos iniciales
acaba yendo a casa del cliente. Si se pone en contacto con 100 personas por teléfono, ¿cuál es la probabilidad de
que vaya a ver a entre 45 y 50 personas?

117
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

Solución: Si X es el número de personas a las que va a ver la vendedora, X sigue una distribución binomial
Bin(n = 100, p = 0,4). Como np(1 − p) = 24 > 9, X se puede aproximar con una distribución normal N(40, 24), ya
que E(X) = np = 1000,4 = 40 y Var(X) = np(1 − p) = 100 · 0,4 · 0,6 = 24. Por lo tanto, X se puede transformar
en Z ∼ N(0, 1).
45 − 100 · 0,4 50 − 100 · 0,4
P (45 ≤ X ≤ 50) ' P ( √ ≤Z≤ √ )=
100 · 0,4 · 0,6 100 · 0,4 · 0,6
= P (1,02 ≤ Z ≤ 2,04) = F (2,04) − F (1,02) = 0,9793 − 0,8461 = 0,1332

5.5. La distribución exponencial.


La distribución exponencial es especialmente útil para resolver problemas de listas de espera o colas. También
es apropiada para modelizar problemas sobre el tiempo que se dedica a la realización de un servicio. Es importante
señalar que la distribución exponencial se diferencia de la normal en dos aspectos: se limita a las variables aleatorias
que toman valores positivos y su distribución no es simétrica.
Si T es una variable aleatoria que sigue una distribución exponencial, Ex(λ), su función de densidad se expresa
de la siguiente forma:

f (t) = λe−λt , con t > 0


donde λ es el número medio de ocurrencias por unidad de tiempo, t es el número de unidades de tiempo hasta
la siguiente ocurrencia y e = 2,71828...
0.20
0.15
0.10
f(t)

0.05
0.00

0 5 10 15

Figura 5.12: Función de densidad de una variable T∼Ex(λ).

La función de distribución acumulada en este caso es:

F (t) = 1 − e−λt , para t > 0


Se puede comprobar que:
E(T ) = 1/λ
Var(T ) = 1/λ2
Puede demostrarse que λ es el mismo parámetro utilizado en la distribución de Poisson, vista en el tema
anterior. Los supuestos del modelo exponencial son los mismos que los de la distribución de Poisson. La distribución
de Poisson indica la probabilidad de que haya X éxitos o llegadas durante una unidad de tiempo. En cambio, la
distribución exponencial indica la probabilidad de que haya un éxito o una llegada durante un intervalo de tiempo
t.

118
Estadı́stica

Ejercicio 5.5. El tiempo que se dedica a atender al público en el mostrador de información de una biblioteca
puede representarse mediante una distribución exponencial que tiene un tiempo medio de atención de 5 minutos.
¿Cuál es la probabilidad de que el tiempo de atención al público sea de más de 10 minutos?
¿Cuál es el percentil 25?

Solución: Sea t el tiempo de atención en minutos. La tasa de atención es λ= 15 =0.2 por minuto y la función de
densidad es
f (t) = 0,2 · e−0,2t
La probabilidad que buscamos es:

P (t > 10) = 1 − P (t < 10) = 1 − F (10) = 1 − (1 − e−0,2·10 ) = e−2,0 = 0,1353


Por lo tanto, la probabilidad de que el tiempo de atención sea de más de 10 minutos es 0.1353.

En cuanto al percentil 25, buscamos un valor t0 = de modo que P (T ≤ t0 ) = 0,2500:


t0 =? tal que P (T ≤ t0 ) = 0,2500, es decir: F (t0 ) = 0,2500
Como F (t0 ) = 1 − e−0,2·t0 = 0,2500, tenemos que : e−0,2·t0 = 1 − 0,25 = 0,75
Tomando logaritmos: ln(e−0,2·t0 ) = ln(0,75) =⇒ (−0,2 · t0 ) · ln(e) = ln(0,75)
y despejando t0 = ln(0,75)
−0,2
= −0,29
−0,2
= 1,4 min.

5.6. La distribución ji cuadrado, χ2 .


En este apartado estudiamos las caracterı́sticas funcionales de la distribución y sus propiedades más impor-
tantes, incluyendo la utilización de la tabla.

Una variable aleatoria continua X, sigue una distribución ji cuadrado con n grados de libertad, si su función
de probabilidad es la siguiente:
1 x n
f (X) = n e 2 X ( 2 −1)
2 2 Γ( n2 )
Esta función está definidad para x > 0.

Supongamos que Z1 , Z2 ,..., Zk son variables aleatorias normales tipificadas N (0, 1) independientes entre sı́, la
suma cuadrática de todas ellas es una variable aleatoria X, que se distribuye según una χ2 con n grados de libertad.

El valor esperado de una distribución ji cuadrado con n grados de libertad es n y su varianza es 2n.
En el cálculo de probabilidades sobre distribuciones ji cuadrado con n grados de libertad, lo más frecuente
es que se desee conocer el área entre la curva y el eje de abcisas para valores de la variable mayores que un
valor determinado. Al área que queda a la derecha de un valor determinado se le denomina α y representa la
probabilidad de obtener un valor de la variable mayor que el indicado, el área a la izquierda se le denomina 1 − α.
El cálculo de probabilidades correspondientes a variables que siguen distribuciones ji cuadrado se realiza
consultando tablas estadı́sticas. Hay varios tipos de tablas, es por ello que antes de consultarla se recomienda
observar con qué tipo de tabla estamos trabajando. La tabla que empleamos nosotros está basada en la función
de distribución acumulativa.
La primera columna indica los grados de libertad, y la primera fila nos indica el área que queda a la izquierda
del valor que aparece en la tabla. Por ejemplo, para n = 1 grados de libertad y p = 0,95 está el valor 3.8415, esto
significa que el 95 % de los valores de variables aleatorias que se distribuyen según una ji cuadrado con un grado
de libertad tienen valores menores de 3.8415, la probabilidad de obtener un valor mayor a 3.8415 es de 0.05. Esto
lo podemos expresar de las siguientes formas:

χ21;0,05 = 3,8415,
P (χ21 < 3,8415) = 0,95,
P (χ21 > 3,8415) = 0,05.

119
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

5.7. Ejercicios propuestos


Ejercicio 5.6. Considera la función:

0, si t < 0
(
f (t) = 2, si 0 ≤ t ≤ 1/2
1, si t > 1/2
Comprueba que es una función de densidad y calcula su función de distribución. Además, calcula la siguientes
probabilidades

a. P (X > 2) d. Calcula P (X ≤ 1,5)

b. P (X > −20)
e. Calcula P (1,75 ≤ X ≤ 2,25)
c. P (0,1 ≤ X ≤ 0,75)

Ejercicio 5.7. Considera la función:

0, si x < 1


x − 1, si 1 ≤ x ≤ 2

f (x) =
 −x + 3, si 2 ≤ x ≤ 3

0, si x > 3
a. Comprueba que f (x) es una función de densidad. f. Calcula la probabilidad P (≤ X ≤ 2,8)
b. Obtén la función de distribución. g. Calcula p(X ≤ 1,5)
c. Calcula la probabilidad P (X ≤ 1,5)
d. Calcula la probabilidad P (X ≥ 2,8) h. Calcula p(1,75 ≤ X ≤ 2,25)
e. Calcula la probabilidad P (X ≤ 2,8)

Ejercicio 5.8. Considera la función:

 1 + x , si 0 ≤ x ≤ 3
 2

f (x) = m

0, en otro caso.

Averigua el valor de m para que f (x) sea una función de densidad. Obtén la función de distribución. Calcula
las siguientes probabilidades, para el m obtenido en el apartado anterior:

a. P (X ≤ 1)
c. P (X > 1)
b. P (1 ≤ X ≤ 2)

Ejercicio 5.9. Supongamos que la duración en minutos de las llamadas telefónicas sigue una distribución dada
por la función:
F (x) = 1 − e−x/3
Calcular la probabilidad de que la duración de una llamada cualquiera sea:
1. superior a 6 minutos.
2. inferior a 10 minutos.
3. igual a 6 minutos.

Ejercicio 5.10. Sea una variable X que sigue una distribución uniforme con parámetros a = −2 y b = 4,5, es
decir X ∼ U n(a = −2, b = 4,5). Calcula su función de distribución de probabilidad acumulada y después calcula
estas probabilidades utilizando dicha función de probabilidad acumulada:

120
Estadı́stica

a. P (−10 < X < 3) e. P (X > −3,2)


b. P (X > 4)
f. P (1 < X < 2)
c. P (X < 1)
d. P (X < −1/2) g. P (−2 < X < −1)

Ejercicio 5.11. Siendo Z ∼ N (0, 1) calculad las siguientes probabilidades. Representad la variable y cada
probabilidad.

a. P (Z < 0) g. P (1 ≤ Z ≤ 2)
b. P (Z < 1) h. P (−1 ≤ Z ≤ 1)
c. P (Z ≤ 1)
i. P (−2 ≤ Z ≤ 2)
d. P (Z > 1)
e. P (Z < 2) j. P (−3 ≤ Z ≤ 3)
f. P (Z < 3) k. P (Z > 3)

Ejercicio 5.12. Sea X ∼ N (20, 5), representad gráficamente la variable y calculad y dibujad las siguientes
probabilidades.

a. P (X < 20) g. P (15 ≤ X ≤ 30)


b. P (X < 25) h. P (15 ≤ X ≤ 25)
c. P (X ≤ 25)
i. P (10 ≤ X ≤ 30)
d. P (X > 25)
e. P (X < 30) j. P (5 ≤ X ≤ 35)
f. P (X < 35) k. P (X > 35)

Ejercicio 5.13. En una distribución normal Standard N (0, 1), calculad:


1. m tal que P (X ≤ m) = 0,9871
2. m tal que P (X ≤ m) = 0,2358
3. m tal que P (0,47 ≤ X ≤ m) = 0,1680

Ejercicio 5.14. Una empresa produce bombillas cuya duración sigue una distribución normal que tiene una
media de 1200 horas y una desviación tı́pica de 250 horas. Si elegimos una bombilla aleatoriamente, ¿cuál es la
probabilidad de que dure entre 900 y 1300 horas?

Ejercicio 5.15. Un autor recibe de una editorial un contrato, según el cual recibe una cantidad fija de 10000
euros más 1.50 euros por cada ejemplar que se venda de su libro. Su incertidumbre sobre las ventas totales del
libro pueden representarse por medio de un variable aleatoria que tiene una media de 30 000 y una desviación
tı́pica de 8000. Halla la media y la desviación tı́pica de la cantidad total de dinero que recibirá.

Ejercicio 5.16. Una organización benéfica solicita donaciones por teléfono. Los empleados reciben 60 euros más
un 20 % del dinero que generan las llamadas cada semana. La cantidad de dinero generada en una semana puede
concebirse como una variable aleatoria que tiene una media de 700 euros y una desviación tı́pica de 130 euros.
Halla la media y la desviación tı́pica de la remuneración total de un empleado en una semana.

Ejercicio 5.17. Se sabe que la cantidad de dinero que gastan los estudiantes en libros de texto en un año en una
universidad sigue una distribución normal que tiene una media de 380 euros y una varianza de 2500 euros.
a. ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste menos de 400 euros en libros de
texto en un año?
b. ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste más de 360 euros en libros de
texto en un año?
c. Explica gráficamente por qué las respuestas de los apartados (a) y (b) son iguales.
d. ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste entre 300 euros y 400 euros en
libros?

121
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

Ejercicio 5.18. Una compañı́a de alquiler de automóviles ha observado que la probabilidad de que un automóvil
necesite una reparación en un mes cualquiera dado es 0.2. La compañı́a tiene 900 automóviles. Idea: Usa para
los cálculos la aproximación normal a la binomial.
a. ¿Cuál es la probabilidad de que más de 200 automóviles necesiten una reparación en un mes determinado?
b. ¿Cuál es la probabilidad de que menos de 175 automóviles necesiten una reparación en un mes determinado?

Ejercicio 5.19. La duración de una determinada marca de neumáticos sigue una distribución normal que tiene
una media de 35 000 kilómetros y una desviación tı́pica de 4000 kilómetros.
i. ¿Qué proporción de estos neumáticos tiene una duración de más de 38 000 kilómetros?
ii. ¿Qué proporción de estos neumáticos tiene una duración de menos de 38 000 kilómetros?
iii. ¿Qué proporción de estos neumáticos tiene una duración de entre 32 000 y 38 000 kilómetros?

Ejercicio 5.20. Se encuesta a una muestra de 100 obreros de una gran empresa para saber qué piensa de un
nuevo plan de trabajo propuesto. Si el 60 % de todos los obreros de esta empresa es partidario de este nuevo plan,
¿cuál es la probabilidad de que menos de 50 de los miembros de la muestra sea partidario del plan?. Idea: Usa
para los cálculos la aproximación normal a la binomial.

Ejercicio 5.21. Una vendedora de perfumes quiere averiguar si tiene sentido vender perfumes a domicilio. Su
experiencia sugiere que en el 40 % de los clientes están de acuerdo. Si se pone en contacto con 100 personas por
teléfono, ¿cuál es la probabilidad de que vaya a ver a entre 45 y 50 personas?

Ejercicio 5.22. Tras un test de cultura general se observa que las puntuaciones obtenidas siguen una distribu-
ción N (65, 18). Se desea clasificar a los examinados en tres grupos (de baja cultural general, de cultura general
aceptable, de excelente cultura general) de modo que hay en el primero un 20 % la población, un 65 % el segundo
y un 15 % en el tercero. ¿Cuáles han de ser las puntuaciones que marcan el paso de un grupo al otro?.

Ejercicio 5.23. El salario mensual de un vendedor se distribuye de manera uniforme entre 120 euros, que es su
sueldo base, y 780 euros. ¿Cuál es la probabilidad de que en un mes cualquiera gane más de 550 euros?. ¿Y de
qué gane menos de 700 euros?

Ejercicio 5.24. El personal de una importante compañı́a usa una terminal para realizar sus pedidos internacio-
nales. Si el tiempo que cada comercial gasta en una sesión en la terminal tiene una distribución exponencial con
media de 36 minutos, calcular la probabilidad de que utilice la terminal 30 minutos o menos.

Ejercicio 5.25. Sabiendo que la clase de Estadı́stica comienza a las 10 horas y que el profesor que imparte dicha
asignatura emplea en el trayecto de su casa a la Facultad entre 15 y 20 minutos de forma uniforme, calcular a
qué hora debe salir de casa para que pueda llegar puntualmente a dar su clase con una probabilidad del 99 %.

Ejercicio 5.26. Un componente eléctrico tiene una vida media de 8 años. Si su vida útil se distribuye en forma
exponencial. ¿Cuál debe ser el tiempo de garantı́a que se debe otorgar, si se desea reemplazar a lo más el 15 % de
los componentes que fallen dentro de este perı́odo?

Ejercicio 5.27. Dada una distribución uniforme X en un intervalo [2, 7], indicad cuál es el valor esperado de
dicha variable.

Ejercicio 5.28. Dada una distribución uniforme X en un intervalo [2, 7], indicad cuál es la varianza de dicha
variable.

122
Estadı́stica

5.8. Cuestionarios

5.8.1. 28 de mayo del 2018


Cuestión 1.1

Las ventas diarias de una librerı́a siguen una distribución uniforme entre los 600 y los 1000 euros. Calcular
la probabilidad de que un dı́a la cifra de ventas supere los 900 euros.
a) 0,5
b) 0,25
c) 0,75
d) Ninguna de las anteriores.

El tiempo de retraso de un determinado vuelo de una compañı́a área sigue una distribución normal de media
Cuestión 1.2

10 minutos y desviación tı́pica 5 minutos. ¿Cuál es el tiempo mı́nimo de retraso del 2,5 % de los vuelos que
más se retrasan?.
a) 19,8 minutos
b) 0,2 minutos
c) 1,96 minutos
d) Ninguna de las anteriores.

Una máquina debe llenar botes de jalea con gramos de producto, pero no lo hace exactamente. Los pesos
Cuestión 1.3

reales de contenido siguen una ley normal. Si la media es de 300 gramos y una desviación de 4 gramos. ¿qué
proporción de botes tendrán menos de 308 gramos?.
a) 0,9772
b) 97,72 %
c) 2 %
d) Ninguna de las anteriores.

El tiempo de funcionamiento de una bombilla de distribuye como exponencial con una media de 10 dı́as.
Cuestión 1.4

¿Cuál es la probabilidad de que una bombilla funcione más de 10 dı́as? SI ES NECESARIO REDONDEAR
AL SEGUNDO DECIMAL.
a) 0,37
b) 0,63
c) 0,96
d) Ninguna de las anteriores.

123
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
Cuestión 1.5

¿Cuál es el valor de la varianza de la variable del ejercicio anterior?


a) 100
b) 1/10
c) 10
d) Ninguna de las anteriores.

El tiempo máximo que se puede reservar una sala de conferencias grande de cierta empresa son 4 horas. Con
mucha frecuencia tienen conferencias extensas y breves. De echo se sabe que la duración X de una conferencia
Cuestión 1.6

tiene una distribución uniforme en el intervalo [0, 4]. Si la probabilidad de que una conferencia dure como
mucho un determinado tiempo es 0,9, ¿cuál es el valor de ese tiempo?.
a) No se puede calcular.
b) 7,6 horas
c) 3,6 horas
d) Ninguna de las anteriores.
Cuestión 1.7

¿Cuál es el valor esperado de la variable del ejercicio anterior?


a) 4
b) 1.33
c) 2
d) Ninguna de las anteriores.

En un experimento de laboratorio se utiliza cierto material. Sabiendo que la duración media de un átomo de
Cuestión 1.8

esta materia es de 140 dı́as y sigue una distribución exponencial, ¿cuántos dı́as transcurrirán hasta que haya
desaparecido el 90 % de este material? SI ES NECESARIO REDONDEAR AL SEGUNDO DECIMAL.
a) No se puede calcular porque de negativo.
b) 322,36
c) 677,08
d) Ninguna de las anteriores.

Soluciones Cuestionario 28 de mayo 2018


Número cuestión Respuesta correcta
1 b
2 a
3 b
4 a
5 a
6 c
7 c
8 b

124
Estadı́stica

5.8.2. Cuestionario Tema 5: 24 de mayo del 2019. Modelo A.

Se sabe que la estatura en centı́metros de los alumnos matriculados en primero de esta Universidad sigue
una distribución normal de media 175 cm y desviación tı́pica de 8 cm. Calcula la probabilidad de que un
Cuestión 2.1

alumno mida entre 170 y 185 cm.

a) 0.63
b) 0.16
c) 0.34
d) Ninguna de las anteriores es correcta.
Cuestión 2.2

Dado el enunciado anterior, calcula el valor que deja por debajo el 95 % de los alumnos

a) 161.84
b) 188.16
c) 191.01
d) Ninguna de las anteriores es correcta.

El tiempo de revisión del motor de un avión sigue una distribución exponencial con media 22 minutos.
Cuestión 2.3

Encontrar la probabilidad de que el tiempo de revisión sea menor a 10 minutos.

a) 1
b) 0.37
c) 0.63
d) Ninguna de las anteriores es correcta.

El tiempo de vida de una lámpara especial sigue una distribución exponencial con media 100 horas. ¿Cuántas
Cuestión 2.4

horas como máximo transcurrirán para el 10 % de las lámparas que menos duran?

a) 10.54 horas
b) No se puede calcular.
c) 230.62 horas
d) Ninguna de las anteriores es correcta.

125
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

El ingreso semanal, en euros, de un pequeño comercio sigue una distribución uniforme entre los valores 5,000
Cuestión 2.5

y 10,000 euros. Calcula la probabilidad de que una semana se ingrese entre 7.000 y 8.000 euros.

a) 0.20
b) 0.33
c) 0.67
d) Ninguna de las anteriores es correcta.
Cuestión 2.6

Dado el enunciado anterior, ¿cuál es el ingreso semanal máximo que alcanzan el 90 % de las semanas?

a) 7500
b) 9500
c) 9000
d) Ninguna de las anteriores es correcta.

El ingreso semanal, en euros, de un pequeño comercio sigue una distribución uniforme entre los valores 5,000
Cuestión 2.7

y 10,000 euros. Calcula la desviación tı́pica de los ingresos semanales de este comercio.

a) 866.03
b) 7500
c) 1443.38
d) Ninguna de las anteriores es correcta.

Una empresa se dedica a poner máquinas expendedoras de bebidas en distintos hospitales. El alquiler del
espacio que utiliza le cuesta 100 euros diarios y gana 1.4 euros por cada bebida vendida. Si las ventas de
bebidas diarias tienen un valor esperado de 150 y una desviación tı́pica de 30, ¿Cuál es el beneficio diario
Cuestión 2.8

que espera obtener?

a) 130
b) 210
c) 110
d) Ninguna de las anteriores es correcta.

126
Estadı́stica

Soluciones Cuestionario Tema 5: 24 de mayo 2019. Modelo A.

Número cuestión Respuesta correcta


1 a
2 b
3 b
4 a
5 a
6 b
7 c
8 c

5.8.3. Cuestionario Tema 5: 24 de mayo del 2019. Modelo B.

Las calificaciones de los alumnos que se presentan al examen de estadı́stica se distribuye normalmente con
Cuestión 3.1

una media de 6.5 y una varianza de 4. Calcula la probabilidad de que las calificaciones estén comprendidas
entre 5 y 7.5 puntos
a) 0.25
b) 0.46
c) 0.08
d) Ninguna de las anteriores es correcta.
Cuestión 3.2

Dado el enunciado anterior, calcula el valor que deja por encima el 95 % de las calificaciones

a) 0.12
b) 3.21
c) 9.79
d) Ninguna de las anteriores es correcta.

El tiempo de revisión del motor de un avión sigue una distribución exponencial con media 15 minutos.
Cuestión 3.3

Encontrar la probabilidad de que el tiempo de revisión sea mayor a 10 minutos.

a) 7,18 · 10−66
b) 0.49
c) 0.51
d) Ninguna de las anteriores es correcta.

127
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

El tiempo de vida de una lámpara especial sigue una distribución exponencial con media 75 horas. ¿Cuántas
Cuestión 3.4

horas como máximo transcurrirán para el 15 % de las lámparas que menos duran?

a) No se puede calcular
b) 2,17 · 10−3
c) 12.19
d) Ninguna de las anteriores es correcta.

El ingreso semanal, en euros, de un pequeño comercio sigue una distribución uniforme entre los valores 6,000
Cuestión 3.5

y 9,000 euros. Calcula la probabilidad de que una semana se ingrese entre 7.000 y 8.000 euros.

a) 0.20
b) 0.33
c) 0.67
d) Ninguna de las anteriores es correcta.
Cuestión 3.6

Dado el enunciado anterior, ¿cuál es el ingreso semanal máximo que alcanzan el 80 % de las semanas?

a) 8400
b) 7500
c) 7200
d) Ninguna de las anteriores es correcta.

El ingreso semanal, en euros, de un pequeño comercio sigue una distribución uniforme entre los valores 6,000
Cuestión 3.7

y 9,000 euros. Calcula la desviación tı́pica de los ingresos semanales de este comercio.

a) 866.03
b) 7500
c) 1443.38
d) Ninguna de las anteriores es correcta.

128
Estadı́stica

Una empresa se dedica a poner máquinas expendedoras de bebidas en distintos hospitales. El alquiler del
espacio que utiliza le cuesta 150 euros diarios y gana 1.4 euros por cada bebida vendida. Si las ventas de
bebidas diarias tienen un valor esperado de 160 y una desviación tı́pica de 40, ¿Cuál es el beneficio diario
Cuestión 3.8

que espera obtener?

a) 130
b) 280
c) 210
d) Ninguna de las anteriores es correcta.

Soluciones Cuestionario Tema 5: 24 de mayo 2019. Modelo B.

Número cuestión Respuesta correcta


1 b
2 b
3 c
4 c
5 b
6 a
7 a
8 d

5.8.4. Cuestionario Tema 5: 30 de mayo del 2019. Modelo C.

Se sabe que el peso medio en kilos de los alumnos varones matriculados en primero de esta Universidad
sigue una distribución normal de media 74 kg y desviación tı́pica de 6 kg. Calcula la proporción de alumnos
Cuestión 4.1

varones pesen entre 68 y 80 kg.

a) 16 %
b) 84 %
c) 68 %
d) Ninguna de las anteriores es correcta.
Cuestión 4.2

Dado el enunciado anterior, calcula el valor que deja por debajo el 97.5 % de los pesos de los alumnos varones

a) 83.87
b) 85.76
c) 64.24
d) Ninguna de las anteriores es correcta.

129
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

El tiempo de vida media de un marcapasos sigue una distribución exponencial con media 16 años. Calcular
la probabilidad de que una persona a la que se ha implantado un marcapasos se le deba de implantar otro
Cuestión 4.3

antes de 20 años.

a) 0.71
b) 0.29
c) 1
d) Ninguna de las anteriores es correcta.

El tiempo de vida media de un marcapasos sigue una distribución exponencial con media 16 años. Calcular
Cuestión 4.4

el tiempo mı́nimo que duran el 10 % de los marcapasos más duraderos.

a) 1.69
b) 36.84
c) No se puede calcular
d) Ninguna de las anteriores es correcta.

Una empresa cervecera familiar ha estimado que la demanda diaria de sus clientes sigue una distribución
uniforme entre 100 y 150 litros. Calcula la probabilidad de que la demanda de un dı́a cualquiera esté entre
Cuestión 4.5

130 l. y 140 l.

a) 0.20
b) 0.80
c) 0.60
d) Ninguna de las anteriores es correcta.

Dado el enunciado anterior, ¿qué cantidad deberán tener disponibles cada dı́a para satisfacer la demanda
Cuestión 4.6

con probabilidad 0.90?

a) 45 l.
b) 145 l.
c) 100 l.
d) Ninguna de las anteriores es correcta.

130
Estadı́stica

Una empresa cervecera familiar ha estimado que la demanda diaria de sus clientes sigue una distribución
Cuestión 4.7

uniforme entre 100 y 150 litros. Calcula la desviación tı́pica de la demanda diaria de estos clientes.

a) 14.43
b) 208,33
c) 125
d) Ninguna de las anteriores es correcta.

Una empresa se dedica a poner máquinas expendedoras de periódicos en distintas calles de una ciudad. El
alquiler del espacio que utiliza le cuesta 100 euros diarios y gana 0.4 euros por cada periódico vendido. Si
las ventas diarias de periódicos tienen un valor esperado de 600 y una desviación tı́pica de 100, ¿Cuál es el
Cuestión 4.8

beneficio diario que espera obtener con una de estas máquinas?

a) 500
b) 240
c) 140
d) Ninguna de las anteriores es correcta.

Soluciones Cuestionario Tema 5: 24 de mayo 2019. Modelo C.

Número cuestión Respuesta correcta


1 c
2 b
3 a
4 b
5 a
6 b
7 a
8 c

5.8.5. Cuestionario Tema 5: 24 de mayo del 2019. Modelo D.

Se sabe que el número de horas que los alumnos dedican a estudiar estadı́stica el dı́a antes del examen sigue
una distribución normal de media 10 horas y desviaci’on tı́pica de 5.25 horas. Calcula la probabilidad de
Cuestión 5.1

que un alumno estudie entre 7 y 11 horas.

a) 0.29
b) 0.86
c) 0.68
d) Ninguna de las anteriores es correcta.

131
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA
Cuestión 5.2

Dado el enunciado anterior, calcula el valor que deja por debajo el 95 % de los alumnos

a) 18.64
b) 9.56
c) 20.29
d) Ninguna de las anteriores es correcta.

El tiempo de vida media de un marcapasos sigue una distribución exponencial con media 10 años. Calcular
la probabilidad de que una persona a la que se ha implantado un marcapasos se le deba de implantar otro
Cuestión 5.3

antes de 13 años.

a) 0.73
b) 0.27
c) 1
d) Ninguna de las anteriores es correcta.

El tiempo de vida media de un marcapasos sigue una distribución exponencial con media 10 años. Calcular
Cuestión 5.4

el tiempo mı́nimo que duran el 5 % de los marcapasos más duraderos.

a) No se puede calcular.
b) 29,96 años
c) 0.51 años
d) Ninguna de las anteriores es correcta.

Una empresa cervecera familiar ha estimado que la demanda diaria de sus clientes sigue una distribución
uniforme entre 160 y 200 litros. Calcula la probabilidad de que la demanda de un dı́a cualquiera esté entre
Cuestión 5.5

175 l. y 185 l.

a) 0.63
b) 0.38
c) 0.25
d) Ninguna de las anteriores es correcta.

132
Estadı́stica

Dado el enunciado anterior, ¿qué cantidad deberán tener disponibles cada dı́a para satisfacer la demanda
Cuestión 5.6

con probabilidad 0.80?

a) 192 l.
b) 190 l.
c) 180 l.
d) Ninguna de las anteriores es correcta.

Una empresa cervecera familiar ha estimado que la demanda diaria de sus clientes sigue una distribución
Cuestión 5.7

uniforme entre 160 y 200 litros. Calcula la desviación tı́pica de la demanda diaria de estos clientes.

a) 133.33
b) 180
c) 11.55
d) Ninguna de las anteriores es correcta.

Una empresa se dedica a poner máquinas expendedoras de periódicos en distintas calles de una ciudad. El
alquiler del espacio que utiliza le cuesta 130 euros diarios y gana 0.5 euros por cada periódico vendido. Si
las ventas diarias de periódicos tienen un valor esperado de 600 y una desviación tı́pica de 100, ¿Cuál es el
Cuestión 5.8

beneficio diario que espera obtener con una de estas máquinas?

a) 300
b) 170
c) 470
d) Ninguna de las anteriores es correcta.

Soluciones Cuestionario Tema 5: 24 de mayo 2019. Modelo D.


Número cuestión Respuesta correcta
1 a
2 a
3 a
4 b
5 c
6 a
7 c
8 b

133
CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA

134
Apéndice A

Introducción a las integrales

A.1. Primitivas e integral indefinida


Una función F (x) que verifica F 0 (x) = f (x) para todo x en un intervalo se dice que es una primitiva de f en
dicho intervalo.

d 4
Ejemplo A.1. Consideremos la función f (x) = 4x3 , es posible obtenerla por derivación como: [x ] = 4x3 ;
dx
por lo tanto, una primitiva de f es F (x) = x . Como la derivada de cualquier constante es cero, se sigue que las
4

siguientes funciones también son primitivas de f (x) = 4x3 : F1 (x) = x4 − 7, F2 (x) = x4 + 1, F3 (x) = x4 + 91.

Teorema A.1. Dadas dos primitivas de una misma función f , F1 (x) y F2 (x), en un intervalo (a, b), éstas se
diferencian en una constante, es decir, F1 (x) = F2 (x) + C para todo x ∈ (a, b).

Al conjunto de todas las funcionesZ primitivas de una función f (F (x) + C) se le llama integral indefinida o
anti–derivada de f y se denota como f (x)dx.

Teorema A.2. Se verifican las siguientes propiedades:


Z
d
1. La integración es la operación inversa de la derivación F (x)dx = F (x) + C;
dx
Z Z Z
2. [f (x) + g(x)]dx = f (x)dx + g(x)dx;
Z Z
3. kf (x)dx = k f (x)dx.

Teorema A.3. Si r es un racional distinto de −1 y a es un número real cualquiera

(x + a)r+1
Z
(x + a)r dx = + C.
r+1

(x + a)r+1 1
Demostración. La derivada de es (r + 1)(x + a)r = (x + a)r .
r+1 r+1
Z
Ejemplo A.2. Calcula 5x7 + 2x2 + 7x1/3 dx.


Combinando la linealidad (teorema A.2) y integral indefinida de la potencia (teorema A.3), se tiene que

x7+1 x2+1 x1/3+1 5 2 21 4/3


Z
5x7 + 2x2 + 7x1/3 dx = 5 +2 +7 + C = x8 + x3 + +C

x
7+1 2+1 1/3 + 1 8 3 4

135
APÉNDICE A. INTRODUCCIÓN A LAS INTEGRALES

√  √
Z
Ejemplo A.3. Calcular x−1−1 x − 1 + 1 dx

√  √ √
Realizamos el producto del integrando con anterioridad a la integración: x−1−1 x − 1 + 1 = ( x − 1)2 −


x2
Z Z
12 = x − 2. La integración es ahora inmediata: x dx − 2 dx = − 2x + C.
2

Z √
3
x−5+2
Ejemplo A.4. Calcula dx.
3
Z √
x−5+2 1 2 1 2
3
Z Z Z
dx = ( (x − 5)1/3 + ) dx = (x − 5)1/3 dx + dx =
3 3 3 3 3
1 (x − 5)1/3+1 2 1 2
= + x + C = (x − 5)4/3 + x + C.
3 1/3 + 1 3 4 3

Ejemplo A.5. Encuentra la función F que verifica que F 0 (x) = x2 − 4x y F (0) = 2.


La función F es una primitiva de f (x) = x2 − 4x, luego existe un C tal que

x3 x2 1
F (x) = −4 + C = x3 − 2x2 + C.
3 2 3
Como F (0) = C, podemos determinar el valor de C, ya que en la expresión anterior F (0) = C, con lo que C = 2
1
y la función buscada es F (x) = x2 − 2x2 + 2.
3

Ejemplo A.6. En una empresa que manufactura harina el coste fijo de producción es 1000e por año donde el
coste fijo de producción son todos los gastos que permanecen constantes independientemente de la producción. Si
Q es la producción en kilo y C es el coste de producción medido en euros, el coste en materias primas (trigo) es de
0,2e por kilo producido y el marginal del coste de la mano de obra varı́a como 0,1Q−0,9 . Por tanto, el marginal
del coste de producción viene dado por
dC
= 0,2 + 0,1Q−0,9
dQ
Determina con estos datos el coste según la producción.
La función de coste es una primitiva de 0,2 + 0,1Q−0,9 , con lo que hay una constante A tal que

Q0,1
C(Q) = 0,2Q + 0,1 + A.
0,1
En este caso hemos llamado a la constante de integración A para no confundirla con el coste. Como los costes en
ausencia de producción valen 1000e tenemos que C(0) = 1000, luego A = 1000 y la función de costo es

C(Q) = 0,2Q + Q0,1 + 1000.

A.2. Integral definida


Z b
Dada una función f acotada no negativa y dos números a ≤ b, la integral definida denotada por f (x) dx
a
es el área de un trapecio curvilı́neo definido por
{(x, y) : a ≤ x ≤ b 0 ≤ y ≤ f (x)}
cuya superficie aparece sombreada en la figura A.1. Si la función no negativa acotada en [a, b] posee sólo un número
finito de discontinuidades, es seguro que tiene sentido hablar de área de la anterior superficie. Sin embargo, existen
funciones muy complicadas de definir (no nos aparecerán en ningún ejemplo práctico) para las que no tiene sentido
Z b
hablar del área de dicha superficie. En consecuencia, f (x) dx consiste en un número siempre que tenga sentido.
a

136
Estadı́stica

y x=a x=b
y = f (x)

Z b
f (x) dx
a

x
a b

Figura A.1: El área de la superficie sombreada define la integral de función f (x) en intervalo [a, b].

Ejemplo A.7. El área Zde un rectángulo de base b = 3 y altura h = 2, que es b · h = 2 · 3 = 6, se puede identificar
3
con la integral definida 2 dx. En el primer panel de la figura A.2 aparece dicha superficie sombreada.
0

Z 4
Ejemplo A.8. La integral definida x dx es el área de un triángulo cuya base y altura valen 4, por lo que
0

4
1 42
Z
x dx = 4·4= = 8.
0
2 2

En el segundo panel de la figura A.2 aparece la superficie correspondiente sombreada.

Ejemplo A.9. La función f (x) = 1 − |x| en el intervalo [−1, 1] está definida por trozos como

1+x si − 1 ≤ x < 0;

f (x) =
1−x si 0 ≤ x ≤ 1.
Z 1
La integral definida (1 − |x|) dx es el área del triángulo sombreado en el tercer panel de la figura A.2. Como
−1
se
Z trata de un triángulo cuya base mide dos unidades y su altura una, el área de dicho triángulo vale uno, ası́
1
(1 − |x|) dx = 1.
−1

Z 1
π p
Ejemplo A.10. La integral definida 1 − x2 dx es
, pues la superficie que aparece sombreada en el cuarto
−1
2
panel de la figura A.2 es la mitad de un cı́rculo de radio uno.

Z b
La integral definida f (x) dx de una función acotada cualquiera (puede ser negativa) se define por
a
Z b Z b Z b
f (x) dx = máx{f (x), 0} dx − máx{−f (x), 0} dx
a a a

donde ambos términos tienen sentido porque las funciones máx{f (x), 0} y máx{−f (x), 0} son funciones no nega-
tivas. Vea la figura A.3 donde aparece un ejemplo gráfico de estas funciones.

137
APÉNDICE A. INTRODUCCIÓN A LAS INTEGRALES

y
y
4 y
y
2 1
Z 3
1
Z 4
1
2 dx Z 1
Z
x dx
p
(1 − |x|) dx 1 − x2 dx
0 x 0 x −1 x −1 x
3 4 −1 1 −1 1

Figura A.2: Gráficas de las funciones definidas en los ejemplos A.7, A.8, A.9 y A.10

y y y
y = f (x) y = max{f (x), 0}

y = max{−f (x), 0}

x x x

Figura A.3: La definición de la integral para una función no necesariamente positiva separa el intervalo
de definición de la integral en el trozo donde la función está por encima del eje de abscisa y en el trozo
que está por debajo del eje de abscisa.

Z 3
Ejemplo A.11. Calcular x dx.
−2
La superficie por encima del eje de abscisa es un triángulo cuya base y altura valen 3 y, por consiguiente, el área
de dicho triángulo es 9/2. Por debajo del eje de abscisa la superficie es un triángulo cuyo base y altura son 2 y,
por tanto, su área es 2. El valor de la integral
3
9 5
Z
x dx = −2= .
−2
2 2
Z b Z a
Si b < a se define la integral definida por f (x) dx = − f (x) dx.
a b

Teorema A.4. La integral definida verifica las propiedades:


Z b Z b Z b
1. [f (x) + g(x)]dx = f (x) dx + g(x) dx;
a a a
Z b Z b
2. k f (x) dx = k f (x) dx.
a a
Z b Z c Z b
3. f (x) dx = f (x) dx + f (x) dx
Za a a c

4. f (x) dx = 0.
a

138
Estadı́stica

Z b Z b
5. Si f es integrable en [a, b], y f (x) ≤ g(x) para x con a ≤ x ≤ b y f (x) dx ≤ g(x) dx
a a
Z b Z b
6. La variable de integración es muda, f (x) dx = f (t) dt.
a a

Todas estas propiedades son intuitivas dado que la integral no es más que el área comprendida entre la gráfica
de la función y el eje de abscisas.

y y
1 1
Z 3 Z 3
f (x) dx f (s) ds
1 1
x x
1 2 3 1 2 3
Z b Z b
Figura A.4: El valor de f (x) dx y de f (t) dt es el mismo porque las dos expresiones representan el
a a
área de la misma superficie.

Se denomina partición del intervalo [a, b] a un conjunto ∆ = {x0 , x1 , x2 , . . . , xN −1 , xN } tales que

a = x0 < x1 < x2 < . . . < xN −1 < xN = b.

Se denomina diámetro de la partición ∆ = {x0 , x1 , x2 , . . . , xN } al mayor de los valores |xi −xi−1 | con i = 1, . . . , N ,
es decir,
diam(∆) = máx |xi − xi−1 | = máx{x1 − x0 , x2 − x1 , . . . , xN − xN −1 }.
i=1,...,N

Dada una función f definida en [a, b] y una partición ∆ = {x0 , x1 , x2 , . . . , xN } en [a, b] se dice que un valor S es
una suma integral de f y ∆ si existen ci en el intervalo [xi−1 , xi ] para i = 1, . . . , N tales que

N
X
S= f (ci ) (xi − xi−1 ).
i=1

Como se puede observar en la figura A.5 la suma integral consiste en la suma del área de los rectángulos con
base xi −xi−1 y altura f (ci ). Resulta bastante intuitivo que dada una partición con diámetro pequeño cualesquiera
de sus sumas integrales se aproximan bastante al verdadero valor de la integral definida. Esta idea se enuncia de
forma rigurosa en el teorema A.5

Teorema A.5. Si f es una función acotada con un número finito de discontinuidades, entonces para todo  > 0
existe un δ > 0 tal que para toda suma integral, S, de f y partición ∆ de [a, b] con diam(∆) < δ se verifica que
Z b
|S − f (x) dx| < .
a

A.3. Cambio de variable


Muchas veces, se recurre a un cambio de variable, u = g(x). Entonces, la integral resultante h(u)du es mucho
R
más sencilla y resulta una de integrales inmediatas.

139
APÉNDICE A. INTRODUCCIÓN A LAS INTEGRALES

x
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12

c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12

Figura A.5: La suma del área de los rectángulos sombreados es una suma integral para la partición
∆ = {x0 , x1 , x2 , . . . , xN } y la función f .

Pasos para la integración por sustitución o cambio de variable:


1. Elección inteligente del cambio de variable u = g(x).
2. Utilizar u = g(x) y x = g −1 (u) para dejar el integrando en función de u.
3. Diferenciar el cambio de variable, con lo que du = g 0 (x)dx, pues la integral final se va a realizar con respecto
a la nueva variable u:
1
dx = 0 du
g (x)
4. Para dar la solución en términos de x, deshacer el cambio al finalizar la integración: no olvidemos la
sustitución u = g(x).
Z
Ejemplo A.12. Calcular (5 − 2x)3 dx.
Llamamos por la variable u a lo que está elevado al cubo. Ası́, u = 5−2x y du = −2dx. Despejando dx = du/(−2).
Sustituyendo en la integral,
1 u4
Z Z
du
(5 − 2x) dx =
3
u3 =− +C
−2 2 4
1
Z
y sustituyendo u por la expresión que sustituı́a, tenemos que (5 − x)3 dx = − (5 − 2x)4 + C.
8

Z
Ejemplo A.13. Calcular x(x2 + 1)7 dx
Denominamos u a la expresión que está elevada a la séptima, u = x2 + 1 y du = 2x dx. Despejando x dx = du/2.
Tenemos que
1 u8
Z Z Z
du
x(x2 + 1)7 dx = (x2 + 1)7 x dx = u7 = +C
2 2 8
x2 + 1
Z
sustituyendo u por la expresión que la definı́a, tenemos que x(x2 + 1)7 dx = + C.
16

A.4. La integral como media


Dada una magnitud económica que es función del tiempo, f (t) (por ejemplo, la cotización de una acción en
la bolsa) deseamos medir el valor medio de la acción en un lapso o intervalo de tiempo [0, T ]. La primera idea
para aproximar dicho valor es tomar una partición ∆ = {t0 , t1 , . . . , tN } con tj = jT /N del intervalo [0, T ] y en

140
Estadı́stica

cada subintervalo [ti−1 , ti ] medimos el valor de la acción en un momento arbitrario ci . La aproximación al valor
N
1 X T
medio viene dada por la media de los valores de la acción en dichos momentos, f (ci ), pero como es la
N N
i=1
distancia entre dos puntos consecutivos de la partición tenemos que

N N N
1 X 1 X T 1 X
f (ci ) = f (ci ) = f (ci )(ti − ti−1 )
N T N T
i=1 i=1 i=1

Por consiguiente, dicha aproximación al valor medio es una suma integral de f para la partición ∆ dividida por
T . La aproximación obtenida mejora conforme aumentemos el número de puntos de la partición ∆. Por tanto, el
valor medio en el lı́mite es la integral definida en [0, T ] dividida por la longitud del intervalo, T .
Por todas las consideraciones anteriores se define el valor medio de un función en el intervalo [a, b] como

b
1
Z
hf i = f (x) dx.
b−a a

Ejemplo A.14. Calcular el valor medio de la función f (x) = 1 − |x| en el intervalo [−1, 1].
Z 1
En el ejemplo A.9 vimos que (1 − |x|) dx = 1. Por tanto,
−1

1
1 1
Z
hf i = (1 − |x|) dx = .
1 − (−1) −1
2

Teorema A.6. Si f es continua en el intervalo [a, b], existe c ∈ (a, b) tal que hf i = f (c) o lo que es equivalente
Z b
f (x) dx = f (c)(b − a)
a

Demostración. La función f continua en [a, b] alcanza su máximo y su mı́nimo por el teorema de Weierstrass. Sean
cm y cM los puntos donde se alcanzan el mı́nimo y el máximo respectivamente. Por tanto, f (cm ) ≤ f (x) ≤ f (cM )
para todo x en el intervalo [a, b]. Utilizando la propiedad de monotonı́a de la integración (teorema A.4 apartado
5) se tiene que
Z b Z b Z b
f (cm )(b − a) = f (cm ) dx ≤ f (x) dx ≤ f (cM ) dx = f (cM )(b − a).
a a a

Dividiendo por b − a la anterior desigualdad se obtiene que


b
1
Z
f (cm ) ≤ f (x) dx ≤ f (cM ).
b−a a

b
1
Z
Por el teorema del valor intermedio al ser f continua, existe c tal que f (c) = f (x) dx.
b−a a

A.5. Teorema fundamental del cálculo integral


El siguiente resultado es conocido como teorema fundamental del cálculo y muestra la intima conexión que
existe entre las integrales indefinidas y las definidas.
Z x
Teorema A.7. Si f es continua en [a, b], la función A(x) = f (t) dt es derivable en [a, b] y A0 (x) = f (x)
a

141
APÉNDICE A. INTRODUCCIÓN A LAS INTEGRALES

Demostración. La derivada de la función A se define por


x+h x x+h
A(x + h) − A(x) 1 1
Z Z  Z
A0 (x) = lı́m = lı́m f (t) dt − f (t) dt = lı́m f (t) dt
h→0 h h→0 h
a a
h→0 h x

x+h
1
Z
Por el teorema A.6 para cada h existe un ch entre x y x + h tal que f (t) dt = f (ch ). Cuando h tiende a
h x
cero, f (ch ) tiende a f (x) por continuidad y, por tanto, A0 (x) = f (x).

y y

A ∆A A dA

x x
x x + dx x x + dx

Figura A.6: Interpretación geométrica del teorema fundamental del cálculo.

x
1
Z
Ejemplo A.15. Derivar la función F (x) = dt.
1
t
1
Por el teorema A.7 tenemos que F 0 (x) = .
x

x2 +1
1
Z
Ejemplo A.16. Derivar la función F (x) = dt.
x2
t+1
y
1 1
Z
Si llamamos G(y) = dt con el teorema A.7 sabemos que G0 (y) = .
0
t+1 y+1

x2 +1 x2 +1 0
1 1 1
Z Z Z
F (x) = dt = dt + dt
x2
t+1 0
t+1 x2
t+1
x2 +1 x2
1 1
Z Z
= dt − dt = G(x2 + 1) − G(x2 ).
0
t+1 0
t+1

Derivamos la función F usando la regla de la cadena


d d d 1 1 −2x
 
[F (x)] = [G(x2 + 1)] − [G(x2 )] = G0 (x2 + 1)2x − G0 (x2 )2x = 2x − 2 =
dx dx dx x2 + 1 x x2 (x2 + 1)

Regla de Barrow
Una consecuencia del teorema fundamental del cálculo integral es la conocida regla de Barrow. Si F (x) es una
primitiva de una función continua f (x), se tiene que existe una constante C tal que
Z x
F (x) = f (t) dt + C
a

142
Estadı́stica

y, finalmente, Z b  Z a  Z b
F (b) − F (a) = f (t) dt + C − f (t) dt + C = f (t) dt.
a a a
Dicha fórmula sigue siendo correcta aunque f no sea continua en todos sus puntos.

Teorema A.8. Si F es una primitiva de f entonces:


Z b
f (x) dx = [F (x)]ba = F (b) − F (a)
a

Z 3
Ejemplo A.17. Calcular (x − 2)4 dx.
1
(x − 2)5
Como es una primitiva de (x − 2)4 , tenemos que
5
3 3
(x − 2)5 (3 − 2)5 (1 − 2)5 1 2
Z 
−1
(x − 2)4 dx = = − = − =
1
5 1
5 5 5 5 5


Ejemplo A.18. Calcula el valor medio de f (x) = 2x + 1 en el intervalo [0, 1].
 1 3/2 1
1
Z 1 Z 1
1 1/2 √ (x + )
hf i = (2x + 1)1/2 = 21/2 (x + ) dx = 2 2  =
1−0 0 0
2 3/2
0
√ (3/2)3/2 (1/2)3/2 √ 1
 
= 2 − = 3− .
3/2 3/2 3

A.6. Ejercicios propuestos.


Ejercicio A.1. Calcula las siguientes integrales:
Z 1 Z 1

a. x dx d. x2 + x + 3 dx
0 −1
1 2
1
Z

Z
b. 3x + 3
x dx e. x3 + √ + x3 + 1 dx
0 1 x
2 2
x4
Z Z

c. √ + 9x2 + ex dx f. x + 2x + x−3 dx
0 2 1

143
APÉNDICE A. INTRODUCCIÓN A LAS INTEGRALES

144
Apéndice B

Técnicas de recuento.

El análisis combinatorio estudia las diversas configuraciones de las agrupaciones con los elementos de un
conjunto dependiendo de si en estas configuraciones se pueden repetir elementos o si el orden de los elementos es
determinante. La forma más sencilla y gráfica de contar es el diagrama de árbol, pero tiene el inconveniente de
que sólo es posible su utilización en el caso de que los resultados posibles sean pocos. Otra forma de contar es el
análisis combinatorio del experimento, cuyas posibilidades son permutaciones, variaciones y combinaciones.

B.1. Diagrama de árbol


(Se corresponde con la sección 8.1 del libro Haeussler (2008))

Un diagrama de árbol es un gráfico en el que están reflejados todos los posibles resultados de un experimento.
Es una técnica muy sencilla y clara, pero sólo es posible su aplicación cuando el número de resultados posibles es
pequeño.

Ejercicio B.1. ¿Qué probabilidad tiene una pareja de tener al menos dos varones en un embarazo de trillizos?

Solución: Según se observa en el árbol de la figura B.1 hay 8 posibilidades distintas:

VVV, VVH,VHV,VHH,HVV,HVH,HHV,HHH

Padres

V H

V H V H

V H V H V H V H

Figura B.1: Diagrama de árbol del ejemplo B.1.

B.2. Variaciones y permutaciones


(Se corresponde con la sección 8.2 del libro Haeussler (2008))

Son agrupaciones que se forman seleccionando algunos (no todos) los elementos del conjunto y cada agrupación
se distingue de otra según el orden de los elementos en la agrupación. Imaginemos que disponemos de n elementos
y queremos hacer agrupaciones de m elementos,.

145
APÉNDICE B. TÉCNICAS DE RECUENTO.

Si permitimos repeticiones de alguno o de todos los m elementos, las agrupaciones diferentes se cuentan como
variaciones con repetición:

V Rn,m = nm
Si exigimos que las agrupaciones se formen con m elementos diferentes, las agrupaciones diferentes se cuentan
como variaciones sin repetición con m ≤ n:

Vn,m = n · (n − 1) · (n − 2) · · · (n − m + 1)
En el libro de denotan por n Pm .

Ejercicio B.2. ¿Cuántos números de tres cifras se pueden formar con las nueve cifras significativas del sistema
decimal? ¿Cuántos de estos números de tres cifras tienen todas las cifras diferentes?

Solución: Para la primera cuestión V R9,3 = 93 = 729 y a la segunda cuestión V9,3 = 9 · 8 · 7

Ejercicio B.3. En una encuesta de una lista de 10 partidos polı́ticos se pide hacer una lista de 4 por orden de
preferencia. ¿Cuántas posibles respuestas se pueden dar?

Solución: Como importa el orden y no se pueden repetir:

V10,4 = 10 · 9 · 8 · 7 = 5040

Por su especial interés se denominan permutaciones a las variaciones sin repeticiones en las que seleccionan
todos los elementos del conjunto en un determinado orden. El número de agrupaciones distintas para un conjunto
con n elementos es

Pn = n! = Vn,n = 1 · 2 · 3 · · · (n − 1) · · · n
Al sı́mbolo de exclamación le denominaremos factorial. Leemos n! como “el factorial de n”

Ejercicio B.4. ¿Cuántas palabras distintas, con o sin significado, se pueden formar con las letras de la palabra
DISCO?

Solución: P5 = 5! = 5 · 4 · 3 · 2 · 1 = 120

Por definición consideraremos 0! = 1. Con la definición de los factoriales se tiene que Vn,m = n!/(n − m)!

B.3. Combinaciones
(Se corresponde con la sección 8.2 del libro Haeussler (2008))

Son agrupaciones que se forman seleccionando algunos (no todos) elementos del conjunto total, de manera que
dos agrupaciones son iguales si contienen los mismos elementos, aunque sea en diferente orden. Si consideramos
un conjunto de n elementos, el número de agrupaciones diferentes con m elementos son:

Vn,m n!
Cn,m = =
Pm m!(n − m)!
Al número Cn,m también se denota por .
n

m

Ejercicio B.5. Imagina que 10 personas acuden a una entrevista de trabajo para cubrir 3 puestos de adminis-
trativo. ¿De cuantas formas diferentes se pueden contratar a 3 personas?

146
Estadı́stica

V10,3
Solución: C10,3 = P3
= 10·9·8
3·2·1
= 120

Teorema B.1 (Propiedades básicas de los números combinatorios). Se verifican las siguientes propiedades
1. Cn,m + Cn,m+1 = Cn+1,m+1
Pn
2. j=1
Cn,j = Cn,0 + Cn,1 + Cn,2 + · · · + Cn,n−1 + Cn,n = 22 n

B.4. Resumen del análisis combinatorio.


obteniendo el número de agrupaciones distintas en función del Cuadro B.1.

¿Importa el orden de los elementos?

(SI) (NO)
¿Intervienen todos Combinaciones
los elementos?

(SI) (NO)
Permutaciones ¿Se pueden repetir?

(SI) (NO)
Variaciones Variaciones
con repetición sin repetición

Cuadro B.1: Cuadro de ayuda para el análisis combinatorio

B.5. Ejercicios propuestos


Ejercicio B.6. Hallar el número de formas en que un jurado puede otorgar el primer, segundo y tercer premio
en un concurso de 18 participantes. (Sol.: 4896)

Ejercicio B.7. Un grupo de debate está formado por 3 chicos y 2 chicas. Hallar el número de formas que en que
pueden sentarse en una fila. (Sol.: 120)

Ejercicio B.8. Una bolsa contiene cinco bolas rojas y seis bolas blancas.
a. Hallar el número de formas en que se pueden sacar cuatro bolas de la bolsa.
b. Hallar el número de formas en que se pueden sacar cuatro bolas rojas y dos blancas.

Ejercicio B.9. ¿De cuántas maneras pueden sentarse 10 personas en un banco si hay 4 sitios disponibles? (Sol.:
5040)

Ejercicio B.10. ¿Cuántos números de 4 dı́gitos se pueden formar con las cifras 1, 2, . . . , 9
a. Permitiendo repeticiones. (Sol.: 6561)
b. Sin repeticiones. (Sol.: 3024)
c. Si el último dı́gito ha de ser 1 y no se permiten repeticiones (Sol.: 336)

147
APÉNDICE B. TÉCNICAS DE RECUENTO.

Ejercicio B.11. En un grupo de 10 amigos, ¿de cuántas maneras diferentes pueden distribuirse sus fechas de
cumpleaños durante el año?

Ejercicio B.12. Un alumno tiene que elegir 7 de las 10 preguntas de un examen. ¿De cuántas maneras puede
elegirlas? ¿Y si las 4 primeras son obligatorias?(Sol.: 120; 20)

Ejercicio B.13. Una lı́nea de ferrocarril tiene 25 estaciones. ¿Cuántos billetes diferentes habrá que imprimir si
cada billete lleva impresas las estaciones de origen y destino?.(Sol.: 600)

148
Apéndice C

Formulario

Estadı́stica descriptiva
Media Desviación
v tı́pica
n
X uXn

(xi − x)2
u
xi u
x1 + x2 + ... + xn
t
i=1 i=1
X= = S=
n n n−1

Posición percentil Percentil al p %


p
(n − 1) +1 (1 − γ)x[k] + γx[k+1]
100

Rango Rango intercuartı́lico


Rango = M áximo − M ínimo R.I.C. = Q3 − Q1 = P75 − P25

Valores atı́picos Aritmética de variables normales


[Q1 − 1,5 · R.I.C., Q3 + 1,5 · R.I.C.] X ∼ N (µ, σ) ⇒ Z = X−µσ
∼ N (0, 1)
Z ∼ N (0, 1) ⇒ X = σ · Z + µ ∼ N (µ, σ)

Covarianza Coeficiente de correlación


n Pn
1 X (xi yi ) − n x y SXY
SXY = (xi − x)(yi − y) = i=1
r=
n−1 n−1 SX SY
i=1
Recta de regresión Coeficientes recta
s
yb = b0 + b1 x b1 = SsXY
2 = r sxy , b0 = y − b1 x
x

Frecuencia condicionada
fi,j
fi|j =
f·,j

Probabilidad
Variaciones con repetición Variaciones sin repetición m ≤ n
V Rn,m = nm Vn,m = n(n − 1)(n − 2) · (n − m + 1)
Permutaciones Combinaciones
V
Pn = n! Cn,m = Pn,m
m
Probabilidad de la ∪ Probabilidad condicionada
P (A ∩ B)
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) P (B|A) =
P (A)

149
APÉNDICE C. FORMULARIO

Variable aleatoria discreta


Valor esperado Varianza
µ = E(X) = x xP (x) σ 2 = E((X − µ)2 ) = x (x − µ)2 P (x) = E(X 2 ) − µ2
P P
Distribución binomial Distribución hipergeométrica
P (X = k) = nk pk (1 − p)n−k = pk (1 − p)n−k ,
 n!
k!(n−k)!
N −E
E
 
k n−k E(N −E)
µ = np, σ = np(1 − p)
2
P (X = k) = N
 ,µ= nE
N
, σ2 = N 2 (N −1)
n
Distribución de Poisson Aproximación binomial-Poisson
e−λ λk
P (X = k) = ,
k!
e−np · (np)k
µ = λ, σ 2 = λ P (X = k) =
k!

Variable aleatoria continua


Valor esperado Varianza
µ = E(X) = x · f (x) dx σ 2 = E((X − µ)2 ) = E(X 2 ) − µ2
R
Función densidad y distribución acumulada Un(a,b) Valor esperado y Varianza Un(a,b)
(
1  0, x ≤ a
, si a ≤ x ≤ b x−a a+b 2 (b − a)2

f (x) = b−a F (x) = , si a < x < b µ = E(X) = ,σ =
0, en caso contrario. b−a
 1,
 2 12
x≥b
Función densidad Distribución normal X ∼ N (µ, σ) Tipificación distribución normal
(x − µ)2
1 − X −µ
f (x) = √ e 2σ 2 Z=
2πσ 2 σ
Función densidad Exp(λ). Valor Esperado. Varianza Distribución acumulada Exp(λ).
f (t) = λe−λt , t > 0,
µ = E(T ) = 1/λ, σ 2 = V ar(T ) = 1/λ2 F (t) = 1 − e−λt , t > 0,

150
Apéndice D

Tablas estadı́sticas

151
Tabla de probabilidades de la distribución N(0,1)
[P (Z < z)]
Apéndice E

Exámenes finales de cursos


anteriores

E.1. Curso académico 18-19


E.1.1. Examen convocatoria junio 2019.
Problema E.1. Todos los alumnos: 1,5 puntos. Una empresa textil quiere analizar las ventas (en miles de euros)
de los últimos 12 meses:
Mes Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Ventas 20,5 46,5 36,0 41,0 52,0 50,0 55,5 10,0 25,5 52,5 88,5 90,5

1. Dibuja el diagrama de cajas de la variable Ventas e interpreta los resultados.

2. Calcula los percentiles 20 y 95 de la variable Ventas e interprétalos.

Problema E.2. Todos los alumnos: 1,5 puntos En el proceso de fabricación del último modelo de móviles
NEWMOV, se ha detectado que el 1 % presentan algún tipo de defecto y son devueltos. Realiza los cálculos
con 4 cifras decimales.
Si se dan las condiciones necesarias para realizar una aproximación de una distribución a otra,
utilizadla.

1. Si se acaba de enviar un pedido de 20 móviles a una empresa, ¿cuál es la probabilidad de que tengan que
devolver más de 2 móviles?

2. Si ayer se envió un pedido de 500 móviles, ¿cuál es la probabilidad de que tengan que devolver al menos 2
móviles?

Problema E.3. Todos los alumnos: 2 puntos Las ventas semanales de una librerı́a siguen una distribución Normal
de media 3000 euros y una desviación tı́pica de 400 euros.

1. ¿Cuál es la probabilidad de que la cifra de ventas de una semana supere los 4000 euros?

2. ¿Cuál es la probabilidad de obtener una venta semanal entre 2000 y 3000 euros?

3. ¿Cuál es el valor de la venta semanal (euros) que solo es superado por el 25 % de las ventas semanales?

Problema E.4. (Alumnos sin evaluación continua: modelo A,1,5 puntos)

153
En la siguiente tabla se muestran los datos de 1508 matrileños donde podemos ver dos variables: X= nivel
educativo e Y=situación laboral
Empleado Parado Inactivo
Primaria 95 6 315
Indicar cuál es la frecuencia de las personas paradas
Secundaria 393 28 257
Post-secundaria 317 8 89
Cuestión 1.1

sabiendo que han estudiado secundaria.

a) 28
b) 28/678
c) 28/42
d) Ninguna de las anteriores

Sean las variables estadı́sticas bidimensionales (X, Y ) donde X=PIB per cápita (en miles de dólares) e
Y=Tasa natural de crecimiento demográfico de 162 paı́ses del mundo. Conocemos los siguientes datos:
Cuestión 1.2

SXY = −52,46, X = 6,04, Y = 17,82, SX 2


= 71,97, SY2 = 745,97. Indicar cuál es el coeficiente de correlación.

a) −0,23
b) −0,73
c) 22,22
d) Ninguna de las anteriores.

En un safari se sabe que el número medio de leones que se pueden ver en un dı́a es de 5 leones. Calcula la
Cuestión 1.3

probabilidad de que en un dı́a en el safari se puedan ver como mucho 3 leones.

a) 0.27
b) 0.74
c) 0.44
d) Ninguna de las anteriores.

Los voltajes que se asumen para cierto aparato eléctrico varı́an entre 6 voltios y 12 voltios. Se sabe que estos
voltajes se distribuyen de forma uniforme. Calcular la probabilidad de que el nivel de voltaje se encuentre
Cuestión 1.4

entre 6.5 y 8 voltios.

a) 0.41
b) 0.25
c) 0.12
d) Ninguna de las anteriores.
El 42 % de la población activa de cierto paı́s está formada por mujeres. Se sabe que un 24 % de las mujeres
y un 16 % de los hombres están en el paro. ¿Cuál es la probabilidad de que una persona elegida al azar de la
Cuestión 1.5

población activa en este paı́s esté en el paro?

a) 0,19
b) 0,4
c) 0,58
d) Ninguna de las anteriores.

A partir del enunciado de la cuestión anterior, supongamos ahora que se elige un adulto al azar para rellenar
Cuestión 1.6

un formulario y se observa que no tiene trabajo. ¿Cuál es la probabilidad de que la persona elegida sea mujer?

a) 0,1
b) 0,24
c) 0,53
d) Ninguna de las anteriores.

Un dado simétrico tiene tres caras iguales con una puntuación de 6 en cada cara, en otras dos de las caras
la puntuación es de 5 en cada una y en la cara restante la puntuación es de 1. La función de probabilidad
X P (X = x)
1 1/6
asociada es: ¿Cuál es el valor esperado para esta variable?
Cuestión 1.7

5 2/6
6 3/6

a) 3,5
b) 4,83
c) 5
d) Ninguna de las anteriores.
Cuestión 1.8

Las calificaciones de una determinada asignatura tomando valores: suspenso, aprobado, notable, etc...es una
variable · · ·
a) variable aleatoria cuantitativa continua
b) variable aleatoria cualitativa ordinal
c) variable aleatoria cualitativa nominal
d) Ninguna de las anteriores.

Problema E.5. (Alumnos sin evaluación continua: modelo B 1,5 puntos)


Cuestión 1.1

Las calificaciones de una determinada asignatura tomando valores: suspenso, aprobado, notable, etc...es una
variable · · ·
a) variable aleatoria cuantitativa continua
b) variable aleatoria cualitativa nominal
c) variable aleatoria cualitativa ordinal
d) Ninguna de las anteriores.

Un dado simétrico tiene tres caras iguales con una puntuación de 6 en cada cara, en otras dos de las caras
la puntuación es de 5 en cada una y en la cara restante la puntuación es de 1. La función de probabilidad
X P (X = x)
1 1/6
asociada es: ¿Cuál es el valor esperado para esta variable?
Cuestión 1.2

5 2/6
6 3/6

a) 3,5
b) 5
c) 4,83
d) Ninguna de las anteriores.

El 42 % de la población activa de cierto paı́s está formada por mujeres. Se sabe que un 24 % de las mujeres
y un 16 % de los hombres están en el paro. ¿Cuál es la probabilidad de que una persona elegida al azar de la
Cuestión 1.3

población activa en este paı́s esté en el paro?

a) 0,4
b) 0,19
c) 0,58
d) Ninguna de las anteriores.

A partir del enunciado de la cuestión anterior, supongamos ahora que se elige un adulto al azar para rellenar
Cuestión 1.4

un formulario y se observa que no tiene trabajo. ¿Cuál es la probabilidad de que la persona elegida sea mujer?

a) 0,1
b) 0,53
c) 0,24
d) Ninguna de las anteriores.
Los voltajes que se asumen para cierto aparato eléctrico varı́an entre 6 voltios y 12 voltios. Se sabe que estos
voltajes se distribuyen de forma uniforme. Calcular la probabilidad de que el nivel de voltaje se encuentre
Cuestión 1.5

entre 6.5 y 8 voltios.

a) 0.25
b) 0.41
c) 0.12
d) Ninguna de las anteriores.

En un safari se sabe que el número medio de leones que se pueden ver en un dı́a es de 5 leones. Calcula la
Cuestión 1.6

probabilidad de que en un dı́a en el safari se puedan ver como mucho 3 leones.

a) 0.74
b) 0.44
c) 0.27
d) Ninguna de las anteriores.

Sean las variables estadı́sticas bidimensionales (X, Y ) donde X=PIB per cápita (en miles de dólares) e
Y=Tasa natural de crecimiento demográfico de 162 paı́ses del mundo. Conocemos los siguientes datos:
Cuestión 1.7

SXY = −52,46, X = 6,04, Y = 17,82, SX 2


= 71,97, SY2 = 745,97. Indicar cuál es el coeficiente de correlación.

a) −0,73
b) −0,23
c) 22,22
d) Ninguna de las anteriores.

En la siguiente tabla se muestran los datos de 1508 matrileños donde podemos ver dos variables: X= nivel
Empleado Parado Inactivo
Primaria 95 6 315
educativo e Y=situación laboral Indicar cuál es la
Secundaria 393 28 257
Post-secundaria 317 8 89
Cuestión 1.8

frecuencia de las personas paradas sabiendo que han estudiado secundaria.

a) 28/678
b) 28
c) 28/42
d) Ninguna de las anteriores

Problema E.6. (Alumnos sin evaluación continua); 1,75 PUNTOS El propietario de una librerı́a ha decidido
regalar un libro en Navidad a sus mejores clientes. Ha escogido 15 libros de cocina y 15 de viajes, todos del mismo
tamaño y los ha envuelto con un mismo papel, de modo que no puede distinguir de qué tipo es cada libro. Si lleva
10 libros regalados,
1. ¿Cuál es la probabilidad de que la mitad sean de viajes?
2. ¿Cuál es la probabilidad de que haya regalado entre 3 y 5 libros de viajes?

Problema E.7. (Alumnos sin evaluación continua); 1.75 PUNTOS El tiempo de revisión del motor de un avión
sigue una distribución exponencial de media 25 minutos.

1. ¿Cuál es la probabilidad de que el tiempo de revisión sea menor a 10 minutos?

2. ¿Cuál es la probabilidad de que el tiempo de revisión esté entre 20 y 30 minutos?

3. ¿Cuál es el tiempo de revisión de un motor solo superado por el 10 % de los tiempos de revisión de motores?

E.1.2. Examen convocatoria julio 2019.


Problema E.8. Todos los alumnos: 1,5 puntos. Se sabe que el 65 % de los accidentes de tráfico que se producen
durante la noche de los sábados se deben a la ingesta excesiva de alcohol, el 25 % se deben a la imprudencia del
conductor y el resto a otras causas (Fallo mecánico,...etc). En estos accidentes, el resultado es nefasto el 30 % de
las veces en el primer caso, el 20 % en el segundo y el 5 % en el tercero.

1. Calcular la probabilidad de que uno de estos accidentes no tenga resultado nefasto. (0,75 puntos)

2. Si se produce una accidente sin resultado nefasto, calcular la probabilidad de que la causa de dicho accidente
sea la ingesta excesiva de alcohol. (0,75 puntos)

Problema E.9. Todos los alumnos: 1,5 puntos Una central telefónica recibe una media de 2 llamadas por minuto.
Si la centralita tiene una capacidad para atender a lo sumo 4 llamadas por minuto.

1. ¿Cuál es la probabilidad de que en un minuto determinado no sea posible dar lı́nea a todos los clientes?
(0,75 puntos)

2. ¿Cuál es la probabilidad de que en un minuto determinado sea posible darle lı́nea a lo sumo a un cliente?(0,75
puntos)

Problema E.10. Todos los alumnos: 2 puntos Varios test de inteligencia dieron una puntuación que sigue una
ley normal con media 100 y desviación tı́pica 15.

1. Determinar el porcentaje de población que obtendrı́a un coeficiente entre 95 y 110. (0,75 puntos)

2. Determinar el porcentaje de población que obtendrı́a un coeficiente mı́nimo de 97. (0,5 puntos)

3. ¿Qué coeficiente mı́nimo de inteligencia tiene el 5 % de la población cuyo coeficiente de inteligencia es el


más alto?.

Problema E.11. (Alumnos sin evaluación continua: modelo A 1,5 puntos)


Cuestión 2.1

Las ventas mensuales (en euros) de un determinado producto es una variable:


RESPUESTA DEL TEST:
a) variable aleatoria cualitativa nominal
b) variable aleatoria cualitativa ordinal
c) variable aleatoria cuantitativa continua
d) Ninguna de las anteriores.
El gerente de una empresa quiere saber si la distribución de su marca es igual en las 4 grandes áreas de
distribución del producto: NE, NO, SE, SO. En la siguiente tabla se muestran los resultados de una encuesta
realizada a 800 personas donde podemos ver dos variables: X= si el encuestado compra o no su marca e Y=
área del paı́s de la persona encuestada.

NE NO SE SO
Compra la marca 80 110 85 95
No compra la marca 120 90 115 105
Cuestión 2.2

Indicad cuál es la frecuencia de las personas que compran la marca sabiendo que son del SE.

a) 85
b) 0,43
c) 0,23
d) Ninguna de las anteriores.
Cuestión 2.3

El percentil 35 de la muestra: 15, 10, 35, 30, 50, 40, 25, 20, 45 es:

a) 3,8
b) 24
c) 38
d) Ninguna de las anteriores.

En una muestra de familias se han analizado las variables renta anual (X) y ahorro anual (Y), medidas
ambas en miles de euros. Conocemos los siguientes datos: rXY = 0, 85, X = 22, Y = 2,19, SX 2
= 0,93,
SY = 0,15. Indicad cuál es la recta de regresión que deberı́amos utilizar para predecir el ahorro anual de una
2
Cuestión 2.4

familia en función de su renta anual:

a) Y = −5, 51 + 0, 35X
b) X = −5, 51 + 0, 35Y
c) Y = 0, 35 − 5, 51X
d) Ninguna de las anteriores.

La demanda de un cierto item es una variable aleatoria que se distribuye como sigue:
Cuestión 2.5

Nº unidades demandadas 1 2 3 4
Calcula la varianza de la variable.
Probabilidad 0.25 0.45 0.15 0.15
a) 3.6
b) 0.96
c) 2.2
d) Ninguna de las anteriores.
Una tienda de música tiene en el almacén 20 guitarras en stock, de las cuales, 3 son defectuosas. Un cliente
Cuestión 2.6

compra 5 guitarras, calcula la probabilidad de que 2 de esas guitarras sean defectuosas.

a) 0.34
b) 0.23
c) 0.13
d) Ninguna de las anteriores.

Un grupo musical recibe una oferta de una promotora musical para un festival con las siguientes condiciones,
el grupo recibirá una cantidad fija de 50000? más 6? por entrada vendida. Se sabe que el número de entradas
vendidas se puede representar por medio de una variable aleatoria de media 10000 y desviación tı́pica de
Cuestión 2.7

2500. Calcula la desviación tı́pica de la cantidad total de dinero que recibirá el grupo.

a) 15000
b) 110000
c) 122
d) Ninguna de las anteriores.

Sea X la cantidad de tiempo (en minutos) que un empleado de correos pasa con su cliente. Se sabe que el
tiempo tiene una distribución exponencial con una cantidad de tiempo promedio igual a cuatro minutos.
Cuestión 2.8

Calcula la probabilidad de que un empleado de correos pase entre cuatro y cinco minutos con un cliente
seleccionado al azar.
a) 0.71
b) 0.08
c) 0.63
d) Ninguna de las anteriores.

Problema E.12. (Alumnos sin evaluación continua: modelo B 1,5 puntos)

Una tienda de música tiene en el almacén 20 guitarras en stock, de las cuales, 3 son defectuosas. Un cliente
Cuestión 2.1

compra 5 guitarras, calcula la probabilidad de que 2 de esas guitarras sean defectuosas.

a) 0.13
b) 0.34
c) 0.23
d) Ninguna de las anteriores.
La demanda de un cierto item es una variable aleatoria que se distribuye como sigue:
Cuestión 2.2

Nº unidades demandadas 1 2 3 4
Calcula la varianza de la variable.
Probabilidad 0.25 0.45 0.15 0.15
a) 3.6
b) 2.2
c) 0.96
d) Ninguna de las anteriores.

Un grupo musical recibe una oferta de una promotora musical para un festival con las siguientes condiciones,
el grupo recibirá una cantidad fija de 50000? más 6? por entrada vendida. Se sabe que el número de entradas
vendidas se puede representar por medio de una variable aleatoria de media 10000 y desviación tı́pica de
Cuestión 2.3

2500. Calcula la desviación tı́pica de la cantidad total de dinero que recibirá el grupo.

a) 110000
b) 122
c) 15000
d) Ninguna de las anteriores.

Sea X la cantidad de tiempo (en minutos) que un empleado de correos pasa con su cliente. Se sabe que el
tiempo tiene una distribución exponencial con una cantidad de tiempo promedio igual a cuatro minutos.
Cuestión 2.4

Calcula la probabilidad de que un empleado de correos pase entre cuatro y cinco minutos con un cliente
seleccionado al azar.
a) 0.08
b) 0.71
c) 0.63
d) Ninguna de las anteriores.

El gerente de una empresa quiere saber si la distribución de su marca es igual en las 4 grandes áreas de
distribución del producto: NE, NO, SE, SO. En la siguiente tabla se muestran los resultados de una encuesta
realizada a 800 personas donde podemos ver dos variables: X= si el encuestado compra o no su marca e Y=
área del paı́s de la persona encuestada.

NE NO SE SO
Compra la marca 80 110 85 95
No compra la marca 120 90 115 105
Cuestión 2.5

Indicad cuál es la frecuencia de las personas que compran la marca sabiendo que son del SE.

a) 0,43
b) 85
c) 0,23
d) Ninguna de las anteriores.
Cuestión 2.6

Las ventas mensuales (en euros) de un determinado producto es una variable:


RESPUESTA DEL TEST:
a) variable aleatoria cuantitativa continua
b) variable aleatoria cualitativa nominal
c) variable aleatoria cualitativa ordinal
d) Ninguna de las anteriores.

En una muestra de familias se han analizado las variables renta anual (X) y ahorro anual (Y), medidas
ambas en miles de euros. Conocemos los siguientes datos: rXY = 0, 85, X = 22, Y = 2,19, SX 2
= 0,93,
SY = 0,15. Indicad cuál es la recta de regresión que deberı́amos utilizar para predecir el ahorro anual de una
2
Cuestión 2.7

familia en función de su renta anual:

a) X = −5, 51 + 0, 35Y
b) Y = 0, 35 − 5, 51X
c) Y = −5, 51 + 0, 35X
d) Ninguna de las anteriores.
Cuestión 2.8

El percentil 35 de la muestra: 15, 10, 35, 30, 50, 40, 25, 20, 45 es:

a) 3,8
b) 38
c) 24
d) Ninguna de las anteriores.

Problema E.13. (Alumnos sin evaluación continua); 1,75 PUNTOS Imaginemos que un 80 % de personas en el
mundo han visto el partido de la final del último mundial de futbol. Tras el evento, 4 amigos se reúnen a cenar:
1. ¿Cuál es la probabilidad de que 3 de ellos hayan visto el mundial? (0,75 puntos)
2. ¿Cuál es la probabilidad de que como mucho lo haya visto uno el mundial? (0,75 puntos)
3. Este problema, ¿se podrı́a aproximar por una Poisson? Razonar la respuesta. (0,25 puntos)
Problema E.14. (Alumnos sin evaluación continua); 1.75 PUNTOS Sabemos que un autobús pasa cada 10
minutos. Consideramos la variable del tiempo de espera en la parada del autobús como una distribución uniforme
en el intervalo [0, 10]. Calcular:
1. La probabilidad de esperar menos de 2 minutos. (0,5 puntos)
2. La probabilidad de esperar como mı́nimo 5 minutos. (0,5 puntos)
3. Calcular el tiempo máximo que hay que esperar en el 35 % de las ocaciones que menos tiempo se espera.
(0,75 puntos)

E.2. Curso académico 17-18


E.2.1. Examen convocatoria mayo 2018.
Problema E.15. (Todos los alumnos: 1,5 puntos.) En un centro comercial están analizando el número de clientes
que atienden cada dı́a. Haz un diagrama de caja con los 18 datos recogidos.
Clientes: 43, 44, 45, 49, 43, 44, 53, 44, 45, 45, 53, 52, 44, 45, 52, 45, 47, 51.
Dibuja el diagrama de cajas de esa distribución de datos y comenta que observas a partir de él.

Problema E.16. (Todos los alumnos: 1,5 puntos) Sabemos que el 90 % de los estudiantes que toman un curso
elemental de estadı́stica aprueban. ¿Cuál es la probabilidad de que al menos 3 estudiantes en una clase de 15
estudiantes no aprueben el curso?

Problema E.17. (Todos los alumnos: 2 puntos) En una empresa de marketing, el tiempo de vida de un ordenador
personal sigue una distribución normal de media 4 años y desviaciń tı́pica 0.5 años.

1. ¿Cuál es la probabilidad de que un ordenador se use menos de 2 años?

2. ¿Cuál es la probabilidad de que un ordenador se use entre 3 y 5 años?

3. ¿Cuál es el tiempo de uso que solo sobrepasan el 10 % de los ordenadores personales?

Problema E.18. (Alumnos sin evaluación continua: modelo A,1,5 puntos)

Una compa ñı́a de seguros estudió la relación existente entre el ingreso familiar X y el montante de los seguros
de vida de los padres Y. En base a una muestra de 18 familias se obtuvo la siguiente información (en miles
de euros):
X=35.90 SX =55.25
Cuestión 1.1

Y =66.40 SY =107.89 Calcular la recta de regresión:


Cov(X, Y ) = SXY =5426.4
a) Y = 1,78 + 2,50X
b) Y = 0,91 + 1,78X
c) Y = 2,50 + 1,78X
d) Ninguna de las anteriores
Cuestión 1.2

Supongamos que el consumo de yogures en una guarderı́a varı́a de forma uniforme entre 6 y 10 litros diarios.
¿Cuántos litros deberı́an beberse para que sobre como máximo un 10 %?.
a) 9,6 litros
b) 3,6 litros
c) 6,4 litros
d) Ninguna de las anteriores.
Cuestión 1.3

Sea Z ∼ N (0, 1) y sabemos que P (Z < a) = 0,242


a) 0.7
b) -0.7
c) No se puede calcular porque no está en la tabla
d) Ninguna de las anteriores.
X 0 1 2
Cuestión 1.4

Dada la siguiente tabla: Indicad el valor esperado y la varianza de esta v.a.


P (X) 0.25 0.50 0.25
discreta respectivamente.
a) 1 y 0,5
b) 0,5 y 1
c) 1 y 1,5
d) Ninguna de las anteriores.

En una asignatura de primer curso de una titulación universitaria, asisten a clase regularmente 210 alumnos
de los 300 que hay matriculados. Además se sabe que aprueban el 80 % de los alumnos que asisten a clase y el
Cuestión 1.5

15 % de los que no asisten. Calcular la probabilidad de que elegido al azar un alumno matriculado y resulta
que ha aprobado.
a) 0,56
b) 0,045
c) 0,605
d) Ninguna de las anteriores.
Cuestión 1.6

En una carrera de velocidad compiten diez atletas. ¿De cuántas maneras distintas podrı́a estar formado el
podio? (el podio lo forman el primer, el segundo y el tercer clasificado)
a) 720
b) 1000
c) 120
d) Ninguna de las anteriores.
Cuestión 1.7

Una variable aleatoria discreta contabiliza el número de coches que pasan a través de un cierto punto en una
carretera cada hora. ¿Qué tipo de distribución sigue?.
a) Binomial
b) Poisson
c) Hipergeométrica
d) Ninguna de las anteriores.
Cuestión 1.8

Una urna contiene 100 bolas de las que 60 son blancas y 40 negras. Se extraen 35 bolas al azar. Hallar la
probabilidad de que 30 sean negras.
a) 4,23 · 10−12
b) 6,01 · 10−22
c) 0,423
d) Ninguna de las anteriores.
Problema E.19. (Alumnos sin evaluación continua: modelo B)1,5 puntos
Cuestión 1.1

Una urna contiene 100 bolas de las que 60 son blancas y 40 negras. Se extraen 35 bolas al azar. Hallar la
probabilidad de que 30 sean negras.
a) 6,01 · 10−22
b) 0,423
c) 4,23 · 10−12
d) Ninguna de las anteriores.
Cuestión 1.2

Una variable aleatoria discreta contabiliza el número de coches que pasan a través de un cierto punto en una
carretera cada hora. ¿Qué tipo de distribución sigue?.
a) Poisson
b) Binomial
c) Hipergeométrica
d) Ninguna de las anteriores.
Cuestión 1.3

En una carrera de velocidad compiten diez atletas. ¿De cuántas maneras distintas podrı́a estar formado el
podio? (el podio lo forman el primer, el segundo y el tercer clasificado)
a) 1000
b) 120
c) 720
d) Ninguna de las anteriores.

En una asignatura de primer curso de una titulación universitaria, asisten a clase regularmente 210 alumnos
de los 300 que hay matriculados. Además se sabe que aprueban el 80 % de los alumnos que asisten a clase y el
Cuestión 1.4

15 % de los que no asisten. Calcular la probabilidad de que elegido al azar un alumno matriculado y resulta
que ha aprobado.
a) 0,605
b) 0,56
c) 0,045
d) Ninguna de las anteriores.
X 0 1 2
Cuestión 1.5

Dada la siguiente tabla: Indicad el valor esperado y la varianza de esta v.a.


P (X) 0.25 0.50 0.25
discreta respectivamente.
a) 0,5 y 1
b) 1 y 1,5
c) 1 y 0,5
d) Ninguna de las anteriores.

Una compañı́a de seguros estudió la relación existente entre el ingreso familiar X y el montante de los seguros
de vida de los padres Y. En base a una muestra de 18 familias se obtuvo la siguiente información (en miles
de euros):
X=35.90 SX =55.25
Cuestión 1.6

Y =66.40 SY =107.89 Calcular la recta de regresión:


Cov(X, Y ) = SXY =5426.4
a) Y = 2,50 + 1,78X
b) Y = 1,78 + 2,50X
c) Y = 0,91 + 1,78X
d) Ninguna de las anteriores
Cuestión 1.7

Supongamos que el consumo de yogures en una guarderı́a varı́a de forma uniforme entre 6 y 10 litros diarios.
¿Cuántos litros deberı́an beberse para que sobre como máximo un 10 %?.
a) 3,6 litros
b) 6,4 litros
c) 9,6 litros
d) Ninguna de las anteriores.
Cuestión 1.8

Sea Z ∼ N (0, 1) y sabemos que P (Z < a) = 0,242


a) 0.7
b) No se puede calcular porque no está en la tabla
c) -0.7
d) Ninguna de las anteriores.

Problema E.20. (Alumnos sin evaluación continua: 1,75 PUNTOS) Un servicio dedicado a la reparación de
electrodomésticos recibe por término medio 4 llamadas diarias. Determinar la probabilidad de que reciba un dı́a
más de 5 llamadas.

Problema E.21. (Alumnos sin evaluación continua: 1.75 PUNTOS) Se sabe que la duración (en horas) de la
baterı́a de un determinado modelo de cámaras digitales sigue una distribución exponencial de media 15 horas.
1. ¿Cuál es la probabilidad de que una baterı́a funcione más de 15 horas?
2. Calcular la duración mı́nima (que superan el / del) 50 % de las baterı́as de mayor duración.
E.2.2. Examen convocatoria julio 2018.
Problema E.22. (Todos los alumnos: 1,5 puntos) Para hacer un estudio sobre el uso que se hace de Internet
para comprar productos, se ha llevado a cabo una encuesta y se ha construido esta tabla, en la que X recoge la
edad de las personas encuestadas e Y el número de compras que realizan por internet durante 3 meses:

X/Y [5,15) [15,25) [25,35) Total


[18, 28) 3 4 3
[28, 38) 2 3 1
[38, 48) 3 2 1
[48, 58) 1 1 0
Total
Contesta a las siguientes preguntas:
1. Frecuencia marginal de las edades.
2. Frecuencias de Y en individuos con edades entre 38 y 48 años.
3. De los individuos que realizan al menos 25 compras al trimestre, ¿qué porcentaje corresponde a los menores
de 28 años?
4. ¿Qué porcentaje de individuos con edades entre 18 y 28 ha realizado al menos 15 compras en 3 meses?
Problema E.23. (Todos los alumnos: 1,5 puntos) Se sabe que el 10 % de los alumnos de una determinada
Universidad, no realizan la encuesta de valoración del profesorado. Si elige aleatoriamente una muestra de 20
alumnos de esta Universidad,
1. ¿cuál es la probabilidad de que al menos uno haya realizado la encuesta?
2. ¿cuál es la probabilidad de que todos hayan realizando la encuesta?.
Problema E.24. (Todos los alumnos: 2 puntos) Los salarios mensuales de los recién graduados que acceden a
su primer empleo se distribuyen según una ley normal de media 1500 euros y desviación tı́pica de 400 euros.
Calcular el porcentaje de graduados que cobran:
1. Menos de 600 euros al mes.
2. Entre 1000 y 1500 euros al mes.
Averiguar el salario mı́nimo del 20 % de los recién titulados que cobran más.
Problema E.25. (Alumnos sin evaluación continua: modelo A, 1,5 puntos)

En una distribución bivariante de X e Y el coeficiente de correlación vale 0.995. Interpretar su resultado.


Cuestión 2.1

Se ha pedido a una muestra de 50 analistas financieros que hagan una predicción de los beneficios por acción
Cuestión 2.2

que obtendrá la empresa de energı́as renovables SoleMı́o el próximo año. La predicción mı́nima es de 20
euros/acción y la máxima de 70. Los cuartiles son 30, 40 y 50. Señala cuál de estas afirmaciones es verdadera:
a) El 25 % predice unos beneficios superiores a 30 euros/acción o entre 30 y 70 euros/acción.
b) El 25 % predice unos beneficios inferiores a 50 euros/acción o entre 20 y 50 euros/acción.
c) El 25 % predice unos beneficios superiores a 50 euros/acción o entre 50 y 70 euros/acción
d) Ninguna de las anteriores.
Cuestión 2.3

En la edición de unos libros de texto, se detectó que el 2 % eran defectuosos. Si se envió un pedido de 10000
libros a unos almacenes, hallar el número esperado y desviación tı́pica de libros defectuosos respectivamente.
a) 200, 196
b) 200, 14
c) 20000, 1960000
d) Ninguna de las anteriores.
Cuestión 2.4

Si un banco recibe en promedio 10 cheques por hora, ¿cuál es la probabilidad de que lleguen como máximo
2 en una hora?
a) 4,99 · 10−4
b) 2,27 · 10−3
c) 2,77 · 10−3
d) Ninguna de las anteriores.

Supongamos que el tiempo de respuesta de una terminal conectada en lı́nea es una v.a. X con distribución
Cuestión 2.5

exponencial con promedio igual a 5 segundos. Calcular la probabilidad de que el tiempo de respuesta sea
mayor de 10 segundos
a) 0,865
b) 0,135
c) 1,93 · 10−22
d) Ninguna de las anteriores.
Cuestión 2.6

En una Administración se utilizan 5 sı́mbolos para clasificar los expedientes, de manera que los 2 primeros son
letras y los 3 últimos son números. Suponiendo que hay 25 letras, ¿cuántos expendientes podrán clasificar?
a) 53130
b) 300
c) 625000
d) Ninguna de las anteriores.

Se sabe que en un hospital determinado llegan pacientes a la sala de urgencias a razón de 5 cada hora y se
Cuestión 2.7

desea calcular la probabilidad de que lleguen exactamente 5 personas en 1 hora. Para realizar los cálculos,
necesitamos saber que distribución sigue la variable considerada:
a) Exponencial
b) Poisson
c) Hipergeométrica
d) Ninguna de las anteriores.
En un grupo de 200 propietarios de automóviles, 27 tienen solo un Mazda, 71 tienen solo un Toyota, 7 ambas
Cuestión 2.8

marcas y los restantaes otras marcas. Se desea entrevistar a un propietario elegido aleatoriamente de entre
los 200. Estima la probabilidad de que el entrevistado posea un Mazda o un Toyota.
a) 0,56
b) 0,525
c) 0,49
d) Ninguna de las anteriores.

Problema E.26. (Alumnos sin evaluación continua: modelo B, 1,5 puntos)


Cuestión 2.1

En una Administración se utilizan 5 sı́mbolos para clasificar los expedientes, de manera que los 2 primeros son
letras y los 3 últimos son números. Suponiendo que hay 25 letras, ¿cuántos expendientes podrán clasificar?
a) 300
b) 2300
c) 53130
d) Ninguna de las anteriores.

Se sabe que en un hospital determinado llegan pacientes a la sala de urgencias a razón de 5 cada hora y se
Cuestión 2.2

desea calcular la probabilidad de que lleguen exactamente 5 personas en 1 hora. Para realizar los cálculos,
necesitamos saber que distribución sigue la variable considerada:
a) Hipergeométrica
b) Poisson
c) Exponencial
d) Ninguna de las anteriores.
Cuestión 2.3

Si un banco recibe en promedio 10 cheques por hora, ¿cuál es la probabilidad de que lleguen como máximo
2 en una hora?
a) 2, 77 · 10−3
b) 2, 27 · 10−3
c) 4, 99 · 10−4
d) Ninguna de las anteriores.
Se ha pedido a una muestra de 50 analistas financieros que hagan una predicción de los beneficios por acción
Cuestión 2.4

que obtendrá la empresa de energı́as renovables SoleMı́o el próximo año. La predicción mı́nima es de 20
euros/acción y la máxima de 70. Los cuartiles son 30, 40 y 50. Señala cuál de estas afirmaciones es verdadera:
a) El 25 % predice unos beneficios superiores a 30 euros/acción o entre 30 y 70 euros/acción.
b) El 25 % predice unos beneficios inferiores a 50 euros/acción o entre 20 y 50 euros/acción.
c) El 25 % predice unos beneficios superiores a 50 euros/acción o entre 50 y 70 euros/acción.
d) Ninguna de las anteriores.

Supongamos que el tiempo de respuesta de una terminal conectada en lı́nea es una v.a. X con distribución
Cuestión 2.5

exponencial con promedio igual a 5 segundos. Calcular la probabilidad de que el tiempo de respuesta sea
mayor de 10 segundos
a) 0,135
b) 0,865
c) 1,93 · 10−22
d) Ninguna de las anteriores.

En un grupo de 200 propietarios de automóviles, 27 tienen solo un Mazda, 71 tienen solo un Toyota, 7 ambas
Cuestión 2.6

marcas y los restantaes otras marcas. Se desea entrevistar a un propietario elegido aleatoriamente de entre
los 200. Estima la probabilidad de que el entrevistado posea un Mazda o un Toyota.
a) 0,56
b) 0,525
c) 0,49
d) Ninguna de las anteriores.
Cuestión 2.7

En la edición de unos libros de texto, se detectó que el 2 % eran defectuosos. Si se envió un pedido de 10000
libros a unos almacenes, hallar el número esperado y desviación tı́pica de libros defectuosos.
a) 200, 196
b) 200, 14
c) 20000, 1960000
d) Ninguna de las anteriores.

En una distribución bivariante de X e Y el coeficiente de correlación vale 0.995. Interpretar su resultado.


Cuestión 2.8
Problema E.27. (Alumnos sin evaluación continua); 1,75 PUNTOS Una empresa dedicada a la investigación de
mercados ha realizado una encuesta a 100 clientes que acudieron a un centro comercial. De ellos, solo 26 contestaron
todas las preguntas. Si tomamos una muestra aleatoria de 10 de los encuestados, ¿cuál es la probabilidad de que
al menos 3 hayan contestado todas las preguntas?

Problema E.28. (Alumnos sin evaluación continua); 1.75 PUNTOS En una cierta fábrica se fabrican cada dı́a
una media de 40 mil metros de cable. Unos dı́as más, otros dı́as menos. Aunque el mı́nimo seguro que siempre
es 30 mil metros. La variable aleatoria que recoge el número de metros de cable fabricados en un dı́a siguen una
distribución uniforme continua.¿Qué porcentaje de dı́as se fabrican más de 34 mil metros de cable?.

También podría gustarte