Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Autor
Resumen 2
1. Introducción 2
1.1. ¿Qué es la Estadı́stica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Aplicaciones de la estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3. Tipos de estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.1. Estadı́stica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.2. Estadı́stica inferencial . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3. Repaso Corte 1 26
3.1. Examen 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.2. Examen 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.3. Examen 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4. Conceptos de probabilidad 31
4.1. Algunas relaciones de teorı́a de conjuntos . . . . . . . . . . . . . . . . . . . . 31
4.1.1. Unión (∪) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.1.2. Intersección (∩) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.1.3. Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.1.4. Eventos mutuamente excluyentes . . . . . . . . . . . . . . . . . . . . 33
4.2. Axiomas, interpretaciones y propiedades de la probabilidad . . . . . . . . . . 33
4.2.1. Axiomas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.2.2. Definición de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . 34
4.2.3. Propiedades de la probabilidad . . . . . . . . . . . . . . . . . . . . . 34
4.3. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.4. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.5. Ejercicios. Fuente: Douglas et al. (2012), Levin & Rubin (2004) . . . . . . . 37
5. Variable aleatoria 41
5.1. Función de Distribución Acumulada . . . . . . . . . . . . . . . . . . . . . . . 41
5.1.1. Caso discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.1.2. Caso continuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.2. Valor esperado y varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.3. Ejercicios. Fuente: Douglas et al. (2012), Levin & Rubin (2004) . . . . . . . 46
6. Repaso Corte 2 50
6.1. Examen 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
6.2. Examen 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7. Modelos de probabilidad 53
7.1. Distribución Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
7.1.1. Valor esperado y varianza de una v.a. binomial . . . . . . . . . . . . 53
7.2. Distribución Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
7.2.1. Valor esperado y varianza de una v.a. poisson . . . . . . . . . . . . . 55
7.3. Distribución Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
7.3.1. Valor esperado y varianza de una v.a. Uniforme . . . . . . . . . . . . 56
7.4. Distribución Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
7.4.1. Valor esperado y varianza de una v.a. Exponencial . . . . . . . . . . 57
7.5. Distribución Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.5.1. La función Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.5.2. Función Gamma incompleta . . . . . . . . . . . . . . . . . . . . . . . 58
7.5.3. Valor esperado y varianza de una v.a. Gamma . . . . . . . . . . . . . 58
7.6. Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.6.1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.6.2. Valor esperado y varianza . . . . . . . . . . . . . . . . . . . . . . . . 61
7.6.3. Calculo de probabilidades para una v.a. ∼ N (µ, σ) . . . . . . . . . . 62
7.6.4. Propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.6.5. Distribución Normal Estándar . . . . . . . . . . . . . . . . . . . . . . 63
7.6.6. Calculo del valor de X para una probabilidad conocida . . . . . . . . 64
7.7. Ejercicios. Fuente: Douglas et al. (2012), Levin & Rubin (2004) . . . . . . . 65
Bibliografı́a 67
Lista de Tablas
Introducción
El análisis de datos esta relacionado con la necesidad del procesamiento y análisis de datos,
mecanismos de recolección, presentación, y obtención de resultados que sirvan de apoyo en
la toma de decisiones (Douglas et al., 2012).
Control de calidad.
Contadurı́a.
Economı́a.
Los catadores de vino beben unas gotas para tomar una decisión con respecto a todo
el vino que se venderá.
Capı́tulo 2
2.1.2. Cuantitativa
Esta variable se registra en forma numérica.
Ordinal: Se considera que los datos se arreglan en determinado orden, pero no pueden
determinarse diferencias entre los valores de los datos o pudieran no tener sentido.
Ejemplo: durante una prueba gastronómica de 4 platillos, el C se clasificó número 1;
el B, número 2; el A, número 3, y el D, número 4; el estrato socioeconómico.
Razón: Tiene las caracterı́sticas del nivel de intervalo con un punto de inicio cero.
Las diferencias y las divisiones tienen significado en este nivel de medición. Ejemplo:
salario de los estudiantes de la nocturna.
Estadı́stico: es una cantidad numérica calculada sobre una muestra. Ejemplo: tiempo
de duración de una muestra de bombillas.
6 2 Análisis Exploratorio de Datos
Tablas de frecuencias.
2.4.1. Frecuencias
Sea una muestra x1 , x2 , . . . , xn , entonces se definen
M ax(x1 , . . . , xi ) − M in(x1 , . . . , xi )
c=
m
2.4 Buscando patrones de comportamiento en los datos 7
4. Establecer los lı́mites de cada clase. Se necesita abarcar la distancia el rango de los
datos. Una sugerencia seria en convertir el lı́mite inferior de la primera clase en un
múltiplo del intervalo de clase.
Tabla 2.1: Precios de vehı́culos vendidos en diciembre en Calima Motors, las unidades se
encuentran en millones de pesos
50.2 100.2 70 70.1 100.2 80.3 90.4 90.2
60.5 70.1 60.6 70.8 60.8 70.2 80.4 90.6
.
80.5 50.7 60.4 100.1 80.2 90 70.8 80.2
50.3 60.2 90.1 80.6 70 70.7 80.3 70.5
Solución
1. Construcción de la tabla de frecuencias:
100.2 − 50.2
Amplitud del intervalo: c = = 8.33 ≈ 9
6
Empezamos con un valor por debajo del mı́nimo que es 50.2, por ejemplo 50.1 y le
vamos sumando la amplitud (9) hasta abarcar todo el rango de datos y completar
las seis clases:
0
m Li Ls Xi ni Ni fi ( %) Fi ( %)
1 (50.1 59.1] 54.6 3 3 9.4 9.4
2 (59.1 68.1] 63.6 5 8 15.6 25.0
3 (68.1 77.1] 72.6 9 17 28.1 53.1
4 (77.1 86.1] 81.6 7 24 21.9 75.0
5 (86.1 95.1] 90.6 5 29 15.6 90.6
6 (95.1 104.1] 99.6 3 32 9.4 100.0
32.00
2. Interpretación:
n2 = 5: 5 vehı́culos tuvieron un precio de venta 59.7 y 68.1 millones de pesos.
f4 ( %) = 21.9: El 21.9 % de los vehı́culos de la muestra tuvieron un precio de venta
entre 77.7 y 86.1 millones de pesos.
N3 = 17: 17 vehı́culos tuvieron un precio de venta máximo de 77.1 millones de pesos.
F2 ( %) = 25 El 25 % de los vehı́culos tuvieron un precio de venta máximo de 68.1
millones.
0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5
55566666777889
Bélgica Bélgica Bélgica Bélgica Francia Francia Francia Francia Francia Francia Francia
Francia Francia Francia Francia Francia Francia Francia Francia Francia Francia Francia
Francia Francia Francia Francia Finlandia Finlandia Alemania Alemania Alemania Alemania
Suiza USA Alemania Alemania Alemania Holanda Japón Japón Japón Japón Japón Japón
Japón Japón Japón Japón Suecia Suecia Suecia USA USA USA USA USA USA USA USA
USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA
USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA
USA USA USA USA
Cuando la variable es cualitativa y tiene una escala nominal sólo se puede interpretar la
frecuencia absoluta y frecuencia relativa. En la Tabla 2.3 se muestra la forma de organizar
este tipo de variable.
10 2 Análisis Exploratorio de Datos
Cuando se realiza el gráfico con la frecuencia absoluta acumulada este deberı́a tomar forma
de escalera.
2.5 Representación gráfica de los datos 11
Uno de los gráficos mas usados para este tipo de variables es el histograma de frecuencias,
para construirlo se divide el conjunto de datos en m clases, y se representan verticalmente
las frecuencias, absolutas o relativas, de las distintas clases.
La ojiva permite ver cuántas observaciones se encuentran por encima o debajo de ciertos
valores, en lugar de solo exhibir los números asignados a cada intervalo. Este tipo de
gráfico puede ser construido usando la frecuencia absoluta acumulada o la frecuencia relativa
acumulada.
12 2 Análisis Exploratorio de Datos
100
●
90
●
●
80
Fi (%)
●
70
60
●
50
Intervalos
F (X ≤ x) = 1 − F (x)
F (a ≤ X ≤ b) = F (b) − F (a)
Ejemplo 2.6.1 En la Tabla 2.4 se tienen las notas del examen final del curso de Estadı́stica
1 en el periodo 2018-2.
Tabla 2.4: Distribución de las notas del examen final del curso de Estadı́stica 1
m Li L s ni Ni fi ( %) Fi ( %)
1 1.50 2.05 2 2 7.1 7.1
2 2.05 2.60 3 5 10.7 17.9
3 2.60 3.15 8 13 28.6 46.4
4 3.15 3.70 4 17 14.3 60.7
5 3.70 4.25 8 25 28.6 89.3
6 4.25 4.80 3 28 10.7 100.0
28
Solución
1.
F (X ≤ 2.8) = F (2.8)
0.286
= 0.179 + · (2.8 − 2.6)
0.55
= 0.283
2.
F (X ≥ 3.9) = 1 − F (3.9)
0.286
= 1 − 0.607 + · (3.9 − 3.7)
0.55
= 1 − 0.711
= 0.289
3.
n
1X
X̄ = xi (2.2)
n i=1
Solución
1
X̄ = [30 + 75 + 79 + 80 + 80 + 105 + 126 + 138 + 149179] = 104.1
10
m 0
X Xi · ni
X̄ = (2.3)
i=1
n
0
Donde Xi es el promedio de cada clase.
Ejemplo 2.7.2 Calcular la media aritmética para datos agrupados del Ejemplo 4.1
Solución
Propiedad 1
n
X
xi − X̄ = 0 (2.4)
i=1
Propiedad 2: La suma de los cuadrados de las desviaciones de los datos con respecto
a un valor a es mı́nima cuando a = X̄
n
X
(xi − a)2 (2.5)
i=1
16 2 Análisis Exploratorio de Datos
Propiedad 3: Si xi = k para todo i, es decir, todos los datos son iguales a una
constante, entonces:
X̄ = k (2.6)
Propiedad 4: Si todos los datos de una muestra se multiplican por una constante, el
nuevo promedio seria la constante por el promedio inicial:
y i = a · xi (2.7)
Ȳ = a · X̄ (2.8)
Pn
w i xi
X̄w = Pi=1
n (2.11)
i=1 wi
Ejemplo 2.7.3 Un restaurante vende refrescos medianos, grandes y gigantes a $0.90, $1.25
y $1.50. De las 10 últimas bebidas que se vendieron 3 eras medianas, 4 grandes y 3 gigantes.
Determine el precio promedio.
Solución
√
MG = n
x1 · x2 · · · xn (2.12)
Ejemplo 2.7.4 Suponga que usted recibió un 5 % de incremento salarial este año y 15 % de
incremento el siguiente. Calcule el incremento anual promedio.
Solución
√
Mg = 5 · 15 = 8.66
2.7.5. La mediana
La mediana es el valor que no es superado por mas del 50 % de los datos.
Mediana para datos no agrupados: Primero se organizan los datos en orden ascendente:
x( n+1
2 )
, si n es impar
Me = (2.13)
x( n2 ) +x( n2 +1)
2
, si n es par
Ejemplo 2.7.5 Calcular la mediana de las edades de una muestra de personas de una unidad
residencial: 19 27 31 14 19 42 28 57 52 53 13 57 42 38 16
Solución
Ordenamos los datos: 13,14,16,19,19,27,28,31,38,42,42,52,53,57,57
Identificamos la posición.
18 2 Análisis Exploratorio de Datos
13 14 16 19 19 27 28 31 38 42 42 52 53 57 57
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15)
M e = x( 15+1 ) = x(8) = 31
2
0.5 − FLi−1
M e = Li−1 + · ci (2.14)
fi
Ejemplo 2.7.6 Calcular la Mediana de los datos del los datos del Ejemplo 4.1.
Solución
(0.5 − 0.25)
M e = 68.1 + · 9 = 76.107
0.281
Interpretación: El 50 % de los vehı́culos tuvieron un precio de venta máximo de 76.107
millones.
2.7.6. La moda
En el caso de variables cuantitativas discretas, la moda es el valor de la observación
que aparece con mas frecuencia. En el caso de variable cuantitativas continuas, la moda
corresponde a los valores alrededor de los cuales se produce la mayor concentración de los
datos. En la literatura hay algunas expresiones que nos permiten tener un valor aproximado
para datos agrupados, para determinar los valores a utilizar es necesario identificar la clase
donde se encuentra la mayor frecuencia absoluta o relativa.
fi+1
M o = Li−1 + (2.15)
fi−1 + fi+1
Ejemplo 2.7.7 Calcular la moda del conjunto de datos del Ejemplo 4.1.
2.8 Indicadores de dispersión 19
Solución
La clase de referencia
0.156
M o = 68.1 + = 68.516 (2.16)
0.219 + 0.156
Interpretación: La mayorı́a de los vehı́culos tuvieron un precio de venta alrededor de 68.516
millones.
2.8.1. Rango
Se define como la distancia entre el valor máximo y el valor mı́nimo:
2.8.2. Varianza
La varianza es la medida de dispersión mas utilizada en el análisis estadı́stico.
Varianza para datos no agrupados:
n
2 1 X 2
S = xi − X̄ (2.18)
n − 1 i=1
Ejemplo 2.8.1 Con el objetivo de evaluar el nivel de dispersión del tiempo de atención de
una entidad bancaria de la ciudad de Cali. Para esto, se tomó una muestra de clientes y se
reportó el tiempo de atención en minutos: 17.9, 33.0, 3.8, 7.5, 19.4, 59.9, 12.0, 18.6.
Solución
Puesto que el conjunto de datos es pequeño, no vale la pena agruparlos por lo tanto se utiliza
la expresión de la varianza y desviación estándar para datos no agrupados.
Si xi = k, entonces S 2 = 0
Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas
distintas.
S
CV % = × 100 (2.22)
X̄
Ejemplo 2.8.2 Con un micrómetro, se realizan mediciones del diámetro de un balero, que
tienen una media de 4.03 mm y una desviación estándar de 0.012 mm; con otro micrómetro
se toman mediciones de la longitud de un tornillo que tiene una media de 1.76 pulgadas
y una desviación estándar de 0.0075 pulgadas. ¿Cuál de los dos micrómetros presenta una
variabilidad relativamente menor?.
Solución
Para este ejercicio es de suma importancia observar que las mediciones de cada micrómetro
tienen unidades diferentes, el primero esta en milı́metros y el segundo pulgadas, por lo tanto,
para comparar la dispersión se debe usar el coeficiente de variación.
0.012
CVM 1 ( %) = · 100 = 0.297 %
4.03
0.0075
CVM 2 ( %) = · 100 = 0.426 %
1.76
Interpretación: Los resultados indican que la variabilidad relativa es menor cuando las
mediciones son tomadas con el micrómetro 1.
22 2 Análisis Exploratorio de Datos
1
1− (2.23)
k2
Donde k > 1
Ejemplo 2.8.3 Con el objetivo de evaluar el funcionamiento del proceso de llenado de una
bebida, se reportaron mediciones del nivel de llenado en mililitros. Previamente se realizó un
análisis exploratorio de datos y se determinó que la distribución de las mediciones sigue una
distribución con forma de campana. Los resultados arrojaron una media muestral de 100 ml
y una desviación estándar de 20 ml. De acuerdo a esto, el gerente de producción desea saber
entre que valores se encuentra el 68 % de las mediciones de la muestra.
Solución
1
1− = 0.68
k2
1
0.32 = 2
k
r
1
k= = 1.767
0.32
To complete the online class survey, each student will need approximately 15 to 20
minutes of Internet access. After students have answered the survey, their teacher will
have immediate access to their class results. These are used to teach statistical concepts,
measurement, data analysis, and graphing, as well as to explore social concepts. Students
can compare their class data with random samples from other students around the country
and with random samples of responses from the international database.
a) Unidad de estudio.
b) Población objeto de estudio.
c) Muestra de estudio.
a) Variable de análisis.
b) Tipo de variable.
c) Escala de medición.
m Clases ni Ni fi Fi
1 (0.9,7.3] 22 22 0.46 0.46
2 (7.3,13.6] 16 38 0.33 0.79
3 (13.6,19.9] 1 39 0.02 0.81
4 (19.9,26.1] 3 42 0.06 0.88
5 (26.1,32.4] 2 44 0.04 0.92
6 (32.4,40] 4 48 0.08 1.00
5. Los datos que se presentan a continuación corresponden a los tiempos de atención (en
minutos) de los clientes de un banco:
m Clases ni Ni fi ( %) Fi ( %)
1 (4.18 , 7.41] 3 3 6 6
2 (7.41 , 10.6] 3 6 6 12
3 (10.6 , 13.8] 10 16 20 32
4 (13.8 , 17.1] 15 31 30 62
5 (17.1 , 20.3] 13 44 26 88
6 (20.3 , 23.5] 5 49 10 98
7 (23.5 , 26.7] 1 50 2 100
a) Interprete: n2 , f3 , N4 y F2 %.
b) ¿Cuál es el porcentaje de clientes atendidos entre 12 y 20 minutos?
c) Proporción de clientes que han sido atendidos en máximo 19.5 minutos.
d ) Porcentaje de clientes que han sido atendidos en mı́nimo 11.9 minutos.
Capı́tulo 3
Repaso Corte 1
3.1. Examen 1
1. Una empresa encargada del procesamiento de filetes de pescado, tiene como objetivo
determinar las caracterı́sticas óptimas para la preservación del producto. Las variables
más importantes para determinar la calidad de este producto son las Bases
Nitrogenadas Volátiles Totales (TVB-N) y la Proteı́na Sarcoplasmática (PS), ambas
variables están medidas en porcentaje. Para esto, el departamento de control de calidad
ha decidido analizar una muestra de 45 filetes del último lote procesado. A continuación
se presentan los resultados obtenidos:
1.0
0.82
0.8
0.8
0.69 0.69
0.6
0.6
0.53
Fi
Fi
0.4
0.4
0.31
0.29
0.2
0.2
0.0
0.0
a) Estadı́stica descriptiva.
b) Muestra.
c) Población.
d ) Estadı́stico
3. Con la siguiente información responda, se puede afirmar que hay puntos atı́picos en los
datos: Mı́n(xi): 0.3; Máx(xi): 5.7; Q1 : 1.85; Q2 : 2.56; Q3 : 3.29. Utilice un procedimiento
adecuado.
Li Ls
0
Xi ni fi Ni Fi
1.25 1.55 3
1.55 1.85 15
1.85 2.15 36
2.15 2.45 61
2.45 2.75 72
2.75 3.05 80
3.2. Examen 2
1. Diga el tipo de variable y la escala de medición de las siguientes variables:
a) ¿Cuales son los dos tipos de estadı́stica más importantes y para que sirven?
b) Defina los siguientes términos: Muestra, Parámetro, Estadı́stico
Li−1 Li ni fi Ni Fi
9.7 15.7 0.35 70 0.35
15.7 21.7 46 0.23 116
21.7 27.7 30 0.73
27.7 33.7 0.27 1
3.3. Examen 3
1. Los talleres AndresCarAudio registran las ventas (miles de pesos) de servicios
extendidos: 823, 648, 321, 634, 752, 669, 427, 555, 904, 586, 722, 360, 468, 847, 641,
217, 588, 349, 308, 766. A continuación se presentan los resultados obtenidos de un
informe descriptivo:
Responda usando la información de la Tabla 1 y Tabla 2:
Tabla 3.1: Tabla de frecuencias de las ventas Tabla 3.2: Estadı́sticos descriptivos de
de servicio extendido. las ventas de servicio extendido.
m Intervalo ni Ni fi Fi Indicador Valor
1 (216,389] 5 5 0.25 0.25 Promedio 577.52
2 (389,560] 3 8 0.15 0.40 Varianza 38589.62
3 (560,732] 7 15 0.35 0.75 Asimetrı́a -0.23
4 (732,905] 5 20 0.25 1.00 Curtosis 1.54
plataformas.
Empresa de Número Promedio Desviación Coeficiente
Ingresos (miles de pesos)
Plataforma
Conceptos de probabilidad
4.1.3. Complemento
0
El complemento de un evento A, denontado por A , es el conjunto de todos los resultados
en S.
0
Figura 4.4: Complemento A .
4.2 Axiomas, interpretaciones y propiedades de la probabilidad 33
Ejemplo 4.1.1 Para el experimento donde se observa el número de bombas en uso en una
sola gasolineria con seis bombas, sea A = {0, 1, 2, 3, 4}, B = {3, 4, 5, 6} y C = {1, 3, 5}.
0 0
Encontrar: A ∪ B, A ∪ C , A ∩ B, A ∩ C, A y {A ∪ B}
Solución
A ∪ B = {0, 1, 2, 3, 4, 5, 6}
A ∪ C = {0, 1, 2, 3, 4, 5}
A ∩ B = {3, 4}
A ∩ C = {1, 3}
0
A = {5, 6}
0
(A ∪ B) = {}
4.2.1. Axiomas
Para cualquier evento A, P (A) ≥ 0
P (S) = 1
N (A)
P (A) = (4.1)
N (S)
Donde N (A) son los resultados del evento A y N (S) son los resultados del espacio muestral
S.
Solución: Sea el evento A ∪ B se suscribe por lo menos a uno de los dos periódicos.
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
P (A ∪ B) = 0.6 + 0.8 − 0.5
P (A ∪ B) = 0.9
4.2 Axiomas, interpretaciones y propiedades de la probabilidad 35
Ahora el evento de que una familia solo se suscriba al periódico local se puede escribir como
0
A ∩ B:
0
P (A ∩ B) = P (A ∪ B) − P (A)
0
P (A ∩ B) = 0.9 − 0.6
0
P (A ∩ B) = 0.3
Ahora el evento de que una familia solo se suscriba al periódico metropolitano se puede
0
escribir como A ∩ B :
0
P (A ∩ B ) = P (A ∪ B) − P (B)
0
P (A ∩ B ) = 0.9 − 0.8
0
P (A ∩ B ) = 0.1
Sea el evento D la probabilidad de que una familia se suscriba exactamente a uno de los dos
periódicos:
0 0
P (D) = P (A ∩ B) + P (A ∩ B )
P (D) = 0.3 + 0.1
P (D) = 0.4
N
X N
X
1= P (Ei ) = p·N
i=1 i=1
p·N =1
1
p=
N
36 4 Conceptos de probabilidad
Ejemplo 4.2.2 Cuando se lanzan por separado dos dados, calcule la probabilidad del evento
A = {suma de dos números sea igual a 7}
Solución:
Dado 2
Dado 1 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
nA 6
P (A) = = = 0.166
nΩ 36
P (A ∩ B)
P (A/B) = (4.2)
P (B)
k
X
P (B) = P (B/A1 )P (A1 ) + . . . + P (B/Ak )P (Ak ) = P (B/Ai )P (Ai ) (4.3)
i=1
Ejemplo 4.4.1 Una fábrica de enlatados produce 5000 envases diarios. La máquina A
produce 3000 de estos envases, de los que el 2 % son defectuosos y la máquina B produce los
2000 restantes de los que se sabe que el 4 % son defectuosos. Determinar:
Solución:
1.
Envase defectuosos de la máquina A:
3
P (A ∩ D) = P (A) · P (D/A) = · 0.02 = 0.012
5
Envase defectuosos de la máquina A:
2
P (B ∩ D) = P (B) · P (D/B) = · 0.04 = 0.016
5
Probabilidad de que un envase elegido al azar sea defectuoso:
2.
Probabilidad de que provenga de la máquina A:
P (A ∩ D) 0.012
P (A/D) = = = 0.4286
P (D) 0.028
Probabilidad de que provenga de la máquina B:
P (B ∩ D) 0.016
P (B/D) = = = 0.5714
P (D) 0.028
3. Suponga que las especificaciones del fabricante para la longitud del cable de cierto
tipo de computadora son 2000 ± 10 milı́metros. En esta industria se sabe que el
cable pequeño tiene la misma probabilidad de salir defectuoso (de no cumplir con las
especificaciones) que el cable grande. Es decir, la probabilidad de que aleatoriamente
se produzca un cable con una longitud mayor que 2010 milı́metros es igual a la
probabilidad de producirlo con una longitud menor que 1990 milı́metros. Se sabe que
la probabilidad de que el procedimiento de producción cumpla con las especificaciones
es 0.99.
6. A los obreros de las fábricas se les motiva constantemente a practicar la tolerancia cero
para prevenir accidentes en el lugar de trabajo. Los accidentes pueden ocurrir porque el
ambiente o las condiciones laborales son inseguros. Por otro lado, los accidentes pueden
4.5 Ejercicios. Fuente: Douglas et al. (2012), Levin & Rubin (2004) 39
ocurrir por negligencia o fallas humanas. Además, los horarios de trabajo de 7:00 a.m.
a 3:00 p.m. (turno matutino), de 3:00 p.m. a 11:00 p.m. (turno vespertino) y de 11:00
p.m. a 7:00 a.m. (turno nocturno) podrı́a ser un factor. El año pasado ocurrieron 300
accidentes. Los porcentajes de los accidentes por la combinación de condiciones son los
que siguen:
8. Las probabilidad de que tres eventos A, B y C ocurran son P (A) = 0.35, P (B) = 0.45
y P (C) = 0.2. Suponga que ocurrió A, B o C, las probabilidades de que ocurra otro
evento X son P (X/A) = 0.8, P (X/B) = 0.65 y P (X/C) = 0.3. Encuentre P (A/X),
P (B/X) y P (C/X).
40 4 Conceptos de probabilidad
Variable aleatoria
Cantidad que resulta de un experimento que, por azar, puede adoptar diferentes valores.
X
F (X) : R → [0, 1] que verifica F (X) = P [X ≤ x] = Pi (5.1)
xi <x
X 0 1 2 3
P (X) 1/8 3/8 3/8 1/8
La función de distribución para una variable aleatoria discreta siembre verifica las siguientes
propiedades:
1. F (−∞) = 0 ; F (+∞) = 1
P (x = a) = 0 si X es continua.
0.010
0.005
0.000
F (−∞) = 0
5.1 Función de Distribución Acumulada 43
F (∞) = 1
0.010
0.005
0.000
(
x2
3
, −1 < x < 2,
f (x) =
0 , en otro caso.
Solución:
1.
2 2
x2
Z Z 3
1 2 1 x 2
f (x) = dx = x dx = · =1
−1 3 3 −1 3 3 −1
2.
1
x2
Z 3
1 x 0
P (0 < X < 1) = dx = · = 0.111
0 3 3 3 1
3.
x
t2
3
x3 1
Z
1 t 1
F (x) = dt = · = +
−1 3 3 3 x 9 9
Propiedades de E(X):
E(c) = c
Propiedades:
V (c) = 0
(
1
− 270 · x(1 − x) , 4 < x < 10,
f (x) =
0 , en otro caso.
Solución:
1.
−1 10
3
x4 4
Z
1 x 4
E(X) = x · x · (1 − x)dx = − · −
270 4 270 3 10 4 10
3 3
4 4
1 10 − 4 10 4
=− · − − = 7.866
270 3 4 4
Z 10 Z 10
2 1 1 3 4
E(X ) = − (x · x · (1 − x)) dx = − x − x dx
270 4 270 4
4
x 10 x5 10
4
10 − 44 105 − 45
1 1
=− · − =− · − = 360.59
270 4 4 5 4 270 4 5
σ(X) 17.28
CV (X) % = · 100 = · 100 = 219.67 %
E(X) 7.866
2. Se lanza una moneda hasta que se presentan 3 caras sucesivamente. Liste sólo aquellos
elementos del espacio muestral que requieren 6 o menos lanzamientos. ¿Es éste un
espacio muestral discreto? Explique su respuesta.
4. Jim Rieck, analista de mercado de la compañı́a Flatt and Mitney Aircraft, tiene la
creencia de que el nuevo avión de combate de la compañı́a, el Tigerhawk, tiene el 70 %
de posibilidades de ser escogido para sustituir por completo a los aviones de combate
de la Fuerza Aérea de Estados Unidos. Sin embargo, existe una posibilidad entre cinco
de que la Fuerza Aérea compre sólo el número necesario de Tigerhawk para sustituir la
mitad de sus 5,000 aviones de combate. Por último, existe una posibilidad entre 10 de
que la Fuerza Aérea sustituya toda su flotilla de aviones de combate con Tigerhawks
y que además compre el número suficiente de éstos para aumentar el número de sus
unidades en un 10 %. Construya una tabla y trace la distribución de probabilidad de
las ventas de Tigerhawks a la Fuerza Aérea.
5. Mario, el dueño de Mario?s Pizza Emporium, debe tomar una decisión difı́cil. Se ha
dado cuenta que cada noche vende entre una y cuatro de sus famosas pizzas ?Con todo,
menos el fregadero?. Sin embargo, la preparación de estas pizzas lleva tanto tiempo, que
Mario las elabora todas con anterioridad y las almacena en el refrigerador. Como los
ingredientes no duran más de un dı́a, siempre desperdicia las pizzas que no ha vendido
al final de la noche. El costo de preparar cada una es de $7 y el precio al cliente es de
$12. Además de los costos usuales, Mario calcula que pierde $5 por cada pizza de este
tipo que no puede vender por no tenerlas preparadas de antemano. ¿Cuántas pizzas
?Con todo, menos el fregadero? debe almacenar Mario cada noche a fin de minimizar
la pérdida esperada si el número de pizzas ordenadas tiene la siguiente distribución de
probabilidad?
8. (0.5 ) La vida útil, en dı́as, para frascos de cierta medicina de prescripción es una
variable aleatoria que tiene la siguiente función de densidad:
20000
x>0
f (x) = (x + 100)3
0, en otro caso
Calcule la probabilidad de que un frasco de esta medicina tenga una vida útil de:
9. El número total de horas, medidas en unidades de 100 horas, que una familia utiliza
una aspiradora en un periodo de un año es una variable aleatoria continua X que tiene
la siguiente función de densidad:
x 0<x<1
f (x) = 2 − x, 1 ≤ x < 2
0, en otro caso
10. La proporción de personas que responden a cierta encuesta enviada por correo es una
variable aleatoria continua X que tiene la siguiente función de densidad:
(
2(x+2)
5
, 0<x<1
f (x) =
0, en otro caso
5.3 Ejercicios. Fuente: Douglas et al. (2012), Levin & Rubin (2004) 49
Repaso Corte 2
6.1. Examen 1
1. Un testigo de un accidente de auto en el que huye el culpable dice a la policı́a que la
placa del vehı́culo contenı́a las letras RLH seguidas de tres dı́gitos cuyo primer número
es un 5. El testigo no puede recordar los otros dos dı́gitos de la placa, pero tiene la
certeza de que los tres dı́gitos eran diferentes. Encuentre el número máximo de placas
de auto que la policı́a tiene que verificar.
(
2 · (1 − y) ; 0 ≤ y ≤ 1
f (y) =
0 ; otro caso
4. Cierta área del este de Estados Unidos resulta afectada, en promedio, por 6 huracanes
al año. Calcule la probabilidad de que para cierto año esta área resulte afectada por
a) ¿Los 4 exploten?
b) ¿Al menos 2 no exploten?
6. Una empresa recibe visitantes en sus instalaciones y los hospeda en cualquiera de tres
hoteles de la ciudad; Palacio del Sol, Sicomoros o Fiesta Inn, en una proporción de
18.5 %, 32 % y 49.5 % respectivamente, de los cuales se ha tenido información de que
se les ha dado un mal servicio en un 2.8 %, 1 % y 4 % respectivamente.
6.2. Examen 2
1. Si un estudiante tiene 9 libros y desea ordenar a 5 de ellos sobre un estante. De cuantas
maneras distintas puede hacerlo?
Modelos de probabilidad
2. Cada prueba produce un resultado que se puede clasificar como éxito o fracaso.
n x
p(x) = p (1 − p)n−x x = 0, 1, 2, . . . , n (7.1)
x
E (X) = n · p (7.2)
V (X) = n · p · (1 − p) (7.3)
54 7 Modelos de probabilidad
Solución:
a)
15
X 15
P (X ≥ 10) = (0.4)x (1 − 0.4)15−x = 0.0338
x=10
x
b)
8
X 15
P (3 ≤ X ≤ 8) = (0.4)x (1 − 0.4)15−x = 0.8778
x=3
x
c)
15
P (X = 5) = (0.4)5 (1 − 0.4)15−5 = 0.1859
5
d)
E(X) = 15 · 0.4 = 6
V (X) = 15 · 0.4 · 0.6 = 3.6
e−λ λx
p(x) =
x!
Donde λ es la media de la cantidad de veces (éxitos) que se presenta un evento en un intervalo
particular.
7.3 Distribución Uniforme 55
E (X) = λ (7.4)
V (X) = λ (7.5)
Ejemplo 7.2.1 Si un editor de novelas se esfuerza por asegurar que sus libros están libres
de errores tipográficos, de modo que la probabilidad de que alguna página contenga por lo
menos un error es 0.005 y los errores son independientes de una página a otra, ¿cuál es la
probabilidad de que una de sus novelas de 400 páginas contenga exactamente una página con
errores? ¿a lo sumo 3 páginas con errores?
λ = 400 · 0.005 = 2
e−2 · 21
P (X = 1) = = 0.2706
1!
b)
3
X e−2 · 2x
P (X ≤ 3) = = 0.8571
x=0
x!
Ejemplo 7.3.1 Suponga que se puede reservar una sala de conferencias grande para cierta
compañı́a por no más de cuatro horas. Sin embargo, el uso de la sala de conferencias es tal
que muy a menudo tienen lugar conferencias largas y cortas. De hecho, se puede suponer que
la duración X de una conferencia tiene una distribución uniforme en el intervalo [0, 4].
56 7 Modelos de probabilidad
2. ¿Cuál es la probabilidad de que cualquier conferencia dada dure al menos tres horas?
Solución:
1
f (x) = , 0 ≤ x ≤ 4
4
2.
Z 4
1 1
P (X ≥ 3) = dx =
3 4 4
a+b
E(X) = (7.6)
2
(b − a)2
V (X) = (7.7)
12
(
1/βe−x/β , x > 0
f (x) = (7.8)
0, en cualquier otro caso
donde β > 0.
E(X) = β (7.10)
V (X) = β 2 (7.11)
Ejemplo 7.4.1 Suponga que un sistema contiene cierto tipo de componente cuyos tiempo
de falla en años está dado por X . La variable aleatoria X se modelo bien mediante la
distribución exponencial con tiempo medio para la falla de 5 años. Si se instalan cinco de
estos componentes en diferentes sistemas, ¿cuál es la probabilidad de que un componente
funcione después de 8 años?
Solución:
Usando la función de densidad:
Z ∞
P (X > 8) = 1/5 · e−x/5 dx
8
h ∞ i
−x/5
= 1/5 · −5e
8
= −e−∞/5 + e−8/5 = 0.2018
Z ∞
Γ(α) = xα−1 e−x dx (7.12)
0
58 7 Modelos de probabilidad
(
1
β α Γ(α)
xα−1 e−x/β , x>0
f (x) = (7.14)
0, en cualquier otro caso
x
y α−1 e−y
Z
F (x; α) = dy (7.15)
0 Γ(α)
E(X) = αβ (7.16)
V (X) = αβ 2 (7.17)
Ejemplo 7.5.1 En un estudio biomédico con ratas se usa una investigación de respuesta a
la dosis para determinar el efecto de la dosis de un tóxico en su tiempo de sobrevivencia.
El tóxico es uno que se descarga con frecuencia en la atmósfera desde el combustible de los
aviones. Para cierta dosis del tóxico el estudio determina que el tiempo de sobrevivencia, en
semanas, tiene una distribución gamma con α = 5 y β = 10. ¿Cuál es la probabilidad de que
una rata no sobreviva más de 60 semanas?
7.6 Distribución Normal 59
Solución:
60
xα−1 e−x/β
Z
1
P (X ≤ 60) = α dx
β 0 Γ(α)
X
Si hacemos y = β
, X = βy, utilizando la función gamma incompleta tenemos
6
y 4 e−y
Z
P (Y ≤ 6) = dy = F (6; 5) = 0.715
0 Γ(5)
Solución:
La mitad del área bajo la curva se encuentra a la derecha del punto central y la otra
mitad está a la izquierda de dicho punto.
60 7 Modelos de probabilidad
Es asintótica, lo que quiere decir que la curva se acerca cada vez más al eje X pero
jamás llega a tocarlo.
Figura 7.1: Función de densidad de una v.a. a) X ∼ N (3, 1.5). b) X ∼ N (4, 1.5). c) X ∼
N (5, 1.5). d) X ∼ N (6, 1.5)
(a) (b)
0.20
0.20
f(x)
f(x)
0.10
0.10
0.00
0.00
−10 −5 0 5 10 −10 −5 0 5 10
x x
(c) (d)
0.20
0.20
f(x)
f(x)
0.10
0.10
0.00
0.00
−10 −5 0 5 10 −10 −5 0 5 10
x x
Figura 7.2: Función de densidad de una v.a. a) X ∼ N (3, 1.5). b) X ∼ N (3, 3). c) X ∼
N (3, 4.5). d) X ∼ N (3, 6)
(a) (b)
0.12
0.20
0.08
f(x)
f(x)
0.10
0.04
0.00
0.00
−10 −5 0 5 10 −10 −5 0 5 10
x x
(c) (d)
0.08
0.05
0.06
f(x)
f(x)
0.04
0.03
0.02
0.01
0.00
−10 −5 0 5 10 −10 −5 0 5 10
x x
7.6.1. Definición
Se dice que una variable aleatoria X tiene una distribución normal si su función de densidad
es de la forma:
1 1
f (x) = √ exp (X − µ)2 X∈R (7.18)
2πσ 2σ 2
Z ∞
E(X) = x · f (x)dx = µ µ∈R (7.19)
−∞
62 7 Modelos de probabilidad
Z ∞
V (X) = [x − E(X)]2 f (x)dx = σ 2 (7.20)
−∞
0.1
0.0
a b
7.6.4. Propiedades
P (−∞ < X < ∞)
Z a
P (X < a) = f (x)dx
−∞
P (X > a) = 1 − P (X < a)
P (X ≤ a) = P (X < a)
7.6 Distribución Normal 63
Para resolver este problema, se utiliza una sola de las distribuciones normales, aquella cuya
media es 0 y la desviación estándar es 1. Se le conoce como la distribución normal estándar,
de forma que todas las distribuciones normales pueden convertirse a la estándar, restando
la media de cada observación y dividiendo por la desviación estándar.
Si X ∼ N (µ, σ)
X −µ
Z= (7.21)
σ
Entonces Z ∼ N (0, 1)
Ejemplo 7.6.1 Suponga que X es normal con media 8.0 y desviación estándar 5.0.
Encuentre:
1. P (X < 8.6)
2. P (X > 8.6)
Solución:
1.
8.6 − 8
P (X < 8.6) = P Z < = 0.12
5
= P (Z < 0.12) = 0.5478
64 7 Modelos de probabilidad
2.
3.
Solución:
X =µ+Z ·σ
= 8 + (−0.84) · 5
= 3.8
4. La central telefónica de una CIA recibe en promedio 10 llamadas por cada perı́odo de
20 minutos. Calcular la probabilidad de que en los próximos 10 minutos se reciban:
6. El tiempo necesario para que un individuo sea atendido en una cafeterı́a es una variable
aleatoria que tiene una distribución exponencial con una media de 4 minutos. ¿Cuál es
la probabilidad de que una persona sea atendida en menos de 3 minutos en al menos
4 de los siguientes 6 dı́as?
66 7 Modelos de probabilidad
7. Dada una distribución normal estándar, calcule el área bajo la curva que está:
a) a la izquierda de z = −1.39
b) a la derecha de z = 1.96
c) entre z = −2.16 y z = −0.65
d ) a la izquierda de z = 1.43
e) a la derecha de z = −0.89
f ) entre z = −0.48 y z = 1.74
8. Una máquina expendedora de bebidas gaseosas se regula para que sirva un promedio
de 200 mililitros por vaso. Si la cantidad de bebida se distribuye normalmente con una
desviación estándar igual a 15 mililitros,
Douglas, L., Marchal, W., & Wathen, S. (2012). Estadı́stica aplicada a los negocios y
economı́a. McGraw-Hill Interamericana.