Guia Estudio Estadistica1

Guı́a de estudio para el curso de Estadı́stica 1
Autor
Johann Alexis Ospina Galindéz
Universidad Autónoma de Occidente

Departamento de Matemáticas y Estadı́stica
Facultad de Ciencias Básicas y Ambientales
Santiago de Cali, Colombia
Resumen
El presente documento tiene como objetivo proporcionar al estudiante los conceptos
básicos e intermedios del Análisis Exploratorio de Datos, elementos preliminares del
calculo de probabilidades, variables aleatorias y modelos de probabilidades. Resaltando los
conceptos y temas claves que son usados con mayor frecuencias en los cursos de pregrado de
Estadı́stica de la Universidad Autónoma de Occidente.
Contenido
Resumen 2
1. Introducción 2
1.1. ¿Qué es la Estadı́stica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Aplicaciones de la estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3. Tipos de estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.1. Estadı́stica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.2. Estadı́stica inferencial . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2. Análisis Exploratorio de Datos 4

2.1. Tipos de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.1. Variable cualitativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.2. Cuantitativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2. Escalas de medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2.1. Escalas de medición para variables cuantitativas . . . . . . . . . . . . 5
2.2.2. Escalas de medición para variables cuantitativas . . . . . . . . . . . . 5
2.3. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3.1. Parámetro y estadı́stico . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.4. Buscando patrones de comportamiento en los datos . . . . . . . . . . . . . . 6
2.4.1. Frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.4.2. Tabla de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.4.3. Nomenclatura de la tabla de frecuencias . . . . . . . . . . . . . . . . 7
2.4.4. Tabla de frecuencias para variables cuantitativas discretas . . . . . . 8
2.4.5. Tabla de frecuencia cuando la variable es cualitativa . . . . . . . . . . 9
2.5. Representación gráfica de los datos . . . . . . . . . . . . . . . . . . . . . . . 10
2.5.1. Gráfico para variables cuantitativa discreta . . . . . . . . . . . . . . . 10
2.5.2. Gráfico para variables cuantitativa continua . . . . . . . . . . . . . . 11
2.5.3. Gráfico para variables cualitativas . . . . . . . . . . . . . . . . . . . . 12
2.6. Función empı́rica de distribución acumulada . . . . . . . . . . . . . . . . . . 13
2.7. Indicadores de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.7.1. Promedio o media aritméticas . . . . . . . . . . . . . . . . . . . . . . 14
4 CONTENIDO
2.7.2. Propiedades de la media aritmética . . . . . . . . . . . . . . . . . . . 15

2.7.3. Media ponderada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.7.4. Media geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.7.5. La mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.7.6. La moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.8. Indicadores de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.8.1. Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.8.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.8.3. Desviación estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.8.4. Propiedades de la varianza: . . . . . . . . . . . . . . . . . . . . . . . 20
2.8.5. Coeficiente de variación . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.8.6. Teorema de Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.8.7. Regla empı́rica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.9. Ejercicios. Fuente: Douglas et al. (2012), Levin & Rubin (2004) . . . . . . . 23
3. Repaso Corte 1 26
3.1. Examen 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.2. Examen 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.3. Examen 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4. Conceptos de probabilidad 31
4.1. Algunas relaciones de teorı́a de conjuntos . . . . . . . . . . . . . . . . . . . . 31
4.1.1. Unión (∪) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.1.2. Intersección (∩) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.1.3. Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.1.4. Eventos mutuamente excluyentes . . . . . . . . . . . . . . . . . . . . 33
4.2. Axiomas, interpretaciones y propiedades de la probabilidad . . . . . . . . . . 33
4.2.1. Axiomas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.2.2. Definición de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . 34
4.2.3. Propiedades de la probabilidad . . . . . . . . . . . . . . . . . . . . . 34
4.3. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.4. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5. Variable aleatoria 41
5.1. Función de Distribución Acumulada . . . . . . . . . . . . . . . . . . . . . . . 41
5.1.1. Caso discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.1.2. Caso continuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.2. Valor esperado y varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
6. Repaso Corte 2 50
6.1. Examen 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
6.2. Examen 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7. Modelos de probabilidad 53
7.1. Distribución Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
7.1.1. Valor esperado y varianza de una v.a. binomial . . . . . . . . . . . . 53
7.2. Distribución Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
7.2.1. Valor esperado y varianza de una v.a. poisson . . . . . . . . . . . . . 55
7.3. Distribución Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
7.3.1. Valor esperado y varianza de una v.a. Uniforme . . . . . . . . . . . . 56
7.4. Distribución Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
7.4.1. Valor esperado y varianza de una v.a. Exponencial . . . . . . . . . . 57
7.5. Distribución Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.5.1. La función Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.5.2. Función Gamma incompleta . . . . . . . . . . . . . . . . . . . . . . . 58
7.5.3. Valor esperado y varianza de una v.a. Gamma . . . . . . . . . . . . . 58
7.6. Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.6.1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.6.2. Valor esperado y varianza . . . . . . . . . . . . . . . . . . . . . . . . 61
7.6.3. Calculo de probabilidades para una v.a. ∼ N (µ, σ) . . . . . . . . . . 62
7.6.4. Propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.6.5. Distribución Normal Estándar . . . . . . . . . . . . . . . . . . . . . . 63
7.6.6. Calculo del valor de X para una probabilidad conocida . . . . . . . . 64
Bibliografı́a 67
Lista de Tablas
2.1. Precios de vehı́culos vendidos en diciembre en Calima Motors, las unidades se

encuentran en millones de pesos . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Distribución del número de piezas defectuosas. . . . . . . . . . . . . . . . . 9
2.3. Distribución de las refinerias más grandes a nivel mundial. . . . . . . . . . . 10
2.4. Distribución de las notas del examen final del curso de Estadı́stica 1 . . . . 13
3.1. Tabla de frecuencias de las ventas de servicio extendido. . . . . . . . . . . . 29

3.2. Estadı́sticos descriptivos de las ventas de servicio extendido. . . . . . . . . . 29
3.3. Resumen descriptivo por plataformas. . . . . . . . . . . . . . . . . . . . . . . 29
Lista de Figuras
2.1. Diagrama de lı́nea. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2. Gráfico de la distribución absoluta acumulada. . . . . . . . . . . . . . . . . . 11
2.3. Histograma de frecuencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4. Ojiva. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5. Gráfico de sectores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.1. Comportamiento de la distribución de valores de TVB-N (Izquierda) y PS

(Derecha). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.2. Diagrama de cajas por plataformas. . . . . . . . . . . . . . . . . . . . . . . . 29
4.1. Diagrama de Venn de los eventos A y B. . . . . . . . . . . . . . . . . . . . . 31

4.2. Unión de eventos A ∪ B. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.3. Intersección de A ∩ B. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
0
4.4. Complemento A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.5. Eventos mutuamente excluyentes. . . . . . . . . . . . . . . . . . . . . . . . . 33
5.1. Representación de la probabilidad entre dos valores P (a ≤ X ≤ b). . . . . . . 42

5.2. Representación de una probabilidad acumulada P (X ≤ x) . . . . . . . . . . 43
7.1. Función de densidad de una v.a. a) X ∼ N (3, 1.5). b) X ∼ N (4, 1.5). c) X ∼

N (5, 1.5). d) X ∼ N (6, 1.5) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
7.2. Función de densidad de una v.a. a) X ∼ N (3, 1.5). b) X ∼ N (3, 3). c) X ∼
N (3, 4.5). d) X ∼ N (3, 6) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.3. Ilustración de P (a ≤ X ≤ b) para X ∼ N (µ, σ) . . . . . . . . . . . . . . . . 62
Capı́tulo 1
Introducción
El análisis de datos esta relacionado con la necesidad del procesamiento y análisis de datos,
mecanismos de recolección, presentación, y obtención de resultados que sirvan de apoyo en
la toma de decisiones (Douglas et al., 2012).
1.1. ¿Qué es la Estadı́stica?

Es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos numéricos que
ayuda a tomar las mejores decisiones .
1.2. Aplicaciones de la estadı́stica

Investigación de mercados.
Control de calidad.
Contadurı́a.
Economı́a.
1.3. Tipos de estadı́stica

1.3.1. Estadı́stica descriptiva
Se encarga de la organización, resumen y presentación de los datos de manera informativa.
Un estudio de la empresa Gallup encontró que el 49 % de la población sabe el nombre

del primer libro de la Biblia. Esto describe que 49 de cada 100 personas que conocieron
la respuesta.
1.3 Tipos de estadı́stica 3
De acuerdo con un reporte de consumidores, los dueños de las lavadoras Whirlpool

reportaron 9 % de problemas durante 1999. El estadı́stico 9 describe el número de
problemas por cada 100 lavadoras.
1.3.2. Estadı́stica inferencial

Es una decisión, estimación, predicción o generalizacion tomada sobre una población con
base en una muestra.
Población: Es un grupo de individuos, objetos o medidas de interés.
Muestra: Es una porción, o parte, de la población que interesa.
Algunos ejemplo del uso de la estadı́stica inferencial:
Las cadenas de TV monitorean la popularidad de sus programas de manera continua,

para ello contratan los servicios de organizaciones que muestrean la preferencia de los
televidentes.
El departamento de contabilidad de una empresa selecciona una muestra de las facturas

para verificar los errores de todas las facturas de la compañı́a.
Los catadores de vino beben unas gotas para tomar una decisión con respecto a todo
el vino que se venderá.
Capı́tulo 2
Análisis Exploratorio de Datos
En este capitulo se abordará el concepto de Análisis Exploratorio de Datos o Estadı́stica

Descriptiva con el objetivo de ilustrar al estudiante con todo lo referente a la caracterización
de datos (Behar & Yepes, 1996).
2.1. Tipos de variables

De acuerdo a la naturaleza de la variable se pueden clasificar las variables de acuerdo a dos
tipos.
2.1.1. Variable cualitativa

Es la caracterı́stica o variable de estudio que no es numérica.
Ejemplos: Género, preferencia religiosa, tipo de automóvil, estado de nacimiento, color

de ojos.
2.1.2. Cuantitativa
Esta variable se registra en forma numérica.
Ejemplos: saldo en la verificación de la contabilidad, minutos que se permanece en la

clase, el número de niños en una familia.
Las variables cuantitativas se clasifican como discretas o continuas.
Discretas: Sólo pueden representar algunos valores y en general existen ’huecoséntre

ellos. Ejemplo: el número de cuartos en una casa (1, 2 ,3,..., etc...).
Continuas: Estas pueden tomar cualquier valor dentro de un intervalo especı́fico.

Ejemplo: el tiempo que se tarda en volar de Cali a Cartagena.
2.2 Escalas de medición 5
2.2. Escalas de medición

2.2.1. Escalas de medición para variables cuantitativas
Nominal: Los datos se clasifican únicamente en categorı́as y no pueden arreglarse en
forma ordenada. Ejemplos: color de ojos, género, preferencia religiosa.
Ordinal: Se considera que los datos se arreglan en determinado orden, pero no pueden
determinarse diferencias entre los valores de los datos o pudieran no tener sentido.
Ejemplo: durante una prueba gastronómica de 4 platillos, el C se clasificó número 1;
el B, número 2; el A, número 3, y el D, número 4; el estrato socioeconómico.
2.2.2. Escalas de medición para variables cuantitativas

Intervalo: Es semejante al nivel ordinal. Tiene la propiedad adicional de que pueden
determinarse las diferencias entre los valores de los datos. No existe naturalmente
ningún cero. Ejemplo: la temperatura en la escala Fahrenheit.
Razón: Tiene las caracterı́sticas del nivel de intervalo con un punto de inicio cero.
Las diferencias y las divisiones tienen significado en este nivel de medición. Ejemplo:
salario de los estudiantes de la nocturna.
2.3. Conceptos básicos

Para dar respuesta a las preguntas de investigación desde la estadı́stica descriptiva, se
selecciona una parte del conjunto de individuos que se quiere investigar, y se toman datos
coherentes con el contenido del problema.
Población: conjunto de individuos o elementos objeto de estudio que cumplen ciertas

propiedades comunes.
Muestra: subconjunto representativo de una población
2.3.1. Parámetro y estadı́stico

Parámetro: es una cantidad numérica calculada sobre una población. Ejemplo: tiempo
de duración de un lote de bombillas.
Estadı́stico: es una cantidad numérica calculada sobre una muestra. Ejemplo: tiempo
de duración de una muestra de bombillas.
6 2 Análisis Exploratorio de Datos
2.4. Buscando patrones de comportamiento en los

datos
Las técnicas de la estadı́stica descriptiva y del análisis exploratorio de datos tienen como
objetivo obtener el máximo de información posible a partir de una muestra. Para esto se
utilizan herramientas tales como:
Tablas de frecuencias.
Gráficos (diagramas de barras, histogramas de frecuencias, diagramas de cajas, etc).
Medidas o indicadores (tendencia central, variabilidad, posición y forma).
2.4.1. Frecuencias
Sea una muestra x1 , x2 , . . . , xn , entonces se definen
La frecuencia absoluta de un dato, es el numero de veces que dicho dato se repite

en el conjunto de la muestra.
La frecuencia relativa de un dato, es la proporción que dicho dato se repite en el

conjunto de la muestra, con respecto al numero total de datos.
La frecuencia de clase acumulada se define acumulando la frecuencia absoluta

hasta una clase especı́fica.
La frecuencia relativa acumulada se define acumulando la frecuencia relativa hasta

una clase especı́fica
2.4.2. Tabla de frecuencias

Para la construcción de la tabla de frecuencias se debe tener en cuenta los siguientes pasos:
1. Ordenar los datos de forma ascendente.
2. Definir el número de clases, elija el número de intervalos de acuerdo a la regla de

Sturges m = 1 + 3.322 · log10 (n).
3. Determinar la amplitud o ancho de clases.
M ax(x1 , . . . , xi ) − M in(x1 , . . . , xi )
c=
m
2.4 Buscando patrones de comportamiento en los datos 7
4. Establecer los lı́mites de cada clase. Se necesita abarcar la distancia el rango de los
datos. Una sugerencia seria en convertir el lı́mite inferior de la primera clase en un
múltiplo del intervalo de clase.
5. Contar el número de elementos de cada clase.
2.4.3. Nomenclatura de la tabla de frecuencias

0
Marca de clase (Xi ): Es el promedio entre el lı́mite inferior y lı́mite superior de cada
intervalo
Frecuencia absoluta (ni )

ni
Frecuencia relativa (fi ): fi =
n
Frecuencia absoluta acumulada (Ni )
Ni
Frecuencia relativa acumulada (Fi ): Fi =
n
Ejemplo 2.4.1 Los datos corresponden a medicones de precios de ventas en millones en un
consecionario de la ciudad de Santiago de Cali durante el mes de diciembre.
Tabla 2.1: Precios de vehı́culos vendidos en diciembre en Calima Motors, las unidades se
encuentran en millones de pesos
50.2 100.2 70 70.1 100.2 80.3 90.4 90.2
60.5 70.1 60.6 70.8 60.8 70.2 80.4 90.6
.
80.5 50.7 60.4 100.1 80.2 90 70.8 80.2
50.3 60.2 90.1 80.6 70 70.7 80.3 70.5
Con los datos de la Tabla 2.1 responda los siguientes interrogantes.
1. Construya una tabla de frecuencia para datos agrupados.
2. Interprete n2 , f4 ( %), N3 , F2 ( %).
Solución
1. Construcción de la tabla de frecuencias:
Ordenamos los datos.

Calculamos el número de clases: m = 1 + 3.3 · log10 (32) = 6
50.2 50.3 50.7 60.2 60.4 60.5 60.6 60.8

70 70 70.1 70.1 70.2 70.5 70.7 70.8
70.8 80.2 80.2 80.3 80.3 80.4 80.5 80.6
90 90.1 90.2 90.4 90.6 100.1 100.2 100.2
100.2 − 50.2
Amplitud del intervalo: c = = 8.33 ≈ 9
6
Empezamos con un valor por debajo del mı́nimo que es 50.2, por ejemplo 50.1 y le
vamos sumando la amplitud (9) hasta abarcar todo el rango de datos y completar
las seis clases:
0
m Li Ls Xi ni Ni fi ( %) Fi ( %)
1 (50.1 59.1] 54.6 3 3 9.4 9.4
2 (59.1 68.1] 63.6 5 8 15.6 25.0
3 (68.1 77.1] 72.6 9 17 28.1 53.1
4 (77.1 86.1] 81.6 7 24 21.9 75.0
5 (86.1 95.1] 90.6 5 29 15.6 90.6
6 (95.1 104.1] 99.6 3 32 9.4 100.0
32.00
2. Interpretación:
n2 = 5: 5 vehı́culos tuvieron un precio de venta 59.7 y 68.1 millones de pesos.
f4 ( %) = 21.9: El 21.9 % de los vehı́culos de la muestra tuvieron un precio de venta
entre 77.7 y 86.1 millones de pesos.
N3 = 17: 17 vehı́culos tuvieron un precio de venta máximo de 77.1 millones de pesos.
F2 ( %) = 25 El 25 % de los vehı́culos tuvieron un precio de venta máximo de 68.1
millones.
2.4.4. Tabla de frecuencias para variables cuantitativas discretas

Ejemplo: Es una empresa con cadena de montaje donde se fabrican cables de acero, se
realiza un estudio sobre la calidad de la producción. Los siguientes datos informan sobre el
numero de piezas defectuosas encontradas en una muestra de lotes examinados.
0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5
55566666777889
En la Tabla 2.2 se ilustra como queda la tabla de frecuencias del ejemplo.

2.4 Buscando patrones de comportamiento en los datos 9
Tabla 2.2: Distribución del número de piezas defectuosas.

Número de piezas ni fi ( %) Ni Fi ( %)
0 6 10.7 6 10.70
1 9 16.1 15 26.80
2 10 17.9 25 44.70
3 7 12.5 32 57.20
4 5 8.9 37 66.10
5 8 14.3 45 80.40
6 5 8.9 50 89.30
7 3 5.4 53 94.70
8 2 3.6 55 98.30
9 1 1.8 56 100.10
2.4.5. Tabla de frecuencia cuando la variable es cualitativa

Ejemplo: Tomamos como población 98 de las refinerı́as mas grandes en todo el mundo. Nos
fijamos en la variable o dato referente al paı́s donde están localizadas:
Bélgica Bélgica Bélgica Bélgica Francia Francia Francia Francia Francia Francia Francia
Francia Francia Francia Francia Francia Francia Francia Francia Francia Francia Francia
Francia Francia Francia Francia Finlandia Finlandia Alemania Alemania Alemania Alemania
Suiza USA Alemania Alemania Alemania Holanda Japón Japón Japón Japón Japón Japón
Japón Japón Japón Japón Suecia Suecia Suecia USA USA USA USA USA USA USA USA
USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA
USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA USA
USA USA USA USA
Cuando la variable es cualitativa y tiene una escala nominal sólo se puede interpretar la
frecuencia absoluta y frecuencia relativa. En la Tabla 2.3 se muestra la forma de organizar
este tipo de variable.
Tabla 2.3: Distribución de las refinerias más grandes a nivel mundial.

Refinerı́a ni fi ( %)
Alemania 7 7.2
Bélgica 4 4.1
Finlandia 2 2.1
Francia 22 22.7
Holanda 1 1.0
Japón 10 10.3
Suecia 3 3.1
Suiza 1 1.0
USA 47 48.5
2.5. Representación gráfica de los datos

Se ha visto que la tabla de frecuencias resume los datos que disponemos de una muestra,
ahora bien, para darnos cuenta de un solo vistazo de las caracterı́sticas de la muestra resulta
aun mas esclarecedor el uso de gráficos y diagramas.
2.5.1. Gráfico para variables cuantitativa discreta

Cuando representamos una variable discreta, usamos el diagrama de lineas:
Figura 2.1: Diagrama de lı́nea.
Cuando se realiza el gráfico con la frecuencia absoluta acumulada este deberı́a tomar forma
de escalera.
2.5 Representación gráfica de los datos 11
Figura 2.2: Gráfico de la distribución absoluta acumulada.
2.5.2. Gráfico para variables cuantitativa continua
Uno de los gráficos mas usados para este tipo de variables es el histograma de frecuencias,
para construirlo se divide el conjunto de datos en m clases, y se representan verticalmente
las frecuencias, absolutas o relativas, de las distintas clases.
Figura 2.3: Histograma de frecuencias.
La ojiva permite ver cuántas observaciones se encuentran por encima o debajo de ciertos
valores, en lugar de solo exhibir los números asignados a cada intervalo. Este tipo de
gráfico puede ser construido usando la frecuencia absoluta acumulada o la frecuencia relativa
acumulada.
Figura 2.4: Ojiva.
100
●
90
●
●
80
Fi (%)
●
70
60
●
50
(20,23] (23,26] (26,29] (29,32] (32,35] (38,41]
Intervalos
2.5.3. Gráfico para variables cualitativas
El diagrama de sectores es el mas usado y consisten en dividir un cı́rculo en tantas porciones

como clases existan, de modo que a cada clase le corresponde un arco de cı́rculo proporcional
a su frecuencia absoluta o relativa.
Figura 2.5: Gráfico de sectores.

2.6 Función empı́rica de distribución acumulada 13
2.6. Función empı́rica de distribución acumulada

La función empı́rica de distribución acumulada nos permite tener una proporción acumulada
hasta cualquier valor dentro de la distribución de la variable de estudio.

0

 para x ≤ L0
fi
F (x) = F (Li−1 ) + ci
· (x − Li−1 ) para Li−1 < x ≤ Li (2.1)


1 para x > Lm
para todo i = 1, 2, · · · , m.
Ahora si queremos calcular proporciones por encima de un valor especı́fico, usamos la
siguiente expresión:
F (X ≤ x) = 1 − F (x)
Si el interés es calcular proporciones entre dos valores, usamos la siguiente expresión:
F (a ≤ X ≤ b) = F (b) − F (a)
Ejemplo 2.6.1 En la Tabla 2.4 se tienen las notas del examen final del curso de Estadı́stica
1 en el periodo 2018-2.
Tabla 2.4: Distribución de las notas del examen final del curso de Estadı́stica 1
m Li L s ni Ni fi ( %) Fi ( %)
1 1.50 2.05 2 2 7.1 7.1
2 2.05 2.60 3 5 10.7 17.9
3 2.60 3.15 8 13 28.6 46.4
4 3.15 3.70 4 17 14.3 60.7
5 3.70 4.25 8 25 28.6 89.3
6 4.25 4.80 3 28 10.7 100.0
28
De acuerdo a la tabla anterior, responda

1. ¿Porcentaje de estudiantes con notas a lo sumo de 2.8?
2. ¿Porcentaje de estudiantes con notas mı́nimas de 3.9?
3. ¿Porcentaje de estudiantes con notas entre 2.8 y 3.9?
4. ¿Cantidad de estudiantes mı́nimas de 3.4?

Solución
1.
F (X ≤ 2.8) = F (2.8)
0.286
= 0.179 + · (2.8 − 2.6)
0.55
= 0.283
El 28.3 % de los estudiantes tuvieron notas a lo sumo de 2.8.
2.
F (X ≥ 3.9) = 1 − F (3.9)

0.286
= 1 − 0.607 + · (3.9 − 3.7)
0.55
= 1 − 0.711
= 0.289
El 28.9 % de los estudiantes tuvieron notas mı́nimas de 3.9.
3.
F (2.8 ≤ X ≤ 3.9) = F (3.9) − F (2.8)

0.286 0.286
= 0.607 + · (3.9 − 3.7) − 0.179 + · (2.8 − 2.6)
0.55 0.55
= 0.711 − 0.283
= 0.428
2.7. Indicadores de tendencia central

2.7.1. Promedio o media aritméticas
Promedio para datos no agrupados:
Si los valores de una variable son x1 , x2 , . . . , xn y denotamos la media como X̄ entonces:
n
1X
X̄ = xi (2.2)
n i=1
Ejemplo 2.7.1 Calcular la media aritmética del siguiente conjunto de

datos:30,75,79,80,80,105,126,138,149,179
2.7 Indicadores de tendencia central 15
Solución
1
X̄ = [30 + 75 + 79 + 80 + 80 + 105 + 126 + 138 + 149179] = 104.1
10
Promedio para datos agrupados:

En el caso que los datos estén agrupados en una distribución de frecuencias el calculo de la
media aritmética sigue la expresión:
m 0
X Xi · ni
X̄ = (2.3)
i=1
n
0
Donde Xi es el promedio de cada clase.
Ejemplo 2.7.2 Calcular la media aritmética para datos agrupados del Ejemplo 4.1
Solución
3 · 54.6 + 5 · 63.6 + 9 · 72.6 + 7 · 81.6 + 5 · 90.6 + 3 · 99.6

X̄ = = 76.818
32
Interpretación: El precio de venta promedio de los vehı́culos de la muestra fue 76.818
millones.
2.7.2. Propiedades de la media aritmética

La suma de las desviaciones de los datos con respecto a su media es cero.
Propiedad 1
n
X
xi − X̄ = 0 (2.4)
i=1
Propiedad 2: La suma de los cuadrados de las desviaciones de los datos con respecto
a un valor a es mı́nima cuando a = X̄
n
X
(xi − a)2 (2.5)
i=1
Propiedad 3: Si xi = k para todo i, es decir, todos los datos son iguales a una
constante, entonces:
X̄ = k (2.6)
Propiedad 4: Si todos los datos de una muestra se multiplican por una constante, el
nuevo promedio seria la constante por el promedio inicial:
y i = a · xi (2.7)
Ȳ = a · X̄ (2.8)
Propiedad 5: Si zi = axi + byi para todo i, donde a y b son constantes, entonces:
Z̄ = aX̄ + bȲ (2.9)
Propiedad 6: Si una muestra de n individuos se divide en k−submuestras de tamaño

n1 , n2 , . . . , nk y con promedios x̄1 , x̄2 , . . . , x̄k , entonces:
x̄1 n1 + x̄2 n2 + . . . + x̄k nk

X̄G = (2.10)
n1 + n2 + . . . + nk
2.7.3. Media ponderada

Constituye un caso especial de media aritmética, se presenta cuando varias observaciones
con el mismo valor.
Pn
w i xi
X̄w = Pi=1
n (2.11)
i=1 wi
Ejemplo 2.7.3 Un restaurante vende refrescos medianos, grandes y gigantes a $0.90, $1.25
y $1.50. De las 10 últimas bebidas que se vendieron 3 eras medianas, 4 grandes y 3 gigantes.
Determine el precio promedio.
Solución
3 · 0.9 + 4 · 1.25 + 3 · 1.5

X̄w = = 8.15
3+4+3
Interpretación: El precio promedio de acuerdo al tipo de refresco fue de 8.15 dólares.
2.7 Indicadores de tendencia central 17
2.7.4. Media geométrica

Resulta importante para determinar el cambio promedio de porcentajes, razones, indices o
tasas.
√
MG = n
x1 · x2 · · · xn (2.12)
Ejemplo 2.7.4 Suponga que usted recibió un 5 % de incremento salarial este año y 15 % de
incremento el siguiente. Calcule el incremento anual promedio.
Solución
√
Mg = 5 · 15 = 8.66
Interpretación: El incremento anual promedio fue de 8.66 %.
2.7.5. La mediana
La mediana es el valor que no es superado por mas del 50 % de los datos.
Mediana para datos no agrupados: Primero se organizan los datos en orden ascendente:

x( n+1
2 )
, si n es impar


Me = (2.13)
 x( n2 ) +x( n2 +1)


2
, si n es par
Ejemplo 2.7.5 Calcular la mediana de las edades de una muestra de personas de una unidad
residencial: 19 27 31 14 19 42 28 57 52 53 13 57 42 38 16
Solución
Ordenamos los datos: 13,14,16,19,19,27,28,31,38,42,42,52,53,57,57
Identificamos la posición.
13 14 16 19 19 27 28 31 38 42 42 52 53 57 57
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15)
Puesto que n = 15 es impar, aplicamos la expresión:
M e = x( 15+1 ) = x(8) = 31
2
Interpretación: El 50 % de la muestra de personas de la unidad residencial tienen 31

años o menos.
Mediana para datos agrupados

0.5 − FLi−1
M e = Li−1 + · ci (2.14)
fi
Ejemplo 2.7.6 Calcular la Mediana de los datos del los datos del Ejemplo 4.1.
Solución
(0.5 − 0.25)
M e = 68.1 + · 9 = 76.107
0.281
Interpretación: El 50 % de los vehı́culos tuvieron un precio de venta máximo de 76.107
millones.
2.7.6. La moda
En el caso de variables cuantitativas discretas, la moda es el valor de la observación
que aparece con mas frecuencia. En el caso de variable cuantitativas continuas, la moda
corresponde a los valores alrededor de los cuales se produce la mayor concentración de los
datos. En la literatura hay algunas expresiones que nos permiten tener un valor aproximado
para datos agrupados, para determinar los valores a utilizar es necesario identificar la clase
donde se encuentra la mayor frecuencia absoluta o relativa.
fi+1
M o = Li−1 + (2.15)
fi−1 + fi+1
Ejemplo 2.7.7 Calcular la moda del conjunto de datos del Ejemplo 4.1.
2.8 Indicadores de dispersión 19
Solución
La clase de referencia
0.156
M o = 68.1 + = 68.516 (2.16)
0.219 + 0.156
Interpretación: La mayorı́a de los vehı́culos tuvieron un precio de venta alrededor de 68.516
millones.
2.8. Indicadores de dispersión

Los indicadores de dispersión o variabilidad evalúan la confiabilidad de la información
obtenida por algunos indicadores de tendencia central. Ya que la representatividad de los
indicadores depende de la dispersión de los datos.
2.8.1. Rango
Se define como la distancia entre el valor máximo y el valor mı́nimo:
Rango = max (x1 , . . . , xn ) − min (xi , . . . , xn ) (2.17)
Nota: El rango es sensible a valores extremos.
2.8.2. Varianza
La varianza es la medida de dispersión mas utilizada en el análisis estadı́stico.
Varianza para datos no agrupados:
n
2 1 X 2
S = xi − X̄ (2.18)
n − 1 i=1
Varianza para datos agrupados

m
2 1 X 0 2
S = ni · Xi − X̄ (2.19)
n − 1 i=1
2.8.3. Desviación estándar

Con la varianza no es posible realizar una interpretación directa, puesto que las unidades se
encuentran elevadas al cuadrado, sin embargo con la desviación estándar es posible realizar
dichas interpretaciones.
Desviación estándar para datos no agrupados

v
u n
u 1 X 2
S=t xi − X̄ (2.20)
n − 1 i=1
Desviación estándar para datos agrupados

v
u m
u 1 X 0 2
S= t ni · Xi − X̄ (2.21)
n − 1 i=1
Ejemplo 2.8.1 Con el objetivo de evaluar el nivel de dispersión del tiempo de atención de
una entidad bancaria de la ciudad de Cali. Para esto, se tomó una muestra de clientes y se
reportó el tiempo de atención en minutos: 17.9, 33.0, 3.8, 7.5, 19.4, 59.9, 12.0, 18.6.
Solución
Puesto que el conjunto de datos es pequeño, no vale la pena agruparlos por lo tanto se utiliza
la expresión de la varianza y desviación estándar para datos no agrupados.
(17.9 + 33.0 + 3.8 + 7.5 + 19.4, 59.9 + 12.0 + 18.6)

X̄ = = 21.51
8
Varianza:
1
S2 = (3 · (54.6 − 76.82)2 + 5 · (63.6 − 76.82)2 + 9 · (72.6 − 76.82)2 +
8−1
= 7 · (81.6 − 76.82)2 + 5 · (90.6 − 76.82)2 + 3 · (99.6 − 76.82)2 )
= 167.1441548
Nota: La varianza no se interpreta porque sus unidades están elevadas al cuadrado.
Desviación estándar:
√
S = 167.144 = 12.92
Interpretación: Los precios de los vehı́culos vendidos se dispersan con respecto al promedio
de venta en 12.92 millones.
2.8.4. Propiedades de la varianza:

S2 ≥ 0
Si xi = k, entonces S 2 = 0
Si yi = kxi , entonces Sy2 = k 2 Sx2
Si yi = k + xi , entonces Sy2 = Sx2

2.8 Indicadores de dispersión 21
2.8.5. Coeficiente de variación

Es una medida que se emplea fundamentalmente para:
Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de

unidades de medida. Por ejemplo, kilogramos y centı́metros.
Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas
distintas.
Comparar dos grupos de datos que tienen distinta media.
Determinar si cierta media es consistente con cierta varianza.
El coeficiente de variación muestral se denota:
S
CV % = × 100 (2.22)
X̄
Ejemplo 2.8.2 Con un micrómetro, se realizan mediciones del diámetro de un balero, que
tienen una media de 4.03 mm y una desviación estándar de 0.012 mm; con otro micrómetro
se toman mediciones de la longitud de un tornillo que tiene una media de 1.76 pulgadas
y una desviación estándar de 0.0075 pulgadas. ¿Cuál de los dos micrómetros presenta una
variabilidad relativamente menor?.
Solución
Para este ejercicio es de suma importancia observar que las mediciones de cada micrómetro
tienen unidades diferentes, el primero esta en milı́metros y el segundo pulgadas, por lo tanto,
para comparar la dispersión se debe usar el coeficiente de variación.
0.012
CVM 1 ( %) = · 100 = 0.297 %
4.03
0.0075
CVM 2 ( %) = · 100 = 0.426 %
1.76
Interpretación: Los resultados indican que la variabilidad relativa es menor cuando las
mediciones son tomadas con el micrómetro 1.
2.8.6. Teorema de Chebyshev

Si una variable aleatoria tiene una varianza o desviación estándar pequeña,esperarı́amos que
la mayorı́a de los valores se agrupan alrededor de la media. Por lo tanto, la proporción de
observaciones provenientes ya sea de una muestra o una población, que se encuentran a k
desviaciones estándares de la media es de por lo menos:
1
1− (2.23)
k2
Donde k > 1
Ejemplo 2.8.3 Con el objetivo de evaluar el funcionamiento del proceso de llenado de una
bebida, se reportaron mediciones del nivel de llenado en mililitros. Previamente se realizó un
análisis exploratorio de datos y se determinó que la distribución de las mediciones sigue una
distribución con forma de campana. Los resultados arrojaron una media muestral de 100 ml
y una desviación estándar de 20 ml. De acuerdo a esto, el gerente de producción desea saber
entre que valores se encuentra el 68 % de las mediciones de la muestra.
Solución
1
1− = 0.68
k2
1
0.32 = 2
k
r
1
k= = 1.767
0.32
Linf erior = 100 − 1.767 · 20 = 64.66

Lsuperior = 100 + 1.767 · 20 = 135.34
Interpretación: De acuerdo a la muestra de mediciones realizadas para evaluar el proceso

de llenado, el 68 % de las mediciones se encuentran entre 64.66 y 135.34 ml.
2.8.7. Regla empı́rica

La regla empı́rica es la regla estadı́stica para la distribución normal y se establece con la
media y la desviación estándar. Según ésto, el 68 % de los datos se encuentran dentro de
la primera DE, el 95 % dentro de las dos primeras DE y 99.7 % dentro de las tres primeras
desviaciones estándar.
2.9 Ejercicios. Fuente: Douglas et al. (2012), Levin & Rubin (2004) 23
2.9. Ejercicios. Fuente: Douglas et al. (2012), Levin &

Rubin (2004)
About Census at School
Under the direction of their teachers, students in grades 4 to 12 anonymously complete an
online questionnaire, thus submitting the data to a national database. The questions ask
about such things as the length of their right foot, height, favorite subject in school, and
how long it takes them to get to school. Thirteen questions are common to every country
participating in Census at School, but each country adds its own questions specific to the
interests of its students. Periodically, the national data from the 13 common questions go
to an international database maintained in the UK.
To complete the online class survey, each student will need approximately 15 to 20
minutes of Internet access. After students have answered the survey, their teacher will
have immediate access to their class results. These are used to teach statistical concepts,
measurement, data analysis, and graphing, as well as to explore social concepts. Students
can compare their class data with random samples from other students around the country
and with random samples of responses from the international database.
Descargar el cuestionario en el siguiente enlace:

http://ww2.amstat.org/censusatschool/pdfs/C@SQuestionnaire.pdf
De acuerdo a la información suministrada sobre el censo escolar y el cuestionario que

descargó, responda las preguntas 1 y 2:
1. Con respecto al estudio defina:
a) Unidad de estudio.
b) Población objeto de estudio.
c) Muestra de estudio.
2. Para las preguntas 1, 2, 4, 7, 9, 11, 13 , 24, 26, 28, 38, defina:
a) Variable de análisis.
b) Tipo de variable.
c) Escala de medición.
3. Entre al siguiente enlace: http://ww2.amstat.org/censusatschool/ seleccione las

siguientes opciones:
Random Sampler → Accept → Sample Size = 50 → State=Iowa→ Grade
level=All Grades→ Gender=All→ Data Collection Year:=All
De acuerdo a la información que descargó responda los siguientes interrogantes:
a) Encuentre la variabilidad relativa de la estatura Height cm por genero (Nota:

Utilice los indicadores para datos no agrupados).
b) Construya la tabla de frecuencias para las variables: Languages spoken,
Travel to School y Doing Homework Hours.
4. Utilizando la siguiente tabla de frecuencia de la variable Travel time to School,

responda:
m Clases ni Ni fi Fi
1 (0.9,7.3] 22 22 0.46 0.46
2 (7.3,13.6] 16 38 0.33 0.79
3 (13.6,19.9] 1 39 0.02 0.81
4 (19.9,26.1] 3 42 0.06 0.88
5 (26.1,32.4] 2 44 0.04 0.92
6 (32.4,40] 4 48 0.08 1.00
a) ¿Cuál es el porcentaje de estudiantes que emplearon máximo 20 minutos en llegar

a la escuela?
b) ¿Cuál es el porcentaje de estudiantes que emplearon mı́nimo 34 minutos en llegar
a la escuela?
c) ¿Cuál es el porcentaje de estudiantes que tardaron entre 10 y 35 minutos?
d ) Calcule el tiempo de viaje promedio a la escuela.
e) ¿La mitad de los estudiantes de la muestra tuvieron un tiempo de viaje a la
escuela menor o igual a?
f ) ¿La mayorı́a de los estudiantes tuvieron un tiempo de viaje a la escuela entre que
valores?
g) Encuentre la variabilidad relativa del tiempo de viaje a la escuela.

h) ¿El 25 % de los estudiantes tuvieron un tiempo de viaje menor o igual a?
i ) ¿El 75 % de los estudiantes tuvieron un tiempo de viaje menor o igual a?
j ) ¿Calcule el nivel de curtosis y asimetrı́a de la distribución del tiempo de viaje?
5. Los datos que se presentan a continuación corresponden a los tiempos de atención (en
minutos) de los clientes de un banco:
m Clases ni Ni fi ( %) Fi ( %)
1 (4.18 , 7.41] 3 3 6 6
2 (7.41 , 10.6] 3 6 6 12
3 (10.6 , 13.8] 10 16 20 32
4 (13.8 , 17.1] 15 31 30 62
5 (17.1 , 20.3] 13 44 26 88
6 (20.3 , 23.5] 5 49 10 98
7 (23.5 , 26.7] 1 50 2 100
a) Interprete: n2 , f3 , N4 y F2 %.
b) ¿Cuál es el porcentaje de clientes atendidos entre 12 y 20 minutos?
c) Proporción de clientes que han sido atendidos en máximo 19.5 minutos.
d ) Porcentaje de clientes que han sido atendidos en mı́nimo 11.9 minutos.
Capı́tulo 3
Repaso Corte 1
A continuación se presentan una serie de propuestas de evaluación con el objetivo de que el

estudiante tenga una marco de referencia que le ayude a mejorar el desempeño en la primera
evaluación del curso.
3.1. Examen 1
1. Una empresa encargada del procesamiento de filetes de pescado, tiene como objetivo
determinar las caracterı́sticas óptimas para la preservación del producto. Las variables
más importantes para determinar la calidad de este producto son las Bases
Nitrogenadas Volátiles Totales (TVB-N) y la Proteı́na Sarcoplasmática (PS), ambas
variables están medidas en porcentaje. Para esto, el departamento de control de calidad
ha decidido analizar una muestra de 45 filetes del último lote procesado. A continuación
se presentan los resultados obtenidos:
Figura 3.1: Comportamiento de la distribución de valores de TVB-N (Izquierda) y PS

(Derecha).
1 1
1.0
1.0
0.82
0.8
0.8
0.69 0.69
0.6
0.6
0.53
Fi
Fi
0.4
0.4
0.31
0.29
0.2
0.2
0.0
0.0
(13.3,32.1] (32.1,50.8] (50.8,69.6] (69.6,88.3] (0.15,0.257] (0.257,0.365] (0.365,0.473] (0.473,0.58]

3.1 Examen 1 27
De acuerdo a los resultados anteriores responda:
a) ¿Cuál de las dos variables tiene un comportamiento más homogéneo en el producto

analizado?.
b) En un lote procesado se descarta cuando el 71 % de la muestra tienen valores de
TVB-N mayores a 70. ¿Se descartarı́a el lote analizado?.
2. El subconjunto de todos los elementos objeto de estudio para una caracterı́stica

determinada se denomina (justifique su respuesta):
a) Estadı́stica descriptiva.
b) Muestra.
c) Población.
d ) Estadı́stico
3. Con la siguiente información responda, se puede afirmar que hay puntos atı́picos en los
datos: Mı́n(xi): 0.3; Máx(xi): 5.7; Q1 : 1.85; Q2 : 2.56; Q3 : 3.29. Utilice un procedimiento
adecuado.
4. La Distribución de frecuencias de la duración de las llamadas (minutos) para una

muestra de 80 reservaciones telefónicas de vuelos que se realizaron a National Airlines
a partir de Enero 15 hasta febrero 24 de 2016 es la siguiente:
Li Ls
0
Xi ni fi Ni Fi
1.25 1.55 3
1.55 1.85 15
1.85 2.15 36
2.15 2.45 61
2.45 2.75 72
2.75 3.05 80
¿Qué porcentaje de las reservaciones telefónicas presentaron un tiempo de duración de

por lo menos 2,35 minutos?. Utilice un procedimiento adecuado.
28 3 Repaso Corte 1
3.2. Examen 2
1. Diga el tipo de variable y la escala de medición de las siguientes variables:
a) Estrato social (I, II, III, IV).

b) Temperatura de un generador de energı́a.
c) Número de piezas defectuosas por lote de producción.
d ) Resistencia a la compresión de una barra de aluminio.
2. Responde las siguientes preguntas:
a) ¿Cuales son los dos tipos de estadı́stica más importantes y para que sirven?
b) Defina los siguientes términos: Muestra, Parámetro, Estadı́stico
3. Una empresa consultora de investigación en materiales está encargada de caracterizar la

composición de aluminio de un material nuevo en el mercado. Para ello se observaron
200 barras de aluminio a los cuales se les midió el contenido de aluminio (gramos),
presentando la siguiente distribución de frecuencias:
Li−1 Li ni fi Ni Fi
9.7 15.7 0.35 70 0.35
15.7 21.7 46 0.23 116
21.7 27.7 30 0.73
27.7 33.7 0.27 1
a) Complete la tabla de frecuencias.

b) Calcule e interprete el promedio y la mediana
3.3. Examen 3
1. Los talleres AndresCarAudio registran las ventas (miles de pesos) de servicios
extendidos: 823, 648, 321, 634, 752, 669, 427, 555, 904, 586, 722, 360, 468, 847, 641,
217, 588, 349, 308, 766. A continuación se presentan los resultados obtenidos de un
informe descriptivo:
Responda usando la información de la Tabla 1 y Tabla 2:
a) La compañı́a tiene la creencia de que una sucursal no puede mantenerse

financieramente con menos de 455 (miles de pesos) en ventas diarias. Indique
cuántas sucursales no pueden mantenerse. Es también polı́tica de la compañı́a
otorgar una bonificación económica al gerente de la sucursal que genere más de
745 (miles de pesos) diarios. ¿Qué porcentaje recibirán la bonificación?
3.3 Examen 3 29
Tabla 3.1: Tabla de frecuencias de las ventas Tabla 3.2: Estadı́sticos descriptivos de
de servicio extendido. las ventas de servicio extendido.
m Intervalo ni Ni fi Fi Indicador Valor
1 (216,389] 5 5 0.25 0.25 Promedio 577.52
2 (389,560] 3 8 0.15 0.40 Varianza 38589.62
3 (560,732] 7 15 0.35 0.75 Asimetrı́a -0.23
4 (732,905] 5 20 0.25 1.00 Curtosis 1.54
b) (0.5) ¿El 30 % de las surcusales tuvieron ventas mı́nimas de?

c) (0.5) Entre que valores de ventas con respecto a la media se encuentra el 58 % de
los datos.
d ) (0.5) ¿Existen datos atı́picos en la información suministrada por la empresa?
e) (0.5) Indique e interprete la forma y el tipo de asimetrı́a. Finalmente, usted podrı́a
decir que las ventas de servicios extendidos fueron heterogéneas.
2. Con el objetivo de evaluar las plataformas tecnológicas de transporte para que

socios conductores se conecten fácilmente con usuarios que buscan viajes seguros y
conductores confiables. La siguiente información corresponde a ingresos totales por
viajes (en miles de pesos) de cuatro plataformas que ofrecen servicios de transporte en
la ciudad de Cali.
Figura 3.2: Diagrama de cajas por

plataformas.
250
Tabla 3.3: Resumen descriptivo por

200
plataformas.
Empresa de Número Promedio Desviación Coeficiente
Ingresos (miles de pesos)
transporte de viajes estándar de asimetrı́a

Cabify 40 166.65 37.94 -0.19
150
Super Taxis 27 156.78 29.32 0.16

Taxi express 16 149.69 3.55 0.53
UBER 20 129.25 35.88 0.03
Total 103
100
50
Cabify Super Taxis Taxexpress UBER
Plataforma
Responda usando la información argumentando usando la información suministrada:

30 3 Repaso Corte 1
a) ¿Qué porcentaje de viajes de la muestra fueron realizados por la plataforma

SUPER TAXIS?
b) ¿Cuál es el ingreso promedio de los 103 viajes de la muestra?
c) ¿En términos generales cuál plataforma genera los mayores ingresos? ¿Cuál
plataforma de transporte tiene menos ingresos?
d ) ¿En términos generales en qué plataforma los ingresos fueron más variables? ¿En
qué plataforma fueron menos variables?
e) Si usted fuese a invertir en algunas de estas plataformas teniendo en cuenta el
informe descriptivo anterior, ¿Mencione dos plataformas de transporte en las que
invertirı́a y por qué?
Capı́tulo 4
Conceptos de probabilidad
En este capitulo se abordaran los conceptos preliminares del calculo de probabilidades,

pasando por la teoria de conjuntos, operaciones con eventos, defición de la probabilidad,
probabilidad condicional y teora de bayes Levin & Rubin (2004).
4.1. Algunas relaciones de teorı́a de conjuntos

Un evento no es otra cosa que un conjunto, por lo tanto las relaciones y resultados de la
teorı́a elemental de conjuntos se puede usar para estudiar eventos.
Figura 4.1: Diagrama de Venn de los eventos A y B.
4.1.1. Unión (∪)

La unión de dos eventos A y B denotada por A ] B y que se lee A unión B, es el evento
que consiste en los resultados que están ya sea en A o en B o en ambos eventos. Es decir,
los resultados en por lo menos uno de los eventos.
32 4 Conceptos de probabilidad
Figura 4.2: Unión de eventos A ∪ B.
4.1.2. Intersección (∩)

La intersección de dos eventos A y B denotada por A ∩ B y que se lee A intersección B, es
el evento que consiste en los resultados que están tanto en A como en B.
Figura 4.3: Intersección de A ∩ B.
4.1.3. Complemento
0
El complemento de un evento A, denontado por A , es el conjunto de todos los resultados
en S.
0
Figura 4.4: Complemento A .
4.2 Axiomas, interpretaciones y propiedades de la probabilidad 33
4.1.4. Eventos mutuamente excluyentes

Dos o más eventos son mutuamente excluyentes o disjuntos, si no pueden ocurrir
simultáneamente. Es decir, la ocurrencia de un evento impide automáticamente la ocurrencia
del otro evento (o eventos).
Figura 4.5: Eventos mutuamente excluyentes.
Ejemplo 4.1.1 Para el experimento donde se observa el número de bombas en uso en una
sola gasolineria con seis bombas, sea A = {0, 1, 2, 3, 4}, B = {3, 4, 5, 6} y C = {1, 3, 5}.
0 0
Encontrar: A ∪ B, A ∪ C , A ∩ B, A ∩ C, A y {A ∪ B}
Solución
A ∪ B = {0, 1, 2, 3, 4, 5, 6}
A ∪ C = {0, 1, 2, 3, 4, 5}
A ∩ B = {3, 4}
A ∩ C = {1, 3}
0
A = {5, 6}
0
(A ∪ B) = {}
4.2. Axiomas, interpretaciones y propiedades de la

probabilidad
Dados un experimento y un espacio muestral S, el objetivo de la probabilidad es asignar a
cada evento A un número P (A), denominado probabilidad del evento A, que dará una medida
más precisa de la probabilidad de que ocurra el evento A.
4.2.1. Axiomas
Para cualquier evento A, P (A) ≥ 0
P (S) = 1
Si A1 , A2 , . . . , Ak es una colección finita de eventos mutuamente excluyentes, entonces

X k
P (A1 ∪ A2 ∪ . . . Ak ) = P (Ai )
i=1
Si A1 , A2 , A3 , . . . es una colección infinita de eventos mutuamente excluyentes, entonces

P (A1 ∪ A2 ∪ A3 ∪ . . .)
4.2.2. Definición de probabilidad

Sea un evento A, entonces
N (A)
P (A) = (4.1)
N (S)
Donde N (A) son los resultados del evento A y N (S) son los resultados del espacio muestral
S.
4.2.3. Propiedades de la probabilidad

0
Para cualquier evento A, P (A) = 1 − P (A )
Si A y B son mutuamente excluyentes, entonces P (A ∩ B) = 0
Para dos eventos cualesquiera A y B, P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
Ejemplo 4.2.1 En un determinado suburbio residencial, 60 % de los hogares se suscriben

al periódico metropolitano publicado en una ciudad cercana, 80 % se suscriben al periódico
local y 50 % se suscriben a ambos periódicos. Si se selecciona al azar una familia, ¿cuál es la
probabilidad de que esté suscrita 1) al menos a uno de los dos periódicos y 2) exactamente
a uno de los dos periódicos?
Solución: Sea el evento A ∪ B se suscribe por lo menos a uno de los dos periódicos.
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
P (A ∪ B) = 0.6 + 0.8 − 0.5
P (A ∪ B) = 0.9
4.2 Axiomas, interpretaciones y propiedades de la probabilidad 35
Ahora el evento de que una familia solo se suscriba al periódico local se puede escribir como
0
A ∩ B:
0
P (A ∩ B) = P (A ∪ B) − P (A)
0
P (A ∩ B) = 0.9 − 0.6
0
P (A ∩ B) = 0.3
Ahora el evento de que una familia solo se suscriba al periódico metropolitano se puede
0
escribir como A ∩ B :
0
P (A ∩ B ) = P (A ∪ B) − P (B)
0
P (A ∩ B ) = 0.9 − 0.8
0
P (A ∩ B ) = 0.1
Sea el evento D la probabilidad de que una familia se suscriba exactamente a uno de los dos
periódicos:
0 0
P (D) = P (A ∩ B) + P (A ∩ B )
P (D) = 0.3 + 0.1
P (D) = 0.4
Un resultado importante es la probabilidad de la unión de mas de dos eventos, se puede

calcular de manera análoga para tres eventos A, B, C:
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B)−

P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)
Otro interpretación importante son los resultados equiprobables, ya que en muchos
experimentos que consta de N resultados, es razonable asignar probabilidades iguales a
los N eventos simples, donde p = P (Ei ):
N
X N
X
1= P (Ei ) = p·N
i=1 i=1
Si despejamos p tenemos que:
p·N =1
1
p=
N
Ejemplo 4.2.2 Cuando se lanzan por separado dos dados, calcule la probabilidad del evento
A = {suma de dos números sea igual a 7}
Solución:
Dado 2
Dado 1 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
nA 6
P (A) = = = 0.166
nΩ 36
4.3. Probabilidad condicional

Para dos eventos cualesquiera A y B con P (B) > 0, la probabilidad condicional de A dado
que ocurrió B se define como
P (A ∩ B)
P (A/B) = (4.2)
P (B)
4.4. Teorema de Bayes

Sean A1 , . . . , Ak eventos mutuamente excluyentes y exhaustivos. Entonces para cualquier
otro evento B,
k
X
P (B) = P (B/A1 )P (A1 ) + . . . + P (B/Ak )P (Ak ) = P (B/Ai )P (Ai ) (4.3)
i=1
Sea A1 , A2 , . . . , Ak una colección de k eventos mutuamente excluyentes y exhaustivos con

P (Ai ) > 0 para i = 1, . . . , k. Entonces para cualquier otro evento B para el cual P (B) > 0,
P (Aj ∩ B) P (B/Aj )P (Aj )

P (Aj /B) = = Pk (4.4)
P (B) i=1 P (B/Ai ) · P (Ai )
Ejemplo 4.4.1 Una fábrica de enlatados produce 5000 envases diarios. La máquina A
produce 3000 de estos envases, de los que el 2 % son defectuosos y la máquina B produce los
2000 restantes de los que se sabe que el 4 % son defectuosos. Determinar:
1. La probabilidad de que un envase elegido al azar sea defectuoso.
2. ¿Si el envase seleccionado es defectuoso, qué probabilidad hay de que proceda de la

máquina A?¿y de la B?
Solución:
1.
Envase defectuosos de la máquina A:

3
P (A ∩ D) = P (A) · P (D/A) = · 0.02 = 0.012
5
Envase defectuosos de la máquina A:

2
P (B ∩ D) = P (B) · P (D/B) = · 0.04 = 0.016
5
Probabilidad de que un envase elegido al azar sea defectuoso:
P (D) = 0.012 + 0.016
2.
Probabilidad de que provenga de la máquina A:
P (A ∩ D) 0.012
P (A/D) = = = 0.4286
P (D) 0.028
Probabilidad de que provenga de la máquina B:
P (B ∩ D) 0.016
P (B/D) = = = 0.5714
P (D) 0.028

Rubin (2004)
1. Al final del semestre John se va a graduar en la facultad de ingenierı́a industrial de una
universidad. Después de tener entrevistas en dos empresas en donde quiere trabajar,
determina que la probabilidad que tiene de lograr una oferta de empleo en la empresa
A es 0.8, y que la probabilidad de obtenerla en la empresa B es 0.6. Si, por otro
lado, considera que la probabilidad de recibir ofertas de ambas empresas es 0.5, ¿qué
probabilidad tiene de obtener al menos una oferta de esas dos empresas?
2. Si las probabilidades de que un mecánico automotriz dé servicio a 3, 4, 5, 6, 7, 8

o más vehı́culos en un dı́a de trabajo dado son 0.12, 0.19, 0.28, 0.24, 0.10 y 0.07,
respectivamente, ¿cuál es la probabilidad de que dé servicio al menos a 5 vehı́culos el
siguiente dı́a de trabajo?
3. Suponga que las especificaciones del fabricante para la longitud del cable de cierto
tipo de computadora son 2000 ± 10 milı́metros. En esta industria se sabe que el
cable pequeño tiene la misma probabilidad de salir defectuoso (de no cumplir con las
especificaciones) que el cable grande. Es decir, la probabilidad de que aleatoriamente
se produzca un cable con una longitud mayor que 2010 milı́metros es igual a la
probabilidad de producirlo con una longitud menor que 1990 milı́metros. Se sabe que
la probabilidad de que el procedimiento de producción cumpla con las especificaciones
es 0.99.
a) ¿Cuál es la probabilidad de que un cable elegido al azar sea muy largo?

b) ¿Cuál es la probabilidad de que un cable elegido al azar sea más grande que 1990
milı́metros?
4. Suponga que se descubre que, en un grupo de 500 estudiantes universitarios de último

año, 210 fuman, 258 consumen bebidas alcohólicas, 216 comen entre comidas, 122
fuman y consumen bebidas alcohólicas, 83 comen entre comidas y consumen bebidas
alcohólicas, 97 fuman y comen entre comidas y 52 tienen esos tres hábitos nocivos para
la salud. Si se selecciona al azar a un miembro de este grupo, calcule la probabilidad
de que el estudiante
a) Fume pero no consuma bebidas alcohólicas;

b) Coma entre comidas y consuma bebidas alcohólicas pero no fume.
c) No fume ni coma entre comidas.
5. Basado en su experiencia, un agente bursátil considera que en las condiciones

económicas actuales la probabilidad de que un cliente invierta en bonos libres de
impuestos es 0.6, la de que invierta en fondos comunes de inversión es 0.3 y la de
que invierta en ambos es 0.15. En esta ocasión encuentre la probabilidad de que un
cliente invierta
a) En bonos libres de impuestos o en fondos comunes de inversión;

b) En ninguno de esos dos instrumentos.
6. A los obreros de las fábricas se les motiva constantemente a practicar la tolerancia cero
para prevenir accidentes en el lugar de trabajo. Los accidentes pueden ocurrir porque el
ambiente o las condiciones laborales son inseguros. Por otro lado, los accidentes pueden
ocurrir por negligencia o fallas humanas. Además, los horarios de trabajo de 7:00 a.m.
a 3:00 p.m. (turno matutino), de 3:00 p.m. a 11:00 p.m. (turno vespertino) y de 11:00
p.m. a 7:00 a.m. (turno nocturno) podrı́a ser un factor. El año pasado ocurrieron 300
accidentes. Los porcentajes de los accidentes por la combinación de condiciones son los
que siguen:
Turno Condiciones Fallas

inseguras humanas
Matutino 5% 32 %
Vespertino 6% 25 %
Nocturno 2% 30 %
Si se elige aleatoriamente un reporte de accidente de entre los 300 reportes,
a) ¿Cuál es la probabilidad de que el accidente haya ocurrido en el turno nocturno?

b) ¿Cuál es la probabilidad de que el accidente haya ocurrido debido a una falla
humana?
c) ¿Cuál es la probabilidad de que el accidente haya ocurrido debido a las condiciones
inseguras?
d ) ¿Cuál es la probabilidad de que el accidente haya ocurrido durante los turnos
vespertino o nocturno?
7. La siguiente es una clasificación, según el género y el nivel de escolaridad, de una

muestra aleatoria de 200 adultos.
Escolaridad Hombre Mujer

Primaria 38 45
Secundaria 28 50
Universidad 22 17
Si se elige una persona al azar de este grupo, ¿cuál es la probabilidad de que:
a) ¿la persona sea hombre, dado que su escolaridad es de secundaria?

b) ¿la persona no tenga un grado universitario, dado que es mujer?
8. Las probabilidad de que tres eventos A, B y C ocurran son P (A) = 0.35, P (B) = 0.45
y P (C) = 0.2. Suponga que ocurrió A, B o C, las probabilidades de que ocurra otro
evento X son P (X/A) = 0.8, P (X/B) = 0.65 y P (X/C) = 0.3. Encuentre P (A/X),
P (B/X) y P (C/X).
9. El doctor ha decidido recetar dos nuevos medicamentos a 200 pacientes cardiacos de

la siguiente manera: 50 obtienen el medicamento A, 50 obtienen el medicamento B y
100 obtienen ambos. Los 200 pacientes se eligieron de manera que cada uno tiene 80 %
de posibilidad de tener un ataque cardiaco si no toma uno de los medicamentos. El
A reduce 35 % la probabilidad de un ataque al corazón, el B la reduce 20 % y los dos
tomados juntos realizan su trabajo independientemente. Si un paciente del programa
seleccionado en forma aleatoria tiene un ataque cardı́aco, ¿cuál es la probabilidad de
que el paciente haya recibido los dos medicamentos?
10. El departamento de crédito de Lion?s Department Store en Anaheim, California,

informó que 30 % de las ventas se paga con efectivo o con cheque; 30 % con tarjeta
de crédito, y 40 % con tarjeta de débito. Veinte por ciento de las compras con efectivo
o cheque, 90 % de las compras con tarjeta de crédito y 60 % de las compras con tarjeta
de débito son por más de $50. La señora Tina Stevens acaba de comprar un vestido
nuevo que le costó $120. ¿Cuál es la probabilidad de que haya pagado en efectivo o
con cheque?
Capı́tulo 5
Variable aleatoria
Cantidad que resulta de un experimento que, por azar, puede adoptar diferentes valores.
5.1. Función de Distribución Acumulada

La función de distribución describe el comportamiento probabilı́stico de una variable
aleatoria X asociada a un experimento aleatorio y se representa como F (X).
5.1.1. Caso discreto

Sea X una variable aleatoria discreta asociada a un espacio probabilı́stico, se define la función
de distribución:
X
F (X) : R → [0, 1] que verifica F (X) = P [X ≤ x] = Pi (5.1)
xi <x
X 0 1 2 3
P (X) 1/8 3/8 3/8 1/8
Ejemplo 5.1.1 Calcule la probabilidad de obtener menos de dos caras

Solución:
F (1) = P (X ≤ 1) = P (X = 0) + P (X = 1) = 1/8 + 3/8 = 4/8
La función de distribución para una variable aleatoria discreta siembre verifica las siguientes
propiedades:
1. F (−∞) = 0 ; F (+∞) = 1
2. P (a, b) = P (a ≤ X ≤ b) = F (b) − F (a)

42 5 Variable aleatoria
5.1.2. Caso continuo

Se dice que f (x) es la función de densidad de una variable aleatoria X del tipo continuo, si:
f (x) ≥ 0, −∞ < x < ∞

Z ∞
f (x)dx = 1
−∞
Z b
P (a < x < b) = f (x)dx
a
P (x = a) = 0 si X es continua.
Figura 5.1: Representación de la probabilidad entre dos valores P (a ≤ X ≤ b).

0.025
0.020
0.015
f(x)
0.010
0.005
0.000
40 60 80 100 120 140 160
La función de probabilidad acumulativa de una variable aleatoria continua F(x), se define

como:
Z x
F (x) = P (X < x) = P (X ≤ x) = f (x)dx
−∞
F (−∞) = 0
5.1 Función de Distribución Acumulada 43
F (∞) = 1
P (a < X < b) = F (b) − F (a)

∂F (x)
∂x
= f (x)
Figura 5.2: Representación de una probabilidad acumulada P (X ≤ x)

0.025
0.020
0.015
f(x)
0.010
0.005
0.000
40 60 80 100 120 140 160
Ejemplo 5.1.2 Suponga que el error en la temperatura de reacción medido en grados

Celsius, en un experimento de laboratorio controlado, es una variable aleatoria continua
X que tiene la función de densidad de probabilidad
(
x2
3
, −1 < x < 2,
f (x) =
0 , en otro caso.
1. Verifique que f (x) es función de densidad.
2. Calcule P (0 < X ≤ 1).
3. Calcule F (x) y utilice el resultado para calcular P (−1 < X ≤ 1.5)

Solución:
1.
2 2
x2
Z Z 3
1 2 1 x 2
f (x) = dx = x dx = · =1
−1 3 3 −1 3 3 −1
2.
1
x2
Z 3
1 x 0
P (0 < X < 1) = dx = · = 0.111
0 3 3 3 1
3.
x
t2
3
x3 1
Z
1 t 1
F (x) = dt = · = +
−1 3 3 3 x 9 9
P (−1 < X ≤ 1.5) = F (1.5) − F (−1)

(1.5)3 1 (−1)3 1

= + − + = 0.4861
9 9 9 9
5.2. Valor esperado y varianza

Se denomina valor esperado E(X) de una variable aleatoria a su valor medio o promedio
poblacional, calculado a través de su función de probabilidad P (x), en el caso discreto, o de
densidad f (x) en el caso continuo
X
E(X) = x · p(x) = µx , si x es una v.a. discreta.
x
Z ∞
E(X) = x · f (x)dx, si x es una v.a. continua.
−∞
Propiedades de E(X):
E(c) = c
E(aX) = aE(X) = aµx
E(aX + b) = aE(X) + b = aµx + b
Es posible tener el valor esperado de cualquier función g(X):

X
E [g(X)] = g(x) · p(x), si x es una v.a. discreta.
x
5.2 Valor esperado y varianza 45
Z ∞
E [g(X)] = g(x) · f (x)dx, si x es una v.a. continua.
−∞
La varianza V (X) cuantifica la magnitud de la variabilidad de una variable aleatoria, de

manera que un valor pequeño de este indicador sugiere homogeneidad, mientras que por el
contrario un valor grande indica dispersión.
X
V (X) = E (X − E[X])2 = (x − µx )2 · p(x), si x es una v.a. discreta.

x
Z ∞
V (X) = E (X − E[X])2 = (x − µx )2 · f (x)dx, si x es una v.a. continua.

−∞
Propiedades:
V (c) = 0
V (aX) = a2 V (X) = a2 σx2
V (aX + b) = a2 V (X) = a2 σx2
Ejemplo 5.2.1 La demanda diaria en toneladas para un determinado producto alimenticio

que se vende a granel es una variable aleatoria X con función de densidad
(
1
− 270 · x(1 − x) , 4 < x < 10,
f (x) =
0 , en otro caso.
1. ¿Cuál es la variabilidad relativa de la demanda diaria?
2. Si se desea un nivel de servicio superior al 90 % cual es la cantidad de toneladas de

productos mı́nima de la que debe disponerse en el inventario al inicio del dı́a.
Solución:
1.
−1 10
3
x4 4
Z
1 x 4
E(X) = x · x · (1 − x)dx = − · −
270 4 270 3 10 4 10
3 3
4 4

1 10 − 4 10 4
=− · − − = 7.866
270 3 4 4
Interpretación de E(X): El promedio de la demanda diaria fue de 7.866 toneladas.

Z 10 Z 10
2 1 1 3 4

E(X ) = − (x · x · (1 − x)) dx = − x − x dx
270 4 270 4
4
x 10 x5 10
4
10 − 44 105 − 45

1 1
=− · − =− · − = 360.59
270 4 4 5 4 270 4 5
V (X) = E(X 2 ) − E 2 (X) = 360.59 − (7.86)2 = 298.81

√
σ(X) = 298.81 = 17.28
Interpretación de σ(X): En promedio las discrepancias de la demanda diaria con respecto

a la demanda media fue de 17.28 toneladas.
σ(X) 17.28
CV (X) % = · 100 = · 100 = 219.67 %
E(X) 7.866
La variabilidad de la demanda considerando la demanda promedio fue de 219.67 %, esto

indica, una alta variabilidad en este proceso, es decir, que hay momentos con una alta
demanda y otros con una escasa demanda.

Rubin (2004)
1. Sea W la variable aleatoria que da el número de caras menos el número de cruces en
tres lanzamientos de una moneda. Liste los elementos del espacio muestral S para los
tres lanzamientos de la moneda y asigne un valor w de W a cada punto muestral.
2. Se lanza una moneda hasta que se presentan 3 caras sucesivamente. Liste sólo aquellos
elementos del espacio muestral que requieren 6 o menos lanzamientos. ¿Es éste un
espacio muestral discreto? Explique su respuesta.
3. La presidenta nacional de la Asociación Contra la Distrofia Muscular intenta estimar

la cantidad que ofrecerá cada persona que llama durante el teletón anual de esta
asociación. Usando los datos recolectados en los últimos 10 años, calculó las siguientes
probabilidades de las diferentes cantidades prometidas. Dibuje una gráfica que ilustre
esta distribución de probabilidad.
Dólares prometidos 25 50 75 100 125

Probabilidad 0.45 0.25 0.15 0.1 0.05
4. Jim Rieck, analista de mercado de la compañı́a Flatt and Mitney Aircraft, tiene la
creencia de que el nuevo avión de combate de la compañı́a, el Tigerhawk, tiene el 70 %
de posibilidades de ser escogido para sustituir por completo a los aviones de combate
de la Fuerza Aérea de Estados Unidos. Sin embargo, existe una posibilidad entre cinco
de que la Fuerza Aérea compre sólo el número necesario de Tigerhawk para sustituir la
mitad de sus 5,000 aviones de combate. Por último, existe una posibilidad entre 10 de
que la Fuerza Aérea sustituya toda su flotilla de aviones de combate con Tigerhawks
y que además compre el número suficiente de éstos para aumentar el número de sus
unidades en un 10 %. Construya una tabla y trace la distribución de probabilidad de
las ventas de Tigerhawks a la Fuerza Aérea.
5. Mario, el dueño de Mario?s Pizza Emporium, debe tomar una decisión difı́cil. Se ha
dado cuenta que cada noche vende entre una y cuatro de sus famosas pizzas ?Con todo,
menos el fregadero?. Sin embargo, la preparación de estas pizzas lleva tanto tiempo, que
Mario las elabora todas con anterioridad y las almacena en el refrigerador. Como los
ingredientes no duran más de un dı́a, siempre desperdicia las pizzas que no ha vendido
al final de la noche. El costo de preparar cada una es de $7 y el precio al cliente es de
$12. Además de los costos usuales, Mario calcula que pierde $5 por cada pizza de este
tipo que no puede vender por no tenerlas preparadas de antemano. ¿Cuántas pizzas
?Con todo, menos el fregadero? debe almacenar Mario cada noche a fin de minimizar
la pérdida esperada si el número de pizzas ordenadas tiene la siguiente distribución de
probabilidad?
Número de pizzas pedidas 1 2 3 4

Probabilidad 0.4 0.3 0.2 0.1
6. La información que sigue representa el número de llamadas diarias al servicio de

emergencia por el servicio voluntario de ambulancias de Walterboro, Carolina del Sur,
durante los últimos 50 dı́as. En otras palabras, hubo 22 dı́as en los que se realizaron 2
llamadas de emergencia, y 9 dı́as en los que se realizaron 3 llamadas de emergencia.
Número de llamadas 0 1 2 3 4 Total

Frecuencia 8 10 22 9 1 50
a) Convierta esta información sobre el número de llamadas en una distribución de

probabilidad.
b) ¿Es un ejemplo de distribución de probabilidad discreta o continua?
c) ¿Cuál es la media de la cantidad de llamadas de emergencia al dı́a?
d ) ¿Cuál es la desviación estándar de la cantidad de llamadas diarias?
7. El director de admisiones de Kinzua University en Nueva Escocia estimó la distribución

de admisiones de estudiantes para el segundo semestre con base en la experiencia de
años pasados. ¿Cuál es el número de admisiones esperado para el segundo semestre?
Calcule la varianza y la desviación estándar del número de admisiones.
Admisiones 1000 1200 1500

Probabilidad 0.6 0.3 0.1
8. (0.5 ) La vida útil, en dı́as, para frascos de cierta medicina de prescripción es una
variable aleatoria que tiene la siguiente función de densidad:
20000

 x>0
f (x) = (x + 100)3
0, en otro caso

Calcule la probabilidad de que un frasco de esta medicina tenga una vida útil de:
a) Al menos 200 dı́as;

b) Cualquier lapso entre 80 y 120 dı́as.
9. El número total de horas, medidas en unidades de 100 horas, que una familia utiliza
una aspiradora en un periodo de un año es una variable aleatoria continua X que tiene
la siguiente función de densidad:

x 0<x<1


f (x) = 2 − x, 1 ≤ x < 2


0, en otro caso
Calcule la probabilidad de que en un periodo de un año una familia utilice su

aspiradora:
a) Menos de 120 horas;

b) Entre 50 y 100 horas.
c) Calcule el valor esperado y varianza.
10. La proporción de personas que responden a cierta encuesta enviada por correo es una
variable aleatoria continua X que tiene la siguiente función de densidad:
(
2(x+2)
5
, 0<x<1
f (x) =
0, en otro caso
a) Demuestre que P (0 < X < 1) = 1.

b) Calcule la probabilidad de que más de 1/4 pero menos de 1/2 de las personas
contactadas respondan a este tipo de encuesta.
c) Calcule el valor esperado y varianza.
Capı́tulo 6
Repaso Corte 2
A continuación se presentan una serie de propuestas de evaluación con el objetivo de que el

estudiante tenga una marco de referencia que le ayude a mejorar el desempeño en la segunda
evaluación del curso.
6.1. Examen 1
1. Un testigo de un accidente de auto en el que huye el culpable dice a la policı́a que la
placa del vehı́culo contenı́a las letras RLH seguidas de tres dı́gitos cuyo primer número
es un 5. El testigo no puede recordar los otros dos dı́gitos de la placa, pero tiene la
certeza de que los tres dı́gitos eran diferentes. Encuentre el número máximo de placas
de auto que la policı́a tiene que verificar.
2. Al probar cierto clase de neumático para camión en un terreno escabroso, se encuentra

que 25 % de los camiones no completaban la prueba sin ponchaduras. De los siguientes
15 camiones probados, encuentre la probabilidad que más de 3 camiones no tengan
ponchaduras.
3. Durante un turno de 8 horas la proporción de tiempo Y que una máquina troqueladora

de láminas metálicas está sin operar por mantenimiento o reparaciones tiene una
distribución con la siguiente función de densidad:
(
2 · (1 − y) ; 0 ≤ y ≤ 1
f (y) =
0 ; otro caso
El costo (millones de pesos) de este tiempo improductivo, debido a producción perdida

y costo de mantenimiento y reparación, está dado por C = 10 + 20Y + 4Y 2 . Encuentre
el costo promedio.
6.2 Examen 2 51
4. Cierta área del este de Estados Unidos resulta afectada, en promedio, por 6 huracanes
al año. Calcule la probabilidad de que para cierto año esta área resulte afectada por
a) Menos de 4 huracanes al año.

b) Más de 2 huracanes en 6 meses.
5. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene

3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de que:
a) ¿Los 4 exploten?
b) ¿Al menos 2 no exploten?
6. Una empresa recibe visitantes en sus instalaciones y los hospeda en cualquiera de tres
hoteles de la ciudad; Palacio del Sol, Sicomoros o Fiesta Inn, en una proporción de
18.5 %, 32 % y 49.5 % respectivamente, de los cuales se ha tenido información de que
se les ha dado un mal servicio en un 2.8 %, 1 % y 4 % respectivamente.
a) Si se selecciona a un visitante al azar y se encuentra que se quejó del servicio

prestado, ¿cuál es la probabilidad de que se haya hospedado en el Palacio del
Sol?.
b) Si el visitante seleccionado no se quejó del servicio prestado, ¿cuál es la
probabilidad de que se haya hospedado en e hotel Fiesta Inn?
6.2. Examen 2
1. Si un estudiante tiene 9 libros y desea ordenar a 5 de ellos sobre un estante. De cuantas
maneras distintas puede hacerlo?
2. Las enfermedades I y II son comunes entre la gente de cierta población. Se supone

que el 10 % de la población contraerá la enfermedad I alguna vez durante su vida,
15 % contraerá eventualmente la enfermedad II y el 3 % contraerá ambas. Encuentre la
probabilidad de que una persona elegida al azar contraiga al menos una enfermedad.
3. (1 punto) La siguiente es una clasificación, según el género y el nivel de escolaridad,

de una muestra aleatoria de 200 adultos.
Escolaridad Hombre Mujer
Primaria 38 45
Secundaria 28 50
Universidad 22 17
Si se elige una persona al azar de este grupo, ¿cuál es la probabilidad de que:

52 6 Repaso Corte 2
a) ¿la persona sea hombre, dado que su escolaridad es de secundaria?

b) ¿la persona no tenga un grado universitario, dado que es mujer?
4. La mina de carbón en la región A tienen una probabilidad de 0.2 de producir. La mina

de carbón en la región B tienen una probabilidad de 0.09. Suponga que las dos minas
producen de manera independiente.
a) ¿Cuál es la probabilidad de que ambas minas produzcan?

b) Cuál es la probabilidad de que al menos una produzca?
5. Los clientes se encargan de evaluar los diseños preliminares de varios productos.

En el pasado, el 95 % de los productos con mayor éxito en el mercado recibieron
buenas evaluaciones, el 60 % de los productos con éxito moderado recibieron buenas
evaluaciones, y el 10 % de productos de escaso éxito recibieron buenas evaluaciones.
Además, el 40 % de los productos han tenido mucho éxito, el 35 % un éxito moderado,
y el 25 % una baja aceptación.
a) Si un nuevo diseño no obtiene una buena evaluación, cuál es la probabilidad de

que se convierta en un producto de gran éxito.
b) Si un nuevo diseño obtiene una buena evaluación, cuál es la probabilidad de que
se convierta en un producto de escaso éxito.
Capı́tulo 7
Modelos de probabilidad
7.1. Distribución Binomial

Un experimento a menudo consiste en pruebas repetidas, cada una con dos posibles
resultados que se pueden etiquetar como éxito o fracaso.
Si se habla de un proceso Bernoulli debe tener las siguientes propiedades:
1. El experimento consiste en n pruebas que se repiten.
2. Cada prueba produce un resultado que se puede clasificar como éxito o fracaso.
3. La probabilidad de un éxito, que se denota con p, permanece constante en cada prueba.
4. Las pruebas que se repiten son independientes.
El número X de éxitos en n experimentos Bernoulli se denomina variable aleatoria binomial.

La distribución de probabilidad de esta variable aleatoria se llama ditribución binomial.
Definición La distribución de probabilidad de la v.a. binomial X, el número de éxitos en n
pruebas independientes, es

n x
p(x) = p (1 − p)n−x x = 0, 1, 2, . . . , n (7.1)
x
7.1.1. Valor esperado y varianza de una v.a. binomial
E (X) = n · p (7.2)
V (X) = n · p · (1 − p) (7.3)
54 7 Modelos de probabilidad
Ejemplo 7.1.1 La probabilidad de que un paciente se recupere de una rara enfermedad

sanguı́nea es 0.4. Si se sabe que 15 personas contraen esta enfermedad, ¿cuál es la
probabilidad de que (a) sobrevivan al menos 10. (b) sobrevivan de 3 a 8. (c) sobrevivan
exactamente 5 y (d) encuentre la media y la varianza de X?
Solución:
a)
15
X 15
P (X ≥ 10) = (0.4)x (1 − 0.4)15−x = 0.0338
x=10
x
b)
8
X 15
P (3 ≤ X ≤ 8) = (0.4)x (1 − 0.4)15−x = 0.8778
x=3
x
c)

15
P (X = 5) = (0.4)5 (1 − 0.4)15−5 = 0.1859
5
d)
E(X) = 15 · 0.4 = 6
V (X) = 15 · 0.4 · 0.6 = 3.6
7.2. Distribución Poisson

Se dice que una variable aleatoria X tiene una distribución de Poisson con parámetro λ
(λ > 0) si la función de masa de X es,
e−λ λx
p(x) =
x!
Donde λ es la media de la cantidad de veces (éxitos) que se presenta un evento en un intervalo
particular.
7.3 Distribución Uniforme 55
7.2.1. Valor esperado y varianza de una v.a. poisson
E (X) = λ (7.4)
V (X) = λ (7.5)
Ejemplo 7.2.1 Si un editor de novelas se esfuerza por asegurar que sus libros están libres
de errores tipográficos, de modo que la probabilidad de que alguna página contenga por lo
menos un error es 0.005 y los errores son independientes de una página a otra, ¿cuál es la
probabilidad de que una de sus novelas de 400 páginas contenga exactamente una página con
errores? ¿a lo sumo 3 páginas con errores?
Solución: Primero debemos encontra la media
λ = 400 · 0.005 = 2
Es decir, que en promedio hay dos errores por página.

a)
e−2 · 21
P (X = 1) = = 0.2706
1!
b)
3
X e−2 · 2x
P (X ≤ 3) = = 0.8571
x=0
x!
7.3. Distribución Uniforme

Una de la distribuciones continuas más simples en la estadı́stica es la distribución uniforme.
Esta distribución se caracteriza por tener una densidad plana en un intervalo cerrado por
ejemplo [a, b]
La función de densidad de la v.a. uniforme continua X en el intervalo [a, b] es
Ejemplo 7.3.1 Suponga que se puede reservar una sala de conferencias grande para cierta
compañı́a por no más de cuatro horas. Sin embargo, el uso de la sala de conferencias es tal
que muy a menudo tienen lugar conferencias largas y cortas. De hecho, se puede suponer que
la duración X de una conferencia tiene una distribución uniforme en el intervalo [0, 4].
1. ¿Cuál es la función de densidad de la probabilidad?
2. ¿Cuál es la probabilidad de que cualquier conferencia dada dure al menos tres horas?
Solución:
1. La función de densidad apropiada para la variable aleatoria uniforme X en esta

situación es
1
f (x) = , 0 ≤ x ≤ 4
4
2.
Z 4
1 1
P (X ≥ 3) = dx =
3 4 4
7.3.1. Valor esperado y varianza de una v.a. Uniforme
a+b
E(X) = (7.6)
2
(b − a)2
V (X) = (7.7)
12
7.4. Distribución Exponencial

La variable aleatoria continua X tiene una distribución exponencial, con parámetro λ, si su
función de densidad esta dada por
(
1/βe−x/β , x > 0
f (x) = (7.8)
0, en cualquier otro caso
donde β > 0.
La función de distribución esta dada por:
F (x) = 1 − e−x/β (7.9)

7.5 Distribución Gamma 57
7.4.1. Valor esperado y varianza de una v.a. Exponencial
E(X) = β (7.10)
V (X) = β 2 (7.11)
Ejemplo 7.4.1 Suponga que un sistema contiene cierto tipo de componente cuyos tiempo
de falla en años está dado por X . La variable aleatoria X se modelo bien mediante la
distribución exponencial con tiempo medio para la falla de 5 años. Si se instalan cinco de
estos componentes en diferentes sistemas, ¿cuál es la probabilidad de que un componente
funcione después de 8 años?
Solución:
Usando la función de densidad:
Z ∞
P (X > 8) = 1/5 · e−x/5 dx
8
h ∞ i
−x/5
= 1/5 · −5e
8
= −e−∞/5 + e−8/5 = 0.2018
Usando la función de distribución:
P (X > 8) = 1 − P (X ≤ 8) = 1 − F (8) = 1 − 1 − e−8/5 = 0.2018

7.5. Distribución Gamma

La distribución gamma deriva su nombre de la función gamma, que se estudia en muchas
áreas de las matemáticas.
7.5.1. La función Gamma

Se define como
Z ∞
Γ(α) = xα−1 e−x dx (7.12)
0
Cuando α es igual a n, donde n es un entero positivo,
Γ(n) = (n − 1)(n − 2), . . . , Γ(1) (7.13)
Donde Γ(1) = 1 y Γ(n) = n!

La variable aleatoria continua X tiene una distribución gamma, con parámetros α y β, si su
función de densidad está dada por,
(
1
β α Γ(α)
xα−1 e−x/β , x>0
f (x) = (7.14)
0, en cualquier otro caso
cuando α > 0 y β > 0
7.5.2. Función Gamma incompleta

La integral anterior se puede resolver a través del uso de la función gamma incompleta, que
resulta ser la función de distribución acumulada para la distribución gamma. Esta función
se escribe como:
x
y α−1 e−y
Z
F (x; α) = dy (7.15)
0 Γ(α)
7.5.3. Valor esperado y varianza de una v.a. Gamma
E(X) = αβ (7.16)
V (X) = αβ 2 (7.17)
Ejemplo 7.5.1 En un estudio biomédico con ratas se usa una investigación de respuesta a
la dosis para determinar el efecto de la dosis de un tóxico en su tiempo de sobrevivencia.
El tóxico es uno que se descarga con frecuencia en la atmósfera desde el combustible de los
aviones. Para cierta dosis del tóxico el estudio determina que el tiempo de sobrevivencia, en
semanas, tiene una distribución gamma con α = 5 y β = 10. ¿Cuál es la probabilidad de que
una rata no sobreviva más de 60 semanas?
7.6 Distribución Normal 59
Solución:
60
xα−1 e−x/β
Z
1
P (X ≤ 60) = α dx
β 0 Γ(α)
X
Si hacemos y = β
, X = βy, utilizando la función gamma incompleta tenemos
6
y 4 e−y
Z
P (Y ≤ 6) = dy = F (6; 5) = 0.715
0 Γ(5)
Ejemplo 7.5.2 Supongase que el tiempo de supervivencia X en semanas de un ratón macho

elegido al azar expuesto a 240 rads de radiación gamma tiene una distribución gamma con
α = 8 y β = 15. ¿cuál es el tiempo de supervivencia esperado y la desviación estándar?.
Calcule la probabilidad de que un ratón sobreviva entre 60 y 120 semanas es.
Solución:
P (60 < X < 120) = P (X < 120) − P (X < 60)

= P (Y < 120/15) − P (Y < 60/15)
= P (Y < 8) − P (Y < 4)
= F (8; 8) − F (4; 8)
= 0.547 − 0.051 = 0.496
7.6. Distribución Normal

La distribución de probabilidad conocida como distribución normal es, por la cantidad de
fenómenos que explica, la más importante de las distribuciones estadı́sticas. A la distribución
normal también se la denomina con el nombre de campana de Gauss, pues al representar su
función de probabilidad, ésta tiene forma de campana.
Caracterı́sticas:
La curva normal tiene forma de campana y un solo pico en el centro de la distribución.
La media aritmética, la mediana y la moda de la distribución son iguales y se localizan

en el centro.
La mitad del área bajo la curva se encuentra a la derecha del punto central y la otra
mitad está a la izquierda de dicho punto.
La distribución de probabilidad normal es simétrica alrededor de su media.
Es asintótica, lo que quiere decir que la curva se acerca cada vez más al eje X pero
jamás llega a tocarlo.
En la Figura 7.1 se observa como un cambio en la media, genera un desplazamiento en la

distribución.
Figura 7.1: Función de densidad de una v.a. a) X ∼ N (3, 1.5). b) X ∼ N (4, 1.5). c) X ∼
N (5, 1.5). d) X ∼ N (6, 1.5)
(a) (b)
0.20
0.20
f(x)
f(x)
0.10
0.10
0.00
0.00
−10 −5 0 5 10 −10 −5 0 5 10
x x
(c) (d)
0.20
0.20
f(x)
f(x)
0.10
0.10
0.00
0.00
−10 −5 0 5 10 −10 −5 0 5 10
x x
En la Figura 7.2 se observa como un cambio en la desviación estándar, genera un cambio

en el ancho de la función de densidad.
Figura 7.2: Función de densidad de una v.a. a) X ∼ N (3, 1.5). b) X ∼ N (3, 3). c) X ∼
N (3, 4.5). d) X ∼ N (3, 6)
(a) (b)
0.12
0.20
0.08
f(x)
f(x)
0.10
0.04
0.00
0.00
−10 −5 0 5 10 −10 −5 0 5 10
x x
(c) (d)
0.08
0.05
0.06
f(x)
f(x)
0.04
0.03
0.02
0.01
0.00
−10 −5 0 5 10 −10 −5 0 5 10
x x
7.6.1. Definición
Se dice que una variable aleatoria X tiene una distribución normal si su función de densidad
es de la forma:

1 1
f (x) = √ exp (X − µ)2 X∈R (7.18)
2πσ 2σ 2
7.6.2. Valor esperado y varianza
Z ∞
E(X) = x · f (x)dx = µ µ∈R (7.19)
−∞
Z ∞
V (X) = [x − E(X)]2 f (x)dx = σ 2 (7.20)
−∞
7.6.3. Calculo de probabilidades para una v.a. ∼ N (µ, σ)

La probabilidad de que una variable aleatoria X tome un valor determinado entre dos
números reales a y b, coincide con el área bajo la curva de la función f (X) entre los puntos
a y b (Ver Figura 7.3).
Figura 7.3: Ilustración de P (a ≤ X ≤ b) para X ∼ N (µ, σ)

0.4
0.3
0.2
f(x)
0.1
0.0
a b
7.6.4. Propiedades
P (−∞ < X < ∞)
Z a
P (X < a) = f (x)dx
−∞
P (X > a) P (X < −a) por simetrı́a
P (X > a) = 1 − P (X < a)
P (a < X < b) = P (X < b) − P (X < a)

Z a
Al ser X una v.a. continua, P (X = a) = f (x)dx = 0 ∀a ∈ R
a
P (X ≤ a) = P (X < a)
7.6.5. Distribución Normal Estándar

Como se pudo observar, no existe una sola distribución de probabilidad normal, sino una
familia de ella. Cada una de las distribuciones puede tener una media (µ) o una desviación
estándar distinta (σ). Por tanto, el número de combinaciones de dichos parámetros es
ilimitado.
Para resolver este problema, se utiliza una sola de las distribuciones normales, aquella cuya
media es 0 y la desviación estándar es 1. Se le conoce como la distribución normal estándar,
de forma que todas las distribuciones normales pueden convertirse a la estándar, restando
la media de cada observación y dividiendo por la desviación estándar.
Si X ∼ N (µ, σ)
X −µ
Z= (7.21)
σ
Entonces Z ∼ N (0, 1)
Al determinar el valor Z utilizando la expresión anterior, es posible encontrar el área

de probabilidad bajo cualquier curva normal haciendo referencia a la distribución normal
estándar en una tabla especı́fica donde se tabulan estas cantidades.
La tabla nos proporciona la probabilidad de que la v.a. normal estándar Z tome un

valor situado a la izquierda de un número a, es decir, P (Z < c). En otras palabras, esta
tabla nos da el valor del área hasta c.
Ejemplo 7.6.1 Suponga que X es normal con media 8.0 y desviación estándar 5.0.
Encuentre:
1. P (X < 8.6)
2. P (X > 8.6)
3. P (8 < X < 8.6)
Solución:
1.

8.6 − 8
P (X < 8.6) = P Z < = 0.12
5
= P (Z < 0.12) = 0.5478
2.
P (X > 8.6) = 1 − P (X < 8.6)

8.6 − 8
=1−P Z <
5
= 1 − P (Z < 0.12)
= 1 − 0.5478
= 0.4522
3.
P (8 < X < 8.6) = P (X < 8.6) − P (X < 8)

8.6 − 8 8−8
=P Z< −P Z <
5 5
= P (Z < 0.12) − P (Z < 0)
= 0.5478 − 0.5
= 0.0478
7.6.6. Calculo del valor de X para una probabilidad conocida

Pasos para encontrar el valor de X para una probabilidad conocida:
1. Encuentre el valor de Z para la probabilidad conocida.
2. Convierta a unidades de X usando la fórmula: X = µ + Z · σ
Ejemplo 7.6.2 Si X es normal con media 8 y desviación estándar 5. Encuentre el valor de

X tal que solo el 20 % de todos los valores están por debajo de él
Solución:
X =µ+Z ·σ
= 8 + (−0.84) · 5
= 3.8
Interpretación: Luego el 20 % de los valores de la distribución con media 8 y desviación

estándar 5 son menores que 3.8.

Rubin (2004)
1. Se recibe un lote de 60 componentes electrónicos. El proveedor asegura que sus lotes
contienen como máximo 2 % de defectuosos. Para decidir si se recibe o no el lote, se
seleccionan 6 componentes y se prueban. Si dos de los seis están defectuosos se rechaza
el lote. Calcule la probabilidad de rechazar este lote.
a) ¿Cuál es la probabilidad que ninguna de estas piezas tenga defecto?

b) ¿Cuál es la probabilidad que al menos dos de estas piezas tengan defecto?
2. En cierta ciudad, la incompatibilidad se da como razón o motivo legal en el 80 %

de todos los casos de divorcio. Obtenga la probabilidad de que cinco de los seis
divorcios siguientes archivados en esta ciudad argumenten incompatibilidad como
motivo principal.
3. El promedio de reclamos que se presentan en una agencia de corredores de seguros es

de tres por dı́a.
a) ¿Cuál es la probabilidad de que un dı́a cualquiera se presente sólo un reclamo?

b) ¿Cuál es la probabilidad de que mañana se presenten, como máximo, tres
reclamos?
c) ¿Cuál es la probabilidad de que el viernes se presenten entre dos y cuatro reclamos?
4. La central telefónica de una CIA recibe en promedio 10 llamadas por cada perı́odo de
20 minutos. Calcular la probabilidad de que en los próximos 10 minutos se reciban:
a) al menos dos llamadas.

b) dos o tres llamadas.
c) a lo más dos llamadas.
5. Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de

operaciónantes de fallar, en años, está dado por T . La variable aleatoria T se modela
bien mediante la distribución exponencial con tiempo medio de operación antes de
fallar β = 5. Si se instalan 5 de estos componentes en diferentes sistemas, ¿cuál es la
probabilidad de que al final de 8 años al menos dos aún funcionen?
6. El tiempo necesario para que un individuo sea atendido en una cafeterı́a es una variable
aleatoria que tiene una distribución exponencial con una media de 4 minutos. ¿Cuál es
la probabilidad de que una persona sea atendida en menos de 3 minutos en al menos
4 de los siguientes 6 dı́as?
7. Dada una distribución normal estándar, calcule el área bajo la curva que está:
a) a la izquierda de z = −1.39
b) a la derecha de z = 1.96
c) entre z = −2.16 y z = −0.65
d ) a la izquierda de z = 1.43
e) a la derecha de z = −0.89
f ) entre z = −0.48 y z = 1.74
8. Una máquina expendedora de bebidas gaseosas se regula para que sirva un promedio
de 200 mililitros por vaso. Si la cantidad de bebida se distribuye normalmente con una
desviación estándar igual a 15 mililitros,
a) ¿qué fracción de los vasos contendrá más de 224 mililitros?

b) ¿cuál es la probabilidad de que un vaso contenga entre 191 y 209 mililitros?
c) ¿cuántos vasos probablemente se derramarán si se utilizan vasos de 230 mililitros
para las siguientes 1000 bebidas?
d ) ¿por debajo de qué valor obtendremos el 25 % más bajo en el llenado de las
bebidas?
Bibliografı́a
Behar, R. & Yepes, M. (1996). Estadı́stica: un enfoque descriptivo.
Douglas, L., Marchal, W., & Wathen, S. (2012). Estadı́stica aplicada a los negocios y
economı́a. McGraw-Hill Interamericana.
Levin, R. I. & Rubin, D. S. (2004). Estadı́stica para administración y economı́a. Pearson

Educación.

Guia Estudio Estadistica1

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Guia Estudio Estadistica1

Cargado por

Copyright:

Formatos disponibles

Guı́a de estudio para el curso de Estadı́stica 1

Johann Alexis Ospina Galindéz

Universidad Autónoma de Occidente

2. Análisis Exploratorio de Datos 4

2.7.2. Propiedades de la media aritmética . . . . . . . . . . . . . . . . . . . 15

2.1. Precios de vehı́culos vendidos en diciembre en Calima Motors, las unidades se

3.1. Tabla de frecuencias de las ventas de servicio extendido. . . . . . . . . . . . 29

2.1. Diagrama de lı́nea. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.1. Comportamiento de la distribución de valores de TVB-N (Izquierda) y PS

4.1. Diagrama de Venn de los eventos A y B. . . . . . . . . . . . . . . . . . . . . 31

5.1. Representación de la probabilidad entre dos valores P (a ≤ X ≤ b). . . . . . . 42

7.1. Función de densidad de una v.a. a) X ∼ N (3, 1.5). b) X ∼ N (4, 1.5). c) X ∼

1.1. ¿Qué es la Estadı́stica?

1.2. Aplicaciones de la estadı́stica

1.3. Tipos de estadı́stica

Un estudio de la empresa Gallup encontró que el 49 % de la población sabe el nombre

De acuerdo con un reporte de consumidores, los dueños de las lavadoras Whirlpool

1.3.2. Estadı́stica inferencial

Población: Es un grupo de individuos, objetos o medidas de interés.

Muestra: Es una porción, o parte, de la población que interesa.

Algunos ejemplo del uso de la estadı́stica inferencial:

Las cadenas de TV monitorean la popularidad de sus programas de manera continua,

El departamento de contabilidad de una empresa selecciona una muestra de las facturas

Análisis Exploratorio de Datos

En este capitulo se abordará el concepto de Análisis Exploratorio de Datos o Estadı́stica

2.1. Tipos de variables

2.1.1. Variable cualitativa

Ejemplos: Género, preferencia religiosa, tipo de automóvil, estado de nacimiento, color

Ejemplos: saldo en la verificación de la contabilidad, minutos que se permanece en la

Las variables cuantitativas se clasifican como discretas o continuas.

Discretas: Sólo pueden representar algunos valores y en general existen ’huecoséntre

Continuas: Estas pueden tomar cualquier valor dentro de un intervalo especı́fico.

2.2. Escalas de medición

2.2.2. Escalas de medición para variables cuantitativas

2.3. Conceptos básicos

Población: conjunto de individuos o elementos objeto de estudio que cumplen ciertas

Muestra: subconjunto representativo de una población

2.3.1. Parámetro y estadı́stico

2.4. Buscando patrones de comportamiento en los

Gráficos (diagramas de barras, histogramas de frecuencias, diagramas de cajas, etc).

Medidas o indicadores (tendencia central, variabilidad, posición y forma).

La frecuencia absoluta de un dato, es el numero de veces que dicho dato se repite

La frecuencia relativa de un dato, es la proporción que dicho dato se repite en el

La frecuencia de clase acumulada se define acumulando la frecuencia absoluta

La frecuencia relativa acumulada se define acumulando la frecuencia relativa hasta

2.4.2. Tabla de frecuencias

1. Ordenar los datos de forma ascendente.

2. Definir el número de clases, elija el número de intervalos de acuerdo a la regla de

3. Determinar la amplitud o ancho de clases.

5. Contar el número de elementos de cada clase.

2.4.3. Nomenclatura de la tabla de frecuencias

Frecuencia absoluta (ni )

Con los datos de la Tabla 2.1 responda los siguientes interrogantes.

1. Construya una tabla de frecuencia para datos agrupados.

2. Interprete n2 , f4 ( %), N3 , F2 ( %).

Ordenamos los datos.

50.2 50.3 50.7 60.2 60.4 60.5 60.6 60.8

2.4.4. Tabla de frecuencias para variables cuantitativas discretas

En la Tabla 2.2 se ilustra como queda la tabla de frecuencias del ejemplo.

Tabla 2.2: Distribución del número de piezas defectuosas.

2.4.5. Tabla de frecuencia cuando la variable es cualitativa

Tabla 2.3: Distribución de las refinerias más grandes a nivel mundial.