Ma460 202201 X031 Cuaderno de Trabajo

1 Estadística Descriptiva 201901
MA460
Estadística Descriptiva
Cuaderno de trabajo
Los profesores del curso
Área de Ciencias - Marzo 2022

La siguiente guía de trabajo contiene el material necesario para
seguir las clases del curso Estadística Descriptiva de la Universi-
dad Peruana de Ciencias Aplicadas. Contiene la teoría, ejercicios
resueltos y propuestos de todo el curso.
Este material de enseñanza está basado en materia-

les y trabajo de los profesores del curso.
Esperamos que este material le sea de utilidad.
Los profesores del curso
Gráfico de la carátula https://www.cognodata.com/blog/

Tabla de contenido
Unidad 1. Organización y descripción de datos................................................................................ 4
Definición de Estadística ..................................................................................................................... 5
Definiciones ........................................................................................................................................ 8
Estadística descriptiva ...................................................................................................................... 21
Distribución de frecuencias de variables cualitativas ....................................................................... 22
Gráficos estadísticos ......................................................................................................................... 25
Tabulaciones cruzadas ...................................................................................................................... 40
Resumen de datos cuantitativos ...................................................................................................... 49
Gráficos de datos cuantitativos ........................................................................................................ 58
Medidas de tendencia central .......................................................................................................... 66
Medidas de variabilidad ................................................................................................................... 80
Medidas de asimetría ....................................................................................................................... 88
Medidas de posición ......................................................................................................................... 92
Unidad 2. Teoría de la probabilidad ............................................................................................ 109
Experimentos, reglas de conteo y asignación de probabilidades ................................................... 110
Reglas de conteo y combinaciones ................................................................................................. 117
Probabilidad condicional ................................................................................................................ 122
Eventos independientes ................................................................................................................. 140
Unidad 3. Distribuciones de probabilidad y muestreo ................................................................. 144
Variable aleatoria ........................................................................................................................... 145
Variable aleatoria discreta .............................................................................................................. 147
Distribuciones de probabilidad de variable discreta ...................................................................... 165
Variable aleatoria continua ............................................................................................................ 182
Distribuciones de probabilidad de variable continua ..................................................................... 198
Muestreo probabilístico ................................................................................................................. 224
Muestreo aleatorio simple ............................................................................................................. 225
Muestreo sistemático ..................................................................................................................... 232
Muestreo estratificado ................................................................................................................... 238
Propiedad reproductiva de la normal ............................................................................................. 249
Distribución muestral de un estadístico ......................................................................................... 256
Tablas estadísticas .......................................................................................................................... 266
Estadística Descriptiva 2022 01 4
Unidad 1. Organización y descripción de datos
Logro de la Unidad 1
Al finalizar la Unidad 1, el estudiante será capaz entender claramente la información que se presenta
en las tablas y gráficos estadísticos. Calcular e identificar las medidas de resumen idóneas que corres-
ponden a cada análisis de datos.
Temario
• Conceptos básicos
• La Estadística y sus subdivisiones.
• Definiciones de población, muestra, variables, clasificación de variables, parámetros y estadísticos.
• La investigación estadística. Metodología.
• Métodos de organización y presentación de datos cualitativos y cuantitativos
• Tablas de distribución de frecuencias y representaciones gráficas (circular, barras, Pareto)
• Tablas de doble entrada
• Medidas de tendencia central: media aritmética, mediana, moda, media ponderada
• Medidas de posición: cuartiles, deciles, percentiles
• Medidas de dispersión: varianza, desviación estándar, coeficiente de variación
• Medidas de asimetría
• Diagramas de cajas
Definición de Estadística
Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, or-
ganizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.
Recopilar datos Organizar datos Presentar datos Analizar datos Tomar decisiones
Estadística descriptiva
Son métodos asociados a la caracterización, resumen y presentación de datos, que permiten descri-
birlos apropiadamente.
Comprende el uso de gráficos, tablas e indicadores de resumen obtenidos al realizar algunos cálculos.
Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más características de una población o tomar
decisiones referentes a una población, basados en los resultados obtenidos del estudio de muestras
elegidas adecuadamente.
Estas conclusiones no tienen que ser totalmente válidas, pueden tener cierto margen de error, por eso
se dan con una medida de confiabilidad o probabilidad.
Métodos de recolección, caracterización, resumen y
presentación de características de datos
Población Muestra Datos
Muestreo
𝑝 Porcentaje poblacional 𝑀𝑒 Mediana poblacional

Estimación
𝜇 Media poblacional 𝑀𝑜 Moda poblacional
Estadística inferencial
Se estima características poblacionales o se decide basándose en muestras al azar.
Ejercicios
1. Indique si los siguientes enunciados corresponden al uso de la Estadística descriptiva o de la Esta-

dística inferencial.
Solución
Los gráficos están realizados usando estadística descriptiva.
Este gráfico muestra la intención de voto en España para los partidos políticos: PSOE, PP, Vox y
Ciudadanos, Unidas Podemos y otros. Esta noticia se basa en estadística inferencial.
Definiciones
Unidad elemental
Es la entidad acerca de la cual se reúne los datos.
Población
Población es el conjunto de todas las unidades elementales de interés en determinado estudio. Es un
conjunto de personas, objetos, conceptos, etc. de los cuales se sacan conclusiones a partir de una o
más características observables de naturaleza cualitativa o cuantitativa.
Muestra
Muestra es un subconjunto de la población. Será representativa si se elige al azar.
Variable
Es una característica de interés de las unidades elementales.
Dato
Es el resultado de medir una variable de una unidad elemental.
Observación
Es el conjunto de mediciones de una unidad elemental.
Población Muestra Datos

Muestreo
Dato
Observación
Unidad elemental
Ejemplo 1
A una persona (unidad elemental) se le pregunta su sexo, ciudad de residencia y edad (variables). Ella
responde (tres datos): “Soy mujer, vivo en Lima y tengo 19 años” (observación).
Población: Todos los Muestra: Algunos alumnos Base de datos: Mediciones a

alumnos de una sección de una sección los alumnos en la muestra
Muestreo Tres variables Sexo Ciudad Edad
Una observación Mujer Lima 19
Tres datos
Unidad elemental: Un
alumno de la sección
Ejemplo 2
En una fábrica (unidad elemental) se pregunta su distrito, tamaño de la empresa y su rubro (variables).
Se registra (tres datos): “Jesús María, mediana empresa y metalmecánica” (observación).
Ejemplo 3
La Secretaría Académica de una universidad está interesada en realizar un estudio sobre los motivos
por los cuales algunos alumnos del pregrado han decidido dar exámenes de recuperación ese ciclo. La
universidad cuenta con quince facultades y un total de 7500 alumnos, de los cuales 830 han decidido
rendir exámenes de recuperación ese ciclo. De la población se va a entrevistar a una muestra aleatoria
de 200 alumnos. Defina la población y la muestra.
Solución
La población son los 830 alumnos que han decidido dar exámenes de recuperación ese ciclo. La mues-
tra son los 200 alumnos que han decidido dar exámenes de recuperación ese ciclo.
Ejercicios
2. El objetivo de una investigación es estimar la media, en años, de la edad de los egresados de la

UPC. Indique la población, muestra, unidad elemental, variable a medir y un posible dato.
Solución
La población es todos los egresados de la UPC
La muestra es algunos egresados de la UPC
La unidad elemental es un egresado de la UPC
La variable a medir es edad
Un posible dato es 26 años
3. El objetivo de una investigación es estimar el porcentaje de los egresados de la UPC que trabajan
en su carrera. Indique la población, muestra, unidad elemental, variable a medir y un posible dato.
Solución
La población es todos los egresados de la UPC
La muestra es algunos egresados de la UPC
La unidad elemental es un egresado de la UPC
La variable a medir es si trabaja en su carrera
Un posible dato es: no trabajo en mi carrera
4. Según un informe de la Cámara Peruana de la Construcción (Capeco), el 70% de viviendas en Lima

son informales y vulnerables a un terremoto. Indique la población, muestra, unidad elemental,
variable a medir y un posible dato para poder hacer ese informe.
Solución
La población es todas las viviendas en Lima.
La muestra es algunas viviendas en Lima.
La unidad elemental es una vivienda en Lima.
La variable por medir es si es informal y vulnerable a un terremoto.
Un posible dato es no es informal y vulnerable.
5. Se quiere estimar el promedio diario de las ventas, en soles, del supermercado A durante el año
2021. Indique la población, muestra, unidad elemental, variable a medir y un posible dato.
Solución
La población es todos los días que trabajó el supermercado A en el año 2021
La muestra es algunos días que trabajó el supermercado A en el año 2021
La unidad elemental es un día que trabajó el supermercado A en el año 2021
La variable por medir es monto de ventas por día, en soles
Un posible dato es 50000 soles.
6. Los teens de hoy son parte de la nueva generación que se abre paso y vive la era del Internet y los
dispositivos móviles aún con más intensidad que sus predecesores, los millenials. Aunque denomi-
nan a esta generación Z o iGen. Es una generación sobreexpuesta a la información, multipantallas
y los primeros en socializar a través de la tecnología. Datum realizó una encuesta a 402 jóvenes de
13 a 19 años en el Perú. El cuestionario constó de 35 preguntas. Indique la unidad elemental en la
investigación, la cantidad de observaciones y datos obtenidos.
Solución
La unidad elemental es unteen, es decir, joven de 13 a 19 años en el Perú.
La cantidad de observaciones es 402, pues cada joven da una observación.
La cantidad de datos obtenidos es 14070 (35 x 402), pues cada joven brinda 35 datos.
7. Indique las variables y una posible observación de la base de datos usada para realizar esta info-
grafía.
Solución
Las variables son: edad, nivel educativo, número de trabajos, ingreso mensual, si tiene tarjeta de
crédito o ahorro, si recibe CTS, si se encuentra afiliado a una AFP, número de horas que trabaja a
las semana, si tiene seguro de salud, si trabaja de manera formal, número de personas en su em-
presa, sector en qué trabaja, ocupación laboral.
Una posible observación es: edad = 35 años, nivel educativo = superior, número de trabajos = 1,
ingreso mensual = 3000 soles, si tiene tarjeta de crédito o ahorro = sí, si recibe CTS = sí, si se en-
cuentra afiliado a una AFP = sí, número de horas que trabaja a las semana = 40 horas, si tiene
seguro de salud = sí, si trabaja de manera formal = sí, número de personas en su empresa = 7,
sector en qué trabaja = comercio, ocupación laboral = empleado.
8. Según el estudio “Rumores de oficina”, el 42% de los ejecutivos limeños considera que los rumores
influyen mucho en el clima laboral de la oficina. Indique el elemento, una variable a medir y una
posible observación.
Solución
La unidad elemental es …
Una variable por medir es …
Una posible observación es …
9. En una investigación, se quiere estimar el promedio del número de asistentes a los conciertos de
artistas internacionales realizados en Lima durante el año 2021. Indique el elemento, una variable
a medir y una posible observación.
Solución
Una variable por medir es …
Una posible observación es …
10. El objetivo de una investigación en el Perú es determinar el promedio de la edad de las mujeres en
edad fértil que usan métodos anticonceptivos. El INEI considera a la edad fértil en las mujeres
desde los 15 hasta los 49 años. Indique la población, la muestra y la unidad elemental para esta
investigación.
Solución
La población es …
La muestra es …
11. El objetivo de una investigación en la ciudad de Lima es determinar la ocupabilidad en hoteles de

4 y 5 estrellas en Cusco durante el día de año nuevo del 2021, es decir, el porcentaje de habitacio-
nes ocupadas durante ese día. Indique la población y la muestra
Solución
La población es …
La muestra es …
Escalas de medición de las variables
Son los tipos de valores asignados a las unidades elementales para una variable definida.
La escala de medición permite determinar la cantidad de información que contienen los datos y el
análisis estadístico más apropiado.
Nominal
• Una variable está medida en escala nominal cuando los datos son etiquetas
que se emplean para definir un atributo del elemento.
Ordinal
• Una variable está medida en escala ordinal cuando los datos son etiquetas
y el orden es significativo.
• Se pueden ordenar, de tal manera que puedan expresar grados de la
característica medida.
• No tiene sentido medir la distancia entre los valores de la variable ni
realizar operaciones aritméticas con ellos pues no toman valores
numéricos específicos ni existe proporcionalidad entre categorías vecinas.
Intervalo
• Una variable está medida en escala de intervalo si los datos tienen
propiedades de datos ordinales y el intervalo entre observaciones se
expresa en términos de una unidad fija de medida.
• Los datos de intervalo siempre son numéricos.
• El cero es relativo, es decir, no indica la ausencia de la característica
medida.
Razón
• Una variable está medida en escala de razón si los datos tienen todas las
propiedades de los datos de intervalo y se puede realizar cualquier
operación aritmética (suma, resta, multiplicación y división) y lógica
(comparación y ordenamiento).
• El cero es absoluto, es decir, indica la ausencia total de la característica
medida.
Ejemplo 4
Nominal
• Sexo de una persona
• Estado civil de un empleado de una empresa
• Carrera profesional universitaria
Ordinal
• Orden de mérito de un atleta en una competición
• Grado de instrucción de los clientes de un banco
Intervalo
• Temperatura en grados centígrados 0ºC
• Año de nacimiento
Razón
• Sueldo de un empleado de una empresa
• Tiempo en terminar un examen
• Peso de un perro
Ejemplo 5
Indique la escala de medición de las siguientes variables y su escala de medición.
• Número de personas que van a ver una película

• Género de una película (drama, comedia, acción, etc.)
• Duración de una película
• Opinión sobre la película (buena, regular, mala)
Solución
Variable Escala de medida de la variable
Número de personas que van a ver una película Razón
Género de una película (drama, comedia, acción, etc.) Nominal
Duración de una película Razón
Opinión sobre la película (buena, regular, mala) Ordinal
Ejercicios
12. Indique la escala de medición de cada variable.
Variable Nominal Ordinal Intervalo Razón
Nombre de un país X
Número de medallas de oro de un país X
Precio de una entrada, en soles X
Edad de un deportista X
Año en que se desarrolló el Panamericano X
Posición de un país en el medallero X
Temperatura en el agua del mar en °C X
Opinión respecto a los Panamericanos: mala, regular,

X
buena, muy buena
Tipos de variables según su naturaleza
Las variables se pueden clasificar en cualitativas o cuantitativas.
Variable Variable
cualitativa cuantitativa
Es una variable que Es una variable que A su vez, la variable

puede ser expresada puede ser medida en cuantitativa se
en escala nominal u escala de intervalo o clasifica en discreta o
ordinal. de razón. continua.
Variable discreta
Tiene un número finito o infinito
numerable de posibles valores; es
decir, que en un intervalo solo
puede tomar ciertos valores.
Variable continua
Tiene un número infinito no
numerable de posibles valores; es
decir, que en un intervalo puede
tomar cualquier valor.
Ejemplo 6
Variables Tipo de variable Escala de medición

Marca de computadora personal que utiliza Cualitativa Nominal
Tiempo que usa la computadora por semana Cuantitativa continua Razón
Número de perros en una casa Cuantitativa discreta Razón
Ejercicios
13. Indique la escala de medición y tipo de las siguientes variables.
Variable Tipo de variable Escala de medición

Principal ventaja de tener una
Cualitativa Nominal
tarjeta de crédito
Número de tarjetas de crédito

Cuantitativa discreta Razón
que tiene una persona
Número de la tarjeta (Son 16 dígi-

Cualitativa Nominal
tos)
Límite de crédito permitido en

Cuantitativa continua Razón
una sola operación
Tipo de tarjeta (Clásica, Premium,

Cualitativa Ordinal
Signature, Elite)
Compañía de pago (Visa, Master-

Cualitativa Nominal
card)
Año de vencimiento de la tarjeta Cuantitativa discreta Intervalo
14. Indique la escala de medición y tipo de las siguientes variables.
Variable Tipo de variable Escala de medida
Edad del elector
Sexo del elector
Candidato preferido
Nivel socioeconómico del elector
Tiempo que demora desde su casa

al centro de votación
Número de personas que votaron

en una mesa de votación
Año en que se produce la votación

Parámetro
Parámetro es cualquier resumen de la población.
Estadístico
Estadístico es cualquier resumen de la muestra.
Ejemplo 7
En un estudio entre alumnos de la UPC, se registró la edad de todos los alumnos de la UPC. La media
de la edad fue de 19,3 años. Además, de una muestra de aleatoria de 300 alumnos se encontró que el
12% trabaja. Indique lo siguiente.
Medida de resumen Variable Valor Parámetro o estadístico

Media Edad 19,3 años Parámetro
Proporción Condición de trabajo 0,12 Estadístico
Ejemplo 8
La encuesta de El Comercio-Ipsos publicada el 25 de julio del 2021 revela varios datos sobre las priori-
dades de los peruanos. Para empezar, la principal preocupación sigue derivada de las consecuencias
que deja la pandemia por el COVID-19: salud y empleo.
De acuerdo con esta encuesta, se tienen varios estadísticos, como, por ejemplo: Proporción de perua-
nos de 18 a más años que manifiestan que uno de los temas que deberían ser priorizados por el go-
bierno durante los primeros meses de gestión es mejorar los servicios de salud/Avanzar con la vacu-
nación contra el COVID-19, cuyo valor es 0,75. Es un estadístico, pues para calcularlo se uso una mues-
tra aleatoria.
Ejercicios
15. Indique si los porcentajes obtenidos son estadísticos o parámetros.
Los porcentajes obtenidos son estadísticos, pues se calcularon de una muestra.
16. Según los Censos Nacionales 2017 ejecutados por el INEI, el 50,30% de los peruanos son mujeres.
Indique si este resultado es un parámetro o un estadístico. Además, indique el nombre y valor de
la medida de resumen.
Es un parámetro. Proporción de mujeres en el Perú, su valor es 0,503.
17. Según un informe de Sedapal del año 2019 basado en una muestra de habitantes, San Isidro fue el
distrito de Lima Metropolitana que registró el mayor consumo promedio de agua potable: 254
litros por persona por día.
Según el caso, complete los espacios en blanco para el caso de San Isidro.
La población por estudiar es todos los habitantes de San Isidro.
La muestra por seleccionar es algunos habitantes de San Isidro.
La unidad elemental es un habitante de San Isidro.
La variable en estudio es cantidad de litors de agua que consume al día.
La medida de resumen calculada es la media cuyo valor para el distrito de San Isidro es 254 litros
Esta medida de resumen es estadístico, pues es calculado de una muestra.
18. El siguiente gráfico pertenece al estudio de opinión sobre drogas en población urbana peruana de
la ONG Cedro del año 2017. Se encuestó a 8352 personas entre 12 y 65 años. Complete los espa-
cios en blanco.
Fuente: Encuesta sobre opinión sobre drogas en población urbana peruana. Cedro. 2017
Solución
La población por estudiar es …

La variable en estudio es …
La medida de resumen calculada es …
Esta medida de resumen es … (estadístico o parámetro) pues …
19. Los resultados del Censo Nacional de Población Penitenciaria 2016 revelan que el 60,0% de inter-
nos logró estudiar algún año de educación secundaria y 25,2% educación primaria. Las personas
privadas de libertad han logrado estudiar algún año de educación superior (superior no universi-
taria 7,2% y superior universitaria 5,2%). Usando esta información, complete los espacios en
blanco.
Frecuencia absoluta simple de una clase

Es la cantidad de elementos que pertenecen a esa clase. Se denota por 𝑓! .
Frecuencia relativa simple de una clase

Es la proporción de elementos que pertenecen a esa clase. Se calcula dividiendo la frecuencia absoluta
entre el número total de datos. Se denota por ℎ! y se calcula con:
𝑓!
ℎ! =
𝑛
Frecuencia porcentual simple de una clase

Es la frecuencia relativa multiplicada por 100%. Se denota por 𝑝! y se calcula con:
𝑝! = ℎ! × 100%
Distribución de frecuencias
Es un resumen, expresado en un cuadro, de un conjunto de datos que muestra las frecuencias absolu-
tas, relativas y porcentuales en cada una de varias clases que no se traslapan. La distribución de fre-
cuencias es un cuadro que se calcula de la siguiente manera:
Distribución de <unidades elementales> según <variable>

Variable Frecuencia absoluta 𝒇𝒊 Frecuencia relativa 𝒉𝒊 Frecuencia porcentual 𝒑𝒊
𝑓#
Categoría 1 𝑓# ℎ# = 𝑝# = ℎ# × 100%
𝑛
𝑓$
Categoría 2 𝑓$ ℎ$ = 𝑝$ = ℎ$ × 100%
𝑛
⋮ ⋮ ⋮ ⋮
𝑓%
Categoría 𝑘 𝑓% ℎ% = 𝑝% = ℎ% × 100%
𝑛
Total 𝒏 1,00 100%
Fuente:
Título de una tabla de distribución de frecuencias
De acuerdo con el INEI, para los títulos seguiremos el siguiente esquema:

Distribución de frecuencias de variables cualitativas
La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Variable Frecuencia absoluta 𝑓! Frecuencia relativa ℎ! Frecuencia porcentual 𝑝!
𝑓#
Categoría 1 𝑓# ℎ# = 𝑝# = ℎ# × 100%
𝑛
𝑓$
Categoría 2 𝑓$ ℎ$ = 𝑝$ = ℎ$ × 100%
𝑛
⋮ ⋮ ⋮ ⋮
𝑓%
Categoría 𝑘 𝑓% ℎ% = 𝑝% = ℎ% × 100%
𝑛
Total 𝒏 1,00 100%
Fuente: …………………………
Ejemplo 9
La Defensoría del Pueblo presentó el Reporte de Conflictos Sociales N° 213, correspondiente al mes de
noviembre de 2021, el cual da cuenta de 97 conflictos sociales activos.
Distribución de conflictos sociales activos en el Perú según actividad, noviembre 2021

Ejercicios
20. En enero del presente año se entrevistó a una muestra de 400 alumnos de pregrado de la univer-
sidad A y se obtuvo la siguiente información referente al plato peruano preferido.
Complete lo faltante.
Imagen tomada de https://sthephanierv.wordpress.com/2016/11/08/la-gastronomia-peruana-a-los-ojos-del-mundo/
Distribución de alumnos según plato peruano preferido

Plato peruano preferido Cantidad de alumnos Porcentaje de alumnos
Ají de gallina (pollo) 123 30,75%
Lomo saltado 115 28,75%
Ceviche 78 19,50%
Pollo a la brasa 45 11,25%
Causa 27 6,75%
Otro 12 3,00%
Total 400 100,00%
Fuente: Universidad A
21. La empresa DGS va a contratar más personal si el porcentaje de trabajos de la zona Norte supera
al 40%. Organice la siguiente información y proponga la decisión. ¿Se contratará más personal?
Norte Norte Este Este Este Este Este Norte Este Sur Sur Norte Norte Norte Este
Este Sur Sur Norte Sur Sur Este Sur Sur Norte Norte Norte Sur Norte Sur
Norte Este Sur Sur Norte Norte Norte Este Norte Sur Sur Este Sur Este Sur
Interpretración
Determinar si se va a contratar a más personal.
Representación
Vamos a hacer una distribución de frecuencias de la variable <zona>.
Cálculo
Distribución de trabajos según zona
Zona Frecuencia absoluta Frecuencia porcentual
Este 13 28.89%
Norte 16 35.56%
Sur 16 35.56%
Total 45 100.00%
Fuente: Empresa DGS
Análisis y argumentación
El porcentaje de trabajos de la zona Norte es 35,56%, que no supera al 40%. Por lo tanto, no se va
a contratar a más personal.
22. En los Censos Nacionales 2017 ejecutados por el INEI se preguntó a todos los peruanos el idioma
o lengua con el que aprendió hablar, obteniéndose los siguientes resultados. Complete lo faltante.
Perú. Distribución de peruanos según idioma o lengua con el que aprendió hablar
Idioma o lengua con que aprendió a hablar Casos Porcentaje Porcentaje acumulado
Castellano 23 178 478
Quechua 3 799 780
Aimara 450 010 1,61% 98,15%
Ashaninka 73 567 0,26% 98,41%
Lengua de señas peruanas 10 447 0,04% 98,45%
Otra lengua extranjera 49 876 0,18% 98,63%
Otra lengua nativa u originaria 179 601 0,64% 99,27%
No sabe / No responde 204 301 0,73% 100,00%
Total 27 946 060 100,00% 100.00%
Fuente INEI. Censos Nacionales 2017
23. El objetivo de una investigación es estimar el porcentaje de peruanos que aprueban la gestión de
del presidente de la República, para lo cual se tomó una muestra aleatoria de personas de 18 a 70
años y se les preguntó por su opinión. Los resultados son los siguientes.
Desaprueba Aprueba Desaprueba Aprueba Desaprueba Desaprueba Desaprueba

No sabe Aprueba Aprueba Desaprueba Aprueba Aprueba Aprueba
Desaprueba Desaprueba Aprueba Aprueba Desaprueba No sabe Desaprueba
Aprueba Desaprueba Aprueba Aprueba Desaprueba Desaprueba Aprueba
Desaprueba Desaprueba Desaprueba Desaprueba Aprueba Desaprueba Desaprueba
Aprueba No sabe Desaprueba Desaprueba Aprueba Desaprueba No sabe
Aprueba Desaprueba Desaprueba Desaprueba Aprueba Aprueba Desaprueba
Desaprueba Desaprueba Desaprueba Aprueba Aprueba Desaprueba Desaprueba
Aprueba Desaprueba No sabe Aprueba Desaprueba Desaprueba Aprueba
Aprueba Aprueba Aprueba Desaprueba Desaprueba Desaprueba Desaprueba
Construya la distribución de frecuencias de los datos. Interprete los valores 𝑓$ y ℎ# .
Gráficos estadísticos
• El método gráfico es una forma de simplificar lo tedioso y lo complejo.
• Las personas ocupadas necesitan ayuda visual.
• Un gráfico es más accesible que una tabla.
• El método gráfico ayuda al cerebro, ya que permite entender y memorizar mejor.
Ejemplo 10
Instagram es una aplicación de redes sociales que se enfoca en compartir fotos y videos. Es propiedad
de Facebook, que recientemente se renombró como Meta. A partir de diciembre de 2021, Instagram
alcanzó un nuevo hito de 2 mil millones de usuarios activos en todo el mundo. Los usuarios de 25 a 34
años constituían el mayor grupo de usuarios de Instagram por edad en todo el mundo, seguidos por
los de 18 a 24 años. Los hombres son el 51,6% de los usuarios de Instagram.
Distribución de usuarios activos de Instagram desde enero de 2013 hasta diciembre de 2021
Tomado de https://www.statista.com/statistics/253577/number-of-monthly-active-instagram-users/
Gráfico de barras
Es una forma de representar datos cualitativos resumidos en una distribución de frecuencias.
En uno de los ejes, se representan las categorías o clases de la variable; para el otro eje, se puede usar
una escala de frecuencias absolutas, relativas o porcentuales. Se traza una barra sobre cada indicador
de clase de una altura proporcional a la frecuencia correspondiente. Las barras deben estar separadas
para enfatizar el hecho de que cada clase es diferente de otra.
Ejemplo 11
Pronto encabezó la clasificación de revistas femeninas en España al registrar cerca de dos millones de
lectoras durante 2021. Hola y Vogue ocuparon la segunda y la tercera posición.
Distribución de lectores de revistas femeninas en España, en miles, según revista preferida
Tomado de https://es.statista.com/estadisticas/491628/revistas-femeninas-las-mas-leidas-en-espana/
Ejemplo 12
Según el Instituto Internacional de Investigación para la Paz de Estocolmo, Estados Unidos sigue siendo
el mayor exportador de armas, responsable del 38,6 % de las ventas internacionales de armas entre
2017 y 2021. Suministró armas a más de 100 países.
Distribución de armas exportadas del 2017 a 2021 según país de origen
Tomado de https://www.statista.com/chart/18417/global-weapons-exports/
Diagrama circular
Cada sector circular representa la frecuencia observada de una clase o categoría. El sector circular que
representa a una determinada clase de la variable tiene un ángulo en el centro proporcional a la fre-
cuencia relativa de dicha clase. El ángulo que le corresponde a cada clase se obtiene multiplicando
360º por la respectiva frecuencia relativa.
Ejemplo 13
Según el II Informe Bienal sobre la Realidad Universitaria en el Perú publicado por la Superintendencia
Nacional de Educación Superior Universitaria en el año 2020, observamos que no hay gran diferencia
entre la matrícula universitaria entre hombres (48,9%) y mujeres (51,1%). Además, que dentro de las
ciencias sociales (52,8% del total), las ciencias administrativas son las que cuentan con más alumnos
(54,9%).
Distribución de alumnos de pregrado matriculados en el Perú según sexo
Distribución de alumnos de pregrado matriculados en el Perú según área del conocimiento

Según el mismo informe, observamos que el 45,7% de los investigadores registrados en el Registro
Nacional de Ciencia, Tecnología y de Innovación Tecnológica trabajan principalmente en universidades
públicas.
Distribución de investigadores universitarios registrados en el Renacyt

según tipo de gestión de la universidad donde investigan
Ejemplo 14
La Defensoría del Pueblo presentó el Reporte de Conflictos Sociales N° 213, correspondiente al mes de
noviembre de 2021, el cual da cuenta -entre otros aspectos- de 199 conflictos sociales registrados.
Distribución de conflictos sociales en el Perú según actividad, noviembre 2021

Ejercicios
24. América Noticias realizó Feminicidios 2019, un proyecto digital que busca registrar el número de
mujeres asesinadas en el Perú; de lo publicado por este proyecto se tiene los siguientes gráficos.
Póngales título.
Solución
Distribución de femicidios según lugar de ocurrencia
Hotel/hostal Casa de familiar Centro de labores
5.7% 2.9% de la víctima
Casa de agresor 1.4%
6.4% Otros
29.3%
Casa de ambos
7.9%
Lugar desolado
9.3%
Calle-vía pública
12.1% Casa de la víctima
25.0%
Fuente: Feminicidios 2019
Distribución de femicidios según situación legal del feminicida

70 66
60
Número de feminicidas
50
40
28
30 25
20
11 10
10
0
Detenido sin Prófugo Libre en Cometió suicidio Otros
sentencia investigación
Fuente: Feminicidios 2019 Situación legal del feminicida
América Noticias
25. Se tiene como objetivo mostrar la composición porcentual de alumnos universitarios en el Perú
por tipo de institución educativa al final de la secundaria, para lo cual se tomó como referencia los
datos del II Censo Universitario 2010 realizado por el INEI, donde se preguntó a los alumnos
universitarios por el tipo de institución educativa donde terminaron su educación secundaria. Los
resultados se muestran en la siguiente tabla.
Título:
Tipo de institución fi hi
Estatal 256 060 0,5405
Particular 154 275 0,3256
Particular religioso 58 673 0,1238
No escolarizado 4 472 0,0094
Otro 309 0,0007
Total 473 789
Fuente:
Realice un diagrama circular con dichos datos.
Rpta:
Distribución de estudiantes de pregrado según institución donde
terminaron la secundaria
No escolarizado Otro
0.94% 0.07%
Particular religioso
12.38%
Estatal
54.05%
Particular
32.56%
Fuente: II Censo Universitario 2010 INEI Perú
26. El Banco Europeo de Inversiones publicó el 15 de marzo del 2021 la tercera edición de la encuesta
sobre el clima 2020-2021, que analiza las expectativas de los ciudadanos respecto a las políticas
de lucha contra el cambio climático. Ponga título al gráfico circular.
Frecuencias acumuladas, absolutas relativas y porcentuales
Frecuencia absoluta acumulada de una clase
Es la suma de la frecuencia absoluta de un valor determinado de la variable con las frecuencias abso-
lutas de los valores menores de la variable. Se denota por 𝐹! .
La frecuencia absoluta acumulada del último valor de la variable es igual al total de casos.
Frecuencia relativa acumulada de una clase
Es la suma de la frecuencia relativa de un valor determinado de la variable con las frecuencias relativas
de los valores menores de la variable. Se denota por 𝐻! .
La frecuencia relativa acumulada del valor más alto de la variable es igual a 1.
Frecuencia porcentual acumulada de una clase
Es la suma de la frecuencia porcentual de un valor determinado de la variable con las frecuencias por-
centuales de los valores menores de la variable. Se denota por 𝑃! .
La frecuencia porcentual acumulada del valor más alto de la variable es igual a 100%.

Frecuencia porcentual
Variable Frecuencia absoluta 𝒇𝒊 Frecuencia porcentual 𝒑𝒊
acumulada 𝑷𝒊
𝑓#
Categoría 1 𝑓# 𝑝# = × 100% 𝑃#
𝑛
𝑓$
Categoría 2 𝑓$ 𝑝$ = × 100% 𝑃$ = 𝑝# + 𝑃#
𝑛
⋮ ⋮ ⋮ ⋮
𝑓%
Categoría 𝑘 𝑓% 𝑝% = × 100% 100%
𝑛
Total 𝒏 100%
Fuente:
Diagrama de Pareto
El diagrama de Pareto es una representación gráfica que permite identificar y seleccionar los aspectos
prioritarios que hay que tratar en un determinado problema.
También se conoce como diagrama ABC o Ley de las prioridades 80 - 20, que dice: “el 80% de los
problemas que ocurren en cualquier actividad son ocasionados por el 20% de los elementos que inter-
vienen en producirlos” (pocos vitales, muchos triviales).
Según este concepto se tiene un problema con muchas causas, podemos decir que el 20% de las causas
resuelven el 80 % del problema. Por ejemplo, en control de calidad, se puede mostrar que la mayoría
de los defectos surgen de un número pequeño de causas.
Pasos para la elaboración del diagrama de Pareto
Los pasos para la elaboración del diagrama de Pareto son los siguientes:
1. Construya una tabla de distribución de frecuencias ordenando las categorías en forma descen-
dente respecto a la frecuencia.
• La categoría Otros se coloca al final, no importa cuán grande sea, pues está compuesta por
categorías cuyas frecuencias son menores al valor de la variable con frecuencia más pequeña
listada individualmente.
• Agregue a la tabla de distribución de frecuencias una columna para la frecuencia acumulada.

Variable Frecuencia absoluta 𝒇𝒊 Frecuencia porcentual 𝒑𝒊 Frecuencia porcentual 𝑷𝒊
Categoría 1 𝑓" 𝑝" 𝑃"
Categoría 2 𝑓# 𝑝# 𝑃#
⋮ ⋮ ⋮ ⋮
Otros 𝑓$ 𝑝$ 𝑃$
Total 𝒏 100% 100%
Fuente:
2. Dibuje los ejes verticales y horizontal, título, rótulos de los ejes y fuente.
• Dibuje un eje vertical izquierdo, un eje vertical derecho y uno horizontal.

• En el eje vertical izquierdo, ponga alguna de las frecuencias simples (𝑓! , ℎ! o 𝑝! ).
• Si usa la frecuencia absoluta 𝑓! , marque una escala de 0 a 𝑛.
• Si usa la frecuencia relativa ℎ! , marque una escala de 0 a 1.
• Si usa la frecuencia absoluta 𝑝! , marque una escala de 0% a 100%.
• En el eje vertical derecho, use alguna de las frecuencias acumuladas (𝐹! , 𝐻! o 𝑃! = 𝐻! %). Se
recomienda usar la frecuencia porcentual acumulada; en ese caso, marque una escala de 0%
a 100%.
• En el eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una de
las categorías incluida la categoría Otros.
Distribución de unidades elementales según variable
Frecuencia acumulada porcentual

100%
Frecuencia simple 75%
50%
25%
Categoría 1 Categoría 2 Categoría 3 Otros
Variable
Fuente:
3. Grafique el diagrama de barras.


100%
Frecuencia simple
75%
50%
25%
Variable
Fuente:
4. Dibuje la línea de frecuencias acumuladas (curva de Pareto). Indique las etiquetas de datos de las
frecuencias simples y de las frecuencias acumuladas.
100%
100% 𝟏𝟎𝟎%
𝑃) 𝐏𝟑
Frecuencia simple
𝑃$ 75%
𝑃# 𝐏𝟐
𝐏𝟏
50%
25%
Variable
Fuente:
Ejemplo 15
El gerente de producción de una empresa, que produce asientos de fibra de vidrio, quiere identificar
los problemas más frecuentes reportados en la fabricación de este producto, y planear soluciones de
acuerdo con la recurrencia del problema.
Al extraer una muestra aleatoria de productos fallados, obtuvo los siguientes resultados:
Distribución de productos según problemas reportados en los asientos de fibra de vidrio

Tipo de problema reportado Número de ocurrencias 𝒇𝒊
Color inadecuado 28
Forma no simétrica 16
Medidas fuera de norma 50
Superficie rugosa 71
Bordes afilados 9
Desprendimiento de capa protectora 12
Otros 14
Fuente: Gerencia de Producción
Elabore el diagrama de Pareto.
Solución
Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categoría Otros va al final.
Luego, se calcula las frecuencias relativas y las relativas acumuladas.
Distribución de productos según problemas reportados de asientos de fibra de vidrio

Tipo de problema reportado fi hi Fi Hi
Superficie rugosa 71 0,355 71 0,355
Medidas fuera de norma 50 0,250 121 0,605
Color inadecuado 28 0,140 149 0,745
Forma no simétrica 16 0,080 165 0,825
Desprendimiento de capa protectora 12 0,060 177 0,885
Bordes afilados 9 0,045 186 0,930
Otros 14 0,070 200 1,000
Fuente: Gerencia de Producción
También se puede realizar el gráfico de Pareto usando las frecuencias relativas hi y las frecuencias
relativas acumuladas Hi.
Distribución de productos según problemas reportados de asientos de fibra de vidrio

Ejercicios
27. El gerente financiero del Banco JJF realizó un estudio sobre los principales problemas que declara-
ron los clientes que poseen la tarjeta de crédito TravelMax. Si se quiere identificar los problemas
más importantes que deben resolverse para solucionar el 70% de la problemática. ¿Usted que le
recomendaría a gerente financiero?
Distribución de … según …
Principal problema fi Fi hi Hi
Poca información sobre beneficios 77 77 35,00% 35,00%
Alto costo de membresía 46 123 20,91% 55,91%
Pocos puntos TravelMax por compras 31 154 14,09% 70,00%
Pocos destinos para elegir 24 178 10,91% 80,91%
Altos intereses 19 197 8,64% 89,55%
Otros 23 220 10,45% 100,00%
Total 220 100,00%
Fuente: Banco JJF
Interpretación
Identificar los problemas más importantes que deben resolverse para solucionar el 70% de la pro-
blemática.
Representación
Vamos a realizar un gráfico de Pareto de la variable <principal problema>.
Cálculo
Distribución de clientes que poseen la tarjeta de crédito TravelMax según principal problema
Principal problema fi Fi hi Hi
Poca información sobre beneficios 77 77 35,00% 35,00%
Alto costo de membresía 46 123 20,91% 55,91%
Pocos puntos TravelMax por compras 31 154 14,09% 70,00%
Pocos destinos para elegir 24 178 10,91% 80,91%
Altos intereses 19 197 8,64% 89,55%
Otros 23 220 10,45% 100,00%
Total 220 100,00%
Fuente: Banco JJF
Los problemas más importantes que deben resolverse para solucionar el 70% de la problemática
son poca información sobre beneficios, alto costo de la membresía y pocos puntos Travel por com-
pras.
28. La siguiente tabla fue desarrollada con información de los Censos Nacionales 2017. Se quiere rea-
lizar un comentario a partir de un gráfico que muestre que en pocos tipos de materiales de cons-
trucción en las paredes se concentra la mayor cantidad de viviendas.
Distribución de ……… según …………

Material de construcción predominante en las paredes Casos Porcentaje Porcentaje acumulado
Ladrillo o bloque de cemento 4 298 274 55,83% 55,83%
Adobe 1 791 829 23,27% 79,10%
Madera (pona, tornillo etc.) 727 778 9,45% 88,56%
Tapia 356 665 4,63% 93,19%
Triplay / calamina / estera 239 012 3,10% 96,29%
Otro material 285 342 3,71% 100,00%
Total 7 698 900 100,00% 100,00%
Fuente: Censos Nacionales 2017 INEI
Solución
La variable en estudio es …
El gráfico más adecuado es …

Distribución de viviendas según material de construcción predominante en las paredes

100%
7 000 000 90%
Porcentaje acumulado de viviendas

6 000 000 80%
Número de viviendas
70%
5 000 000
60%
4 000 000 50%
3 000 000 40%
30%
2 000 000
20%
1 000 000
10%
0 0%
Ladrillo o bloque Adobe Madera (pona, Tapia Triplay / calamina Otro material
de cemento tornillo etc.) / estera
Fuente: Censos Nacionales 2017. INEI Material predominante en las paredes
29. En la agencia de viajes A se realizó una encuesta a 330 clientes respecto a las principales quejas
que tienen clientes acerca de los tours del tipo todo incluido al exterior. Las cuales se detallan en
el siguiente cuadro.
Distribución de clientes según principales quejas de clientes
Principal queja Frecuencia absoluta
Cambio de fecha de los vuelos 120
El hotel no era de la categoría que se veía en el folleto 94
Los hoteles no incluyen bebidas premium 61
La comida de los hoteles no es de calidad excelente 23
Otros 25
Que les venden otros servicios como tiempo compartido 7
Fuente: Dirección de Atención al cliente. Agencia A
Realice el diagrama de Pareto correspondiente a estos datos.
30. Objetivo: Identificar las principales quejas de los pasajeros sobre el servicio que brinda la aerolí-
nea. Teniendo en cuenta la siguiente información, elabore el diagrama de Pareto.
Distribución de pasajeros según principal queja del servicio de la aerolínea Wayra

Principal queja Número de pasajeros pi Fi Pi
Mucho tiempo en cola en el counter 124
La comida no es buena 59
Impuntualidad de los vuelos 25
Pocos vuelos 16
Tarifas muy caras 9
Otros 17
Fuente: Wayra S.A 𝑛 = 250
Tabulaciones cruzadas
También llamadas tablas de contingencia o de doble entrada. Se usan para resumir de manera simul-
tánea los datos para dos variables.
Título de una tabla cruzada o gráfico de una tabla de contingencia

Siguiendo indicaciones del INEI, en este curso, usaremos el siguiente esquema.
Si el gráfico presenta las frecuencias absolutas o las frecuencias porcentuales con respecto al total, el
título será:
Distribución de <unidades elementales> según <variable 1> y <variable 2>
Si el gráfico presenta las frecuencias porcentuales con respecto a la variable 2, el título será:
Distribución de <unidades elementales> según <variable 1> por <variable 2>
Ejemplo 16
Según el II Informe Bienal sobre la Realidad Universitaria en el Perú publicado por la SUNEDU en el año
2020, observamos que sí hay gran diferencia entre la cantidad de autoridades universitarias entre
hombres y mujeres en todos los tipos de gestión.
Incluye cuatro categorías —titulares, adjuntas, encargadas y accesitarias— para 142 universidades. Los
cargos son rector y vicerrector o decano; y, en una proporción importante de las universidades priva-
das, cargos equiparables como presidente, gerente general o director.
Distribución de autoridades universitarias según sexo y tipo de gestión

Tipo de gestión Mujer Hombre Total
Pública 126 467 593
Privada asociativa 108 330 438
Privada societaria 93 250 343
Total 327 1047 1374
Fuente: Sunedu, 2019
Distribución de autoridades universitarias según sexo y tipo de gestión

Pública 9.17% 33.99% 43.16%
Privada asociativa 7.86% 24.02% 31.88%
Privada societaria 6.77% 18.20% 24.96%
Total 23.80% 76.20% 100.00%
Distribución de autoridades universitarias según sexo por tipo de gestión
Pública 21.25% 78.75% 100%
Privada asociativa 24.66% 75.34% 100%
Privada societaria 27.11% 72.89% 100%
Total 23.80% 76.20% 100%
Distribución de autoridades universitarias según tipo de gestión por sexo

Pública 38.53% 44.60% 43.16%
Privada asociativa 33.03% 31.52% 31.88%
Privada societaria 28.44% 23.88% 24.96%
Total 100.00% 100.00% 100.00%
Ejercicios
31. En los Censos Nacionales 2017 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a las peruanas por la cantidad de hijos que han tenido vivos, obteniéndose los siguientes
resultados.
Perú. Distribución de mujeres según edad de la mujer y número de hijos nacidos vivos
Número total de hijos/a que ha tenido nacidos vivos
Edad en años 0 hijos 1 hijo 2 hijos 3 hijos 4 hijos 5 hijos 6 hijos Total
12 años 268 402 140 268 542
13 años 256 100 2038 258 138
14 años 244 718 2811 24 247 553
15 años 233 809 4933 115 238 857
16 años 226 478 9181 400 44 236 103
17 años 222 861 18841 1318 107 243 127
18 años 213 602 32381 3590 340 77 249 990
19 años 186 065 43147 6807 731 132 236 882
20 años 179 260 57 564 12017 1555 236 90 29 250 751
Total 2 031 295 171 036 24 271 2777 445 90 29 2 229 943
Fuente: INEI – Censos Nacionales 2017
a. Calcule el número de menores de edad con hijos.
El número de menores de edad con hijos es 39952.

12 años 140
13 años 2038
14 años 2811 24
15 años 4933 115
16 años 9181 400 44
17 años 18841 1318 107
b. Calcule el porcentaje de mujeres de 19 años que han tenido hijos.
El porcentaje de mujeres de 19 años que han tenido hijos 21,45% (50817/236882 x 100%).

19 años 186 065 43147 6807 731 132 236 882
32. A continuación, se presenta el resumen de datos de 250 clientes morosos del banco JMF en julio
del 2020. El gerente del banco JMF elegirá una sede (Lima o Arequipa) para iniciar una campaña
de facilidades de pago. El criterio será el siguiente: se iniciará la campaña de facilidades de pago
en la sede donde sea mayor el porcentaje de clientes de la categoría estándar. Indique la sede en
la que se iniciará dicha campaña.
Distribución de clientes morosos según categoría y sede

Sede
Categoría Total
Lima Arequipa
Estándar 80 50 130
Silver 50 20 70
Gold 40 10 50
Total 170 80 250
Fuente: Banco JMF
Gráfico de tabulaciones cruzadas de dos variables
Distribución de <elementos> Distribución de <elementos>

según según
<variable 1> y <variable 2> <variable 1> por <variable 2>
100%
Variable 2
Variable 2
Variable 1
Variable 1
Variable 1 Variable 1 Variable 2 Variable 2
Todas las frecuencias juntas En cada grupo o columna, las

suman n o 100% frecuencias suman 100%
Barras Barras Barras Barras
agrupadas apiladas agrupadas apiladas al
al 100% 100%
Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El alto
de cada barra es proporcional a la frecuencia de cada categoría.
Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada categoría.
El alto de cada barra es proporcional a la frecuencia de cada categoría.
Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada ca-
tegoría. El alto de cada barra es el mismo para cada categoría.
Ejemplo 17
Según el II Informe Bienal sobre la Realidad Universitaria en el Perú publicado por la SUNEDU en el año
2020, observamos que sí hay gran diferencia entre la matrícula universitaria entre hombres y mujeres
por área de conocimiento.
Distribución de alumnos de pregrado en el Perú según sexo por área del conocimiento
Ejercicios
33. En total, las descargas de aplicaciones en todo el mundo alcanzaron los 36100 millones en el cuarto
trimestre del año 2021. Las aplicaciones de inversión y criptomonedas ganaron impulso con los
tokens no fungibles (NFT) que surgieron como una tendencia al alza. Ponga título a este gráfico.
Distribución de descargas de aplicaciones según app y plataforma de descarga
https://sensortower.com/blog/q4-2021-data-digest/
Porque se muestran las frecuencias absolutas.
34. Según un estudio realizado por la organización Women’s Media Center, de los 205 nominados en
2022 en las categorías no actorales, solo 55 (el 27%) son mujeres, mientras que 150 (el 73%) son
hombres. Se trata de la tasa más baja de representación femenina en las categorías no condicio-
nadas por el género analizadas en tres años. Ponga título al siguiente gráfico.
Distribución de nominados al Oscar 2022 según categoría no actoral y sexo
Tomado de https://es.statista.com/grafico/27119/hombres-y-mujeres-nominados-a-los-premios-oscar-en-categorias-no-actorales-seleccionadas/
Porque se muestran las frecuencias absolutas.

35. El CDC predice que la variante BA.2 de Covid-19, será la dominante en los Estados Unidos en el
primer trimestre del año 2022. Los datos muestran que la variante, que está relacionada con las
variedades de covid-19 que se conocieron como Omicron (BA.1.1), fue responsable de alrededor
del 35% de los casos en el país hasta el 19 de marzo de 2022. Ponga título al siguiente gráfico.
Distribución de contagiados según variante por semana
36. En los Censos Nacionales de Población y Vivienda 2007 y 2017, se preguntó a los peruanos por la
región natural donde residían. Ponga título al siguiente gráfico.
Distribución de residentes en el Perú según región natural donde reside por año
37. A fin de conocer hacia dónde se dirigen los limeños durante el día, El Comercio accedió a un estudio
de la Autoridad Autónoma del Tren Eléctrico (AATE), que empleó la tecnología Big Data –movi-
miento del GPS de los celulares de forma anónima– que esta institución adscrita al Ministerio de
Transporte y Comunicaciones usa para planificar el futuro del transporte público integrado. Ponga
título al siguiente gráfico.
38. En el II Censo Nacional Universitario del año 2010 realizado por el INEI se preguntó a los alumnos
del Perú por su tipo de universidad y su género. Los datos se muestran en el siguiente cuadro.
Perú. Distribución de alumnos de pregrado por género y tipo de universidad. 2010

Sexo Pública Privada Total
Mujer 135 082 247 743 382 825
Hombre 174 093 226 052 400 145
Total 309 175 473 795 782 970
Fuente: INEI. II Censo Universitario. 2010.
a. Interprete el valor “135 082” de la tabla.

b. Elabore un gráfico comparativo que permita ver la composición porcentual según sexo y tipo
de universidad.
c. Elabore un gráfico comparativo que permita ver la composición porcentual según sexo por tipo
de universidad.
Distribución de alumnos según género por tipo de
universidad
100%
90%
Porcentaje de alumnos
80%
56.31% 47.71%
70%
60%
50%
Hombre
40%
30% Mujer
52.29%
20% 43.69%
10%
0%
Pública Privada
Tipo de universidad
Fuente: INEI. II Censo Universitario 2010
d. Elabore un gráfico comparativo que permita ver la composición porcentual según tipo de uni-
versidad por sexo.
Rpta:
Resumen de datos cuantitativos

Distribución de frecuencias de variables discretas
Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la variable el
número de elementos (frecuencia) que la componen.
Si los datos son discretos y no hay mucha variabilidad se presentarán directamente cada valor de la
variable y sus respectivas frecuencias. El procedimiento más simple es listar los 𝑛 datos en forma as-
cendente y luego elaborar la tabla de distribución de frecuencias indicando para cada valor de la va-
riable su respectiva frecuencia con la que aparece en la serie.

Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
Variable
absoluta 𝑓! relativa ℎ! acumulada 𝐹! acumulada 𝐻!
𝑓#
𝑥# 𝑓# ℎ# = 𝐹# = 𝑓# 𝐻# = ℎ#
𝑛
𝑓$
𝑥$ 𝑓$ ℎ$ = 𝐹$ = 𝑓$ + 𝐹# 𝐻$ = ℎ$ + 𝐻#
𝑛
⋮ ⋮ ⋮ ⋮ ⋮
𝑓%
𝑥% 𝑓% ℎ% = 𝑛 1,00
𝑛
Total 𝑛 1
Fuente:
Gráfico de bastones
En este caso, la variable se ubica en el eje de las abscisas y las frecuencias, absolutas, relativas o por-
centuales, en el eje ordenado.
Ejemplo 18
Distribución de alumnos de pregrado según número de veces

que postuló a la universidad donde estudia
700,000
576,215
600,000
Número de alumnos
500,000
400,000
300,000
200,000 119,642
58,315
100,000 18,748 9,908 81 32 22 7
0
0 1 2 3 4 5 6 7 8 9
Número de veces que postuló
Fuente: PERÚ, II Censo Nacional Universitario 2010. INEI
Ejercicios
39. Para Fiestas Patrias, la empresa Wayra está dispuesta a realizar una promoción, si el porcentaje de
pasajeros que haya realizado como mínimo cuatro viajes supera el 70%. Indique lo que hará la
empresa. Se cuenta con la siguiente información y se desea hacer un gráfico.
Distribución de pasajeros según número de viajes

Número de viajes Número de pasajeros pi Fi Pi
1 15 10% 15 10%
2 18 12% 33 22%
3 24 16% 57 38%
4 30 20% 87 58%
6 63 42% 150 100%
Fuente: Aerolínea Wayra
Interpretación
Determinar si se va a realizar una promoción.
Representación
La unidad elemental es un pasajero
La variable en estudio es número de viajes
Se hará el gráfico de bastones, pues la variable en estudio es discreta.
Cálculo
El porcentaje de pasajeros que haya realizado como mínimo cuatro viajes es 62% (20% + 42%),
que no supera el 70%. Por lo tanto, no se va a realizar una promoción.
40. Uno de los objetivos de una investigación en la empresa A es mostrar la composición porcentual
del número de cursos de capacitación dadas a sus trabajadores. Los siguientes datos muestran el
número de capacitaciones que 48 trabajadores han recibido en el presente año.
3 3 1 2 1 1 2 2 1 6 3 1 3 1 3 2 3 2 2 3 2 2 1 1
1 1 1 1 3 2 2 4 1 2 2 2 1 3 1 2 1 2 2 2 2 1 6 2
Construya el gráfico de frecuencias porcentuales para la variable “número de capacitaciones”.

Distribución de frecuencias de variables continuas
Es un resumen de un conjunto de datos que consiste en presentar para cada categoría el número de
elementos (frecuencia) que la componen. Los datos se agrupan de intervalo (también llamados clases,
categorías o grupos).
Pasos para construir la tabla de frecuencias
Para agrupar 𝑛 datos de una muestra, los pasos son los siguientes:
a. Determine el rango (𝑟)

𝑟 = 𝑋𝑚á𝑥 – 𝑋𝑚í𝑛
donde:
𝑋𝑚á𝑥 es el dato de mayor valor
𝑋𝑚í𝑛 es el dato de menor valor
b. Determine el número de intervalos (𝑘) usando la regla de Sturges:
𝑘 = 1 + 3,322 𝑙𝑜𝑔(𝑛)
El número de intervalos 𝑘 es siempre un número entero. Si la estimación tiene decimales, se toma

el entero más próximo.
c. Calcule el ancho o amplitud de intervalo (𝑤).
𝑟
𝑤=
𝑘
La amplitud 𝑤 se redondea al número inmediato superior de acuerdo con la cantidad de decimales

que tienen los datos o según la precisión con que se desea trabajar.
Por ejemplo:
𝒓 𝒘
Si los datos tienen 𝒘=
𝒌 (redondeo por exceso)
cero decimales 𝑤 = 50,2381 𝑤 = 51
una cifra decimal 𝑤 = 50,2381 𝑤 = 50,3
dos cifras decimales 𝑤 = 50,2381 𝑤 = 50,24
tres cifras decimales 𝑤 = 50,2381 𝑤 = 50,239
cero decimales 𝑤 = 0,38001 𝑤 = 1,0
d. Determine los límites de cada intervalo.
• Partiendo del dato de menor valor, es decir el límite inferior del primer intervalo, 𝐿!# se deter-
mina cada uno de los límites de intervalos sumando la amplitud de clase a cada valor obtenido.
• Si los datos son cuantitativos continuos, el límite superior 𝐿* de un intervalo es el límite inferior
𝐿! del siguiente intervalo. El intervalo es abierto en el límite inferior y cerrado en el límite su-
perior, con excepción en el primer intervalo en el que los dos límites son cerrados.
e. Calcule la marca de clase N𝑥%´ O. La marca de clase es el punto medio de cada clase. Se calcula como
la semisuma de los límites de cada clase. Representa a todos los datos que están contenidos en
dicha clase.
Límite inferior + Límite superior 𝐿!% + 𝐿*%

𝑥%´ = =
2 2
f. Construya la tabla de distribución de frecuencias realizando la agrupación y conteo de los datos

según la clase a la que corresponda.

Frecuencia Frecuencia Frecuencia abso- Frecuencia rela-
Intervalos Marca de clase
absoluta luta acumulada tiva acumulada
(clases) 𝑥!´ relativa ℎ!
𝑓! 𝐹! 𝐻!
𝐿!# + 𝐿*# 𝑓#
[𝐿!# − 𝐿*# ] 𝑥#´ = 𝑓# ℎ# = 𝐹# = 𝑓# 𝐻# = ℎ#
2 𝑛
𝐿!$ + 𝐿*$ 𝑓$
]𝐿!$ − 𝐿*$ ] 𝑥$´ = 𝑓$ ℎ$ = 𝐹$ = 𝑓$ + 𝐹# 𝐻$ = ℎ$ + 𝐻#
2 𝑛
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝐿!% + 𝐿*% 𝑓%
]𝐿!% − 𝐿*% ] 𝑥%´ = 𝑓% ℎ% = 𝑛 1,00
2 𝑛
Total 𝒏 1
Fuente:
Ejemplo 19
El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. La tabla muestra los pagos de impuestos, en soles, en el 2020 de 48
viviendas elegidas al azar.
145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1
Elabore la tabla de frecuencias para la variable: pago por impuestos municipales año 2020.
Solución
El rango 𝑟 se calcula con:
𝑟 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 = 351,1 − 145, 1 = 206
Siguiendo la regla de Sturges, el número de intervalos es:
𝑘 = 1 + 3,322 𝑙𝑜𝑔#, 𝑛 = 1 + 3,322 𝑙𝑜𝑔#, (48) = 6,585
El número de intervalos 𝑘 es un valor entero y se usa el redondeo simple. En este caso, 𝑘 = 7.
La amplitud del intervalo 𝑤 se calcula de la siguiente manera:
𝑟 206
𝑤= = = 29,429 ≈ 29,5
𝑘 7
El valor de la amplitud del intervalo 𝑤 se va a redondear por exceso. En este caso se redondea a un
decimal, pues los datos tienen un decimal.
Distribución de frecuencias del pago de impuestos municipales del año 2020

Pago de impuestos Marca de clase fi hi Fi Hi
[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1 ; 351,6] 336,85 6 0,1250 48 1,0000
Total 48 1,0000
Fuente: Oficina de Rentas de la Municipalidad
Ejercicios
41. Se seleccionó una muestra de clientes que compró papas nativas en una feria de productos agra-
rios. Construya la distribución de frecuencias.
Pesos de papas nativas, en kilogramos, que clientes compraron en una visita a una feria
1,0 1,4 1,5 1,9 2,2 2,3 2,5 2,8 2,8 2,8 3,0 3,2 3,2 3,3 3,3 3,3 3,3
3,3 3,4 3,6 3,7 3,9 4,0 4,1 4,2 4,3 4,4 4,4 4,5 4,5 4,5 4,6 4,6 4,6
4,6 4,6 4,8 4,9 5,0 5,0 5,1 5,3 5,4 5,4 5,4 5,5 5,5 5,5 5,6 5,7 5,7
5,7 5,7 5,7 5,7 5,8 5,8 5,9 6,0 6,0 6,0 6,2 6,3 6,5 7,0 7,5 7,5 7,8
El rango 𝑟 se calcula con:
𝑟 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 = 7,8 − 1, 0 = 6,8
𝑘 = 1 + 3,322 𝑙𝑜𝑔#, 𝑛 = 1 + 3,322 𝑙𝑜𝑔#, (68) = 7,09
El número de intervalos 𝑘 es un valor entero y se usa el redondeo simple. En este caso, 𝑘 = 7.
La amplitud del intervalo 𝑤 se calcula de la siguiente manera:
𝑟 6,8
𝑤= = = 0,97 ≈ 1,0
𝑘 7
El valor de la amplitud del intervalo 𝑤 se va a redondear por exceso. En este caso se redondea a
un decimal, pues los datos tienen un decimal.
Distribución de clientes según peso de papas nativas compradas

Peso de las papas Marca de clase fi hi Fi Hi
[min = 1,0; min + w = 2,0] 1,5 4 0.0588 4 0.0588
]2,0 ; 3,0] 2,5 7 0.1029 11 0.1618
]3,0 ; 4,0] 3,5 12 0.1765 23 0.3382
]4,0 ; 5,0] 4,5 17 0.2500 40 0.5882
]5,0 ; 6,0] 5,5 21 0.3088 61 0.8971
]6,0 ; 7,0] 6,5 4 0.0588 65 0.9559
]7,0 ; 8,0] 7,5 3 0.0441 68 1.0000
Total 68 1,0000
Fuente: Feria agrícola
1,0 1,4 1,5 1,9 2,2 2,3 2,5 2,8 2,8 2,8 3,0 3,2 3,2 3,3 3,3 3,3 3,3
3,3 3,4 3,6 3,7 3,9 4,0 4,1 4,2 4,3 4,4 4,4 4,5 4,5 4,5 4,6 4,6 4,6
4,6 4,6 4,8 4,9 5,0 5,0 5,1 5,3 5,4 5,4 5,4 5,5 5,5 5,5 5,6 5,7 5,7
5,7 5,7 5,7 5,7 5,8 5,8 5,9 6,0 6,0 6,0 6,2 6,3 6,5 7,0 7,5 7,5 7,8
𝑓$ = 7. Del total de clientes en la muestra, 7 de ellos compraron más de 2 y hasta 3 kilos de papas
𝐹- = 40. Del total de clientes en la muestra, 40 de ellos compraron desde un kilo hasta 5 kilos de
papas.
𝐻) = 0,3382. Del total de clientes en la muestra, el 33,82% de ellos compraron desde un kilo hasta
4 kilos de papas.
42. La siguiente tabla corresponde a la distribución de frecuencias de los salarios, en soles, del último
mes de los empleados de la empresa A. Complete la tabla.
Empresa. A. Distribución de trabajadores según salarios, en soles, del último mes

Clase Marca de Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
clase absoluta fi relativa hi acumulada Fi acumulada Hi
[1200; ] 120
] ; ] 1800 300 0,42
] ; ] 780
] ; ] 150
] ; ]
Fuente. Gerencia de Recursos Humanos. Empresa A

Clase Marca Frecuencia Frecuencia Frecuencia absoluta Frecuencia rela-
de clase absoluta fi relativa hi acumulada Fi tiva acumulada Hi
[1200; 1200+w] 120 0,12 120 0,12
]1200+w ; 1200+2w] 1800 300 0,30 420 0,42
] ; ] 360 0,36 780 0,78
] ; ] 150 0,15 930 0,93
] ; ] 70 0,07 1000 1,00
Como 1800 es la marca de clase, se puede plantear:
(1200 + 𝑤) + (1200 + 2𝑤)

= 1800
2
𝑤 = 400
Clase Marca Frecuencia Frecuencia Frecuencia absoluta Frecuencia rela-
de clase absoluta fi relativa hi acumulada Fi tiva acumulada Hi
[1200; 1600] 1400 120 0,12 120 0,12
]1600; 2000] 1800 300 0,30 420 0,42
]2000 ; 2400] 2200 360 0,36 780 0,78
]2400 ; 2800] 2600 150 0,15 930 0,93
]2800 ; 3200] 3000 70 0,07 1000 1,00
43. El objetivo de una investigación sobre la lúcuma, de la empresa A en el presente mes, es establecer
la distribución de su peso para la exportación. La lúcuma es originaria de las regiones tropicales de
Sudamérica. Es empleada, sobre todo, en la preparación de dulces, postres y helados.
En el siguiente cuadro se muestra el peso, en gramos, de una muestra de 60 frutos.
167 172 173 180 182 182 183 183 183 184 185 186
186 186 187 189 190 191 191 192 193 194 194 194
194 195 195 195 197 197 199 201 201 201 201 201
203 204 205 207 207 207 207 209 210 212 212 213
213 214 218 218 218 219 220 222 223 226 228 232
Realice la tabla de distribución de frecuencias de los datos.
44. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años.
Complete la distribución de frecuencias.
Distribución de una muestra de peruanos de 18 años, según su estatura

Estatura (en metros) Marca de clase fi hi Fi Hi
[ , ] 155 0,48
] , ] 0,32
] , ] 167 0,95
] , ] 600
Fuente: MINSA
Gráficos de datos cuantitativos

Histograma
Un histograma es una representación gráfica de una variable en forma de barras, donde la altura de
cada barra es proporcional a la frecuencia de los valores representados.
Se coloca la variable sobre el eje horizontal y las frecuencias sobre el eje vertical.
Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase sobre
el eje horizontal y cuya altura es proporcional a la frecuencia correspondiente (absoluta, relativa o
porcentual). Los rectángulos adyacentes se tocan entre sí.
Histograma de frecuencias absolutas

Frecuencia simple absoluta
𝑓"
𝑓!
𝑓#
𝑓$
𝑓%
𝐿!" 𝐿#" = 𝐿!$ 𝐿#$ = 𝐿!% 𝐿#% = 𝐿!& 𝐿#& = 𝐿!' 𝐿#'
Variable
Fuente: Unidad de medición
Histograma de frecuencias relativas

Frecuencia simple relativa
ℎ"
ℎ!
ℎ#
ℎ$
ℎ%
𝐿!" 𝐿#" = 𝐿!$ 𝐿#$ = 𝐿!% 𝐿#% = 𝐿!& 𝐿#& = 𝐿!' 𝐿#'
Variable
Histograma de frecuencias porcentuales

Frecuencia simple porcentual
𝑝"
𝑝!
𝑝#
𝑝$
𝑝%
𝐿!" 𝐿#" = 𝐿!$ 𝐿#$ = 𝐿!% 𝐿#% = 𝐿!& 𝐿#& = 𝐿!' 𝐿#'
Variable
Polígono de frecuencias
Un polígono de frecuencias es un gráfico de líneas que une los puntos asociados a las marcas de clase
de una variable. La altura del punto asociado a cada marca de clase es proporcional a la frecuencia de
dicho valor.
Se realiza uniendo con segmentos de recta los puntos de intersección de las marcas de clase con las
frecuencias (absolutas, relativas o porcentuales).
Los polígonos de frecuencias se cierran creando dos intervalos ficticios, uno antes del primer intervalo
y uno después del último.
Si los intervalos creados toman valores que pueden no ser reales, igual se crea el intervalo, como,
ejemplo, tiempos negativos.

Frecuencia simple
𝑥"´ − 𝑤 𝑥"´ 𝑥#´ 𝑥'´ 𝑥(´ 𝑥(´ + 𝑤

Variable
Ojiva
La ojiva es la gráfica de una distribución acumulada de frecuencias.
Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de cada
intervalo y la frecuencia acumulada respectiva.
La ojiva usa los límites de los intervalos y no las marcas de clase.
Con la ojiva se puede estimar fácilmente el número o porcentaje de observaciones que corresponden
a un intervalo determinado.

100%
𝑃$
100%
Frecuencia acumulada
𝑃#
porcentual
75% 𝑃"
50% 𝑃!
25%
𝐿%" 𝐿&" 𝐿&# 𝐿&' 𝐿&( 𝐿&)

Variable
Ejercicios
45. Grafique el histograma, el polígono de frecuencias y la ojiva de frecuencias porcentuales con los
datos de la muestra del ejercicio de las papas nativas.
46. En economía, la prima de riesgo es el sobreprecio que paga un país para financiarse en los merca-
dos en comparación con otros países. Cuanto mayor es el riesgo país, más alta será su prima de
riesgo. Significa la confianza de los inversores en la solidez de una economía. La prima de riesgo de
los países de la Unión Europea se calcula respecto de Alemania porque su deuda pública es la que
tiene menor riesgo de impago. Para el caso de España, la agencia de calificación de riesgos A ha
medido la prima de riesgo durante 50 días desde junio del 2017.
España. Distribución de días según prima de riesgo. Junio y julio del 2017
Prima de riesgo Marca de clase fi hi Fi Hi
[ 120 ; 130 ] 125 1 0,0200 1 0,0200
] 130 ; 140 ] 135 3 0,0600 4 0,0800
] 140 ; 150 ] 145 11 0,2200 15 0,3000
] 150 ; 160 ] 155 14 0,2800 29 0,5800
] 160 ; 170 ] 165 12 0,2400 41 0,8200
] 170 ; 180 ] 175 6 0,1200 47 0,9400
] 180 ; 190 ] 185 3 0,0600 50 1,0000
Fuente: Agencia de Calificación de Riesgos A.
Grafique el histograma, el polígono de frecuencias y la ojiva de frecuencias relativas.

Distribuciones de frecuencias de dos o más grupos de datos con intervalos comunes
La idea básica para distribuciones de frecuencias de dos o más grupos de datos es tener intervalos
comunes, es decir, que los límites de los intervalos para ambas distribuciones sean iguales. Para ello,
debemos seguir los siguientes pasos:
• Hallar el valor mínimo de todos los datos y el valor máximo de todos los grupos de datos, y usarlos
para calcular el rango.
• Siguiendo la regla de Sturges, el número de intervalos 𝑘 es:
𝑘 = 1 + 3,322 𝑙𝑜𝑔#, (𝑛)
El valor de 𝑛 es el máximo del número de datos de cada grupo. Tener en cuenta que no es la suma
de ambos tamaños muestrales.
• Luego se construye cada distribución de frecuencias, usando las mismas reglas de la distribución
de frecuencias de una variable continua.
Ejemplo 20
La empresa de investigación de mercado A lleva a cabo un estudio para obtener indicadores que le
permitan inferir respecto al consumo de energía eléctrica mensual (medido en kilovatios, redondeado
al entero más próximo) de las familias en los departamentos de Arequipa y Tacna. Dicho estudio, sus-
tentado en el análisis de muestras aleatorias tomadas en ambos departamentos, arrojó los siguientes
resultados:
Arequipa
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666
Tacna
217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424
426 429 438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636
Usando la regla de Sturges, calcule intervalos comunes y marcas de clase de una tabla de distribución
de frecuencias que permita comparar los datos.
Solución
Hallar el mínimo de todos los datos (217) y el máximo de todos los datos (666) de ambas ciudades, y
usarlos para calcular el rango. Calcular el número de categorías, el número de datos es el máximo
número de datos (40) entre ambas ciudades. Tener en cuenta que no es la suma de ambos tamaños
muestrales.
𝑅𝑎𝑛𝑔𝑜 = 𝑟 = 666 – 217 = 449
𝑘 = 1 + 3,322 𝑙𝑜𝑔#, (𝑛) = 1 + 3,322 𝑙𝑜𝑔#, (40) = 6,322
El valor de 𝑘 se redondea por redondeo simple; en este caso, 𝑘 = 6.
La amplitud se redondea por exceso a cero decimales, pues los datos tienen cero decimales.
𝑟 449
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑤 = = = 74,83 ≈ 75
𝑘 6
Distribución de clientes según consumo eléctrico

Consumo de energía Marca de clase
[217 ; 292] 254,5
]292 ; 367] 329,5
]367 ; 442] 404,5
]442 ; 517] 479,5
]517 ; 592] 554,5
]592 ; 667] 629,5
Fuente: Empresa A
Ejercicios
47. Se extrajeron dos muestras aleatorias, la primera de 80 pasajeros de clase económica y la segunda
de 60 pasajeros de clase ejecutiva. Indique la clase que tenga valores concentrados en los valores
bajos.
Peso del equipaje de mano en clase económica Peso del equipaje de mano en clase ejecutiva
7,9 8,9 9,8 10,8 11,2 11,8 12,3 13,2 6,0 8,2 8,5 8,9 9,7 10,8
7,9 8,9 10,1 10,8 11,3 11,9 12,4 13,4 6,5 8,2 8,5 8,9 9,8 11,0
8,0 9,0 10,2 10,9 11,4 12,0 12,4 13,5 6,8 8,2 8,5 8,9 9,9 11,2
8,0 9,1 10,2 11,0 11,4 12,0 12,4 13,6 6,8 8,3 8,6 9,0 9,9 11,6
8,1 9,1 10,3 11,0 11,5 12,1 12,5 13,7 6,9 8,3 8,6 9,1 10,0 11,7
8,1 9,3 10,4 11,0 11,5 12,1 12,5 13,9 7,1 8,3 8,7 9,1 10,0 12,2
8,2 9,4 10,6 11,1 11,5 12,1 12,6 14,2 7,1 8,4 8,7 9,3 10,3 12,5
8,5 9,5 10,6 11,1 11,6 12,2 12,7 14,6 7,2 8,4 8,7 9,4 10,5 12,9
8,6 9,7 10,7 11,1 11,7 12,2 12,9 14,6 7,7 8,4 8,8 9,6 10,5 13,0
8,8 9,7 10,8 11,2 11,7 12,3 13,1 14,8 8,0 8,4 8,8 9,7 10,6 13,0
Solución
Interpretación
Determinar la clase que tenga valores concentrados en los valores bajos.
Representación
Vamos a realizar dos distribuciones de frecuencia y un polígono de frecuencias con intervalos comunes.
Cálculo
El valor máximo de todos los datos es 14,8 kilos y el mínimo es 6,0 kilos.
Luego, el rango de todos los datos es:
𝑟 = 𝑚á𝑥𝑖𝑚𝑜 − 𝑚í𝑛𝑖𝑚𝑜 = 14,8 − 6,0 = 8,8 kilos
Siguiendo Sturges, la cantidad de intervalos es igual a:
𝑘 = 1 + 3,322 𝑙𝑜𝑔(𝑚á𝑥𝑖𝑚𝑜 (80,60))
𝑘 = 1 + 3,322 𝑙𝑜𝑔(80) = 7,3
Luego, como 𝑘 es un valor entero, se tiene que:
𝑘 = 7
La amplitud es igual al rango entre la cantidad de intervalos, esto es,
𝑟 8,8
𝑤= = = 1,26
𝑘 7
Como los datos tienen un decimal, la amplitud es:
𝑤 = 1,3
Peso del equipaje de mano en clase económica Peso del equipaje de mano en clase ejecutiva
7,9 8,9 9,8 10,8 11,2 11,8 12,3 13,2 6,0 8,2 8,5 8,9 9,7 10,8
7,9 8,9 10,1 10,8 11,3 11,9 12,4 13,4 6,5 8,2 8,5 8,9 9,8 11,0
8,0 9,0 10,2 10,9 11,4 12,0 12,4 13,5 6,8 8,2 8,5 8,9 9,9 11,2
8,0 9,1 10,2 11,0 11,4 12,0 12,4 13,6 6,8 8,3 8,6 9,0 9,9 11,6
8,1 9,1 10,3 11,0 11,5 12,1 12,5 13,7 6,9 8,3 8,6 9,1 10,0 11,7
8,1 9,3 10,4 11,0 11,5 12,1 12,5 13,9 7,1 8,3 8,7 9,1 10,0 12,2
8,2 9,4 10,6 11,1 11,5 12,1 12,6 14,2 7,1 8,4 8,7 9,3 10,3 12,5
8,5 9,5 10,6 11,1 11,6 12,2 12,7 14,6 7,2 8,4 8,7 9,4 10,5 12,9
8,6 9,7 10,7 11,1 11,7 12,2 12,9 14,6 7,7 8,4 8,8 9,6 10,5 13,0
8,8 9,7 10,8 11,2 11,7 12,3 13,1 14,8 8,0 8,4 8,8 9,7 10,6 13,0
Distribución de pasajeros de clase económica según peso de equipaje

Intervalo Marca de clase Frecuencia absoluta fi Frecuencia relativa hi
[6,0 ; 7,3] 6,65 0 0.0000
]7,3 ; 8,6] 7,95 9 0.1125
]8,6 ; 9,9] 9,25 12 0.1500
]9,9 ; 11,2] 10,55 20 0.2500
]11,2 ; 12,5] 11,85 25 0.3125
]12,5 ; 13,8] 13,15 9 0.1125
]13,8 ; 15,1] 14,45 5 0.0625
Distribución de pasajeros de clase ejecutiva según peso de equipaje

Intervalo Marca de clase Frecuencia absoluta fi Frecuencia relativa hi
[6,0 ; 7,3] 6,65 8 0.1333
]7,3 ; 8,6] 7,95 17 0.2833
]8,6 ; 9,9] 9,25 19 0.3167
]9,9 ; 11,2] 10,55 9 0.1500
]11,2 ; 12,5] 11,85 4 0.0667
]12,5 ; 13,8] 13,15 3 0.0500
]13,8 ; 15,1] 14,45 0 0.0000
La clase que tiene valores concentrados en los valores bajos es ejecutiva.

Medidas de tendencia central
Una medida de localización o de tendencia central se refiere al valor central que representa a los datos
de una determinada variable.
En este curso veremos la media, mediana y moda.
Media
La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de dichos
valores dividida entre el número de valores.
Cálculo de la media aritmética
La fórmula para la media poblacional (parámetro) es:

∑5!6# 𝑥!
𝜇=
𝑁
La fórmula para la media muestral (estadístico) es:
∑7!6# 𝑥!
𝑥̅ =
𝑛
En Excel se usa la función =PROMEDIO(datos).
Características de la media
Se puede calcular para datos medidos en escala de intervalo o razón.

El cálculo de la media es sencillo y es una medida muy conocida.
El valor de la media es sensible a los valores extremos, por lo que varía mucho con valores muy grandes
o muy pequeños con respecto a los demás.
Si cada uno de los 𝑛 valores 𝑥! es transformado en:
𝑦! = 𝑎 𝑥! + 𝑏
siendo 𝑎 y 𝑏 constantes, entonces, la media de los 𝑛 valores 𝑦! es:
𝑦h = 𝑎𝑥̅ + 𝑏
Ejemplo 21
La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más impor-
tante de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federación In-
ternacional de Voleibol (FIVB) y contó con 16 equipos. En la figura se muestra algunas jugadoras de la
selección serbia. Calcule la media de la estatura de estas jugadoras.
Solución
La media muestral es 𝑥̅ = 186,56 cm.
Esto quiere decir que la estatura de las jugadoras de voleibol de Serbia está alrededor de 185,56 cm.
Ejercicios
48. Según los Censos Nacionales del 2017 en el Perú, la media de la edad de los peruanos es 31,51
años. Interprete este valor.
La edad de los mperuanos está alrededor de 31,51 años.
49. En 2018, la media del consumo anual per cápita de carne de pollo en Lima Metropolitana fue de
80,5 kilogramos. Interprete este valor.
El consumo anual per cápita de carne de pollo en Lima Metropolitana estuvo alrededor de 80,5
kilogramos
50. A continuación, se presenta la información de una muestra de empleados de la compañía A.
Empleado Ingreso mensual (soles) Experiencia laboral (años)

1 2020 4,6
2 3410 8,8
3 1967 2,1
4 1630 1,2
5 2502 5,2
6 1677 1,1
7 4286 4,9
8 2952 2,8
Calcule e interprete el valor de la media de cada una de las variables.
Variable Valor Interpretación

El ingreso menual de los trabajadores está
Ingreso mensual, en soles 2555,5 soles
alrededor de 2555,5 soles
La experiencia laboral está alrededor de
Experiencia laboral, en años 3,84 años
3,84 años.
51. Calcule la media de los siguientes grupos de números.
Grupo 1 1 2 3 4 5 6 7
Grupo 2 1 2 3 4 5 6 700
¿Qué nota al calcular la media de cada grupo?
La media se ve afectada por valores extremos.

52. Una empresa ha decidido hacer dos ofertas a su sindicato sobre el aumento de sueldo anual a sus
trabajadores:
• Aumento general del 4%.

• Aumento general del 2,5% más un bono de 80 soles.
Si el sueldo promedio es de 4500 soles, ¿cuál de las dos ofertas debe aceptar el sindicato si lo que
desea es hacer máximo el sueldo medio de los trabajadores?
𝑦! = 𝑎 𝑥! + 𝑏
siendo 𝑎 y 𝑏 constantes, entonces, la media de los 𝑛 valores 𝑦! es:
Oferta 1: Aumento general del 4%
𝑦h = (1 + 0,04) × 4500 + 0 = 4680 soles
Oferta 2: Aumento general del 2,5% más un bono de 80 soles
𝑦h = (1 + 0,025) × 4500 + 80 = 4692,5 soles
La oferta que debe aceptar el sindicato si lo que desea es hacer máximo el sueldo medio de los
trabajadores es la oferta 2 (4692,5 > 46980).
53. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años. Calcule e interprete la media de la estatura de la muestra.
1,67 1,70 1,83 1,65 1,70 1,65 1,60 1,70 1,61 1,69
Rpta: 1,68 m.
54. Se muestra un gráfico del CIES Football Observatory sobre la media de estatura de las 32 seleccio-
nes que participaron en el Mundial de Rusia 2018. Bélgica es el equipo con mayor altura y Perú es
la 31°. Interprete el valor en el caso peruano.
55. En una empresa el sueldo medio es 2500 soles. La gerencia, luego de la negociación con el sindi-
cato, decide realizar un aumento del 3,5% y un bono de 150 soles a cada trabajador. Calcule el
nuevo sueldo medio. Rpta: 2737,5 soles
56. Una tienda rebaja los precios, en 12%, a toda su línea de casacas. Si la media de los precios de las
casacas antes de la rebaja era de 155 soles. Calcule la nueva media de los precios.
Rpta: 136,4 soles
Mediana
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto.
El 50% de las observaciones son menores o iguales a la mediana.
El 50% de las unidades elementales presen- El 50% de las unidades elementales presen-
tan valores en la variable de estudio iguales tan valores en la variable de estudio mayo-
o menores a la mediana. res a la mediana.
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 (𝑀𝑒)
Cálculo de la mediana
1. Primero, ordenamos los datos de manera ascendente.
2. Calculamos la posición 𝑖 de la mediana.
𝑛+1
𝑖 = 50 k l = 0,5(𝑛 + 1) = 𝐸, 𝑑
100
donde:
𝑛 es el tamaño de muestra
𝐸 es la parte entera
0, 𝐷 es la parte decimal
3. Luego, calculamos la mediana.
Si 𝑑 = 0, entonces 𝑚𝑒 = 𝑋[9]
Si 𝑑 ≠ 0, entonces 𝑚𝑒 = 𝑋[9] + 0,5N𝑋[9;#] − 𝑋[9] O
donde:
𝑋[9] es el dato de la posición 𝐸
𝑋[9;#] es el dato de la posición 𝐸 + 1
En Excel se usa la función =MEDIANA(datos).
Características de la mediana
• Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
• El valor de la mediana depende del número de datos observados.
• La mediana es un estadístico que no se ve afectado por valores extremos (mínimo y máximo). Por
eso se le utiliza cuando hay datos inusuales o el polígono de frecuencias no es simétrico.
Ejemplo 22
ternacional de Voleibol (FIVB).
En la figura se muestra algunas jugadoras de la selección de República Dominicana. Calcule e interprete

la mediana de la estatura de estas jugadoras.
Solución
Primero, ordenamos los datos.
Posición 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12° 13° 14° 15°

Estatura 167 171 174 182 183 183 186 186 188 188 190 190 194 196 201
Luego, calculamos la posición de la mediana. La posición 𝑖 es:
𝑖 = 0,5 (𝑛 + 1) = 0,5 × (15 + 1) = 8,0 = 𝐸, 𝑑

Como 𝑑 = 0, entonces la mediana es el valor en la posición 𝑖 = 8, es decir, 𝑚𝑒 = 𝑋[<] = 186 cm.
Se interpreta como:
• El 50% de las jugadoras de voleibol de República Dominicana miden 186 centímetros o menos.
• El 50% de las jugadoras de voleibol de República Dominicana miden hasta 186 centímetros.
• El 50% de las jugadoras de voleibol de República Dominicana miden como máximo 186 centíme-
tros.
Ejercicios
57. Según los Censos Nacionales del 2017 en el Perú, la mediana de la edad de los peruanos es 29
El 50% de los peruanos tiene 29 años o menos.

El 50% de los peruanos tiene hasta 29 años.
El 50% de los peruanos tiene como máximo 29 años.
58. El Ministerio de Trabajo y el INEI ejecutaron la “Encuesta Nacional Especializada de Trabajo Infantil
2015” cuyo objetivo fue caracterizar el trabajo infantil en el Perú. La población tuvo de 5 a 17 años
de edad. La mediana del tiempo que trabajan a la semana fue de 14 horas. Interprete este valor.
El 50% de los niños de 5 a 7 años en el Perú que trabajan labora hasta 14 horas semanales.
59. Se registra los tiempos, en minutos, que se demora una cajera en atender a algunos clientes del
supermercado A.
5,3 2,7 10,7 8,2 3,0 5,4 5,6 10,2 11,3 2,6 2,6 5,4 3,5 7,0 11,5
Calcule e interprete el valor de la mediana. Rpta: 5,4 minutos
El 50% de los clientes del supermercado A en la muestra es atendido en hasta 5,4 minutos.
60. Calcule la mediana de los siguientes grupos de números.
Grupo 1 7 10 11 13 16 17 18
Grupo 2 7 10 11 13 16 17 180
¿Qué concluye al calcular la mediana de cada grupo?
La mediana no se ve afectada por valores extremos.
61. Complete los siguientes textos:
“La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho con-
junto. El ……… son menores o igual a la mediana.”
“Usar la mediana como medida de tendencia central es preferible a usar la media cuando ……..”.
Moda
La moda de un conjunto de datos de una variable es el valor que se presenta con mayor frecuencia.
Cálculo de la moda
En Excel, para calcular la moda de valores numéricos se usa la función =MODA.UNO(datos) que brinda
como resultado una sola moda, incluso si el conjunto de números tiene más de una moda y la función
=MODA.VARIOS(datos) que brinda como resultado una o más modas, según corresponda al conjunto
de números.
En Excel, para calcular la moda se puede usar tablas dinámicas.
Características de la moda
• La moda se puede calcular para cualquier escala de medición.
• El valor de la moda no se ve afectada por valores extremos.
• La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más
modas (multimodal). Algunas series de datos no tienen moda.
Ejemplo 23
ternacional de Voleibol (FIVB) y contó con 16 equipos. En la figura se muestra algunas jugadoras de la
selección de China. Calcule e interprete la moda de la estatura de estas jugadoras.
Solución
La moda es 187 cm. La estatura más frecuente entre las jugadoras de la selección de vóley de China
es 187 cm.
Ejercicios
62. Según los Censos Nacionales del 2017 en el Perú, la moda de la edad de los peruanos es 8 años.
Interprete este valor. En el momento del censo había 547 909 peruanos de 8 años.
La edad más frecuente es ocho años.
63. En el año 2016 se realizó el Primer Censo Nacional Penitenciario del Perú. Según este censo, de la
población penitenciaria que consumió alguna sustancia antes de cometer el delito, el 79,1% con-
sumió alcohol, marihuana 10,6% y pasta básica de cocaína 9,5%. Interprete el valor de la moda.
El valor de la moda es alcohol, pues su porcentaje es el mayor (79,1%).
La sustancia más frecuentemente consumida antes de cometer un delito es alcohol.
64. Calcule e interprete la moda de los siguientes datos, que corresponden al número de errores or-
tográficos por correo electrónico que cometen algunos gerentes de una empresa en una comuni-
cación escrita.
2 2 5 2 3 3 2 3 2 1 2 0 0 1 3 0 3 2 1 2
4 2 1 3 1 1 3 3 3 1 2 4 2 0 1 4 2 2 2 2
El número de errores ortográficos por correo electrónico que cometen algunos gerentes de una
empresa en una comunicación escrita más frecuente es 2.
65. Calcule la moda de los siguientes grupos de números.
Grupo 1 1 2 2 3 4 4 5
Grupo 2 1 2 2 3 4 4 500
¿Qué concluye al calcular la moda?

Media ponderada
La media ponderada permite calcular el valor medio considerando la importancia o peso de cada valor
sobre el total.
Cálculo de la media ponderada
La fórmula es:
∑7!6# 𝑥! 𝑤!
𝑥̅= =
∑7!6# 𝑤!
donde:
𝑥! : Observación individual
𝑤! : Peso asignado a cada observación
Ejercicios
66. Las notas de un alumno de Estadística Descriptiva son:
Evaluación Nota
Participación 1 20
Participación 2 17
Participación 3 10
Participación 4 15
Control 1 (5%) 15
Informe del trabajo de aplicación grupal (8%) 14
Sustentación del trabajo de aplicación (25%) 16
Participación 5 20
Participación 6 20
Participación 7 15
Participación 8 12
Evaluación de cierre de la Unidad II (20%) 12
Control 2 (8%) 13
Examen final (30%) 12
Si aprobó el curso con más de 14, el siguiente ciclo se matriculará en siete cursos. Indique lo que
hará el alumno.
2 × 17,33 + 5 × 15 + 8 × 14 + 25 × 16
𝐷𝐷1 = = 15,54
40
2 × 18,33 + 20 × 12 + 8 × 13
𝐷𝐷2 = = 12,68
30
40 × 15,54 + 30 × 12,68 + 30 × 12
𝑁𝑜𝑡𝑎 = = 13,62
100
Por lo tanto, el siguiente ciclo no se matriculará en siete cursos (13,62 < 14).
Medidas de variabilidad
Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero
no indican qué tan cercanos o lejanos están los datos de dicho valor central.
Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los
representa y, por lo tanto, permiten evaluar la confiabilidad de ese valor central.
Si la medida de dispersión:
• tiene un valor pequeño, los datos están concentrados alrededor de la medida de tendencia central,
• tiene un valor grande, los datos no están concentrados alrededor de la medida de tendencia cen-
tral.
Las medidas de variabilidad que estudiaremos son:

• Varianza
• Desviación estándar
• Coeficiente de variación
• Rango
• Rango intercuartil
Varianza
La varianza es el promedio de los cuadrados de la diferencia de cada dato con la media.
Las unidades de la varianza son las unidades de los datos al cuadrado.
Cálculo de la varianza
La fórmula para la varianza poblacional (parámetro) es:
∑5
!6#(𝑥! − 𝜇)
$
𝜎$ =
𝑁
En Excel se usa la función =VAR.P(datos).
La fórmula para la varianza muestral (estadístico) es:
∑7!6#(𝑥! − 𝑥̅ )$
𝑠$ =
𝑛−1
En Excel se usa la función =VAR.S(datos).

Desviación estándar
La desviación estándar es la raíz cuadrada positiva de la varianza.
La desviación estándar poblacional se denota por s. En Excel se usa la función =DESVEST.P(datos).
La desviación estándar muestral se denota por s. En Excel se usa la función =DESVEST.M(datos).
Características de la varianza y la desviación estándar
• La varianza y la desviación estándar se ven afectadas por valores extremos.

• La varianza y la desviación estándar son números reales no negativos.
• Se pueden calcular para variables medidas en escala de intervalo o razón.
• La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que, la
desviación estándar es expresada en las mismas unidades de los datos.
• Si cada uno de los 𝑛 valores 𝑥! es transformado en:
𝑦! = 𝑎 𝑥! + 𝑏
siendo 𝑎 y 𝑏 constantes, entonces, se tiene que:
o la relación entre las varianzas de los datos 𝑦! y 𝑥! es:
𝑆>$ = 𝑎$ 𝑆?$
o la relación entre las desviaciones estándar de los datos 𝑦! y 𝑥! es:
𝑆> = 𝑎𝑆?
Ejercicios
67. Calcule la desviación estándar de los siguientes grupos de números.
Grupo 1 1 2 3 4 5 6 7
Grupo 2 1 2 3 4 5 6 800
¿Qué concluye al calcular dicha medida de dispersión?

La desviación estándar se ve muy influida por valores extremos.
68. En una empresa se hace dos ofertas a su sindicato sobre el aumento de sueldo a sus trabajadores:
• Oferta 1: Aumento general del 4%.
• Oferta 2: Aumento del 2,5% más un bono de 80 soles.
Si el sindicato desea elegir la opción con la menor desviación estándar, indique la oferta que elegirá
si la antigua desviación estándar de los sueldos era de 650 soles.
Interpretación
Determinar la oferta que debe elegir el sindicato.
Representación
Usaremos la propiedad de transformación lineal de datos.
Cálculo
𝑦! = 𝑎 𝑥! + 𝑏
siendo 𝑎 y 𝑏 constantes, entonces, se tiene que la relación entre las desviaciones estándar de los
datos 𝑦! y 𝑥! es:
𝑆> = 𝑎𝑆?
Oferta 1: Aumento general del 4%
𝑆> = (1 + 0,04) × 650 = 676 soles
Oferta 2: Aumento del 2,5% más un bono de 80 soles
𝑆> = (1 + 0,025) × 650 = 666,25 soles
La oferta que debe elegir el sindicato la oferta 2 (666,25 < 676).
69. En la ciudad 1 y 2 se extrae una muestra de siete personas y se registra los sueldos mensuales de
cada persona. Los datos se muestran en el cuadro siguiente.
Ciudad 1 1 2 3 4 5 6 7
Ciudad 2 1001 1002 1003 1004 1005 1006 1007
Calcule la desviación estándar de los sueldos mensuales. ¿Los ingresos de las dos ciudades tienen
la misma variabilidad?
Los dos grupos tienen la misma desviación estándar (2,1602). No, no tienen la misma variabilidad,
hay más variabilidad en los ingresos de la ciudad 1.
𝑠 2,1602
𝐶𝑉# = × 100% = × 100% = 54,01%
𝑥̅ 4
𝑠 2,1602
𝐶𝑉$ = × 100% = × 100% = 0,215%
𝑥̅ 1004
Hay más variabilidad en los ingresos de la ciudad 1 pues su coeficiente de variación es el mayor
(54,01% > 0,215%).
70. En una tienda, la desviación estándar de los precios de los jeans es de 20 soles, calcule la nueva
desviación estándar de los precios de los jeans si se realiza:
a. una rebaja del 6% de todos los precios. Rpta: 18,8 soles

b. una oferta y se rebaja ocho soles a cada precio. Rpta: 20,0 soles
71. Los siguientes datos corresponden a consumos, en soles, de alumnos en la cafetería de una uni-
versidad. Calcule la desviación estándar y la varianza. Rpta: 2,945 y 8,68
3,0 7,5 5,5 12,0 6,5 2,7 2,0 4,5 8,0 4,0 2,5 3,0 1,5 7,0
Coeficiente de variación
El coeficiente de variación (𝐶𝑉) de un conjunto de datos indica el porcentaje que es la desviación es-
tándar en comparación con la media.
Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones es-
tándar no es muy útil, por ejemplo, cuando las medias están muy distantes.
Es una medida de variabilidad relativa. No tiene unidades, está expresada en porcentaje.
Cálculo del coeficiente de variación
La fórmula para el coeficiente de variación poblacional (parámetro) es:
𝜎
𝐶𝑉 = × 100%
𝜇
La fórmula para el coeficiente de variación muestral (estadístico) es:

𝑠
𝐶𝑉 = × 100%
𝑥̅
Características del coeficiente de variación
El coeficiente de variación se calcula solamente en variables medidas en escala de razón y solo para
valores positivos.
Ejemplo 24
Los siguientes datos representan resúmenes del número de mediciones de resistencia a la tracción de
cierto artículo que realizaron dos grupos de técnicos.
Grupo 1
media = 3 y desviación estándar = 1,10
Grupo 2
media = 5 y desviación estándar = 1,66
En el grupo con las mediciones que presenten mayor dispersión, se revisará exhaustivamente el pro-
ceso de producción.
Solución
Interpretación
Determinar en qué grupo se revisará exhaustivamente el proceso de producción.
Representación
Como los promedios son diferentes, se usa como indicador de dispersión al coeficiente de variación.
Cálculo
Como nos piden que indiquemos el grupo que presente la mayor dispersión, calcularemos el coefi-
ciente de variación, mediante la fórmula:
𝑠
𝐶𝑉 = × 100%
𝑥̅
Reemplazando los valores en cada grupo, tendremos:
1,10
𝐶𝑉# = × 100% = 36,67%
3
1,66
𝐶𝑉$ = × 100% = 33,20%
5
Las mediciones son más dispersas en el grupo 1, pues su coeficiente de variación es mayor. Como el
coeficiente de variación es mayor en el grupo 1, entonces, se revisará exhaustivamente el proceso de
producción del grupo 1.
Ejercicios
72. Observe las dos imágenes siguientes.
Foto tomada de http://gastronomiaycia.republica.com/
Complete los siguientes textos, con respecto a la variabilidad de los tamaños de las manzanas en
ambos grupos.
a. En el grupo de la izquierda hay mayor homogeneidad en el peso de las manzanas.

b. En el grupo de la izquierda hay menor heterogeneidad/dispersión/variabilidad en el peso de
las manzanas.
c. En el grupo de la derecha hay mayor heterogeneidad/dispersión/variabilidad en el peso de las
manzanas.
d. En el grupo de la derecha hay menor homogeneidad en el peso de las manzanas.
e. Seguramente en el grupo de manzanas a la derecha, el coeficiente de variación del peso de las
manzanas es mayor al coeficiente de variación del grupo a la izquierda.
73. Según los Censos 2017: XII de Población, VII de Vivienda y III de Comunidades Indígenas se tiene
los siguientes resultados para la cantidad de personas en un hogar.
Medida de resumen Lima Loreto

Media 3,56 personas 4,24 personas
Mediana 3,00 personas 4,00 personas
Moda 3,00 personas 4,00 personas
Desviación estándar 2,00 personas 2,29 personas
¿En cuál de las dos ciudades se presenta mayor variabilidad en la cantidad de personas en un hogar
en el Perú?
Medida de resumen Lima Loreto

Coeficiente de 2,00 2,29
𝐶𝑉@! = × 100% = 56,2% 𝐶𝑉@A = × 100% = 54%
variación 3,56 4,24
La ciudad que presenta mayor variabilidad en la cantidad de personas en un hogar en el Perú es

Lima, pues el coeficiente de variación es el mayor (54,0% < 56,2%).
Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre el
dato mayor y el dato menor.
Cálculo del rango
𝑅𝑎𝑛𝑔𝑜 = 𝑟 = 𝑋BáD!BA − 𝑋Bí7!BA
Mínimo valor Máximo valor
Rango = Xmáx - Xmín
donde 𝑋BáD!BA y 𝑋Bí7!BA son los valores máximo y mínimo observados de la variable.
Características del rango

- Se puede calcular en variables medidas en escala de intervalo o razón.
- Se ve muy afectado por valores extremos.
Medidas de asimetría
Coeficiente de asimetría de Pearson
Mide si los datos aparecen ubicados simétricamente o no respecto de la media.
El coeficiente de asimetría se calcula con la siguiente fórmula:
𝑥̅ − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝐴𝑠 = 3 k l
𝑠
Si el coeficiente de asimetría 𝐴𝑠 es:
positivo, indica sesgo a la igual a cero, la distribución negativo, indica sesgo a la

derecha (cola derecha). es simétrica alrededor de la izquierda (cola izquierda).
La media es mayor a la media. La media es menor a la
mediana. La media es igual a la mediana.
Hay concentración mediana. Hay concentración
en valores bajos. en valores altos.
Ejercicios
74. El coeficiente de asimetría de los sueldos de los trabajadores en un país como el Perú seguramente
será positivo pues hay muchos sueldos bajos.
75. En un examen difícil de Estadística, el coeficiente de asimetría de los tiempos que toman los alum-
nos en resolverlo seguramente será negativo pues los alumnos van a tomar mucho tiempo para
resolverlo.
76. Seguramente, la edad de los peruanos tiene coeficiente de asimetría positivo.
Perú: Distribución porcentual de peruanos según edad por sexo. 2007 Y 2017
Fuente: Instituto Nacional de Estadística e Informática - Censos Nacionales de Población y Vivienda.
77. Seguramente, la edad de los japoneses tiene coeficiente de asimetría cercana a cero, negativa.
Japón: Distribución porcentual de japoneses según edad por sexo. 2020

78. Calcule el coeficiente de asimetría del precio del balón de gas de 10 kilos para el distrito de San
Luis según la página web https://www.facilito.gob.pe/facilito/actions/PreciosGLPAction.do del día
24 de marzo del 2022. Interprete dicho valor.
Distrito Marca Establecimiento Precio (soles)

Breña El Nazareno Erick David Tejada Méndez 54.00
Breña Rinde Gas Luvi Gas Breña 54.00
Breña Masgas Meza Huacachi Atilio 55.00
Breña Progas Díaz Mendoza Ronald Enrique 55.00
Breña Sursa El Verdecito Rendidor 55.00
Breña Zafiro Gas Distribuidora Avelo SAC 56.00
Breña Caligas Castillejo Morales Lucas Santiago 56.00
Breña Caserito De Lima Gas Distribuidora Avelo Sac 56.00
Breña Petro América Carlos Salvatierra Quispe 56.00
Breña Petro América Salvatierra Arbieto Denisse 56.00
Breña Caserito De Lima Gas Consorcio Cosme SAC 58.00
Breña Caserito De Lima Gas Vallegas 58.00
Breña Caserito De Lima Gas Distribuidora AJP E.I.R.L. 58.00
Breña Flama Gas Corp. Irma Elizabeth Luis Díaz 59.00
Breña Zafiro Gas Vallegas 59.00
Breña Caserito De Lima Gas Barreragas 59.50
Breña Zafiro Gas Distribuidora AJP E.I.R.L. 60.00
Breña Masgas Solgas S.A. 60.50
Breña Lima Gas Distribuidora Avelo SAC 61.00
Breña Pecsagas Castillejo Morales Lucas Santiago 61.50
Breña Zafiro Gas Barreragas 61.50
Breña Lima Gas Vallegas 62.00
Breña Solgas Meza Huacachi Atilio 62.00
Breña Lima Gas Consorcio Cosme SAC 62.00
Breña Lima Gas Barreragas 62.50
Breña Solgas Solgas S.A. 63.00
Breña Lima Gas Distribuidora AJP E.I.R.L. 63.70
Media 58.674 =PROMEDIO(A2:A28)

Mediana 59.000 =MEDIANA(A2:A28)
Desv. Estándar 3.041 =DESVEST.M(A2:A28)
As -0.322 =3*(D1-D2)/D3
Observamos que el coeficiente de asimetría es negativo (-0,322), por lo tanto, hay una concentra-
ción en valores altos.
79. El salario, en cientos de soles, de los trabajadores una empresa se presenta a continuación:
13 12 13 14 15 15 15 18 23 24 24 25 25 36 42 48 60
Calcule el coeficiente de asimetría de Pearson.

Medidas de posición
Cuantiles
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos
que comprenden el mismo número de valores. Los cuantiles más importantes son los denominados
cuartiles, deciles y percentiles.
67% 33%
Menores notas 𝑃FG Mejores notas
50% 50%
Menores notas 𝑀𝑒 = 𝑃H, = 𝑄$ = 𝐷H Mejores notas
90% 10%
Menores notas 𝑃I, = 𝐷I Mejores notas
25% 75%
Menores notas 𝑃$H = 𝑄# Mejores notas
Percentiles
Dividen el conjunto de datos en 100 partes porcentualmente iguales.
El 𝑘% de las unidades elementales presen- El (100 – 𝑘)% de las unidades elementales

tan valores en la variable de estudio iguales presentan valores en la variable de estudio
o menores al percentil 𝑘, 𝑃! . mayores al percentil 𝑘, 𝑃!
𝑃%
Cuartiles
• Dividen el conjunto de datos en cuatro partes porcentualmente iguales.
• Se les denota como cuartil 1 𝑄# , cuartil 2 𝑄$ y cuartil 3 𝑄) .
• Su equivalente en percentiles es 𝑃$H , 𝑃H, y 𝑃GH , respectivamente.
Deciles
• Dividen el conjunto de datos en diez partes porcentualmente iguales.
• Se les denota como decil 1 𝐷# , decil 2 𝐷$ , decil 3 𝐷) , …, decil 9 𝐷I .
• Su equivalente en percentiles es 𝑃#, , 𝑃$, , 𝑃), , … , 𝑃I, , respectivamente.
Ejemplo
Si queremos determinar el puntaje mínimo para estar en el quinto superior, debemos calcular el per-
centil 80.
El 80% de los El 20% de los

estudiantes tienen un estudiantes tienen
puntaje menor o igual un puntaje mayor al
al percentil 80. percentil 80.
Cálculo de un percentil
1. Primero, ordenamos los datos de manera ascendente.
2. Calculamos la posición 𝑖 del percentil 𝑘.
𝑛+1
𝑖=k l 𝑘 = 𝐸, 𝑑
100
donde:
𝑛 es el tamaño de muestra
𝐸 es la parte entera
0, 𝑑 es la parte decimal
3. Luego, calculamos el percentil 𝑘.
Si 𝑑 = 0, entonces 𝑃% = 𝑋[9]
Si 𝑑 ≠ 0, entonces 𝑃% = 𝑋[9] + 0, 𝑑N𝑋[9;#] − 𝑋[9] O
donde:
𝑋[9] es el dato de la posición 𝐸
𝑋[9;#] es el dato de la posición 𝐸 + 1
En Excel se usa la función =PERCENTIL.EXC(datos;k) donde k se escribe en forma decimal. Por ejemplo,
si se quiere calcular el percentil 25, se usa la función =PERCENTIL.EXC(datos;0.25).
Características de los percentiles

Se puede calcular en variables medidas en escala ordinal, de intervalo y razón.
El valor del percentil no se ve afectado por valores extremos.
Ejemplo 25
En la figura se muestran los datos de algunos jugadores de la selección peruana y su edad en agosto
del 2020. Calcule e interprete el percentil 75 de la edad de estos jugadores.
30 años 28 años 26 años 24 años 31 años 25 años
36 años 35 años 30 años 25 años 29 años
Solución
Primero, ordenamos los datos.
Posición 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12°

Edad 21 24 25 25 25 26 26 27 27 28 28 28
Posición 13° 14° 15° 16° 17° 18° 19° 20° 21° 22° 23°
Edad 28 29 30 30 30 30 30 31 31 35 36
Calculamos la posición 𝑖 del percentil 75.
𝑛+1
𝑖=k l 𝑘 = 𝐸, 𝑑
100
23 + 1
𝑖=k l 75 = 18,0
100
Como 𝑑 = 0, entonces 𝑃GH = 𝑋[#<] = 30 años.
Esto quiere decir que, en agosto del 2020, el 75% de los jugadores de la selección peruana de fútbol
tenía 30 años o menos.
Ejercicios
80. Según los Censos Nacionales del 2017 en el Perú, el percentil 20 de la edad de los peruanos es 11
El 20% de los peruanos tiene 11 años o menos.

El 20% de los peruanos tiene hasta 11 años.
El 20% de los peruanos tiene como máximo 11 años.
Error común
El 20% de los peruanos tiene 11 años.
81. Según los Censos Nacionales del 2017 en el Perú, el percentil 49 del número de habitaciones que
tiene una vivienda es 2. Interprete este valor. ¿Podría este percentil ayudar a entender la gran
cantidad de casos de COVID 19 en el Perú?
Tomado del Manual del Empadronador/a Censos Nacional 2017 INEI.
82. Rosa María Augusta Palacios McBride es una abogada y periodista peruana. Actualmente conduce
el programa Sin Guion trasmitido por YouTube en el canal RTV-La República, programa sobre polí-
tica peruana. Se desea calcular algunas medidas de posición sobre el número de visualizaciones de
sus videos en marzo del 2022.
Día de es- Número de vi-

Título
treno sualizaciones
¿Vacancia el lunes? y Caso Pativilca 25 de marzo 88361
Caso Fujimori: “No se pedía la resurrección del indulto 24 de marzo 72490
El 31 de marzo se vencen 2 millones de dosis 23 de marzo 59058
Siguen los líos en Petroperú y Sagasti pide firmas 22 de marzo 70608
Petroperú en crisis 21 de marzo 74155
Alberto Fujimori indultado 18 de marzo 128493
La salud pública no puede estar en manos de un charlatán 17 de marzo 63944
El plan era dar el anuncio del adelanto de elecciones 16 de marzo 104115
Moción de vacancia admitida y Fiscalía despliega estrategia 15 de marzo 104865
Sobre Castillo: No debemos aceptar sorpresas de un jefe de Estado 14 de marzo 90269
En el Congreso no pasó nada y nada va a pasar 11 de marzo 73472
Sobre moción de vacancia contra Castillo: “Es bastante desordenada” 10 de marzo 88743
Castillo no se va, aunque Karelim López cacaree todo lo que sabe 9 de marzo 83170
Le van a dar la investidura porque este Congreso no quiere irse 8 de marzo 92315
Día de es- Número de vi-
Título
treno sualizaciones
Si no eres chotano, no eres nada. Es el clon del Juan Silva 7 de marzo 117963
a. Calcule e interprete el valor del percentil 80.
𝑃<, = 104 715 visualizaciones
En Excel se usa =PERCENTIL.EXC(A2:A16;0.8)
El 80% de los programas Sin Guion en la muestra tuvieron hasta 104715 visualizaciones.
b. ¿Cuál debe ser el mínimo valor del número de visualizaciones para pertenecer al 15% de sus videos
más vistos?
85% 15%
Menos vistos 𝑃<H Más vistos
Nos piden calcular el percentil 85.
𝑃<H = 112723,8 visualizaciones
El mínimo valor del número de visualizaciones para pertenecer al 15% de sus videos más vistos es
112,723,8.
c. ¿Cuál debe ser el máximo valor del número de visualizaciones para pertenecer al 30% de sus videos
menos vistos?
30% 70%
Menos vistos 𝑃), Más vistos
𝑃), = 73 275,6 visualizaciones
El máximo valor del número de visualizaciones para pertenecer al 30% de sus videos menos vistos
es 73 275,6.
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Cálculo del rango intercuartil
𝑅𝑎𝑛𝑔𝑜 𝑖𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = 𝑅𝐼𝐶 = 𝑄) – 𝑄# = 𝑃GH – 𝑃$H
25% 50% 25%
P25 RIC = P - P P75

75 25
Características del rango intercuartil

• Se puede calcular en variables medidas en escala de intervalo o razón.
• No se ve afectado por valores extremos.
Diagrama de cajas
El diagrama de cajas o box plot es una gráfica que describe la distribución de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango
intercuartil como medida de referencia de dispersión.
Valor atípico
Es un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera valor atípico
a cualquier punto mayor al límite superior (a la derecha) o menor al límite inferior (o a la izquierda); es
decir, que se encuentre fuera de los límites.
Un valor atípico aparece cuando:

• Hay un elemento extraño en la muestra.
• Hay un error de ingreso en los datos.
Edad de un perro, en años 1 1 3 30 6 8 12
• El registro es correcto pero es un caso poco común.

Pasos para trazar un diagrama de cajas
1. Dibuje el eje vertical, eje horizontal, título, rótulos de los ejes y fuente. La variable 1 (cuantitativa)
se representa en el eje vertical y la variable 2 en el eje horizontal.
Distribución de unidades elementales según variable 1 por variable 2

Variable 1 (Cuantitativa)
Unidad de medición
Categoría 1 Categoría 2 Categoría 3
Fuente: Variable 2
2. Trace un rectángulo con los extremos del percentil 25 y percentil 75, en cada categoría. En la caja
trace una recta horizontal en el lugar del percentil 50.
𝑃&%
𝑃%'
Unidad de medición
𝑃"%

Fuente: Variable 2
3. Ubique los límites inferior y superior mediante el rango intercuartil, el límite superior está a
1,5 𝑅𝐼𝐶 arriba del P75, mientras que, el límite inferior está a 1,5 𝑅𝐼𝐶 debajo del P25.
o Trace los bigotes desde los extremos de las cajas hasta los valores mínimo y máximo dentro de
los límites inferior y superior.
o Marque con asteriscos (*) las localizaciones de los valores atípicos.
*
𝑃&%
𝑃%'
Unidad de medición
𝑃"%
*
Fuente: Variable 2
En el diagrama de cajas, también se puede poner las categorías en el eje vertical, con lo que
las cajas y los bigotes estarán de forma horizontal.
Distribución de unidades elementales según variable 1

por variable 2
Categoría 1
*
Variable 2
Categoría 2
Categoría 3
𝑃"% 𝑃%' 𝑃&%
Diagrama de cajas en Excel

Para construir un diagrama de cajas usando Excel:
• Seleccione las columnas con los datos, incluidos los rótulos.
• Haga clic en la pestaña Insertar y, a continuación, haga clic en (el icono de gráfico estadístico )
• Seleccione Cajas y bigotes .

Casos en la construcción del diagrama de cajas
En la construcción del diagrama de cajas se pueden presentar dos casos, cuando el valor mínimo o
máximo son valores atípicos.
Caso 1: Cuando el valor mínimo es un valor atípico

Si el valor mínimo es un valor atípico, entonces el bigote debe llegar hasta el dato siguiente al valor
mínimo, considerando a este valor como nuevo valor mínimo.
Por ejemplo, si el límite inferior 𝐿! = 1,7; el percentil 25 𝑃$H = 3,5 y los datos son:
1,5 1,8 2,2 3,4 4,2 … … … 5,8 6,7
Entonces:
3,5 Percentil 25 𝑃"#

Bigote inferior
Valor mínimo dentro de los límites 1,8

Límite inferior 𝐿! = 1,7
1,5
Valor atípico *
Caso 2: Cuando el valor máximo es un valor atípico

Si el valor máximo es un valor atípico, entonces el bigote debe llegar hasta el dato anterior al valor
máximo, considerando a este valor como nuevo valor máximo.
Por ejemplo, si el límite superior 𝐿* = 6,2, ; el percentil 75 𝑃GH = 3,8 y los datos son:
1,5 1,8 2,2 3,4 4,2 … … … 5,8 6,7
Entonces:
*
Valor atípico 6,7
Límite superior 𝐿$ = 6,2
Valor máximo dentro de los límites 5,8
Bigote superior
3,8 Percentil 75 𝑃%#
Interpretación de un diagrama de cajas
El diagrama de cajas permite:
• Comparar los cuartiles de dos o más conjuntos de datos.

• Comparar el rango de dos o más conjuntos de datos.
• Comparar el rango intercuartil de dos o más conjuntos de datos.
• Observar el tipo de distribución de los datos.
• Observar el tipo de distribución de los datos en el 50% central.
• Identificar la presencia de valores atípicos.
• Identificar los valores mínimos y máximos.
Distribución de elementos según variable cuantitativa por variable cualitativa
Valor atípico *
P75 *
P50
Variable cuantitativa
Máximo
P25
Rango Asimetría
RIC
Asimetría en el
50% central
* Valor atípico
Mínimo
Categoría A Categoría B Categoría C

Variable cualitativa
Fuente: ...
Ejemplo 26
Los registros policíacos del distrito A muestran los números de informes de delitos diarios para una
muestra de días durante los meses de invierno y una muestra de días durante los meses de verano.
Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28
Construya un gráfico que permita comparar, entre invierno y verano, los valores medianos, la variabi-
lidad y encontrar los valores atípicos del número de delitos diarios. Se destinará más efectivos policia-
les en la estación (invierno o verano) que presente mayor cantidad de delitos.
Solución
Interpretación
Se debe hacer un gráfico que permita comparar la cantidad de delitos diarios.
Representación
Se hará un diagrama de cajas del número de delitos diarios por estación.
Cálculo
Calculemos los percentiles y los rangos intercuartiles. Se debe calcular los percentiles con datos sim-
ples. No calcule la distribución de frecuencias.
Estadísticos Invierno Verano

Percentil 25 7,25 9,0
Percentil 50 16,0 20,0
Percentil 75 20,75 26,75
Rango intercuartil 20,75 – 7,25 = 13,5 26,75 – 9,0 = 17,75
Largo máximo del bigote = 1,5 RIC 1,5 x 13,5 = 20,25 1,5 x 17,75 = 26,625
Límite inferior = P25 – 1,5 RIC 7,25 – 20,25 = -13 9,0 – 26,625 = -17,625
Límite superior = P75 + 1,5 RIC 20,75 + 20,25 = 41 26,75 + 26,625 = 53,375
En el invierno, los bigotes llegan como mínimo a 5 y como máximo a 22 y en el verano, llegan como
mínimo a 5 y como máximo a 28.
Distribución de delitos según estación del año
Fuente: Comisaría del distrito A
La mediana es mayor en verano, el 𝑅𝐼𝐶 es más grande en invierno, no hay valores atípicos, pues ningún
dato está fuera de los límites.
De acuerdo al gráfico se debe destinar más efectivos policiales en verano.

Ejercicios
Se quiere comparar los tiempos para realizar una cierta tarea, con y sin capacitación. ¿Se podría afirmar
que la capacitación reduce el tiempo de realizar la tarea?
Tiempo, en minutos, para realizar una tarea, sin o con capacitación

Sin 10 13 20 22 25 26 27 30 34 35 35 40 41 42 43 46 47 54 80 86
Con 5 11 12 13 15 24 24 24 25 26 30 31 31 33 34 35 39 45 80
Solución
Interpretación
Representación
Cálculo
Estadísticos Sin capacitación Con capacitación

Percentil 25 15
Percentil 50 26
Percentil 75 34
Rango intercuartil 19
Largo máximo del bigote = 1,5 RIC 28,5
Límite inferior = P25 – 1,5 RIC -13,5
Límite superior = P75 + 1,5 RIC 62,5
Mínimo 5
Máximo 80
Distribución de trabajadores según tiempo por condición de capacitación

90
80
Tiempo en realizar la tarea
70
60
50
40
30
20
10
0
Sin capacitación Con capacitación
Condición de capacitación
Fuente: Empresa A
83. El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en la si-
guiente tabla.
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60
Calcule el rango y el rango intercuartil de los datos. Rpta: Rango = 54, RIC = 6
84. De datos sacados de la Intranet de la Universidad A, se desea comparar el resultado de la primera

práctica de tres horarios de un curso de Estadística, para lo cual, se tienen los siguientes resultados.
H1 10 11 11 12 12 12 12 13 13 13 14 15 15 16 16 17 18 18 19 19 19 20
H2 4 11 11 11 12 12 13 13 14 14 15 15 16 16 15 16 16 17 17 18
H3 9 9 10 10 10 11 12 12 12 12 13 13 13 13 14 14 15 15 15 17
Construya un diagrama de cajas que permita comparar el resultado de los horarios.
Indique el horario con mayor mediana de notas, el horario con mayor rango intercuartil y el ho-
rario donde existen valores atípicos.
El horario con mayor mediana de notas es el horario 1 y 2 (14,5 puntos).
El horario con mayor rango intercuartil es el horario 1 (RIC = P75 – P25 = 18 - 12 = 6 puntos)
RIC
El horario donde existen valores atípicos es el horario 2 (El valor atípico es 4 puntos).
85. Complete el siguiente texto:
“Los datos atípicos se define como …”

“Se trazan los bigotes desde los ... de las cajas hasta los valores mínimo y máximo … de los límites
inferior y superior”.
Ejercicios adicionales
86. Complete el siguiente cuadro con la mejor respuesta posible de acuerdo con la frase mencionada.
Frase Se debe calcular o realizar:
“Calcule el valor más frecuente de los datos”
“Determine el grupo que tenga mayor variabilidad

en el 50% de los valores centrales”
“Encuentre el grupo que tenga valores concentra-

dos en los valores más pequeños”
“Determine el grupo que tenga mayor variabilidad

de los datos”
“Haga un gráfico que muestre la distribución por-

centual según la variable 1 por la variable 2”
“Calcule el valor mínimo para estar en el cuarto su-

perior de los datos”
“Calcule la mejor medida de tendencia central (me-

dia o mediana) cuando hay mucha asimetría”
“Realice un gráfico que permita visualizar los valo-

res atípicos”
“Calcule el valor para el cual los valores están alre-

dedor”
“Calcular el valor que está en el centro de los da-

tos”
“Haga un gráfico que muestre que pocos factores

son vitales y muchos son triviales”
“Calcule el valor máximo para estar en el quinto in-

ferior de los datos”
“Calcule un estadístico que se pueda calcular en to-

das las escalas de medición”
“Haga un gráfico que muestre las frecuencias acu-

muladas”
“Si la medida de variabilidad es igual a 15%, nos re-

ferimos a…”
87. Marque con una equis las medidas de resumen que se pueden calcular con una variable medida
en cada escala de medición.
Medida de resumen Nominal Ordinal Intervalo Razón

Media
Mediana
Moda
Percentil
Varianza
Desviación estándar
Rango
Rango intercuartil
Coeficiente de asimetría
88. Indique si son verdaderas o falsas las siguientes afirmaciones.
a. La mediana se puede calcular solo en variables cuantitativas.

b. La media es un valor que siempre está entre el mínimo valor y el máximo valor de los datos.
c. La media se puede calcular solo en variables medidas en escala de razón.
d. El percentil 90 es siempre mayor al percentil 10.
e. El cuartil 2 es igual al decil 5.
f. El percentil siempre se expresa en porcentaje.
g. Si todos los pesos son iguales, la media ponderada es igual a la media aritmética.
h. La media ponderada no tiene unidades.
i. El coeficiente de asimetría tiene unidades las mismas unidades que los datos.
j. Si a cada valor de un grupo de datos se le aumenta en 10%, el coeficiente de asimetría no va-
ría.
k. Si a cada valor de un grupo de datos se le aumenta 10 unidades, el coeficiente de asimetría
no varía.
l. En un diagrama de cajas siempre se puede conocer el máximo y mínimo de un grupo de da-
tos.
m. El coeficiente de variación se puede calcular en escalas de intervalo y de razón.
n. Si las unidades de los datos son minutos, la varianza se expresa en minutos al cuadrado.
o. El rango intercuartil se ve muy afectado por valores muy grandes o muy pequeños.
p. El coeficiente de variación tiene las mismas unidades que la varianza.
Rpta: F, V, F, F, V, F, V, F, F, V, V, V, F, V, F, F
Unidad 2. Teoría de la probabilidad
Logro de la unidad 2
Al finalizar la Unidad 2, el estudiante analiza situaciones reales de incertidumbre aplicando los con-
ceptos de probabilidades valorando su utilidad en la toma de decisiones.
Temario
• Reglas de conteo y combinaciones
• Probabilidad: concepto, experimento aleatorio, espacio muestral y evento
• Operaciones con eventos
• Probabilidad condicional
• Probabilidad total
• Teorema de Bayes
• Diagrama del árbol
• Eventos independientes
Experimentos, reglas de conteo y asignación de probabilidades

La probabilidad mide o cuantifica la posibilidad de ocurrencia de un evento.
Ejemplo 27
Ejemplo 28
El silencio sísmico de más de 270 años que se registra en Lima indica que existen altas probabilidades
de que la capital sea sacudida, en algún momento, por un sismo de magnitud superior a 8,5; advirtió
el presidente ejecutivo del Instituto Geofísico del Perú (IGP).
Experimento aleatorio
Es todo proceso que genera dos o más resultados bien definidos sin que se pueda predecir con certeza
cuál de ellos será observado u ocurrirá en cada realización del proceso. En cualquier repetición simple
de un experimento, ocurrirá uno y solo uno de los posibles resultados experimentales.
Espacio muestral
Es el conjunto de todos los posibles resultados de todos los resultados experimentales. Se le suele
simbolizar por 𝑆 o Ω.
Evento
Un evento es un subconjunto del espacio muestral. Al realizar un experimento, diremos que el evento
A ha ocurrido si el resultado obtenido es un elemento del evento A.
Probabilidad de un evento
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por tanto, la pro-
babilidad es una medida del grado de incertidumbre asociado con un evento.
Un valor de probabilidad cercano a 0 indica que es muy improbable que ocurra el evento, mientras
que una probabilidad cercana a 1 indica que es casi seguro que ocurra el evento.
El objetivo del cálculo de probabilidades es el obtener un valor numérico asociado con la ocurrencia
de determinado acontecimiento para facilitar la toma de decisiones relacionada con él.
Imposible Improbable Igualmente probable o improbable Probable Seguro

0 0,2 0,5 0,8 1
Definición clásica de probabilidad (a priori)
Sea un experimento aleatorio cuyo correspondiente espacio muestral W está formado por un número
finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces, definimos la
probabilidad de un evento 𝐴 como sigue:
𝑛(𝐴)
𝑃(𝐴) =
𝑛(Ω)
donde:
𝑛(𝐴) es el número de elementos del evento 𝐴
𝑛(Ω) es el número de elementos del espacio muestral
Ejercicios
89. Marque con un aspa, asignando una opción a la situación de acuerdo con su posibilidad de ocu-
rrencia.
Muy Poco Igualmente Muy

Bastante
Situación poco probable que
probable probable probable
probable ocurra o no
Una mujer será la próxima pre-
X
sidenta del Perú.
Perú clasificará al Mundial Qa-
X
tar 2022.
Aprobaré este curso. X
90. Complete el siguiente cuadro asignando probabilidades según su parecer.
Experimento aleatorio Espacio muestral Un evento Probabilidad

Se invierte en una empresa de
productos de higiene y se regis- Ω = {rentable; no ren-
𝐴 = {rentable} P(A) = 0,90
tra si la empresa es o no renta- table}
ble al final del año.
Se invierte en una empresa de

turismo y se registra si la em- Ω = {rentable; no ren-
𝐴 = {rentable} P(A) = 0,50
presa es o no rentable al final table}
del año.
91. Complete el siguiente cuadro.
Experimento aleatorio Espacio muestral Evento Probabilidad
Se lanza un dado, cal- 𝑛(𝐴) 2

cule la probabilidad de Ω = {1, 2, 3, 4, 5, 6} A = {3, 5} 𝑃(𝐴) = =
que salga 3 ó 5. 𝑛(Ω) 6
Se lanzan dos dados, A = {(2,6); (3,6); (4,6);

calcule la probabilidad Ω = {(1,1); (1,2); (5,6); (6,6); (3;5); (4,5); 𝑛(𝐴) 15
𝑃(𝐴) = =
de que la suma sea (1,3); …; (6,6)} (5,5) (6,5); (4,4) ;(5,4); 𝑛(𝑆) 36
mayor a 7. (6,4) (5,3); (6,3); (6,2)}
Se saca una bola de
una urna con tres bo- Ω = {𝑅# ; 𝑅$ ; 𝑅) ;
jas rojas y cuatro ne- 𝑛(𝐴) 3
𝑁# ; 𝑁$ ; 𝑁) ; 𝑁- } A = {𝑅# ; 𝑅$ ; 𝑅) } 𝑃(𝐴) = =
gras, calcule la proba- 𝑛 (𝑆) 7
bilidad de que sea
roja.
Ejercicios
92. Indicar, para cara uno de los siguientes experimentos aleatorios, los respectivos espacios mues-
trales: lanzar una moneda, jugar un partido de fútbol, jugar un partido de tenis, lanzar un dado,
lanzar dos dados.
93. Un experimento consiste en lanzar primero un dado para después lanzar una moneda, siempre y
cuando el número del dado sea par. Si el resultado del dado es impar, la moneda se lanza dos
veces. Determine el espacio muestral de este experimento.
94. Se lanzan dos dados, calcule la probabilidad de que la suma de los dos dados sea mayor a siete.
Rpta: 0,4167
95. De 50 conductores, nueve no tienen los papeles en regla. Si un policía escoge al azar a cinco con-
ductores y les pide sus papeles.
a. Calcule la probabilidad de que elija a dos que no tengan los papeles en regla. Rpta: 0,1811
b. Calcule la probabilidad de que elija al menos un conductor sin papeles en regla. Rpta: 0,6463
96. En un lote de polos, hay 70 polos rojos, 150 blancos y 90 azules. Si extrae un polo al azar.
a. ¿Cuál es la probabilidad de que el polo sea azul o blanco? Rpta: 0,7742

b. ¿Cuál es la probabilidad de que no sea azul? Rpta: 0,7097
Algunas relaciones básicas de probabilidad
Con frecuencia se construyen eventos mediante la combinación de eventos más sencillos. Es usual
emplear la notación de conjuntos para describir los eventos construidos de esta forma.
Sea 𝜀 un experimento aleatorio y Ω el espacio muestral asociado. Si 𝐴 y 𝐵 son dos eventos definidos
en Ω, se define las siguientes operaciones con eventos.
Complemento (AC)
Para un evento 𝐴 cualquiera se define su complemento 𝐴K como el evento consistente en todos los
puntos de Ω que no están en 𝐴.
Ac
Se tiene que
𝑃(𝐴) = 1 − 𝑃(𝐴K )
𝐴K se expresa como: “El evento 𝐴 no ocurre”.
Unión de eventos (A È B)
Para dos eventos 𝐴 y 𝐵, la unión del evento 𝐴 con el evento 𝐵 es el evento que contiene todos los
puntos de 𝑆 que pertenecen a 𝐴 o a 𝐵 o a ambos.
A B
𝐴 ∪ 𝐵 se expresa como: “Al menos uno de los eventos A o B ocurre”.

Intersección de eventos (A ∩ B)
Para dos eventos 𝐴 y 𝐵, la intersección de los eventos 𝐴 y 𝐵 es el evento que contiene todos los puntos
de Ω que pertenecen tanto a 𝐴 como a 𝐵.
A B
𝐴 ∩ 𝐵 se expresa como: “Ambos eventos, 𝐴 y 𝐵 ocurren a la vez”.
Diferencia de eventos (A - B)
Para dos eventos 𝐴 y 𝐵, la diferencia de los eventos 𝐴 menos 𝐵 es el evento que contiene todos los
puntos de Ω que pertenecen a 𝐴 y no pertenecen a 𝐵.
A B
𝐴 − 𝐵 se expresa como: “Ocurre el evento 𝐴 pero no el evento 𝐵”.
Diferencia simétrica de eventos (A ∆ B)

Para dos eventos 𝐴 y 𝐵, la diferencia simétrica de los eventos 𝐴 y 𝐵 es el evento que contiene todos
los puntos de Ω que pertenecen solo a 𝐴 o aquellos que solo pertenecen a 𝐵.
A B
𝐴 Δ 𝐵 se expresa como: “Ocurre solo uno de los eventos 𝐴 o 𝐵”.

Ejercicios
Un financista invierte en fondos mutuos y en la Bolsa de Valores.
Se definen los eventos:

𝐴:= que el financista tenga éxito en la inversión de fondos mutuos.
𝐵:= que el financista tenga éxito en la inversión en la Bolsa de Valores.
Escriba los siguientes eventos en función de los eventos 𝐴 y 𝐵. Además, grafique dicho evento en un
diagrama de Venn.
Solución
Evento Notación Diagrama de Venn
A B
que el financista tenga éxito en las dos inver-
𝐴∩𝐵
siones
A B
que el financista no tenga éxito en la Bolsa de K
𝐵
Valores
A B
que el financista tenga éxito en, al menos una,
𝐴∪𝐵
de sus inversiones
A B
que el financista tenga éxito solamente en una
𝐴 Δ 𝐵
de sus inversiones
A B
que el financista tenga éxito en la Bolsa de Va-
𝐵−𝐴
lores, pero no en los fondos mutuos
Eventos mutuamente excluyentes
Dos eventos son mutuamente excluyentes o disjuntos si no tienen puntos de Ω en común.
Los eventos 𝐴 y 𝐵 son mutuamente excluyentes si y solo si 𝐴 ∩ 𝐵 = f.
A B
Reglas de conteo y combinaciones
Regla de la adición
Si 𝐴 y 𝐵 son eventos mutuamente excluyentes, entonces:
𝑛(𝐴 ∪ 𝐵) = 𝑛(𝐴) + 𝑛(𝐵)
Regla de la multiplicación
Si un experimento se realiza por una sucesión de 𝑘 pasos, en el primer paso tiene 𝑛# resultados posi-
bles, el segundo tiene 𝑛$ resultados posibles y así sucesivamente, entonces el número total de resul-
tados del experimento es:
𝑛(𝐴) = 𝑛# × 𝑛$ × … × 𝑛%
Regla de conteo para combinaciones
La cantidad de formas de seleccionar 𝑥 objetos de un total de 𝑛 objetos distinguibles sin tomar en

cuenta el orden es:
𝑛!
𝑛(𝐴) = 𝐶D7 =
𝑥! (𝑛 − 𝑥)!
Ejercicios
97. Indique si los siguientes eventos son mutuamente excluyentes.
𝐴: Estudio mucho el curso Estadística, 𝐵: Desapruebo el curso Estadística No

𝐴: Apruebo el curso Estadística, 𝐵: Desapruebo el curso Estadística Sí
𝐴: Hoy estudio Administración y Negocios Internacionales en la UPC, 𝐵: Hoy estudio Administra-
ción y Marketing en la UPC Sí
98. Una persona puede elegir solo una de dos opciones para almorzar: una de cinco diferentes ham-
burguesas o una de diez pizzas diferentes. ¿De cuántas maneras diferentes puede almorzar dicha
persona?
Por el principio de la adición, pues los eventos son mutuamente excluyentes.
𝐴 ≔ que la persona elija una hamburguesa

𝐵 ≔ que la persona elija una pizza
𝑛(𝐴 ∪ 𝐵) = 𝑛(𝐴) + 𝑛(𝐵) = 5 + 10 = 15
99. Un restaurante tiene la siguiente carta. Si un menú consta de elegir un entrante, un segundo y un
postre, ¿de cuántas maneras diferentes puede elegir un cliente su menú?
Por el principio de la multiplicación.
𝑛(𝐴) = 𝑛# × 𝑛$ × 𝑛) = 5 × 5 × 4 = 100
100. En un vuelo, la aerolínea ha sobrevendido pasajes, por lo que tendrá que ofrecer premios a pasa-
jeros para que no viajen en ese vuelo. Si hay 15 pasajeros que viajan solos y están dispuestos a no
viajar y recibir los premios ¿De cuántas maneras diferentes se puede elegir a solo ocho de ellos?
Por la regla de combinaciones.
15!
𝑛(𝐴) = 𝐶<#H = = 6435
8! × (15 − 8)!
En Excel se usa =COMBINAT(15;8) = 6435

En Casio; 15; Shift; ÷; 8; =. 15C8 =6435
101. Para jugar la Tinka se debe elegir seis números de un total de 45, sin importar el orden.
a. ¿De cuántas maneras diferentes se puede elegir seis números de un total de 45?
b. ¿Cuál es la probabilidad de que una persona gane la Tinka con una jugada?
102. En un hogar hay diez personas y un encuestador necesita entrevistar a dos de ellas, sin importar
el orden. ¿De cuántas maneras diferentes se puede elegir a esas dos personas? Rpta: 45
103. Al fin del ciclo, los 30 alumnos de una sección deben elegir a tres de ellos al azar para que organi-
cen un “compartir”. ¿Cuántos grupos diferentes de tres personas se pueden elegir?
Rpta: 4060
Axiomas de la probabilidad
Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y 𝐴 un

evento definido en Ω, entonces la probabilidad del evento 𝐴, denotada por 𝑃(𝐴), es aquel número
que cumple los siguientes axiomas:
Axioma 1
0 £ 𝑃(𝐴) £ 1
Axioma 2
𝑃(𝑆) = 1
Axioma 3
Si 𝐴 y 𝐵 son dos eventos mutuamente excluyentes entonces:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
Ley aditiva para eventos cualesquiera
Sean A, B y C tres eventos cualesquiera, se cumple que:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)– 𝑃(𝐴 ∩ 𝐵)
A B
𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐵 ∩ 𝐶) + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)
A B
C
104. La probabilidad de una persona sea contagiada por el virus A es de 0,12 y de que sea contagiada
por el virus B es 0,2; mientras que la probabilidad de que sea contagiada por alguno de los dos
virus es 0,25. Calcule la probabilidad de que ocurran los siguientes eventos.
Definamos los eventos.

𝐴 ≔ que la persona sea contagiada por el virus A 𝑃(𝐴) = 0,12
𝐵 ≔ que la persona sea contagiada por el virus B 𝑃(𝐵) = 0,20
Por ley aditiva, sabemos que:

𝑃(𝐴 ∪ 𝐵) = 0,25
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
0,25 = 0,12 + 0,20 − 𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴 ∩ 𝐵) = 0,07
A B
0,05 0,07 0,13
0,75
Evento Probabilidad Diagrama de Venn
A B
que sean contagiados por los
𝑃(𝐴 ∩ 𝐵) = 0,07
dos virus.
A B
que sea contagiado por solo
𝑃(𝐴 ∆ 𝐵) = 0,05 + 0,13 = 0,18
un virus.
A B
que sea contagiado solo por el K
𝑃(𝐵 − 𝐴) = 𝑃(𝐴 ∩ 𝐵) = 0,13
virus B.
105. Un fabricante de teléfonos celulares acaba de lanzar dos modelos de smartphones económicos:
el L720 y el L520. La probabilidad de que el modelo L720 tenga éxito es 0,70 y en el modelo L520
es 0,60. La probabilidad de que al menos uno de los modelos tenga éxito es 0,90. Determine la
probabilidad de que se tenga éxito solo en uno de los modelos. Rpta: 0,5
106. La probabilidad de que una persona viaje a Alemania el próximo año es 0,40; a Bélgica es 0,5 y
Chipre es 0,37. Además, la probabilidad de viajar a Alemania y Bélgica es 0,15; a Alemania y Chipre
es 0,10 y a Bélgica y Chipre es 0,12. Si la probabilidad de que la persona viaje a por lo menos a una
ciudad es 0,95; calcule la probabilidad de que la persona viaje a una sola ciudad.
Probabilidad condicional
Sean los eventos 𝐴 y 𝐵 definidos en el espacio muestral Ω, entonces la probabilidad de que ocurra el
evento 𝐴 teniendo como condición que el evento 𝐵 ya ocurrió, se denomina probabilidad condicional.
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵) =
𝑃(𝐵)
“Lo que yo se” lo escribo a la derecha

“Lo pedido” lo escribo a la izquierda
A B
𝑃(𝐵)
𝑃(𝐴 ∩ 𝐵)
Ejemplo 29
En un grupo, conformado por hombres y mujeres, existen profesionales y no profesionales de acuerdo
con la siguiente tabla.
Condición Hombre (B) Mujer (Bc) Total

Profesional (A) 1 2 3
No profesional (Ac) 7 10 17
Total 8 12 20
Si se elige una mujer al azar, calcule la probabilidad de que sea profesional.

Solución
Primero, definamos los eventos necesarios para resolver este problema:
𝐵K := Que la persona escogida sea mujer
𝐴:= Que la persona escogida sea profesional
La probabilidad pedida es:
𝑃(𝐴 ∩ 𝐵K ) 2
𝑃(𝐴⁄𝐵K ) = = = 0,16667
𝑃(𝐵 )
K 12
Condición Hombre (B) Mujer (Bc) Total

Profesional (A) 1 2 3
No profesional (Ac) 7 10 17
Total 8 12 20
Ejemplo 30
El gerente de Wallmarket al distribuir los productos en las diferentes tiendas toma una muestra de 250
unidades de los tres productos y en los dos tipos de envases, del almacén con la idea de distribuirlos
aleatoriamente en las tiendas. La distribución de los productos es la siguiente:
Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
a. Si se elige un producto al azar, para una de las tiendas, calcule la probabilidad de que sea jugo de
maracuyá y en frasco.
b. ¿Cuál es la probabilidad de que sea mermelada o el envase sea de sachet?
c. Si el envase es sachet, ¿cuál es la probabilidad de que sea esencia?
Solución
a. Si se elige un producto al azar, para una de las tiendas, calcule la probabilidad de que sea jugo de
maracuyá y en frasco.
Solución
Lo primero es definir los eventos necesarios.
𝐽:= que el producto elegido sea jugo
𝐹:= que la presentación elegida sea frasco
En la tabla observamos que lo pedido es:
62
𝑃(𝐽 ∩ 𝐹) = = 0,248
250
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
b. ¿Cuál es la probabilidad de que sea mermelada o el envase sea de sachet?
Solución
Sean los eventos:
𝑀:= que el producto elegido sea mermelada
𝑆:= que la presentación elegida sea sachet
𝑃(𝑀 ∪ 𝑆) = 𝑃(𝑀) + 𝑃(𝑆) − 𝑃(𝑀 ∩ 𝑆)
88 120 50
= + − = 0,632
250 250 250
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
c. Si el envase es sachet, ¿cuál es la probabilidad de que sea esencia?
Solución
Sean los eventos:
𝐸:= que el producto elegido sea esencia

𝑆:= que la presentación elegida sea sachet
20
𝑃(𝐸/𝑆) = = 0,167
120
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
Ejemplo 31
La mayoría de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95 octanos y 97
octanos. Con frecuencia, alguna de cada está enriquecida con un aditivo. La tabla siguiente ilustra los
porcentajes de clientes que prefieren cada tipo.
90 octanos (B) 95 octanos (C) 97 octanos (D) Total

Con aditivo (A) 0,05 0,10 0,05 0,20
Sin aditivo (AC) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00
Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina.
a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?
b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado
gasolina de 97 octanos?
c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado
gasolina sin aditivo?
Solución
a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?
Solución
𝑃(𝐴 ∪ 𝐶 K ) = 𝑃(𝐴) + 𝑃(𝐶 K )– 𝑃(𝐴 ∩ 𝐶 K )
= 0,20 + 0,50 − (0,05 + 0,05) = 0,60

Con aditivo (A) 0,05 0,10 0,05 0,20
Sin aditivo (AC) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00
b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado

gasolina de 97 octanos?
Solución
𝑃(𝐷 ∩ 𝐶 K )
𝑃(𝐷 ⁄𝐶 K ) =
𝑃 (𝐶 K )
0,30
= = 0,60
0,20 + 0,30

Con aditivo (A) 0,05 0,10 0,05 0,20
Sin aditivo (AC) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00
c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado

gasolina sin aditivo?
Solución
𝑃(𝐴K ∩ 𝐵K )
𝑃(𝐴K ⁄𝐵K ) =
𝑃 (𝐵 K )
0,40 + 0,25
= = 0,8125
0,50 + 0,30

Con aditivo (A) 0,05 0,10 0,05 0,20
Sin aditivo (AC) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00
Ejercicios
107. Objetivo específico: Analizar el comportamiento de los clientes considerando el destino de viaje,
el tipo de cliente y el modo de compra. Se ha obtenido la siguiente tabla.
Destino de viaje nacional (D) Destino de viaje internacional (E)

Tipo de cliente Compra presen- Compra por In- Compra Compra por In- Total
cial (F) ternet (G) presencial (F) ternet (G)
Premium (A) 12 28 38 13 91
Frecuente (B) 8 25 12 23 68
Ocasional (C) 7 15 9 10 41
Total 27 68 59 46 200
a. Si se elige al azar a un cliente que compra por Internet, calcule la probabilidad de que sea un viajero
premium.
Definamos los eventos necesarios.

𝐺 ≔ que el cliente compre por Internet
𝐴 ≔ que el cliente sea premium
28 + 13 41
𝑃(𝐴⁄𝐺 ) = =
68 + 46 114

Premium (A) 28 13
Frecuente (B) 25 23
Ocasional (C) 15 10
Total 68 46
b. Si se elige al azar a un cliente frecuente, calcule la probabilidad de que compre pasajes con destino
nacional.

𝐵 ≔ que el cliente sea frecuente
𝐷 ≔ que el cliente compre destino nacional
8 + 25 33
𝑃(𝐷⁄𝐵 ) = =
68 68

Premium (A)
Frecuente (B) 8 25 12 23 68
Ocasional (C)
Total
108. Según el II Censo Universitario, en el año 2010, 63 900 alumnos ingresaron a las universidades
públicas y 194 151 a las universidades privadas. De ellos, en las universidades públicas, 28 798
ingresantes fueron mujeres, mientras que en las privadas lo fueron 98 942.
a. Si se elige al azar a una ingresante, calcule la probabilidad de que estudie en una universidad
privada. Rpta: 0,77456
b. Si se elige al azar a un ingresante de universidad privada, calcule la probabilidad de que sea
mujer. Rpta: 0,50961
109. En una empresa hay 150 trabajadores; 25 de los hombres y 35 de las mujeres realizan actividades
de responsabilidad social en la empresa. El total de mujeres en la empresa es de 57.
a. Si elegimos al azar a un trabajador hombre, calcule la probabilidad de que realice actividades

de responsabilidad social. Rpta: 0,2688
b. Si elegimos al azar a un trabajador que no realice actividades de responsabilidad social, calcule
la probabilidad de que sea mujer. Rpta: 0,2444
c. Si elegimos al azar a un trabajador que realice actividades de responsabilidad social y que sea
mujer. Rpta: 0,2333
Ley multiplicativa para eventos cualesquiera
La ley multiplicativa se usa para calcular la probabilidad de una intersección de eventos.
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) 𝑃(𝐵/𝐴)
o de forma equivalente:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵) 𝑃(𝐴/𝐵)

Ejercicios
110. Un sistema de seguridad en una máquina tiene dos componentes. La probabilidad de que el pri-
mer componente falle es 0,75% y la probabilidad de que el segundo componente falle si el primero
ha fallado es 2%. El sistema falla si ambos componentes fallan. Si la probabilidad de que falle el
sistema de seguridad es mayor al 0,1% se pondrá un tercer componente de seguridad. Indique lo
que se hará.
Interpretación
Determinar si se pondrá un tercer componente de seguridad.
Representación
𝐴 ≔ que el primer componente falle 𝑃(𝐴) = 0,0075
𝐵 ≔ que el segundo componente falle 𝑃(𝐵⁄𝐴) = 0,02
Utilizaremos la ley multiplicativa.
Cálculo
La probabilidad pedida es la probabilidad de que falle el sistema de seguridad; el sistema falla si
ambos componentes fallan, es decir:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵 ⁄𝐴) = 0,0075 × 0,02 = 0,00015
𝑃(𝐵⁄𝐴) = 0,02 𝑃(𝐴 ∩ 𝐵)

𝑃(𝐴) = 0,0075
𝑃(𝐵K ⁄𝐴) = 0,98 𝑃(𝐴 ∩ 𝐵K )
𝑃(𝐵⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵)
𝑃(𝐴K ) = 0,9925
𝑃(𝐵K ⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵K )
La probabilidad de que falle el sistema de seguridad es 0,00015; que es menor a 0,001. Por lo
tanto, no se pondrá un tercer componente de seguridad.
111. Para elegir a una persona entre tres se prepara una bolsa con dos bolas negras y una bola blanca.
Los tres van sacando, por orden, una bola que no devuelven. Quien saque la bola blanca gana.
¿Quién lleva más ventaja: el primero, el segundo o el tercero? Rpta: Nadie
Partición del espacio muestral
Se denomina partición del espacio muestral Ω a una colección de 𝑘 eventos 𝐴# , 𝐴$ , , … , 𝐴% mutua-

mente excluyentes y cuya unión es el espacio muestral Ω, con las siguientes condiciones:
• 𝑃(𝐴! ) ≥ 0; para todo 𝑖 = 1, 2, 3, ⋯ , 𝑘

• 𝐴! ∩ 𝐴L = ∅ para todo 𝑖 ≠ 𝑗
• 𝐴# ∪ 𝐴$ ∪ ⋯ ∪ 𝐴% = Ω
W
𝐴# 𝐴$ … 𝐴%
Probabilidad total
Si 𝑘 eventos 𝐴# , 𝐴$ , , … , 𝐴% constituyen una partición del espacio muestral Ω, entonces la probabilidad

para cualquier evento 𝐵 de Ω se calcula:
𝑃(𝐵) = • 𝑃(𝐵 ∩ 𝐴! )
!6#
𝑃(𝐵) = • 𝑃(𝐴! )𝑃(𝐵/𝐴! )

!6#
La probabilidad pedida no es condicional.

W
𝐴# 𝐴$ … 𝐴%
𝐵
Árbol de probabilidades
El árbol de probabilidades es la tercera herramienta (el diagrama de Venn y la tabla de contingencias

son las dos herramientas anteriores) muy útil para el planteamiento de problemas, sobre todo cuando
hay como datos iniciales las probabilidades condicionales.
La elaboración de un árbol de probabilidades sencillo tiene la siguiente estructura:
𝑃(𝐵⁄𝐴) 𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴)
𝑃(𝐵K ⁄𝐴) 𝑃(𝐴 ∩ 𝐵K )
𝑃(𝐵⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵)
𝑃(𝐴K )
𝑃(𝐵K ⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵K )
Teorema de Bayes
Si los 𝑘 eventos 𝐴# , 𝐴$ , 𝐴) , ⋯ , 𝐴% constituyen una partición del espacio muestral Ω y 𝑃(𝐴! ) ≠ 0 para
todo 𝑖 = 1, 2, 3, … , 𝑘; entonces para un evento 𝐵 cualquier contenido Ω tal que 𝑃(𝐵) ≠ 0.
𝑃(𝐴! ∩ 𝐵)
𝑃(𝐴! •𝐵) =
𝑃(𝐵)
Usando el teorema de la probabilidad total y la ley multiplicativa para eventos cualesquiera.
𝑃(𝐴! )𝑃(𝐵⁄𝐴! )
𝑃(𝐴! ⁄𝐵) = %
∑!6# 𝑃(𝐴! )𝑃(𝐵/𝐴! )
El teorema de Bayes establece una relación muy importante en la teoría de probabilidades y es la base
para la revisión de la asignación de probabilidades a la luz de información adicional.
Ejemplo 32
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 2% de las usuarias y el 0,8% de
los usuarios han sufrido de algún tipo de robo durante el uso del Metropolitano.
Si se elige un usuario al azar que ha sido víctima de robo, calcule la probabilidad de que sea hombre y
la probabilidad de que sea mujer. Se va a establecer una oficina de protección al usuario y se pondrá
énfasis a los usuarios cuyo sexo tengan más probabilidad de sufrir algún tipo de robo.
Solución
Interpretación
Se va a determinar el sexo que tenga más probabilidad entre los que han sufrido un robo.
Representación
Sean los eventos:
𝑅:= Que el usuario sea víctima de robo
𝐻:= Que el usuario sea hombre.
𝑀:= Que el usuario sea mujer
Usaremos el teorema de la probabilidad total y el teorema de Bayes.
Cálculo
Por el teorema de la probabilidad total.
𝑃(𝑅⁄𝐻 ) = 0,008
𝑃(𝐻) = 0,55
𝑃(𝑅K ⁄𝐻) = 0,992
𝑃(𝑅 ⁄𝑀) = 0,020

𝑃(𝑀) = 0,45
𝑃(𝑅K ⁄𝑀) = 0,980
𝑃(𝑅) = 𝑃(𝐻)𝑃(𝑅⁄𝐻) + 𝑃(𝑀)𝑃(𝑅 ⁄𝑀)
𝑃(𝑅) = 0,55 × 0,008 + 0,45 × 0,020 = 0,0134
Por teorema de Bayes, calculemos cada probabilidad.
𝑃(𝐻) × 𝑃(𝑅 ⁄𝐻 ) 0,55 × 0,008

𝑃(𝐻 ⁄𝑅) = = = 0,3284
𝑃 (𝑅 ) 0,0134
𝑃(𝑀) × 𝑃(𝑅⁄𝑀) 0,45 × 0,020

𝑃(𝑀⁄𝑅 ) = = = 0,6716
𝑃 (𝑅 ) 0,0134
Entre los que han sufrido algún tipo de robo, las mujeres tienen una mayor probabilidad. Se pondrá
énfasis en la protección de las mujeres.
Ejemplo 33
Si Expórtame, una empresa que exporta productos alimenticios, distribuye sus productos de la si-
guiente manera: 45% en jugo, 35% en mermelada y el resto en esencia. Además, se sabe que la pro-
babilidad de que un jugo esté en mal estado es 4%, una mermelada es 2% y una esencia es 3%. Si de
los productos en mal estado se selecciona uno al azar, determine el tipo de producto que sea más
probable. Para dicho producto se establecerá un nuevo esquema de control de calidad.
Solución
Interpretación
Se debe determinar el tipo de producto que es más probable que esté en mal estado.
Representación
Sean los siguientes eventos:
𝐽: = que el producto elegido sea jugo

𝑀: = que el producto elegido sea mermelada
𝐸: = que el producto elegido sea esencia
𝐵: = que el producto elegido esté en buen estado
Para resolver este problema usaremos el teorema de Bayes.
Cálculo
Completemos el árbol de probabilidades.
𝑃(𝐵 ⁄𝐽) = 0,96

𝑃(𝐽) = 0,45
𝑃(𝐵K ⁄𝐽) = 0,04
𝑃(𝐵⁄𝑀) = 0,98
𝑃(𝑀) = 0,35
𝑃(𝐵K ⁄𝑀) = 0,02
𝑃(𝐵 ⁄𝐸) = 0,97

𝑃(𝐸) = 0,20
𝑃(𝐵K ⁄𝐸) = 0,03
Por el teorema de la probabilidad total, se tiene que:
𝑃(𝐵K ) = 𝑃(𝐽)𝑃(𝐵M ⁄𝐽) + 𝑃(𝑀)𝑃(𝐵M ⁄𝑀) + 𝑃(𝐸)𝑃(𝐵M ⁄𝐸 )
𝑃(𝐵K ) = 0,45 × 0,04 + 0,35 × 0,02 + 0,20 × 0,03 = 0,031

Por el teorema de Bayes, se tiene que:
𝑃(𝐽 ∩ 𝐵M ) 0,018
𝑃(𝐽⁄𝐵M ) = = = 𝟎, 𝟓𝟖𝟎𝟔
𝑃(𝐵M ) 0,031
𝑃(𝑀 ∩ 𝐵M ) 0,007
𝑃(𝑀⁄𝐵M ) = = = 0,2258
𝑃(𝐵M ) 0,031
𝑃(𝐸 ∩ 𝐵M ) 0,006
𝑃(𝐸⁄𝐵M ) = = = 0,1936
𝑃(𝐵M ) 0,031
De los productos en mal estado, el más probable es el jugo. Se establecerá un nuevo esquema de
control de calidad para los jugos.
Ejemplo 34
El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en
efectivo, con cheque o al crédito, con probabilidades respectivas de 0,3; 0,3 y 0,4.
La probabilidad de que una venta sea por más de $50, es igual a 0,2 si ésta es en efectivo, es igual a
0,9 si ésta es con cheque y es igual a 0,6 si ésta es al crédito.
Si compra por más de $50, ¿qué es más probable que haya pagado en efectivo, con cheque o al crédito?
Solución
Sean los eventos:
𝐸: La compra se realiza con dinero en efectivo
𝐶𝐻: La compra se realiza con cheque
𝐶: La compra se realiza al crédito
𝑀: La compra es por más de $ 50
𝑀M : La compra no es por más de $ 50
Con la información proporcionada, construimos el siguiente diagrama de árbol:
𝑃(𝑀⁄𝐸 ) = 0,2
𝑃(𝐸) = 0,3
𝑃(𝑀K ⁄𝐸) = 0,8
𝑃(𝑀⁄𝐶𝐻) = 0,9
𝑃(𝐶𝐻) = 0,3
𝑃(𝑀K ⁄𝐶𝐻) = 0,1
𝑃(𝑀⁄𝐶 ) = 0,6
𝑃(𝐶) = 0,4
𝑃(𝑀K ⁄𝐶 ) = 0,4
Por el teorema de la probabilidad total, se tiene que:
𝑃(𝑀) = 𝑃(𝐸)𝑃(𝑀⁄𝐸 ) + 𝑃(𝐶𝐻)𝑃(𝑀 ⁄𝐶𝐻) + 𝑃(𝐶)𝑃(𝑀⁄𝐶 )
𝑃(𝑀) = 0,3 × 0,2 + 0,3 × 0,9 + 0,4 × 0,6 = 0,57
Por el teorema de Bayes, se tiene que:
𝑃(𝐸 ∩ 𝑀) 0,3 × 0,2

𝑃(𝐸 ⁄𝑀) = = = 0,1053
𝑃(𝑀) 0,57
𝑃(𝐶𝐻 ∩ 𝑀) 0,3 × 0,9

𝑃(𝐶𝐻⁄𝑀) = = = 0,4737
𝑃(𝑀) 0,57
𝑃(𝐶 ∩ 𝑀) 0,4 × 0,6

𝑃(𝐶 ⁄𝑀) = = = 0,4211
𝑃(𝑀) 0,57
Se observa que es más probable la compra se haya hecho con cheque.

Ejercicios
112. En una empresa el 35% de los trabajadores son mujeres y el 65% son hombres. Un día ha llegado
tarde a trabajar el 2% de las mujeres y el 4% de los hombres.
a. Si se elige al azar a un trabajador, calcule la probabilidad de que haya llegado tarde.

b. Si se elige al azar a un trabajador que no ha llegado tarde, calcule la probabilidad de que sea
elegida una mujer.
Solución
Los eventos y el árbol de probabilidades necesarios para resolver este problema son:
𝐻:= que el trabajador elegido sea hombre

𝑀:= que el trabajador elegido sea mujer
𝑇:= que el trabajador haya llegado tarde
a. Si se elige al azar a un trabajador, calcule la probabilidad de que haya llegado tarde.
Usaremos el teorema de la probabilidad total, pues la probabilidad pedida no es condicional.
𝑃(𝑇) = 𝑃(𝐻)𝑃(𝑇⁄𝐻) + 𝑃(𝑀)𝑃(𝑇⁄𝑀) = 0,65 × 0,04 + 0,35 × 0,02 = 0,033
𝑃(𝑇) = 0,033
𝑃(𝑇⁄𝐻) = 0,04 𝑃(𝐻 ∩ 𝑇)

𝑃(𝐻) = 0,65
𝑃(𝑇 K ⁄𝐻 ) = 0,96 𝑃(𝐻 ∩ 𝑇 K )
𝑃(𝑇⁄𝑀) = 0,02 𝑃(𝑀 ∩ 𝑇)

𝑃(𝑀) = 0,35
𝑃(𝑇 K ⁄𝑀) = 0,98 𝑃(𝑀 ∩ 𝑇 K )
b. Si se elige, al azar a un trabajador que no ha llegado tarde, calcule la probabilidad de que sea
elegida una mujer.
Usaremos el teorema de Bayes, pues la probabilidad pedida es una condicional. La probabili-

dad pedida es:
𝑃(𝑀 ∩ 𝑇 K ) 0,35 × 0,98

𝑃(𝑀⁄𝑇 K ) = = = 0,354
𝑃(𝑇 K ) 1 − 0,033
𝑃(𝑇⁄𝐻) = 0,04 𝑃(𝐻 ∩ 𝑇)

𝑃(𝐻) = 0,65
𝑃(𝑇 K ⁄𝐻 ) = 0,96 𝑃(𝐻 ∩ 𝑇 K )
𝑃(𝑇⁄𝑀) = 0,02 𝑃(𝑀 ∩ 𝑇)

𝑃(𝑀) = 0,35
𝑃(𝑇 K ⁄𝑀) = 0,98 𝑃(𝑀 ∩ 𝑇 K )
113. Una empresa que fabrica polos mediante tres máquinas, A, B y C, producen el 25%, 30% y 45%,
respectivamente, del total de los polos producidos en la fábrica. Los porcentajes de producción
defectuosa de estas máquinas son del 2%, 4% y 3% respectivamente.
a. Si se elige un polo al azar; calcule la probabilidad de que sea no defectuoso. Rpta: 0,9695

𝐴 ≔ que el polo sea producido por la máquina A
𝐵 ≔ que el polo sea producido por la máquina B
𝐶 ≔ que el polo sea producido por la máquina C
𝐷 ≔ que el polo sea defectuoso
𝑃(𝐷⁄𝐴) = 0,02
𝑃(𝐴) = 0,25
𝑃(𝐷K ⁄𝐴) = 0,98
𝑃(𝐷⁄𝐵) = 0,04
𝑃(𝐵) = 0,30
𝑃(𝐷K ⁄𝐷 ) = 0,96
𝑃(𝐷⁄𝐶 ) = 0,03
𝑃(𝐶) = 0,45
𝑃(𝐷K ⁄𝐶 ) = 0,97
𝑃(𝐷K ) = 0,25 × 0,98 + 0,30 × 0,96 + 0,40 × 0,97 = 0,9695
b. Tomamos, al azar, un polo y resulta ser defectuoso; calcule la probabilidad de haber sido pro-
ducido por la máquina B. Rpta: 0,3934
𝑃(𝐵 ∩ 𝐷) 0,30 × 0,04

𝑃(𝐵⁄𝐷 ) = = = 0,3934
𝑃(𝐷) 1 − 0,9695
𝑃(𝐷⁄𝐴) = 0,02
𝑃(𝐴) = 0,25
𝑃(𝐷K ⁄𝐴) = 0,98
𝑃(𝐷⁄𝐵) = 0,04
𝑃(𝐵) = 0,30
𝑃(𝐷K ⁄𝐵 ) = 0,96
𝑃(𝐷⁄𝐶 ) = 0,03
𝑃(𝐶) = 0,45
𝑃(𝐷K ⁄𝐶 ) = 0,97
Eventos independientes
Si 𝑃(𝐴) ¹ 0, los eventos 𝐴 y 𝐵 son independientes si y solo si:
𝑃(𝐴/𝐵) = 𝑃(𝐴)
Ley de la multiplicación para eventos independientes
Si dos eventos 𝐴 y 𝐵 son independientes se cumple que:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) 𝑃(𝐵)
Si tres eventos 𝐴, 𝐵 y 𝐶 son independientes se cumple que:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) 𝑃(𝐵)
𝑃(𝐴 ∩ 𝐶) = 𝑃(𝐴)𝑃(𝐶)
𝑃(𝐵 ∩ 𝐶) = 𝑃(𝐵) 𝑃(𝐶)
𝑃(𝐴 ∩ 𝐵 ∩ 𝐶) = 𝑃(𝐴)𝑃(𝐵)𝑃(𝐶)
Ejercicios
114. Si dos eventos 𝐴 y 𝐵 son independientes, indique el diagrama de Venn correspondiente.
A B A B
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵)
El diagrama de Venn correspondiente es de la derecha. El diagrama de la izquierda corresponde

mutuamente excluyentes.
115. La probabilidad de que un emprendedor tenga éxito en un restaurante es del 30% y la probabili-
dad de que tenga éxito en una cafetería es del 35%. Si la probabilidad de tener éxito en al menos
uno de los negocios es mayor al 50% decidirá emprender los dos negocios. ¿Qué decisión se to-
mará? Asuma independencia.
Interpretación
Determinar si se decidirá emprender los dos negocios.
Representación
A:= que el emprendedor tenga éxito en un restaurante 𝑃(𝐴) = 0,30
B:= que un emprendedor tenga éxito en la cafetería 𝑃(𝐵) = 0,35
Usaremos la independencia de eventos.
Cálculo
Por independencia, se tiene que:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) = 0,30 × 0,35 = 0,105
A B
0,195 0,105 0,245
0,455
La probabilidad pedida es la probabilidad de tener éxito en al menos uno de los negocios, es decir:
𝑃(𝐴 ∪ 𝐵) = 0,195 + 0,105 + 0,245 = 0,545

La probabilidad de tener éxito en al menos uno de los negocios es 0,545; que es mayor a 0,5. Por
lo tanto, sí se decidirá emprender los dos negocios.
116. Un vendedor de artefactos eléctricos, en una tienda por departamentos sabe, por experiencia,
que el 2% de las personas que preguntan por un televisor finalmente lo compran. El vendedor ha
decidido que si no vende al menos un televisor ese día renunciará a su trabajo. Calcule la proba-
bilidad de que no renuncie si ese día preguntaron 50 clientes por televisores.
117. Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer trabajo es
del 70% y que sea aceptado en el segundo es del 50%. Si ser aceptado en dichos trabajos es inde-
pendiente entre sí.
a. ¿Cuál es la probabilidad de que al menos sea aceptado en uno de los trabajos? Rpta: 0,85
b. ¿Cuál es la probabilidad de que solamente sea aceptado en uno solo de los trabajos?
Rpta: 0,50
118. El pulpo Paul era un octópodo que fue empleado como oráculo para predecir los resultados de la
selección alemana de fútbol en el Mundial de Fútbol 2010, acertando los ocho emparejamientos
que se le propusieron, los siete partidos de Alemania en la Copa Mundial de Fútbol de 2010 y la
final entre España y Holanda. Antes de cada partido, a Paul se le presentaron dos contenedores
idénticos con comida: uno de ellos estaba marcado con una bandera, usualmente la de Alemania
y el otro con la bandera del equipo oponente. La elección de Paul se interpretaba como el equipo
que lograría la victoria. Si el pulpo Paul, en realidad, escogió los contenedores al azar, calcule la
probabilidad de acertar en los resultados de los ocho los partidos que le propusieron. Asuma in-
dependencia entre cada elección. Rpta: 0,0039
𝐴 ≔ que el pulpo Paul acierte los ocho partidos
𝐴! ≔ que acierte el partido 𝑖; 𝑖 = 1, 2, 3, … ,8
Establezcamos una relación entre los eventos.
𝐴 = 𝐴# ∩ 𝐴$ ∩ 𝐴) ∩ … ∩ 𝐴<
𝑃(𝐴) = 𝑃(𝐴# ∩ 𝐴$ ∩ 𝐴) ∩ … ∩ 𝐴< )
Por independencia de eventos, afirmaremos que:
𝑃(𝐴) = 𝑃(𝐴# )𝑃(𝐴$ ) … 𝑃(𝐴< )
Como el pulpo Paul elegión entre dos contenedores de comida.

𝑃(𝐴) = 0,50 × 0,50 × … × 0,50 = 0,50< = 0,0039
119. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en una
chica acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma independencia
entre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo menos con una
de ellas. Rpta: 0,8046
Unidad 3. Distribuciones de probabilidad y mues-

treo
Logro de la unidad 3
Al finalizar la Unidad 3, el estudiante aplica los conceptos de variable aleatoria, valor esperado y pro-
babilidad para la toma de decisiones responsables dentro de un escenario del ámbito empresarial.
Temario
• Definición de variable aleatoria discreta y continua
• Función de probabilidad de una variable aleatoria discreta
• Función de densidad y función de distribución acumulada de una variable aleatoria continua.
• Valor esperado y varianza de variables aleatorias discretas y continuas
• Estudio de propiedades de las siguientes distribuciones: binomial, hipergeométrica, Poisson, uni-
forme, normal, exponencial
• Muestreo aleatorio. Tipos de muestreo.
• Propiedad reproductiva de la distribución normal
• Distribución muestral de un promedio
• Teorema del límite central
Variable aleatoria
Se denomina variable aleatoria a una descripción numérica del resultado de un experimento.
La variable aleatoria atribuye a cada evento un número que no es aleatorio o imprevisible, sino fijo y
predeterminado.
Lo que es aleatorio es el experimento sobre cuyo espacio muestral se define la variable aleatoria.
Ejemplo
Un experimento aleatorio que consiste en lanzar un dado.
El espacio muestral 𝑆 = {1, 2, 3, 4, 5, 6}
Un evento posible 𝐴 = {3}
Definamos una variable 𝑋 ≔ número de la cara superior de un dado
El rango de la variable 𝑋 es: 𝑅? = {1, 2, 3, 4, 5, 6}
Reescribamos el evento 𝐴 = {3} = (𝑋 = 3)
La probabilidad de que suceda 𝐴 es
1
𝑃(𝐴) = 𝑃(𝑋 = 3) = 𝑓(3) =
6
Rango o recorrido de una variable aleatoria
Se llama rango o recorrido de una variable aleatoria 𝑋 y lo denotaremos 𝑅? , al conjunto de los valores
reales que la variable aleatoria puede tomar.
Tipos de variable aleatoria
Una variable aleatoria es discreta si puede asumir un conjunto finito o infinito numerable de valores
diferentes.
Una variable aleatoria es continua si puede asumir cualquier valor en un intervalo.
Ejercicios
120. Indique el tipo de la variable aleatoria y su rango.
Variable aleatoria Tipo Rango

𝑋: = número de veces que un alumno lleva un
Discreta 𝑅? = {0, 1, 2, 3, 4}
curso en la UPC
𝑌: = cantidad de horas que dedica un alumno a es-
Continua 𝑅? = [0, 24]
tudiar un curso el día previo al examen
Variable aleatoria discreta
Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se denota
𝑃(𝑋 = 𝑥).
Por ejemplo: número de alumnos matriculados por curso, cantidad de preguntas correctamente con-
testadas en una evaluación de personal, cantidad de clientes que visitan un centro comercial en un día
determinado.
Distribución de probabilidad de una variable aleatoria discreta
La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que asigna a
todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:
Condición 1
𝑓(𝑥) ≥ 0
Condición 2
• 𝑓(𝑥) = 1
N+
Definimos la función de probabilidad 𝑓(𝑥) como:
𝑓(𝑥) = 𝑃(𝑋 = 𝑥)
Ejemplo 35
Calcule 𝑎 para que la siguiente función sea una función de probabilidad. Grafique 𝑓(𝑥).
𝑎𝑥 10, 15, 20, 25

𝑓(𝑥) = —
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Solución
La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que asigna a
todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:
Condición 1
𝑓(𝑥) ≥ 0
La primera condición se cumple cuando a es mayor que cero, puesto que x > 0.
Condición 2
• 𝑓(𝑥) = 1
N+
La segunda condición se cumple si:
𝑎10 + 𝑎15 + 𝑎20 + 𝑎25 = 1
𝑎70 = 1
1
𝑎=
70
0.40 0.357
0.35
0.286
0.30
0.25 0.214
f(x)
0.20
0.143
0.15
0.10
0.05
0.00
0 5 10 15 20 25 30
X
Ejemplo 36
Sea 𝑋 el número de lanzamientos de un dado hasta que salga el primer seis. Determine la función de
probabilidad de la variable 𝑋 y calcule 𝑃(𝑋 > 3).
Solución
Sea la variable aleatoria 𝑋: = número de lanzamientos de un dado hasta que salga el primer seis.
El rango o recorrido de 𝑋 es:

𝑅? = {1, 2, 3, … }
La función de probabilidad 𝑓(𝑥) se deduce:
1
𝑓(1) = 𝑃(𝑋 = 1) =
6
5 1
𝑓(2) = 𝑃(𝑋 = 2) = ×
6 6
5 $ 1
𝑓(3) = 𝑃(𝑋 = 3) = k l ×
6 6
Luego, la función de probabilidad de la variable X es:
5 DO# 1
𝑓(𝑥 ) = 𝑃(𝑋 = 𝑥) = k l × 𝑥 = 1, 2, 3, …
6 6
𝑃(𝑋 > 3)
Dado el rango infinito de 𝑋, para poder calcular la probabilidad usar la siguiente propiedad:
𝑃(𝑋 > 3) = 1 − 𝑃(𝑋 ≤ 3)
= 1 − (𝑓(1) + 𝑓(2) + 𝑓(3))
5 #O# 1 5 $O# 1 5 )O# 1

= 1 − šk l × +k l × +k l × ›
6 6 6 6 6 6
1 5 5 )O# 25
=1−š + +k l × › = 0,5787
6 36 6 216
Ejercicios
121. Sea Ω el espacio muestral obtenido al lanzar una moneda dos veces y observar si sale cara (c) o
sello (s) cada vez. Indique el espacio muestral de dicho experimento y determine la función de
probabilidad de la variable <número de caras obtenidas al lanzar dos monedas>.
El experimento aleatorio es lanzar una moneda dos veces
El espacio muestral es Ω = {(𝑠, 𝑠); (𝑠, 𝑐); (𝑐, 𝑠); (𝑐, 𝑐)}
Definamos la variable aleatoria
𝑋 ≔ número de caras obtenidas al lanzar dos monedas
El rango de 𝑋 es:
𝑅? = {0, 1, 2}
La función de probabilidad será:
1
𝑓(0) = 𝑃(𝑋 = 0) =
4
2
𝑓(1) = 𝑃(𝑋 = 1) =
4
1
𝑓(2) = 𝑃(𝑋 = 2) =
4
𝒙 0 1 2
𝒇(𝒙) 0,25 0,50 0,25
122. Se lanza un dado, sea la variable aleatoria 𝑋 igual al número de la cara superior del dado. Deter-
mine y grafique la función de probabilidad de la variable 𝑋.
Definamos la variable aleatoria

𝑋 ≔ número de la cara superior de un dado
𝑅? = {1, 2, 3, 4, 5, 6}
1
𝑓(1) = 𝑃(𝑋 = 1) =
6
1
𝑓(2) = 𝑃(𝑋 = 2) =
6
Y así sucesivamente.
𝒙 1 2 3 4 5 6
𝒇(𝒙) 1/6 1/6 1/6 1/6 1/6 1/6
1
𝑓(𝑥) = •6 𝑥 = 1, 2, 3, 4, 5, 6
123. En un lote de 30 polos hay tres defectuosos. Se toma una muestra aleatoria de cinco polos y se
define la variable aleatoria 𝑋 como el número de polos defectuosos en la muestra.
a. Determine y grafique la función de probabilidad de la variable 𝑋.
3 defectuosos 𝑋: = número de defectusos

27 no defectuosos en la muestra de tamaño 5
Definamos la variable.
𝑋: = número de defectusos en la muestra de tamaño 5

𝑅? = {0, 1, 2, 3}
𝐶,) × 𝐶H$G
𝑓(0) = 𝑃(𝑋 = 0) = = 0,56650
𝐶H),
𝐶#) × 𝐶-$G
𝑓(1) = 𝑃(𝑋 = 1) = = 0,36946
𝐶H),
𝐶$) × 𝐶)$G
𝑓(2) = 𝑃(𝑋 = 2) = = 0,06158
𝐶H),
𝐶)) × 𝐶$$G
𝑓(3) = 𝑃(𝑋 = 3) = = 0,00246
𝐶H),
𝒙 0 1 2 3
𝒇(𝒙) 0,56650 0,36946 0,06158 0,00246
$G
𝐶D) × 𝐶HOD
𝑓(𝑥) = ž 𝐶H), 𝑥 = 0, 1, 2, 3
b. Calcule la probabilidad de tener dos polos defectuosos en la muestra. Rpta: 0,06158
𝑃(𝑋 = 2) = 𝑓(2) = 0,06516
c. Calcule la probabilidad de tener al menos un polo defectuoso en la muestra.

Rpta: 0,43350

𝑃(𝑋 ≥ 1) = 𝑓(1) + 𝑓(2) + 𝑓(3) = 0,36946 + 0,06158 + 0,00246 = 0,43350
Tambien, se pudo escribir así:
𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 < 1) = 1 − 𝑓(0) = 1 − 0,56650 = 0,43350

Valor esperado de una variable aleatoria discreta
El valor esperado o esperanza matemática de una variable aleatoria 𝑋 o media de una función de pro-
babilidad de 𝑋 se denota 𝐸(𝑋).
𝜇? = 𝐸(𝑋) = • 𝑥𝑓(𝑥)
NP7QA ?
Valor esperado de una función de variable aleatoria discreta
Sea 𝐺(𝑋) una función de la variable aleatoria continua 𝑋. El valor esperado de 𝐺(𝑋):
𝜇R(?) = 𝐸(𝐺(𝑋)) = • 𝐺(𝑥)𝑓(𝑥)

NP7QA ?
Propiedades del valor esperado
• Si 𝑎 y 𝑏 son constantes, entonces:
𝐸(𝑎𝑋 + 𝑏) = 𝑎𝐸(𝑋) + 𝑏 = 𝑎 𝜇? + 𝑏
• Como casos particulares se tiene:
𝐸(𝑏) = 𝑏
𝐸(𝑋 + 𝑏) = 𝐸(𝑋) + 𝑏 = 𝜇? + 𝑏
𝐸(𝑎𝑋) = 𝑎 𝐸(𝑋) = 𝑎 𝜇?
• Si 𝑋 e 𝑌 son variables aleatorias, 𝑎 y 𝑏 son constantes, entonces:
𝐸(𝑎𝑋 + 𝑏𝑌) = 𝑎𝐸(𝑋) + 𝑏𝐸(𝑌)
𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)
𝐸(𝑋 – 𝑌) = 𝐸(𝑋) – 𝐸(𝑌)
• Si 𝑋 e 𝑌 son variables aleatorias independientes, 𝑎 y 𝑏 son constantes, entonces:
𝐸(𝑎 𝑋. 𝑏 𝑌) = 𝑎 𝑏 𝐸(𝑋) 𝐸(𝑌)

• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes, entonces:
𝐸(𝑋# . 𝑋$ . 𝑋) . . . 𝑋7 ) = 𝐸(𝑋# ). 𝐸(𝑋$ ). 𝐸(𝑋) ) . . . 𝐸(𝑋7 )
• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes y 𝑎# , 𝑎$ , 𝑎) , … , 𝑎7 son 𝑛 constantes,

entonces:
7 7
𝐸 ¡• 𝑎! 𝑋! ¢ = • 𝑎! 𝐸(𝑋! )
!6# !6#
• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias con la misma función de probabilidad, entonces se

cumple que 𝐸(𝑋! ) = µ, por lo tanto:
𝐸 ¡• 𝑋! ¢ = 𝑛𝜇
!6#
Varianza de una variable aleatoria discreta
La varianza 𝑉(𝑋) de una variable aleatoria discreta 𝑋 se calcula con:
𝑉(𝑋) = 𝐸(𝑋 $ ) − 𝐸(𝑋)$
La varianza de la variable aleatoria 𝑋 también se denota por 𝜎?$ o 𝜎 $ .
Desviación estándar de una variable aleatoria discreta
La desviación estándar de 𝑋 es la raíz cuadrada de la varianza de 𝑋.
Se denota por s? o 𝜎.
𝜎? = £𝜎?$
Varianza de una función de variable aleatoria discreta
$
𝜎R(?) = • (𝐺(𝑋) − 𝜇R(?) )$ 𝑓(𝑥)
NP7QA ?
Propiedades de la varianza
𝑉(𝑏) = 0
𝑉(𝑎𝑋) = 𝑎$ 𝑉(𝑋)
𝑉(𝑋 + 𝑏) = 𝑉(𝑋)
• Si 𝑋 e 𝑌 son dos variables aleatorias independientes, 𝑎 y 𝑏 son dos constantes, entonces:
𝑉(𝑎𝑋 + 𝑏𝑌) = 𝑎$ 𝑉(𝑋) + 𝑏$ 𝑉(𝑌)

entonces:
7 7
𝑉 ¡• 𝑎! 𝑋! ¢ = • 𝑎!$ 𝑉(𝑋! )
!6# !6#
• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes con la misma función de probabili-

dad, entonces se cumple que 𝑉(𝑋! ) = s$ y, por lo tanto:
𝑉 ¡• 𝑋! ¢ = 𝑛𝜎 $
!6#
Una de las medidas de variabilidad que podríamos usar es el coeficiente de variación, tal como lo usa-
mos en la unidad de medidas de resumen.
El coeficiente de variación se define de la siguiente manera:
𝜎? 𝜎?
𝐶𝑉 = × 100% = × 100%
𝐸(𝑋) 𝜇?
Ejemplo 37
Sea 𝑋 una variable aleatoria con la siguiente función de probabilidad. Calcular la varianza de 𝑋.
𝑎𝑥 1, 2, 3, 4, 5
𝑓(𝑥) = —
Solución
Lo primero es determinar 𝑎, planteamos que
• 𝑓(𝑥) = 1
D6#
𝑓(1) + 𝑓(2) + 𝑓(3) + 𝑓(4) + 𝑓(5) = 1
𝑎×1+𝑎×2+𝑎×3+𝑎×4+𝑎×5=1
15𝑎 = 1
1
𝑎=
15
Lo pedido es:
H
$)
𝐸(𝑋 = • 𝑥 $ 𝑓(𝑥)
D6#
1 2 3 4 5
= 1$ × + 2$ × + 3$ + 4$ + 5$ = 15
15 15 15 15 15
El esperado de 𝑋 es:
H
1 2 3 4 5
𝐸(𝑋) = • 𝑥 𝑓(𝑥) = 1 × +2× +3 +4 +5
15 15 15 15 15
D6#
55
𝐸(𝑋) =
15
Luego se tiene que:
$ 55 $
𝑉(𝑋) = 𝐸(𝑋 $ ) − N𝐸(𝑋)O = 15 − k l = 1,556
15
Ejemplo 38
Caso Metropolitano
Se define la variable aleatoria 𝑋 definida como el número de recargas de la tarjeta de los usuarios del
Metropolitano a la semana con la siguiente función de probabilidad.
𝑿 ≔ número de recargas 0 1 2 3 4
𝒇(𝒙) 0,10 4𝑘 0,30 𝑘 0,10
a. Si un usuario recargó por lo menos una vez su tarjeta en una semana, calcule la probabilidad de
que dicho usuario recargue su tarjeta por lo menos dos veces en esa semana.
b. Si el costo de una recarga es de cinco soles y el Metropolitano tiene 560 mil usuarios, determine
el monto esperado semanal por recargas.
Solución
a. Si un usuario recargó por lo menos una vez su tarjeta en una semana, calcule la probabilidad de
que dicho usuario recargue su tarjeta por lo menos dos veces en esa semana.
Solución
Para que 𝑓(𝑥) sea una función de probabilidad debe cumplir que:
• 𝑓(𝑥) = 1
,
Determinemos el valor de 𝑘 para que 𝑓(𝑥) sea función de probabilidad. Por lo tanto:
𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3) + 𝑓(4) = 1
0,10 + 4𝑘 + 0,30 + 𝑘 + 0,10 = 1
𝑘 = 0,1
La función de probabilidad es:
𝑿: = número de recargas 0 1 2 3 4
𝒇(𝒙) 0,10 0,40 0,30 0,10 0,10
𝑃N(𝑋 ≥ 2) ∩ (𝑋 ≥ 1)O 𝑃(𝑋 ≥ 2)

𝑃(𝑋 ≥ 2⁄𝑋 ≥ 1) = =
𝑃(𝑋 ≥ 1) 𝑃(𝑋 ≥ 1)
𝑓(2) + 𝑓(3) + 𝑓(4)
=
𝑓 (1) + 𝑓(2) + 𝑓 (3) + 𝑓(4)
0,30 + 0,10 + 0,10 0,5

= = = 0,5556
0,40 + 0,30 + 0,10 + 0,10 0,9
b. Si el costo de una recarga es de cinco soles y el Metropolitano tiene 560 mil usuarios, determine
el monto esperado semanal por recargas.
Solución
Como cada persona paga cinco soles y son 560 mil usuarios, luego el monto semanal por recargas
𝑀(𝑋) es:
𝑀(𝑋) = 5 × 560000 𝑋
Luego, el monto esperado semanal por recargas es:
𝐸N𝑀(𝑋)O = 𝐸(5 × 560000 𝑋) = 2 800 000 𝐸(𝑋)
El valor esperado de 𝑋 es:

-
𝐸(𝑋) = • 𝑥𝑓(𝑥)
D6,
= 0 × 𝑓(0) + 1 × 𝑓(1) + 2 × 𝑓(2) + 3 × 𝑓(3) + 4 × 𝑓(4)
= 0 × 0,10 + 1 × 0,40 + 2 × 0,30 + 3 × 0,10 + 4 × 0,10 = 1,7
El esperado del monto semanal por recargas será:
𝐸N𝑀(𝑋)O = 2 800 000 𝐸(𝑋) = 2 800 000 × 1,7 = 4 760 000
Luego, el monto esperado semanal por recargas es 4 760 000 soles.

Ejercicio
124. La demanda diaria de un producto es una variable aleatoria 𝑋 cuya distribución de probabilidades
es simétrica y está dada por la tabla siguiente:
𝒙 1 2 3 4 5
𝒇(𝒙) 𝑎 0,20 𝑏 𝑐 0,05
La empresa obtiene por cada unidad demandada de producto 100 soles de utilidad. Si la cantidad
demanda en un día es mayor a dos unidades, se obtiene una utilidad adicional de 15 soles por
unidad demandada de producto.
a. Calcule el valor de 𝑎, 𝑏 y 𝑐. Rpta: 0,05; 0,50 y 0,20

b. Determine la probabilidad que la demanda diaria sea de por lo menos tres productos.
Rpta: 0,75
c. Calcule el valor esperado de la utilidad por la demanda diaria de productos.
Rpta: 330,75 soles
125. El número de personas que no se presentan a un vuelo se modela con una variable aleatoria 𝑋 con
la siguiente función de probabilidad.
𝒙 0 1 2 3 4 5 6
𝒇(𝒙) 0,20 0,25 0,22 0,15 0,10 0,05 𝑎
Si la media es mayor a dos, se comenzará a mandar un correo electrónico a los pasajeros recor-
dándoles el viaje. Indique la acción a tomar.
Interpretación
Determinar si se comenzará a mandar un correo electrónico a los pasajeros recordándoles el viaje.
Representación
Definamos la variable aleatoria.
𝑋 ≔ número de personas que no se presentan a un vuelo
𝑅? = {0, 1, 2, 3, 4, 5, 6}
Determinemos el valor de 𝑎.
La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que
asigna a todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:
Condición 1
𝑓(6) = 𝑎 ≥ 0
Condición 2
• 𝑓(𝑥) = 1
N+
𝑓(0) + 𝑓(1) + ⋯ + 𝑓(6) = 1
0,20 + 0,25 + 0,22 + 0,15 + 0,10 + 0,05 + 𝑎 = 1
𝑎 = 0,03
𝒙 0 1 2 3 4 5 6
𝒇(𝒙) 0,20 0,25 0,22 0,15 0,10 0,05 0,03
Vamos a calcular la media de 𝑋.
Cálculo
Calculemos la media de 𝑋.
𝜇 = 𝐸(𝑋) = • 𝑥 𝑓(𝑥)
N+
𝜇 = 0 𝑓(0) + 1 𝑓(1) + 2𝑓(2) + ⋯ + 6 𝑓(6)
𝜇 = 0 × 0,22 + 1 × 0,25 + 2 × 0,22 + 3 × 0,15 + 4 × 0,10 + 5 × 0,05 + 6 × 0,03 = 1,97
𝜇 = 𝐸(𝑋) = 1,97 personas
La media del número de personas que no se presentan a un vuelo es 1,97, que es menor a 2. Por
lo tanto, no se comenzará a mandar un correo electrónico a los pasajeros recordándoles el viaje.
126. En una bodega, la demanda mensual del jugo en frasco se modela con la siguiente variable alea-
toria 𝑋 con la siguiente función de probabilidad.
𝑿: = número de frascos demandados 80 90 100 120 130 140

𝒇(𝒙) 0,15 0,25 0,35 0,10 0,10 0,05
Cada frasco cuesta tres soles y se vende cinco soles. Si la ganancia esperada mensual por este
concepto es mayor 200 soles entonces se dará unos frascos de promoción a las bodegas. Indique
lo que se hará.
127. El número de ensaladas demandadas al día en un restaurante se modela con una variable aleato-
ria 𝑋 que tiene la siguiente distribución de probabilidad.
𝒙 10 15 17 18 20 25
𝒇(𝒙) 𝑎 0,12 0,35 2𝑎 0,14 0,09
El costo de cada ensalada es de seis soles y las vende a diez soles. Toda ensalada no vendida en el
día se desecha. Calcule la media y desviación estándar de la utilidad diaria, si el restaurante prepara
20 ensaladas por día. Rpta: 49,5; 27,654
128. Se lanzan dos dados y sea la variable aleatoria 𝑋 igual a la suma de los números de las caras su-
periores. Calcule la media y la varianza de la variable 𝑋. Rpta: 7; 5,83333
Definamos una variable aleatoria.
𝑋 ≔ suma de los números de las caras superiores
El rango de X es:
𝑅? = {2, 3, … ,12}
La función de probabilidad de 𝑋 es:
# $ )
𝑓(2) = 𝑃(𝑋 = 2) = 𝑓(3) = 𝑃(𝑋 = 3) = 𝑓(4) = 𝑃(𝑋 = 4) =
)F )F )F
- H F
𝑓(5) = 𝑃(𝑋 = 5) = )F 𝑓(6) = 𝑃(𝑋 = 6) = )F 𝑓(7) = 𝑃(𝑋 = 7) = )F
H - )
𝑓(8) = 𝑃(𝑋 = 8) = )F 𝑓(9) = 𝑃(𝑋 = 9) = )F 𝑓(10) = 𝑃(𝑋 = 10) = )F
$ #
𝑓(11) = 𝑃(𝑋 = 11) = )F 𝑓(12) = 𝑃(𝑋 = 12) = )F
𝒙 2 3 4 5 6 7 8 9 10 11 12
𝒇(𝒙) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
𝑥−1
⎧ 𝑥 = 2, 3, 4, 5, 6, 7
⎪ 36
𝑓(𝑥) = 13 − 𝑥
⎨ 𝑥 = 8, 9, 10, 11, 12
⎪ 36
⎩ 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
La media de X es:
𝜇 = 𝐸(𝑋) = • 𝑥 𝑓(𝑥)
N+
𝜇 = 2 𝑓(2) + 3 𝑓(3) + 4𝑓(4) + ⋯ + 12 𝑓(12)
1 2 3 1
𝜇 =2× + 3 × +4× + ⋯ + 12 × =7
36 36 36 36
El valor esperado de 𝑋 $ es:
𝐸(𝑋 $ ) = • 𝑥 $ 𝑓(𝑥)
N+
1 2 3 4 5 6 5 1
𝐸(𝑋 $ ) = 2$ × + 3$ × + 4$ × + 5$ × + 6$ × + 7$ × + 8$ × + ⋯ + 12$ ×
36 36 36 36 36 36 36 36
𝐸(𝑋 $ ) = 54,8333
La varianza 𝑉(𝑋) de una variable aleatoria discreta 𝑋 se calcula con:
𝑉(𝑋) = 𝐸(𝑋 $ ) − 𝐸(𝑋)$
𝑉(𝑋) = 54,8333 − 7$ = 5,8333
129. Un examen consta de 100 preguntas. Cada pregunta tiene cinco opciones para marcar y solo una
respuesta correcta Por cada respuesta correcta se le otorga al postulante un punto, mientras que
si la respuesta es incorrecta al postulante se le resta un cuarto de punto. Si un postulante contesta
todas las preguntas del examen al azar, calcule el valor esperado del puntaje obtenido.
Rpta: 37,5 puntos
Distribuciones de probabilidad de variable discreta

Distribución binomial
Un experimento binomial consiste en una serie de 𝑛 pruebas o ensayos, donde 𝑛 se fija antes de rea-
lizar el experimento.
• Las pruebas son idénticas y cada una de ellas puede resultar en uno de dos posibles resultados que
denotan éxito o fracaso.
• Las pruebas son independientes entre sí por lo que el resultado de un intento en particular no
influye en el resultado de cualquier otro.
• La probabilidad de éxito es constante de una prueba a otra y la denotamos como 𝑝.
Entonces para 𝑛 intentos y la probabilidad 𝑝 de éxito en cualquier intento, la probabilidad de tener 𝑥

éxitos en los 𝑛 intentos está dada por:
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶D7 𝑝 D (1 − 𝑝)7OD 𝑥 = 0,1,2, ⋯ , 𝑛
La variable binomial cuenta el número de éxitos en 𝑛 repeticiones semejantes e independientes con

probabilidad de éxito constante.
La variable aleatoria X sigue una distribución binomial con parámetros 𝑛 y 𝑝, se denota:
𝑋~𝐵(𝑛, 𝑝)
Ejemplo 39
4
𝑋~𝐵 k𝑛 = 5, 𝑝 = l
7
Media
µ = 𝐸(𝑋) = 𝑛𝑝
Varianza
s$ = 𝑉(𝑋) = 𝑛𝑝(1 − 𝑝)
Para el cálculo de probabilidades de una distribución binomial en Excel se usa la función:

=DISTR.BINOM.N(x; n = número de repeticiones; p = probabilidad de éxito; acumulado = 1)
Ejemplo 40
En el proceso de control de calidad se analiza 60 envases de los productos de Expórtame. Por investi-
gaciones anteriores se sabe que la probabilidad de que un envase esté en mal estado es de 0,01.
Se rechazarán los 60 productos si la probabilidad de seleccionar más de dos envases en mal estado es
mayor al 3%, ¿qué decisión se debe tomar?
Solución
Interpretación
Determinar si se rechazará los 60 productos.
Representación
Definamos la variable necesaria para resolver el problema:
𝑋: = número de envases en mal estado.
La variable 𝑋 se tiene una distribución binomial con parámetros:
𝑛: = número de ensayos = 60
𝑝: = probabilidad de éxito = 0,01
El rango de 𝑋 es 0, 1, 2,…, 60.
Entonces:
𝑋~ 𝐵(𝑛 = 60; 𝑝 = 0,01)
Cálculo
𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − (𝑓(0) + 𝑓(1) + 𝑓(2))
= 1 − 𝐶,F, 0,01, 0,99F, + 𝐶#F, 0,01# 0,99HI +𝐶$F, 0,01$ 0,99H<

𝑃(𝑋 > 2) = 0,0224
La probabilidad de seleccionar más de dos envases en mal estado es 0,0224. Como la probabilidad
pedida es menor al 3% (0,0224 < 0,03), entonces los 60 productos no serán rechazados.
Ejemplo 41
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 1% de las usuarias y el 0,8% de
los usuarios hombres han sufrido de algún tipo de robo durante el uso del Metropolitano. Si el sistema
tiene 560 mil usuarios, calcule el número esperado de usuarios que han sido víctimas de robo durante
el uso del Metropolitano.
Solución
Sean los eventos:
𝑅: = Que el usuario sea víctima de robo
𝐻: = Que el usuario sea hombre
𝑀: = Que el usuario sea mujer
Usaremos la distribución binomial y el teorema de la probabilidad total.
Usando el teorema de la probabilidad total tenemos que:

𝑃(𝑅⁄𝐻 ) = 0,008
𝑃(𝐻) = 0,55
𝑃(𝑅K ⁄𝐻) = 0,992
𝑃(𝑅⁄𝑀) = 0,01
𝑃(𝑀) = 0,45
𝑃(𝑅K ⁄𝑀) = 0,99
𝑃(𝑅) = 𝑃(𝐻) 𝑃(𝑅⁄𝐻) + 𝑃(𝑀) 𝑃(𝑅 ⁄𝑀)
𝑃(𝑅) = 0,55 × 0,008 + 0,45 × 0,01 = 0,0044 + 0,0045 = 0,0089
Sea la variable aleatoria 𝑌: = número de usuarios que han sido víctima de robo
𝑌~𝐵(𝑛 = 560 000; 𝑝 = 0,0089)
𝐸(𝑌) = 𝑛𝑝 = 560000 × 0,0089
El número esperado de usuarios que han sido víctima de robo es 4984 usuarios.
Ejemplo 42
Se sabe que el 12% de los usuarios del Metropolitano realizan conexiones de rutas. Si elegimos al azar
80 usuarios.
a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexiones.
b. Sea la variable Y definida como el número de usuarios que realizan conexiones de los 560mil usua-
rios. Calcule el valor esperado y varianza de Y.
Solución
a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexiones.
Solución
Sea 𝑋 ∶= cantidad de usuarios del Metropolitano que realizan conexiones de rutas en la muestra
𝑋~𝐵(𝑛 = 80; 𝑝 = 0,12)
El rango de 𝑋 es 𝑅? = {0,1, … ,80}
𝑃(8 ≤ 𝑋 ≤ 9) = 𝑓(8) + 𝑓(9) = 0,2623
En Excel, se usa la función =DISTR.BINOM.N(8;80;0.12;0)+DISTR.BINOM.N(9;80;0.12;0)
b. Sea la variable 𝑌 definida como el número de usuarios que realizan conexiones de los 560 mil usua-
rios. Calcule el valor esperado y varianza de 𝑌.
Solución
Sea 𝑌: = número de usuarios que realizan conexiones de los 560 mil usuarios
𝑌~𝐵(𝑛 = 560000; 𝑝 = 0,12)
El valor esperado y varianza de 𝑌 es:
𝐸(𝑌) = 𝑛𝑝 = 560 000 × 0,12 = 67000
𝑉(𝑌) = 𝑛𝑝(1 − 𝑝) = 560 000 × 0,12 × (1 − 0,12) = 59136

Ejercicios
130. Según el analista Rodrigo Parra, en el Perú, el 26 de marzo del 2022, el porcentaje de positividad
de pruebas moleculares fue de 1,0%, es decir, el 1,0% de las pruebas moleculares de detección
del COVID 19 hechas ese día dieron un resultado positivo. Asuma independencia entre las prue-
bas.
a. Si a un grupo de 100 peruanos se les realiza pruebas moleculares ese día, calcule la probabili-
dad de que tres den un resultado positivo a la prueba del COVID 19.
b. Si a un grupo de 120 peruanos se realiza pruebas moleculares ese día, calcule la probabilidad
de que haya al menos dos den positivo a la prueba del COVID 19.
c. Si en un grupo de 140 peruanos se realiza pruebas moleculares ese día, calcule la probabilidad
de que haya entre dos y cinco (incluyendo dos y cinco) den positivo a la prueba del COVID 19.
d. Si a 50000 peruanos se realizan pruebas moleculares ese día, calcule el valor esperado del
número de peruanos que den positivo a la prueba del COVID 19.
131. Una compañía de comida rápida sabe que el 90% de sus tiendas por franquicia tendrán éxito co-
mercial. Si el éxito de cada tienda se puede considerar independiente de las demás tiendas. Cal-
cule la probabilidad de que al menos dieciocho tiendas tengan éxito, si la compañía va a instalar
20 tiendas en el presente año. Rpta: 0, 6769
132. Según la Asociación para el Fomento de la Infraestructura Nacional el 48% de los hogares de Lima
no tienen acceso a agua potable de calidad, por no contar con la dosificación adecuada de cloro
o comprarla de manera informal a los camiones cisternas. Si se eligen al azar a diez hogares de
Lima, calcule la probabilidad de que cinco de ellos no tengan acceso agua potable de calidad.
Rpta: 0,2441
Distribución hipergeométrica
Consideremos 𝑁 elementos, de los cuales 𝑟 son considerados éxitos y, por lo tanto, 𝑁 − 𝑟 como fra-
casos. Como en el caso de la distribución binomial estamos interesados en saber la probabilidad de
obtener 𝑥 éxitos en una muestra de 𝑛 elementos.
El experimento hipergeométrico consiste en extraer al azar y sin sustitución 𝑛 elementos de un con-

junto de 𝑁 elementos, 𝑟 de los cuales son éxitos y 𝑁 − 𝑟 son fracasos.
La probabilidad de obtener de 𝑥 éxitos en la muestra de 𝑛 elementos es:
𝐶DU 𝐶7OD
5OU
𝑓(𝑥) = 𝑥 = 𝑚á𝑥{0, 𝑛 − (𝑁 − 𝑟)}, … , 𝑚í𝑛{𝑛, 𝑟}
𝐶75
El rango de 𝑋 en la mayoría de los casos va de 0 a 𝑛, pero no siempre, por lo que se debe analizar en
cada caso.
La variable hipergeométrica cuenta el número de éxitos en una muestra de tamaño 𝑛, tomada de una
vez de una población de tamaño 𝑁 donde hay 𝑟 éxitos.
Se dice que la variable aleatoria 𝑋 sigue una distribución hipergeométrica con parámetros 𝑛, 𝑟 y 𝑁 y
se denota:
𝑋~𝐻(𝑛, 𝑟, 𝑁)
Media
𝑟
𝜇 = 𝐸(𝑋) = 𝑛
𝑁
Varianza
𝑟 𝑟 𝑁−𝑛
𝜎$ = 𝑛 «1 − ¬ k l
𝑁 𝑁 𝑁−1
Para el cálculo de probabilidades de una distribución hipergeométrica en Excel se usa la función:

=DISTR.HIPERGEOM.N(x; n = tamaño de muestra; r = número de éxitos en población; N = tamaño de
la población; acumulado = 0)
Ejemplo 43
Luego de embalar un contenedor de envases de productos de Expórtame, se tienen 60 envases, de los
cuales 25 son frascos. Si selecciona una muestra aleatoria de 20 envases para el control de calidad.
a. Calcule la probabilidad de que ocho envases sean de frasco.

b. Calcule la variabilidad relativa de 𝑋 respecto a la media.
Solución
a. Calcule la probabilidad de que ocho envases sean de frasco.
Representación
Definamos la variable 𝑋: = número de envases de frasco seleccionados.
La variable 𝑋 se tiene una distribución hipergeométrica con parámetros:

𝑁 = 60 tamaño de la población
𝑟 = 25 número de éxitos en la población
𝑛 = 20 tamaño de la muestra.
El rango de 𝑋, es decir todos los valores que puede tomar la variable, es igual 0, 1, 2,…, 20.
Entonces,
𝑋~𝐻(𝑁 = 60; 𝑟 = 25; 𝑛 = 20)
𝑅? = {0, 1, … ,20}
Cálculo
𝐶<$H × 𝐶#$
)H
𝑃(𝑋 = 8) = F, = 0,2153
𝐶$,
b. Calcule la variabilidad relativa de X respecto a la media.
Solución
Lo que nos piden es calcular el coeficiente de variación de 𝑋.
Primero, hallemos el esperado y la varianza de 𝑋.
𝑟 25
𝜇 = 𝐸(𝑋) = 𝑛 = 20 = 8,333
𝑁 60
𝑟 𝑟 𝑁−𝑛
𝑉(𝑋) = 𝑛 «1 − ¬ k l
𝑁 𝑁 𝑁−1
25 25 60 − 25
= 20 k1 − l k l = 2,8337
60 60 60 − 1
El coeficiente de variación de 𝑋 es:
-𝑉(𝑋)
𝐶𝑉(𝑋) = × 100%
𝐸 (𝑋 )
√2,8337
= × 100% = 21,79%
8,3333
Ejemplo 44
La actriz Magaly Solier es la décima séptima mujer en denunciar una agresión sexual en un bus del
Metropolitano, desde noviembre del 2012. De las 17 denuncias, solo una está cerca de recibir senten-
cia. El agresor podría recibir de dos a cuatro años de prisión suspendida, cumplir trabajos comunitarios
o pagar reparación civil. Si se eligen al azar tres de las denuncias de las 17 existentes. Calcule la proba-
bilidad de elegir el caso que está cerca de recibir sentencia.
Solución
Sea X:= número de casos que están cerca de recibir sentencia
𝑋~𝐻(𝑁 = 17; 𝑛 = 3; 𝑟 = 1)
𝑅? = {0, 1}
𝑃(𝑋 = 1) = 𝑓(1) = 0,1765

Ejercicios
133. En un vuelo se van a servir 150 comidas. La oficina de control de calidad de los alimentos durante
el vuelo selecciona al azar cinco de ellas para verificar que en perfecto estado. Dentro de las 150
comidas, hay cuatro que no están en perfecto estado. Si se encuentra al menos una comida que
no esté en perfecto estado; se cambiará de proveedor. Calcule la probabilidad de que se cambie
de proveedor.
134. Un grupo de 25 amigos van a una discoteca, pero tres de ellos no tienen la edad permitida para
ingresar. Si la persona encargada en la puerta pedirá cuatro identificaciones al azar. Si a alguno
de los menores de edad se le pide la identificación, nadie en el grupo entrará a la discoteca. Cal-
cule la probabilidad de que todos entren a la discoteca. Rpta: 0,5783
135. La empresa San Fernando ha lanzado su campaña “Plato calato no”. Si de un total de 60 personas,
donde 34 recuerdan la campaña, se eligen al azar a ocho personas para entrevistarlos, calcule la
probabilidad de elegir al menos a tres personas que recuerden la campaña.
Rpta: 0,9402
136. En una distribuidora hay 25 televisores de los cuales seis son de tecnología OLED. Si se seleccionan
al azar diez televisores, calcule la probabilidad de que se haya seleccionado por lo menos dos
televisores de tecnología OLED. Rpta: 0,8022
137. Un comerciante recibe un lote de 30 computadoras portátiles. Para protegerse de una mala re-
mesa, el comerciante revisará diez computadoras y rechazará todo el lote si encuentra una o más
computadoras defectuosas. Si en el lote hay tres computadoras defectuosas, ¿cuál es la probabi-
lidad de que rechace el lote? Rpta: 0,7192
Distribución de Poisson
El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina
proceso de Poisson y posee las siguientes propiedades:
• El número de resultados que ocurre en un intervalo o región de espacio cualquiera es indepen-

diente del número que ocurre en cualquier otro intervalo o región del espacio disjunto.
• La probabilidad de que ocurra un solo resultado durante el intervalo muy corto o región muy pe-
queña es proporcional a la longitud del intervalo al tamaño de la región y no depende del número
de resultados que ocurren fuera del intervalo o región.
• La probabilidad de que ocurra más de un resultado en tal intervalo corto o caiga en tal región
pequeña es insignificante.
La probabilidad de tener 𝑥 resultados en un intervalo dado o en una región específica es:
𝑒 OV 𝜆D
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, …
𝑥!
x = número de éxitos por unidad de tiempo o región.

l = número esperado de éxitos por unidad de tiempo o región.
e = 2,71828…
Se dice que la variable aleatoria 𝑋 sigue una distribución de Poisson con parámetro l y se denota
𝑋~𝑃(l)
Media
µ = 𝐸(𝑋) = l
Varianza
s$ = 𝑉(𝑋) = l
Para el cálculo de probabilidades de una distribución Poisson en Excel se usa la función:

=POISSON.DIST(x; media = lambda; acumulado = 0)
Ejemplo 45
Suponga que el número de llamadas que llegan a una central telefónica es 0,5 por minuto en promedio.
a. Calcule la probabilidad de que en un minuto no lleguen llamadas.

b. Calcule la probabilidad de que en un minuto lleguen más de tres llamadas.
c. Calcule la probabilidad de que en tres minutos lleguen menos de cinco llamadas.
d. Calcule la probabilidad de que en cinco minutos lleguen más de dos llamadas.
Solución
a. Calcule la probabilidad de que en un minuto no lleguen llamadas.
Solución
Definamos la variable necesaria:
𝑋: = número de llamadas en un minuto
l = 0,5 llamadas por minuto
𝑋~𝑃(𝜆 = 0,5)
𝑒 O,,H 0,5,
𝑃(𝑋 = 0) = 𝑓(0) = = 0,6065
0!
En Excel, se usa la función =POISSON.DIST(0;0.5;0) = 0,6065
b. Calcule la probabilidad de que en un minuto lleguen más de tres llamadas.
Solución
𝑃(𝑋 > 3) = 1 − 𝑃(𝑋 ≤ 3) = 1 − (𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3))
𝑒 O,,H 0,5, 𝑒 O,,H 0,5# 𝑒 O,,H 0,5$ 𝑒 O,,H 0,5)

= 1−š + + + ›
0! 1! 2! 3!
= 1 − (0,6065 + 0,3033 + 0,0758 + 0,0126) = 1 − 0,9982 = 0,0018
En Excel, se usa la función =1-POISSON.DIST(3;0.5;1) = 0,0018

c. Calcule la probabilidad de que en tres minutos lleguen menos de cinco llamadas.
Solución
Definamos una nueva variable, pues ha cambiado la unidad de tiempo.
𝑌: = número de llamadas en tres minutos
𝑌~𝑃(𝜆 =? )
Calculemos el valor de lambda 𝜆, usando una regla de tres simple:
1 𝑚𝑖𝑛𝑢𝑡𝑜 0,5
3 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝜆
De donde:
l = 1,5 llamadas
𝑌~𝑃(𝜆 = 1,5)
𝑃(𝑌 < 5) = 𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3) + 𝑓(4)
𝑒 O#,H 1,5, 𝑒 O#,H 1,5# 𝑒 O#,H 1,5$ 𝑒 O#,H 1,5) 𝑒 O#,H 1,5-
= + + + +
0! 1! 2! 3! 4!
= 0,2231 + 0,3347 + 0,2510 + 0,1255 + 0,0471 = 0,98142
En Excel, se usa la función =POISSON.DIST(4;1.5;1) = 0,98142
d. Calcule la probabilidad de que en cinco minutos lleguen más de dos llamadas.
Solución
Definamos una nueva variable, pues ha cambiado la unidad de tiempo.
𝑊: = número de llamadas en cinco minutos
𝑊~𝑃(𝜆 =? )
1 𝑚𝑖𝑛𝑢𝑡𝑜 0,5
De donde:
l = 2,5 llamadas
𝑊~𝑃(𝜆 = 2,5)
𝑃(𝑊 > 2) = 1 − 𝑃(𝑊 ≤ 2)
= 1 − (𝑓(0) + 𝑓(1) + 𝑓(2))
𝑒 O$,H 2,5, 𝑒 O$,H 2,5# 𝑒 O$,H 2,5$

=1−š + + ›
0! 1! 2!
= 1 − (0,0821 + 0,2052 + 0,2565) = 0,45652
En Excel, se usa la función =1-POISSON.DIST(2;2.5;1) = 0,45652
Ejemplo 46
El administrador de un almacén ha observado que, en promedio, ingresan al establecimiento 20 per-
sonas cada 30 minutos. ¿Cuál es la probabilidad de que en seis minutos ingresen al almacén a lo más
cinco clientes pero más de tres?
Solución
Definamos la variable adecuada:

𝑋: = número de personas que entren al establecimiento en un periodo de seis minutos.
𝑋~𝑃(𝜆 =? )
30 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 20
De donde:
l=4
𝑋~𝑃(𝜆 = 4)
𝑃(3 < 𝑋 ≤ 5) = 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5)
= 𝑓(4) + 𝑓(5)
𝑒 O- 4- 𝑒 O- 4H
= + = 0,3517
4! 5!
En Excel, se usa la función =POISSON.DIST(5;4;1)-POISSON.DIST(3;4;1) = 0,3517
Ejemplo 47
Si se sabe que en cada 100 metros de longitud de un cable hay un promedio de 80 puntos por los cuales
este puede ser seccionado. ¿Cuál es la probabilidad de que en un tramo de 13,5 metros se encuentren
cinco puntos de seccionamiento?
Solución
𝑋: = número de puntos de seccionamiento
Como nos dicen que la variable cuenta puntos por unidad de longitud, se tiene que:
𝑋~𝑃(l)
100 𝑚𝑒𝑡𝑟𝑜𝑠 80 𝑝𝑢𝑛𝑡𝑜𝑠

13,5 𝑚𝑒𝑡𝑟𝑜𝑠 𝜆
De donde:
𝑋~𝑃(𝜆 = 10,8)
𝑒 O#,,< 10,8OH
𝑃(𝑋 = 5) = 𝑓(5) = = 0,025
5!
En Excel, se usa la función =POISSON.DIST(5;10.8;0).
Observe que si lambda l sale un valor que no es entero, no se debe redondear a un entero.
Ejemplo 48
El número de unidades envasados por una persona se modela con una variable Poisson con un prome-
dio 10 unidades por cada 20 minutos.
a. ¿Cuál es la probabilidad de que en 20 minutos se envasen 12 productos?

b. Si la máquina funciona durante dos horas consecutivas, calcule la probabilidad de que se hayan
envasado 50 productos.
Solución
a. ¿Cuál es la probabilidad de que en 20 minutos se envasen 12 productos?
Solución
𝑋: = número de productos que se envasan en 20 minutos
𝑋~𝑃(𝜆 = 10)
𝑒 O#, 10O#$
𝑃(𝑋 = 12) = 𝑓(12) = = 0,095
12!
En Excel, se usa la función =POISSON.DIST(12;10;0)
b. Si la máquina funciona durante dos horas consecutivas, calcule la probabilidad de que se hayan
envasado 50 productos.
Solución
𝑌: = número de personas que entren al establecimiento en un periodo de dos horas
𝑌~𝑃(𝜆 =? )
20 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 10
De donde:
𝑌~𝑃(𝜆 = 60)
𝑒 OF, 60OH,
𝑃(𝑌 = 50) = 𝑓(50) = = 0,0233
50!
En Excel, se usa la función =POISSON.DIST(60;50;0)

Ejemplo 49
El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia, queja o re-
clamo. El número de correos electrónicos que llegan a la cuenta de correo se modela como una varia-
ble aleatoria Poisson con una media de ocho correos por día. Calcule la probabilidad que en medio día
llegue más de tres correos con consultas, sugerencias, quejas o reclamos. Si esta probabilidad es mayor
a 0,8 se destinará a una persona para que conteste los correos diariamente.
Solución
Interpretación
Determinar si la probabilidad de que lleguen más de tres correos es mayor a 0,8.
Representación
Sea
𝑋: = número de correos electrónicos llegados a la cuenta de correo del Metropolitano en medio día.
8 𝑐𝑜𝑟𝑟𝑒𝑜𝑠
l = × 0,5 = 4
1 𝑑í𝑎
Luego:
𝑋~𝑃(l = 4)
Cálculo
𝑃(𝑋 > 3) = 1 − 𝑃(𝑋 ≤ 3)
)
𝑒 O- 4D
=1−•
𝑥!
D6,
= 1– (0,0183 + 0,0733 + 0,1465 + 0,1954) = 1– 0,4335 = 0,5665
En Excel, se usa la función =1-POISSON.DIST(3;4;1) = 0,5665.
La probabilidad de que lleguen más de tres correros es 0,5665 que es menor a 0,8. Como no es mayor
a 0,8 no se destinará a una persona para que conteste los correos diariamente.
Ejercicios
138. El número de llamadas hacia una azafata por los pasajeros durante un vuelo se modela con una
variable Poisson con una media de 0,25 llamadas cada diez minutos.
a. Calcule la probabilidad de que una azafata no reciba ninguna llamada en un viaje de 50 minu-
tos.
b. Calcule la probabilidad de que una azafata reciba más de una llamada en un viaje de 800 mi-
nutos.
c. Si una azafata ya recibió una llamada durante los primeros minutos del viaje, calcule la proba-
bilidad de que reciba dos llamadas más durante dicho viaje de 60 minutos.
139. En una pastelería, el número demandado de un cierto tipo de torta se modela con una variable
Poisson con una media de tres tortas al día. La pastelería, siempre, produce tres tortas diarias.
Cada torta cuesta producirla 50 soles y se vende a 80 soles. Toda torta no vendida en el día se
remata en 20 soles y siempre las compran todas las tortas a ese precio. Calcule el valor esperado
de la utilidad por dicho concepto. Rpta: 49,67 soles
Variable aleatoria continua
Es una variable cuyo rango es un conjunto infinito no numerable de valores.
Por ejemplo: peso, en kilos, de una persona, tiempo en resolver la primera pregunta del examen parcial
de un curso o volumen, en decibeles, en una discoteca a una hora determinada.
Función de densidad de una variable aleatoria continua
Se denomina función densidad de probabilidad 𝑓(𝑥) de una variable aleatoria continua a la función
que satisface:
Condición 1
𝑓(𝑥) ≥ 0 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑥 ∈ 𝑅
Condición 2
;X
³ 𝑓(𝑥)𝑑𝑥 = 1
OX
Se cumple que:
Y
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ³ 𝑓(𝑥)𝑑𝑥
P
!(#)
!(# ≤ % ≤ &)
% &
Para variables continuas se cumple:
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)

Ejemplo 50
Para cierto negocio por correo electrónico la proporción de los pedidos procesados en 24 horas tiene
la función de densidad de probabilidad.
𝑓(𝑥) = —2(1 − 𝑥)
0≤𝑥≤1
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Compruebe si f(x) es una función de densidad.
Solución
Se debe comprobar dos condiciones
Primera condición: 𝑓(𝑥) ≥ 0 para todo x Î R.
Esta se cumple pues para 0 ≤ 𝑥 ≤ 1 es:
𝑓(𝑥) = 2(1 − 𝑥) ≥ 0
;X
Segunda condición: ∫OX 𝑓(𝑥)𝑑𝑥 = 1
Existen varias formas de comprobar la segunda condición.
Primera forma
Integrando la función de densidad 𝑓(𝑥) y verificando que el área es igual a 1 y que cada 𝑓(𝑥) sea
positivo.
# # #
𝑥$
³ 𝑓(𝑥)𝑑𝑥 = ³ 2(1 − 𝑥)𝑑𝑥 = š2𝑥 − 2 ›µ = (2𝑥 − 𝑥 $ )|#,
2 ,
, ,
Ahora debemos evaluar en 0 y en 1.
= (2 × 1– 1$ ) − (2 × 1– 0$ ) = 1
Segunda forma
Calculando el área del triángulo a partir de la gráfica y verificando que el área es igual a 1 y que
cada f(x) sea positivo.
𝑏×ℎ 1×2
Á𝑟𝑒𝑎 = = =1
2 2
Tercera forma
Integrando la función de densidad 𝑓(𝑥) de 0 a 1; usando algún programa informático.
³ 𝑓(𝑥)𝑑𝑥
,,<
Puede usar está página web:

https://www.wolframalpha.com/input/?i=integrate+2%281-x%29+from+x+%3D+0+to+1
b. ¿Cuál es la probabilidad que al menos el 80% de los pedidos sean procesados dentro de 24 horas?
Solución
Existen varias formas de calcular la probabilidad pedida.
𝑃(𝑋 ≥ 0,8)
Primera forma
Integrando la función de densidad 𝑓(𝑥) de 0,8 a 1.
# #
𝑃(𝑋 ≥ 0,8) = ³ 𝑓(𝑥)𝑑𝑥 = ³ 2(1 − 𝑥)𝑑𝑥

,,< ,,<
= (2𝑥 − 𝑥 $ )|#,,< = 0,04
Segunda forma
Calculando el área de triángulo desde 0,8 a 1.
𝑏 × ℎ (1 − 0,8) × N2(1 − 0,8)O

𝑃(𝑋 ≥ 0,8) = = = 0,04
2 2
Observe que, para la segunda forma de resolución, se usó la función de densidad para hallar la
altura del triángulo.
Tercera forma
Integrando la función de densidad 𝑓(𝑥) de 0,8 a 1; usando algún programa informático.
𝑃(𝑋 ≥ 0,8) = ³ 𝑓(𝑥)𝑑𝑥

,,<
Puede usar está página web:
https://www.wolframalpha.com/input/?i=integrate+2%281-x%29+from+x+%3D+0.8+to+1
c. Si el porcentaje de pedidos procesados en 24 horas es mayor al 80%, calcular la probabilidad de

que sea mayor a 90%.
Solución
𝑃N(𝑋 > 0,9) ∩ (𝑋 > 0,8)O 𝑃(𝑋 > 0,9)

𝑃(𝑋 > 0,9⁄𝑋 > 0,8) = =
𝑃(𝑋 > 0,8) 𝑃(𝑋 > 0,8)
#
∫,,I 2(1 − 𝑥)𝑑𝑥 0,01
= # = = 0,25
∫,,< 2(1 − 𝑥 )𝑑𝑥 0,04
Ejercicios
140. Una variable aleatoria continua tiene la siguiente función de densidad de probabilidad:
𝑎𝑥 0<𝑥<7
𝑓(𝑥) = —
Calcule la probabilidad de 𝑃(2 < 𝑋 < 5).
141. La duración (en minutos) de una llamada telefónica en la sala de profesores puede modelarse por
una variable aleatoria X con la siguiente función de densidad:
𝑎(3 − 𝑥) 0<𝑥<3
𝑓(𝑥) = —
a. Determine el valor de 𝑎. Rpta: 0,2222

b. Calcule la probabilidad de que una llamada dure menos de un minuto y medio.
Rpta: 0,75
c. Si una llamada ya duró un minuto, calcule la probabilidad de que dure más de dos minutos.
Rpta: 0,25
Función de distribución acumulada de probabilidad
La función de distribución acumulada de una variable aleatoria continua 𝑋 con función de densidad
𝑓(𝑥) se define por:
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) −¥ < 𝑥 < +¥
Se tiene que:
𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝐹(𝑏) − 𝐹(𝑎)
Para variables continuas se cumple:
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)
Propiedades
• Se cumple que:
𝑑𝐹(𝑥)
= 𝑓(𝑥)
𝑑𝑥
• 𝐹(𝑥) es una función que siempre está entre 0 y 1 (0 ≤ 𝐹(𝑥) ≤ 1); pues es igual a una probabili-
dad.
• 𝐹(𝑥) es una función que nunca decrece.
lim 𝐹(𝑥) = 0
D→OX
lim 𝐹(𝑥) = 1
D→;X
1.0
𝐹(𝑥)
0.8
0.6
0.4
0.2
0.0
-2 -1 0 1 2 3 4 5
Ejemplo 51
Las ventas diarias (en miles de dólares) de una bodega es una variable aleatoria continua 𝑋 que tiene
la función densidad:
2(𝑥 + 2)
𝑓(𝑥) = • 0≤𝑥≤1
5
a. Construya su respectiva función de distribución acumulada de probabilidad.
Solución
Primera forma: Integrando
Para el tramo [0; 1] usaremos la definición de la función de distribución acumulada
D D
2(𝑡 + 2) 2 𝑡$
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ³ 𝑑𝑡 = š + 2𝑡›µ
, 5 5 2 ,
2 𝑥$ 2 0$ 2 𝑥$ 1
𝐹(𝑥) = š + 2𝑥› − š + 2 × 0› = š + 2𝑥› = 𝑥(𝑥 + 4)
5 2 5 2 5 2 5
La función de distribución 𝐹(𝑥) se expresa de la siguiente manera:
1 𝑥≥1
1
𝐹(𝑥) = » 𝑥(𝑥 + 4) 0 < 𝑥 < 1
5
0 𝑥≤0
Segunda forma: Integrar usando algún programa informático
Para el tramo [0; 1] usaremos la definición de la función de distribución acumulada
D
2(𝑡 + 2) 1
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ³ 𝑑𝑡 = 𝑥(𝑥 + 4)
, 5 5
Puede usar páginas como https://www.wolframalpha.com/ y pedir que calcule la integral corres-
pondiente.
b. ¿Cuál sería la venta mínima del 25% de los mayores montos diarios de venta?
Solución
Calcularemos el percentil 75; 𝑃GH = 𝑚
𝑃(𝑋 ≤ 𝑚) = 0,75
1.0
0.9
0.8
0.7
0.6 0,75
𝐹(𝑥)
0.5
0.4
0.3
0.2
0.1 0,78
0.0
-0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2
1
𝐹(𝑚) = 𝑚(𝑚 + 4) = 0,75
5
Resolviendo la ecuación se tienen que 𝑚 = 0,78; por lo que el percentil 75 es 780 dólares.
Ejemplo 52
Encuentre el rango intercuartil de 𝑋, si 𝑋 es el tiempo de vida de un sistema es una variable aleatoria,
en años, cuya función de distribución acumulada es:
0 𝑥≤5
𝐹(𝑥) = • 25
1 − $ 𝑥$ > 5
𝑥
a. Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la

probabilidad que pertenezca al quinto superior?
b. Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la
Solución
a. Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la
Solución
Sea 𝑋: = tiempo, en años, de vida de un sistema.
Para calcular el rango intercuartil, debemos hallar el cuartil 1 y el cuartil 3, para esto hay dos posi-
bilidades: integrar la función de densidad 𝑓(𝑥) o reemplazar en la función de distribución acumu-
lada.
Por definición de cuartil 3, el 75% de los datos es menor o igual a él, es decir:
𝑃(𝑋 ≤ 𝑄) ) = 0,75
o lo que es lo mismo:
𝐹(𝑄) ) = 0,75
25
1− = 0,75
𝑄)$
de donde:
𝑄) = 10
Haciendo lo mismo para el cuartil 1.
𝑃(𝑋 ≤ 𝑄# ) = 0,25
𝐹(𝑄# ) = 0,25
25
1− = 0,25
𝑄#$
de donde:
𝑄) = 5,7735
Luego:
𝑅𝐼𝐶 = 𝑄) − 𝑄# = 4,23
b. Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la

Solución
Como nos dicen que “ya se sabe que está en el cuarto superior”, es una probabilidad condicional.
Para estar en el quinto superior tiene que tener un tiempo de vida mayor al percentil 80, además
como se sabe que esta en el cuarto superior tiene un tiempo de vida mayor al percentil 75.
Por lo tanto, la probabilidad pedida es:
𝑃(𝑋 > 𝑃<, ⁄𝑋 > 𝑃GH )
Por la definición de probabilidad condicional.
𝑃 «(𝑋 > 𝑃<, ) ∩ N(𝑋 > 𝑃GH )O¬

=
𝑃(𝑋 > 𝑃GH )
𝑃(𝑋 > 𝑃<, )

=
𝑃(𝑋 > 𝑃GH )
Por la definición de percentil el 𝑃(𝑋 > 𝑃<, ) = 0,20 y el 𝑃(𝑋 > 𝑃GH ) = 0,25.
𝑃(𝑋 > 𝑃<, ) 0,20

𝑃(𝑋 > 𝑃<, ⁄𝑋 > 𝑃GH ) = = = 0,80
𝑃(𝑋 > 𝑃GH ) 0,25
Ejercicios
142. Sea 𝐹(𝑥) la función de distribución acumulada de la variable 𝑋.
1 𝑥>2
𝐹(𝑥) = •𝑥 − 1 1 ≤ 𝑥 ≤ 2
0 𝑥<1
Calcule la probabilidad de que 𝑋 esté entre 1,5 y 1,8.
143. Sea 𝑋 una variable aleatoria que modela la cantidad de tiempo en minutos que una persona tarda
en responder una pregunta de un examen y que tiene la siguiente función de densidad:
𝑓(𝑥) = —𝑎(6 − 𝑥) 0<𝑥<6

a. Determine la función de distribución acumulada 𝐹(𝑥) de la variable aleatoria 𝑋.

b. Use la función de distribución acumulada 𝐹(𝑥) de la variable 𝑋 para calcular la probabilidad
de que una persona se tarde hasta cuatro minutos en responder una pregunta.
c. Use la función de distribución acumulada 𝐹(𝑥) de la variable 𝑋 para calcular la probabilidad
de que una persona se tarde más de cinco minutos en responder una pregunta.
d. Use la función de distribución acumulada 𝐹(𝑥) de la variable 𝑋 para calcular la probabilidad
de que una persona se tarde entre dos y cinco minutos en responder una pregunta.
144. Para una estación gasolinera las ventas semanales, medidas en miles de galones, se modela con
una variable aleatoria 𝑋 que tiene la función de densidad que se muestra a continuación:
𝑥−1 1<𝑥≤2
𝑓(𝑥) = •3 − 𝑥 2<𝑥<3
a. Calcule la probabilidad de que en una semana cualquiera venda al menos 1500 galones de
gasolina. Rpta. 0,875
b. Determine la función de distribución de probabilidad acumulada.
c. Calcule la venta semanal esperada. Rpta. 2,000
145. La proporción de personas que responden a una encuesta enviada por correo electrónico se mo-
dela con una variable aleatoria 𝑋 con la siguiente función de densidad:
𝑓(𝑥) = —𝑎(2𝑥 + 9) 0<𝑥<1

a. Determine y grafique la función de distribución acumulada de la variable aleatoria 𝑋.

b. Use la función de distribución acumulada para calcular la probabilidad de que respondan entre
60% y 80% de las personas a la encuesta. Rpta: 0,208
c. Use la función de distribución acumulada para calcular la mediana de 𝑋.
Rpta: 0,52493
Valor esperado de una variable aleatoria continua
El valor esperado o esperanza matemática de una variable aleatoria 𝑋 o media de una distribución de
probabilidad de 𝑋 se denota 𝐸(𝑋).
;X
𝜇? = 𝐸(𝑋) = ³ 𝑥 𝑓(𝑥) 𝑑𝑥
OX
Valor esperado de una función de variable aleatoria continua
Sea 𝐺(𝑋) una función de la variable aleatoria continua 𝑋.
El valor esperado de 𝐺(𝑋):
;∞
𝜇R(?) = 𝐸(𝐺(𝑋)) = ³ 𝐺(𝑥)𝑓(𝑥) 𝑑𝑥
O∞
Propiedades del valor esperado
𝐸(𝑎𝑋 + 𝑏) = 𝑎𝐸(𝑋) + 𝑏 = 𝑎 𝜇? + 𝑏
𝐸(𝑏) = 𝑏
𝐸(𝑋 + 𝑏) = 𝐸(𝑋) + 𝑏 = 𝜇? + 𝑏
𝐸(𝑎𝑋) = 𝑎 𝐸(𝑋) = 𝑎 𝜇?
• Si 𝑋 e 𝑌 son variables aleatorias, 𝑎 y 𝑏 son constantes, entonces:
𝐸(𝑎𝑋 + 𝑏𝑌) = 𝑎𝐸(𝑋) + 𝑏𝐸(𝑌)
𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)
𝐸(𝑋 – 𝑌) = 𝐸(𝑋) – 𝐸(𝑌)
• Si 𝑋 e 𝑌 son variables aleatorias independientes, 𝑎 y 𝑏 son constantes, entonces:

𝐸(𝑎 𝑋. 𝑏 𝑌) = 𝑎 𝑏 𝐸(𝑋) 𝐸(𝑌)
• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes, entonces:
𝐸(𝑋# . 𝑋$ . 𝑋) . . . 𝑋7 ) = 𝐸(𝑋# ). 𝐸(𝑋$ ). 𝐸(𝑋) ) . . . 𝐸(𝑋7 )

entonces:
7 7
𝐸 ¡• 𝑎! 𝑋! ¢ = • 𝑎! 𝐸(𝑋! )
!6# !6#
• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias con la misma función de densidad, entonces se cum-

ple que 𝐸(𝑋! ) = µ, por lo tanto:
𝐸 ¡• 𝑋! ¢ = 𝑛𝜇
!6#
Varianza de una variable aleatoria continua
;X
𝜎?$ = 𝑉(𝑋) = ³ (𝑥 − 𝜇)$ 𝑓(𝑥) 𝑑𝑥
OX
𝜎?$ = 𝑉(𝑋) = 𝐸(𝑋 $ ) − 𝐸(𝑋)$
Desviación estándar de una variable aleatoria continua
𝜎? = -𝑉(𝑋)
Varianza de una función de variable aleatoria continua
;X
$
𝜎R(?) =³ (𝐺(𝑋) − 𝜇R(?) )$ 𝑓(𝑥) 𝑑𝑥
OX
Propiedades de la varianza
𝑉(𝑏) = 0
𝑉(𝑎𝑋) = 𝑎$ 𝑉(𝑋)
𝑉(𝑋 + 𝑏) = 𝑉(𝑋)
• Si 𝑋 e 𝑌 son dos variables aleatorias independientes, 𝑎 y 𝑏 son dos constantes, entonces:
𝑉(𝑎𝑋 + 𝑏𝑌) = 𝑎$ 𝑉(𝑋) + 𝑏$ 𝑉(𝑌)

entonces:
7 7
𝑉 ¡• 𝑎! 𝑋! ¢ = • 𝑎!$ 𝑉(𝑋! )
!6# !6#
• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes con la misma función de densidad,

entonces se cumple que 𝑉(𝑋! ) = s$ y, por lo tanto:
𝑉 ¡• 𝑋! ¢ = 𝑛𝜎 $
!6#
Una de las medidas de variabilidad que podríamos usar es el coeficiente de variación, tal como lo usa-
mos en la unidad de medidas de resumen.
El coeficiente de variación se define de la siguiente manera:
𝜎?
𝐶𝑉 = × 100%
𝐸(𝑋)
Ejemplo 53
Caso Metropolitano
La distancia, en metros, que recorre un usuario caminando para llegar a una estación del Metropoli-
tano se modela con la variable aleatoria X con la siguiente función de densidad.
𝑥
0 < 𝑥 < 500
𝑓(𝑥) = » 250000
𝑥
𝑎− 500 ≤ 𝑥 < 1000
250000
a. Calcule el esperado y la varianza de 𝑋.
Solución
Primero hallemos 𝑎.
H,, #,,,
𝑥 𝑥
³ 𝑑𝑥 + ³ 𝑎 − 𝑑𝑥 = 1
250000 250000
, H,,
De donde:
1
𝑎 =
250
Calculemos el esperado y la varianza de 𝑋.
H,, #,,,
𝑥 1 𝑥
𝐸(𝑋) = ³ 𝑥 𝑑𝑥 + ³ 𝑥 − 𝑑𝑥 = 500
250000 250 250000
, H,,
H,, #,,,
𝑥 $
1 𝑥
𝑉(𝑋) = ³ 𝑥 𝑑𝑥 + ³ 𝑥 $ − 𝑑𝑥 − 500$ = 41 666,7
250000 250 250000
, H,,
b. Calcule la probabilidad de que un usuario camine entre 300 y 700 metros para llegar a una esta-
ción.
Solución
G,,
𝑃(300 < 𝑋 < 700) = ³ 𝑓(𝑥)𝑑𝑥

),,
Como la función de densidad está definida de forma diferente en los tramos [300;500[ y [500;700],
entonces la integral es:
H,, G,,
𝑥 1 𝑥
𝑃(300 < 𝑋 < 700) = ³ 𝑑𝑥 + ³ − 𝑑𝑥 = 0,64
250000 250 250000
),, H,,
Ejercicios
146. El sobrepeso, en kilos, del equipaje de mano de un pasajero se modela con una variable aleatoria
𝑋 con la siguiente función de densidad de probabilidad:
𝑓(𝑥) = —𝑘(8 − 𝑥)
4≤𝑥≤6
Si la desviación estándar de la variable aleatoria del sobrepeso es mayor a medio kilo, se va a

restringir el sobrepeso permitido en el equipaje de mano. Indique lo que se hará.
Solución
Interpretación
Representación
Cálculo
147. El tiempo, en minutos, que se tarda una persona en ser atendido en el counter del aeropuerto se
modela con una variable aleatoria 𝑋:
𝑓(𝑥) = —𝑘(8 − 𝑥) 4≤𝑥≤8

Determine la media de la variable aleatoria 𝑋.
148. El gerente comercial de la sucursal de Surco informa que el gasto mensual, en cientos de soles,
por la venta de libros a sus clientes es una variable aleatoria que tiene la siguiente función de
densidad:
1
𝑓(𝑥) = •8 𝑥 + 𝑎 2≤𝑥≤6
Calcule el valor esperado del gasto mensual en libros. Rpta: 467 soles
Distribuciones de probabilidad de variable continua

Distribución uniforme
Función de densidad
1
𝑓(𝑥) = •𝑏 − 𝑎 𝑎≤𝑥≤𝑏
Se dice que 𝑋 tiene una distribución uniforme y se denota:
𝑋~𝑈(𝑎, 𝑏)
Media
(𝑎 + 𝑏)
𝜇=
2
Varianza
(𝑏 − 𝑎)$
𝜎$ =
12
La función de distribución acumulada 𝐹(𝑥) de una variable uniforme es:
0 𝑥<𝑎
𝑥−𝑎
𝐹(𝑥) = ž 𝑎≤𝑥≤𝑏
𝑏−𝑎
1 𝑥>𝑏
Ejemplo 54
En ciertos experimentos, el error cometido al determinar la densidad de una sustancia es una variable
aleatoria cuya distribución es uniforme con 𝑎 = -0,025 y 𝑏 = 0,025.
a. ¿Cuál es la probabilidad de que tal error esté entre 0,010 y 0,015?

b. ¿Cuál es el error esperado cometido?
Solución
a. ¿Cuál es la probabilidad de que tal error esté entre 0,010 y 0,015?
Solución
Sea X:= error al determinar la densidad de una sustancia
𝑋~𝑈(𝑎 = −0,025, 𝑏 = 0,025)
Tiene la siguiente función de densidad
1
𝑓(𝑥) = •0,025 − (−0,025) −0,025 ≤ 𝑥 ≤ 0,025
1
𝑓(𝑥) = •0,05 −0,025 ≤ 𝑥 ≤ 0,025
𝑃(0,010 ≤ 𝑋 ≤ 0,015)
Existen dos formas de calcular esta probabilidad:
Integrando la función de densidad 𝑓(𝑥) o calculándola a partir del área del rectángulo.
,,,#H
1
𝑃(0,010 ≤ 𝑋 ≤ 0,015) = ³ 𝑑𝑥 = 0,10
0,050
,,,#,
b. ¿Cuál es el error esperado cometido?
Solución
La variable
𝑋~𝑈(𝑎 = −0,025, 𝑏 = 0,025)
tiene el siguiente valor esperado de errores
(𝑎 + 𝑏) (−0,025 + 0,025)
𝜇= = =0
2 2
Ejemplo 55
La llegada de cada uno de los empleados a su centro de labores se produce independientemente, de

acuerdo a la distribución uniforme en el intervalo comprendido entre las 8:00 y 8:25 am.
De una muestra de 10 empleados, calcule la probabilidad de que cuatro de ellos hayan llegado entre
las 8:15 y 8:20 AM.
Solución
Sea X:= tiempo, en minutos, desde las 8 AM hasta la hora de llegada de los empleados al centro de
trabajo, luego:
𝑋~𝑈(0, 25)
La función de densidad es :
1
𝑓(𝑥) = •25 0 ≤ 𝑥 ≤ 25
Se define la variable:
𝑌: = número de empleados que llegan al centro de trabajo entre 8:15 y 8:20 AM.
𝑌~𝐵(𝑛 = 10; 𝑝 =? )
Debe calcularse la probabilidad de éxito p de que un empleado llegue al centro de trabajo entre 8:15
y 8:20 AM esto es:
$H
1
𝑝 = 𝑃(15 < 𝑋 < 25) = ³ 𝑑𝑥 = 0,20
25
#H
Entonces:
𝑌~𝐵(𝑛 = 10; 𝑝 = 0,20)
Luego la función de probabilidad es:
𝑃(𝑌 = 𝑦) = 𝑓(𝑦) = 𝐶\#, 0,20\ (1 − 0,20)#,O\ 𝑦 = 0, 1, … , 10
𝑃(𝑌 = 4) = 𝑓(4) = 𝐶-#, 0,20- (1 − 0,20)#,O- = 0,0881
En Excel, se usa la función = DISTR.BINOM.N(4;10;0.2;0) = 0,0881

Ejercicios
149. El tiempo en el que un avión llega a su destino con respecto a su hora programada se modela con
una variable aleatoria uniforme de parámetros -10 y 20. De tal manera que los valores negativos
indican que el avión llegó antes de la hora programada y los valores positivos indican que el avión
llegó después de la hora programada. Si la probabilidad de que un avión llegue con un retraso
mayor a 10 minutos es mayor al 20%, se revisarán los protocolos de salida de un avión. Indique lo
que se hará.
Solución
Interpretación
Representación
Cálculo
150. El tiempo en el que un avión llega a su destino con respecto a su hora programada se modela con
una variable aleatoria uniforme de parámetros -10 y 20. De tal manera que los valores negativos
indican que el avión llegó antes de la hora programada y los valores positivos indican que el avión
llegó después de la hora programada. Si la probabilidad de que un avión llegue con un retraso
mayor a 10 minutos es mayor al 20%, se revisarán los protocolos de salida de un avión. Indique lo
que se hará.
a. Calcule la probabilidad de que la diferencia entre la hora de llegada programada y la hora de
llegada sea mayor a seis minutos.
b. Si se escoge al azar 20 vuelos, calcule la probabilidad de que, como máximo, se tenga un vuelo
con retraso mayor a ocho minutos.
151. La variable X se distribuye uniformemente con media igual a 24 y varianza igual a 12, calcular los
parámetros de la función de densidad. Rpta: a = 18, b = 30
152. La función de Excel =ALEATORIO() genera un número con distribución uniforme con parámetros
a igual a cero y b igual a uno. Sea 𝑋 una variable aleatoria definida como el número generado por
dicha función.
a. Calcule la probabilidad de que la función genere un número aleatorio entre 0,2 y 0,7.
Rpta: 0,50
b. Use la función de distribución acumulada 𝐹(𝑥) para calcular 𝑃(0,15 < 𝑋 < 0,55).
Rpta: 0,40
153. El tiempo, en minutos, que demora un servicio de delivery en entregar una pizza puede modelarse
por una variable aleatoria uniforme con parámetros 10 y 38. Si la pizza se tarda más de 30 minutos
en ser entregada, el cliente no la pagará.
a. Si una familia pide una pizza, calcule la probabilidad de que le salga gratis.
Rpta: 0,2857
b. Si la familia pide una pizza diaria durante diez días seguidos, calcule la probabilidad de que por
lo menos una de ellas le salga gratis. Rpta: 0,9654
c. Una familia pidió una pizza hace 25 minutos y aún no ha llegado, ¿cuál es la probabilidad de
que le salga gratis? Rpta: 0,6154
154. Se ha observado que un servicio muy solicitado es llevar clientes de Jesús María a San Isidro. Se
define la variable uniforme 𝑋: = diferencia entre el tiempo programado y el tiempo real de lle-
gada del taxi, en minutos. Los parámetros de 𝑋 son -5 a 15, donde el signo negativo indica que el
vehículo llegó antes del tiempo estimado y el valor positivo indica que demoró más del tiempo
estimado.
𝑘 −5 ≤ 𝑥 ≤ 15
𝑓(𝑥) = —
a. Calcule la probabilidad que uno de estos servicios haya tenido un retraso mayor a cinco minu-
tos. Rpta: 0,50
b. Calcule el tiempo mínimo para pertenecer al 20% de los clientes que más demoran en llegar a
su destino. Si este tiempo es mayor a los 10 minutos se realizará un análisis de los tiempos
reales para cumplir con este servicio. ¿Qué decisión se tomará? Rpta: 11 minutos
c. Se elige aleatoriamente a diez de estos servicios, calcule la probabilidad de que cuatro lleguen
antes del tiempo programado. Rpta: 0,14600
Distribución exponencial
En variables que representan los tiempos de vida útil, tiempos de sobrevivencia, en tiempos de ocu-
rrencia en procesos de Poisson se suele utilizar la distribución exponencial.
La variable aleatoria 𝑋 tiene una distribución exponencial con parámetro 𝛽 (𝛽 > 0) si su función de
densidad de probabilidad es:
1 O]D
𝑓(𝑥) = •𝛽 𝑒
𝑥≥0
Se denota:
𝑋 ~ 𝐸𝑥𝑝(𝛽)
Se lee que la variable aleatoria 𝑋 sigue una distribución exponencial con parámetro 𝛽.
Función de distribución acumulada
0 𝑥<0
𝐹(𝑥) = —
1 − 𝑒 OD/] 𝑥≥0
𝛽>0
Características
La variable puede tomar valores de 0 a +¥, no toma valores negativos.
La gráfica es descendente con sesgo a la derecha.
Existe una curva para cada valor de 𝛽.
Media
𝜇D = 𝐸(𝑋) = 𝛽
Varianza
𝜎?$ = 𝛽$
En Excel, se usa la función =DISTR.EXP.N(x; lambda = 1/beta; acumulado = 1)

Cálculo de un percentil
Para el cálculo del percentil 𝑃% pueden usar el SOLVE de la calculadora:
_
O ,
1−𝑒 ] =𝑘
Por ejemplo, si se quiere calcular el percentil 90 se debe resolver la siguiente ecuación:
_
O -.
1−𝑒 ] = 0,9
En Excel, se usa la función 𝑃%
=INV.GAMMA(k/100;1;beta)
Por ejemplo, si se quiere calcular el percentil 90, 𝑃I, =INV.GAMMA(0.9;1;beta).
Ejemplo 56
El ingeniero de planta de una línea aérea sabe que la duración promedio de los neumáticos de las
avionetas es de 1,5 años. Si la duración de los neumáticos tiene una distribución exponencial.
a. ¿Cuál es la probabilidad de que los neumáticos duren a lo más 1,6 años?
Solución
Definamos la variable aleatoria 𝑋: duración de neumáticos de las avionetas.
𝑋~𝐸𝑥𝑝(𝛽 = 1,5)
#,F
O
𝑃(𝑋 ≤ 1,6) = 𝐹(1,6) = 1 − 𝑒 #,H = 0,6558
b. ¿Cuál es la probabilidad de que los neumáticos duren más de dos años?
Solución
𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2)
$
O
= 1 − 𝐹(2) = 1 − k1 − 𝑒 #,H l = 0,2636
c. La gerencia de la línea aérea está evaluando la posibilidad de cambiar de proveedor si el tiempo
mínimo del 25% de los neumáticos que tienen una mayor duración es menor a 1,8 años.
Solución
Interpretación
Determinar si se va a cambiar de proveedor.
Representación
Se debe calcular el percentil 75 de la variable <duración de neumáticos de las avionetas>.
Cálculo
El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración lo representamos
por 𝑡B!7 .
𝑃(𝑋 > 𝑡B!7 ) = 0,25
𝑃(𝑋 > 𝑡B!7 ) = 1 − 𝑃(𝑋 ≤ 𝑡B!7 )
`
O /01
= 1 − 𝐹(𝑡B!7 ) = 1 − k1 − 𝑒 #,H l
`
O /01
=𝑒 #,H = 0,25
2
O /01
Tomamos logaritmo neperiano a ambos lados de la ecuación 𝑒 3,5 = 0,25
`
O /01
𝑙𝑛 k𝑒 #,H l = ln (0,25)
𝑡B!7
− = −1,3863
1,5
𝑡B!7 = 2,08 𝑎ñ𝑜𝑠
El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración es mayor a 1,8 años
(2,08 > 1,8). Por tanto, no se va a cambiar de proveedor.
Ejercicios
155. El tiempo, en días, que transcurre desde la adquisición de un vehículo nuevo hasta que se presenta
la primera falla mecánica se modela con una variable aleatoria exponencial con media de 500 días.
a. Calcule la probabilidad de que el tiempo que transcurre desde la adquisición de un vehículo

nuevo hasta que se presenta la primera falla mecánica sea mayor a 600 días.
b. Se elige al azar un vehículo, se observa que han pasado 300 días y no se ha presentado ninguna
falla mecánica, calcule la probabilidad de que pasen como máximo 200 días más antes de que
se presente la primera falla mecánica. Rpta: 0,3297
c. Calcule e interprete el cuartil 3 del tiempo que transcurre desde la adquisición de un vehículo
nuevo hasta que se presenta la primera falla mecánica. Rpta: 693,14 días
d. Calcule la probabilidad de que un vehículo, elegido al azar, presente la primera falla mecánica
después de los 700 días. Si esta probabilidad es menor del 80% se considera una falla impor-
tante y se solicitará el pago de la garantía al proveedor de la flota. ¿Cuál será la decisión?
Rpta: 0,2466
156. La vida útil, en meses, de un artefacto eléctrico es una variable aleatoria con distribución expo-
nencial con parámetro 𝛽. El fabricante afirma que el 90% de estos componentes tienen una vida
útil que supera los 60 meses. ¿Cuál es la media de la vida útil de estos componentes?
Rpta: 569,47 meses
Distribución normal
Función de densidad
Se dice que la variable aleatoria 𝑋 sigue una distribución normal con parámetros µ y s.
Se denota con:
𝑋~𝑁(µ, s$ )
La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de tendencia
central coinciden.
El rango de la variable normal es toda la recta real, esto es, de –¥ a + ¥.
Para el cálculo de probabilidades acumuladas en Excel se usa la función:
=DISTR.NORM.N(x; media; desviación estándar; acumulado = 1)
Para el cálculo del percentil 𝑃% en Excel se usa la función:
=INV.NORM(k; media; desviación estándar)
Por ejemplo, si se quiere calcular el percentil 90, 𝑘 = 0,9.
Estandarización
Se toma como referencia una distribución normal estándar (µ = 0 y s2 = 1). Se usa el cambio de variable:
𝑋−𝜇
𝑍=
𝜎
Se denota con:
𝑍~𝑁(µ = 0, s$ = 1)
Cálculo de una probabilidad de una variable normal
Para calcular una probabilidad de una variable normal existen varias posibilidades, entre ellas puede
usar:
• Estandarizar la variable para usar la tabla de la normal estándar.
• Usar un programa informático, como, por ejemplo, Excel.
Cálculo de una probabilidad usando de la tabla normal estándar
Para calcular una probabilidad usando la tabla normal estándar debemos estandarizar la variable y
obtenemos un valor de 𝑍.
𝑃(𝑋 ≤ 𝑎)
𝑋−𝜇 𝑎−𝜇
= 𝑃k ≤ l
𝜎 𝜎
𝑎−𝜇
= 𝑃 «𝑍 ≤ ¬
𝜎
POa
El valor de b
se redondea a dos decimales, usando redondeo simple.
• En la primera columna de este valor buscamos el valor de las unidades y las décimas.
• En la fila correspondiente al valor de la columna buscamos el valor de las centésimas.
• Su intersección nos dará la probabilidad.
La tabla normal estándar siempre nos dará el valor del área hacia la izquierda de Z.
𝑎−𝜇
𝑃 𝑍≤
𝜎
𝑎−𝜇
-4 -3 -2 -1 00 1 2 3 4
𝜎
Cálculo de una probabilidad de una variable normal usando Excel
Con Excel, se usa la función =DISTR.NORM.N(x;media;desv_estándar;acumulado)
• x: es el valor para el que desea la distribución.

• media: es la media aritmética de la distribución.
• desv_estándar: es la desviación estándar de la distribución, un número positivo.
• acumulado: Use acumulado = 1 para calcular la probabillidad.
La función siempre nos dará el valor del área hacia la izquierda de x.
Sea 𝑋 una variable normal tal que:
𝑋~𝑁(𝜇 = 30; 𝜎 $ = 5$ )
Calcule:
𝑃(𝑋 ≤ 37,8)
Solución
Primera forma: Usando la tabla de la normal estándar
Estandarizando la variable para usar la tabla de la normal estándar.
𝑋 − 𝜇 37,8 − 𝜇
𝑃(𝑋 ≤ 37,8) = 𝑃 k ≤ l
𝜎 𝜎
37,8 − 30
= 𝑃 k𝑍 ≤ l
5
= 𝑃(𝑍 ≤ 1,56)
Usando la tabla de la distribución normal estándar.
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
Tenemos que:
𝑃(𝑍 ≤ 1,56) = 0,94062
0,94062
-4 -3 -2 -1 0 11,562 3 4
Segunda forma: Usando Excel
Usando algún programa estadístico como Excel.
En Excel, se usa =DISTR.NORM.N(1.56;0;1;1) = 0,94062
Cálculo de un percentil de una variable normal
Para calcular un percentil de una variable normal existen varias posibilidades:

• Estandarizar la variable para usar la tabla de la normal estándar
• Usar un programa informático, como, por ejemplo, Excel.
Cálculo de un percentil usando de la tabla normal estándar
Para calcular un percentil usamos la tabla normal estándar de forma inversa.
Para calcular el percentil 𝑘, se plantea la ecuación:
𝑃(𝑋 ≤ 𝑃% ) = 0, 𝑘
Luego, debemos estandarizar la variable.
𝑋 − 𝜇 𝑃% − 𝜇
𝑃k ≤ l = 0, 𝑘
𝜎 𝜎
𝑃% − 𝜇
𝑃 k𝑍 ≤ l = 0, 𝑘
𝜎
Luego, se busca dentro de la tabla el valor más cercano a 0, 𝑘. A partir de ese número dentro de la
tabla, salimos a la primera columna y primera fila y sumamos los números encontrados y obtendere-
mos el valor c.
0, 𝑘
𝑃! − 𝜇
-4 -3 -2 -1 00 1 2 = 𝑐3 4
𝜎
El valor del percentil se obtiene de la ecuación:
𝑃% = 𝜇 + 𝑐 𝜎
Cálculo de un percentil de una variable normal usando Excel
Con Excel, se usa la función =INV.NORM(probabilidad;media;desv_estándar).
• probabilidad: es un número entre 0 y 1. Por ejemplo, para calcular el percentil 70; use 0,7.
• media: es la media aritmética de la distribución.
• desv_estándar: es la desviación estándar de la distribución, un número positivo.
Tabla de la distribución normal estándar
Área bajo la curva normal: [P(Z £ z ) = a ]
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Ejercicios
157. Si 𝑍~ 𝑁(µ = 0, s$ = 1), calcular:
𝑃(𝑍 < 0,24) = …..
-4 -3 -2 -1 0 10,24 2 3 4
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
𝑃(𝑍 > −3,56) = …..
-4 -3 -3,56
-2 -1 0 1 2 3 4
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
𝑃(0,30 < 𝑍 < 0,59) =
-4 -3 -2 -1 0 0,30 1 0,59 2 3 4
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
Hallar 𝑐 para que 𝑃(𝑍 < 𝑐) = 0,63307.
-4 -3 -2 -1 0 1 c 2 3 4
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
Ejemplo 57
El gasto mensual de un usuario en el Metropolitano se modela con una variable normal con media de
100 soles y una desviación estándar de cinco soles. Se elige un usuario al azar.
a. Calcule la probabilidad de que gaste más de 105 soles.

b. Calcule la probabilidad de que gaste entre 90 y 110 soles.
c. Determine el gasto mensual mínimo para que esté en 10% de los que más gastan.
Solución
a. Calcule la probabilidad de que gaste más de 105 soles.
Solución
Defianmos la variable aleatoria
𝑋: = gasto mensual de un usuario en el Metropolitano
𝑋~𝑁(𝜇 = 100; 𝜎 $ = 5$ )
𝑃(𝑋 > 105)
Cálculo usando la tabla de la normal estándar
Como usamos la tabla normal estándar debemos usar el complemento, pues la tabla nos da el área
izquierda.
𝑃(𝑋 > 105) = 1 − 𝑃(𝑋 ≤ 105)
105 − 100
= 1 − 𝑃 k𝑍 ≤ l = 1 − 𝑃(𝑍 ≤ 1)
5
= 1 − 0,84134 = 0,15866
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08

0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100
Cálculo usando Excel
En Excel, se usa la función =1-DISTR.NORM.N(105;100;5;1)
b. Calcule la probabilidad de que gaste entre 90 y 110 soles.

Solución
𝑃(90 ≤ 𝑋 ≤ 110)
Estandarizamos, es decir, restamos la media 𝜇 y dividimos entre la desviación estándar 𝜎:
90 − 𝜇 𝑋 − 𝜇 110 − 𝜇
= 𝑃k ≤ ≤ l
𝜎 𝜎 𝜎
90 − 100 𝑋 − 100 110 − 100

= 𝑃k ≤ ≤ l
5 5 5
= 𝑃(−2 ≤ 𝑍 ≤ 2)
Usando la tabla de la normal estándar.
= 0,97725– 0,02275 = 0,9545
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08

1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537
z -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00

-2,1 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
En Excel, se usa la función =DISTR.NORM.N(110;100;5;1)-DISTR.NORM.N(90;100;5;1).
c. Determine el gasto mensual mínimo para que esté en 10% de los que más gastan.
Solución
Como nos piden determinar el gasto mensual mínimo para que esté en 10% de los que más gastan
𝑃(𝑋 ≤ 𝑎) = 0,90
Estandarizando:
𝑎 − 100
𝑃 k𝑍 ≤ l = 0,90
5
Buscamos el valor más cercano a 0,90; en este caso; 0,89973. Salimos a los bordes y obtenemos el
valor de 1,28.
z 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

1,1 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
Luego:
𝑎 − 100
= 1,28
5
𝑎 = 1,28 × 5 + 100
𝑎 = 106,4
En Excel, se usa la función =INV.NORM(0.9;100;5) = 106,4.
Ejemplo 58
En Buck Café, la máquina surtidora de refrescos está ajustada de tal forma que sirve en promedio 250
mililitros por vaso. Si la cantidad de refresco servido en los vasos sigue, aproximadamente, una distri-
bución normal con una desviación estándar de 10 mililitros. ¿Qué proporción de los vasos servidos
contendrán entre 240 y 255 mililitros de refresco?
Solución
Sea 𝑋: = cantidad de refresco servido por vaso
𝑋~𝑁(𝜇 = 250, s$ = 10$ )
𝑃(240 ≤ 𝑋 ≤ 255)
Estandarizando se tiene:
240 − 𝜇 𝑋 − 𝜇 255 − 𝜇
= 𝑃k ≤ ≤ l
𝜎 𝜎 𝜎
240 − 250 255 − 250
= 𝑃k ≤𝑍≤ l
10 10
𝑃(−1 ≤ 𝑍 ≤ 0,5)
= 0,69146 − 0,15866 = 0,5328
Usando la tabla de la distribución normal estándar.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08

0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175
z -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00

-1,1 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
En Excel, se usa la función =DISTR.NORM.N(255;250;10;1)-DISTR.NORM.N(240;250;10;1) = 0,5328
Ejemplo 59
Se informa que la cantidad de azúcar de los paquetes marcados con un kilo, tiene distribución normal
con media µ kilogramos y desviación estándar 0,02 kilogramos. Deteminar el valor de µ si la cantidad
de azúcar que contiene cada paquete es menor o igual a 0,95 kilos con probabilidad 0,102.
Solución
Sea 𝑋: = pesos de los paquetes de azúcar, en kilogramos
𝑋~𝑁(𝜇 =? , s$ = 0,02$ )
La condición establecida es:
𝑃(𝑋 ≤ 0,95) = 0,102
Estandarizando, es decir, restando la media y dividiendo que la desviación estándar, se tiene:
𝑋 − 𝜇 0,95 − 𝜇
𝑃k ≤ l = 0,102
𝜎 𝜎
0,95 − 𝜇
𝑃 k𝑍 ≤ l = 0,102
𝜎
Usando la tabla normal estándar para calcular el valor z correspondiente.
0,95 − 𝜇
= −1,27
0,02
Dentro de la tabla de la normal estándar, buscamos el valor más cercano a 0,102; en este caso,
0,10204. Saliendo a los bordes, obtenemos el valor de -1,27.
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01

-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350
De donde:
0,95 − 𝜇 = −1,27 × 0,02
𝜇 = 0,9754
0,95 − 𝜇
𝑃 k𝑍 ≤ l = 0,102
0,02
En Excel, se usa la función =INV.NORM(0.102;0;1) = -1,27 = -1,27
Luego
0,95 − 𝜇
= −1,27
0,02
De donde:
𝜇 = 0,9754
Ejercicios
158. La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una variable
aleatoria que tiene una distribución normal con una media igual a 400 soles y una desviación
estándar igual a 80 soles.
a. Calcule la probabilidad de que un cliente ahorre menos de 450 soles en un mes.

b. Calcule la probabilidad de que un cliente ahorre más de 360 soles mensuales.
c. Calcule la probabilidad que el ahorro mensual de un cliente esté entre 350 y 500 soles.
d. ¿Cuál es el ahorro mínimo mensual para estar en el 25% de los clientes que más ahorran?
e. ¿Cuál es el ahorro máximo mensual para estar en el 8% de los clientes que menos ahorran?
f. Si se elige al azar a 4000 clientes, calcule el valor esperado del número de clientes que ahorran
más de 500 soles.
159. El tiempo de incapacidad debido a un accidente laboral leve que tiene un trabajador de una em-
presa durante un mes se modela con una variable normal con una media de 90 horas y una des-
viación estándar de 18 horas. Si una persona ya tuvo 80 horas de incapacidad, calcule la probabi-
lidad de que tenga por lo menos 20 horas más. Rpta. 0,4070
160. Una compañía ha comprado una prueba para seleccionar personal. Los que han diseñado la
prueba saben que las notas siguen una distribución normal con una media de 75 puntos y una
desviación estándar de diez puntos. Calcule la probabilidad de que una persona que rinda esta
prueba obtenga una nota superior a 90 puntos. Rpta: 0,06681
161. En una ciudad se estima que la temperatura máxima en un día del mes de enero puede modelarse
con una variable normal con media 30°C y desviación estándar 2°C.
a. Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la temperatura
máxima sea menor a 31°C. Rpta: 0,69146
b. Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la temperatura
máxima esté entre 28,5 y 32°C. Rpta: 0,61472
c. Calcule el número esperado de días en el mes de enero en que la temperatura máxima es
mayor a 33°C. Asuma independencia entre las temperaturas de un día y otro.
Rpta: 2,07
162. Marque la opción correcta.
La moda de una variable aleatoria normal 𝑋 es:

a. Igual a cero.
b. El esperado de 𝑋.
c. Aquel valor para el cual 𝑓(𝑀𝑒) = 0,5, donde 𝑓 es la función de densidad de 𝑋.
d. No se puede determinar sin saber la desviación estándar.
e. Es el valor que acumula más del 50% del área. Rpta: b
Muestreo
Elemento
Es el objeto sobre el cual se hace la medición. También llamada unidad elemental.
Población muestreada
Es la colección de todos los elementos posibles que podrían extraerse en una muestra.
Marco muestral
Es una lista de los elementos que están disponibles para su elección en la etapa de muestreo.
Censo
Es el estudio completo de todos los elementos de la población.
Parámetro
Es un resumen de una característica de una población.
Estadístico
Es un resumen de una característica de una muestra.
Ventajas del muestreo

• Ahorro de dinero debido a que se consideran menos unidades para trabajar.
• Ahorro de tiempo, dado que el número de mediciones solo es de una parte representativa de la
población.
• Mayor precisión, la muestra puede ser más precisa porque reduce la magnitud de los errores no
muestrales, debido a que:
• Existe menos personal necesario para hacer las mediciones (u observaciones).
• Hay personal con mejor preparación.
• Puede variar las condiciones del estudio si se demora su ejecución.
• Conveniencia, es conveniente el uso de una muestra si el estudio ocasiona la destrucción de la
unidad estudiada.
Desventajas del muestreo

• Las estimaciones resultantes del muestreo están afectas al inevitable error de muestreo.
• La información proveniente de una muestra no proporciona información tipo inventario para cada
uno de los elementos de la población.
• Las estimaciones no pueden subdividirse para pequeños dominios de análisis, considerando que
no todos ellos pueden estar representados debidamente en la muestra.
• Requiere de personal especializado y experimentado.
Muestreo probabilístico
En el muestreo probabilístico, la selección de cada elemento de la muestra se hace siguiendo reglas
matemáticas de decisión. Todos los elementos de la población tienen una probabilidad real y conocida
de ser seleccionados. Existen diversos métodos de muestreo probabilístico como, por ejemplo:
Muestreo aleatorio simple

Se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo de una po-
blación que contiene un total de N unidades. Se garantiza que cada una de las muestras posibles tiene
la misma probabilidad de ser elegida.
Muestreo sistemático
Se selecciona un primer elemento aleatoriamente y, luego, los demás elementos que conformarán la
muestra cada cierto intervalo. Este muestreo supone que se cuenta con una enumeración completa
de los elementos de la población.
Muestreo estratificado
Se selecciona la muestra de los diversos estratos. Un estrato es una parte de la población, cuyos ele-
mentos tienen características similares. El objetivo de estratificar la población es buscar homogenei-
dad entre los estratos.
Muestreo aleatorio simple
En este procedimiento, se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de
muestreo de una población que contiene un total de N unidades.
Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.
Pasos por seguir para seleccionar una muestra simple aleatoria
1. Enumere las unidades del marco muestral con números sucesivos.

2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios.
El muestreo aleatorio simple presenta dos propiedades:
Representativo: Cada unidad tiene las mismas posibilidades de ser escogida.

Independencia: La selección de una unidad no influye en la selección de otras unidades.
Pero en el mundo real es difícil encontrar muestras completamente independientes y representativas.

Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método
no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta varias
veces a los que tienen varios números.
Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente,
información acerca del ingreso mensual (en soles) y años cumplidos en la empresa de cada uno de sus
trabajadores.
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las columnas C4,
C8, C11 y C15 de la tabla de números aleatorios.
Trabajadores registrados
Ingreso Ingreso Ingreso Años en la
Nº Años en la empresa Nº Años en la empresa Nº
(en soles) (en soles) (en soles) empresa
1 2300 5 51 2100 13 101 2400 16
2 2800 11 52 2100 9 102 1700 0
3 2400 4 53 1800 1 103 2500 12
4 2500 2 54 2000 9 104 1700 3
5 2300 3 55 2100 10 105 2400 17
6 2100 2 56 1900 4 106 2400 16
7 1700 2 57 2000 10 107 1900 7
8 2000 0 58 2300 11 108 1700 1
9 2200 7 59 2000 7 109 2100 6
10 2100 4 60 1700 1 110 2000 5
11 1700 0 61 1900 6 111 2000 3
12 2500 2 62 2000 9 112 2500 13
13 2800 13 63 2400 17 113 1700 0
14 2400 9 64 1700 0 114 2500 19
15 1700 1 65 1700 2 115 1700 3
16 2400 9 66 2400 17 116 2600 19
17 2200 10 67 2500 13 117 1600 1
18 2200 4 68 2600 16 118 1800 6
19 2300 10 69 2100 14 119 2100 10
20 2800 11 70 1900 7 120 1700 0
21 2100 7 71 2000 9 121 2400 16
22 1700 1 72 1800 7 122 2600 17
23 2500 6 73 2100 10 123 2100 10
24 2400 9 74 2300 12 124 2100 8
25 2700 17 75 2700 20 125 2400 17
26 1700 0 76 2800 20 126 1700 1
27 1600 2 77 1800 3 127 2600 20
28 2600 17 78 1700 5 128 2400 16
29 2500 13 79 1700 4 129 2700 17
30 2500 16 80 1700 0 130 2100 12
31 2700 17 81 1700 1 131 1600 0
32 1700 1 82 2100 6 132 2100 15
33 1600 1 83 2600 17 133 1900 5
34 2400 11 84 2400 9 134 2100 12
35 1900 3 85 2600 19 135 2200 12
36 1800 5 86 1900 7 136 2400 13
37 1800 3 87 1600 0 137 1800 4
38 2400 14 88 1900 3 138 2600 17
39 2600 16 89 2100 14 139 2700 20
40 2700 18 90 1700 0 140 2500 16
41 2100 11 91 2100 15 141 2500 16
42 2300 14 92 1700 1 142 1900 6
43 1700 0 93 2300 14 143 2100 15
44 2200 13 94 2500 16 144 1700 9
45 2900 20 95 2600 18 145 1500 0
46 1800 5 96 1900 3 146 1800 18
47 2100 16 97 2500 19 147 2100 10
48 2000 12 98 1800 6 148 2700 19
49 2000 12 99 1700 2 149 1800 9
50 2900 20 100 2000 10 150 2100 15
Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios. Como el marco muestral tiene 150 elementos usemos las
columnas C4, C5 y C6, para elegir números de tres cifras y luego C8, C9 y C10.
Los elementos seleccionados son:
Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149
Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Ejemplo 60
Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente,
información acerca del ingreso mensual (en soles) y años cumplidos en la empresa de cada uno de sus
trabajadores.
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio.
Use las columnas C4, C8, C11 y C15 de la tabla de números aleatorios.
Trabajadores registrados
1 2300 5 51 2100 13 101 2400 16
2 2800 11 52 2100 9 102 1700 0
3 2400 4 53 1800 1 103 2500 12
4 2500 2 54 2000 9 104 1700 3
5 2300 3 55 2100 10 105 2400 17
6 2100 2 56 1900 4 106 2400 16
7 1700 2 57 2000 10 107 1900 7
8 2000 0 58 2300 11 108 1700 1
9 2200 7 59 2000 7 109 2100 6
10 2100 4 60 1700 1 110 2000 5
11 1700 0 61 1900 6 111 2000 3
12 2500 2 62 2000 9 112 2500 13
13 2800 13 63 2400 17 113 1700 0
14 2400 9 64 1700 0 114 2500 19
15 1700 1 65 1700 2 115 1700 3
16 2400 9 66 2400 17 116 2600 19
17 2200 10 67 2500 13 117 1600 1
18 2200 4 68 2600 16 118 1800 6
19 2300 10 69 2100 14 119 2100 10
20 2800 11 70 1900 7 120 1700 0
21 2100 7 71 2000 9 121 2400 16
22 1700 1 72 1800 7 122 2600 17
23 2500 6 73 2100 10 123 2100 10
24 2400 9 74 2300 12 124 2100 8
25 2700 17 75 2700 20 125 2400 17
26 1700 0 76 2800 20 126 1700 1
27 1600 2 77 1800 3 127 2600 20
28 2600 17 78 1700 5 128 2400 16
29 2500 13 79 1700 4 129 2700 17
30 2500 16 80 1700 0 130 2100 12
31 2700 17 81 1700 1 131 1600 0
32 1700 1 82 2100 6 132 2100 15
33 1600 1 83 2600 17 133 1900 5
34 2400 11 84 2400 9 134 2100 12
35 1900 3 85 2600 19 135 2200 12
36 1800 5 86 1900 7 136 2400 13
37 1800 3 87 1600 0 137 1800 4
38 2400 14 88 1900 3 138 2600 17
39 2600 16 89 2100 14 139 2700 20
40 2700 18 90 1700 0 140 2500 16
41 2100 11 91 2100 15 141 2500 16
42 2300 14 92 1700 1 142 1900 6
43 1700 0 93 2300 14 143 2100 15
44 2200 13 94 2500 16 144 1700 9
45 2900 20 95 2600 18 145 1500 0
46 1800 5 96 1900 3 146 1800 18
47 2100 16 97 2500 19 147 2100 10
48 2000 12 98 1800 6 148 2700 19
49 2000 12 99 1700 2 149 1800 9
50 2900 20 100 2000 10 150 2100 15
Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios.
Como el marco muestral tiene 150 elementos usemos las columnas C4, C5 y C6, para elegir números de
tres cifras y luego C8, C9 y C10.
Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149

4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Ejercicios
163. Una empresa de 500 trabajadores se quiere elegir a 7 personas usando muestreo aleatorio
simple. Use las columnas C2, C5 y C12.
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Muestreo sistemático
En el muestreo sistemático se elige un elemento del marco muestral cada cierto intervalo. Este mues-
treo supone que se cuenta con una enumeración completa de los elementos de la población.
Procedimiento para seleccionar una muestra sistemática
1. Calcule el valor de k, donde:

𝑁
𝑘=
𝑛
El valor de k se redondea al valor del entero menor.
2. Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio (A).
3. A partir de este número elegido, seleccione el siguiente que ocupa la posición (A + k) del listado
del marco muestral y así sucesivamente hasta completar la muestra.
Ejemplo 61
Se tiene una población de 12 personas y se desea elegir a cuatro de ellas mediante un muestreo siste-
mático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C3, C6 y C12.
Solución
Calculemos el valor de k, donde:
𝑁 12
𝑘= = =3
𝑛 4
El valor de k se redondea al valor del entero menor, luego k = 3.
Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque aleatorio (A). Ob-
servando la columna C3 de la tabla de números aleatorios tenemos que A = 2.

4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la quinta
posición (3 + 2 = 5) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es
decir, elegiremos los datos de las posiciones 2, 5, 8 y 11.
Ejemplo 62
Se tiene una población de 15 personas y se desea elegir a seis de ellas mediante un muestreo sistemá-
tico. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C4, C8 y C1.
Solución
𝑁 15
𝑘= = = 2,5
𝑛 6
Seleccionemos aleatoriamente un número entero entre 1 y k = 2, llamado arranque aleatorio (A). Ob-
servando la columna C4 de la tabla de números aleatorios tenemos que A = 1.

4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la tercera
posición (1 + 2 = 3) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es
decir, elegiremos los datos de las posiciones 1, 3, 5, 7, 9 y 11.
Ejemplo 63
Se tiene información de 40 personas de un barrio de Lima Metropolitana. Obtenga una muestra alea-
toria de ocho personas usando el muestreo sistemático y elabore una tabla con los elementos selec-
cionados. Utilice las columnas C8; C10; C11 de la tabla de números aleatorios.
Individuos registrados
Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162
Solución
𝑁 40
𝑘= = =5
𝑛 8

Seleccionemos aleatoriamente un número entero entre 1 y k = 5, llamado arranque aleatorio (A).
Observando la columna C8 de la tabla de números aleatorios tenemos que A = 5.

4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la décima
posición (5 + 5 = 10) del listado del marco muestral y así sucesivamente hasta completar la muestra.
Es decir, elegiremos los datos de las posiciones 5, 10, 15, 20, 25, 30, 35 y 40.
Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura

1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162
Ejercicios
164. Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la

tabla que se muestra a continuación información acerca de las variables: ingreso mensual (en so-
les), nivel de educación y años cumplidos en la empresa.
Años en
Ingreso Nivel de Años en Ingreso Nivel de Años en Ingreso Nivel de
Nº Nº Nº em-
(soles) educación empresa (soles) educación empresa (soles) educación
presa
1 2300 Secundaria 5 51 2100 Técnica 13 101 2400 Técnica 16
11 1700 Secundaria 1 61 1900 Técnica 6 111 2000 Superior 3
41 2100 Técnica 11 91 2100 Técnica 15 141 2500 Superior 16
Aplique el muestreo sistemático para seleccionar una muestra de ocho empleados y elabore un listado
con los elementos seleccionados. Utilice la columna C3, C9, y C12 de la tabla de números aleatorios. Con
la muestra obtenido, calcule el porcentaje muestral de trabajadores con ingresos mayores a 2000 so-
les.
Solución
Muestreo estratificado
Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de sus
elementos.
El objetivo de estratificar la población es buscar homogeneidad entre los estratos.
Pasos a seguir para seleccionar una muestra estratificada
1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a todos
los elementos de la población y que cada elemento pertenezca solamente a un estrato.
2. Calcule la cantidad de elementos a seleccionar en cada estrato.
3. Seleccione muestras aleatorias simples para cada uno de los estratos.
Recomendaciones para el uso de muestras estratificadas
• Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén rela-
cionadas entre sí.
• No se considera la formación de muchos estratos, generalmente se usa entre tres y ocho estratos.
• Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto, pueden no ser
considerados.
Ejemplo 64
La siguiente tabla muestra a los 120 alumnos de la especialidad de Comunicaciones, de la universidad
A, a quienes se les preguntó por su aplicación preferida para escuchar música y por la cantidad de
horas a la semana que la usaba.
Posición App Horas Posición App Horas Posición App Horas

1 Spotify 8 41 Spotify 16 81 YouTube Music 14
8 Spotify 10 48 Spotify 9 88 Amazon Music 6
27 Spotify 5 67 YouTube Music 7 107 Amazon Music 9
Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable
<aplicación preferida> como variable de estratificación. Elabore un listado con el alumno seleccionado
y la cantidad de horas a la semana que escucha música con la aplicación de su preferencia. Para el
estrato 1 use las columnas C1, C5 y C9, para el estrato 2 use las columnas C7, C3, C8 y C15 y para el
estrato 3 use C12, C5, C8, C14, C1, y C7. Con la muestra obtenida calcule el promedio de horas a la
semana que los alumnos escuchan música con la aplicación de su preferencia.
Solución
Posición 𝑵𝒉
Estrato 𝑵𝒉 𝒏𝒉 = ×𝒏
(desde – hasta) 𝑵
𝑁# 66
1. Spotify N1 = 66 1 - 66 𝑛# = ×𝑛 = × 12 = 6,6 ≈ 7
𝑁 120
𝑁$ 21
2. Youtube Music N2 = 21 67 - 87 𝑛$ = ×𝑛 = × 12 = 2,1 ≈ 2
𝑁 120
𝑁) 33
3. Amazon Music N3 = 33 88 - 120 𝑛) = ×𝑛 = × 12 = 3,3 ≈ 3
𝑁 120
Total N = 120 𝑛 = 12
Posición App Horas Posición App Horas Posición App Horas

Estrato 1: Estrato 2: Estrato 3:

Spotify YouTube Music Amazon Music
Posición Horas Posición Horas Posición Horas
48 9 84 15 119 6
2 9 73 3 110 11
16 4 100 4
29 7
61 6
13 4
45 4
Entonces, con los doce elementos seleccionados en la muestra se tiene que la media muestral de horas
a la semana que los alumnos escuchan música a través de la aplicación de su preferencia es 6,83 horas.

4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Ejemplo 65
La empresa de telecomunicaciones RTV tiene 120 empleados de los cuales tiene información de las
variables: ingreso en soles, nivel de educación y años en la empresa.
Años
Ingreso Años Ingreso Nivel de Ingreso Años
Nivel de cumplidos Nivel de edu-
Nº (en so- cumplidos Nº (en so- educa- Nº (en so- cumplidos
educación en la em- cación
les) en la empresa les) ción les) en la empresa
presa
Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como variable
de estratificación el nivel educacional. Elabore un listado identificando la posición de cada empleado
seleccionado. Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9,
C10 y C11 y para el estrato 3 use las columnas C4, C3, C5 y C7.
Solución
Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3 son:
secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos mues-
tras aleatorias simples.
Números de elemen- Posiciones #!

Estratos Cantidad seleccionada por estrato 𝑛" = ×𝑛
tos en el estrato 𝑁" (desde – hasta) $
𝑁% 30
1. Secundaria 𝑁% = 30 1 – 30 𝑛% = ×𝑛 = × 16 = 4
𝑛 120
𝑁& 50
2. Técnica 𝑁& = 50 31 – 80 𝑛& = ×𝑛 = × 16 = 6,67 ≈ 7
𝑛 120
𝑁' 40
3. Superior 𝑁' = 40 81 – 120 𝑛' = ×𝑛 = × 16 = 5,33 ≈ 5
𝑛 120
Total 𝑵 = 120 𝒏 = 16
Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y C5.
Observemos que las posiciones de los elementos a elegir están entre el 1 y el 30.
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
Luego, el cuadro con las posiciones de los elementos seleccionados para el estrato Secundaria es:
Estrato Secundaria Posición 2 16 29 13
Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10 y C11.

4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:
Estrato Técnica Posición 54 62 66 77 48 67 44
Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y C7.

4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:
Estrato Superior Posición 114 81 97 105 83
Años
Ingreso Años Ingreso Nivel de Ingreso Años
Nivel de cumplidos Nivel de edu-
Nº (en so- cumplidos Nº (en so- educa- Nº (en so- cumplidos
educación en la em- cación
les) en la empresa les) ción les) en la empresa
presa
Ejercicios
165. Objetivo específico: Determinar los clientes a seleccionar para realizar un estudio sobre me-
joras en el servicio de mantenimiento.
Juan Pérez, dueño de un taller de mantenimiento de multimarca desea aplicar

técnicas estadísticas que le permitan mejoras en el servicio de mantenimiento,
para ello ha decidido realizar una encuesta a 11 clientes entre los 150 clientes
atendidos en el último mes, indicando la posición del dato seleccionado y el va-
lor de las variables solicitadas de acuerdo con los siguientes tipos de muestreo.
a. Usando muestreo aleatorio simple, calcule el porcentaje de autos Hyundai seleccionados en su

muestra. De la tabla de números aleatorios use las columnas: C4, C1, C12, C5, C13, C7, C15 y C10.
b. Usando muestreo aleatorio sistemático, calcule el porcentaje de clientes que pagaron más de 300
soles seleccionados en su muestra. De la tabla de números aleatorios use la columna C7.
c. Se desea estimar el pago promedio usando muestreo aleatorio estratificado. Use las columnas de
números aleatorios que se indican: Afinamiento, C17, C2, C15, C4, C13, C6, C11, C1; Dirección: C7,
C12, C5, C4, C3, C16, C2, C9; Frenos: C6, C2, C5, C14, C3, C16, C18, C1; Luces: C3, C12, C5, C17, C7,
C9, C1,C6, C8, C10; Nivelación: C13, C12, C5, C7, C17, C1, C3, C8, C4
La siguiente tabla muestra a los 150 clientes del taller de mantenimiento atendidos en el último mes.
Servicio so- Servicio Servicio

N° Marca Tipo licitado Pago N° Marca Tipo solicitado Pago N° Marca Tipo solicitado Pago
1 Toyota Auto Afinamiento 514 51 Honda Camioneta Dirección 496 101 Mitsubishi Camioneta Luces 716
2 Nissan Auto Afinamiento 289 52 Hyundai Camioneta Dirección 324 102 Hyundai Auto Luces 403
3 Hyundai Camioneta Afinamiento 480 53 Hyundai Camioneta Dirección 623 103 Mitsubishi Camioneta Luces 556
4 Honda Camioneta Afinamiento 419 54 Nissan Camioneta Dirección 478 104 Honda Auto Luces 362
5 Mitsubishi Auto Afinamiento 354 55 Toyota Camioneta Dirección 441 105 Hyundai Auto Luces 417
6 Hyundai Camioneta Afinamiento 404 56 Hyundai Auto Dirección 476 106 Hyundai Auto Luces 504
7 Nissan Camioneta Afinamiento 542 57 Toyota Camioneta Dirección 413 107 Hyundai Auto Luces 379
8 Hyundai Camioneta Afinamiento 408 58 Nissan Auto Dirección 512 108 Honda Camioneta Luces 457
9 Hyundai Camioneta Afinamiento 385 59 Nissan Auto Dirección 440 109 Mitsubishi Camioneta Luces 449
10 Mitsubishi Camioneta Afinamiento 419 60 Mitsubishi Auto Dirección 472 110 Hyundai Camioneta Luces 458
11 Hyundai Camioneta Afinamiento 598 61 Nissan Camioneta Dirección 556 111 Nissan Auto Luces 443
12 Hyundai Camioneta Afinamiento 366 62 Mitsubishi Camioneta Dirección 380 112 Hyundai Auto Luces 505
13 Nissan Auto Afinamiento 380 63 Honda Camioneta Frenos 703 113 Hyundai Auto Luces 434
14 Honda Auto Afinamiento 479 64 Honda Auto Frenos 462 114 Honda Auto Luces 380
15 Hyundai Auto Afinamiento 466 65 Nissan Auto Frenos 414 115 Nissan Camioneta Luces 522
16 Nissan Auto Afinamiento 387 66 Toyota Auto Frenos 326 116 Hyundai Camioneta Luces 544
17 Mitsubishi Camioneta Afinamiento 435 67 Honda Auto Frenos 193 117 Nissan Auto Luces 576
18 Honda Auto Afinamiento 426 68 Honda Camioneta Frenos 604 118 Honda Camioneta Luces 452
19 Toyota Auto Afinamiento 528 69 Honda Auto Frenos 524 119 Hyundai Auto Luces 558
20 Nissan Auto Afinamiento 475 70 Hyundai Auto Frenos 348 120 Mitsubishi Camioneta Luces 335
21 Honda Camioneta Afinamiento 517 71 Hyundai Auto Frenos 390 121 Nissan Auto Luces 375
22 Hyundai Auto Afinamiento 600 72 Toyota Auto Frenos 586 122 Toyota Camioneta Luces 468
23 Nissan Auto Afinamiento 229 73 Honda Camioneta Frenos 482 123 Hyundai Auto Luces 424
24 Honda Camioneta Afinamiento 434 74 Nissan Auto Frenos 450 124 Mitsubishi Auto Luces 496
25 Mitsubishi Camioneta Afinamiento 370 75 Hyundai Auto Frenos 538 125 Nissan Auto Nivelación 437
26 Toyota Auto Afinamiento 436 76 Hyundai Auto Frenos 245 126 Hyundai Auto Nivelación 458
27 Hyundai Auto Afinamiento 385 77 Nissan Auto Frenos 331 127 Mitsubishi Auto Nivelación 382
28 Toyota Auto Afinamiento 472 78 Nissan Auto Frenos 457 128 Nissan Auto Nivelación 464
29 Hyundai Camioneta Afinamiento 479 79 Toyota Auto Frenos 503 129 Mitsubishi Auto Nivelación 592
30 Hyundai Auto Afinamiento 483 80 Mitsubishi Auto Frenos 487 130 Toyota Auto Nivelación 403
31 Toyota Camioneta Afinamiento 366 81 Toyota Auto Frenos 206 131 Honda Auto Nivelación 455
32 Honda Auto Afinamiento 410 82 Toyota Camioneta Frenos 465 132 Toyota Camioneta Nivelación 394
33 Hyundai Auto Afinamiento 432 83 Hyundai Camioneta Frenos 341 133 Nissan Auto Nivelación 387
34 Hyundai Auto Afinamiento 333 84 Toyota Camioneta Frenos 421 134 Hyundai Auto Nivelación 559
35 Nissan Auto Afinamiento 484 85 Honda Auto Frenos 269 135 Mitsubishi Camioneta Nivelación 394
36 Toyota Auto Dirección 235 86 Toyota Auto Frenos 540 136 Honda Auto Nivelación 442
37 Honda Camioneta Dirección 800 87 Hyundai Auto Frenos 531 137 Toyota Camioneta Nivelación 589
38 Hyundai Auto Dirección 519 88 Hyundai Auto Frenos 529 138 Honda Auto Nivelación 489
39 Honda Auto Dirección 315 89 Honda Camioneta Frenos 499 139 Honda Camioneta Nivelación 580
40 Mitsubishi Camioneta Dirección 445 90 Mitsubishi Auto Frenos 474 140 Hyundai Auto Nivelación 322
41 Hyundai Auto Dirección 555 91 Toyota Camioneta Frenos 434 141 Hyundai Auto Nivelación 414
42 Hyundai Camioneta Dirección 479 92 Honda Camioneta Luces 371 142 Honda Auto Nivelación 382
43 Toyota Auto Dirección 497 93 Nissan Auto Luces 800 143 Toyota Auto Nivelación 542
44 Honda Camioneta Dirección 380 94 Honda Auto Luces 421 144 Nissan Auto Nivelación 394
45 Hyundai Auto Dirección 455 95 Nissan Camioneta Luces 583 145 Hyundai Camioneta Nivelación 558
46 Nissan Camioneta Dirección 505 96 Honda Camioneta Luces 400 146 Honda Camioneta Nivelación 393
47 Mitsubishi Auto Dirección 463 97 Hyundai Auto Luces 351 147 Hyundai Camioneta Nivelación 256
48 Hyundai Camioneta Dirección 361 98 Mitsubishi Auto Luces 385 148 Toyota Auto Nivelación 278
49 Hyundai Auto Dirección 630 99 Hyundai Camioneta Luces 377 149 Hyundai Auto Nivelación 290
50 Hyundai Camioneta Dirección 585 100 Honda Camioneta Luces 331 150 Mitsubishi Camioneta Nivelación 555
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Propiedad reproductiva de la normal

Igual que sucede con otras distribuciones, como la de Bernoulli, la binomial o la de Poisson, la variable
aleatoria de la distribución normal es reproductiva; esto quiere decir que, si sumamos variables alea-
torias de distribución normal, la variable suma también es otra variable de distribución normal.
La reproductividad de la variable normal nos asegura que un histograma de estos valores tendrá el
aspecto de la curva de Gauss. La forma de saber los parámetros concretos (media y desviación están-
dar) de la variable suma nos la da el siguiente resultado teórico.
Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes, tales que:
𝑋! ~𝑁(𝜇! , s$! )
para cada 𝑖 = 1, 2, 3, ⋯ , 𝑛; entonces, la variable aleatoria Y está distribuida normalmente.
𝑆 = 𝑐# 𝑋# + 𝑐$ 𝑋$ + ⋯ + 𝑐7 𝑋7 = • 𝑐! 𝑋! ~𝑁(𝜇d ; 𝜎d$ )
!6#
donde 𝑐# , 𝑐$ , … , 𝑐7 son constantes.
Media
7
𝐸(𝑆) = 𝜇d = 𝑐# 𝜇# + 𝑐$ 𝜇$ + ⋯ + 𝑐7 𝜇7 = • 𝑐! 𝜇!
!6#
Varianza
7
𝑉(𝑆) = 𝜎d$ = 𝑐#$ 𝜎#$ + 𝑐$$ 𝜎$$ + ⋯+ 𝑐7$ 𝜎7$ = • 𝑐!$ 𝜎!$
!6#
Como caso particular, si tenemos que 𝑐! = 1.
7 7 7
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 = • 𝑋! ~𝑁 ¡• 𝜇! ; • 𝜎!$ ¢
!6# !6# !6#
Como casos particulares, si 𝑋# y 𝑋$ tienen distribuciones normales 𝑋# ~𝑁(𝜇# ; 𝜎#$ ) y 𝑋$ ~𝑁(𝜇$ ; 𝜎$$ )
respectivamente, entonces:
𝑆 = 𝑋# + 𝑋$ ~𝑁(𝜇# + 𝜇$ ; 𝜎#$ + 𝜎$$ )
𝑆 = 𝑋# − 𝑋$ ~𝑁(𝜇# − 𝜇$ ; 𝜎#$ + 𝜎$$ )

Ejemplo 66
Dos supermercados compiten por tomar el liderazgo del mercado. Un estudio reciente de una compa-
ñía de investigación de mercado estimó que las ventas diarias (en miles de dólares) de los dos super-
mercados se distribuyen normalmente con medias de 15 y 17 y desviaciones estándar de 3 y 4 respec-
tivamente.
a. Calcule la probabilidad de que el segundo supermercado obtenga mayores ventas que el primer
supermercado en el primer día.
b. Calcule la probabilidad de que la diferencia entre las ventas diarias de ambos supermercados no
supere los 1000 dólares.
Solución
a. Calcule la probabilidad de que el segundo supermercado obtenga mayores ventas que el primer
supermercado en el primer día.
Solución
Sean las variables:
𝑋: = ventas diarias del primer supermercado
𝑋~𝑁(15; 9)
𝑌: = ventas diarias del segundo supermercado
𝑌~𝑁(17; 16)
Se pide:
𝑃(𝑌 > 𝑋) = 𝑃(𝑌 − 𝑋 > 0)
Sea la variable:
𝑊 =𝑌−𝑋
Por la propiedad reproductiva de la distribución normal, se tiene:
𝑊~𝑁(1 × 17 + (−1) × 15; (1)$ × 16 + (−1)$ × 9)
𝑊~𝑁(2; 25)
𝑊−2 0−2
𝑃(𝑌– 𝑋 > 0) = 𝑃(𝑊 > 0) = 𝑃 k > l
5 5
= 𝑃(𝑍 > −0,4) = 1 − 0,34458 = 0,65542

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
b. Calcule la probabilidad de que la diferencia entre las ventas diarias de ambos supermercados no
supere los 1000 dólares.
Solución
En este caso, se pide calcular la probabilidad de la diferencia entre las ventas de los supermercados
sea menor o igual a 1000 dólares.
𝑃(|𝑊| ≤ 1)
= 𝑃(−1 ≤ 𝑊 ≤ 1)
−1 − 2 𝑊 − 2 1 − 2
= 𝑃k ≤ ≤ l
5 5 5
= 𝑃(−0,6 ≤ 𝑍 ≤ −0,2) = 0,42074 − 0,27425 = 0,14649
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
En Excel, se usa la función =DISTR.NORM.N(1;2;5;1)-DISTR.NORM.N(-1;2;5;1)

Ejemplo 67
Caso Metropolitano
El peso de un usuario hombre del Metropolitano se modela con una variable normal con media de 75
kilos y desviación estándar de 15 kilos, mientras que para una usuaria mujer con media de 60 kilos y
desviación estándar de 10 kilos. Si en un bus hay 50 hombres y 30 mujeres.
a. Si se elige una persona al azar, calcule la probabilidad de que pese más de 70 kilos.
b. Calcule la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere 5500 kilos.
Solución
a. Si se elige una persona al azar, calcule la probabilidad de que pese más de 70 kilos.
Solución
Sean los eventos:
𝐴: = una persona pese más de 70 kilos
𝐻: = Que el usuario sea hombre
50
𝑃(𝐻) = = 0,625
80
𝑀: = Que el usuario sea mujer
30
𝑃(𝑀) = = 0,375
80
Sean las variables aleatorias:
𝑋: = peso de un hombre
𝑋~𝑁(75; 15$ )
𝑌: = peso de una mujer
𝑌~𝑁(60; 10$ )
Usaremos teorema de la probabilidad total:
𝑃(𝐴) = 𝑃(𝐻)𝑃(𝐴/𝐻) + 𝑃(𝑀)𝑃(𝐴/𝑀)
Calculemos cada una de las probabilidades condicionadas
𝑃(𝐴⁄𝐻) = 𝑃(𝑋 > 70) = 1 − 𝑃(𝑍 < −0,33) = 1 − 0,37070 = 0,6293
z -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00

-0,4 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
𝑃(𝐴⁄𝑀 ) = 𝑃(𝑌 > 70) = 1 − 𝑃(𝑍 < 1) = 1 − 0,8413 = 0,1587
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08

0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100
Luego:
𝑃(𝐴⁄𝐻) = 0,6293
𝑃(𝐻) = 0,625
𝑃(𝐴K ⁄𝐻 ) = 0,3707
𝑃(𝐴⁄𝑀) = 0,1587
𝑃(𝑀) = 0,375
𝑃(𝐴K ⁄𝑀) = 0,8413
𝑃(𝐴) = 𝑃(𝐻)𝑃(𝐴⁄𝐻) + 𝑃(𝑀) 𝑃(𝐴⁄𝑀)
= 0,625 × 0,6293 + 0,375 × 0,1587 = 0,4528
b. Calcule la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere 5500 kilos.
Solución
Sea 𝑌: = el peso total de los 50 hombres y 30 mujeres
H, ),
𝑌 = • 𝑋! + • 𝑌!
!6# !6#
Por propiedad reproductiva de la normal, se tiene que:
𝑌~𝑁(50 × 75 + 30 × 60; 50 × 15$ + 30 × 10$ )
Es decir:
𝑌~𝑁(5550; 14250)
La probabilidad pedida es la probabilidad de que el peso total de los 50 hombres y 30 mujeres

supere 5500 kilos.
𝑃(𝑌 > 5500)
Estandarizando:
𝑌 − 5550 5500 − 5550

= 𝑃k > l
√14250 √14250
= 𝑃(𝑍 > −0,42)
= 1 − 𝑃(𝑍 ≤ −0,42)
z -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00

-0,5 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
= 1 − 0,33724 = 0,66276

En Excel, se usa la función =1-DISTR.NORM.N(5500;5550;RAIZ(14250);1)
Ejercicios
166. Si 𝑋# , 𝑋$ son dos variables normales, tales que:
𝑋# ~𝑁(µ# = 8, 𝜎#$ = 12)

𝑋$ ~𝑁Nµ$ = 10, 𝜎$$ = 20O
Indique la distribución de la variable 𝑆 y sus parámetros.
a. 𝑆 = 𝑋# + 𝑋$
𝑆 = 𝑋# + 𝑋$ ~ 𝑁(… ; … )
𝑆 ~ 𝑁(… ; … )
b. 𝑆 = 𝑋# − 𝑋$
𝑆 = 𝑋# − 𝑋$ ~ 𝑁(… ; … )
𝑆 ~ 𝑁(… ; … )
167. En un estudio de evaluación de la atención de un servicio de cafeterías, los tiempos, en minutos,

que tardan en atender a un cliente las cafeterías A y B se modelaron con las variables aleatorias
𝑋~𝑁(4,9) y 𝑌~𝑁(5,16) respectivamente y de manera independiente. Si en cada cafetería son
atendidas 20 personas, halle la probabilidad de que el tiempo total de atención en la cafetería B
sea mayor que el de la cafetería A. Rpta. 0,81327
168. Una familia tiene tres hijos. El monto de la propina semanal que se le da a cada hijo puede mode-
larse como una variable normal. Al menor se le da en media 23,5 soles por semana con una des-
viación estándar de 3 soles, al segundo hijo se le da el doble que al menor y al mayor se le da el
triple que al menor. Calcular la probabilidad de que en cuatro semanas la suma total recibida en
propinas por los tres sume más de 600 soles. Rpta. 0,15866
169. El peso de los pasajeros adultos de un avión se modela con una variable normal:
• en mujeres, con media 65 kilos y desviación estándar 15 kilos.
• en hombres, con media 80 kilos y desviación estándar 20 kilos.
a. Si la probabilidad de que 10 pasajeras mujeres y 10 pasajeros hombres pesen más de 1500
kilos es mayor a 0,3 se va a restringir la cantidad de pasajeros en las avionetas pequeñas.
Indique lo que hará la compañía.
b. En un avión el 60% de los pasajeros son hombres. Si la probabilidad de que una persona pese
más de 75 kilos es mayor a 0,3 se restringirá el peso de los equipajes de mano. Indique lo que
se hará.
Distribución muestral de un estadístico

Es la lista de posibles valores de un estadístico y la probabilidad asociada a cada valor.
Distribución de la media muestral de una población normal
Si 𝑋# , 𝑋$ , … , 𝑋7 son 𝑛 variables independientes con distribución normal, tales que 𝑋! con media µ y
varianza 𝜎 $ , entonces la distribución de la variable media muestral 𝑋h es la siguiente:
𝑋# + 𝑋$ + ⋯ + 𝑋7
𝑋h = ~𝑁N𝜇?e ; 𝜎?$e O
𝑛
Â
Media de la variable media muestral 𝑿
𝜇?e = 𝜇
Â
Varianza de la variable media muestral 𝑿
𝜎$
𝜎?$e =
𝑛
Es decir:
𝑋# + 𝑋$ + ⋯ + 𝑋7 𝜎$
𝑋h = ≈ 𝑁 š𝜇; ›
𝑛 𝑛
Distribución de la media muestral de una población no normal (Teorema del

límite central)
Si 𝑋# , 𝑋$ , … , 𝑋7 son 𝑛 variables independientes e igualmente distribuidas, tales que 𝑋! con media 𝜇 y

varianza 𝜎 $ , entonces la variable aleatoria 𝑋h tiene una distribución aproximadamente normal a me-
dida que 𝑛 crece, independientemente de la distribución de la población.
La distribución muestral de la media muestral (𝑋h) se aproxima a la distribución normal si 𝑛 ³ 30.
𝑋# + 𝑋$ + ⋯ + 𝑋7
𝑋h = ≈ 𝑁N𝜇?e ; 𝜎?$e O
𝑛
Â
Media de la variable media muestral 𝑿
𝜇?e = 𝜇
Â
Varianza de la variable media muestral 𝑿
𝜎$
𝜎?$e =
𝑛
Es decir:
𝑋# + 𝑋$ + ⋯ + 𝑋7 𝜎$
𝑋h = ≈ 𝑁 š𝜇; ›
𝑛 𝑛
Distribución de la suma muestral de una población normal
Si 𝑋# , 𝑋$ , … , 𝑋7 son 𝑛 variables independientes con distribución normal, tales que 𝑋! con media µ y
varianza 𝜎 $ , entonces la distribución de la variable suma muestral 𝑋h, por propiedad reproductiva de
la normal, es la siguiente:
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ~𝑁(𝜇d ; 𝜎d$ )
Media de la variable suma muestral 𝑺

𝜇d = 𝑛𝜇
Varianza de la variable suma muestral 𝑺

𝜎d$ = 𝑛𝜎 $
Es decir:
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ~𝑁(𝑛𝜇; 𝑛𝜎 $ )
Distribución de la suma muestral de una población no normal (Teorema del

límite central)
Si 𝑋# , 𝑋$ , … , 𝑋7 son 𝑛 variables independientes e igualmente distribuidas, tales que 𝑋! con media 𝜇 y

varianza 𝜎 $ , entonces la variable aleatoria 𝑆 tiene una distribución aproximadamente normal a me-
dida que 𝑛 crece, independientemente de la distribución de la población.
La distribución de la suma muestral 𝑆 se aproxima a la distribución normal si 𝑛 ³ 30.
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ≈ 𝑁(𝜇d ; 𝜎d$ )
Media de la variable suma muestral 𝑺

𝜇d = 𝑛𝜇
Varianza de la variable suma muestral 𝑺

𝜎d$ = 𝑛𝜎 $
Es decir:
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ≈ 𝑁(𝑛𝜇; 𝑛𝜎 $ )
Ejemplo 68
Caso Metropolitano
El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia, queja o re-
clamo. El número de correos electrónicos que llegan a la cuenta de correo se modela como una varia-
ble aleatoria Poisson con una media de ocho correos por día.
Si se eligen al azar 100 días, calcule la probabilidad que la cantidad total de correos recibidos en esos
100 días esté entre 790 y 810.
Solución
Sea
𝑋! = número de correos electrónicos que llegan a la cuenta de correo del Metropolitano en el día, 𝑖 =
1, … ,100
𝑋! ~𝑃(𝜆 = 8)
Por lo tanto, de las propiedades de la distribución de 𝑋 sabemos que:
𝜇 = 𝐸(𝑋) = 𝜆 = 8
𝜎 $ = 𝑉(𝑋) = 𝜆 = 8
Sea Y := cantidad total de correos en los 100 días
#,,
𝑆 = • 𝑋!
!6#
Usaremos el teorema central del límite.
Usando la distribución de la suma muestral:
Por teorema central del límite, se tiene que:
𝑆 ≈ 𝑁(𝑛𝜇; 𝑛𝜎 $ )
Reemplazando los valores, se tiene que:
𝑆 ≈ 𝑁(𝑛𝜇 = 100 × 8; 𝑛𝜎 $ = 100 × 8)
𝑆 ≈ 𝑁(800; 800)
𝑃(790 < 𝑆 < 810)

= 𝑃(−0,35 < 𝑍 < 0,35)
= 0,63683 − 0,36317 = 0,27366
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
En Excel, se usa la función:

=DISTR.NORM.N(810;800;RAIZ(800);1)-DISTR.NORM.N(790;800; RAIZ(800);1)
Usando la distribución de la distribución de la media muestral
𝑃(790 < 𝑆 < 810)
Si dividimos la suma 𝑆 entre el tamaño de muestra 𝑛 = 100, obtendremos la media muestral 𝑋h.
790 𝑆 810
= 𝑃k < < l
100 100 100
= 𝑃(7,9 < 𝑋h < 8,1)
Por teorema central del límite:

𝜎$
𝑋h ≈ 𝑁 š𝜇, ›
𝑛
Reemplazando los valores tendremos:
𝜎$ 8
𝑋h ≈ 𝑁 š𝜇 = 8, = ›
𝑛 100
𝑋h ≈ 𝑁(8; 0,08)
Volviendo a la probabilidad pedida:
𝑃(790 < 𝑆 < 810)

= 𝑃(7,9 < 𝑋h < 8,1)
7,9 − 8 8,1 − 8
= 𝑃k <𝑍< l
√0,08 √0,08
= 𝑃(−0,35 < 𝑍 < 0,35)
= 0,63683 − 0,36317 = 0,27366
En Excel, se usa la función:

=DISTR.NORM.N(8.1;8;RAIZ(0.08);1)-DISTR.NORM.N(7.9;8; RAIZ(0.08);1).
Ejemplo 69
Caso Metropolitano
Se define la variable aleatoria 𝑋: = número de días a la semana que un usuario usa el Metropolitano.
Esta variable presenta la siguiente función de probabilidad.
𝑿: = número de días 0 1 2 3 4 5 6 7
𝒇(𝒙) 0,05 0,10 0,15 0,15 0,20 0,25 0,05 0,05
Si se elige al azar una muestra de 1000 usuarios, calcule la probabilidad de que la media muestral del
número de días que usan el Metropolitana esté entre 3,5 y 3,6 días. Si esta probabilidad supera a 0,6
entonces se mantendrá la cantidad de buses actual.
Solución
Interpretación
Determinar si se mantendrá la cantidad de buses actual.
Representación
Definamos las variables necesarias:
𝑋: = número de días a la semana que un usuario usa el Metropolitano.
𝜎$
𝑋 ≈ 𝑁 š𝜇, ›
𝑛
𝑋h: = media muestral del número de días a la semana que un usuario usa el Metropolitano.
𝜎$
𝑛
Cálculo
Para resolver el problema necesita establecer los parámetros de la distribución de la variable media
muestral 𝑋h, por ello necestamos calcular 𝜇 y 𝜎 $ .
Calculemos la media de 𝑋.
𝜇 = 𝐸(𝑋) = • 𝑥𝑓(𝑥)
D6,
= 0 × 𝑓(0) + ⋯ + 7 × 𝑓(7)
= 0 × 0,05 + ⋯ + 7 × 0,05
𝜇 = 𝐸(𝑋) = 3,55
Calculemos la varianza de 𝑋.
$
𝜎 $ = 𝑉(𝑋) = 𝐸(𝑋 $ ) − N𝐸(𝑋)O
= • 𝑥 $ 𝑓(𝑥) − 3,55$
D6,
= (0$ × 0,05 + ⋯ + 7$ × 0,05) − 3,55$ = 3,1475
𝜎 $ = 𝑉(𝑋) = 3,1475
Ya mencionamos que la distribución de la variable media muestral 𝑋h es:
𝜎$
𝑛
Reemplazando los valores en dicha expresión, tenemos que:
𝜎 $ 3,1475
𝑋h ≈ 𝑁 š𝜇 = 3,55, = ›
𝑛 1000
𝑋h ≈ 𝑁(3,55; 0,0031475)
𝑃(3,5 < 𝑋h < 3,6)
Estandarizando, se tiene que:

3,5 − 3,55 𝑋h − 3,55 3,6 − 3,55

= 𝑃š < < ›
-0,0031475 -0,0031475 -0,0031475
= 𝑃(−0,89 < 𝑍 < 0,89)
= 0,81327 − 0,18673 = 0,62654
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
En Excel, se usa la función

=DISTR.NORM.N(3.6;3.55;RAIZ(0.0031475);1)-DISTR.NORM.N(3.5;3.55;RAIZ(0.0031475);1)
La probabilidad pedida es 0,62654, que es mayor a 0,6. Por lo tanto, se mantendrá la cantidad de buses
actual.
Ejemplo 70
Caso Metropolitano
El tiempo de espera para tomar un bus de un usuario se modela con una variable uniforme con pará-
metros 0 y 10 minutos. Si la probabilidad de que la media del tiempo de espera de esos 500 usuarios
seleccionados al azar es mayor a 5,2 minutos supera al 10%, entonces, se va a aumentar la cantidad
de buses.
Solución
Interpretación
Determinar si se va a aumentar la cantidad de buses.
Representación
Definamos las variables necesarias:
𝑋: = tiempo de espera de un usuario
𝑋~𝑈(𝑎 = 0, 𝑏 = 10)
𝑋h: = media muestral del tiempo de espera de un usuario

𝜎$
𝑛
Cálculo
Por propiedad de la variable uniforme, se tiene que:
𝑎 + 𝑏 0 + 10
𝜇= = =5
2 2
(𝑏 − 𝑎)$ (10 − 0)$

𝜎$ = = = 8,3333
12 12
Por teorema central del límite, se tiene que la distribución de la media muestral 𝑋h es:
𝜎$
𝑛
Reemplazando los valores:
𝜎 $ 8,3333
𝑋h ≈ 𝑁 š𝜇 = 5, = ›
𝑛 500
𝑋h ≈ 𝑁(5; 0,01667)
𝑃(𝑋h > 5,2)
Estandarizando, se tiene:
𝑋h − 5 5,2 − 5
= 𝑃š > ›
√0,01667 √0,01667
= 𝑃(𝑍 > 1,55) = 1 − 0,93943 = 0,06069
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
En Excel, se usa la función: =1-DISTR.NORM.N(5.2;5;RAIZ(0.01667);1)
La probabilidad de que la media del tiempo de espera de esos 500 usuarios seleccionados al azar es
mayor 5,2 minutos es es 0,06069, que no supera a 0,1 (10%). Por lo tanto, no se aumentará la cantidad
de buses.
Ejercicios
170. Según los Censos Nacionales del 2017, la media de la edad de los peruanos es 31,51 años y la
desviación estándar es 21,27. Si se toma una muestra de 5000 personas, calcule la probabilidad
de que la media muestral esté entre 31,4 y 31,6 años. Asuma que la edad sigue una distribución
normal.
171. La cantidad de mango que exporta una empresa mensualmente se modela con una variable alea-
toria con media de 25 toneladas y desviación estándar de cuatro toneladas. Calcular la probabili-
dad de que la cantidad exportada en tres años sea menor a 920 toneladas. Asuma independencia
entre las cantidades mensuales exportadas. Rpta. 0,79673
172. El tiempo, en segundos, que tarda un auxiliar de vuelo, en segundos, en servir las bebidas a un
pasajero se modela con una variable aleatoria 𝑋 con la siguiente función de densidad:
𝑎(20 − 𝑥) 10 ≤ 𝑥 ≤ 20
𝑓(𝑥) = —
Si la probabilidad de que un auxiliar de vuelo se demore más de 22 minutos al servir a 100 pasa-
jeros es mayor a 0,7 se adelantará el momento de entregar las bebidas. Indique la decisión.
Solución
Interpretación
Representación
Cálculo
173. Según los Censos Nacionales del 2017, la media de la cantidad de habitaciones por vivienda es 2,9
habitaciones y la desviación estándar es 1,76. Si se toma una muestra de 6000 viviendas, calcule
la probabilidad de que la media muestral del número de habitaciones esté entre 2,88 y 2,92 habi-
taciones.
174. Lima y El Cairo son las dos principales ciudades del mundo situadas en zonas desérticas y con
extremo estrés hídrico. En París, Zúrich o Berlín, el consumo medio por persona de agua bordea
los 130 litros por día. Sin embargo, en Lima el consumo medio por persona es de 250 litros por
día con una desviación estándar de 60 litros por día. Si se toma una muestra en Lima de 100 per-
sonas, calcule la probabilidad de que el consumo total muestral en un día sea menor a 24 mil
litros. Rpta. 0,04746
175. El número de vuelos nacionales cancelados en un día se modela con la variable aleatoria 𝑋 con la
siguiente función de probabilidad:
𝒙 0 1 2 3 4 5
𝒇(𝒙) 0,40 0,25 0,15 0,10 0,05 0,05
Se toma una muestra de 100 días, calcule la probabilidad de que se cancelen entre 125 a 135
vuelos nacionales. Rpta: 0,29931
176. Marque la afirmación correcta.

El teorema del límite central afirma que:
a. A medida que el tamaño poblacional crece, la distribución de la media poblacional tiende a una
distribución normal
b. A medida que el tamaño poblacional crece, la distribución de la media muestral tiende a una
c. A medida que el tamaño muestral crece, la distribución de la media poblacional tiende a una
d. A medida que el tamaño muestral crece, la distribución de la media muestral tiende a una dis-
tribución normal. Rpta: d.
177. Marque la afirmación correcta.

El teorema del límite central afirma que:
a. La suma de variables aleatorias normales independientes es una variable normal
b. La suma de más de 30 variables aleatorias normales independientes es una variable normal
c. La suma de más de 30 variables aleatorias independientes es una variable normal
d. La suma de más de 30 variables aleatorias independientes es aproximadamente una variable
normal Rpta: d.
Tablas estadísticas
Todas las tablas de este manual han sido calculadas usando el MS Excel.
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Índice
Axiomas de la probabilidad, 107 circular, 27

Desviación estándar, 73 de barras, 26
Distribución de barras agrupadas, 41
binomial, 141 de Pareto, 32
de frecuencias, 21, 46, 48 Histograma, 53
de la media muestral, 232, 233 Ojiva, 54
de probabilidad, 128, 129 Polígono de frecuencias, 54
hipergeométrica, 146 Media, 60
normal, 184 ponderada, 70
Poisson, 150 Mediana, 64
uniforme continua, 174 Medidas de posición
Escalas de medición, 13 Percentiles, 83
Espacio muestral, 99 Moda, 68
Estadística Muestreo
Definición, 5 aleatorio simple, 201
estadístico, 18 estratificado, 214
Evento, 99 probabilístico, 200
Complemento, 102 sistemático, 208
Eventos Parámetro, 18
independientes, 124 Población, 8
Intersección de, 103 Probabilidad
mutuamente excluyentes, 105 Teorema de Bayes, 118
Unión de, 102 Propiedad reproductiva de la normal, 225
Experimento aleatorio, 99 Variable, 16
Función aleatoria continua, 158
de densidad, 158 aleatoria discreta, 129
de distribución acumulada, 163 Varianza, 72
Gráfico

Ma460 202201 X031 Cuaderno de Trabajo

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ma460 202201 X031 Cuaderno de Trabajo

Cargado por

Copyright:

Formatos disponibles

1 Estadística Descriptiva 201901

Área de Ciencias - Marzo 2022

Este material de enseñanza está basado en materia-

Esperamos que este material le sea de utilidad.

Los profesores del curso

Gráfico de la carátula https://www.cognodata.com/blog/

Unidad 1. Organización y descripción de datos

Población Muestra Datos

𝑝 Porcentaje poblacional 𝑀𝑒 Mediana poblacional

1. Indique si los siguientes enunciados corresponden al uso de la Estadística descriptiva o de la Esta-

Población Muestra Datos

Población: Todos los Muestra: Algunos alumnos Base de datos: Mediciones a

Muestreo Tres variables Sexo Ciudad Edad

Una observación Mujer Lima 19

2. El objetivo de una investigación es estimar la media, en años, de la edad de los egresados de la

4. Según un informe de la Cámara Peruana de la Construcción (Capeco), el 70% de viviendas en Lima

11. El objetivo de una investigación en la ciudad de Lima es determinar la ocupabilidad en hoteles de

Indique la escala de medición de las siguientes variables y su escala de medición.

• Número de personas que van a ver una película

12. Indique la escala de medición de cada variable.

Variable Nominal Ordinal Intervalo Razón

Número de medallas de oro de un país X

Precio de una entrada, en soles X

Año en que se desarrolló el Panamericano X

Posición de un país en el medallero X

Temperatura en el agua del mar en °C X

Opinión respecto a los Panamericanos: mala, regular,

Es una variable que Es una variable que A su vez, la variable

Variables Tipo de variable Escala de medición

13. Indique la escala de medición y tipo de las siguientes variables.

Variable Tipo de variable Escala de medición

Número de tarjetas de crédito

Número de la tarjeta (Son 16 dígi-

Límite de crédito permitido en

Tipo de tarjeta (Clásica, Premium,

Compañía de pago (Visa, Master-

Año de vencimiento de la tarjeta Cuantitativa discreta Intervalo

14. Indique la escala de medición y tipo de las siguientes variables.

Variable Tipo de variable Escala de medida

Edad del elector

Sexo del elector

Nivel socioeconómico del elector

Tiempo que demora desde su casa

Número de personas que votaron

Año en que se produce la votación

Medida de resumen Variable Valor Parámetro o estadístico

15. Indique si los porcentajes obtenidos son estadísticos o parámetros.

Los porcentajes obtenidos son estadísticos, pues se calcularon de una muestra.

Es un parámetro. Proporción de mujeres en el Perú, su valor es 0,503.

La población por estudiar es …

Frecuencia absoluta simple de una clase

Frecuencia relativa simple de una clase

Frecuencia porcentual simple de una clase

Distribución de <unidades elementales> según <variable>

Título de una tabla de distribución de frecuencias

De acuerdo con el INEI, para los títulos seguiremos el siguiente esquema:

Distribución de <unidades elementales> según <variable>

Distribución de frecuencias de variables cualitativas

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>

Distribución de conflictos sociales activos en el Perú según actividad, noviembre 2021

Imagen tomada de https://sthephanierv.wordpress.com/2016/11/08/la-gastronomia-peruana-a-los-ojos-del-mundo/

Distribución de alumnos según plato peruano preferido

Desaprueba Aprueba Desaprueba Aprueba Desaprueba Desaprueba Desaprueba