Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MA460
Estadística Descriptiva
Cuaderno de trabajo
Los profesores del curso
Logro de la Unidad 1
Al finalizar la Unidad 1, el estudiante será capaz entender claramente la información que se presenta
en las tablas y gráficos estadísticos. Calcular e identificar las medidas de resumen idóneas que corres-
ponden a cada análisis de datos.
Temario
• Conceptos básicos
• La Estadística y sus subdivisiones.
• Definiciones de población, muestra, variables, clasificación de variables, parámetros y estadísticos.
• La investigación estadística. Metodología.
• Métodos de organización y presentación de datos cualitativos y cuantitativos
• Tablas de distribución de frecuencias y representaciones gráficas (circular, barras, Pareto)
• Tablas de doble entrada
• Medidas de tendencia central: media aritmética, mediana, moda, media ponderada
• Medidas de posición: cuartiles, deciles, percentiles
• Medidas de dispersión: varianza, desviación estándar, coeficiente de variación
• Medidas de asimetría
• Diagramas de cajas
Estadística Descriptiva 2022 01 5
Definición de Estadística
Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, or-
ganizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.
Recopilar datos Organizar datos Presentar datos Analizar datos Tomar decisiones
Estadística Descriptiva 2022 01 6
Estadística descriptiva
Son métodos asociados a la caracterización, resumen y presentación de datos, que permiten descri-
birlos apropiadamente.
Comprende el uso de gráficos, tablas e indicadores de resumen obtenidos al realizar algunos cálculos.
Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más características de una población o tomar
decisiones referentes a una población, basados en los resultados obtenidos del estudio de muestras
elegidas adecuadamente.
Estas conclusiones no tienen que ser totalmente válidas, pueden tener cierto margen de error, por eso
se dan con una medida de confiabilidad o probabilidad.
Estadística descriptiva
Métodos de recolección, caracterización, resumen y
presentación de características de datos
Muestreo
Solución
Los gráficos están realizados usando estadística descriptiva.
Este gráfico muestra la intención de voto en España para los partidos políticos: PSOE, PP, Vox y
Ciudadanos, Unidas Podemos y otros. Esta noticia se basa en estadística inferencial.
Estadística Descriptiva 2022 01 8
Definiciones
Unidad elemental
Es la entidad acerca de la cual se reúne los datos.
Población
Población es el conjunto de todas las unidades elementales de interés en determinado estudio. Es un
conjunto de personas, objetos, conceptos, etc. de los cuales se sacan conclusiones a partir de una o
más características observables de naturaleza cualitativa o cuantitativa.
Muestra
Muestra es un subconjunto de la población. Será representativa si se elige al azar.
Variable
Es una característica de interés de las unidades elementales.
Dato
Es el resultado de medir una variable de una unidad elemental.
Observación
Es el conjunto de mediciones de una unidad elemental.
Dato
Observación
Unidad elemental
Estadística Descriptiva 2022 01 9
Ejemplo 1
A una persona (unidad elemental) se le pregunta su sexo, ciudad de residencia y edad (variables). Ella
responde (tres datos): “Soy mujer, vivo en Lima y tengo 19 años” (observación).
Tres datos
Unidad elemental: Un
alumno de la sección
Ejemplo 2
En una fábrica (unidad elemental) se pregunta su distrito, tamaño de la empresa y su rubro (variables).
Se registra (tres datos): “Jesús María, mediana empresa y metalmecánica” (observación).
Ejemplo 3
La Secretaría Académica de una universidad está interesada en realizar un estudio sobre los motivos
por los cuales algunos alumnos del pregrado han decidido dar exámenes de recuperación ese ciclo. La
universidad cuenta con quince facultades y un total de 7500 alumnos, de los cuales 830 han decidido
rendir exámenes de recuperación ese ciclo. De la población se va a entrevistar a una muestra aleatoria
de 200 alumnos. Defina la población y la muestra.
Solución
La población son los 830 alumnos que han decidido dar exámenes de recuperación ese ciclo. La mues-
tra son los 200 alumnos que han decidido dar exámenes de recuperación ese ciclo.
Estadística Descriptiva 2022 01 10
Ejercicios
3. El objetivo de una investigación es estimar el porcentaje de los egresados de la UPC que trabajan
en su carrera. Indique la población, muestra, unidad elemental, variable a medir y un posible dato.
Solución
La población es todos los egresados de la UPC
La muestra es algunos egresados de la UPC
La unidad elemental es un egresado de la UPC
La variable a medir es si trabaja en su carrera
Un posible dato es: no trabajo en mi carrera
5. Se quiere estimar el promedio diario de las ventas, en soles, del supermercado A durante el año
2021. Indique la población, muestra, unidad elemental, variable a medir y un posible dato.
Solución
La población es todos los días que trabajó el supermercado A en el año 2021
La muestra es algunos días que trabajó el supermercado A en el año 2021
La unidad elemental es un día que trabajó el supermercado A en el año 2021
La variable por medir es monto de ventas por día, en soles
Un posible dato es 50000 soles.
6. Los teens de hoy son parte de la nueva generación que se abre paso y vive la era del Internet y los
dispositivos móviles aún con más intensidad que sus predecesores, los millenials. Aunque denomi-
nan a esta generación Z o iGen. Es una generación sobreexpuesta a la información, multipantallas
y los primeros en socializar a través de la tecnología. Datum realizó una encuesta a 402 jóvenes de
Estadística Descriptiva 2022 01 11
13 a 19 años en el Perú. El cuestionario constó de 35 preguntas. Indique la unidad elemental en la
investigación, la cantidad de observaciones y datos obtenidos.
Solución
La unidad elemental es unteen, es decir, joven de 13 a 19 años en el Perú.
La cantidad de observaciones es 402, pues cada joven da una observación.
La cantidad de datos obtenidos es 14070 (35 x 402), pues cada joven brinda 35 datos.
7. Indique las variables y una posible observación de la base de datos usada para realizar esta info-
grafía.
Solución
Las variables son: edad, nivel educativo, número de trabajos, ingreso mensual, si tiene tarjeta de
crédito o ahorro, si recibe CTS, si se encuentra afiliado a una AFP, número de horas que trabaja a
las semana, si tiene seguro de salud, si trabaja de manera formal, número de personas en su em-
presa, sector en qué trabaja, ocupación laboral.
Estadística Descriptiva 2022 01 12
Una posible observación es: edad = 35 años, nivel educativo = superior, número de trabajos = 1,
ingreso mensual = 3000 soles, si tiene tarjeta de crédito o ahorro = sí, si recibe CTS = sí, si se en-
cuentra afiliado a una AFP = sí, número de horas que trabaja a las semana = 40 horas, si tiene
seguro de salud = sí, si trabaja de manera formal = sí, número de personas en su empresa = 7,
sector en qué trabaja = comercio, ocupación laboral = empleado.
8. Según el estudio “Rumores de oficina”, el 42% de los ejecutivos limeños considera que los rumores
influyen mucho en el clima laboral de la oficina. Indique el elemento, una variable a medir y una
posible observación.
Solución
La unidad elemental es …
Una variable por medir es …
Una posible observación es …
9. En una investigación, se quiere estimar el promedio del número de asistentes a los conciertos de
artistas internacionales realizados en Lima durante el año 2021. Indique el elemento, una variable
a medir y una posible observación.
Solución
La unidad elemental es …
Una variable por medir es …
Una posible observación es …
10. El objetivo de una investigación en el Perú es determinar el promedio de la edad de las mujeres en
edad fértil que usan métodos anticonceptivos. El INEI considera a la edad fértil en las mujeres
desde los 15 hasta los 49 años. Indique la población, la muestra y la unidad elemental para esta
investigación.
Solución
La población es …
La muestra es …
La unidad elemental es …
Son los tipos de valores asignados a las unidades elementales para una variable definida.
La escala de medición permite determinar la cantidad de información que contienen los datos y el
análisis estadístico más apropiado.
Nominal
• Una variable está medida en escala nominal cuando los datos son etiquetas
que se emplean para definir un atributo del elemento.
Ordinal
• Una variable está medida en escala ordinal cuando los datos son etiquetas
y el orden es significativo.
• Se pueden ordenar, de tal manera que puedan expresar grados de la
característica medida.
• No tiene sentido medir la distancia entre los valores de la variable ni
realizar operaciones aritméticas con ellos pues no toman valores
numéricos específicos ni existe proporcionalidad entre categorías vecinas.
Intervalo
• Una variable está medida en escala de intervalo si los datos tienen
propiedades de datos ordinales y el intervalo entre observaciones se
expresa en términos de una unidad fija de medida.
• Los datos de intervalo siempre son numéricos.
• El cero es relativo, es decir, no indica la ausencia de la característica
medida.
Razón
• Una variable está medida en escala de razón si los datos tienen todas las
propiedades de los datos de intervalo y se puede realizar cualquier
operación aritmética (suma, resta, multiplicación y división) y lógica
(comparación y ordenamiento).
• El cero es absoluto, es decir, indica la ausencia total de la característica
medida.
Estadística Descriptiva 2022 01 14
Ejemplo 4
Nominal
• Sexo de una persona
• Estado civil de un empleado de una empresa
• Carrera profesional universitaria
Ordinal
• Orden de mérito de un atleta en una competición
• Grado de instrucción de los clientes de un banco
Intervalo
• Temperatura en grados centígrados 0ºC
• Año de nacimiento
Razón
• Sueldo de un empleado de una empresa
• Tiempo en terminar un examen
• Peso de un perro
Ejemplo 5
Solución
Variable Escala de medida de la variable
Número de personas que van a ver una película Razón
Género de una película (drama, comedia, acción, etc.) Nominal
Duración de una película Razón
Opinión sobre la película (buena, regular, mala) Ordinal
Estadística Descriptiva 2022 01 15
Ejercicios
Nombre de un país X
Edad de un deportista X
Variable Variable
cualitativa cuantitativa
Variable discreta
Tiene un número finito o infinito
numerable de posibles valores; es
decir, que en un intervalo solo
puede tomar ciertos valores.
Variable continua
Tiene un número infinito no
numerable de posibles valores; es
decir, que en un intervalo puede
tomar cualquier valor.
Ejemplo 6
Candidato preferido
Estadístico
Estadístico es cualquier resumen de la muestra.
Ejemplo 7
En un estudio entre alumnos de la UPC, se registró la edad de todos los alumnos de la UPC. La media
de la edad fue de 19,3 años. Además, de una muestra de aleatoria de 300 alumnos se encontró que el
12% trabaja. Indique lo siguiente.
Ejemplo 8
La encuesta de El Comercio-Ipsos publicada el 25 de julio del 2021 revela varios datos sobre las priori-
dades de los peruanos. Para empezar, la principal preocupación sigue derivada de las consecuencias
que deja la pandemia por el COVID-19: salud y empleo.
De acuerdo con esta encuesta, se tienen varios estadísticos, como, por ejemplo: Proporción de perua-
nos de 18 a más años que manifiestan que uno de los temas que deberían ser priorizados por el go-
bierno durante los primeros meses de gestión es mejorar los servicios de salud/Avanzar con la vacu-
nación contra el COVID-19, cuyo valor es 0,75. Es un estadístico, pues para calcularlo se uso una mues-
tra aleatoria.
Estadística Descriptiva 2022 01 19
Ejercicios
16. Según los Censos Nacionales 2017 ejecutados por el INEI, el 50,30% de los peruanos son mujeres.
Indique si este resultado es un parámetro o un estadístico. Además, indique el nombre y valor de
la medida de resumen.
17. Según un informe de Sedapal del año 2019 basado en una muestra de habitantes, San Isidro fue el
distrito de Lima Metropolitana que registró el mayor consumo promedio de agua potable: 254
litros por persona por día.
Según el caso, complete los espacios en blanco para el caso de San Isidro.
La población por estudiar es todos los habitantes de San Isidro.
La muestra por seleccionar es algunos habitantes de San Isidro.
La unidad elemental es un habitante de San Isidro.
Estadística Descriptiva 2022 01 20
La variable en estudio es cantidad de litors de agua que consume al día.
La medida de resumen calculada es la media cuyo valor para el distrito de San Isidro es 254 litros
Esta medida de resumen es estadístico, pues es calculado de una muestra.
18. El siguiente gráfico pertenece al estudio de opinión sobre drogas en población urbana peruana de
la ONG Cedro del año 2017. Se encuestó a 8352 personas entre 12 y 65 años. Complete los espa-
cios en blanco.
Fuente: Encuesta sobre opinión sobre drogas en población urbana peruana. Cedro. 2017
Solución
19. Los resultados del Censo Nacional de Población Penitenciaria 2016 revelan que el 60,0% de inter-
nos logró estudiar algún año de educación secundaria y 25,2% educación primaria. Las personas
privadas de libertad han logrado estudiar algún año de educación superior (superior no universi-
taria 7,2% y superior universitaria 5,2%). Usando esta información, complete los espacios en
blanco.
Estadística Descriptiva 2022 01 21
Estadística descriptiva
𝑓!
ℎ! =
𝑛
𝑝! = ℎ! × 100%
Distribución de frecuencias
Es un resumen, expresado en un cuadro, de un conjunto de datos que muestra las frecuencias absolu-
tas, relativas y porcentuales en cada una de varias clases que no se traslapan. La distribución de fre-
cuencias es un cuadro que se calcula de la siguiente manera:
𝑓%
Categoría 𝑘 𝑓% ℎ% = 𝑝% = ℎ% × 100%
𝑛
Total 𝒏 1,00 100%
Fuente:
Fuente: …………………………
Ejemplo 9
La Defensoría del Pueblo presentó el Reporte de Conflictos Sociales N° 213, correspondiente al mes de
noviembre de 2021, el cual da cuenta de 97 conflictos sociales activos.
20. En enero del presente año se entrevistó a una muestra de 400 alumnos de pregrado de la univer-
sidad A y se obtuvo la siguiente información referente al plato peruano preferido.
Complete lo faltante.
21. La empresa DGS va a contratar más personal si el porcentaje de trabajos de la zona Norte supera
al 40%. Organice la siguiente información y proponga la decisión. ¿Se contratará más personal?
Norte Norte Este Este Este Este Este Norte Este Sur Sur Norte Norte Norte Este
Este Sur Sur Norte Sur Sur Este Sur Sur Norte Norte Norte Sur Norte Sur
Norte Este Sur Sur Norte Norte Norte Este Norte Sur Sur Este Sur Este Sur
Interpretración
Determinar si se va a contratar a más personal.
Representación
Vamos a hacer una distribución de frecuencias de la variable <zona>.
Estadística Descriptiva 2022 01 24
Cálculo
Distribución de trabajos según zona
Zona Frecuencia absoluta Frecuencia porcentual
Este 13 28.89%
Norte 16 35.56%
Sur 16 35.56%
Total 45 100.00%
Fuente: Empresa DGS
Análisis y argumentación
El porcentaje de trabajos de la zona Norte es 35,56%, que no supera al 40%. Por lo tanto, no se va
a contratar a más personal.
22. En los Censos Nacionales 2017 ejecutados por el INEI se preguntó a todos los peruanos el idioma
o lengua con el que aprendió hablar, obteniéndose los siguientes resultados. Complete lo faltante.
Perú. Distribución de peruanos según idioma o lengua con el que aprendió hablar
Idioma o lengua con que aprendió a hablar Casos Porcentaje Porcentaje acumulado
Castellano 23 178 478
Quechua 3 799 780
Aimara 450 010 1,61% 98,15%
Ashaninka 73 567 0,26% 98,41%
Lengua de señas peruanas 10 447 0,04% 98,45%
Otra lengua extranjera 49 876 0,18% 98,63%
Otra lengua nativa u originaria 179 601 0,64% 99,27%
No sabe / No responde 204 301 0,73% 100,00%
Total 27 946 060 100,00% 100.00%
Fuente INEI. Censos Nacionales 2017
23. El objetivo de una investigación es estimar el porcentaje de peruanos que aprueban la gestión de
del presidente de la República, para lo cual se tomó una muestra aleatoria de personas de 18 a 70
años y se les preguntó por su opinión. Los resultados son los siguientes.
Gráficos estadísticos
• El método gráfico es una forma de simplificar lo tedioso y lo complejo.
• Las personas ocupadas necesitan ayuda visual.
• Un gráfico es más accesible que una tabla.
• El método gráfico ayuda al cerebro, ya que permite entender y memorizar mejor.
Ejemplo 10
Instagram es una aplicación de redes sociales que se enfoca en compartir fotos y videos. Es propiedad
de Facebook, que recientemente se renombró como Meta. A partir de diciembre de 2021, Instagram
alcanzó un nuevo hito de 2 mil millones de usuarios activos en todo el mundo. Los usuarios de 25 a 34
años constituían el mayor grupo de usuarios de Instagram por edad en todo el mundo, seguidos por
los de 18 a 24 años. Los hombres son el 51,6% de los usuarios de Instagram.
Distribución de usuarios activos de Instagram desde enero de 2013 hasta diciembre de 2021
Tomado de https://www.statista.com/statistics/253577/number-of-monthly-active-instagram-users/
Estadística Descriptiva 2022 01 26
Gráfico de barras
Es una forma de representar datos cualitativos resumidos en una distribución de frecuencias.
En uno de los ejes, se representan las categorías o clases de la variable; para el otro eje, se puede usar
una escala de frecuencias absolutas, relativas o porcentuales. Se traza una barra sobre cada indicador
de clase de una altura proporcional a la frecuencia correspondiente. Las barras deben estar separadas
para enfatizar el hecho de que cada clase es diferente de otra.
Ejemplo 11
Pronto encabezó la clasificación de revistas femeninas en España al registrar cerca de dos millones de
lectoras durante 2021. Hola y Vogue ocuparon la segunda y la tercera posición.
Tomado de https://es.statista.com/estadisticas/491628/revistas-femeninas-las-mas-leidas-en-espana/
Ejemplo 12
Según el Instituto Internacional de Investigación para la Paz de Estocolmo, Estados Unidos sigue siendo
el mayor exportador de armas, responsable del 38,6 % de las ventas internacionales de armas entre
2017 y 2021. Suministró armas a más de 100 países.
Distribución de armas exportadas del 2017 a 2021 según país de origen
Tomado de https://www.statista.com/chart/18417/global-weapons-exports/
Estadística Descriptiva 2022 01 27
Diagrama circular
Cada sector circular representa la frecuencia observada de una clase o categoría. El sector circular que
representa a una determinada clase de la variable tiene un ángulo en el centro proporcional a la fre-
cuencia relativa de dicha clase. El ángulo que le corresponde a cada clase se obtiene multiplicando
360º por la respectiva frecuencia relativa.
Ejemplo 13
Según el II Informe Bienal sobre la Realidad Universitaria en el Perú publicado por la Superintendencia
Nacional de Educación Superior Universitaria en el año 2020, observamos que no hay gran diferencia
entre la matrícula universitaria entre hombres (48,9%) y mujeres (51,1%). Además, que dentro de las
ciencias sociales (52,8% del total), las ciencias administrativas son las que cuentan con más alumnos
(54,9%).
Ejemplo 14
La Defensoría del Pueblo presentó el Reporte de Conflictos Sociales N° 213, correspondiente al mes de
noviembre de 2021, el cual da cuenta -entre otros aspectos- de 199 conflictos sociales registrados.
24. América Noticias realizó Feminicidios 2019, un proyecto digital que busca registrar el número de
mujeres asesinadas en el Perú; de lo publicado por este proyecto se tiene los siguientes gráficos.
Póngales título.
Solución
Distribución de femicidios según lugar de ocurrencia
Hotel/hostal Casa de familiar Centro de labores
5.7% 2.9% de la víctima
Casa de agresor 1.4%
6.4% Otros
29.3%
Casa de ambos
7.9%
Lugar desolado
9.3%
Calle-vía pública
12.1% Casa de la víctima
25.0%
Fuente: Feminicidios 2019
60
Número de feminicidas
50
40
28
30 25
20
11 10
10
0
Detenido sin Prófugo Libre en Cometió suicidio Otros
sentencia investigación
Fuente: Feminicidios 2019 Situación legal del feminicida
América Noticias
25. Se tiene como objetivo mostrar la composición porcentual de alumnos universitarios en el Perú
por tipo de institución educativa al final de la secundaria, para lo cual se tomó como referencia los
datos del II Censo Universitario 2010 realizado por el INEI, donde se preguntó a los alumnos
universitarios por el tipo de institución educativa donde terminaron su educación secundaria. Los
resultados se muestran en la siguiente tabla.
Título:
Estadística Descriptiva 2022 01 30
Tipo de institución fi hi
Estatal 256 060 0,5405
Particular 154 275 0,3256
Particular religioso 58 673 0,1238
No escolarizado 4 472 0,0094
Otro 309 0,0007
Total 473 789
Fuente:
Realice un diagrama circular con dichos datos.
Rpta:
Distribución de estudiantes de pregrado según institución donde
terminaron la secundaria
No escolarizado Otro
0.94% 0.07%
Particular religioso
12.38%
Estatal
54.05%
Particular
32.56%
26. El Banco Europeo de Inversiones publicó el 15 de marzo del 2021 la tercera edición de la encuesta
sobre el clima 2020-2021, que analiza las expectativas de los ciudadanos respecto a las políticas
de lucha contra el cambio climático. Ponga título al gráfico circular.
Estadística Descriptiva 2022 01 31
Frecuencias acumuladas, absolutas relativas y porcentuales
Es la suma de la frecuencia absoluta de un valor determinado de la variable con las frecuencias abso-
lutas de los valores menores de la variable. Se denota por 𝐹! .
La frecuencia absoluta acumulada del último valor de la variable es igual al total de casos.
Es la suma de la frecuencia relativa de un valor determinado de la variable con las frecuencias relativas
de los valores menores de la variable. Se denota por 𝐻! .
Es la suma de la frecuencia porcentual de un valor determinado de la variable con las frecuencias por-
centuales de los valores menores de la variable. Se denota por 𝑃! .
La frecuencia porcentual acumulada del valor más alto de la variable es igual a 100%.
⋮ ⋮ ⋮ ⋮
𝑓%
Categoría 𝑘 𝑓% 𝑝% = × 100% 100%
𝑛
Total 𝒏 100%
Fuente:
Estadística Descriptiva 2022 01 32
Diagrama de Pareto
El diagrama de Pareto es una representación gráfica que permite identificar y seleccionar los aspectos
prioritarios que hay que tratar en un determinado problema.
También se conoce como diagrama ABC o Ley de las prioridades 80 - 20, que dice: “el 80% de los
problemas que ocurren en cualquier actividad son ocasionados por el 20% de los elementos que inter-
vienen en producirlos” (pocos vitales, muchos triviales).
Según este concepto se tiene un problema con muchas causas, podemos decir que el 20% de las causas
resuelven el 80 % del problema. Por ejemplo, en control de calidad, se puede mostrar que la mayoría
de los defectos surgen de un número pequeño de causas.
Los pasos para la elaboración del diagrama de Pareto son los siguientes:
1. Construya una tabla de distribución de frecuencias ordenando las categorías en forma descen-
dente respecto a la frecuencia.
• La categoría Otros se coloca al final, no importa cuán grande sea, pues está compuesta por
categorías cuyas frecuencias son menores al valor de la variable con frecuencia más pequeña
listada individualmente.
• Agregue a la tabla de distribución de frecuencias una columna para la frecuencia acumulada.
2. Dibuje los ejes verticales y horizontal, título, rótulos de los ejes y fuente.
50%
25%
Variable
Fuente:
75%
50%
25%
Variable
Fuente:
4. Dibuje la línea de frecuencias acumuladas (curva de Pareto). Indique las etiquetas de datos de las
frecuencias simples y de las frecuencias acumuladas.
100%
Frecuencia acumulada porcentual
100% 𝟏𝟎𝟎%
𝑃) 𝐏𝟑
Frecuencia simple
𝑃$ 75%
𝑃# 𝐏𝟐
𝐏𝟏
50%
25%
Variable
Fuente:
Estadística Descriptiva 2022 01 34
Ejemplo 15
El gerente de producción de una empresa, que produce asientos de fibra de vidrio, quiere identificar
los problemas más frecuentes reportados en la fabricación de este producto, y planear soluciones de
acuerdo con la recurrencia del problema.
Al extraer una muestra aleatoria de productos fallados, obtuvo los siguientes resultados:
Solución
Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categoría Otros va al final.
También se puede realizar el gráfico de Pareto usando las frecuencias relativas hi y las frecuencias
relativas acumuladas Hi.
27. El gerente financiero del Banco JJF realizó un estudio sobre los principales problemas que declara-
ron los clientes que poseen la tarjeta de crédito TravelMax. Si se quiere identificar los problemas
más importantes que deben resolverse para solucionar el 70% de la problemática. ¿Usted que le
recomendaría a gerente financiero?
Distribución de … según …
Principal problema fi Fi hi Hi
Poca información sobre beneficios 77 77 35,00% 35,00%
Alto costo de membresía 46 123 20,91% 55,91%
Pocos puntos TravelMax por compras 31 154 14,09% 70,00%
Pocos destinos para elegir 24 178 10,91% 80,91%
Altos intereses 19 197 8,64% 89,55%
Otros 23 220 10,45% 100,00%
Total 220 100,00%
Fuente: Banco JJF
Interpretación
Identificar los problemas más importantes que deben resolverse para solucionar el 70% de la pro-
blemática.
Representación
Vamos a realizar un gráfico de Pareto de la variable <principal problema>.
Cálculo
Distribución de clientes que poseen la tarjeta de crédito TravelMax según principal problema
Principal problema fi Fi hi Hi
Poca información sobre beneficios 77 77 35,00% 35,00%
Alto costo de membresía 46 123 20,91% 55,91%
Pocos puntos TravelMax por compras 31 154 14,09% 70,00%
Pocos destinos para elegir 24 178 10,91% 80,91%
Altos intereses 19 197 8,64% 89,55%
Otros 23 220 10,45% 100,00%
Total 220 100,00%
Fuente: Banco JJF
Estadística Descriptiva 2022 01 37
Análisis y argumentación
Los problemas más importantes que deben resolverse para solucionar el 70% de la problemática
son poca información sobre beneficios, alto costo de la membresía y pocos puntos Travel por com-
pras.
28. La siguiente tabla fue desarrollada con información de los Censos Nacionales 2017. Se quiere rea-
lizar un comentario a partir de un gráfico que muestre que en pocos tipos de materiales de cons-
trucción en las paredes se concentra la mayor cantidad de viviendas.
Solución
La unidad elemental es …
La variable en estudio es …
70%
5 000 000
60%
4 000 000 50%
30%
2 000 000
20%
1 000 000
10%
0 0%
Ladrillo o bloque Adobe Madera (pona, Tapia Triplay / calamina Otro material
de cemento tornillo etc.) / estera
29. En la agencia de viajes A se realizó una encuesta a 330 clientes respecto a las principales quejas
que tienen clientes acerca de los tours del tipo todo incluido al exterior. Las cuales se detallan en
el siguiente cuadro.
Distribución de clientes según principales quejas de clientes
Principal queja Frecuencia absoluta
Cambio de fecha de los vuelos 120
El hotel no era de la categoría que se veía en el folleto 94
Los hoteles no incluyen bebidas premium 61
La comida de los hoteles no es de calidad excelente 23
Otros 25
Que les venden otros servicios como tiempo compartido 7
Fuente: Dirección de Atención al cliente. Agencia A
30. Objetivo: Identificar las principales quejas de los pasajeros sobre el servicio que brinda la aerolí-
nea. Teniendo en cuenta la siguiente información, elabore el diagrama de Pareto.
Tabulaciones cruzadas
También llamadas tablas de contingencia o de doble entrada. Se usan para resumir de manera simul-
tánea los datos para dos variables.
Si el gráfico presenta las frecuencias absolutas o las frecuencias porcentuales con respecto al total, el
título será:
Si el gráfico presenta las frecuencias porcentuales con respecto a la variable 2, el título será:
Ejemplo 16
Según el II Informe Bienal sobre la Realidad Universitaria en el Perú publicado por la SUNEDU en el año
2020, observamos que sí hay gran diferencia entre la cantidad de autoridades universitarias entre
hombres y mujeres en todos los tipos de gestión.
Incluye cuatro categorías —titulares, adjuntas, encargadas y accesitarias— para 142 universidades. Los
cargos son rector y vicerrector o decano; y, en una proporción importante de las universidades priva-
das, cargos equiparables como presidente, gerente general o director.
31. En los Censos Nacionales 2017 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a las peruanas por la cantidad de hijos que han tenido vivos, obteniéndose los siguientes
resultados.
Perú. Distribución de mujeres según edad de la mujer y número de hijos nacidos vivos
Número total de hijos/a que ha tenido nacidos vivos
Edad en años 0 hijos 1 hijo 2 hijos 3 hijos 4 hijos 5 hijos 6 hijos Total
12 años 268 402 140 268 542
13 años 256 100 2038 258 138
14 años 244 718 2811 24 247 553
15 años 233 809 4933 115 238 857
16 años 226 478 9181 400 44 236 103
17 años 222 861 18841 1318 107 243 127
18 años 213 602 32381 3590 340 77 249 990
19 años 186 065 43147 6807 731 132 236 882
20 años 179 260 57 564 12017 1555 236 90 29 250 751
Total 2 031 295 171 036 24 271 2777 445 90 29 2 229 943
Fuente: INEI – Censos Nacionales 2017
El porcentaje de mujeres de 19 años que han tenido hijos 21,45% (50817/236882 x 100%).
32. A continuación, se presenta el resumen de datos de 250 clientes morosos del banco JMF en julio
del 2020. El gerente del banco JMF elegirá una sede (Lima o Arequipa) para iniciar una campaña
de facilidades de pago. El criterio será el siguiente: se iniciará la campaña de facilidades de pago
en la sede donde sea mayor el porcentaje de clientes de la categoría estándar. Indique la sede en
la que se iniciará dicha campaña.
Estadística Descriptiva 2022 01 43
Variable 2
Variable 1
Variable 1
Variable 1 Variable 1 Variable 2 Variable 2
Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El alto
de cada barra es proporcional a la frecuencia de cada categoría.
Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada categoría.
El alto de cada barra es proporcional a la frecuencia de cada categoría.
Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada ca-
tegoría. El alto de cada barra es el mismo para cada categoría.
Ejemplo 17
Según el II Informe Bienal sobre la Realidad Universitaria en el Perú publicado por la SUNEDU en el año
2020, observamos que sí hay gran diferencia entre la matrícula universitaria entre hombres y mujeres
por área de conocimiento.
Distribución de alumnos de pregrado en el Perú según sexo por área del conocimiento
Estadística Descriptiva 2022 01 45
Ejercicios
33. En total, las descargas de aplicaciones en todo el mundo alcanzaron los 36100 millones en el cuarto
trimestre del año 2021. Las aplicaciones de inversión y criptomonedas ganaron impulso con los
tokens no fungibles (NFT) que surgieron como una tendencia al alza. Ponga título a este gráfico.
https://sensortower.com/blog/q4-2021-data-digest/
Porque se muestran las frecuencias absolutas.
34. Según un estudio realizado por la organización Women’s Media Center, de los 205 nominados en
2022 en las categorías no actorales, solo 55 (el 27%) son mujeres, mientras que 150 (el 73%) son
hombres. Se trata de la tasa más baja de representación femenina en las categorías no condicio-
nadas por el género analizadas en tres años. Ponga título al siguiente gráfico.
Tomado de https://es.statista.com/grafico/27119/hombres-y-mujeres-nominados-a-los-premios-oscar-en-categorias-no-actorales-seleccionadas/
36. En los Censos Nacionales de Población y Vivienda 2007 y 2017, se preguntó a los peruanos por la
región natural donde residían. Ponga título al siguiente gráfico.
Distribución de residentes en el Perú según región natural donde reside por año
37. A fin de conocer hacia dónde se dirigen los limeños durante el día, El Comercio accedió a un estudio
de la Autoridad Autónoma del Tren Eléctrico (AATE), que empleó la tecnología Big Data –movi-
miento del GPS de los celulares de forma anónima– que esta institución adscrita al Ministerio de
Transporte y Comunicaciones usa para planificar el futuro del transporte público integrado. Ponga
título al siguiente gráfico.
Estadística Descriptiva 2022 01 47
38. En el II Censo Nacional Universitario del año 2010 realizado por el INEI se preguntó a los alumnos
del Perú por su tipo de universidad y su género. Los datos se muestran en el siguiente cuadro.
c. Elabore un gráfico comparativo que permita ver la composición porcentual según sexo por tipo
de universidad.
Distribución de alumnos según género por tipo de
universidad
100%
90%
Porcentaje de alumnos
80%
56.31% 47.71%
70%
60%
50%
Hombre
40%
30% Mujer
52.29%
20% 43.69%
10%
0%
Pública Privada
Tipo de universidad
Fuente: INEI. II Censo Universitario 2010
Estadística Descriptiva 2022 01 48
d. Elabore un gráfico comparativo que permita ver la composición porcentual según tipo de uni-
versidad por sexo.
Rpta:
Estadística Descriptiva 2022 01 49
Si los datos son discretos y no hay mucha variabilidad se presentarán directamente cada valor de la
variable y sus respectivas frecuencias. El procedimiento más simple es listar los 𝑛 datos en forma as-
cendente y luego elaborar la tabla de distribución de frecuencias indicando para cada valor de la va-
riable su respectiva frecuencia con la que aparece en la serie.
Gráfico de bastones
En este caso, la variable se ubica en el eje de las abscisas y las frecuencias, absolutas, relativas o por-
centuales, en el eje ordenado.
Ejemplo 18
500,000
400,000
300,000
200,000 119,642
58,315
100,000 18,748 9,908 81 32 22 7
0
0 1 2 3 4 5 6 7 8 9
Número de veces que postuló
Fuente: PERÚ, II Censo Nacional Universitario 2010. INEI
Estadística Descriptiva 2022 01 50
Ejercicios
39. Para Fiestas Patrias, la empresa Wayra está dispuesta a realizar una promoción, si el porcentaje de
pasajeros que haya realizado como mínimo cuatro viajes supera el 70%. Indique lo que hará la
empresa. Se cuenta con la siguiente información y se desea hacer un gráfico.
Interpretación
Determinar si se va a realizar una promoción.
Representación
La unidad elemental es un pasajero
La variable en estudio es número de viajes
Se hará el gráfico de bastones, pues la variable en estudio es discreta.
Cálculo
Análisis y argumentación
El porcentaje de pasajeros que haya realizado como mínimo cuatro viajes es 62% (20% + 42%),
que no supera el 70%. Por lo tanto, no se va a realizar una promoción.
40. Uno de los objetivos de una investigación en la empresa A es mostrar la composición porcentual
del número de cursos de capacitación dadas a sus trabajadores. Los siguientes datos muestran el
número de capacitaciones que 48 trabajadores han recibido en el presente año.
Estadística Descriptiva 2022 01 51
3 3 1 2 1 1 2 2 1 6 3 1 3 1 3 2 3 2 2 3 2 2 1 1
1 1 1 1 3 2 2 4 1 2 2 2 1 3 1 2 1 2 2 2 2 1 6 2
Es un resumen de un conjunto de datos que consiste en presentar para cada categoría el número de
elementos (frecuencia) que la componen. Los datos se agrupan de intervalo (también llamados clases,
categorías o grupos).
Para agrupar 𝑛 datos de una muestra, los pasos son los siguientes:
donde:
𝑋𝑚á𝑥 es el dato de mayor valor
𝑋𝑚í𝑛 es el dato de menor valor
𝑘 = 1 + 3,322 𝑙𝑜𝑔(𝑛)
𝑟
𝑤=
𝑘
Por ejemplo:
𝒓 𝒘
Si los datos tienen 𝒘=
𝒌 (redondeo por exceso)
cero decimales 𝑤 = 50,2381 𝑤 = 51
una cifra decimal 𝑤 = 50,2381 𝑤 = 50,3
dos cifras decimales 𝑤 = 50,2381 𝑤 = 50,24
tres cifras decimales 𝑤 = 50,2381 𝑤 = 50,239
dos cifras decimales 𝑤 = 0,38000 𝑤 = 0,38
dos cifras decimales 𝑤 = 0,38001 𝑤 = 0,39
cero decimales 𝑤 = 0,38001 𝑤 = 1,0
Estadística Descriptiva 2022 01 53
d. Determine los límites de cada intervalo.
• Partiendo del dato de menor valor, es decir el límite inferior del primer intervalo, 𝐿!# se deter-
mina cada uno de los límites de intervalos sumando la amplitud de clase a cada valor obtenido.
• Si los datos son cuantitativos continuos, el límite superior 𝐿* de un intervalo es el límite inferior
𝐿! del siguiente intervalo. El intervalo es abierto en el límite inferior y cerrado en el límite su-
perior, con excepción en el primer intervalo en el que los dos límites son cerrados.
e. Calcule la marca de clase N𝑥%´ O. La marca de clase es el punto medio de cada clase. Se calcula como
la semisuma de los límites de cada clase. Representa a todos los datos que están contenidos en
dicha clase.
𝐿!% + 𝐿*% 𝑓%
]𝐿!% − 𝐿*% ] 𝑥%´ = 𝑓% ℎ% = 𝑛 1,00
2 𝑛
Total 𝒏 1
Fuente:
Estadística Descriptiva 2022 01 54
Ejemplo 19
El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. La tabla muestra los pagos de impuestos, en soles, en el 2020 de 48
viviendas elegidas al azar.
145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1
Elabore la tabla de frecuencias para la variable: pago por impuestos municipales año 2020.
Solución
El rango 𝑟 se calcula con:
𝑟 206
𝑤= = = 29,429 ≈ 29,5
𝑘 7
El valor de la amplitud del intervalo 𝑤 se va a redondear por exceso. En este caso se redondea a un
decimal, pues los datos tienen un decimal.
41. Se seleccionó una muestra de clientes que compró papas nativas en una feria de productos agra-
rios. Construya la distribución de frecuencias.
Pesos de papas nativas, en kilogramos, que clientes compraron en una visita a una feria
1,0 1,4 1,5 1,9 2,2 2,3 2,5 2,8 2,8 2,8 3,0 3,2 3,2 3,3 3,3 3,3 3,3
3,3 3,4 3,6 3,7 3,9 4,0 4,1 4,2 4,3 4,4 4,4 4,5 4,5 4,5 4,6 4,6 4,6
4,6 4,6 4,8 4,9 5,0 5,0 5,1 5,3 5,4 5,4 5,4 5,5 5,5 5,5 5,6 5,7 5,7
5,7 5,7 5,7 5,7 5,8 5,8 5,9 6,0 6,0 6,0 6,2 6,3 6,5 7,0 7,5 7,5 7,8
𝑟 6,8
𝑤= = = 0,97 ≈ 1,0
𝑘 7
El valor de la amplitud del intervalo 𝑤 se va a redondear por exceso. En este caso se redondea a
un decimal, pues los datos tienen un decimal.
𝑓$ = 7. Del total de clientes en la muestra, 7 de ellos compraron más de 2 y hasta 3 kilos de papas
𝐹- = 40. Del total de clientes en la muestra, 40 de ellos compraron desde un kilo hasta 5 kilos de
papas.
𝐻) = 0,3382. Del total de clientes en la muestra, el 33,82% de ellos compraron desde un kilo hasta
4 kilos de papas.
42. La siguiente tabla corresponde a la distribución de frecuencias de los salarios, en soles, del último
mes de los empleados de la empresa A. Complete la tabla.
𝑤 = 400
Estadística Descriptiva 2022 01 57
Empresa. A. Distribución de trabajadores según salarios, en soles, del último mes
Clase Marca Frecuencia Frecuencia Frecuencia absoluta Frecuencia rela-
de clase absoluta fi relativa hi acumulada Fi tiva acumulada Hi
[1200; 1600] 1400 120 0,12 120 0,12
]1600; 2000] 1800 300 0,30 420 0,42
]2000 ; 2400] 2200 360 0,36 780 0,78
]2400 ; 2800] 2600 150 0,15 930 0,93
]2800 ; 3200] 3000 70 0,07 1000 1,00
Fuente. Gerencia de Recursos Humanos. Empresa A
43. El objetivo de una investigación sobre la lúcuma, de la empresa A en el presente mes, es establecer
la distribución de su peso para la exportación. La lúcuma es originaria de las regiones tropicales de
Sudamérica. Es empleada, sobre todo, en la preparación de dulces, postres y helados.
En el siguiente cuadro se muestra el peso, en gramos, de una muestra de 60 frutos.
167 172 173 180 182 182 183 183 183 184 185 186
186 186 187 189 190 191 191 192 193 194 194 194
194 195 195 195 197 197 199 201 201 201 201 201
203 204 205 207 207 207 207 209 210 212 212 213
213 214 218 218 218 219 220 222 223 226 228 232
44. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años.
[ , ] 155 0,48
] , ] 0,32
] , ] 167 0,95
] , ] 600
Fuente: MINSA
Estadística Descriptiva 2022 01 58
𝑓"
𝑓!
𝑓#
𝑓$
𝑓%
𝐿!" 𝐿#" = 𝐿!$ 𝐿#$ = 𝐿!% 𝐿#% = 𝐿!& 𝐿#& = 𝐿!' 𝐿#'
Variable
Fuente: Unidad de medición
ℎ"
ℎ!
ℎ#
ℎ$
ℎ%
𝐿!" 𝐿#" = 𝐿!$ 𝐿#$ = 𝐿!% 𝐿#% = 𝐿!& 𝐿#& = 𝐿!' 𝐿#'
Variable
Fuente: Unidad de medición
𝑝"
𝑝!
𝑝#
𝑝$
𝑝%
𝐿!" 𝐿#" = 𝐿!$ 𝐿#$ = 𝐿!% 𝐿#% = 𝐿!& 𝐿#& = 𝐿!' 𝐿#'
Variable
Fuente: Unidad de medición
Estadística Descriptiva 2022 01 59
Polígono de frecuencias
Un polígono de frecuencias es un gráfico de líneas que une los puntos asociados a las marcas de clase
de una variable. La altura del punto asociado a cada marca de clase es proporcional a la frecuencia de
dicho valor.
Se realiza uniendo con segmentos de recta los puntos de intersección de las marcas de clase con las
frecuencias (absolutas, relativas o porcentuales).
Los polígonos de frecuencias se cierran creando dos intervalos ficticios, uno antes del primer intervalo
y uno después del último.
Si los intervalos creados toman valores que pueden no ser reales, igual se crea el intervalo, como,
ejemplo, tiempos negativos.
Ojiva
La ojiva es la gráfica de una distribución acumulada de frecuencias.
Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de cada
intervalo y la frecuencia acumulada respectiva.
La ojiva usa los límites de los intervalos y no las marcas de clase.
Con la ojiva se puede estimar fácilmente el número o porcentaje de observaciones que corresponden
a un intervalo determinado.
𝑃#
porcentual
75% 𝑃"
50% 𝑃!
25%
45. Grafique el histograma, el polígono de frecuencias y la ojiva de frecuencias porcentuales con los
datos de la muestra del ejercicio de las papas nativas.
46. En economía, la prima de riesgo es el sobreprecio que paga un país para financiarse en los merca-
dos en comparación con otros países. Cuanto mayor es el riesgo país, más alta será su prima de
riesgo. Significa la confianza de los inversores en la solidez de una economía. La prima de riesgo de
los países de la Unión Europea se calcula respecto de Alemania porque su deuda pública es la que
tiene menor riesgo de impago. Para el caso de España, la agencia de calificación de riesgos A ha
medido la prima de riesgo durante 50 días desde junio del 2017.
España. Distribución de días según prima de riesgo. Junio y julio del 2017
Prima de riesgo Marca de clase fi hi Fi Hi
[ 120 ; 130 ] 125 1 0,0200 1 0,0200
] 130 ; 140 ] 135 3 0,0600 4 0,0800
] 140 ; 150 ] 145 11 0,2200 15 0,3000
] 150 ; 160 ] 155 14 0,2800 29 0,5800
] 160 ; 170 ] 165 12 0,2400 41 0,8200
] 170 ; 180 ] 175 6 0,1200 47 0,9400
] 180 ; 190 ] 185 3 0,0600 50 1,0000
Fuente: Agencia de Calificación de Riesgos A.
La idea básica para distribuciones de frecuencias de dos o más grupos de datos es tener intervalos
comunes, es decir, que los límites de los intervalos para ambas distribuciones sean iguales. Para ello,
debemos seguir los siguientes pasos:
• Hallar el valor mínimo de todos los datos y el valor máximo de todos los grupos de datos, y usarlos
para calcular el rango.
• Siguiendo la regla de Sturges, el número de intervalos 𝑘 es:
El valor de 𝑛 es el máximo del número de datos de cada grupo. Tener en cuenta que no es la suma
de ambos tamaños muestrales.
• Luego se construye cada distribución de frecuencias, usando las mismas reglas de la distribución
de frecuencias de una variable continua.
Ejemplo 20
La empresa de investigación de mercado A lleva a cabo un estudio para obtener indicadores que le
permitan inferir respecto al consumo de energía eléctrica mensual (medido en kilovatios, redondeado
al entero más próximo) de las familias en los departamentos de Arequipa y Tacna. Dicho estudio, sus-
tentado en el análisis de muestras aleatorias tomadas en ambos departamentos, arrojó los siguientes
resultados:
Arequipa
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666
Tacna
217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424
426 429 438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636
Usando la regla de Sturges, calcule intervalos comunes y marcas de clase de una tabla de distribución
de frecuencias que permita comparar los datos.
Solución
Hallar el mínimo de todos los datos (217) y el máximo de todos los datos (666) de ambas ciudades, y
usarlos para calcular el rango. Calcular el número de categorías, el número de datos es el máximo
número de datos (40) entre ambas ciudades. Tener en cuenta que no es la suma de ambos tamaños
muestrales.
𝑅𝑎𝑛𝑔𝑜 = 𝑟 = 666 – 217 = 449
Estadística Descriptiva 2022 01 62
Siguiendo la regla de Sturges, el número de intervalos es:
La amplitud se redondea por exceso a cero decimales, pues los datos tienen cero decimales.
𝑟 449
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑤 = = = 74,83 ≈ 75
𝑘 6
47. Se extrajeron dos muestras aleatorias, la primera de 80 pasajeros de clase económica y la segunda
de 60 pasajeros de clase ejecutiva. Indique la clase que tenga valores concentrados en los valores
bajos.
Peso del equipaje de mano en clase económica Peso del equipaje de mano en clase ejecutiva
7,9 8,9 9,8 10,8 11,2 11,8 12,3 13,2 6,0 8,2 8,5 8,9 9,7 10,8
7,9 8,9 10,1 10,8 11,3 11,9 12,4 13,4 6,5 8,2 8,5 8,9 9,8 11,0
8,0 9,0 10,2 10,9 11,4 12,0 12,4 13,5 6,8 8,2 8,5 8,9 9,9 11,2
8,0 9,1 10,2 11,0 11,4 12,0 12,4 13,6 6,8 8,3 8,6 9,0 9,9 11,6
8,1 9,1 10,3 11,0 11,5 12,1 12,5 13,7 6,9 8,3 8,6 9,1 10,0 11,7
8,1 9,3 10,4 11,0 11,5 12,1 12,5 13,9 7,1 8,3 8,7 9,1 10,0 12,2
8,2 9,4 10,6 11,1 11,5 12,1 12,6 14,2 7,1 8,4 8,7 9,3 10,3 12,5
8,5 9,5 10,6 11,1 11,6 12,2 12,7 14,6 7,2 8,4 8,7 9,4 10,5 12,9
8,6 9,7 10,7 11,1 11,7 12,2 12,9 14,6 7,7 8,4 8,8 9,6 10,5 13,0
8,8 9,7 10,8 11,2 11,7 12,3 13,1 14,8 8,0 8,4 8,8 9,7 10,6 13,0
Fuente: Aerolínea Wayra
Solución
Interpretación
Determinar la clase que tenga valores concentrados en los valores bajos.
Representación
Vamos a realizar dos distribuciones de frecuencia y un polígono de frecuencias con intervalos comunes.
Cálculo
El valor máximo de todos los datos es 14,8 kilos y el mínimo es 6,0 kilos.
𝑘 = 7
Estadística Descriptiva 2022 01 64
La amplitud es igual al rango entre la cantidad de intervalos, esto es,
𝑟 8,8
𝑤= = = 1,26
𝑘 7
𝑤 = 1,3
Peso del equipaje de mano en clase económica Peso del equipaje de mano en clase ejecutiva
7,9 8,9 9,8 10,8 11,2 11,8 12,3 13,2 6,0 8,2 8,5 8,9 9,7 10,8
7,9 8,9 10,1 10,8 11,3 11,9 12,4 13,4 6,5 8,2 8,5 8,9 9,8 11,0
8,0 9,0 10,2 10,9 11,4 12,0 12,4 13,5 6,8 8,2 8,5 8,9 9,9 11,2
8,0 9,1 10,2 11,0 11,4 12,0 12,4 13,6 6,8 8,3 8,6 9,0 9,9 11,6
8,1 9,1 10,3 11,0 11,5 12,1 12,5 13,7 6,9 8,3 8,6 9,1 10,0 11,7
8,1 9,3 10,4 11,0 11,5 12,1 12,5 13,9 7,1 8,3 8,7 9,1 10,0 12,2
8,2 9,4 10,6 11,1 11,5 12,1 12,6 14,2 7,1 8,4 8,7 9,3 10,3 12,5
8,5 9,5 10,6 11,1 11,6 12,2 12,7 14,6 7,2 8,4 8,7 9,4 10,5 12,9
8,6 9,7 10,7 11,1 11,7 12,2 12,9 14,6 7,7 8,4 8,8 9,6 10,5 13,0
8,8 9,7 10,8 11,2 11,7 12,3 13,1 14,8 8,0 8,4 8,8 9,7 10,6 13,0
Una medida de localización o de tendencia central se refiere al valor central que representa a los datos
de una determinada variable.
Media
La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de dichos
valores dividida entre el número de valores.
∑7!6# 𝑥!
𝑥̅ =
𝑛
Características de la media
𝑦! = 𝑎 𝑥! + 𝑏
𝑦h = 𝑎𝑥̅ + 𝑏
Estadística Descriptiva 2022 01 67
Ejemplo 21
La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más impor-
tante de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federación In-
ternacional de Voleibol (FIVB) y contó con 16 equipos. En la figura se muestra algunas jugadoras de la
selección serbia. Calcule la media de la estatura de estas jugadoras.
Solución
Esto quiere decir que la estatura de las jugadoras de voleibol de Serbia está alrededor de 185,56 cm.
Estadística Descriptiva 2022 01 68
Ejercicios
48. Según los Censos Nacionales del 2017 en el Perú, la media de la edad de los peruanos es 31,51
años. Interprete este valor.
49. En 2018, la media del consumo anual per cápita de carne de pollo en Lima Metropolitana fue de
80,5 kilogramos. Interprete este valor.
El consumo anual per cápita de carne de pollo en Lima Metropolitana estuvo alrededor de 80,5
kilogramos
Grupo 1 1 2 3 4 5 6 7
Grupo 2 1 2 3 4 5 6 700
Si el sueldo promedio es de 4500 soles, ¿cuál de las dos ofertas debe aceptar el sindicato si lo que
desea es hacer máximo el sueldo medio de los trabajadores?
𝑦! = 𝑎 𝑥! + 𝑏
𝑦h = 𝑎𝑥̅ + 𝑏
𝑦h = 𝑎𝑥̅ + 𝑏
𝑦h = 𝑎𝑥̅ + 𝑏
La oferta que debe aceptar el sindicato si lo que desea es hacer máximo el sueldo medio de los
trabajadores es la oferta 2 (4692,5 > 46980).
53. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años. Calcule e interprete la media de la estatura de la muestra.
1,67 1,70 1,83 1,65 1,70 1,65 1,60 1,70 1,61 1,69
Rpta: 1,68 m.
54. Se muestra un gráfico del CIES Football Observatory sobre la media de estatura de las 32 seleccio-
nes que participaron en el Mundial de Rusia 2018. Bélgica es el equipo con mayor altura y Perú es
la 31°. Interprete el valor en el caso peruano.
Estadística Descriptiva 2022 01 70
55. En una empresa el sueldo medio es 2500 soles. La gerencia, luego de la negociación con el sindi-
cato, decide realizar un aumento del 3,5% y un bono de 150 soles a cada trabajador. Calcule el
nuevo sueldo medio. Rpta: 2737,5 soles
56. Una tienda rebaja los precios, en 12%, a toda su línea de casacas. Si la media de los precios de las
casacas antes de la rebaja era de 155 soles. Calcule la nueva media de los precios.
Rpta: 136,4 soles
Estadística Descriptiva 2022 01 71
Mediana
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto.
El 50% de las observaciones son menores o iguales a la mediana.
El 50% de las unidades elementales presen- El 50% de las unidades elementales presen-
tan valores en la variable de estudio iguales tan valores en la variable de estudio mayo-
o menores a la mediana. res a la mediana.
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 (𝑀𝑒)
Cálculo de la mediana
𝑛+1
𝑖 = 50 k l = 0,5(𝑛 + 1) = 𝐸, 𝑑
100
donde:
𝑛 es el tamaño de muestra
𝐸 es la parte entera
0, 𝐷 es la parte decimal
Si 𝑑 = 0, entonces 𝑚𝑒 = 𝑋[9]
donde:
𝑋[9] es el dato de la posición 𝐸
𝑋[9;#] es el dato de la posición 𝐸 + 1
Características de la mediana
• Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
• El valor de la mediana depende del número de datos observados.
• La mediana es un estadístico que no se ve afectado por valores extremos (mínimo y máximo). Por
eso se le utiliza cuando hay datos inusuales o el polígono de frecuencias no es simétrico.
Estadística Descriptiva 2022 01 72
Ejemplo 22
La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más impor-
tante de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federación In-
ternacional de Voleibol (FIVB).
Solución
Se interpreta como:
• El 50% de las jugadoras de voleibol de República Dominicana miden 186 centímetros o menos.
• El 50% de las jugadoras de voleibol de República Dominicana miden hasta 186 centímetros.
• El 50% de las jugadoras de voleibol de República Dominicana miden como máximo 186 centíme-
tros.
Estadística Descriptiva 2022 01 74
Ejercicios
57. Según los Censos Nacionales del 2017 en el Perú, la mediana de la edad de los peruanos es 29
años. Interprete este valor.
58. El Ministerio de Trabajo y el INEI ejecutaron la “Encuesta Nacional Especializada de Trabajo Infantil
2015” cuyo objetivo fue caracterizar el trabajo infantil en el Perú. La población tuvo de 5 a 17 años
de edad. La mediana del tiempo que trabajan a la semana fue de 14 horas. Interprete este valor.
El 50% de los niños de 5 a 7 años en el Perú que trabajan labora hasta 14 horas semanales.
59. Se registra los tiempos, en minutos, que se demora una cajera en atender a algunos clientes del
supermercado A.
5,3 2,7 10,7 8,2 3,0 5,4 5,6 10,2 11,3 2,6 2,6 5,4 3,5 7,0 11,5
El 50% de los clientes del supermercado A en la muestra es atendido en hasta 5,4 minutos.
Grupo 1 7 10 11 13 16 17 18
Grupo 2 7 10 11 13 16 17 180
“La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho con-
junto. El ……… son menores o igual a la mediana.”
“Usar la mediana como medida de tendencia central es preferible a usar la media cuando ……..”.
Estadística Descriptiva 2022 01 75
Moda
La moda de un conjunto de datos de una variable es el valor que se presenta con mayor frecuencia.
Cálculo de la moda
En Excel, para calcular la moda de valores numéricos se usa la función =MODA.UNO(datos) que brinda
como resultado una sola moda, incluso si el conjunto de números tiene más de una moda y la función
=MODA.VARIOS(datos) que brinda como resultado una o más modas, según corresponda al conjunto
de números.
En Excel, para calcular la moda se puede usar tablas dinámicas.
Características de la moda
• La moda se puede calcular para cualquier escala de medición.
• El valor de la moda no se ve afectada por valores extremos.
• La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más
modas (multimodal). Algunas series de datos no tienen moda.
Ejemplo 23
La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más impor-
tante de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federación In-
ternacional de Voleibol (FIVB) y contó con 16 equipos. En la figura se muestra algunas jugadoras de la
selección de China. Calcule e interprete la moda de la estatura de estas jugadoras.
Solución
La moda es 187 cm. La estatura más frecuente entre las jugadoras de la selección de vóley de China
es 187 cm.
Estadística Descriptiva 2022 01 76
Ejercicios
62. Según los Censos Nacionales del 2017 en el Perú, la moda de la edad de los peruanos es 8 años.
Interprete este valor. En el momento del censo había 547 909 peruanos de 8 años.
63. En el año 2016 se realizó el Primer Censo Nacional Penitenciario del Perú. Según este censo, de la
población penitenciaria que consumió alguna sustancia antes de cometer el delito, el 79,1% con-
sumió alcohol, marihuana 10,6% y pasta básica de cocaína 9,5%. Interprete el valor de la moda.
64. Calcule e interprete la moda de los siguientes datos, que corresponden al número de errores or-
tográficos por correo electrónico que cometen algunos gerentes de una empresa en una comuni-
cación escrita.
2 2 5 2 3 3 2 3 2 1 2 0 0 1 3 0 3 2 1 2
4 2 1 3 1 1 3 3 3 1 2 4 2 0 1 4 2 2 2 2
El número de errores ortográficos por correo electrónico que cometen algunos gerentes de una
empresa en una comunicación escrita más frecuente es 2.
Grupo 1 1 2 2 3 4 4 5
Grupo 2 1 2 2 3 4 4 500
La media ponderada permite calcular el valor medio considerando la importancia o peso de cada valor
sobre el total.
La fórmula es:
∑7!6# 𝑥! 𝑤!
𝑥̅= =
∑7!6# 𝑤!
donde:
𝑥! : Observación individual
𝑤! : Peso asignado a cada observación
Estadística Descriptiva 2022 01 78
Ejercicios
Evaluación Nota
Participación 1 20
Participación 2 17
Participación 3 10
Participación 4 15
Control 1 (5%) 15
Informe del trabajo de aplicación grupal (8%) 14
Sustentación del trabajo de aplicación (25%) 16
Participación 5 20
Participación 6 20
Participación 7 15
Participación 8 12
Evaluación de cierre de la Unidad II (20%) 12
Control 2 (8%) 13
Examen final (30%) 12
Si aprobó el curso con más de 14, el siguiente ciclo se matriculará en siete cursos. Indique lo que
hará el alumno.
2 × 17,33 + 5 × 15 + 8 × 14 + 25 × 16
𝐷𝐷1 = = 15,54
40
2 × 18,33 + 20 × 12 + 8 × 13
𝐷𝐷2 = = 12,68
30
Estadística Descriptiva 2022 01 79
40 × 15,54 + 30 × 12,68 + 30 × 12
𝑁𝑜𝑡𝑎 = = 13,62
100
Por lo tanto, el siguiente ciclo no se matriculará en siete cursos (13,62 < 14).
Estadística Descriptiva 2022 01 80
Medidas de variabilidad
Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero
no indican qué tan cercanos o lejanos están los datos de dicho valor central.
Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los
representa y, por lo tanto, permiten evaluar la confiabilidad de ese valor central.
Si la medida de dispersión:
• tiene un valor pequeño, los datos están concentrados alrededor de la medida de tendencia central,
• tiene un valor grande, los datos no están concentrados alrededor de la medida de tendencia cen-
tral.
Varianza
Cálculo de la varianza
∑5
!6#(𝑥! − 𝜇)
$
𝜎$ =
𝑁
∑7!6#(𝑥! − 𝑥̅ )$
𝑠$ =
𝑛−1
𝑦! = 𝑎 𝑥! + 𝑏
𝑆>$ = 𝑎$ 𝑆?$
𝑆> = 𝑎𝑆?
Estadística Descriptiva 2022 01 82
Ejercicios
Grupo 1 1 2 3 4 5 6 7
Grupo 2 1 2 3 4 5 6 800
68. En una empresa se hace dos ofertas a su sindicato sobre el aumento de sueldo a sus trabajadores:
• Oferta 1: Aumento general del 4%.
• Oferta 2: Aumento del 2,5% más un bono de 80 soles.
Si el sindicato desea elegir la opción con la menor desviación estándar, indique la oferta que elegirá
si la antigua desviación estándar de los sueldos era de 650 soles.
Interpretación
Determinar la oferta que debe elegir el sindicato.
Representación
Usaremos la propiedad de transformación lineal de datos.
Cálculo
Si cada uno de los 𝑛 valores 𝑥! es transformado en:
𝑦! = 𝑎 𝑥! + 𝑏
siendo 𝑎 y 𝑏 constantes, entonces, se tiene que la relación entre las desviaciones estándar de los
datos 𝑦! y 𝑥! es:
𝑆> = 𝑎𝑆?
Análisis y argumentación
La oferta que debe elegir el sindicato la oferta 2 (666,25 < 676).
Estadística Descriptiva 2022 01 83
69. En la ciudad 1 y 2 se extrae una muestra de siete personas y se registra los sueldos mensuales de
cada persona. Los datos se muestran en el cuadro siguiente.
Ciudad 1 1 2 3 4 5 6 7
Ciudad 2 1001 1002 1003 1004 1005 1006 1007
Calcule la desviación estándar de los sueldos mensuales. ¿Los ingresos de las dos ciudades tienen
la misma variabilidad?
Los dos grupos tienen la misma desviación estándar (2,1602). No, no tienen la misma variabilidad,
hay más variabilidad en los ingresos de la ciudad 1.
𝑠 2,1602
𝐶𝑉# = × 100% = × 100% = 54,01%
𝑥̅ 4
𝑠 2,1602
𝐶𝑉$ = × 100% = × 100% = 0,215%
𝑥̅ 1004
Hay más variabilidad en los ingresos de la ciudad 1 pues su coeficiente de variación es el mayor
(54,01% > 0,215%).
70. En una tienda, la desviación estándar de los precios de los jeans es de 20 soles, calcule la nueva
desviación estándar de los precios de los jeans si se realiza:
71. Los siguientes datos corresponden a consumos, en soles, de alumnos en la cafetería de una uni-
versidad. Calcule la desviación estándar y la varianza. Rpta: 2,945 y 8,68
3,0 7,5 5,5 12,0 6,5 2,7 2,0 4,5 8,0 4,0 2,5 3,0 1,5 7,0
Estadística Descriptiva 2022 01 84
Coeficiente de variación
El coeficiente de variación (𝐶𝑉) de un conjunto de datos indica el porcentaje que es la desviación es-
tándar en comparación con la media.
Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones es-
tándar no es muy útil, por ejemplo, cuando las medias están muy distantes.
𝜎
𝐶𝑉 = × 100%
𝜇
El coeficiente de variación se calcula solamente en variables medidas en escala de razón y solo para
valores positivos.
Ejemplo 24
Los siguientes datos representan resúmenes del número de mediciones de resistencia a la tracción de
cierto artículo que realizaron dos grupos de técnicos.
Grupo 1
media = 3 y desviación estándar = 1,10
Grupo 2
media = 5 y desviación estándar = 1,66
En el grupo con las mediciones que presenten mayor dispersión, se revisará exhaustivamente el pro-
ceso de producción.
Estadística Descriptiva 2022 01 85
Solución
Interpretación
Determinar en qué grupo se revisará exhaustivamente el proceso de producción.
Representación
Como los promedios son diferentes, se usa como indicador de dispersión al coeficiente de variación.
Cálculo
Como nos piden que indiquemos el grupo que presente la mayor dispersión, calcularemos el coefi-
ciente de variación, mediante la fórmula:
𝑠
𝐶𝑉 = × 100%
𝑥̅
1,10
𝐶𝑉# = × 100% = 36,67%
3
1,66
𝐶𝑉$ = × 100% = 33,20%
5
Análisis y argumentación
Las mediciones son más dispersas en el grupo 1, pues su coeficiente de variación es mayor. Como el
coeficiente de variación es mayor en el grupo 1, entonces, se revisará exhaustivamente el proceso de
producción del grupo 1.
Estadística Descriptiva 2022 01 86
Ejercicios
Complete los siguientes textos, con respecto a la variabilidad de los tamaños de las manzanas en
ambos grupos.
73. Según los Censos 2017: XII de Población, VII de Vivienda y III de Comunidades Indígenas se tiene
los siguientes resultados para la cantidad de personas en un hogar.
¿En cuál de las dos ciudades se presenta mayor variabilidad en la cantidad de personas en un hogar
en el Perú?
donde 𝑋BáD!BA y 𝑋Bí7!BA son los valores máximo y mínimo observados de la variable.
Medidas de asimetría
𝑥̅ − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝐴𝑠 = 3 k l
𝑠
74. El coeficiente de asimetría de los sueldos de los trabajadores en un país como el Perú seguramente
será positivo pues hay muchos sueldos bajos.
75. En un examen difícil de Estadística, el coeficiente de asimetría de los tiempos que toman los alum-
nos en resolverlo seguramente será negativo pues los alumnos van a tomar mucho tiempo para
resolverlo.
Perú: Distribución porcentual de peruanos según edad por sexo. 2007 Y 2017
77. Seguramente, la edad de los japoneses tiene coeficiente de asimetría cercana a cero, negativa.
78. Calcule el coeficiente de asimetría del precio del balón de gas de 10 kilos para el distrito de San
Luis según la página web https://www.facilito.gob.pe/facilito/actions/PreciosGLPAction.do del día
24 de marzo del 2022. Interprete dicho valor.
Observamos que el coeficiente de asimetría es negativo (-0,322), por lo tanto, hay una concentra-
ción en valores altos.
Estadística Descriptiva 2022 01 91
79. El salario, en cientos de soles, de los trabajadores una empresa se presenta a continuación:
13 12 13 14 15 15 15 18 23 24 24 25 25 36 42 48 60
Medidas de posición
Cuantiles
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos
que comprenden el mismo número de valores. Los cuantiles más importantes son los denominados
cuartiles, deciles y percentiles.
67% 33%
Menores notas 𝑃FG Mejores notas
50% 50%
Menores notas 𝑀𝑒 = 𝑃H, = 𝑄$ = 𝐷H Mejores notas
90% 10%
Menores notas 𝑃I, = 𝐷I Mejores notas
25% 75%
Menores notas 𝑃$H = 𝑄# Mejores notas
Percentiles
Dividen el conjunto de datos en 100 partes porcentualmente iguales.
𝑃%
Cuartiles
• Dividen el conjunto de datos en cuatro partes porcentualmente iguales.
• Se les denota como cuartil 1 𝑄# , cuartil 2 𝑄$ y cuartil 3 𝑄) .
• Su equivalente en percentiles es 𝑃$H , 𝑃H, y 𝑃GH , respectivamente.
Deciles
• Dividen el conjunto de datos en diez partes porcentualmente iguales.
• Se les denota como decil 1 𝐷# , decil 2 𝐷$ , decil 3 𝐷) , …, decil 9 𝐷I .
• Su equivalente en percentiles es 𝑃#, , 𝑃$, , 𝑃), , … , 𝑃I, , respectivamente.
Estadística Descriptiva 2022 01 93
Ejemplo
Si queremos determinar el puntaje mínimo para estar en el quinto superior, debemos calcular el per-
centil 80.
𝑛+1
𝑖=k l 𝑘 = 𝐸, 𝑑
100
donde:
𝑛 es el tamaño de muestra
𝐸 es la parte entera
0, 𝑑 es la parte decimal
Si 𝑑 = 0, entonces 𝑃% = 𝑋[9]
donde:
𝑋[9] es el dato de la posición 𝐸
𝑋[9;#] es el dato de la posición 𝐸 + 1
En Excel se usa la función =PERCENTIL.EXC(datos;k) donde k se escribe en forma decimal. Por ejemplo,
si se quiere calcular el percentil 25, se usa la función =PERCENTIL.EXC(datos;0.25).
Solución
Primero, ordenamos los datos.
Posición 13° 14° 15° 16° 17° 18° 19° 20° 21° 22° 23°
Edad 28 29 30 30 30 30 30 31 31 35 36
𝑛+1
𝑖=k l 𝑘 = 𝐸, 𝑑
100
23 + 1
𝑖=k l 75 = 18,0
100
Esto quiere decir que, en agosto del 2020, el 75% de los jugadores de la selección peruana de fútbol
tenía 30 años o menos.
Estadística Descriptiva 2022 01 96
Ejercicios
80. Según los Censos Nacionales del 2017 en el Perú, el percentil 20 de la edad de los peruanos es 11
años. Interprete este valor.
Error común
El 20% de los peruanos tiene 11 años.
81. Según los Censos Nacionales del 2017 en el Perú, el percentil 49 del número de habitaciones que
tiene una vivienda es 2. Interprete este valor. ¿Podría este percentil ayudar a entender la gran
cantidad de casos de COVID 19 en el Perú?
82. Rosa María Augusta Palacios McBride es una abogada y periodista peruana. Actualmente conduce
el programa Sin Guion trasmitido por YouTube en el canal RTV-La República, programa sobre polí-
tica peruana. Se desea calcular algunas medidas de posición sobre el número de visualizaciones de
sus videos en marzo del 2022.
El 80% de los programas Sin Guion en la muestra tuvieron hasta 104715 visualizaciones.
b. ¿Cuál debe ser el mínimo valor del número de visualizaciones para pertenecer al 15% de sus videos
más vistos?
85% 15%
Menos vistos 𝑃<H Más vistos
El mínimo valor del número de visualizaciones para pertenecer al 15% de sus videos más vistos es
112,723,8.
c. ¿Cuál debe ser el máximo valor del número de visualizaciones para pertenecer al 30% de sus videos
menos vistos?
30% 70%
Menos vistos 𝑃), Más vistos
El máximo valor del número de visualizaciones para pertenecer al 30% de sus videos menos vistos
es 73 275,6.
Estadística Descriptiva 2022 01 98
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Diagrama de cajas
El diagrama de cajas o box plot es una gráfica que describe la distribución de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango
intercuartil como medida de referencia de dispersión.
Valor atípico
Es un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera valor atípico
a cualquier punto mayor al límite superior (a la derecha) o menor al límite inferior (o a la izquierda); es
decir, que se encuentre fuera de los límites.
1. Dibuje el eje vertical, eje horizontal, título, rótulos de los ejes y fuente. La variable 1 (cuantitativa)
se representa en el eje vertical y la variable 2 en el eje horizontal.
Fuente: Variable 2
2. Trace un rectángulo con los extremos del percentil 25 y percentil 75, en cada categoría. En la caja
trace una recta horizontal en el lugar del percentil 50.
𝑃&%
Variable 1 (Cuantitativa)
𝑃%'
Unidad de medición
𝑃"%
3. Ubique los límites inferior y superior mediante el rango intercuartil, el límite superior está a
1,5 𝑅𝐼𝐶 arriba del P75, mientras que, el límite inferior está a 1,5 𝑅𝐼𝐶 debajo del P25.
o Trace los bigotes desde los extremos de las cajas hasta los valores mínimo y máximo dentro de
los límites inferior y superior.
o Marque con asteriscos (*) las localizaciones de los valores atípicos.
Estadística Descriptiva 2022 01 100
Distribución de unidades elementales según variable 1 por variable 2
*
𝑃&%
Variable 1 (Cuantitativa)
𝑃%'
Unidad de medición
𝑃"%
*
Categoría 1 Categoría 2 Categoría 3
Fuente: Variable 2
En el diagrama de cajas, también se puede poner las categorías en el eje vertical, con lo que
las cajas y los bigotes estarán de forma horizontal.
*
Variable 2
Categoría 2
Categoría 3
Variable 1 (Cuantitativa)
Fuente: Unidad de medición
En la construcción del diagrama de cajas se pueden presentar dos casos, cuando el valor mínimo o
máximo son valores atípicos.
Por ejemplo, si el límite inferior 𝐿! = 1,7; el percentil 25 𝑃$H = 3,5 y los datos son:
Entonces:
Por ejemplo, si el límite superior 𝐿* = 6,2, ; el percentil 75 𝑃GH = 3,8 y los datos son:
Entonces:
*
Valor atípico 6,7
Límite superior 𝐿$ = 6,2
Valor máximo dentro de los límites 5,8
Bigote superior
3,8 Percentil 75 𝑃%#
Estadística Descriptiva 2022 01 102
Interpretación de un diagrama de cajas
Valor atípico *
P75 *
P50
Variable cuantitativa
Máximo
P25
Rango Asimetría
RIC
Asimetría en el
50% central
* Valor atípico
Mínimo
Ejemplo 26
Los registros policíacos del distrito A muestran los números de informes de delitos diarios para una
muestra de días durante los meses de invierno y una muestra de días durante los meses de verano.
Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28
Construya un gráfico que permita comparar, entre invierno y verano, los valores medianos, la variabi-
lidad y encontrar los valores atípicos del número de delitos diarios. Se destinará más efectivos policia-
les en la estación (invierno o verano) que presente mayor cantidad de delitos.
Estadística Descriptiva 2022 01 103
Solución
Interpretación
Se debe hacer un gráfico que permita comparar la cantidad de delitos diarios.
Representación
Se hará un diagrama de cajas del número de delitos diarios por estación.
Cálculo
Calculemos los percentiles y los rangos intercuartiles. Se debe calcular los percentiles con datos sim-
ples. No calcule la distribución de frecuencias.
En el invierno, los bigotes llegan como mínimo a 5 y como máximo a 22 y en el verano, llegan como
mínimo a 5 y como máximo a 28.
Análisis y argumentación
La mediana es mayor en verano, el 𝑅𝐼𝐶 es más grande en invierno, no hay valores atípicos, pues ningún
dato está fuera de los límites.
Solución
Interpretación
Representación
Cálculo
70
60
50
40
30
20
10
0
Sin capacitación Con capacitación
Condición de capacitación
Fuente: Empresa A
Análisis y argumentación
Estadística Descriptiva 2022 01 105
83. El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en la si-
guiente tabla.
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60
Calcule el rango y el rango intercuartil de los datos. Rpta: Rango = 54, RIC = 6
H1 10 11 11 12 12 12 12 13 13 13 14 15 15 16 16 17 18 18 19 19 19 20
H2 4 11 11 11 12 12 13 13 14 14 15 15 16 16 15 16 16 17 17 18
H3 9 9 10 10 10 11 12 12 12 12 13 13 13 13 14 14 15 15 15 17
Indique el horario con mayor mediana de notas, el horario con mayor rango intercuartil y el ho-
rario donde existen valores atípicos.
El horario con mayor mediana de notas es el horario 1 y 2 (14,5 puntos).
Estadística Descriptiva 2022 01 106
El horario con mayor rango intercuartil es el horario 1 (RIC = P75 – P25 = 18 - 12 = 6 puntos)
RIC
El horario donde existen valores atípicos es el horario 2 (El valor atípico es 4 puntos).
86. Complete el siguiente cuadro con la mejor respuesta posible de acuerdo con la frase mencionada.
Rpta: F, V, F, F, V, F, V, F, F, V, V, V, F, V, F, F
Estadística Descriptiva 2022 01 109
Logro de la unidad 2
Al finalizar la Unidad 2, el estudiante analiza situaciones reales de incertidumbre aplicando los con-
ceptos de probabilidades valorando su utilidad en la toma de decisiones.
Temario
• Reglas de conteo y combinaciones
• Probabilidad: concepto, experimento aleatorio, espacio muestral y evento
• Operaciones con eventos
• Probabilidad condicional
• Probabilidad total
• Teorema de Bayes
• Diagrama del árbol
• Eventos independientes
Estadística Descriptiva 2022 01 110
Ejemplo 27
Ejemplo 28
El silencio sísmico de más de 270 años que se registra en Lima indica que existen altas probabilidades
de que la capital sea sacudida, en algún momento, por un sismo de magnitud superior a 8,5; advirtió
el presidente ejecutivo del Instituto Geofísico del Perú (IGP).
Estadística Descriptiva 2022 01 111
Experimento aleatorio
Es todo proceso que genera dos o más resultados bien definidos sin que se pueda predecir con certeza
cuál de ellos será observado u ocurrirá en cada realización del proceso. En cualquier repetición simple
de un experimento, ocurrirá uno y solo uno de los posibles resultados experimentales.
Espacio muestral
Es el conjunto de todos los posibles resultados de todos los resultados experimentales. Se le suele
simbolizar por 𝑆 o Ω.
Evento
Un evento es un subconjunto del espacio muestral. Al realizar un experimento, diremos que el evento
A ha ocurrido si el resultado obtenido es un elemento del evento A.
Probabilidad de un evento
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por tanto, la pro-
babilidad es una medida del grado de incertidumbre asociado con un evento.
Un valor de probabilidad cercano a 0 indica que es muy improbable que ocurra el evento, mientras
que una probabilidad cercana a 1 indica que es casi seguro que ocurra el evento.
El objetivo del cálculo de probabilidades es el obtener un valor numérico asociado con la ocurrencia
de determinado acontecimiento para facilitar la toma de decisiones relacionada con él.
Sea un experimento aleatorio cuyo correspondiente espacio muestral W está formado por un número
finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces, definimos la
probabilidad de un evento 𝐴 como sigue:
𝑛(𝐴)
𝑃(𝐴) =
𝑛(Ω)
donde:
𝑛(𝐴) es el número de elementos del evento 𝐴
𝑛(Ω) es el número de elementos del espacio muestral
Estadística Descriptiva 2022 01 112
Ejercicios
89. Marque con un aspa, asignando una opción a la situación de acuerdo con su posibilidad de ocu-
rrencia.
92. Indicar, para cara uno de los siguientes experimentos aleatorios, los respectivos espacios mues-
trales: lanzar una moneda, jugar un partido de fútbol, jugar un partido de tenis, lanzar un dado,
lanzar dos dados.
93. Un experimento consiste en lanzar primero un dado para después lanzar una moneda, siempre y
cuando el número del dado sea par. Si el resultado del dado es impar, la moneda se lanza dos
veces. Determine el espacio muestral de este experimento.
94. Se lanzan dos dados, calcule la probabilidad de que la suma de los dos dados sea mayor a siete.
Rpta: 0,4167
95. De 50 conductores, nueve no tienen los papeles en regla. Si un policía escoge al azar a cinco con-
ductores y les pide sus papeles.
a. Calcule la probabilidad de que elija a dos que no tengan los papeles en regla. Rpta: 0,1811
b. Calcule la probabilidad de que elija al menos un conductor sin papeles en regla. Rpta: 0,6463
96. En un lote de polos, hay 70 polos rojos, 150 blancos y 90 azules. Si extrae un polo al azar.
Con frecuencia se construyen eventos mediante la combinación de eventos más sencillos. Es usual
emplear la notación de conjuntos para describir los eventos construidos de esta forma.
Sea 𝜀 un experimento aleatorio y Ω el espacio muestral asociado. Si 𝐴 y 𝐵 son dos eventos definidos
en Ω, se define las siguientes operaciones con eventos.
Complemento (AC)
Para un evento 𝐴 cualquiera se define su complemento 𝐴K como el evento consistente en todos los
puntos de Ω que no están en 𝐴.
Ac
Se tiene que
𝑃(𝐴) = 1 − 𝑃(𝐴K )
Unión de eventos (A È B)
Para dos eventos 𝐴 y 𝐵, la unión del evento 𝐴 con el evento 𝐵 es el evento que contiene todos los
puntos de 𝑆 que pertenecen a 𝐴 o a 𝐵 o a ambos.
A B
A B
Diferencia de eventos (A - B)
Para dos eventos 𝐴 y 𝐵, la diferencia de los eventos 𝐴 menos 𝐵 es el evento que contiene todos los
puntos de Ω que pertenecen a 𝐴 y no pertenecen a 𝐵.
A B
A B
Escriba los siguientes eventos en función de los eventos 𝐴 y 𝐵. Además, grafique dicho evento en un
diagrama de Venn.
Solución
A B
que el financista tenga éxito en las dos inver-
𝐴∩𝐵
siones
A B
que el financista no tenga éxito en la Bolsa de K
𝐵
Valores
A B
que el financista tenga éxito en, al menos una,
𝐴∪𝐵
de sus inversiones
A B
que el financista tenga éxito solamente en una
𝐴 Δ 𝐵
de sus inversiones
A B
que el financista tenga éxito en la Bolsa de Va-
𝐵−𝐴
lores, pero no en los fondos mutuos
Estadística Descriptiva 2022 01 117
Eventos mutuamente excluyentes
A B
Regla de la adición
Regla de la multiplicación
Si un experimento se realiza por una sucesión de 𝑘 pasos, en el primer paso tiene 𝑛# resultados posi-
bles, el segundo tiene 𝑛$ resultados posibles y así sucesivamente, entonces el número total de resul-
tados del experimento es:
𝑛(𝐴) = 𝑛# × 𝑛$ × … × 𝑛%
𝑛!
𝑛(𝐴) = 𝐶D7 =
𝑥! (𝑛 − 𝑥)!
Estadística Descriptiva 2022 01 118
Ejercicios
98. Una persona puede elegir solo una de dos opciones para almorzar: una de cinco diferentes ham-
burguesas o una de diez pizzas diferentes. ¿De cuántas maneras diferentes puede almorzar dicha
persona?
99. Un restaurante tiene la siguiente carta. Si un menú consta de elegir un entrante, un segundo y un
postre, ¿de cuántas maneras diferentes puede elegir un cliente su menú?
𝑛(𝐴) = 𝑛# × 𝑛$ × 𝑛) = 5 × 5 × 4 = 100
Estadística Descriptiva 2022 01 119
100. En un vuelo, la aerolínea ha sobrevendido pasajes, por lo que tendrá que ofrecer premios a pasa-
jeros para que no viajen en ese vuelo. Si hay 15 pasajeros que viajan solos y están dispuestos a no
viajar y recibir los premios ¿De cuántas maneras diferentes se puede elegir a solo ocho de ellos?
15!
𝑛(𝐴) = 𝐶<#H = = 6435
8! × (15 − 8)!
101. Para jugar la Tinka se debe elegir seis números de un total de 45, sin importar el orden.
a. ¿De cuántas maneras diferentes se puede elegir seis números de un total de 45?
b. ¿Cuál es la probabilidad de que una persona gane la Tinka con una jugada?
102. En un hogar hay diez personas y un encuestador necesita entrevistar a dos de ellas, sin importar
el orden. ¿De cuántas maneras diferentes se puede elegir a esas dos personas? Rpta: 45
103. Al fin del ciclo, los 30 alumnos de una sección deben elegir a tres de ellos al azar para que organi-
cen un “compartir”. ¿Cuántos grupos diferentes de tres personas se pueden elegir?
Rpta: 4060
Estadística Descriptiva 2022 01 120
Axiomas de la probabilidad
Axioma 1
0 £ 𝑃(𝐴) £ 1
Axioma 2
𝑃(𝑆) = 1
Axioma 3
Si 𝐴 y 𝐵 son dos eventos mutuamente excluyentes entonces:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
A B
A B
C
Estadística Descriptiva 2022 01 121
104. La probabilidad de una persona sea contagiada por el virus A es de 0,12 y de que sea contagiada
por el virus B es 0,2; mientras que la probabilidad de que sea contagiada por alguno de los dos
virus es 0,25. Calcule la probabilidad de que ocurran los siguientes eventos.
𝑃(𝐴 ∩ 𝐵) = 0,07
A B
0,75
A B
que sean contagiados por los
𝑃(𝐴 ∩ 𝐵) = 0,07
dos virus.
A B
que sea contagiado por solo
𝑃(𝐴 ∆ 𝐵) = 0,05 + 0,13 = 0,18
un virus.
A B
que sea contagiado solo por el K
𝑃(𝐵 − 𝐴) = 𝑃(𝐴 ∩ 𝐵) = 0,13
virus B.
105. Un fabricante de teléfonos celulares acaba de lanzar dos modelos de smartphones económicos:
el L720 y el L520. La probabilidad de que el modelo L720 tenga éxito es 0,70 y en el modelo L520
es 0,60. La probabilidad de que al menos uno de los modelos tenga éxito es 0,90. Determine la
probabilidad de que se tenga éxito solo en uno de los modelos. Rpta: 0,5
106. La probabilidad de que una persona viaje a Alemania el próximo año es 0,40; a Bélgica es 0,5 y
Chipre es 0,37. Además, la probabilidad de viajar a Alemania y Bélgica es 0,15; a Alemania y Chipre
es 0,10 y a Bélgica y Chipre es 0,12. Si la probabilidad de que la persona viaje a por lo menos a una
ciudad es 0,95; calcule la probabilidad de que la persona viaje a una sola ciudad.
Estadística Descriptiva 2022 01 122
Probabilidad condicional
Sean los eventos 𝐴 y 𝐵 definidos en el espacio muestral Ω, entonces la probabilidad de que ocurra el
evento 𝐴 teniendo como condición que el evento 𝐵 ya ocurrió, se denomina probabilidad condicional.
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵) =
𝑃(𝐵)
A B
𝑃(𝐵)
𝑃(𝐴 ∩ 𝐵)
Ejemplo 29
En un grupo, conformado por hombres y mujeres, existen profesionales y no profesionales de acuerdo
con la siguiente tabla.
Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
a. Si se elige un producto al azar, para una de las tiendas, calcule la probabilidad de que sea jugo de
maracuyá y en frasco.
b. ¿Cuál es la probabilidad de que sea mermelada o el envase sea de sachet?
c. Si el envase es sachet, ¿cuál es la probabilidad de que sea esencia?
Solución
a. Si se elige un producto al azar, para una de las tiendas, calcule la probabilidad de que sea jugo de
maracuyá y en frasco.
Solución
Lo primero es definir los eventos necesarios.
𝐽:= que el producto elegido sea jugo
𝐹:= que la presentación elegida sea frasco
62
𝑃(𝐽 ∩ 𝐹) = = 0,248
250
Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
Solución
Sean los eventos:
𝑀:= que el producto elegido sea mermelada
𝑆:= que la presentación elegida sea sachet
Estadística Descriptiva 2022 01 124
88 120 50
= + − = 0,632
250 250 250
Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
Solución
20
𝑃(𝐸/𝑆) = = 0,167
120
Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
Estadística Descriptiva 2022 01 125
Ejemplo 31
La mayoría de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95 octanos y 97
octanos. Con frecuencia, alguna de cada está enriquecida con un aditivo. La tabla siguiente ilustra los
porcentajes de clientes que prefieren cada tipo.
a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?
b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado
gasolina de 97 octanos?
c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado
gasolina sin aditivo?
Solución
a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?
Solución
Solución
Estadística Descriptiva 2022 01 126
La probabilidad pedida es:
𝑃(𝐷 ∩ 𝐶 K )
𝑃(𝐷 ⁄𝐶 K ) =
𝑃 (𝐶 K )
0,30
= = 0,60
0,20 + 0,30
Solución
𝑃(𝐴K ∩ 𝐵K )
𝑃(𝐴K ⁄𝐵K ) =
𝑃 (𝐵 K )
0,40 + 0,25
= = 0,8125
0,50 + 0,30
107. Objetivo específico: Analizar el comportamiento de los clientes considerando el destino de viaje,
el tipo de cliente y el modo de compra. Se ha obtenido la siguiente tabla.
a. Si se elige al azar a un cliente que compra por Internet, calcule la probabilidad de que sea un viajero
premium.
28 + 13 41
𝑃(𝐴⁄𝐺 ) = =
68 + 46 114
b. Si se elige al azar a un cliente frecuente, calcule la probabilidad de que compre pasajes con destino
nacional.
8 + 25 33
𝑃(𝐷⁄𝐵 ) = =
68 68
Estadística Descriptiva 2022 01 128
108. Según el II Censo Universitario, en el año 2010, 63 900 alumnos ingresaron a las universidades
públicas y 194 151 a las universidades privadas. De ellos, en las universidades públicas, 28 798
ingresantes fueron mujeres, mientras que en las privadas lo fueron 98 942.
a. Si se elige al azar a una ingresante, calcule la probabilidad de que estudie en una universidad
privada. Rpta: 0,77456
b. Si se elige al azar a un ingresante de universidad privada, calcule la probabilidad de que sea
mujer. Rpta: 0,50961
109. En una empresa hay 150 trabajadores; 25 de los hombres y 35 de las mujeres realizan actividades
de responsabilidad social en la empresa. El total de mujeres en la empresa es de 57.
o de forma equivalente:
110. Un sistema de seguridad en una máquina tiene dos componentes. La probabilidad de que el pri-
mer componente falle es 0,75% y la probabilidad de que el segundo componente falle si el primero
ha fallado es 2%. El sistema falla si ambos componentes fallan. Si la probabilidad de que falle el
sistema de seguridad es mayor al 0,1% se pondrá un tercer componente de seguridad. Indique lo
que se hará.
Interpretación
Determinar si se pondrá un tercer componente de seguridad.
Representación
Definamos los eventos necesarios.
𝐴 ≔ que el primer componente falle 𝑃(𝐴) = 0,0075
𝐵 ≔ que el segundo componente falle 𝑃(𝐵⁄𝐴) = 0,02
Utilizaremos la ley multiplicativa.
Cálculo
La probabilidad pedida es la probabilidad de que falle el sistema de seguridad; el sistema falla si
ambos componentes fallan, es decir:
𝑃(𝐵⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵)
𝑃(𝐴K ) = 0,9925
𝑃(𝐵K ⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵K )
Análisis y argumentación
La probabilidad de que falle el sistema de seguridad es 0,00015; que es menor a 0,001. Por lo
tanto, no se pondrá un tercer componente de seguridad.
111. Para elegir a una persona entre tres se prepara una bolsa con dos bolas negras y una bola blanca.
Los tres van sacando, por orden, una bola que no devuelven. Quien saque la bola blanca gana.
¿Quién lleva más ventaja: el primero, el segundo o el tercero? Rpta: Nadie
Estadística Descriptiva 2022 01 131
Partición del espacio muestral
W
𝐴# 𝐴$ … 𝐴%
Probabilidad total
𝑃(𝐵) = • 𝑃(𝐵 ∩ 𝐴! )
!6#
𝐵
Estadística Descriptiva 2022 01 132
Árbol de probabilidades
𝑃(𝐵⁄𝐴) 𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴)
𝑃(𝐵K ⁄𝐴) 𝑃(𝐴 ∩ 𝐵K )
𝑃(𝐵⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵)
𝑃(𝐴K )
𝑃(𝐵K ⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵K )
Teorema de Bayes
Si los 𝑘 eventos 𝐴# , 𝐴$ , 𝐴) , ⋯ , 𝐴% constituyen una partición del espacio muestral Ω y 𝑃(𝐴! ) ≠ 0 para
todo 𝑖 = 1, 2, 3, … , 𝑘; entonces para un evento 𝐵 cualquier contenido Ω tal que 𝑃(𝐵) ≠ 0.
𝑃(𝐴! ∩ 𝐵)
𝑃(𝐴! •𝐵) =
𝑃(𝐵)
𝑃(𝐴! )𝑃(𝐵⁄𝐴! )
𝑃(𝐴! ⁄𝐵) = %
∑!6# 𝑃(𝐴! )𝑃(𝐵/𝐴! )
El teorema de Bayes establece una relación muy importante en la teoría de probabilidades y es la base
para la revisión de la asignación de probabilidades a la luz de información adicional.
Ejemplo 32
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 2% de las usuarias y el 0,8% de
los usuarios han sufrido de algún tipo de robo durante el uso del Metropolitano.
Si se elige un usuario al azar que ha sido víctima de robo, calcule la probabilidad de que sea hombre y
la probabilidad de que sea mujer. Se va a establecer una oficina de protección al usuario y se pondrá
énfasis a los usuarios cuyo sexo tengan más probabilidad de sufrir algún tipo de robo.
Estadística Descriptiva 2022 01 133
Solución
Interpretación
Se va a determinar el sexo que tenga más probabilidad entre los que han sufrido un robo.
Representación
Sean los eventos:
𝑅:= Que el usuario sea víctima de robo
𝐻:= Que el usuario sea hombre.
𝑀:= Que el usuario sea mujer
Usaremos el teorema de la probabilidad total y el teorema de Bayes.
Cálculo
Por el teorema de la probabilidad total.
𝑃(𝑅⁄𝐻 ) = 0,008
𝑃(𝐻) = 0,55
𝑃(𝑅K ⁄𝐻) = 0,992
Análisis y argumentación
Entre los que han sufrido algún tipo de robo, las mujeres tienen una mayor probabilidad. Se pondrá
énfasis en la protección de las mujeres.
Estadística Descriptiva 2022 01 134
Ejemplo 33
Si Expórtame, una empresa que exporta productos alimenticios, distribuye sus productos de la si-
guiente manera: 45% en jugo, 35% en mermelada y el resto en esencia. Además, se sabe que la pro-
babilidad de que un jugo esté en mal estado es 4%, una mermelada es 2% y una esencia es 3%. Si de
los productos en mal estado se selecciona uno al azar, determine el tipo de producto que sea más
probable. Para dicho producto se establecerá un nuevo esquema de control de calidad.
Solución
Interpretación
Se debe determinar el tipo de producto que es más probable que esté en mal estado.
Representación
Sean los siguientes eventos:
Cálculo
Completemos el árbol de probabilidades.
𝑃(𝐵⁄𝑀) = 0,98
𝑃(𝑀) = 0,35
𝑃(𝐵K ⁄𝑀) = 0,02
𝑃(𝐽 ∩ 𝐵M ) 0,018
𝑃(𝐽⁄𝐵M ) = = = 𝟎, 𝟓𝟖𝟎𝟔
𝑃(𝐵M ) 0,031
𝑃(𝑀 ∩ 𝐵M ) 0,007
𝑃(𝑀⁄𝐵M ) = = = 0,2258
𝑃(𝐵M ) 0,031
𝑃(𝐸 ∩ 𝐵M ) 0,006
𝑃(𝐸⁄𝐵M ) = = = 0,1936
𝑃(𝐵M ) 0,031
Análisis y argumentación
De los productos en mal estado, el más probable es el jugo. Se establecerá un nuevo esquema de
control de calidad para los jugos.
Ejemplo 34
El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en
efectivo, con cheque o al crédito, con probabilidades respectivas de 0,3; 0,3 y 0,4.
La probabilidad de que una venta sea por más de $50, es igual a 0,2 si ésta es en efectivo, es igual a
0,9 si ésta es con cheque y es igual a 0,6 si ésta es al crédito.
Si compra por más de $50, ¿qué es más probable que haya pagado en efectivo, con cheque o al crédito?
Solución
Sean los eventos:
𝐸: La compra se realiza con dinero en efectivo
𝐶𝐻: La compra se realiza con cheque
𝐶: La compra se realiza al crédito
𝑀: La compra es por más de $ 50
𝑀M : La compra no es por más de $ 50
𝑃(𝑀⁄𝐸 ) = 0,2
𝑃(𝐸) = 0,3
𝑃(𝑀K ⁄𝐸) = 0,8
𝑃(𝑀⁄𝐶𝐻) = 0,9
𝑃(𝐶𝐻) = 0,3
𝑃(𝑀K ⁄𝐶𝐻) = 0,1
𝑃(𝑀⁄𝐶 ) = 0,6
𝑃(𝐶) = 0,4
𝑃(𝑀K ⁄𝐶 ) = 0,4
Estadística Descriptiva 2022 01 136
Por el teorema de la probabilidad total, se tiene que:
112. En una empresa el 35% de los trabajadores son mujeres y el 65% son hombres. Un día ha llegado
tarde a trabajar el 2% de las mujeres y el 4% de los hombres.
𝑃(𝑇) = 0,033
b. Si se elige, al azar a un trabajador que no ha llegado tarde, calcule la probabilidad de que sea
elegida una mujer.
113. Una empresa que fabrica polos mediante tres máquinas, A, B y C, producen el 25%, 30% y 45%,
respectivamente, del total de los polos producidos en la fábrica. Los porcentajes de producción
defectuosa de estas máquinas son del 2%, 4% y 3% respectivamente.
a. Si se elige un polo al azar; calcule la probabilidad de que sea no defectuoso. Rpta: 0,9695
𝑃(𝐷⁄𝐵) = 0,04
𝑃(𝐵) = 0,30
𝑃(𝐷K ⁄𝐷 ) = 0,96
𝑃(𝐷⁄𝐶 ) = 0,03
𝑃(𝐶) = 0,45
𝑃(𝐷K ⁄𝐶 ) = 0,97
b. Tomamos, al azar, un polo y resulta ser defectuoso; calcule la probabilidad de haber sido pro-
ducido por la máquina B. Rpta: 0,3934
𝑃(𝐷⁄𝐴) = 0,02
𝑃(𝐴) = 0,25
𝑃(𝐷K ⁄𝐴) = 0,98
𝑃(𝐷⁄𝐵) = 0,04
𝑃(𝐵) = 0,30
𝑃(𝐷K ⁄𝐵 ) = 0,96
𝑃(𝐷⁄𝐶 ) = 0,03
𝑃(𝐶) = 0,45
𝑃(𝐷K ⁄𝐶 ) = 0,97
Estadística Descriptiva 2022 01 140
Eventos independientes
𝑃(𝐴/𝐵) = 𝑃(𝐴)
𝑃(𝐴 ∩ 𝐶) = 𝑃(𝐴)𝑃(𝐶)
𝑃(𝐴 ∩ 𝐵 ∩ 𝐶) = 𝑃(𝐴)𝑃(𝐵)𝑃(𝐶)
Estadística Descriptiva 2022 01 141
Ejercicios
A B A B
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵)
115. La probabilidad de que un emprendedor tenga éxito en un restaurante es del 30% y la probabili-
dad de que tenga éxito en una cafetería es del 35%. Si la probabilidad de tener éxito en al menos
uno de los negocios es mayor al 50% decidirá emprender los dos negocios. ¿Qué decisión se to-
mará? Asuma independencia.
Interpretación
Determinar si se decidirá emprender los dos negocios.
Representación
Definamos los eventos necesarios.
A:= que el emprendedor tenga éxito en un restaurante 𝑃(𝐴) = 0,30
B:= que un emprendedor tenga éxito en la cafetería 𝑃(𝐵) = 0,35
Usaremos la independencia de eventos.
Cálculo
Por independencia, se tiene que:
A B
0,455
La probabilidad pedida es la probabilidad de tener éxito en al menos uno de los negocios, es decir:
116. Un vendedor de artefactos eléctricos, en una tienda por departamentos sabe, por experiencia,
que el 2% de las personas que preguntan por un televisor finalmente lo compran. El vendedor ha
decidido que si no vende al menos un televisor ese día renunciará a su trabajo. Calcule la proba-
bilidad de que no renuncie si ese día preguntaron 50 clientes por televisores.
117. Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer trabajo es
del 70% y que sea aceptado en el segundo es del 50%. Si ser aceptado en dichos trabajos es inde-
pendiente entre sí.
a. ¿Cuál es la probabilidad de que al menos sea aceptado en uno de los trabajos? Rpta: 0,85
b. ¿Cuál es la probabilidad de que solamente sea aceptado en uno solo de los trabajos?
Rpta: 0,50
118. El pulpo Paul era un octópodo que fue empleado como oráculo para predecir los resultados de la
selección alemana de fútbol en el Mundial de Fútbol 2010, acertando los ocho emparejamientos
que se le propusieron, los siete partidos de Alemania en la Copa Mundial de Fútbol de 2010 y la
final entre España y Holanda. Antes de cada partido, a Paul se le presentaron dos contenedores
idénticos con comida: uno de ellos estaba marcado con una bandera, usualmente la de Alemania
y el otro con la bandera del equipo oponente. La elección de Paul se interpretaba como el equipo
que lograría la victoria. Si el pulpo Paul, en realidad, escogió los contenedores al azar, calcule la
probabilidad de acertar en los resultados de los ocho los partidos que le propusieron. Asuma in-
dependencia entre cada elección. Rpta: 0,0039
𝐴 = 𝐴# ∩ 𝐴$ ∩ 𝐴) ∩ … ∩ 𝐴<
119. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en una
chica acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma independencia
entre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo menos con una
de ellas. Rpta: 0,8046
Estadística Descriptiva 2022 01 144
Logro de la unidad 3
Al finalizar la Unidad 3, el estudiante aplica los conceptos de variable aleatoria, valor esperado y pro-
babilidad para la toma de decisiones responsables dentro de un escenario del ámbito empresarial.
Temario
• Definición de variable aleatoria discreta y continua
• Función de probabilidad de una variable aleatoria discreta
• Función de densidad y función de distribución acumulada de una variable aleatoria continua.
• Valor esperado y varianza de variables aleatorias discretas y continuas
• Estudio de propiedades de las siguientes distribuciones: binomial, hipergeométrica, Poisson, uni-
forme, normal, exponencial
• Muestreo aleatorio. Tipos de muestreo.
• Propiedad reproductiva de la distribución normal
• Distribución muestral de un promedio
• Teorema del límite central
Estadística Descriptiva 2022 01 145
Variable aleatoria
Se denomina variable aleatoria a una descripción numérica del resultado de un experimento.
La variable aleatoria atribuye a cada evento un número que no es aleatorio o imprevisible, sino fijo y
predeterminado.
Lo que es aleatorio es el experimento sobre cuyo espacio muestral se define la variable aleatoria.
Ejemplo
1
𝑃(𝐴) = 𝑃(𝑋 = 3) = 𝑓(3) =
6
Se llama rango o recorrido de una variable aleatoria 𝑋 y lo denotaremos 𝑅? , al conjunto de los valores
reales que la variable aleatoria puede tomar.
Una variable aleatoria es discreta si puede asumir un conjunto finito o infinito numerable de valores
diferentes.
Una variable aleatoria es continua si puede asumir cualquier valor en un intervalo.
Estadística Descriptiva 2022 01 146
Ejercicios
Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se denota
𝑃(𝑋 = 𝑥).
Por ejemplo: número de alumnos matriculados por curso, cantidad de preguntas correctamente con-
testadas en una evaluación de personal, cantidad de clientes que visitan un centro comercial en un día
determinado.
La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que asigna a
todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:
Condición 1
𝑓(𝑥) ≥ 0
Condición 2
• 𝑓(𝑥) = 1
N+
𝑓(𝑥) = 𝑃(𝑋 = 𝑥)
Ejemplo 35
Calcule 𝑎 para que la siguiente función sea una función de probabilidad. Grafique 𝑓(𝑥).
Solución
La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que asigna a
todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:
Condición 1
𝑓(𝑥) ≥ 0
La primera condición se cumple cuando a es mayor que cero, puesto que x > 0.
Estadística Descriptiva 2022 01 148
Condición 2
• 𝑓(𝑥) = 1
N+
𝑎70 = 1
1
𝑎=
70
0.40 0.357
0.35
0.286
0.30
0.25 0.214
f(x)
0.20
0.143
0.15
0.10
0.05
0.00
0 5 10 15 20 25 30
X
Ejemplo 36
Sea 𝑋 el número de lanzamientos de un dado hasta que salga el primer seis. Determine la función de
probabilidad de la variable 𝑋 y calcule 𝑃(𝑋 > 3).
Solución
Sea la variable aleatoria 𝑋: = número de lanzamientos de un dado hasta que salga el primer seis.
1
𝑓(1) = 𝑃(𝑋 = 1) =
6
5 1
𝑓(2) = 𝑃(𝑋 = 2) = ×
6 6
Estadística Descriptiva 2022 01 149
5 $ 1
𝑓(3) = 𝑃(𝑋 = 3) = k l ×
6 6
5 DO# 1
𝑓(𝑥 ) = 𝑃(𝑋 = 𝑥) = k l × 𝑥 = 1, 2, 3, …
6 6
𝑃(𝑋 > 3)
Dado el rango infinito de 𝑋, para poder calcular la probabilidad usar la siguiente propiedad:
1 5 5 )O# 25
=1−š + +k l × › = 0,5787
6 36 6 216
Estadística Descriptiva 2022 01 150
Ejercicios
121. Sea Ω el espacio muestral obtenido al lanzar una moneda dos veces y observar si sale cara (c) o
sello (s) cada vez. Indique el espacio muestral de dicho experimento y determine la función de
probabilidad de la variable <número de caras obtenidas al lanzar dos monedas>.
El espacio muestral es Ω = {(𝑠, 𝑠); (𝑠, 𝑐); (𝑐, 𝑠); (𝑐, 𝑐)}
El rango de 𝑋 es:
𝑅? = {0, 1, 2}
1
𝑓(0) = 𝑃(𝑋 = 0) =
4
2
𝑓(1) = 𝑃(𝑋 = 1) =
4
1
𝑓(2) = 𝑃(𝑋 = 2) =
4
𝒙 0 1 2
𝒇(𝒙) 0,25 0,50 0,25
122. Se lanza un dado, sea la variable aleatoria 𝑋 igual al número de la cara superior del dado. Deter-
mine y grafique la función de probabilidad de la variable 𝑋.
El rango de 𝑋 es:
𝑅? = {1, 2, 3, 4, 5, 6}
1
𝑓(1) = 𝑃(𝑋 = 1) =
6
1
𝑓(2) = 𝑃(𝑋 = 2) =
6
Y así sucesivamente.
𝒙 1 2 3 4 5 6
𝒇(𝒙) 1/6 1/6 1/6 1/6 1/6 1/6
1
𝑓(𝑥) = •6 𝑥 = 1, 2, 3, 4, 5, 6
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
123. En un lote de 30 polos hay tres defectuosos. Se toma una muestra aleatoria de cinco polos y se
define la variable aleatoria 𝑋 como el número de polos defectuosos en la muestra.
Definamos la variable.
𝑅? = {0, 1, 2, 3}
𝐶,) × 𝐶H$G
𝑓(0) = 𝑃(𝑋 = 0) = = 0,56650
𝐶H),
𝐶#) × 𝐶-$G
𝑓(1) = 𝑃(𝑋 = 1) = = 0,36946
𝐶H),
𝐶$) × 𝐶)$G
𝑓(2) = 𝑃(𝑋 = 2) = = 0,06158
𝐶H),
𝐶)) × 𝐶$$G
𝑓(3) = 𝑃(𝑋 = 3) = = 0,00246
𝐶H),
𝒙 0 1 2 3
𝒇(𝒙) 0,56650 0,36946 0,06158 0,00246
$G
𝐶D) × 𝐶HOD
𝑓(𝑥) = ž 𝐶H), 𝑥 = 0, 1, 2, 3
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
El valor esperado o esperanza matemática de una variable aleatoria 𝑋 o media de una función de pro-
babilidad de 𝑋 se denota 𝐸(𝑋).
𝜇? = 𝐸(𝑋) = • 𝑥𝑓(𝑥)
NP7QA ?
Sea 𝐺(𝑋) una función de la variable aleatoria continua 𝑋. El valor esperado de 𝐺(𝑋):
𝐸(𝑎𝑋 + 𝑏) = 𝑎𝐸(𝑋) + 𝑏 = 𝑎 𝜇? + 𝑏
𝐸(𝑏) = 𝑏
𝐸(𝑋 + 𝑏) = 𝐸(𝑋) + 𝑏 = 𝜇? + 𝑏
𝐸(𝑎𝑋) = 𝑎 𝐸(𝑋) = 𝑎 𝜇?
7 7
𝐸 ¡• 𝑎! 𝑋! ¢ = • 𝑎! 𝐸(𝑋! )
!6# !6#
𝐸 ¡• 𝑋! ¢ = 𝑛𝜇
!6#
Se denota por s? o 𝜎.
𝜎? = £𝜎?$
$
𝜎R(?) = • (𝐺(𝑋) − 𝜇R(?) )$ 𝑓(𝑥)
NP7QA ?
Estadística Descriptiva 2022 01 156
Propiedades de la varianza
𝑉(𝑏) = 0
𝑉(𝑎𝑋) = 𝑎$ 𝑉(𝑋)
𝑉(𝑋 + 𝑏) = 𝑉(𝑋)
7 7
𝑉 ¡• 𝑎! 𝑋! ¢ = • 𝑎!$ 𝑉(𝑋! )
!6# !6#
𝑉 ¡• 𝑋! ¢ = 𝑛𝜎 $
!6#
Coeficiente de variación
Una de las medidas de variabilidad que podríamos usar es el coeficiente de variación, tal como lo usa-
mos en la unidad de medidas de resumen.
𝜎? 𝜎?
𝐶𝑉 = × 100% = × 100%
𝐸(𝑋) 𝜇?
Estadística Descriptiva 2022 01 157
Ejemplo 37
Sea 𝑋 una variable aleatoria con la siguiente función de probabilidad. Calcular la varianza de 𝑋.
𝑎𝑥 1, 2, 3, 4, 5
𝑓(𝑥) = —
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Solución
Lo primero es determinar 𝑎, planteamos que
• 𝑓(𝑥) = 1
D6#
𝑎×1+𝑎×2+𝑎×3+𝑎×4+𝑎×5=1
15𝑎 = 1
1
𝑎=
15
Lo pedido es:
H
$)
𝐸(𝑋 = • 𝑥 $ 𝑓(𝑥)
D6#
1 2 3 4 5
= 1$ × + 2$ × + 3$ + 4$ + 5$ = 15
15 15 15 15 15
El esperado de 𝑋 es:
H
1 2 3 4 5
𝐸(𝑋) = • 𝑥 𝑓(𝑥) = 1 × +2× +3 +4 +5
15 15 15 15 15
D6#
55
𝐸(𝑋) =
15
$ 55 $
𝑉(𝑋) = 𝐸(𝑋 $ ) − N𝐸(𝑋)O = 15 − k l = 1,556
15
Estadística Descriptiva 2022 01 158
Ejemplo 38
Caso Metropolitano
Se define la variable aleatoria 𝑋 definida como el número de recargas de la tarjeta de los usuarios del
Metropolitano a la semana con la siguiente función de probabilidad.
𝑿 ≔ número de recargas 0 1 2 3 4
𝒇(𝒙) 0,10 4𝑘 0,30 𝑘 0,10
a. Si un usuario recargó por lo menos una vez su tarjeta en una semana, calcule la probabilidad de
que dicho usuario recargue su tarjeta por lo menos dos veces en esa semana.
b. Si el costo de una recarga es de cinco soles y el Metropolitano tiene 560 mil usuarios, determine
el monto esperado semanal por recargas.
Solución
a. Si un usuario recargó por lo menos una vez su tarjeta en una semana, calcule la probabilidad de
que dicho usuario recargue su tarjeta por lo menos dos veces en esa semana.
Solución
Para que 𝑓(𝑥) sea una función de probabilidad debe cumplir que:
• 𝑓(𝑥) = 1
,
Determinemos el valor de 𝑘 para que 𝑓(𝑥) sea función de probabilidad. Por lo tanto:
𝑘 = 0,1
𝑿: = número de recargas 0 1 2 3 4
𝒇(𝒙) 0,10 0,40 0,30 0,10 0,10
b. Si el costo de una recarga es de cinco soles y el Metropolitano tiene 560 mil usuarios, determine
el monto esperado semanal por recargas.
Solución
Como cada persona paga cinco soles y son 560 mil usuarios, luego el monto semanal por recargas
𝑀(𝑋) es:
𝑀(𝑋) = 5 × 560000 𝑋
𝐸(𝑋) = • 𝑥𝑓(𝑥)
D6,
124. La demanda diaria de un producto es una variable aleatoria 𝑋 cuya distribución de probabilidades
es simétrica y está dada por la tabla siguiente:
𝒙 1 2 3 4 5
𝒇(𝒙) 𝑎 0,20 𝑏 𝑐 0,05
La empresa obtiene por cada unidad demandada de producto 100 soles de utilidad. Si la cantidad
demanda en un día es mayor a dos unidades, se obtiene una utilidad adicional de 15 soles por
unidad demandada de producto.
125. El número de personas que no se presentan a un vuelo se modela con una variable aleatoria 𝑋 con
la siguiente función de probabilidad.
𝒙 0 1 2 3 4 5 6
𝒇(𝒙) 0,20 0,25 0,22 0,15 0,10 0,05 𝑎
Si la media es mayor a dos, se comenzará a mandar un correo electrónico a los pasajeros recor-
dándoles el viaje. Indique la acción a tomar.
Interpretación
Determinar si se comenzará a mandar un correo electrónico a los pasajeros recordándoles el viaje.
Representación
Definamos la variable aleatoria.
El rango de 𝑋 es:
𝑅? = {0, 1, 2, 3, 4, 5, 6}
Determinemos el valor de 𝑎.
La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que
asigna a todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:
Estadística Descriptiva 2022 01 161
Condición 1
𝑓(6) = 𝑎 ≥ 0
Condición 2
• 𝑓(𝑥) = 1
N+
𝑎 = 0,03
𝒙 0 1 2 3 4 5 6
𝒇(𝒙) 0,20 0,25 0,22 0,15 0,10 0,05 0,03
Cálculo
Calculemos la media de 𝑋.
𝜇 = 𝐸(𝑋) = • 𝑥 𝑓(𝑥)
N+
Análisis y argumentación
La media del número de personas que no se presentan a un vuelo es 1,97, que es menor a 2. Por
lo tanto, no se comenzará a mandar un correo electrónico a los pasajeros recordándoles el viaje.
126. En una bodega, la demanda mensual del jugo en frasco se modela con la siguiente variable alea-
toria 𝑋 con la siguiente función de probabilidad.
Cada frasco cuesta tres soles y se vende cinco soles. Si la ganancia esperada mensual por este
concepto es mayor 200 soles entonces se dará unos frascos de promoción a las bodegas. Indique
lo que se hará.
Estadística Descriptiva 2022 01 162
127. El número de ensaladas demandadas al día en un restaurante se modela con una variable aleato-
ria 𝑋 que tiene la siguiente distribución de probabilidad.
𝒙 10 15 17 18 20 25
𝒇(𝒙) 𝑎 0,12 0,35 2𝑎 0,14 0,09
El costo de cada ensalada es de seis soles y las vende a diez soles. Toda ensalada no vendida en el
día se desecha. Calcule la media y desviación estándar de la utilidad diaria, si el restaurante prepara
20 ensaladas por día. Rpta: 49,5; 27,654
128. Se lanzan dos dados y sea la variable aleatoria 𝑋 igual a la suma de los números de las caras su-
periores. Calcule la media y la varianza de la variable 𝑋. Rpta: 7; 5,83333
El rango de X es:
𝑅? = {2, 3, … ,12}
# $ )
𝑓(2) = 𝑃(𝑋 = 2) = 𝑓(3) = 𝑃(𝑋 = 3) = 𝑓(4) = 𝑃(𝑋 = 4) =
)F )F )F
- H F
𝑓(5) = 𝑃(𝑋 = 5) = )F 𝑓(6) = 𝑃(𝑋 = 6) = )F 𝑓(7) = 𝑃(𝑋 = 7) = )F
H - )
𝑓(8) = 𝑃(𝑋 = 8) = )F 𝑓(9) = 𝑃(𝑋 = 9) = )F 𝑓(10) = 𝑃(𝑋 = 10) = )F
$ #
𝑓(11) = 𝑃(𝑋 = 11) = )F 𝑓(12) = 𝑃(𝑋 = 12) = )F
𝒙 2 3 4 5 6 7 8 9 10 11 12
𝒇(𝒙) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
𝑥−1
⎧ 𝑥 = 2, 3, 4, 5, 6, 7
⎪ 36
𝑓(𝑥) = 13 − 𝑥
⎨ 𝑥 = 8, 9, 10, 11, 12
⎪ 36
⎩ 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Estadística Descriptiva 2022 01 163
La media de X es:
𝜇 = 𝐸(𝑋) = • 𝑥 𝑓(𝑥)
N+
1 2 3 1
𝜇 =2× + 3 × +4× + ⋯ + 12 × =7
36 36 36 36
𝐸(𝑋 $ ) = • 𝑥 $ 𝑓(𝑥)
N+
1 2 3 4 5 6 5 1
𝐸(𝑋 $ ) = 2$ × + 3$ × + 4$ × + 5$ × + 6$ × + 7$ × + 8$ × + ⋯ + 12$ ×
36 36 36 36 36 36 36 36
𝐸(𝑋 $ ) = 54,8333
129. Un examen consta de 100 preguntas. Cada pregunta tiene cinco opciones para marcar y solo una
respuesta correcta Por cada respuesta correcta se le otorga al postulante un punto, mientras que
si la respuesta es incorrecta al postulante se le resta un cuarto de punto. Si un postulante contesta
todas las preguntas del examen al azar, calcule el valor esperado del puntaje obtenido.
Rpta: 37,5 puntos
Estadística Descriptiva 2022 01 164
Estadística Descriptiva 2022 01 165
Un experimento binomial consiste en una serie de 𝑛 pruebas o ensayos, donde 𝑛 se fija antes de rea-
lizar el experimento.
• Las pruebas son idénticas y cada una de ellas puede resultar en uno de dos posibles resultados que
denotan éxito o fracaso.
• Las pruebas son independientes entre sí por lo que el resultado de un intento en particular no
influye en el resultado de cualquier otro.
• La probabilidad de éxito es constante de una prueba a otra y la denotamos como 𝑝.
𝑋~𝐵(𝑛, 𝑝)
Ejemplo 39
4
𝑋~𝐵 k𝑛 = 5, 𝑝 = l
7
Estadística Descriptiva 2022 01 166
Media
µ = 𝐸(𝑋) = 𝑛𝑝
Varianza
s$ = 𝑉(𝑋) = 𝑛𝑝(1 − 𝑝)
Ejemplo 40
En el proceso de control de calidad se analiza 60 envases de los productos de Expórtame. Por investi-
gaciones anteriores se sabe que la probabilidad de que un envase esté en mal estado es de 0,01.
Se rechazarán los 60 productos si la probabilidad de seleccionar más de dos envases en mal estado es
mayor al 3%, ¿qué decisión se debe tomar?
Solución
Interpretación
Determinar si se rechazará los 60 productos.
Representación
Definamos la variable necesaria para resolver el problema:
𝑛: = número de ensayos = 60
𝑝: = probabilidad de éxito = 0,01
Entonces:
Cálculo
La probabilidad pedida es:
Análisis y argumentación
La probabilidad de seleccionar más de dos envases en mal estado es 0,0224. Como la probabilidad
pedida es menor al 3% (0,0224 < 0,03), entonces los 60 productos no serán rechazados.
Ejemplo 41
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 1% de las usuarias y el 0,8% de
los usuarios hombres han sufrido de algún tipo de robo durante el uso del Metropolitano. Si el sistema
tiene 560 mil usuarios, calcule el número esperado de usuarios que han sido víctimas de robo durante
el uso del Metropolitano.
Solución
Sean los eventos:
𝑅: = Que el usuario sea víctima de robo
𝐻: = Que el usuario sea hombre
𝑀: = Que el usuario sea mujer
𝑃(𝑅⁄𝑀) = 0,01
𝑃(𝑀) = 0,45
𝑃(𝑅K ⁄𝑀) = 0,99
Sea la variable aleatoria 𝑌: = número de usuarios que han sido víctima de robo
El número esperado de usuarios que han sido víctima de robo es 4984 usuarios.
Estadística Descriptiva 2022 01 168
Ejemplo 42
Se sabe que el 12% de los usuarios del Metropolitano realizan conexiones de rutas. Si elegimos al azar
80 usuarios.
a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexiones.
b. Sea la variable Y definida como el número de usuarios que realizan conexiones de los 560mil usua-
rios. Calcule el valor esperado y varianza de Y.
Solución
a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexiones.
Solución
Sea 𝑋 ∶= cantidad de usuarios del Metropolitano que realizan conexiones de rutas en la muestra
b. Sea la variable 𝑌 definida como el número de usuarios que realizan conexiones de los 560 mil usua-
rios. Calcule el valor esperado y varianza de 𝑌.
Solución
Sea 𝑌: = número de usuarios que realizan conexiones de los 560 mil usuarios
130. Según el analista Rodrigo Parra, en el Perú, el 26 de marzo del 2022, el porcentaje de positividad
de pruebas moleculares fue de 1,0%, es decir, el 1,0% de las pruebas moleculares de detección
del COVID 19 hechas ese día dieron un resultado positivo. Asuma independencia entre las prue-
bas.
a. Si a un grupo de 100 peruanos se les realiza pruebas moleculares ese día, calcule la probabili-
dad de que tres den un resultado positivo a la prueba del COVID 19.
b. Si a un grupo de 120 peruanos se realiza pruebas moleculares ese día, calcule la probabilidad
de que haya al menos dos den positivo a la prueba del COVID 19.
c. Si en un grupo de 140 peruanos se realiza pruebas moleculares ese día, calcule la probabilidad
de que haya entre dos y cinco (incluyendo dos y cinco) den positivo a la prueba del COVID 19.
d. Si a 50000 peruanos se realizan pruebas moleculares ese día, calcule el valor esperado del
número de peruanos que den positivo a la prueba del COVID 19.
131. Una compañía de comida rápida sabe que el 90% de sus tiendas por franquicia tendrán éxito co-
mercial. Si el éxito de cada tienda se puede considerar independiente de las demás tiendas. Cal-
cule la probabilidad de que al menos dieciocho tiendas tengan éxito, si la compañía va a instalar
20 tiendas en el presente año. Rpta: 0, 6769
132. Según la Asociación para el Fomento de la Infraestructura Nacional el 48% de los hogares de Lima
no tienen acceso a agua potable de calidad, por no contar con la dosificación adecuada de cloro
o comprarla de manera informal a los camiones cisternas. Si se eligen al azar a diez hogares de
Lima, calcule la probabilidad de que cinco de ellos no tengan acceso agua potable de calidad.
Rpta: 0,2441
Estadística Descriptiva 2022 01 170
Distribución hipergeométrica
Consideremos 𝑁 elementos, de los cuales 𝑟 son considerados éxitos y, por lo tanto, 𝑁 − 𝑟 como fra-
casos. Como en el caso de la distribución binomial estamos interesados en saber la probabilidad de
obtener 𝑥 éxitos en una muestra de 𝑛 elementos.
𝐶DU 𝐶7OD
5OU
𝑓(𝑥) = 𝑥 = 𝑚á𝑥{0, 𝑛 − (𝑁 − 𝑟)}, … , 𝑚í𝑛{𝑛, 𝑟}
𝐶75
El rango de 𝑋 en la mayoría de los casos va de 0 a 𝑛, pero no siempre, por lo que se debe analizar en
cada caso.
La variable hipergeométrica cuenta el número de éxitos en una muestra de tamaño 𝑛, tomada de una
vez de una población de tamaño 𝑁 donde hay 𝑟 éxitos.
Se dice que la variable aleatoria 𝑋 sigue una distribución hipergeométrica con parámetros 𝑛, 𝑟 y 𝑁 y
se denota:
𝑋~𝐻(𝑛, 𝑟, 𝑁)
Media
𝑟
𝜇 = 𝐸(𝑋) = 𝑛
𝑁
Varianza
𝑟 𝑟 𝑁−𝑛
𝜎$ = 𝑛 «1 − ¬ k l
𝑁 𝑁 𝑁−1
Solución
Representación
Definamos la variable 𝑋: = número de envases de frasco seleccionados.
El rango de 𝑋, es decir todos los valores que puede tomar la variable, es igual 0, 1, 2,…, 20.
Entonces,
𝑋~𝐻(𝑁 = 60; 𝑟 = 25; 𝑛 = 20)
𝑅? = {0, 1, … ,20}
Cálculo
La probabilidad pedida es:
𝐶<$H × 𝐶#$
)H
𝑃(𝑋 = 8) = F, = 0,2153
𝐶$,
Solución
Lo que nos piden es calcular el coeficiente de variación de 𝑋.
𝑟 25
𝜇 = 𝐸(𝑋) = 𝑛 = 20 = 8,333
𝑁 60
𝑟 𝑟 𝑁−𝑛
𝑉(𝑋) = 𝑛 «1 − ¬ k l
𝑁 𝑁 𝑁−1
Estadística Descriptiva 2022 01 172
25 25 60 − 25
= 20 k1 − l k l = 2,8337
60 60 60 − 1
-𝑉(𝑋)
𝐶𝑉(𝑋) = × 100%
𝐸 (𝑋 )
√2,8337
= × 100% = 21,79%
8,3333
Ejemplo 44
La actriz Magaly Solier es la décima séptima mujer en denunciar una agresión sexual en un bus del
Metropolitano, desde noviembre del 2012. De las 17 denuncias, solo una está cerca de recibir senten-
cia. El agresor podría recibir de dos a cuatro años de prisión suspendida, cumplir trabajos comunitarios
o pagar reparación civil. Si se eligen al azar tres de las denuncias de las 17 existentes. Calcule la proba-
bilidad de elegir el caso que está cerca de recibir sentencia.
Solución
𝑋~𝐻(𝑁 = 17; 𝑛 = 3; 𝑟 = 1)
𝑅? = {0, 1}
133. En un vuelo se van a servir 150 comidas. La oficina de control de calidad de los alimentos durante
el vuelo selecciona al azar cinco de ellas para verificar que en perfecto estado. Dentro de las 150
comidas, hay cuatro que no están en perfecto estado. Si se encuentra al menos una comida que
no esté en perfecto estado; se cambiará de proveedor. Calcule la probabilidad de que se cambie
de proveedor.
134. Un grupo de 25 amigos van a una discoteca, pero tres de ellos no tienen la edad permitida para
ingresar. Si la persona encargada en la puerta pedirá cuatro identificaciones al azar. Si a alguno
de los menores de edad se le pide la identificación, nadie en el grupo entrará a la discoteca. Cal-
cule la probabilidad de que todos entren a la discoteca. Rpta: 0,5783
135. La empresa San Fernando ha lanzado su campaña “Plato calato no”. Si de un total de 60 personas,
donde 34 recuerdan la campaña, se eligen al azar a ocho personas para entrevistarlos, calcule la
probabilidad de elegir al menos a tres personas que recuerden la campaña.
Rpta: 0,9402
136. En una distribuidora hay 25 televisores de los cuales seis son de tecnología OLED. Si se seleccionan
al azar diez televisores, calcule la probabilidad de que se haya seleccionado por lo menos dos
televisores de tecnología OLED. Rpta: 0,8022
137. Un comerciante recibe un lote de 30 computadoras portátiles. Para protegerse de una mala re-
mesa, el comerciante revisará diez computadoras y rechazará todo el lote si encuentra una o más
computadoras defectuosas. Si en el lote hay tres computadoras defectuosas, ¿cuál es la probabi-
lidad de que rechace el lote? Rpta: 0,7192
Estadística Descriptiva 2022 01 174
Distribución de Poisson
El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina
proceso de Poisson y posee las siguientes propiedades:
𝑒 OV 𝜆D
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, …
𝑥!
Se dice que la variable aleatoria 𝑋 sigue una distribución de Poisson con parámetro l y se denota
𝑋~𝑃(l)
Media
µ = 𝐸(𝑋) = l
Varianza
s$ = 𝑉(𝑋) = l
Solución
Solución
Definamos la variable necesaria:
𝑋: = número de llamadas en un minuto
𝑋~𝑃(𝜆 = 0,5)
𝑒 O,,H 0,5,
𝑃(𝑋 = 0) = 𝑓(0) = = 0,6065
0!
Solución
Solución
Definamos una nueva variable, pues ha cambiado la unidad de tiempo.
𝑌~𝑃(𝜆 =? )
1 𝑚𝑖𝑛𝑢𝑡𝑜 0,5
3 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝜆
De donde:
l = 1,5 llamadas
𝑌~𝑃(𝜆 = 1,5)
𝑒 O#,H 1,5, 𝑒 O#,H 1,5# 𝑒 O#,H 1,5$ 𝑒 O#,H 1,5) 𝑒 O#,H 1,5-
= + + + +
0! 1! 2! 3! 4!
Solución
Definamos una nueva variable, pues ha cambiado la unidad de tiempo.
𝑊~𝑃(𝜆 =? )
1 𝑚𝑖𝑛𝑢𝑡𝑜 0,5
5 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝜆
De donde:
l = 2,5 llamadas
Estadística Descriptiva 2022 01 177
𝑊~𝑃(𝜆 = 2,5)
Ejemplo 46
El administrador de un almacén ha observado que, en promedio, ingresan al establecimiento 20 per-
sonas cada 30 minutos. ¿Cuál es la probabilidad de que en seis minutos ingresen al almacén a lo más
cinco clientes pero más de tres?
Solución
𝑋~𝑃(𝜆 =? )
30 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 20
6 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝜆
De donde:
l=4
𝑋~𝑃(𝜆 = 4)
= 𝑓(4) + 𝑓(5)
Estadística Descriptiva 2022 01 178
𝑒 O- 4- 𝑒 O- 4H
= + = 0,3517
4! 5!
Ejemplo 47
Si se sabe que en cada 100 metros de longitud de un cable hay un promedio de 80 puntos por los cuales
este puede ser seccionado. ¿Cuál es la probabilidad de que en un tramo de 13,5 metros se encuentren
cinco puntos de seccionamiento?
Solución
Como nos dicen que la variable cuenta puntos por unidad de longitud, se tiene que:
𝑋~𝑃(l)
De donde:
𝑋~𝑃(𝜆 = 10,8)
𝑒 O#,,< 10,8OH
𝑃(𝑋 = 5) = 𝑓(5) = = 0,025
5!
Observe que si lambda l sale un valor que no es entero, no se debe redondear a un entero.
Ejemplo 48
El número de unidades envasados por una persona se modela con una variable Poisson con un prome-
dio 10 unidades por cada 20 minutos.
Solución
𝑋~𝑃(𝜆 = 10)
𝑒 O#, 10O#$
𝑃(𝑋 = 12) = 𝑓(12) = = 0,095
12!
b. Si la máquina funciona durante dos horas consecutivas, calcule la probabilidad de que se hayan
envasado 50 productos.
Solución
𝑌~𝑃(𝜆 =? )
20 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 10
120 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝜆
De donde:
𝑌~𝑃(𝜆 = 60)
𝑒 OF, 60OH,
𝑃(𝑌 = 50) = 𝑓(50) = = 0,0233
50!
Ejemplo 49
El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia, queja o re-
clamo. El número de correos electrónicos que llegan a la cuenta de correo se modela como una varia-
ble aleatoria Poisson con una media de ocho correos por día. Calcule la probabilidad que en medio día
llegue más de tres correos con consultas, sugerencias, quejas o reclamos. Si esta probabilidad es mayor
a 0,8 se destinará a una persona para que conteste los correos diariamente.
Solución
Interpretación
Determinar si la probabilidad de que lleguen más de tres correos es mayor a 0,8.
Representación
Sea
𝑋: = número de correos electrónicos llegados a la cuenta de correo del Metropolitano en medio día.
8 𝑐𝑜𝑟𝑟𝑒𝑜𝑠
l = × 0,5 = 4
1 𝑑í𝑎
Luego:
𝑋~𝑃(l = 4)
Cálculo
La probabilidad pedida es:
)
𝑒 O- 4D
=1−•
𝑥!
D6,
Análisis y argumentación
La probabilidad de que lleguen más de tres correros es 0,5665 que es menor a 0,8. Como no es mayor
a 0,8 no se destinará a una persona para que conteste los correos diariamente.
Estadística Descriptiva 2022 01 181
Ejercicios
138. El número de llamadas hacia una azafata por los pasajeros durante un vuelo se modela con una
variable Poisson con una media de 0,25 llamadas cada diez minutos.
a. Calcule la probabilidad de que una azafata no reciba ninguna llamada en un viaje de 50 minu-
tos.
b. Calcule la probabilidad de que una azafata reciba más de una llamada en un viaje de 800 mi-
nutos.
c. Si una azafata ya recibió una llamada durante los primeros minutos del viaje, calcule la proba-
bilidad de que reciba dos llamadas más durante dicho viaje de 60 minutos.
139. En una pastelería, el número demandado de un cierto tipo de torta se modela con una variable
Poisson con una media de tres tortas al día. La pastelería, siempre, produce tres tortas diarias.
Cada torta cuesta producirla 50 soles y se vende a 80 soles. Toda torta no vendida en el día se
remata en 20 soles y siempre las compran todas las tortas a ese precio. Calcule el valor esperado
de la utilidad por dicho concepto. Rpta: 49,67 soles
Estadística Descriptiva 2022 01 182
Por ejemplo: peso, en kilos, de una persona, tiempo en resolver la primera pregunta del examen parcial
de un curso o volumen, en decibeles, en una discoteca a una hora determinada.
Se denomina función densidad de probabilidad 𝑓(𝑥) de una variable aleatoria continua a la función
que satisface:
Condición 1
𝑓(𝑥) ≥ 0 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑥 ∈ 𝑅
Condición 2
;X
³ 𝑓(𝑥)𝑑𝑥 = 1
OX
Se cumple que:
Y
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ³ 𝑓(𝑥)𝑑𝑥
P
!(#)
!(# ≤ % ≤ &)
% &
𝑓(𝑥) = —2(1 − 𝑥)
0≤𝑥≤1
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Solución
Se debe comprobar dos condiciones
𝑓(𝑥) = 2(1 − 𝑥) ≥ 0
;X
Segunda condición: ∫OX 𝑓(𝑥)𝑑𝑥 = 1
Existen varias formas de comprobar la segunda condición.
Primera forma
Integrando la función de densidad 𝑓(𝑥) y verificando que el área es igual a 1 y que cada 𝑓(𝑥) sea
positivo.
# # #
𝑥$
³ 𝑓(𝑥)𝑑𝑥 = ³ 2(1 − 𝑥)𝑑𝑥 = š2𝑥 − 2 ›µ = (2𝑥 − 𝑥 $ )|#,
2 ,
, ,
= (2 × 1– 1$ ) − (2 × 1– 0$ ) = 1
Segunda forma
Calculando el área del triángulo a partir de la gráfica y verificando que el área es igual a 1 y que
cada f(x) sea positivo.
𝑏×ℎ 1×2
Á𝑟𝑒𝑎 = = =1
2 2
Tercera forma
Integrando la función de densidad 𝑓(𝑥) de 0 a 1; usando algún programa informático.
³ 𝑓(𝑥)𝑑𝑥
,,<
Estadística Descriptiva 2022 01 184
b. ¿Cuál es la probabilidad que al menos el 80% de los pedidos sean procesados dentro de 24 horas?
Solución
Existen varias formas de calcular la probabilidad pedida.
𝑃(𝑋 ≥ 0,8)
Primera forma
Integrando la función de densidad 𝑓(𝑥) de 0,8 a 1.
# #
Segunda forma
Calculando el área de triángulo desde 0,8 a 1.
Tercera forma
Integrando la función de densidad 𝑓(𝑥) de 0,8 a 1; usando algún programa informático.
Solución
#
∫,,I 2(1 − 𝑥)𝑑𝑥 0,01
= # = = 0,25
∫,,< 2(1 − 𝑥 )𝑑𝑥 0,04
Estadística Descriptiva 2022 01 186
Ejercicios
140. Una variable aleatoria continua tiene la siguiente función de densidad de probabilidad:
𝑎𝑥 0<𝑥<7
𝑓(𝑥) = —
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
141. La duración (en minutos) de una llamada telefónica en la sala de profesores puede modelarse por
una variable aleatoria X con la siguiente función de densidad:
𝑎(3 − 𝑥) 0<𝑥<3
𝑓(𝑥) = —
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
La función de distribución acumulada de una variable aleatoria continua 𝑋 con función de densidad
𝑓(𝑥) se define por:
Se tiene que:
𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝐹(𝑏) − 𝐹(𝑎)
Propiedades
• Se cumple que:
𝑑𝐹(𝑥)
= 𝑓(𝑥)
𝑑𝑥
• 𝐹(𝑥) es una función que siempre está entre 0 y 1 (0 ≤ 𝐹(𝑥) ≤ 1); pues es igual a una probabili-
dad.
lim 𝐹(𝑥) = 0
D→OX
lim 𝐹(𝑥) = 1
D→;X
1.0
𝐹(𝑥)
0.8
0.6
0.4
0.2
0.0
-2 -1 0 1 2 3 4 5
Estadística Descriptiva 2022 01 188
Ejemplo 51
Las ventas diarias (en miles de dólares) de una bodega es una variable aleatoria continua 𝑋 que tiene
la función densidad:
2(𝑥 + 2)
𝑓(𝑥) = • 0≤𝑥≤1
5
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Solución
D D
2(𝑡 + 2) 2 𝑡$
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ³ 𝑑𝑡 = š + 2𝑡›µ
, 5 5 2 ,
2 𝑥$ 2 0$ 2 𝑥$ 1
𝐹(𝑥) = š + 2𝑥› − š + 2 × 0› = š + 2𝑥› = 𝑥(𝑥 + 4)
5 2 5 2 5 2 5
1 𝑥≥1
1
𝐹(𝑥) = » 𝑥(𝑥 + 4) 0 < 𝑥 < 1
5
0 𝑥≤0
D
2(𝑡 + 2) 1
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ³ 𝑑𝑡 = 𝑥(𝑥 + 4)
, 5 5
Puede usar páginas como https://www.wolframalpha.com/ y pedir que calcule la integral corres-
pondiente.
Estadística Descriptiva 2022 01 189
b. ¿Cuál sería la venta mínima del 25% de los mayores montos diarios de venta?
Solución
Calcularemos el percentil 75; 𝑃GH = 𝑚
𝑃(𝑋 ≤ 𝑚) = 0,75
1.0
0.9
0.8
0.7
0.6 0,75
𝐹(𝑥)
0.5
0.4
0.3
0.2
0.1 0,78
0.0
-0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2
1
𝐹(𝑚) = 𝑚(𝑚 + 4) = 0,75
5
Resolviendo la ecuación se tienen que 𝑚 = 0,78; por lo que el percentil 75 es 780 dólares.
Estadística Descriptiva 2022 01 190
Ejemplo 52
Encuentre el rango intercuartil de 𝑋, si 𝑋 es el tiempo de vida de un sistema es una variable aleatoria,
en años, cuya función de distribución acumulada es:
0 𝑥≤5
𝐹(𝑥) = • 25
1 − $ 𝑥$ > 5
𝑥
Solución
a. Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la
probabilidad que pertenezca al quinto superior?
Solución
Para calcular el rango intercuartil, debemos hallar el cuartil 1 y el cuartil 3, para esto hay dos posi-
bilidades: integrar la función de densidad 𝑓(𝑥) o reemplazar en la función de distribución acumu-
lada.
Por definición de cuartil 3, el 75% de los datos es menor o igual a él, es decir:
𝑃(𝑋 ≤ 𝑄) ) = 0,75
o lo que es lo mismo:
𝐹(𝑄) ) = 0,75
25
1− = 0,75
𝑄)$
de donde:
𝑄) = 10
𝑃(𝑋 ≤ 𝑄# ) = 0,25
𝐹(𝑄# ) = 0,25
Estadística Descriptiva 2022 01 191
25
1− = 0,25
𝑄#$
de donde:
𝑄) = 5,7735
Luego:
𝑅𝐼𝐶 = 𝑄) − 𝑄# = 4,23
Solución
Como nos dicen que “ya se sabe que está en el cuarto superior”, es una probabilidad condicional.
Para estar en el quinto superior tiene que tener un tiempo de vida mayor al percentil 80, además
como se sabe que esta en el cuarto superior tiene un tiempo de vida mayor al percentil 75.
Por la definición de percentil el 𝑃(𝑋 > 𝑃<, ) = 0,20 y el 𝑃(𝑋 > 𝑃GH ) = 0,25.
1 𝑥>2
𝐹(𝑥) = •𝑥 − 1 1 ≤ 𝑥 ≤ 2
0 𝑥<1
143. Sea 𝑋 una variable aleatoria que modela la cantidad de tiempo en minutos que una persona tarda
en responder una pregunta de un examen y que tiene la siguiente función de densidad:
144. Para una estación gasolinera las ventas semanales, medidas en miles de galones, se modela con
una variable aleatoria 𝑋 que tiene la función de densidad que se muestra a continuación:
𝑥−1 1<𝑥≤2
𝑓(𝑥) = •3 − 𝑥 2<𝑥<3
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Calcule la probabilidad de que en una semana cualquiera venda al menos 1500 galones de
gasolina. Rpta. 0,875
b. Determine la función de distribución de probabilidad acumulada.
c. Calcule la venta semanal esperada. Rpta. 2,000
145. La proporción de personas que responden a una encuesta enviada por correo electrónico se mo-
dela con una variable aleatoria 𝑋 con la siguiente función de densidad:
El valor esperado o esperanza matemática de una variable aleatoria 𝑋 o media de una distribución de
probabilidad de 𝑋 se denota 𝐸(𝑋).
;X
𝜇? = 𝐸(𝑋) = ³ 𝑥 𝑓(𝑥) 𝑑𝑥
OX
;∞
𝜇R(?) = 𝐸(𝐺(𝑋)) = ³ 𝐺(𝑥)𝑓(𝑥) 𝑑𝑥
O∞
𝐸(𝑎𝑋 + 𝑏) = 𝑎𝐸(𝑋) + 𝑏 = 𝑎 𝜇? + 𝑏
𝐸(𝑏) = 𝑏
𝐸(𝑋 + 𝑏) = 𝐸(𝑋) + 𝑏 = 𝜇? + 𝑏
𝐸(𝑎𝑋) = 𝑎 𝐸(𝑋) = 𝑎 𝜇?
7 7
𝐸 ¡• 𝑎! 𝑋! ¢ = • 𝑎! 𝐸(𝑋! )
!6# !6#
𝐸 ¡• 𝑋! ¢ = 𝑛𝜇
!6#
;X
𝜎?$ = 𝑉(𝑋) = ³ (𝑥 − 𝜇)$ 𝑓(𝑥) 𝑑𝑥
OX
𝜎? = -𝑉(𝑋)
;X
$
𝜎R(?) =³ (𝐺(𝑋) − 𝜇R(?) )$ 𝑓(𝑥) 𝑑𝑥
OX
Propiedades de la varianza
𝑉(𝑏) = 0
𝑉(𝑎𝑋) = 𝑎$ 𝑉(𝑋)
Estadística Descriptiva 2022 01 195
𝑉(𝑋 + 𝑏) = 𝑉(𝑋)
7 7
𝑉 ¡• 𝑎! 𝑋! ¢ = • 𝑎!$ 𝑉(𝑋! )
!6# !6#
𝑉 ¡• 𝑋! ¢ = 𝑛𝜎 $
!6#
Coeficiente de variación
Una de las medidas de variabilidad que podríamos usar es el coeficiente de variación, tal como lo usa-
mos en la unidad de medidas de resumen.
𝜎?
𝐶𝑉 = × 100%
𝐸(𝑋)
Ejemplo 53
Caso Metropolitano
La distancia, en metros, que recorre un usuario caminando para llegar a una estación del Metropoli-
tano se modela con la variable aleatoria X con la siguiente función de densidad.
𝑥
0 < 𝑥 < 500
𝑓(𝑥) = » 250000
𝑥
𝑎− 500 ≤ 𝑥 < 1000
250000
Solución
Estadística Descriptiva 2022 01 196
Primero hallemos 𝑎.
H,, #,,,
𝑥 𝑥
³ 𝑑𝑥 + ³ 𝑎 − 𝑑𝑥 = 1
250000 250000
, H,,
De donde:
1
𝑎 =
250
H,, #,,,
𝑥 1 𝑥
𝐸(𝑋) = ³ 𝑥 𝑑𝑥 + ³ 𝑥 − 𝑑𝑥 = 500
250000 250 250000
, H,,
H,, #,,,
𝑥 $
1 𝑥
𝑉(𝑋) = ³ 𝑥 𝑑𝑥 + ³ 𝑥 $ − 𝑑𝑥 − 500$ = 41 666,7
250000 250 250000
, H,,
b. Calcule la probabilidad de que un usuario camine entre 300 y 700 metros para llegar a una esta-
ción.
Solución
G,,
Como la función de densidad está definida de forma diferente en los tramos [300;500[ y [500;700],
entonces la integral es:
H,, G,,
𝑥 1 𝑥
𝑃(300 < 𝑋 < 700) = ³ 𝑑𝑥 + ³ − 𝑑𝑥 = 0,64
250000 250 250000
),, H,,
Estadística Descriptiva 2022 01 197
Ejercicios
146. El sobrepeso, en kilos, del equipaje de mano de un pasajero se modela con una variable aleatoria
𝑋 con la siguiente función de densidad de probabilidad:
𝑓(𝑥) = —𝑘(8 − 𝑥)
4≤𝑥≤6
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Solución
Interpretación
Representación
Cálculo
Análisis y argumentación
147. El tiempo, en minutos, que se tarda una persona en ser atendido en el counter del aeropuerto se
modela con una variable aleatoria 𝑋:
148. El gerente comercial de la sucursal de Surco informa que el gasto mensual, en cientos de soles,
por la venta de libros a sus clientes es una variable aleatoria que tiene la siguiente función de
densidad:
1
𝑓(𝑥) = •8 𝑥 + 𝑎 2≤𝑥≤6
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Calcule el valor esperado del gasto mensual en libros. Rpta: 467 soles
Estadística Descriptiva 2022 01 198
Función de densidad
1
𝑓(𝑥) = •𝑏 − 𝑎 𝑎≤𝑥≤𝑏
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝑋~𝑈(𝑎, 𝑏)
Media
(𝑎 + 𝑏)
𝜇=
2
Varianza
(𝑏 − 𝑎)$
𝜎$ =
12
0 𝑥<𝑎
𝑥−𝑎
𝐹(𝑥) = ž 𝑎≤𝑥≤𝑏
𝑏−𝑎
1 𝑥>𝑏
Estadística Descriptiva 2022 01 199
Ejemplo 54
En ciertos experimentos, el error cometido al determinar la densidad de una sustancia es una variable
aleatoria cuya distribución es uniforme con 𝑎 = -0,025 y 𝑏 = 0,025.
Solución
Solución
1
𝑓(𝑥) = •0,025 − (−0,025) −0,025 ≤ 𝑥 ≤ 0,025
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
1
𝑓(𝑥) = •0,05 −0,025 ≤ 𝑥 ≤ 0,025
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝑃(0,010 ≤ 𝑋 ≤ 0,015)
Integrando la función de densidad 𝑓(𝑥) o calculándola a partir del área del rectángulo.
,,,#H
1
𝑃(0,010 ≤ 𝑋 ≤ 0,015) = ³ 𝑑𝑥 = 0,10
0,050
,,,#,
Estadística Descriptiva 2022 01 200
b. ¿Cuál es el error esperado cometido?
Solución
La variable
(𝑎 + 𝑏) (−0,025 + 0,025)
𝜇= = =0
2 2
Ejemplo 55
De una muestra de 10 empleados, calcule la probabilidad de que cuatro de ellos hayan llegado entre
las 8:15 y 8:20 AM.
Solución
Sea X:= tiempo, en minutos, desde las 8 AM hasta la hora de llegada de los empleados al centro de
trabajo, luego:
𝑋~𝑈(0, 25)
La función de densidad es :
1
𝑓(𝑥) = •25 0 ≤ 𝑥 ≤ 25
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Se define la variable:
𝑌: = número de empleados que llegan al centro de trabajo entre 8:15 y 8:20 AM.
𝑌~𝐵(𝑛 = 10; 𝑝 =? )
Debe calcularse la probabilidad de éxito p de que un empleado llegue al centro de trabajo entre 8:15
y 8:20 AM esto es:
$H
1
𝑝 = 𝑃(15 < 𝑋 < 25) = ³ 𝑑𝑥 = 0,20
25
#H
Estadística Descriptiva 2022 01 201
Entonces:
149. El tiempo en el que un avión llega a su destino con respecto a su hora programada se modela con
una variable aleatoria uniforme de parámetros -10 y 20. De tal manera que los valores negativos
indican que el avión llegó antes de la hora programada y los valores positivos indican que el avión
llegó después de la hora programada. Si la probabilidad de que un avión llegue con un retraso
mayor a 10 minutos es mayor al 20%, se revisarán los protocolos de salida de un avión. Indique lo
que se hará.
Solución
Interpretación
Representación
Cálculo
Análisis y argumentación
150. El tiempo en el que un avión llega a su destino con respecto a su hora programada se modela con
una variable aleatoria uniforme de parámetros -10 y 20. De tal manera que los valores negativos
indican que el avión llegó antes de la hora programada y los valores positivos indican que el avión
llegó después de la hora programada. Si la probabilidad de que un avión llegue con un retraso
mayor a 10 minutos es mayor al 20%, se revisarán los protocolos de salida de un avión. Indique lo
que se hará.
a. Calcule la probabilidad de que la diferencia entre la hora de llegada programada y la hora de
llegada sea mayor a seis minutos.
b. Si se escoge al azar 20 vuelos, calcule la probabilidad de que, como máximo, se tenga un vuelo
con retraso mayor a ocho minutos.
151. La variable X se distribuye uniformemente con media igual a 24 y varianza igual a 12, calcular los
parámetros de la función de densidad. Rpta: a = 18, b = 30
152. La función de Excel =ALEATORIO() genera un número con distribución uniforme con parámetros
a igual a cero y b igual a uno. Sea 𝑋 una variable aleatoria definida como el número generado por
dicha función.
a. Calcule la probabilidad de que la función genere un número aleatorio entre 0,2 y 0,7.
Rpta: 0,50
b. Use la función de distribución acumulada 𝐹(𝑥) para calcular 𝑃(0,15 < 𝑋 < 0,55).
Rpta: 0,40
153. El tiempo, en minutos, que demora un servicio de delivery en entregar una pizza puede modelarse
por una variable aleatoria uniforme con parámetros 10 y 38. Si la pizza se tarda más de 30 minutos
en ser entregada, el cliente no la pagará.
a. Si una familia pide una pizza, calcule la probabilidad de que le salga gratis.
Rpta: 0,2857
Estadística Descriptiva 2022 01 203
b. Si la familia pide una pizza diaria durante diez días seguidos, calcule la probabilidad de que por
lo menos una de ellas le salga gratis. Rpta: 0,9654
c. Una familia pidió una pizza hace 25 minutos y aún no ha llegado, ¿cuál es la probabilidad de
que le salga gratis? Rpta: 0,6154
154. Se ha observado que un servicio muy solicitado es llevar clientes de Jesús María a San Isidro. Se
define la variable uniforme 𝑋: = diferencia entre el tiempo programado y el tiempo real de lle-
gada del taxi, en minutos. Los parámetros de 𝑋 son -5 a 15, donde el signo negativo indica que el
vehículo llegó antes del tiempo estimado y el valor positivo indica que demoró más del tiempo
estimado.
𝑘 −5 ≤ 𝑥 ≤ 15
𝑓(𝑥) = —
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Calcule la probabilidad que uno de estos servicios haya tenido un retraso mayor a cinco minu-
tos. Rpta: 0,50
b. Calcule el tiempo mínimo para pertenecer al 20% de los clientes que más demoran en llegar a
su destino. Si este tiempo es mayor a los 10 minutos se realizará un análisis de los tiempos
reales para cumplir con este servicio. ¿Qué decisión se tomará? Rpta: 11 minutos
c. Se elige aleatoriamente a diez de estos servicios, calcule la probabilidad de que cuatro lleguen
antes del tiempo programado. Rpta: 0,14600
Estadística Descriptiva 2022 01 204
Distribución exponencial
En variables que representan los tiempos de vida útil, tiempos de sobrevivencia, en tiempos de ocu-
rrencia en procesos de Poisson se suele utilizar la distribución exponencial.
La variable aleatoria 𝑋 tiene una distribución exponencial con parámetro 𝛽 (𝛽 > 0) si su función de
densidad de probabilidad es:
1 O]D
𝑓(𝑥) = •𝛽 𝑒
𝑥≥0
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Se denota:
𝑋 ~ 𝐸𝑥𝑝(𝛽)
Se lee que la variable aleatoria 𝑋 sigue una distribución exponencial con parámetro 𝛽.
0 𝑥<0
𝐹(𝑥) = —
1 − 𝑒 OD/] 𝑥≥0
𝛽>0
Características
La variable puede tomar valores de 0 a +¥, no toma valores negativos.
La gráfica es descendente con sesgo a la derecha.
Existe una curva para cada valor de 𝛽.
Media
𝜇D = 𝐸(𝑋) = 𝛽
Varianza
𝜎?$ = 𝛽$
_
O ,
1−𝑒 ] =𝑘
_
O -.
1−𝑒 ] = 0,9
=INV.GAMMA(k/100;1;beta)
Ejemplo 56
El ingeniero de planta de una línea aérea sabe que la duración promedio de los neumáticos de las
avionetas es de 1,5 años. Si la duración de los neumáticos tiene una distribución exponencial.
Solución
𝑋~𝐸𝑥𝑝(𝛽 = 1,5)
#,F
O
𝑃(𝑋 ≤ 1,6) = 𝐹(1,6) = 1 − 𝑒 #,H = 0,6558
Solución
$
O
= 1 − 𝐹(2) = 1 − k1 − 𝑒 #,H l = 0,2636
Estadística Descriptiva 2022 01 206
c. La gerencia de la línea aérea está evaluando la posibilidad de cambiar de proveedor si el tiempo
mínimo del 25% de los neumáticos que tienen una mayor duración es menor a 1,8 años.
Solución
Interpretación
Determinar si se va a cambiar de proveedor.
Representación
Se debe calcular el percentil 75 de la variable <duración de neumáticos de las avionetas>.
Cálculo
El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración lo representamos
por 𝑡B!7 .
`
O /01
= 1 − 𝐹(𝑡B!7 ) = 1 − k1 − 𝑒 #,H l
`
O /01
=𝑒 #,H = 0,25
2
O /01
Tomamos logaritmo neperiano a ambos lados de la ecuación 𝑒 3,5 = 0,25
`
O /01
𝑙𝑛 k𝑒 #,H l = ln (0,25)
𝑡B!7
− = −1,3863
1,5
Análisis y argumentación
El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración es mayor a 1,8 años
(2,08 > 1,8). Por tanto, no se va a cambiar de proveedor.
Estadística Descriptiva 2022 01 207
Ejercicios
155. El tiempo, en días, que transcurre desde la adquisición de un vehículo nuevo hasta que se presenta
la primera falla mecánica se modela con una variable aleatoria exponencial con media de 500 días.
156. La vida útil, en meses, de un artefacto eléctrico es una variable aleatoria con distribución expo-
nencial con parámetro 𝛽. El fabricante afirma que el 90% de estos componentes tienen una vida
útil que supera los 60 meses. ¿Cuál es la media de la vida útil de estos componentes?
Rpta: 569,47 meses
Estadística Descriptiva 2022 01 208
Distribución normal
Función de densidad
Se dice que la variable aleatoria 𝑋 sigue una distribución normal con parámetros µ y s.
Se denota con:
𝑋~𝑁(µ, s$ )
La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de tendencia
central coinciden.
Estandarización
Se toma como referencia una distribución normal estándar (µ = 0 y s2 = 1). Se usa el cambio de variable:
𝑋−𝜇
𝑍=
𝜎
Se denota con:
𝑍~𝑁(µ = 0, s$ = 1)
Estadística Descriptiva 2022 01 209
Para calcular una probabilidad de una variable normal existen varias posibilidades, entre ellas puede
usar:
• Estandarizar la variable para usar la tabla de la normal estándar.
• Usar un programa informático, como, por ejemplo, Excel.
Para calcular una probabilidad usando la tabla normal estándar debemos estandarizar la variable y
obtenemos un valor de 𝑍.
𝑃(𝑋 ≤ 𝑎)
𝑋−𝜇 𝑎−𝜇
= 𝑃k ≤ l
𝜎 𝜎
𝑎−𝜇
= 𝑃 «𝑍 ≤ ¬
𝜎
POa
El valor de b
se redondea a dos decimales, usando redondeo simple.
• En la primera columna de este valor buscamos el valor de las unidades y las décimas.
• En la fila correspondiente al valor de la columna buscamos el valor de las centésimas.
• Su intersección nos dará la probabilidad.
La tabla normal estándar siempre nos dará el valor del área hacia la izquierda de Z.
𝑎−𝜇
𝑃 𝑍≤
𝜎
𝑎−𝜇
-4 -3 -2 -1 00 1 2 3 4
𝜎
Estadística Descriptiva 2022 01 210
Cálculo de una probabilidad de una variable normal usando Excel
𝑋~𝑁(𝜇 = 30; 𝜎 $ = 5$ )
Calcule:
𝑃(𝑋 ≤ 37,8)
Solución
𝑋 − 𝜇 37,8 − 𝜇
𝑃(𝑋 ≤ 37,8) = 𝑃 k ≤ l
𝜎 𝜎
37,8 − 30
= 𝑃 k𝑍 ≤ l
5
= 𝑃(𝑍 ≤ 1,56)
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
Tenemos que:
𝑃(𝑍 ≤ 1,56) = 0,94062
Estadística Descriptiva 2022 01 211
0,94062
-4 -3 -2 -1 0 11,562 3 4
𝑃(𝑋 ≤ 𝑃% ) = 0, 𝑘
𝑋 − 𝜇 𝑃% − 𝜇
𝑃k ≤ l = 0, 𝑘
𝜎 𝜎
𝑃% − 𝜇
𝑃 k𝑍 ≤ l = 0, 𝑘
𝜎
Luego, se busca dentro de la tabla el valor más cercano a 0, 𝑘. A partir de ese número dentro de la
tabla, salimos a la primera columna y primera fila y sumamos los números encontrados y obtendere-
mos el valor c.
Estadística Descriptiva 2022 01 212
0, 𝑘
𝑃! − 𝜇
-4 -3 -2 -1 00 1 2 = 𝑐3 4
𝜎
El valor del percentil se obtiene de la ecuación:
𝑃% = 𝜇 + 𝑐 𝜎
• probabilidad: es un número entre 0 y 1. Por ejemplo, para calcular el percentil 70; use 0,7.
• media: es la media aritmética de la distribución.
• desv_estándar: es la desviación estándar de la distribución, un número positivo.
Estadística Descriptiva 2022 01 213
Tabla de la distribución normal estándar
Área bajo la curva normal: [P(Z £ z ) = a ]
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Estadística Descriptiva 2022 01 214
Tabla de la distribución normal estándar
Área bajo la curva normal: [P(Z £ z ) = a ]
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Estadística Descriptiva 2022 01 215
Ejercicios
-4 -3 -2 -1 0 10,24 2 3 4
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
-4 -3 -3,56
-2 -1 0 1 2 3 4
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
Estadística Descriptiva 2022 01 216
-4 -3 -2 -1 0 0,30 1 0,59 2 3 4
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
-4 -3 -2 -1 0 1 c 2 3 4
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
Estadística Descriptiva 2022 01 217
Ejemplo 57
El gasto mensual de un usuario en el Metropolitano se modela con una variable normal con media de
100 soles y una desviación estándar de cinco soles. Se elige un usuario al azar.
Solución
Solución
Defianmos la variable aleatoria
𝑋: = gasto mensual de un usuario en el Metropolitano
𝑋~𝑁(𝜇 = 100; 𝜎 $ = 5$ )
Como usamos la tabla normal estándar debemos usar el complemento, pues la tabla nos da el área
izquierda.
105 − 100
= 1 − 𝑃 k𝑍 ≤ l = 1 − 𝑃(𝑍 ≤ 1)
5
= 1 − 0,84134 = 0,15866
Solución
La probabilidad pedida es:
𝑃(90 ≤ 𝑋 ≤ 110)
90 − 𝜇 𝑋 − 𝜇 110 − 𝜇
= 𝑃k ≤ ≤ l
𝜎 𝜎 𝜎
= 𝑃(−2 ≤ 𝑍 ≤ 2)
c. Determine el gasto mensual mínimo para que esté en 10% de los que más gastan.
Solución
Como nos piden determinar el gasto mensual mínimo para que esté en 10% de los que más gastan
Nos piden calcular el percentil 90.
𝑃(𝑋 ≤ 𝑎) = 0,90
Estandarizando:
Estadística Descriptiva 2022 01 219
𝑎 − 100
𝑃 k𝑍 ≤ l = 0,90
5
Buscamos el valor más cercano a 0,90; en este caso; 0,89973. Salimos a los bordes y obtenemos el
valor de 1,28.
Luego:
𝑎 − 100
= 1,28
5
𝑎 = 1,28 × 5 + 100
𝑎 = 106,4
Ejemplo 58
En Buck Café, la máquina surtidora de refrescos está ajustada de tal forma que sirve en promedio 250
mililitros por vaso. Si la cantidad de refresco servido en los vasos sigue, aproximadamente, una distri-
bución normal con una desviación estándar de 10 mililitros. ¿Qué proporción de los vasos servidos
contendrán entre 240 y 255 mililitros de refresco?
Solución
Sea 𝑋: = cantidad de refresco servido por vaso
𝑃(240 ≤ 𝑋 ≤ 255)
Estandarizando se tiene:
240 − 𝜇 𝑋 − 𝜇 255 − 𝜇
= 𝑃k ≤ ≤ l
𝜎 𝜎 𝜎
Estadística Descriptiva 2022 01 220
240 − 250 255 − 250
= 𝑃k ≤𝑍≤ l
10 10
𝑃(−1 ≤ 𝑍 ≤ 0,5)
Ejemplo 59
Se informa que la cantidad de azúcar de los paquetes marcados con un kilo, tiene distribución normal
con media µ kilogramos y desviación estándar 0,02 kilogramos. Deteminar el valor de µ si la cantidad
de azúcar que contiene cada paquete es menor o igual a 0,95 kilos con probabilidad 0,102.
Solución
𝑋~𝑁(𝜇 =? , s$ = 0,02$ )
𝑋 − 𝜇 0,95 − 𝜇
𝑃k ≤ l = 0,102
𝜎 𝜎
0,95 − 𝜇
𝑃 k𝑍 ≤ l = 0,102
𝜎
Estadística Descriptiva 2022 01 221
0,95 − 𝜇
= −1,27
0,02
Dentro de la tabla de la normal estándar, buscamos el valor más cercano a 0,102; en este caso,
0,10204. Saliendo a los bordes, obtenemos el valor de -1,27.
De donde:
𝜇 = 0,9754
0,95 − 𝜇
𝑃 k𝑍 ≤ l = 0,102
0,02
Luego
0,95 − 𝜇
= −1,27
0,02
De donde:
𝜇 = 0,9754
Estadística Descriptiva 2022 01 222
Ejercicios
158. La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una variable
aleatoria que tiene una distribución normal con una media igual a 400 soles y una desviación
estándar igual a 80 soles.
159. El tiempo de incapacidad debido a un accidente laboral leve que tiene un trabajador de una em-
presa durante un mes se modela con una variable normal con una media de 90 horas y una des-
viación estándar de 18 horas. Si una persona ya tuvo 80 horas de incapacidad, calcule la probabi-
lidad de que tenga por lo menos 20 horas más. Rpta. 0,4070
160. Una compañía ha comprado una prueba para seleccionar personal. Los que han diseñado la
prueba saben que las notas siguen una distribución normal con una media de 75 puntos y una
desviación estándar de diez puntos. Calcule la probabilidad de que una persona que rinda esta
prueba obtenga una nota superior a 90 puntos. Rpta: 0,06681
161. En una ciudad se estima que la temperatura máxima en un día del mes de enero puede modelarse
con una variable normal con media 30°C y desviación estándar 2°C.
a. Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la temperatura
máxima sea menor a 31°C. Rpta: 0,69146
b. Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la temperatura
máxima esté entre 28,5 y 32°C. Rpta: 0,61472
c. Calcule el número esperado de días en el mes de enero en que la temperatura máxima es
mayor a 33°C. Asuma independencia entre las temperaturas de un día y otro.
Rpta: 2,07
Muestreo
Elemento
Es el objeto sobre el cual se hace la medición. También llamada unidad elemental.
Población muestreada
Es la colección de todos los elementos posibles que podrían extraerse en una muestra.
Marco muestral
Es una lista de los elementos que están disponibles para su elección en la etapa de muestreo.
Censo
Es el estudio completo de todos los elementos de la población.
Parámetro
Es un resumen de una característica de una población.
Estadístico
Es un resumen de una característica de una muestra.
Muestreo probabilístico
En el muestreo probabilístico, la selección de cada elemento de la muestra se hace siguiendo reglas
matemáticas de decisión. Todos los elementos de la población tienen una probabilidad real y conocida
de ser seleccionados. Existen diversos métodos de muestreo probabilístico como, por ejemplo:
Muestreo sistemático
Se selecciona un primer elemento aleatoriamente y, luego, los demás elementos que conformarán la
muestra cada cierto intervalo. Este muestreo supone que se cuenta con una enumeración completa
de los elementos de la población.
Muestreo estratificado
Se selecciona la muestra de los diversos estratos. Un estrato es una parte de la población, cuyos ele-
mentos tienen características similares. El objetivo de estratificar la población es buscar homogenei-
dad entre los estratos.
Estadística Descriptiva 2022 01 225
En este procedimiento, se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de
muestreo de una población que contiene un total de N unidades.
Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.
Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente,
información acerca del ingreso mensual (en soles) y años cumplidos en la empresa de cada uno de sus
trabajadores.
Estadística Descriptiva 2022 01 226
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las columnas C4,
C8, C11 y C15 de la tabla de números aleatorios.
Trabajadores registrados
Ingreso Ingreso Ingreso Años en la
Nº Años en la empresa Nº Años en la empresa Nº
(en soles) (en soles) (en soles) empresa
1 2300 5 51 2100 13 101 2400 16
2 2800 11 52 2100 9 102 1700 0
3 2400 4 53 1800 1 103 2500 12
4 2500 2 54 2000 9 104 1700 3
5 2300 3 55 2100 10 105 2400 17
6 2100 2 56 1900 4 106 2400 16
7 1700 2 57 2000 10 107 1900 7
8 2000 0 58 2300 11 108 1700 1
9 2200 7 59 2000 7 109 2100 6
10 2100 4 60 1700 1 110 2000 5
11 1700 0 61 1900 6 111 2000 3
12 2500 2 62 2000 9 112 2500 13
13 2800 13 63 2400 17 113 1700 0
14 2400 9 64 1700 0 114 2500 19
15 1700 1 65 1700 2 115 1700 3
16 2400 9 66 2400 17 116 2600 19
17 2200 10 67 2500 13 117 1600 1
18 2200 4 68 2600 16 118 1800 6
19 2300 10 69 2100 14 119 2100 10
20 2800 11 70 1900 7 120 1700 0
21 2100 7 71 2000 9 121 2400 16
22 1700 1 72 1800 7 122 2600 17
23 2500 6 73 2100 10 123 2100 10
24 2400 9 74 2300 12 124 2100 8
25 2700 17 75 2700 20 125 2400 17
26 1700 0 76 2800 20 126 1700 1
27 1600 2 77 1800 3 127 2600 20
28 2600 17 78 1700 5 128 2400 16
29 2500 13 79 1700 4 129 2700 17
30 2500 16 80 1700 0 130 2100 12
31 2700 17 81 1700 1 131 1600 0
32 1700 1 82 2100 6 132 2100 15
33 1600 1 83 2600 17 133 1900 5
34 2400 11 84 2400 9 134 2100 12
35 1900 3 85 2600 19 135 2200 12
36 1800 5 86 1900 7 136 2400 13
37 1800 3 87 1600 0 137 1800 4
38 2400 14 88 1900 3 138 2600 17
39 2600 16 89 2100 14 139 2700 20
40 2700 18 90 1700 0 140 2500 16
41 2100 11 91 2100 15 141 2500 16
42 2300 14 92 1700 1 142 1900 6
43 1700 0 93 2300 14 143 2100 15
44 2200 13 94 2500 16 144 1700 9
45 2900 20 95 2600 18 145 1500 0
46 1800 5 96 1900 3 146 1800 18
47 2100 16 97 2500 19 147 2100 10
48 2000 12 98 1800 6 148 2700 19
49 2000 12 99 1700 2 149 1800 9
50 2900 20 100 2000 10 150 2100 15
Estadística Descriptiva 2022 01 227
Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios. Como el marco muestral tiene 150 elementos usemos las
columnas C4, C5 y C6, para elegir números de tres cifras y luego C8, C9 y C10.
Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149
Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente,
información acerca del ingreso mensual (en soles) y años cumplidos en la empresa de cada uno de sus
trabajadores.
Use las columnas C4, C8, C11 y C15 de la tabla de números aleatorios.
Trabajadores registrados
Ingreso Ingreso Ingreso Años en la
Nº Años en la empresa Nº Años en la empresa Nº
(en soles) (en soles) (en soles) empresa
1 2300 5 51 2100 13 101 2400 16
2 2800 11 52 2100 9 102 1700 0
3 2400 4 53 1800 1 103 2500 12
4 2500 2 54 2000 9 104 1700 3
5 2300 3 55 2100 10 105 2400 17
6 2100 2 56 1900 4 106 2400 16
7 1700 2 57 2000 10 107 1900 7
8 2000 0 58 2300 11 108 1700 1
9 2200 7 59 2000 7 109 2100 6
10 2100 4 60 1700 1 110 2000 5
11 1700 0 61 1900 6 111 2000 3
12 2500 2 62 2000 9 112 2500 13
13 2800 13 63 2400 17 113 1700 0
14 2400 9 64 1700 0 114 2500 19
15 1700 1 65 1700 2 115 1700 3
16 2400 9 66 2400 17 116 2600 19
17 2200 10 67 2500 13 117 1600 1
18 2200 4 68 2600 16 118 1800 6
19 2300 10 69 2100 14 119 2100 10
20 2800 11 70 1900 7 120 1700 0
21 2100 7 71 2000 9 121 2400 16
22 1700 1 72 1800 7 122 2600 17
23 2500 6 73 2100 10 123 2100 10
24 2400 9 74 2300 12 124 2100 8
25 2700 17 75 2700 20 125 2400 17
26 1700 0 76 2800 20 126 1700 1
27 1600 2 77 1800 3 127 2600 20
28 2600 17 78 1700 5 128 2400 16
29 2500 13 79 1700 4 129 2700 17
30 2500 16 80 1700 0 130 2100 12
31 2700 17 81 1700 1 131 1600 0
32 1700 1 82 2100 6 132 2100 15
33 1600 1 83 2600 17 133 1900 5
34 2400 11 84 2400 9 134 2100 12
35 1900 3 85 2600 19 135 2200 12
36 1800 5 86 1900 7 136 2400 13
Estadística Descriptiva 2022 01 229
Ingreso Ingreso Ingreso Años en la
Nº Años en la empresa Nº Años en la empresa Nº
(en soles) (en soles) (en soles) empresa
37 1800 3 87 1600 0 137 1800 4
38 2400 14 88 1900 3 138 2600 17
39 2600 16 89 2100 14 139 2700 20
40 2700 18 90 1700 0 140 2500 16
41 2100 11 91 2100 15 141 2500 16
42 2300 14 92 1700 1 142 1900 6
43 1700 0 93 2300 14 143 2100 15
44 2200 13 94 2500 16 144 1700 9
45 2900 20 95 2600 18 145 1500 0
46 1800 5 96 1900 3 146 1800 18
47 2100 16 97 2500 19 147 2100 10
48 2000 12 98 1800 6 148 2700 19
49 2000 12 99 1700 2 149 1800 9
50 2900 20 100 2000 10 150 2100 15
Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios.
Como el marco muestral tiene 150 elementos usemos las columnas C4, C5 y C6, para elegir números de
tres cifras y luego C8, C9 y C10.
Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149
163. Una empresa de 500 trabajadores se quiere elegir a 7 personas usando muestreo aleatorio
simple. Use las columnas C2, C5 y C12.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística Descriptiva 2022 01 232
Muestreo sistemático
En el muestreo sistemático se elige un elemento del marco muestral cada cierto intervalo. Este mues-
treo supone que se cuenta con una enumeración completa de los elementos de la población.
3. A partir de este número elegido, seleccione el siguiente que ocupa la posición (A + k) del listado
del marco muestral y así sucesivamente hasta completar la muestra.
Estadística Descriptiva 2022 01 233
Ejemplo 61
Se tiene una población de 12 personas y se desea elegir a cuatro de ellas mediante un muestreo siste-
mático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C3, C6 y C12.
Solución
𝑁 12
𝑘= = =3
𝑛 4
Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque aleatorio (A). Ob-
servando la columna C3 de la tabla de números aleatorios tenemos que A = 2.
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la quinta
posición (3 + 2 = 5) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es
decir, elegiremos los datos de las posiciones 2, 5, 8 y 11.
Ejemplo 62
Se tiene una población de 15 personas y se desea elegir a seis de ellas mediante un muestreo sistemá-
tico. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C4, C8 y C1.
Solución
𝑁 15
𝑘= = = 2,5
𝑛 6
Seleccionemos aleatoriamente un número entero entre 1 y k = 2, llamado arranque aleatorio (A). Ob-
servando la columna C4 de la tabla de números aleatorios tenemos que A = 1.
Estadística Descriptiva 2022 01 234
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la tercera
posición (1 + 2 = 3) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es
decir, elegiremos los datos de las posiciones 1, 3, 5, 7, 9 y 11.
Ejemplo 63
Se tiene información de 40 personas de un barrio de Lima Metropolitana. Obtenga una muestra alea-
toria de ocho personas usando el muestreo sistemático y elabore una tabla con los elementos selec-
cionados. Utilice las columnas C8; C10; C11 de la tabla de números aleatorios.
Individuos registrados
Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 74
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162
Solución
𝑁 40
𝑘= = =5
𝑛 8
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la décima
posición (5 + 5 = 10) del listado del marco muestral y así sucesivamente hasta completar la muestra.
Es decir, elegiremos los datos de las posiciones 5, 10, 15, 20, 25, 30, 35 y 40.
Años en
Ingreso Nivel de Años en Ingreso Nivel de Años en Ingreso Nivel de
Nº Nº Nº em-
(soles) educación empresa (soles) educación empresa (soles) educación
presa
1 2300 Secundaria 5 51 2100 Técnica 13 101 2400 Técnica 16
2 2800 Secundaria 11 52 2100 Técnica 9 102 1700 Técnica 0
3 2400 Secundaria 4 53 1800 Técnica 1 103 2500 Técnica 12
4 2500 Secundaria 2 54 2000 Técnica 9 104 1700 Técnica 3
5 2300 Secundaria 3 55 2100 Técnica 10 105 2400 Técnica 17
6 2100 Secundaria 2 56 1900 Técnica 4 106 2400 Técnica 16
7 1700 Secundaria 2 57 2000 Técnica 10 107 1900 Técnica 7
8 2000 Secundaria 0 58 2300 Técnica 11 108 1700 Técnica 1
9 2200 Secundaria 7 59 2000 Técnica 7 109 2100 Técnica 6
10 2100 Secundaria 4 60 1700 Técnica 1 110 2000 Técnica 5
11 1700 Secundaria 1 61 1900 Técnica 6 111 2000 Superior 3
12 2500 Secundaria 2 62 2000 Técnica 9 112 2500 Superior 13
13 2800 Secundaria 13 63 2400 Técnica 17 113 1700 Superior 0
14 2400 Secundaria 9 64 1700 Técnica 0 114 2500 Superior 19
15 1700 Secundaria 1 65 1700 Técnica 2 115 1700 Superior 3
16 2400 Secundaria 9 66 2400 Técnica 17 116 2600 Superior 19
17 2200 Secundaria 10 67 2500 Técnica 13 117 1600 Superior 1
18 2200 Secundaria 4 68 2600 Técnica 16 118 1800 Superior 6
19 2300 Secundaria 10 69 2100 Técnica 14 119 2100 Superior 10
20 2800 Secundaria 11 70 1900 Técnica 7 120 1700 Superior 0
21 2100 Secundaria 7 71 2000 Técnica 9 121 2400 Superior 16
22 1700 Secundaria 1 72 1800 Técnica 7 122 2600 Superior 17
23 2500 Secundaria 6 73 2100 Técnica 10 123 2100 Superior 10
24 2400 Secundaria 9 74 2300 Técnica 12 124 2100 Superior 8
25 2700 Secundaria 17 75 2700 Técnica 20 125 2400 Superior 17
26 1700 Secundaria 0 76 2800 Técnica 20 126 1700 Superior 1
27 1600 Secundaria 2 77 1800 Técnica 3 127 2600 Superior 20
28 2600 Secundaria 17 78 1700 Técnica 5 128 2400 Superior 16
29 2500 Secundaria 13 79 1700 Técnica 4 129 2700 Superior 17
30 2500 Secundaria 16 80 1700 Técnica 0 130 2100 Superior 12
31 2700 Secundaria 17 81 1700 Técnica 1 131 1600 Superior 0
32 1700 Secundaria 1 82 2100 Técnica 6 132 2100 Superior 15
33 1600 Secundaria 1 83 2600 Técnica 17 133 1900 Superior 5
34 2400 Secundaria 11 84 2400 Técnica 9 134 2100 Superior 12
Estadística Descriptiva 2022 01 237
35 1900 Secundaria 3 85 2600 Técnica 19 135 2200 Superior 12
36 1800 Secundaria 5 86 1900 Técnica 7 136 2400 Superior 13
37 1800 Secundaria 3 87 1600 Técnica 0 137 1800 Superior 4
38 2400 Secundaria 14 88 1900 Técnica 3 138 2600 Superior 17
39 2600 Secundaria 16 89 2100 Técnica 14 139 2700 Superior 20
40 2700 Secundaria 18 90 1700 Técnica 0 140 2500 Superior 16
41 2100 Técnica 11 91 2100 Técnica 15 141 2500 Superior 16
42 2300 Técnica 14 92 1700 Técnica 1 142 1900 Superior 6
43 1700 Técnica 0 93 2300 Técnica 14 143 2100 Superior 15
44 2200 Técnica 13 94 2500 Técnica 16 144 1700 Superior 9
45 2900 Técnica 20 95 2600 Técnica 18 145 1500 Superior 0
46 1800 Técnica 5 96 1900 Técnica 3 146 1800 Superior 18
47 2100 Técnica 16 97 2500 Técnica 19 147 2100 Superior 10
48 2000 Técnica 12 98 1800 Técnica 6 148 2700 Superior 19
49 2000 Técnica 12 99 1700 Técnica 2 149 1800 Superior 9
50 2900 Técnica 20 100 2000 Técnica 10 150 2100 Superior 15
Aplique el muestreo sistemático para seleccionar una muestra de ocho empleados y elabore un listado
con los elementos seleccionados. Utilice la columna C3, C9, y C12 de la tabla de números aleatorios. Con
la muestra obtenido, calcule el porcentaje muestral de trabajadores con ingresos mayores a 2000 so-
les.
Solución
Estadística Descriptiva 2022 01 238
Muestreo estratificado
Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de sus
elementos.
1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a todos
los elementos de la población y que cada elemento pertenezca solamente a un estrato.
2. Calcule la cantidad de elementos a seleccionar en cada estrato.
3. Seleccione muestras aleatorias simples para cada uno de los estratos.
Estadística Descriptiva 2022 01 239
Recomendaciones para el uso de muestras estratificadas
• Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén rela-
cionadas entre sí.
• No se considera la formación de muchos estratos, generalmente se usa entre tres y ocho estratos.
• Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto, pueden no ser
considerados.
Ejemplo 64
La siguiente tabla muestra a los 120 alumnos de la especialidad de Comunicaciones, de la universidad
A, a quienes se les preguntó por su aplicación preferida para escuchar música y por la cantidad de
horas a la semana que la usaba.
Solución
Posición 𝑵𝒉
Estrato 𝑵𝒉 𝒏𝒉 = ×𝒏
(desde – hasta) 𝑵
𝑁# 66
1. Spotify N1 = 66 1 - 66 𝑛# = ×𝑛 = × 12 = 6,6 ≈ 7
𝑁 120
𝑁$ 21
2. Youtube Music N2 = 21 67 - 87 𝑛$ = ×𝑛 = × 12 = 2,1 ≈ 2
𝑁 120
𝑁) 33
3. Amazon Music N3 = 33 88 - 120 𝑛) = ×𝑛 = × 12 = 3,3 ≈ 3
𝑁 120
Total N = 120 𝑛 = 12
Entonces, con los doce elementos seleccionados en la muestra se tiene que la media muestral de horas
a la semana que los alumnos escuchan música a través de la aplicación de su preferencia es 6,83 horas.
Ejemplo 65
La empresa de telecomunicaciones RTV tiene 120 empleados de los cuales tiene información de las
variables: ingreso en soles, nivel de educación y años en la empresa.
Años
Ingreso Años Ingreso Nivel de Ingreso Años
Nivel de cumplidos Nivel de edu-
Nº (en so- cumplidos Nº (en so- educa- Nº (en so- cumplidos
educación en la em- cación
les) en la empresa les) ción les) en la empresa
presa
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
Estadística Descriptiva 2022 01 243
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Técnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Técnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Técnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Técnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Técnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Técnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Técnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Técnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Técnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Técnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Técnica 10 110 2500 Superior 16
31 2100 Técnica 11 71 2400 Técnica 16 111 2500 Superior 16
32 2300 Técnica 14 72 1700 Técnica 0 112 1900 Superior 6
33 1700 Técnica 0 73 2500 Técnica 12 113 2100 Superior 15
34 2200 Técnica 13 74 1700 Técnica 3 114 1700 Superior 9
35 2900 Técnica 20 75 2400 Técnica 17 115 1500 Superior 0
36 1800 Técnica 5 76 2400 Técnica 16 116 1800 Superior 18
37 2100 Técnica 16 77 1900 Técnica 7 117 2100 Superior 10
38 2000 Técnica 12 78 1700 Técnica 1 118 2700 Superior 19
39 2000 Técnica 12 79 2100 Técnica 6 119 1800 Superior 9
40 2900 Técnica 20 80 2000 Técnica 5 120 2100 Superior 15
Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como variable
de estratificación el nivel educacional. Elabore un listado identificando la posición de cada empleado
seleccionado. Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9,
C10 y C11 y para el estrato 3 use las columnas C4, C3, C5 y C7.
Solución
Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3 son:
secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos mues-
tras aleatorias simples.
𝑁% 30
1. Secundaria 𝑁% = 30 1 – 30 𝑛% = ×𝑛 = × 16 = 4
𝑛 120
𝑁& 50
2. Técnica 𝑁& = 50 31 – 80 𝑛& = ×𝑛 = × 16 = 6,67 ≈ 7
𝑛 120
𝑁' 40
3. Superior 𝑁' = 40 81 – 120 𝑛' = ×𝑛 = × 16 = 5,33 ≈ 5
𝑛 120
Total 𝑵 = 120 𝒏 = 16
Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y C5.
Observemos que las posiciones de los elementos a elegir están entre el 1 y el 30.
Estadística Descriptiva 2022 01 244
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
Luego, el cuadro con las posiciones de los elementos seleccionados para el estrato Secundaria es:
Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10 y C11.
Observemos que las posiciones de los elementos a elegir están entre el 31 y el 80.
Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:
Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y C7.
Observemos que las posiciones de los elementos a elegir están entre el 81 y el 120.
Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:
Estadística Descriptiva 2022 01 245
Años
Ingreso Años Ingreso Nivel de Ingreso Años
Nivel de cumplidos Nivel de edu-
Nº (en so- cumplidos Nº (en so- educa- Nº (en so- cumplidos
educación en la em- cación
les) en la empresa les) ción les) en la empresa
presa
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Técnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Técnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Técnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Técnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Técnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Técnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Técnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Técnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Técnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Técnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Técnica 10 110 2500 Superior 16
31 2100 Técnica 11 71 2400 Técnica 16 111 2500 Superior 16
32 2300 Técnica 14 72 1700 Técnica 0 112 1900 Superior 6
33 1700 Técnica 0 73 2500 Técnica 12 113 2100 Superior 15
34 2200 Técnica 13 74 1700 Técnica 3 114 1700 Superior 9
35 2900 Técnica 20 75 2400 Técnica 17 115 1500 Superior 0
36 1800 Técnica 5 76 2400 Técnica 16 116 1800 Superior 18
37 2100 Técnica 16 77 1900 Técnica 7 117 2100 Superior 10
38 2000 Técnica 12 78 1700 Técnica 1 118 2700 Superior 19
39 2000 Técnica 12 79 2100 Técnica 6 119 1800 Superior 9
40 2900 Técnica 20 80 2000 Técnica 5 120 2100 Superior 15
Estadística Descriptiva 2022 01 246
Ejercicios
165. Objetivo específico: Determinar los clientes a seleccionar para realizar un estudio sobre me-
joras en el servicio de mantenimiento.
La reproductividad de la variable normal nos asegura que un histograma de estos valores tendrá el
aspecto de la curva de Gauss. La forma de saber los parámetros concretos (media y desviación están-
dar) de la variable suma nos la da el siguiente resultado teórico.
𝑋! ~𝑁(𝜇! , s$! )
𝑆 = 𝑐# 𝑋# + 𝑐$ 𝑋$ + ⋯ + 𝑐7 𝑋7 = • 𝑐! 𝑋! ~𝑁(𝜇d ; 𝜎d$ )
!6#
Media
7
𝐸(𝑆) = 𝜇d = 𝑐# 𝜇# + 𝑐$ 𝜇$ + ⋯ + 𝑐7 𝜇7 = • 𝑐! 𝜇!
!6#
Varianza
7
𝑉(𝑆) = 𝜎d$ = 𝑐#$ 𝜎#$ + 𝑐$$ 𝜎$$ + ⋯+ 𝑐7$ 𝜎7$ = • 𝑐!$ 𝜎!$
!6#
7 7 7
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 = • 𝑋! ~𝑁 ¡• 𝜇! ; • 𝜎!$ ¢
!6# !6# !6#
Como casos particulares, si 𝑋# y 𝑋$ tienen distribuciones normales 𝑋# ~𝑁(𝜇# ; 𝜎#$ ) y 𝑋$ ~𝑁(𝜇$ ; 𝜎$$ )
respectivamente, entonces:
Solución
a. Calcule la probabilidad de que el segundo supermercado obtenga mayores ventas que el primer
supermercado en el primer día.
Solución
𝑋~𝑁(15; 9)
𝑌~𝑁(17; 16)
Se pide:
𝑃(𝑌 > 𝑋) = 𝑃(𝑌 − 𝑋 > 0)
Sea la variable:
𝑊 =𝑌−𝑋
𝑊~𝑁(2; 25)
𝑊−2 0−2
𝑃(𝑌– 𝑋 > 0) = 𝑃(𝑊 > 0) = 𝑃 k > l
5 5
b. Calcule la probabilidad de que la diferencia entre las ventas diarias de ambos supermercados no
supere los 1000 dólares.
Solución
En este caso, se pide calcular la probabilidad de la diferencia entre las ventas de los supermercados
sea menor o igual a 1000 dólares.
𝑃(|𝑊| ≤ 1)
= 𝑃(−1 ≤ 𝑊 ≤ 1)
−1 − 2 𝑊 − 2 1 − 2
= 𝑃k ≤ ≤ l
5 5 5
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
a. Si se elige una persona al azar, calcule la probabilidad de que pese más de 70 kilos.
b. Calcule la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere 5500 kilos.
Solución
a. Si se elige una persona al azar, calcule la probabilidad de que pese más de 70 kilos.
Solución
Sean los eventos:
𝐴: = una persona pese más de 70 kilos
𝐻: = Que el usuario sea hombre
50
𝑃(𝐻) = = 0,625
80
𝑀: = Que el usuario sea mujer
30
𝑃(𝑀) = = 0,375
80
𝑋: = peso de un hombre
𝑋~𝑁(75; 15$ )
𝑌: = peso de una mujer
𝑌~𝑁(60; 10$ )
Luego:
𝑃(𝐴⁄𝐻) = 0,6293
𝑃(𝐻) = 0,625
𝑃(𝐴K ⁄𝐻 ) = 0,3707
𝑃(𝐴⁄𝑀) = 0,1587
𝑃(𝑀) = 0,375
𝑃(𝐴K ⁄𝑀) = 0,8413
b. Calcule la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere 5500 kilos.
Solución
H, ),
𝑌 = • 𝑋! + • 𝑌!
!6# !6#
Es decir:
𝑌~𝑁(5550; 14250)
Estandarizando:
= 1 − 𝑃(𝑍 ≤ −0,42)
= 1 − 0,33724 = 0,66276
a. 𝑆 = 𝑋# + 𝑋$
𝑆 = 𝑋# + 𝑋$ ~ 𝑁(… ; … )
𝑆 ~ 𝑁(… ; … )
b. 𝑆 = 𝑋# − 𝑋$
𝑆 = 𝑋# − 𝑋$ ~ 𝑁(… ; … )
𝑆 ~ 𝑁(… ; … )
168. Una familia tiene tres hijos. El monto de la propina semanal que se le da a cada hijo puede mode-
larse como una variable normal. Al menor se le da en media 23,5 soles por semana con una des-
viación estándar de 3 soles, al segundo hijo se le da el doble que al menor y al mayor se le da el
triple que al menor. Calcular la probabilidad de que en cuatro semanas la suma total recibida en
propinas por los tres sume más de 600 soles. Rpta. 0,15866
169. El peso de los pasajeros adultos de un avión se modela con una variable normal:
• en mujeres, con media 65 kilos y desviación estándar 15 kilos.
• en hombres, con media 80 kilos y desviación estándar 20 kilos.
a. Si la probabilidad de que 10 pasajeras mujeres y 10 pasajeros hombres pesen más de 1500
kilos es mayor a 0,3 se va a restringir la cantidad de pasajeros en las avionetas pequeñas.
Indique lo que hará la compañía.
b. En un avión el 60% de los pasajeros son hombres. Si la probabilidad de que una persona pese
más de 75 kilos es mayor a 0,3 se restringirá el peso de los equipajes de mano. Indique lo que
se hará.
Estadística Descriptiva 2022 01 256
Si 𝑋# , 𝑋$ , … , 𝑋7 son 𝑛 variables independientes con distribución normal, tales que 𝑋! con media µ y
varianza 𝜎 $ , entonces la distribución de la variable media muestral 𝑋h es la siguiente:
𝑋# + 𝑋$ + ⋯ + 𝑋7
𝑋h = ~𝑁N𝜇?e ; 𝜎?$e O
𝑛
Â
Media de la variable media muestral 𝑿
𝜇?e = 𝜇
Â
Varianza de la variable media muestral 𝑿
𝜎$
𝜎?$e =
𝑛
Es decir:
𝑋# + 𝑋$ + ⋯ + 𝑋7 𝜎$
𝑋h = ≈ 𝑁 š𝜇; ›
𝑛 𝑛
𝑋# + 𝑋$ + ⋯ + 𝑋7
𝑋h = ≈ 𝑁N𝜇?e ; 𝜎?$e O
𝑛
Â
Media de la variable media muestral 𝑿
𝜇?e = 𝜇
Â
Varianza de la variable media muestral 𝑿
𝜎$
𝜎?$e =
𝑛
Es decir:
𝑋# + 𝑋$ + ⋯ + 𝑋7 𝜎$
𝑋h = ≈ 𝑁 š𝜇; ›
𝑛 𝑛
Estadística Descriptiva 2022 01 257
Distribución de la suma muestral de una población normal
Si 𝑋# , 𝑋$ , … , 𝑋7 son 𝑛 variables independientes con distribución normal, tales que 𝑋! con media µ y
varianza 𝜎 $ , entonces la distribución de la variable suma muestral 𝑋h, por propiedad reproductiva de
la normal, es la siguiente:
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ~𝑁(𝜇d ; 𝜎d$ )
Es decir:
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ~𝑁(𝑛𝜇; 𝑛𝜎 $ )
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ≈ 𝑁(𝜇d ; 𝜎d$ )
Es decir:
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ≈ 𝑁(𝑛𝜇; 𝑛𝜎 $ )
Estadística Descriptiva 2022 01 258
Ejemplo 68
Caso Metropolitano
El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia, queja o re-
clamo. El número de correos electrónicos que llegan a la cuenta de correo se modela como una varia-
ble aleatoria Poisson con una media de ocho correos por día.
Si se eligen al azar 100 días, calcule la probabilidad que la cantidad total de correos recibidos en esos
100 días esté entre 790 y 810.
Solución
Sea
𝑋! = número de correos electrónicos que llegan a la cuenta de correo del Metropolitano en el día, 𝑖 =
1, … ,100
𝑋! ~𝑃(𝜆 = 8)
𝜇 = 𝐸(𝑋) = 𝜆 = 8
𝜎 $ = 𝑉(𝑋) = 𝜆 = 8
#,,
𝑆 = • 𝑋!
!6#
Usaremos el teorema central del límite.
𝑆 ≈ 𝑁(𝑛𝜇; 𝑛𝜎 $ )
𝑆 ≈ 𝑁(800; 800)
La probabilidad pedida es:
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
Si dividimos la suma 𝑆 entre el tamaño de muestra 𝑛 = 100, obtendremos la media muestral 𝑋h.
790 𝑆 810
= 𝑃k < < l
100 100 100
𝜎$ 8
𝑋h ≈ 𝑁 š𝜇 = 8, = ›
𝑛 100
𝑋h ≈ 𝑁(8; 0,08)
7,9 − 8 8,1 − 8
= 𝑃k <𝑍< l
√0,08 √0,08
Ejemplo 69
Caso Metropolitano
Se define la variable aleatoria 𝑋: = número de días a la semana que un usuario usa el Metropolitano.
Esta variable presenta la siguiente función de probabilidad.
𝑿: = número de días 0 1 2 3 4 5 6 7
𝒇(𝒙) 0,05 0,10 0,15 0,15 0,20 0,25 0,05 0,05
Si se elige al azar una muestra de 1000 usuarios, calcule la probabilidad de que la media muestral del
número de días que usan el Metropolitana esté entre 3,5 y 3,6 días. Si esta probabilidad supera a 0,6
entonces se mantendrá la cantidad de buses actual.
Solución
Interpretación
Determinar si se mantendrá la cantidad de buses actual.
Representación
Definamos las variables necesarias:
𝑋: = número de días a la semana que un usuario usa el Metropolitano.
𝜎$
𝑋 ≈ 𝑁 š𝜇, ›
𝑛
𝑋h: = media muestral del número de días a la semana que un usuario usa el Metropolitano.
𝜎$
𝑋h ≈ 𝑁 š𝜇, ›
𝑛
Estadística Descriptiva 2022 01 261
Cálculo
Para resolver el problema necesita establecer los parámetros de la distribución de la variable media
muestral 𝑋h, por ello necestamos calcular 𝜇 y 𝜎 $ .
Calculemos la media de 𝑋.
𝜇 = 𝐸(𝑋) = • 𝑥𝑓(𝑥)
D6,
= 0 × 𝑓(0) + ⋯ + 7 × 𝑓(7)
= 0 × 0,05 + ⋯ + 7 × 0,05
𝜇 = 𝐸(𝑋) = 3,55
Calculemos la varianza de 𝑋.
$
𝜎 $ = 𝑉(𝑋) = 𝐸(𝑋 $ ) − N𝐸(𝑋)O
= • 𝑥 $ 𝑓(𝑥) − 3,55$
D6,
𝜎 $ = 𝑉(𝑋) = 3,1475
𝜎$
𝑋h ≈ 𝑁 š𝜇, ›
𝑛
𝜎 $ 3,1475
𝑋h ≈ 𝑁 š𝜇 = 3,55, = ›
𝑛 1000
𝑋h ≈ 𝑁(3,55; 0,0031475)
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
Análisis y argumentación
La probabilidad pedida es 0,62654, que es mayor a 0,6. Por lo tanto, se mantendrá la cantidad de buses
actual.
Ejemplo 70
Caso Metropolitano
El tiempo de espera para tomar un bus de un usuario se modela con una variable uniforme con pará-
metros 0 y 10 minutos. Si la probabilidad de que la media del tiempo de espera de esos 500 usuarios
seleccionados al azar es mayor a 5,2 minutos supera al 10%, entonces, se va a aumentar la cantidad
de buses.
Solución
Interpretación
Determinar si se va a aumentar la cantidad de buses.
Representación
Definamos las variables necesarias:
𝑋: = tiempo de espera de un usuario
𝑋~𝑈(𝑎 = 0, 𝑏 = 10)
Cálculo
Por propiedad de la variable uniforme, se tiene que:
𝑎 + 𝑏 0 + 10
𝜇= = =5
2 2
Por teorema central del límite, se tiene que la distribución de la media muestral 𝑋h es:
𝜎$
𝑋h ≈ 𝑁 š𝜇, ›
𝑛
Reemplazando los valores:
𝜎 $ 8,3333
𝑋h ≈ 𝑁 š𝜇 = 5, = ›
𝑛 500
𝑋h ≈ 𝑁(5; 0,01667)
Estandarizando, se tiene:
𝑋h − 5 5,2 − 5
= 𝑃š > ›
√0,01667 √0,01667
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
Análisis y argumentación
La probabilidad de que la media del tiempo de espera de esos 500 usuarios seleccionados al azar es
mayor 5,2 minutos es es 0,06069, que no supera a 0,1 (10%). Por lo tanto, no se aumentará la cantidad
de buses.
Estadística Descriptiva 2022 01 264
Ejercicios
170. Según los Censos Nacionales del 2017, la media de la edad de los peruanos es 31,51 años y la
desviación estándar es 21,27. Si se toma una muestra de 5000 personas, calcule la probabilidad
de que la media muestral esté entre 31,4 y 31,6 años. Asuma que la edad sigue una distribución
normal.
171. La cantidad de mango que exporta una empresa mensualmente se modela con una variable alea-
toria con media de 25 toneladas y desviación estándar de cuatro toneladas. Calcular la probabili-
dad de que la cantidad exportada en tres años sea menor a 920 toneladas. Asuma independencia
entre las cantidades mensuales exportadas. Rpta. 0,79673
172. El tiempo, en segundos, que tarda un auxiliar de vuelo, en segundos, en servir las bebidas a un
pasajero se modela con una variable aleatoria 𝑋 con la siguiente función de densidad:
𝑎(20 − 𝑥) 10 ≤ 𝑥 ≤ 20
𝑓(𝑥) = —
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Si la probabilidad de que un auxiliar de vuelo se demore más de 22 minutos al servir a 100 pasa-
jeros es mayor a 0,7 se adelantará el momento de entregar las bebidas. Indique la decisión.
Solución
Interpretación
Representación
Cálculo
Análisis y argumentación
173. Según los Censos Nacionales del 2017, la media de la cantidad de habitaciones por vivienda es 2,9
habitaciones y la desviación estándar es 1,76. Si se toma una muestra de 6000 viviendas, calcule
la probabilidad de que la media muestral del número de habitaciones esté entre 2,88 y 2,92 habi-
taciones.
174. Lima y El Cairo son las dos principales ciudades del mundo situadas en zonas desérticas y con
extremo estrés hídrico. En París, Zúrich o Berlín, el consumo medio por persona de agua bordea
los 130 litros por día. Sin embargo, en Lima el consumo medio por persona es de 250 litros por
día con una desviación estándar de 60 litros por día. Si se toma una muestra en Lima de 100 per-
sonas, calcule la probabilidad de que el consumo total muestral en un día sea menor a 24 mil
litros. Rpta. 0,04746
175. El número de vuelos nacionales cancelados en un día se modela con la variable aleatoria 𝑋 con la
siguiente función de probabilidad:
𝒙 0 1 2 3 4 5
𝒇(𝒙) 0,40 0,25 0,15 0,10 0,05 0,05
Estadística Descriptiva 2022 01 265
Se toma una muestra de 100 días, calcule la probabilidad de que se cancelen entre 125 a 135
vuelos nacionales. Rpta: 0,29931
Tablas estadísticas
Todas las tablas de este manual han sido calculadas usando el MS Excel.
Tabla de la distribución normal estándar
Área bajo la curva normal: [P(Z £ z ) = a ]
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Estadística Descriptiva 2022 01 267
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Estadística Descriptiva 2022 01 268
Índice