Está en la página 1de 268

1 Estadística Descriptiva 201901

MA460
Estadística Descriptiva

Cuaderno de trabajo
Los profesores del curso

Área de Ciencias - Marzo 2022


La siguiente guía de trabajo contiene el material necesario para
seguir las clases del curso Estadística Descriptiva de la Universi-
dad Peruana de Ciencias Aplicadas. Contiene la teoría, ejercicios
resueltos y propuestos de todo el curso.

Este material de enseñanza está basado en materia-


les y trabajo de los profesores del curso.

Esperamos que este material le sea de utilidad.

Los profesores del curso

Gráfico de la carátula https://www.cognodata.com/blog/


Tabla de contenido
Unidad 1. Organización y descripción de datos................................................................................ 4
Definición de Estadística ..................................................................................................................... 5
Definiciones ........................................................................................................................................ 8
Estadística descriptiva ...................................................................................................................... 21
Distribución de frecuencias de variables cualitativas ....................................................................... 22
Gráficos estadísticos ......................................................................................................................... 25
Tabulaciones cruzadas ...................................................................................................................... 40
Resumen de datos cuantitativos ...................................................................................................... 49
Gráficos de datos cuantitativos ........................................................................................................ 58
Medidas de tendencia central .......................................................................................................... 66
Medidas de variabilidad ................................................................................................................... 80
Medidas de asimetría ....................................................................................................................... 88
Medidas de posición ......................................................................................................................... 92
Unidad 2. Teoría de la probabilidad ............................................................................................ 109
Experimentos, reglas de conteo y asignación de probabilidades ................................................... 110
Reglas de conteo y combinaciones ................................................................................................. 117
Probabilidad condicional ................................................................................................................ 122
Eventos independientes ................................................................................................................. 140
Unidad 3. Distribuciones de probabilidad y muestreo ................................................................. 144
Variable aleatoria ........................................................................................................................... 145
Variable aleatoria discreta .............................................................................................................. 147
Distribuciones de probabilidad de variable discreta ...................................................................... 165
Variable aleatoria continua ............................................................................................................ 182
Distribuciones de probabilidad de variable continua ..................................................................... 198
Muestreo probabilístico ................................................................................................................. 224
Muestreo aleatorio simple ............................................................................................................. 225
Muestreo sistemático ..................................................................................................................... 232
Muestreo estratificado ................................................................................................................... 238
Propiedad reproductiva de la normal ............................................................................................. 249
Distribución muestral de un estadístico ......................................................................................... 256
Tablas estadísticas .......................................................................................................................... 266
Estadística Descriptiva 2022 01 4

Unidad 1. Organización y descripción de datos

Logro de la Unidad 1
Al finalizar la Unidad 1, el estudiante será capaz entender claramente la información que se presenta
en las tablas y gráficos estadísticos. Calcular e identificar las medidas de resumen idóneas que corres-
ponden a cada análisis de datos.

Temario
• Conceptos básicos
• La Estadística y sus subdivisiones.
• Definiciones de población, muestra, variables, clasificación de variables, parámetros y estadísticos.
• La investigación estadística. Metodología.
• Métodos de organización y presentación de datos cualitativos y cuantitativos
• Tablas de distribución de frecuencias y representaciones gráficas (circular, barras, Pareto)
• Tablas de doble entrada
• Medidas de tendencia central: media aritmética, mediana, moda, media ponderada
• Medidas de posición: cuartiles, deciles, percentiles
• Medidas de dispersión: varianza, desviación estándar, coeficiente de variación
• Medidas de asimetría
• Diagramas de cajas
Estadística Descriptiva 2022 01 5

Definición de Estadística
Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, or-
ganizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.

Recopilar datos Organizar datos Presentar datos Analizar datos Tomar decisiones
Estadística Descriptiva 2022 01 6
Estadística descriptiva

Son métodos asociados a la caracterización, resumen y presentación de datos, que permiten descri-
birlos apropiadamente.
Comprende el uso de gráficos, tablas e indicadores de resumen obtenidos al realizar algunos cálculos.

Estadística inferencial

Son métodos y técnicas que hacen posible estimar una o más características de una población o tomar
decisiones referentes a una población, basados en los resultados obtenidos del estudio de muestras
elegidas adecuadamente.
Estas conclusiones no tienen que ser totalmente válidas, pueden tener cierto margen de error, por eso
se dan con una medida de confiabilidad o probabilidad.

Estadística descriptiva
Métodos de recolección, caracterización, resumen y
presentación de características de datos

Población Muestra Datos

Muestreo

𝑝 Porcentaje poblacional 𝑀𝑒 Mediana poblacional


Estimación
𝜇 Media poblacional 𝑀𝑜 Moda poblacional
Estadística inferencial
Se estima características poblacionales o se decide basándose en muestras al azar.
Estadística Descriptiva 2022 01 7
Ejercicios

1. Indique si los siguientes enunciados corresponden al uso de la Estadística descriptiva o de la Esta-


dística inferencial.

Solución
Los gráficos están realizados usando estadística descriptiva.

Este gráfico muestra la intención de voto en España para los partidos políticos: PSOE, PP, Vox y
Ciudadanos, Unidas Podemos y otros. Esta noticia se basa en estadística inferencial.
Estadística Descriptiva 2022 01 8

Definiciones

Unidad elemental
Es la entidad acerca de la cual se reúne los datos.

Población
Población es el conjunto de todas las unidades elementales de interés en determinado estudio. Es un
conjunto de personas, objetos, conceptos, etc. de los cuales se sacan conclusiones a partir de una o
más características observables de naturaleza cualitativa o cuantitativa.

Muestra
Muestra es un subconjunto de la población. Será representativa si se elige al azar.

Variable
Es una característica de interés de las unidades elementales.

Dato
Es el resultado de medir una variable de una unidad elemental.

Observación
Es el conjunto de mediciones de una unidad elemental.

Población Muestra Datos


Muestreo

Dato
Observación

Unidad elemental
Estadística Descriptiva 2022 01 9
Ejemplo 1
A una persona (unidad elemental) se le pregunta su sexo, ciudad de residencia y edad (variables). Ella
responde (tres datos): “Soy mujer, vivo en Lima y tengo 19 años” (observación).

Población: Todos los Muestra: Algunos alumnos Base de datos: Mediciones a


alumnos de una sección de una sección los alumnos en la muestra

Muestreo Tres variables Sexo Ciudad Edad

Una observación Mujer Lima 19

Tres datos

Unidad elemental: Un
alumno de la sección

Ejemplo 2
En una fábrica (unidad elemental) se pregunta su distrito, tamaño de la empresa y su rubro (variables).
Se registra (tres datos): “Jesús María, mediana empresa y metalmecánica” (observación).

Ejemplo 3
La Secretaría Académica de una universidad está interesada en realizar un estudio sobre los motivos
por los cuales algunos alumnos del pregrado han decidido dar exámenes de recuperación ese ciclo. La
universidad cuenta con quince facultades y un total de 7500 alumnos, de los cuales 830 han decidido
rendir exámenes de recuperación ese ciclo. De la población se va a entrevistar a una muestra aleatoria
de 200 alumnos. Defina la población y la muestra.

Solución
La población son los 830 alumnos que han decidido dar exámenes de recuperación ese ciclo. La mues-
tra son los 200 alumnos que han decidido dar exámenes de recuperación ese ciclo.
Estadística Descriptiva 2022 01 10
Ejercicios

2. El objetivo de una investigación es estimar la media, en años, de la edad de los egresados de la


UPC. Indique la población, muestra, unidad elemental, variable a medir y un posible dato.
Solución
La población es todos los egresados de la UPC
La muestra es algunos egresados de la UPC
La unidad elemental es un egresado de la UPC
La variable a medir es edad
Un posible dato es 26 años

3. El objetivo de una investigación es estimar el porcentaje de los egresados de la UPC que trabajan
en su carrera. Indique la población, muestra, unidad elemental, variable a medir y un posible dato.
Solución
La población es todos los egresados de la UPC
La muestra es algunos egresados de la UPC
La unidad elemental es un egresado de la UPC
La variable a medir es si trabaja en su carrera
Un posible dato es: no trabajo en mi carrera

4. Según un informe de la Cámara Peruana de la Construcción (Capeco), el 70% de viviendas en Lima


son informales y vulnerables a un terremoto. Indique la población, muestra, unidad elemental,
variable a medir y un posible dato para poder hacer ese informe.
Solución
La población es todas las viviendas en Lima.
La muestra es algunas viviendas en Lima.
La unidad elemental es una vivienda en Lima.
La variable por medir es si es informal y vulnerable a un terremoto.
Un posible dato es no es informal y vulnerable.

5. Se quiere estimar el promedio diario de las ventas, en soles, del supermercado A durante el año
2021. Indique la población, muestra, unidad elemental, variable a medir y un posible dato.
Solución
La población es todos los días que trabajó el supermercado A en el año 2021
La muestra es algunos días que trabajó el supermercado A en el año 2021
La unidad elemental es un día que trabajó el supermercado A en el año 2021
La variable por medir es monto de ventas por día, en soles
Un posible dato es 50000 soles.

6. Los teens de hoy son parte de la nueva generación que se abre paso y vive la era del Internet y los
dispositivos móviles aún con más intensidad que sus predecesores, los millenials. Aunque denomi-
nan a esta generación Z o iGen. Es una generación sobreexpuesta a la información, multipantallas
y los primeros en socializar a través de la tecnología. Datum realizó una encuesta a 402 jóvenes de
Estadística Descriptiva 2022 01 11
13 a 19 años en el Perú. El cuestionario constó de 35 preguntas. Indique la unidad elemental en la
investigación, la cantidad de observaciones y datos obtenidos.
Solución
La unidad elemental es unteen, es decir, joven de 13 a 19 años en el Perú.
La cantidad de observaciones es 402, pues cada joven da una observación.
La cantidad de datos obtenidos es 14070 (35 x 402), pues cada joven brinda 35 datos.

7. Indique las variables y una posible observación de la base de datos usada para realizar esta info-
grafía.

Solución
Las variables son: edad, nivel educativo, número de trabajos, ingreso mensual, si tiene tarjeta de
crédito o ahorro, si recibe CTS, si se encuentra afiliado a una AFP, número de horas que trabaja a
las semana, si tiene seguro de salud, si trabaja de manera formal, número de personas en su em-
presa, sector en qué trabaja, ocupación laboral.
Estadística Descriptiva 2022 01 12

Una posible observación es: edad = 35 años, nivel educativo = superior, número de trabajos = 1,
ingreso mensual = 3000 soles, si tiene tarjeta de crédito o ahorro = sí, si recibe CTS = sí, si se en-
cuentra afiliado a una AFP = sí, número de horas que trabaja a las semana = 40 horas, si tiene
seguro de salud = sí, si trabaja de manera formal = sí, número de personas en su empresa = 7,
sector en qué trabaja = comercio, ocupación laboral = empleado.

8. Según el estudio “Rumores de oficina”, el 42% de los ejecutivos limeños considera que los rumores
influyen mucho en el clima laboral de la oficina. Indique el elemento, una variable a medir y una
posible observación.
Solución
La unidad elemental es …
Una variable por medir es …
Una posible observación es …

9. En una investigación, se quiere estimar el promedio del número de asistentes a los conciertos de
artistas internacionales realizados en Lima durante el año 2021. Indique el elemento, una variable
a medir y una posible observación.
Solución
La unidad elemental es …
Una variable por medir es …
Una posible observación es …

10. El objetivo de una investigación en el Perú es determinar el promedio de la edad de las mujeres en
edad fértil que usan métodos anticonceptivos. El INEI considera a la edad fértil en las mujeres
desde los 15 hasta los 49 años. Indique la población, la muestra y la unidad elemental para esta
investigación.
Solución
La población es …
La muestra es …
La unidad elemental es …

11. El objetivo de una investigación en la ciudad de Lima es determinar la ocupabilidad en hoteles de


4 y 5 estrellas en Cusco durante el día de año nuevo del 2021, es decir, el porcentaje de habitacio-
nes ocupadas durante ese día. Indique la población y la muestra
Solución
La población es …
La muestra es …
Estadística Descriptiva 2022 01 13
Escalas de medición de las variables

Son los tipos de valores asignados a las unidades elementales para una variable definida.

La escala de medición permite determinar la cantidad de información que contienen los datos y el
análisis estadístico más apropiado.

Nominal
• Una variable está medida en escala nominal cuando los datos son etiquetas
que se emplean para definir un atributo del elemento.

Ordinal
• Una variable está medida en escala ordinal cuando los datos son etiquetas
y el orden es significativo.
• Se pueden ordenar, de tal manera que puedan expresar grados de la
característica medida.
• No tiene sentido medir la distancia entre los valores de la variable ni
realizar operaciones aritméticas con ellos pues no toman valores
numéricos específicos ni existe proporcionalidad entre categorías vecinas.
Intervalo
• Una variable está medida en escala de intervalo si los datos tienen
propiedades de datos ordinales y el intervalo entre observaciones se
expresa en términos de una unidad fija de medida.
• Los datos de intervalo siempre son numéricos.
• El cero es relativo, es decir, no indica la ausencia de la característica
medida.
Razón
• Una variable está medida en escala de razón si los datos tienen todas las
propiedades de los datos de intervalo y se puede realizar cualquier
operación aritmética (suma, resta, multiplicación y división) y lógica
(comparación y ordenamiento).
• El cero es absoluto, es decir, indica la ausencia total de la característica
medida.
Estadística Descriptiva 2022 01 14
Ejemplo 4

Nominal
• Sexo de una persona
• Estado civil de un empleado de una empresa
• Carrera profesional universitaria

Ordinal
• Orden de mérito de un atleta en una competición
• Grado de instrucción de los clientes de un banco

Intervalo
• Temperatura en grados centígrados 0ºC
• Año de nacimiento

Razón
• Sueldo de un empleado de una empresa
• Tiempo en terminar un examen
• Peso de un perro

Ejemplo 5

Indique la escala de medición de las siguientes variables y su escala de medición.

• Número de personas que van a ver una película


• Género de una película (drama, comedia, acción, etc.)
• Duración de una película
• Opinión sobre la película (buena, regular, mala)

Solución
Variable Escala de medida de la variable
Número de personas que van a ver una película Razón
Género de una película (drama, comedia, acción, etc.) Nominal
Duración de una película Razón
Opinión sobre la película (buena, regular, mala) Ordinal
Estadística Descriptiva 2022 01 15
Ejercicios

12. Indique la escala de medición de cada variable.

Variable Nominal Ordinal Intervalo Razón

Nombre de un país X

Número de medallas de oro de un país X

Precio de una entrada, en soles X

Edad de un deportista X

Año en que se desarrolló el Panamericano X

Posición de un país en el medallero X

Temperatura en el agua del mar en °C X

Opinión respecto a los Panamericanos: mala, regular,


X
buena, muy buena
Estadística Descriptiva 2022 01 16
Tipos de variables según su naturaleza
Las variables se pueden clasificar en cualitativas o cuantitativas.

Variable Variable
cualitativa cuantitativa

Es una variable que Es una variable que A su vez, la variable


puede ser expresada puede ser medida en cuantitativa se
en escala nominal u escala de intervalo o clasifica en discreta o
ordinal. de razón. continua.

Variable discreta
Tiene un número finito o infinito
numerable de posibles valores; es
decir, que en un intervalo solo
puede tomar ciertos valores.

Variable continua
Tiene un número infinito no
numerable de posibles valores; es
decir, que en un intervalo puede
tomar cualquier valor.

Ejemplo 6

Variables Tipo de variable Escala de medición


Marca de computadora personal que utiliza Cualitativa Nominal
Tiempo que usa la computadora por semana Cuantitativa continua Razón
Número de perros en una casa Cuantitativa discreta Razón
Estadística Descriptiva 2022 01 17
Ejercicios

13. Indique la escala de medición y tipo de las siguientes variables.

Variable Tipo de variable Escala de medición


Principal ventaja de tener una
Cualitativa Nominal
tarjeta de crédito

Número de tarjetas de crédito


Cuantitativa discreta Razón
que tiene una persona

Número de la tarjeta (Son 16 dígi-


Cualitativa Nominal
tos)

Límite de crédito permitido en


Cuantitativa continua Razón
una sola operación

Tipo de tarjeta (Clásica, Premium,


Cualitativa Ordinal
Signature, Elite)

Compañía de pago (Visa, Master-


Cualitativa Nominal
card)

Año de vencimiento de la tarjeta Cuantitativa discreta Intervalo

14. Indique la escala de medición y tipo de las siguientes variables.

Variable Tipo de variable Escala de medida

Edad del elector

Sexo del elector

Candidato preferido

Nivel socioeconómico del elector

Tiempo que demora desde su casa


al centro de votación

Número de personas que votaron


en una mesa de votación

Año en que se produce la votación


Estadística Descriptiva 2022 01 18
Parámetro
Parámetro es cualquier resumen de la población.

Estadístico
Estadístico es cualquier resumen de la muestra.

Ejemplo 7
En un estudio entre alumnos de la UPC, se registró la edad de todos los alumnos de la UPC. La media
de la edad fue de 19,3 años. Además, de una muestra de aleatoria de 300 alumnos se encontró que el
12% trabaja. Indique lo siguiente.

Medida de resumen Variable Valor Parámetro o estadístico


Media Edad 19,3 años Parámetro
Proporción Condición de trabajo 0,12 Estadístico

Ejemplo 8
La encuesta de El Comercio-Ipsos publicada el 25 de julio del 2021 revela varios datos sobre las priori-
dades de los peruanos. Para empezar, la principal preocupación sigue derivada de las consecuencias
que deja la pandemia por el COVID-19: salud y empleo.
De acuerdo con esta encuesta, se tienen varios estadísticos, como, por ejemplo: Proporción de perua-
nos de 18 a más años que manifiestan que uno de los temas que deberían ser priorizados por el go-
bierno durante los primeros meses de gestión es mejorar los servicios de salud/Avanzar con la vacu-
nación contra el COVID-19, cuyo valor es 0,75. Es un estadístico, pues para calcularlo se uso una mues-
tra aleatoria.
Estadística Descriptiva 2022 01 19
Ejercicios

15. Indique si los porcentajes obtenidos son estadísticos o parámetros.

Los porcentajes obtenidos son estadísticos, pues se calcularon de una muestra.

16. Según los Censos Nacionales 2017 ejecutados por el INEI, el 50,30% de los peruanos son mujeres.
Indique si este resultado es un parámetro o un estadístico. Además, indique el nombre y valor de
la medida de resumen.

Es un parámetro. Proporción de mujeres en el Perú, su valor es 0,503.

17. Según un informe de Sedapal del año 2019 basado en una muestra de habitantes, San Isidro fue el
distrito de Lima Metropolitana que registró el mayor consumo promedio de agua potable: 254
litros por persona por día.

Según el caso, complete los espacios en blanco para el caso de San Isidro.
La población por estudiar es todos los habitantes de San Isidro.
La muestra por seleccionar es algunos habitantes de San Isidro.
La unidad elemental es un habitante de San Isidro.
Estadística Descriptiva 2022 01 20
La variable en estudio es cantidad de litors de agua que consume al día.
La medida de resumen calculada es la media cuyo valor para el distrito de San Isidro es 254 litros
Esta medida de resumen es estadístico, pues es calculado de una muestra.

18. El siguiente gráfico pertenece al estudio de opinión sobre drogas en población urbana peruana de
la ONG Cedro del año 2017. Se encuestó a 8352 personas entre 12 y 65 años. Complete los espa-
cios en blanco.

Fuente: Encuesta sobre opinión sobre drogas en población urbana peruana. Cedro. 2017

Solución

La población por estudiar es …


La unidad elemental es …
La variable en estudio es …
La medida de resumen calculada es …
Esta medida de resumen es … (estadístico o parámetro) pues …

19. Los resultados del Censo Nacional de Población Penitenciaria 2016 revelan que el 60,0% de inter-
nos logró estudiar algún año de educación secundaria y 25,2% educación primaria. Las personas
privadas de libertad han logrado estudiar algún año de educación superior (superior no universi-
taria 7,2% y superior universitaria 5,2%). Usando esta información, complete los espacios en
blanco.
Estadística Descriptiva 2022 01 21

Estadística descriptiva

Frecuencia absoluta simple de una clase


Es la cantidad de elementos que pertenecen a esa clase. Se denota por 𝑓! .

Frecuencia relativa simple de una clase


Es la proporción de elementos que pertenecen a esa clase. Se calcula dividiendo la frecuencia absoluta
entre el número total de datos. Se denota por ℎ! y se calcula con:

𝑓!
ℎ! =
𝑛

Frecuencia porcentual simple de una clase


Es la frecuencia relativa multiplicada por 100%. Se denota por 𝑝! y se calcula con:

𝑝! = ℎ! × 100%

Distribución de frecuencias
Es un resumen, expresado en un cuadro, de un conjunto de datos que muestra las frecuencias absolu-
tas, relativas y porcentuales en cada una de varias clases que no se traslapan. La distribución de fre-
cuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta 𝒇𝒊 Frecuencia relativa 𝒉𝒊 Frecuencia porcentual 𝒑𝒊
𝑓#
Categoría 1 𝑓# ℎ# = 𝑝# = ℎ# × 100%
𝑛
𝑓$
Categoría 2 𝑓$ ℎ$ = 𝑝$ = ℎ$ × 100%
𝑛
⋮ ⋮ ⋮ ⋮

𝑓%
Categoría 𝑘 𝑓% ℎ% = 𝑝% = ℎ% × 100%
𝑛
Total 𝒏 1,00 100%
Fuente:

Título de una tabla de distribución de frecuencias

De acuerdo con el INEI, para los títulos seguiremos el siguiente esquema:

Distribución de <unidades elementales> según <variable>


Estadística Descriptiva 2022 01 22

Distribución de frecuencias de variables cualitativas

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta 𝑓! Frecuencia relativa ℎ! Frecuencia porcentual 𝑝!
𝑓#
Categoría 1 𝑓# ℎ# = 𝑝# = ℎ# × 100%
𝑛
𝑓$
Categoría 2 𝑓$ ℎ$ = 𝑝$ = ℎ$ × 100%
𝑛
⋮ ⋮ ⋮ ⋮
𝑓%
Categoría 𝑘 𝑓% ℎ% = 𝑝% = ℎ% × 100%
𝑛
Total 𝒏 1,00 100%

Fuente: …………………………

Ejemplo 9

La Defensoría del Pueblo presentó el Reporte de Conflictos Sociales N° 213, correspondiente al mes de
noviembre de 2021, el cual da cuenta de 97 conflictos sociales activos.

Distribución de conflictos sociales activos en el Perú según actividad, noviembre 2021


Estadística Descriptiva 2022 01 23
Ejercicios

20. En enero del presente año se entrevistó a una muestra de 400 alumnos de pregrado de la univer-
sidad A y se obtuvo la siguiente información referente al plato peruano preferido.
Complete lo faltante.

Imagen tomada de https://sthephanierv.wordpress.com/2016/11/08/la-gastronomia-peruana-a-los-ojos-del-mundo/

Distribución de alumnos según plato peruano preferido


Plato peruano preferido Cantidad de alumnos Porcentaje de alumnos
Ají de gallina (pollo) 123 30,75%
Lomo saltado 115 28,75%
Ceviche 78 19,50%
Pollo a la brasa 45 11,25%
Causa 27 6,75%
Otro 12 3,00%
Total 400 100,00%
Fuente: Universidad A

21. La empresa DGS va a contratar más personal si el porcentaje de trabajos de la zona Norte supera
al 40%. Organice la siguiente información y proponga la decisión. ¿Se contratará más personal?

Norte Norte Este Este Este Este Este Norte Este Sur Sur Norte Norte Norte Este
Este Sur Sur Norte Sur Sur Este Sur Sur Norte Norte Norte Sur Norte Sur
Norte Este Sur Sur Norte Norte Norte Este Norte Sur Sur Este Sur Este Sur

Interpretración
Determinar si se va a contratar a más personal.

Representación
Vamos a hacer una distribución de frecuencias de la variable <zona>.
Estadística Descriptiva 2022 01 24
Cálculo
Distribución de trabajos según zona
Zona Frecuencia absoluta Frecuencia porcentual
Este 13 28.89%
Norte 16 35.56%
Sur 16 35.56%
Total 45 100.00%
Fuente: Empresa DGS

Análisis y argumentación
El porcentaje de trabajos de la zona Norte es 35,56%, que no supera al 40%. Por lo tanto, no se va
a contratar a más personal.

22. En los Censos Nacionales 2017 ejecutados por el INEI se preguntó a todos los peruanos el idioma
o lengua con el que aprendió hablar, obteniéndose los siguientes resultados. Complete lo faltante.

Perú. Distribución de peruanos según idioma o lengua con el que aprendió hablar
Idioma o lengua con que aprendió a hablar Casos Porcentaje Porcentaje acumulado
Castellano 23 178 478
Quechua 3 799 780
Aimara 450 010 1,61% 98,15%
Ashaninka 73 567 0,26% 98,41%
Lengua de señas peruanas 10 447 0,04% 98,45%
Otra lengua extranjera 49 876 0,18% 98,63%
Otra lengua nativa u originaria 179 601 0,64% 99,27%
No sabe / No responde 204 301 0,73% 100,00%
Total 27 946 060 100,00% 100.00%
Fuente INEI. Censos Nacionales 2017

23. El objetivo de una investigación es estimar el porcentaje de peruanos que aprueban la gestión de
del presidente de la República, para lo cual se tomó una muestra aleatoria de personas de 18 a 70
años y se les preguntó por su opinión. Los resultados son los siguientes.

Desaprueba Aprueba Desaprueba Aprueba Desaprueba Desaprueba Desaprueba


No sabe Aprueba Aprueba Desaprueba Aprueba Aprueba Aprueba
Desaprueba Desaprueba Aprueba Aprueba Desaprueba No sabe Desaprueba
Aprueba Desaprueba Aprueba Aprueba Desaprueba Desaprueba Aprueba
Desaprueba Desaprueba Desaprueba Desaprueba Aprueba Desaprueba Desaprueba
Aprueba No sabe Desaprueba Desaprueba Aprueba Desaprueba No sabe
Aprueba Desaprueba Desaprueba Desaprueba Aprueba Aprueba Desaprueba
Desaprueba Desaprueba Desaprueba Aprueba Aprueba Desaprueba Desaprueba
Aprueba Desaprueba No sabe Aprueba Desaprueba Desaprueba Aprueba
Aprueba Aprueba Aprueba Desaprueba Desaprueba Desaprueba Desaprueba
Construya la distribución de frecuencias de los datos. Interprete los valores 𝑓$ y ℎ# .
Estadística Descriptiva 2022 01 25

Gráficos estadísticos
• El método gráfico es una forma de simplificar lo tedioso y lo complejo.
• Las personas ocupadas necesitan ayuda visual.
• Un gráfico es más accesible que una tabla.
• El método gráfico ayuda al cerebro, ya que permite entender y memorizar mejor.

Ejemplo 10
Instagram es una aplicación de redes sociales que se enfoca en compartir fotos y videos. Es propiedad
de Facebook, que recientemente se renombró como Meta. A partir de diciembre de 2021, Instagram
alcanzó un nuevo hito de 2 mil millones de usuarios activos en todo el mundo. Los usuarios de 25 a 34
años constituían el mayor grupo de usuarios de Instagram por edad en todo el mundo, seguidos por
los de 18 a 24 años. Los hombres son el 51,6% de los usuarios de Instagram.

Distribución de usuarios activos de Instagram desde enero de 2013 hasta diciembre de 2021

Tomado de https://www.statista.com/statistics/253577/number-of-monthly-active-instagram-users/
Estadística Descriptiva 2022 01 26
Gráfico de barras
Es una forma de representar datos cualitativos resumidos en una distribución de frecuencias.
En uno de los ejes, se representan las categorías o clases de la variable; para el otro eje, se puede usar
una escala de frecuencias absolutas, relativas o porcentuales. Se traza una barra sobre cada indicador
de clase de una altura proporcional a la frecuencia correspondiente. Las barras deben estar separadas
para enfatizar el hecho de que cada clase es diferente de otra.

Ejemplo 11
Pronto encabezó la clasificación de revistas femeninas en España al registrar cerca de dos millones de
lectoras durante 2021. Hola y Vogue ocuparon la segunda y la tercera posición.

Distribución de lectores de revistas femeninas en España, en miles, según revista preferida

Tomado de https://es.statista.com/estadisticas/491628/revistas-femeninas-las-mas-leidas-en-espana/

Ejemplo 12
Según el Instituto Internacional de Investigación para la Paz de Estocolmo, Estados Unidos sigue siendo
el mayor exportador de armas, responsable del 38,6 % de las ventas internacionales de armas entre
2017 y 2021. Suministró armas a más de 100 países.
Distribución de armas exportadas del 2017 a 2021 según país de origen

Tomado de https://www.statista.com/chart/18417/global-weapons-exports/
Estadística Descriptiva 2022 01 27
Diagrama circular

Cada sector circular representa la frecuencia observada de una clase o categoría. El sector circular que
representa a una determinada clase de la variable tiene un ángulo en el centro proporcional a la fre-
cuencia relativa de dicha clase. El ángulo que le corresponde a cada clase se obtiene multiplicando
360º por la respectiva frecuencia relativa.

Ejemplo 13

Según el II Informe Bienal sobre la Realidad Universitaria en el Perú publicado por la Superintendencia
Nacional de Educación Superior Universitaria en el año 2020, observamos que no hay gran diferencia
entre la matrícula universitaria entre hombres (48,9%) y mujeres (51,1%). Además, que dentro de las
ciencias sociales (52,8% del total), las ciencias administrativas son las que cuentan con más alumnos
(54,9%).

Distribución de alumnos de pregrado matriculados en el Perú según sexo

Distribución de alumnos de pregrado matriculados en el Perú según área del conocimiento


Estadística Descriptiva 2022 01 28
Según el mismo informe, observamos que el 45,7% de los investigadores registrados en el Registro
Nacional de Ciencia, Tecnología y de Innovación Tecnológica trabajan principalmente en universidades
públicas.

Distribución de investigadores universitarios registrados en el Renacyt


según tipo de gestión de la universidad donde investigan

Ejemplo 14

La Defensoría del Pueblo presentó el Reporte de Conflictos Sociales N° 213, correspondiente al mes de
noviembre de 2021, el cual da cuenta -entre otros aspectos- de 199 conflictos sociales registrados.

Distribución de conflictos sociales en el Perú según actividad, noviembre 2021


Estadística Descriptiva 2022 01 29
Ejercicios

24. América Noticias realizó Feminicidios 2019, un proyecto digital que busca registrar el número de
mujeres asesinadas en el Perú; de lo publicado por este proyecto se tiene los siguientes gráficos.
Póngales título.
Solución
Distribución de femicidios según lugar de ocurrencia
Hotel/hostal Casa de familiar Centro de labores
5.7% 2.9% de la víctima
Casa de agresor 1.4%
6.4% Otros
29.3%

Casa de ambos
7.9%

Lugar desolado
9.3%

Calle-vía pública
12.1% Casa de la víctima
25.0%
Fuente: Feminicidios 2019

Distribución de femicidios según situación legal del feminicida


70 66

60
Número de feminicidas

50

40
28
30 25

20
11 10
10

0
Detenido sin Prófugo Libre en Cometió suicidio Otros
sentencia investigación
Fuente: Feminicidios 2019 Situación legal del feminicida
América Noticias

25. Se tiene como objetivo mostrar la composición porcentual de alumnos universitarios en el Perú
por tipo de institución educativa al final de la secundaria, para lo cual se tomó como referencia los
datos del II Censo Universitario 2010 realizado por el INEI, donde se preguntó a los alumnos
universitarios por el tipo de institución educativa donde terminaron su educación secundaria. Los
resultados se muestran en la siguiente tabla.

Título:
Estadística Descriptiva 2022 01 30
Tipo de institución fi hi
Estatal 256 060 0,5405
Particular 154 275 0,3256
Particular religioso 58 673 0,1238
No escolarizado 4 472 0,0094
Otro 309 0,0007
Total 473 789
Fuente:
Realice un diagrama circular con dichos datos.
Rpta:
Distribución de estudiantes de pregrado según institución donde
terminaron la secundaria
No escolarizado Otro
0.94% 0.07%
Particular religioso
12.38%

Estatal
54.05%
Particular
32.56%

Fuente: II Censo Universitario 2010 INEI Perú

26. El Banco Europeo de Inversiones publicó el 15 de marzo del 2021 la tercera edición de la encuesta
sobre el clima 2020-2021, que analiza las expectativas de los ciudadanos respecto a las políticas
de lucha contra el cambio climático. Ponga título al gráfico circular.
Estadística Descriptiva 2022 01 31
Frecuencias acumuladas, absolutas relativas y porcentuales

Frecuencia absoluta acumulada de una clase

Es la suma de la frecuencia absoluta de un valor determinado de la variable con las frecuencias abso-
lutas de los valores menores de la variable. Se denota por 𝐹! .

La frecuencia absoluta acumulada del último valor de la variable es igual al total de casos.

Frecuencia relativa acumulada de una clase

Es la suma de la frecuencia relativa de un valor determinado de la variable con las frecuencias relativas
de los valores menores de la variable. Se denota por 𝐻! .

La frecuencia relativa acumulada del valor más alto de la variable es igual a 1.

Frecuencia porcentual acumulada de una clase

Es la suma de la frecuencia porcentual de un valor determinado de la variable con las frecuencias por-
centuales de los valores menores de la variable. Se denota por 𝑃! .

La frecuencia porcentual acumulada del valor más alto de la variable es igual a 100%.

Distribución de <unidades elementales> según <variable>


Frecuencia porcentual
Variable Frecuencia absoluta 𝒇𝒊 Frecuencia porcentual 𝒑𝒊
acumulada 𝑷𝒊
𝑓#
Categoría 1 𝑓# 𝑝# = × 100% 𝑃#
𝑛
𝑓$
Categoría 2 𝑓$ 𝑝$ = × 100% 𝑃$ = 𝑝# + 𝑃#
𝑛

⋮ ⋮ ⋮ ⋮

𝑓%
Categoría 𝑘 𝑓% 𝑝% = × 100% 100%
𝑛

Total 𝒏 100%

Fuente:
Estadística Descriptiva 2022 01 32
Diagrama de Pareto

El diagrama de Pareto es una representación gráfica que permite identificar y seleccionar los aspectos
prioritarios que hay que tratar en un determinado problema.

También se conoce como diagrama ABC o Ley de las prioridades 80 - 20, que dice: “el 80% de los
problemas que ocurren en cualquier actividad son ocasionados por el 20% de los elementos que inter-
vienen en producirlos” (pocos vitales, muchos triviales).

Según este concepto se tiene un problema con muchas causas, podemos decir que el 20% de las causas
resuelven el 80 % del problema. Por ejemplo, en control de calidad, se puede mostrar que la mayoría
de los defectos surgen de un número pequeño de causas.

Pasos para la elaboración del diagrama de Pareto

Los pasos para la elaboración del diagrama de Pareto son los siguientes:

1. Construya una tabla de distribución de frecuencias ordenando las categorías en forma descen-
dente respecto a la frecuencia.

• La categoría Otros se coloca al final, no importa cuán grande sea, pues está compuesta por
categorías cuyas frecuencias son menores al valor de la variable con frecuencia más pequeña
listada individualmente.
• Agregue a la tabla de distribución de frecuencias una columna para la frecuencia acumulada.

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta 𝒇𝒊 Frecuencia porcentual 𝒑𝒊 Frecuencia porcentual 𝑷𝒊
Categoría 1 𝑓" 𝑝" 𝑃"
Categoría 2 𝑓# 𝑝# 𝑃#
⋮ ⋮ ⋮ ⋮
Otros 𝑓$ 𝑝$ 𝑃$
Total 𝒏 100% 100%
Fuente:

2. Dibuje los ejes verticales y horizontal, título, rótulos de los ejes y fuente.

• Dibuje un eje vertical izquierdo, un eje vertical derecho y uno horizontal.


• En el eje vertical izquierdo, ponga alguna de las frecuencias simples (𝑓! , ℎ! o 𝑝! ).
• Si usa la frecuencia absoluta 𝑓! , marque una escala de 0 a 𝑛.
• Si usa la frecuencia relativa ℎ! , marque una escala de 0 a 1.
• Si usa la frecuencia absoluta 𝑝! , marque una escala de 0% a 100%.
• En el eje vertical derecho, use alguna de las frecuencias acumuladas (𝐹! , 𝐻! o 𝑃! = 𝐻! %). Se
recomienda usar la frecuencia porcentual acumulada; en ese caso, marque una escala de 0%
a 100%.
Estadística Descriptiva 2022 01 33
• En el eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una de
las categorías incluida la categoría Otros.

Distribución de unidades elementales según variable

Frecuencia acumulada porcentual


100%

Frecuencia simple 75%

50%

25%

Categoría 1 Categoría 2 Categoría 3 Otros

Variable
Fuente:

3. Grafique el diagrama de barras.


Distribución de unidades elementales según variable

Frecuencia acumulada porcentual


100%
Frecuencia simple

75%

50%

25%

Categoría 1 Categoría 2 Categoría 3 Otros

Variable
Fuente:

4. Dibuje la línea de frecuencias acumuladas (curva de Pareto). Indique las etiquetas de datos de las
frecuencias simples y de las frecuencias acumuladas.

Distribución de unidades elementales según variable

100%
Frecuencia acumulada porcentual

100% 𝟏𝟎𝟎%
𝑃) 𝐏𝟑
Frecuencia simple

𝑃$ 75%
𝑃# 𝐏𝟐
𝐏𝟏
50%

25%

Categoría 1 Categoría 2 Categoría 3 Otros

Variable
Fuente:
Estadística Descriptiva 2022 01 34
Ejemplo 15

El gerente de producción de una empresa, que produce asientos de fibra de vidrio, quiere identificar
los problemas más frecuentes reportados en la fabricación de este producto, y planear soluciones de
acuerdo con la recurrencia del problema.

Al extraer una muestra aleatoria de productos fallados, obtuvo los siguientes resultados:

Distribución de productos según problemas reportados en los asientos de fibra de vidrio


Tipo de problema reportado Número de ocurrencias 𝒇𝒊
Color inadecuado 28
Forma no simétrica 16
Medidas fuera de norma 50
Superficie rugosa 71
Bordes afilados 9
Desprendimiento de capa protectora 12
Otros 14
Fuente: Gerencia de Producción

Elabore el diagrama de Pareto.

Solución

Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categoría Otros va al final.

Luego, se calcula las frecuencias relativas y las relativas acumuladas.

Distribución de productos según problemas reportados de asientos de fibra de vidrio


Tipo de problema reportado fi hi Fi Hi
Superficie rugosa 71 0,355 71 0,355
Medidas fuera de norma 50 0,250 121 0,605
Color inadecuado 28 0,140 149 0,745
Forma no simétrica 16 0,080 165 0,825
Desprendimiento de capa protectora 12 0,060 177 0,885
Bordes afilados 9 0,045 186 0,930
Otros 14 0,070 200 1,000
Fuente: Gerencia de Producción
Estadística Descriptiva 2022 01 35

También se puede realizar el gráfico de Pareto usando las frecuencias relativas hi y las frecuencias
relativas acumuladas Hi.

Distribución de productos según problemas reportados de asientos de fibra de vidrio


Estadística Descriptiva 2022 01 36
Ejercicios

27. El gerente financiero del Banco JJF realizó un estudio sobre los principales problemas que declara-
ron los clientes que poseen la tarjeta de crédito TravelMax. Si se quiere identificar los problemas
más importantes que deben resolverse para solucionar el 70% de la problemática. ¿Usted que le
recomendaría a gerente financiero?

Distribución de … según …
Principal problema fi Fi hi Hi
Poca información sobre beneficios 77 77 35,00% 35,00%
Alto costo de membresía 46 123 20,91% 55,91%
Pocos puntos TravelMax por compras 31 154 14,09% 70,00%
Pocos destinos para elegir 24 178 10,91% 80,91%
Altos intereses 19 197 8,64% 89,55%
Otros 23 220 10,45% 100,00%
Total 220 100,00%
Fuente: Banco JJF

Interpretación
Identificar los problemas más importantes que deben resolverse para solucionar el 70% de la pro-
blemática.

Representación
Vamos a realizar un gráfico de Pareto de la variable <principal problema>.

Cálculo

Distribución de clientes que poseen la tarjeta de crédito TravelMax según principal problema
Principal problema fi Fi hi Hi
Poca información sobre beneficios 77 77 35,00% 35,00%
Alto costo de membresía 46 123 20,91% 55,91%
Pocos puntos TravelMax por compras 31 154 14,09% 70,00%
Pocos destinos para elegir 24 178 10,91% 80,91%
Altos intereses 19 197 8,64% 89,55%
Otros 23 220 10,45% 100,00%
Total 220 100,00%
Fuente: Banco JJF
Estadística Descriptiva 2022 01 37

Análisis y argumentación
Los problemas más importantes que deben resolverse para solucionar el 70% de la problemática
son poca información sobre beneficios, alto costo de la membresía y pocos puntos Travel por com-
pras.

28. La siguiente tabla fue desarrollada con información de los Censos Nacionales 2017. Se quiere rea-
lizar un comentario a partir de un gráfico que muestre que en pocos tipos de materiales de cons-
trucción en las paredes se concentra la mayor cantidad de viviendas.

Distribución de ……… según …………


Material de construcción predominante en las paredes Casos Porcentaje Porcentaje acumulado
Ladrillo o bloque de cemento 4 298 274 55,83% 55,83%
Adobe 1 791 829 23,27% 79,10%
Madera (pona, tornillo etc.) 727 778 9,45% 88,56%
Tapia 356 665 4,63% 93,19%
Triplay / calamina / estera 239 012 3,10% 96,29%
Otro material 285 342 3,71% 100,00%
Total 7 698 900 100,00% 100,00%
Fuente: Censos Nacionales 2017 INEI

Solución

La unidad elemental es …

La variable en estudio es …

El gráfico más adecuado es …


Estadística Descriptiva 2022 01 38

Distribución de viviendas según material de construcción predominante en las paredes


100%
7 000 000 90%

Porcentaje acumulado de viviendas


6 000 000 80%
Número de viviendas

70%
5 000 000
60%
4 000 000 50%

3 000 000 40%

30%
2 000 000
20%
1 000 000
10%

0 0%
Ladrillo o bloque Adobe Madera (pona, Tapia Triplay / calamina Otro material
de cemento tornillo etc.) / estera

Fuente: Censos Nacionales 2017. INEI Material predominante en las paredes

29. En la agencia de viajes A se realizó una encuesta a 330 clientes respecto a las principales quejas
que tienen clientes acerca de los tours del tipo todo incluido al exterior. Las cuales se detallan en
el siguiente cuadro.
Distribución de clientes según principales quejas de clientes
Principal queja Frecuencia absoluta
Cambio de fecha de los vuelos 120
El hotel no era de la categoría que se veía en el folleto 94
Los hoteles no incluyen bebidas premium 61
La comida de los hoteles no es de calidad excelente 23
Otros 25
Que les venden otros servicios como tiempo compartido 7
Fuente: Dirección de Atención al cliente. Agencia A

Realice el diagrama de Pareto correspondiente a estos datos.

30. Objetivo: Identificar las principales quejas de los pasajeros sobre el servicio que brinda la aerolí-
nea. Teniendo en cuenta la siguiente información, elabore el diagrama de Pareto.

Distribución de pasajeros según principal queja del servicio de la aerolínea Wayra


Principal queja Número de pasajeros pi Fi Pi
Mucho tiempo en cola en el counter 124
La comida no es buena 59
Impuntualidad de los vuelos 25
Pocos vuelos 16
Tarifas muy caras 9
Otros 17
Fuente: Wayra S.A 𝑛 = 250
Estadística Descriptiva 2022 01 39
Estadística Descriptiva 2022 01 40

Tabulaciones cruzadas
También llamadas tablas de contingencia o de doble entrada. Se usan para resumir de manera simul-
tánea los datos para dos variables.

Título de una tabla cruzada o gráfico de una tabla de contingencia


Siguiendo indicaciones del INEI, en este curso, usaremos el siguiente esquema.

Si el gráfico presenta las frecuencias absolutas o las frecuencias porcentuales con respecto al total, el
título será:

Distribución de <unidades elementales> según <variable 1> y <variable 2>

Si el gráfico presenta las frecuencias porcentuales con respecto a la variable 2, el título será:

Distribución de <unidades elementales> según <variable 1> por <variable 2>

Ejemplo 16
Según el II Informe Bienal sobre la Realidad Universitaria en el Perú publicado por la SUNEDU en el año
2020, observamos que sí hay gran diferencia entre la cantidad de autoridades universitarias entre
hombres y mujeres en todos los tipos de gestión.

Incluye cuatro categorías —titulares, adjuntas, encargadas y accesitarias— para 142 universidades. Los
cargos son rector y vicerrector o decano; y, en una proporción importante de las universidades priva-
das, cargos equiparables como presidente, gerente general o director.

Distribución de autoridades universitarias según sexo y tipo de gestión


Tipo de gestión Mujer Hombre Total
Pública 126 467 593
Privada asociativa 108 330 438
Privada societaria 93 250 343
Total 327 1047 1374
Fuente: Sunedu, 2019

Distribución de autoridades universitarias según sexo y tipo de gestión


Tipo de gestión Mujer Hombre Total
Pública 9.17% 33.99% 43.16%
Privada asociativa 7.86% 24.02% 31.88%
Privada societaria 6.77% 18.20% 24.96%
Total 23.80% 76.20% 100.00%
Fuente: Sunedu, 2019
Estadística Descriptiva 2022 01 41
Distribución de autoridades universitarias según sexo por tipo de gestión
Tipo de gestión Mujer Hombre Total
Pública 21.25% 78.75% 100%
Privada asociativa 24.66% 75.34% 100%
Privada societaria 27.11% 72.89% 100%
Total 23.80% 76.20% 100%
Fuente: Sunedu, 2019

Distribución de autoridades universitarias según tipo de gestión por sexo


Tipo de gestión Mujer Hombre Total
Pública 38.53% 44.60% 43.16%
Privada asociativa 33.03% 31.52% 31.88%
Privada societaria 28.44% 23.88% 24.96%
Total 100.00% 100.00% 100.00%
Fuente: Sunedu, 2019
Estadística Descriptiva 2022 01 42
Ejercicios

31. En los Censos Nacionales 2017 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a las peruanas por la cantidad de hijos que han tenido vivos, obteniéndose los siguientes
resultados.

Perú. Distribución de mujeres según edad de la mujer y número de hijos nacidos vivos
Número total de hijos/a que ha tenido nacidos vivos
Edad en años 0 hijos 1 hijo 2 hijos 3 hijos 4 hijos 5 hijos 6 hijos Total
12 años 268 402 140 268 542
13 años 256 100 2038 258 138
14 años 244 718 2811 24 247 553
15 años 233 809 4933 115 238 857
16 años 226 478 9181 400 44 236 103
17 años 222 861 18841 1318 107 243 127
18 años 213 602 32381 3590 340 77 249 990
19 años 186 065 43147 6807 731 132 236 882
20 años 179 260 57 564 12017 1555 236 90 29 250 751
Total 2 031 295 171 036 24 271 2777 445 90 29 2 229 943
Fuente: INEI – Censos Nacionales 2017

a. Calcule el número de menores de edad con hijos.

El número de menores de edad con hijos es 39952.

Número total de hijos/a que ha tenido nacidos vivos


Edad en años 0 hijos 1 hijo 2 hijos 3 hijos 4 hijos 5 hijos 6 hijos Total
12 años 140
13 años 2038
14 años 2811 24
15 años 4933 115
16 años 9181 400 44
17 años 18841 1318 107

b. Calcule el porcentaje de mujeres de 19 años que han tenido hijos.

El porcentaje de mujeres de 19 años que han tenido hijos 21,45% (50817/236882 x 100%).

Número total de hijos/a que ha tenido nacidos vivos


Edad en años 0 hijos 1 hijo 2 hijos 3 hijos 4 hijos 5 hijos 6 hijos Total
19 años 186 065 43147 6807 731 132 236 882

32. A continuación, se presenta el resumen de datos de 250 clientes morosos del banco JMF en julio
del 2020. El gerente del banco JMF elegirá una sede (Lima o Arequipa) para iniciar una campaña
de facilidades de pago. El criterio será el siguiente: se iniciará la campaña de facilidades de pago
en la sede donde sea mayor el porcentaje de clientes de la categoría estándar. Indique la sede en
la que se iniciará dicha campaña.
Estadística Descriptiva 2022 01 43

Distribución de clientes morosos según categoría y sede


Sede
Categoría Total
Lima Arequipa
Estándar 80 50 130
Silver 50 20 70
Gold 40 10 50
Total 170 80 250
Fuente: Banco JMF
Estadística Descriptiva 2022 01 44
Gráfico de tabulaciones cruzadas de dos variables

Distribución de <elementos> Distribución de <elementos>


según según
<variable 1> y <variable 2> <variable 1> por <variable 2>
100%
Variable 2

Variable 2

Variable 1

Variable 1
Variable 1 Variable 1 Variable 2 Variable 2

Todas las frecuencias juntas En cada grupo o columna, las


suman n o 100% frecuencias suman 100%
Barras Barras Barras Barras
agrupadas apiladas agrupadas apiladas al
al 100% 100%

Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El alto
de cada barra es proporcional a la frecuencia de cada categoría.

Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada categoría.
El alto de cada barra es proporcional a la frecuencia de cada categoría.

Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada ca-
tegoría. El alto de cada barra es el mismo para cada categoría.

Ejemplo 17
Según el II Informe Bienal sobre la Realidad Universitaria en el Perú publicado por la SUNEDU en el año
2020, observamos que sí hay gran diferencia entre la matrícula universitaria entre hombres y mujeres
por área de conocimiento.

Distribución de alumnos de pregrado en el Perú según sexo por área del conocimiento
Estadística Descriptiva 2022 01 45
Ejercicios

33. En total, las descargas de aplicaciones en todo el mundo alcanzaron los 36100 millones en el cuarto
trimestre del año 2021. Las aplicaciones de inversión y criptomonedas ganaron impulso con los
tokens no fungibles (NFT) que surgieron como una tendencia al alza. Ponga título a este gráfico.

Distribución de descargas de aplicaciones según app y plataforma de descarga

https://sensortower.com/blog/q4-2021-data-digest/
Porque se muestran las frecuencias absolutas.

34. Según un estudio realizado por la organización Women’s Media Center, de los 205 nominados en
2022 en las categorías no actorales, solo 55 (el 27%) son mujeres, mientras que 150 (el 73%) son
hombres. Se trata de la tasa más baja de representación femenina en las categorías no condicio-
nadas por el género analizadas en tres años. Ponga título al siguiente gráfico.

Distribución de nominados al Oscar 2022 según categoría no actoral y sexo

Tomado de https://es.statista.com/grafico/27119/hombres-y-mujeres-nominados-a-los-premios-oscar-en-categorias-no-actorales-seleccionadas/

Porque se muestran las frecuencias absolutas.


Estadística Descriptiva 2022 01 46
35. El CDC predice que la variante BA.2 de Covid-19, será la dominante en los Estados Unidos en el
primer trimestre del año 2022. Los datos muestran que la variante, que está relacionada con las
variedades de covid-19 que se conocieron como Omicron (BA.1.1), fue responsable de alrededor
del 35% de los casos en el país hasta el 19 de marzo de 2022. Ponga título al siguiente gráfico.

Distribución de contagiados según variante por semana

36. En los Censos Nacionales de Población y Vivienda 2007 y 2017, se preguntó a los peruanos por la
región natural donde residían. Ponga título al siguiente gráfico.

Distribución de residentes en el Perú según región natural donde reside por año

37. A fin de conocer hacia dónde se dirigen los limeños durante el día, El Comercio accedió a un estudio
de la Autoridad Autónoma del Tren Eléctrico (AATE), que empleó la tecnología Big Data –movi-
miento del GPS de los celulares de forma anónima– que esta institución adscrita al Ministerio de
Transporte y Comunicaciones usa para planificar el futuro del transporte público integrado. Ponga
título al siguiente gráfico.
Estadística Descriptiva 2022 01 47

38. En el II Censo Nacional Universitario del año 2010 realizado por el INEI se preguntó a los alumnos
del Perú por su tipo de universidad y su género. Los datos se muestran en el siguiente cuadro.

Perú. Distribución de alumnos de pregrado por género y tipo de universidad. 2010


Sexo Pública Privada Total
Mujer 135 082 247 743 382 825
Hombre 174 093 226 052 400 145
Total 309 175 473 795 782 970
Fuente: INEI. II Censo Universitario. 2010.

a. Interprete el valor “135 082” de la tabla.


b. Elabore un gráfico comparativo que permita ver la composición porcentual según sexo y tipo
de universidad.

c. Elabore un gráfico comparativo que permita ver la composición porcentual según sexo por tipo
de universidad.
Distribución de alumnos según género por tipo de
universidad
100%
90%
Porcentaje de alumnos

80%
56.31% 47.71%
70%
60%
50%
Hombre
40%
30% Mujer
52.29%
20% 43.69%
10%
0%
Pública Privada
Tipo de universidad
Fuente: INEI. II Censo Universitario 2010
Estadística Descriptiva 2022 01 48
d. Elabore un gráfico comparativo que permita ver la composición porcentual según tipo de uni-
versidad por sexo.
Rpta:
Estadística Descriptiva 2022 01 49

Resumen de datos cuantitativos


Distribución de frecuencias de variables discretas
Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la variable el
número de elementos (frecuencia) que la componen.

Si los datos son discretos y no hay mucha variabilidad se presentarán directamente cada valor de la
variable y sus respectivas frecuencias. El procedimiento más simple es listar los 𝑛 datos en forma as-
cendente y luego elaborar la tabla de distribución de frecuencias indicando para cada valor de la va-
riable su respectiva frecuencia con la que aparece en la serie.

Distribución de <unidades elementales> según <variable>


Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
Variable
absoluta 𝑓! relativa ℎ! acumulada 𝐹! acumulada 𝐻!
𝑓#
𝑥# 𝑓# ℎ# = 𝐹# = 𝑓# 𝐻# = ℎ#
𝑛
𝑓$
𝑥$ 𝑓$ ℎ$ = 𝐹$ = 𝑓$ + 𝐹# 𝐻$ = ℎ$ + 𝐻#
𝑛
⋮ ⋮ ⋮ ⋮ ⋮
𝑓%
𝑥% 𝑓% ℎ% = 𝑛 1,00
𝑛
Total 𝑛 1
Fuente:

Gráfico de bastones
En este caso, la variable se ubica en el eje de las abscisas y las frecuencias, absolutas, relativas o por-
centuales, en el eje ordenado.

Ejemplo 18

Distribución de alumnos de pregrado según número de veces


que postuló a la universidad donde estudia
700,000
576,215
600,000
Número de alumnos

500,000
400,000
300,000
200,000 119,642
58,315
100,000 18,748 9,908 81 32 22 7
0
0 1 2 3 4 5 6 7 8 9
Número de veces que postuló
Fuente: PERÚ, II Censo Nacional Universitario 2010. INEI
Estadística Descriptiva 2022 01 50
Ejercicios

39. Para Fiestas Patrias, la empresa Wayra está dispuesta a realizar una promoción, si el porcentaje de
pasajeros que haya realizado como mínimo cuatro viajes supera el 70%. Indique lo que hará la
empresa. Se cuenta con la siguiente información y se desea hacer un gráfico.

Distribución de pasajeros según número de viajes


Número de viajes Número de pasajeros pi Fi Pi
1 15 10% 15 10%
2 18 12% 33 22%
3 24 16% 57 38%
4 30 20% 87 58%
6 63 42% 150 100%
Fuente: Aerolínea Wayra

Interpretación
Determinar si se va a realizar una promoción.

Representación
La unidad elemental es un pasajero
La variable en estudio es número de viajes
Se hará el gráfico de bastones, pues la variable en estudio es discreta.

Cálculo

Análisis y argumentación
El porcentaje de pasajeros que haya realizado como mínimo cuatro viajes es 62% (20% + 42%),
que no supera el 70%. Por lo tanto, no se va a realizar una promoción.

40. Uno de los objetivos de una investigación en la empresa A es mostrar la composición porcentual
del número de cursos de capacitación dadas a sus trabajadores. Los siguientes datos muestran el
número de capacitaciones que 48 trabajadores han recibido en el presente año.
Estadística Descriptiva 2022 01 51
3 3 1 2 1 1 2 2 1 6 3 1 3 1 3 2 3 2 2 3 2 2 1 1
1 1 1 1 3 2 2 4 1 2 2 2 1 3 1 2 1 2 2 2 2 1 6 2

Construya el gráfico de frecuencias porcentuales para la variable “número de capacitaciones”.


Estadística Descriptiva 2022 01 52
Distribución de frecuencias de variables continuas

Es un resumen de un conjunto de datos que consiste en presentar para cada categoría el número de
elementos (frecuencia) que la componen. Los datos se agrupan de intervalo (también llamados clases,
categorías o grupos).

Pasos para construir la tabla de frecuencias

Para agrupar 𝑛 datos de una muestra, los pasos son los siguientes:

a. Determine el rango (𝑟)


𝑟 = 𝑋𝑚á𝑥 – 𝑋𝑚í𝑛

donde:
𝑋𝑚á𝑥 es el dato de mayor valor
𝑋𝑚í𝑛 es el dato de menor valor

b. Determine el número de intervalos (𝑘) usando la regla de Sturges:

𝑘 = 1 + 3,322 𝑙𝑜𝑔(𝑛)

El número de intervalos 𝑘 es siempre un número entero. Si la estimación tiene decimales, se toma


el entero más próximo.

c. Calcule el ancho o amplitud de intervalo (𝑤).

𝑟
𝑤=
𝑘

La amplitud 𝑤 se redondea al número inmediato superior de acuerdo con la cantidad de decimales


que tienen los datos o según la precisión con que se desea trabajar.

Por ejemplo:
𝒓 𝒘
Si los datos tienen 𝒘=
𝒌 (redondeo por exceso)
cero decimales 𝑤 = 50,2381 𝑤 = 51
una cifra decimal 𝑤 = 50,2381 𝑤 = 50,3
dos cifras decimales 𝑤 = 50,2381 𝑤 = 50,24
tres cifras decimales 𝑤 = 50,2381 𝑤 = 50,239
dos cifras decimales 𝑤 = 0,38000 𝑤 = 0,38
dos cifras decimales 𝑤 = 0,38001 𝑤 = 0,39
cero decimales 𝑤 = 0,38001 𝑤 = 1,0
Estadística Descriptiva 2022 01 53
d. Determine los límites de cada intervalo.

• Partiendo del dato de menor valor, es decir el límite inferior del primer intervalo, 𝐿!# se deter-
mina cada uno de los límites de intervalos sumando la amplitud de clase a cada valor obtenido.
• Si los datos son cuantitativos continuos, el límite superior 𝐿* de un intervalo es el límite inferior
𝐿! del siguiente intervalo. El intervalo es abierto en el límite inferior y cerrado en el límite su-
perior, con excepción en el primer intervalo en el que los dos límites son cerrados.

e. Calcule la marca de clase N𝑥%´ O. La marca de clase es el punto medio de cada clase. Se calcula como
la semisuma de los límites de cada clase. Representa a todos los datos que están contenidos en
dicha clase.

Límite inferior + Límite superior 𝐿!% + 𝐿*%


𝑥%´ = =
2 2

f. Construya la tabla de distribución de frecuencias realizando la agrupación y conteo de los datos


según la clase a la que corresponda.

Distribución de <unidades elementales> según <variable>


Frecuencia Frecuencia Frecuencia abso- Frecuencia rela-
Intervalos Marca de clase
absoluta luta acumulada tiva acumulada
(clases) 𝑥!´ relativa ℎ!
𝑓! 𝐹! 𝐻!
𝐿!# + 𝐿*# 𝑓#
[𝐿!# − 𝐿*# ] 𝑥#´ = 𝑓# ℎ# = 𝐹# = 𝑓# 𝐻# = ℎ#
2 𝑛
𝐿!$ + 𝐿*$ 𝑓$
]𝐿!$ − 𝐿*$ ] 𝑥$´ = 𝑓$ ℎ$ = 𝐹$ = 𝑓$ + 𝐹# 𝐻$ = ℎ$ + 𝐻#
2 𝑛
⋮ ⋮ ⋮ ⋮ ⋮ ⋮

𝐿!% + 𝐿*% 𝑓%
]𝐿!% − 𝐿*% ] 𝑥%´ = 𝑓% ℎ% = 𝑛 1,00
2 𝑛
Total 𝒏 1
Fuente:
Estadística Descriptiva 2022 01 54
Ejemplo 19
El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. La tabla muestra los pagos de impuestos, en soles, en el 2020 de 48
viviendas elegidas al azar.

145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1

Elabore la tabla de frecuencias para la variable: pago por impuestos municipales año 2020.
Solución
El rango 𝑟 se calcula con:

𝑟 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 = 351,1 − 145, 1 = 206

Siguiendo la regla de Sturges, el número de intervalos es:

𝑘 = 1 + 3,322 𝑙𝑜𝑔#, 𝑛 = 1 + 3,322 𝑙𝑜𝑔#, (48) = 6,585

El número de intervalos 𝑘 es un valor entero y se usa el redondeo simple. En este caso, 𝑘 = 7.

La amplitud del intervalo 𝑤 se calcula de la siguiente manera:

𝑟 206
𝑤= = = 29,429 ≈ 29,5
𝑘 7

El valor de la amplitud del intervalo 𝑤 se va a redondear por exceso. En este caso se redondea a un
decimal, pues los datos tienen un decimal.

Distribución de frecuencias del pago de impuestos municipales del año 2020


Pago de impuestos Marca de clase fi hi Fi Hi
[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1 ; 351,6] 336,85 6 0,1250 48 1,0000
Total 48 1,0000
Fuente: Oficina de Rentas de la Municipalidad
Estadística Descriptiva 2022 01 55
Ejercicios

41. Se seleccionó una muestra de clientes que compró papas nativas en una feria de productos agra-
rios. Construya la distribución de frecuencias.

Pesos de papas nativas, en kilogramos, que clientes compraron en una visita a una feria
1,0 1,4 1,5 1,9 2,2 2,3 2,5 2,8 2,8 2,8 3,0 3,2 3,2 3,3 3,3 3,3 3,3
3,3 3,4 3,6 3,7 3,9 4,0 4,1 4,2 4,3 4,4 4,4 4,5 4,5 4,5 4,6 4,6 4,6
4,6 4,6 4,8 4,9 5,0 5,0 5,1 5,3 5,4 5,4 5,4 5,5 5,5 5,5 5,6 5,7 5,7
5,7 5,7 5,7 5,7 5,8 5,8 5,9 6,0 6,0 6,0 6,2 6,3 6,5 7,0 7,5 7,5 7,8

El rango 𝑟 se calcula con:

𝑟 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 = 7,8 − 1, 0 = 6,8

Siguiendo la regla de Sturges, el número de intervalos es:

𝑘 = 1 + 3,322 𝑙𝑜𝑔#, 𝑛 = 1 + 3,322 𝑙𝑜𝑔#, (68) = 7,09

El número de intervalos 𝑘 es un valor entero y se usa el redondeo simple. En este caso, 𝑘 = 7.

La amplitud del intervalo 𝑤 se calcula de la siguiente manera:

𝑟 6,8
𝑤= = = 0,97 ≈ 1,0
𝑘 7

El valor de la amplitud del intervalo 𝑤 se va a redondear por exceso. En este caso se redondea a
un decimal, pues los datos tienen un decimal.

Distribución de clientes según peso de papas nativas compradas


Peso de las papas Marca de clase fi hi Fi Hi
[min = 1,0; min + w = 2,0] 1,5 4 0.0588 4 0.0588
]2,0 ; 3,0] 2,5 7 0.1029 11 0.1618
]3,0 ; 4,0] 3,5 12 0.1765 23 0.3382
]4,0 ; 5,0] 4,5 17 0.2500 40 0.5882
]5,0 ; 6,0] 5,5 21 0.3088 61 0.8971
]6,0 ; 7,0] 6,5 4 0.0588 65 0.9559
]7,0 ; 8,0] 7,5 3 0.0441 68 1.0000
Total 68 1,0000
Fuente: Feria agrícola
Estadística Descriptiva 2022 01 56
1,0 1,4 1,5 1,9 2,2 2,3 2,5 2,8 2,8 2,8 3,0 3,2 3,2 3,3 3,3 3,3 3,3
3,3 3,4 3,6 3,7 3,9 4,0 4,1 4,2 4,3 4,4 4,4 4,5 4,5 4,5 4,6 4,6 4,6
4,6 4,6 4,8 4,9 5,0 5,0 5,1 5,3 5,4 5,4 5,4 5,5 5,5 5,5 5,6 5,7 5,7
5,7 5,7 5,7 5,7 5,8 5,8 5,9 6,0 6,0 6,0 6,2 6,3 6,5 7,0 7,5 7,5 7,8

𝑓$ = 7. Del total de clientes en la muestra, 7 de ellos compraron más de 2 y hasta 3 kilos de papas
𝐹- = 40. Del total de clientes en la muestra, 40 de ellos compraron desde un kilo hasta 5 kilos de
papas.
𝐻) = 0,3382. Del total de clientes en la muestra, el 33,82% de ellos compraron desde un kilo hasta
4 kilos de papas.

42. La siguiente tabla corresponde a la distribución de frecuencias de los salarios, en soles, del último
mes de los empleados de la empresa A. Complete la tabla.

Empresa. A. Distribución de trabajadores según salarios, en soles, del último mes


Clase Marca de Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
clase absoluta fi relativa hi acumulada Fi acumulada Hi
[1200; ] 120
] ; ] 1800 300 0,42
] ; ] 780
] ; ] 150
] ; ]
Fuente. Gerencia de Recursos Humanos. Empresa A

Empresa. A. Distribución de trabajadores según salarios, en soles, del último mes


Clase Marca Frecuencia Frecuencia Frecuencia absoluta Frecuencia rela-
de clase absoluta fi relativa hi acumulada Fi tiva acumulada Hi
[1200; 1200+w] 120 0,12 120 0,12
]1200+w ; 1200+2w] 1800 300 0,30 420 0,42
] ; ] 360 0,36 780 0,78
] ; ] 150 0,15 930 0,93
] ; ] 70 0,07 1000 1,00
Fuente. Gerencia de Recursos Humanos. Empresa A

Como 1800 es la marca de clase, se puede plantear:

(1200 + 𝑤) + (1200 + 2𝑤)


= 1800
2

𝑤 = 400
Estadística Descriptiva 2022 01 57
Empresa. A. Distribución de trabajadores según salarios, en soles, del último mes
Clase Marca Frecuencia Frecuencia Frecuencia absoluta Frecuencia rela-
de clase absoluta fi relativa hi acumulada Fi tiva acumulada Hi
[1200; 1600] 1400 120 0,12 120 0,12
]1600; 2000] 1800 300 0,30 420 0,42
]2000 ; 2400] 2200 360 0,36 780 0,78
]2400 ; 2800] 2600 150 0,15 930 0,93
]2800 ; 3200] 3000 70 0,07 1000 1,00
Fuente. Gerencia de Recursos Humanos. Empresa A

43. El objetivo de una investigación sobre la lúcuma, de la empresa A en el presente mes, es establecer
la distribución de su peso para la exportación. La lúcuma es originaria de las regiones tropicales de
Sudamérica. Es empleada, sobre todo, en la preparación de dulces, postres y helados.
En el siguiente cuadro se muestra el peso, en gramos, de una muestra de 60 frutos.

167 172 173 180 182 182 183 183 183 184 185 186
186 186 187 189 190 191 191 192 193 194 194 194
194 195 195 195 197 197 199 201 201 201 201 201
203 204 205 207 207 207 207 209 210 212 212 213
213 214 218 218 218 219 220 222 223 226 228 232

Realice la tabla de distribución de frecuencias de los datos.

44. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años.

Complete la distribución de frecuencias.

Distribución de una muestra de peruanos de 18 años, según su estatura


Estatura (en metros) Marca de clase fi hi Fi Hi

[ , ] 155 0,48
] , ] 0,32
] , ] 167 0,95
] , ] 600
Fuente: MINSA
Estadística Descriptiva 2022 01 58

Gráficos de datos cuantitativos


Histograma
Un histograma es una representación gráfica de una variable en forma de barras, donde la altura de
cada barra es proporcional a la frecuencia de los valores representados.
Se coloca la variable sobre el eje horizontal y las frecuencias sobre el eje vertical.
Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase sobre
el eje horizontal y cuya altura es proporcional a la frecuencia correspondiente (absoluta, relativa o
porcentual). Los rectángulos adyacentes se tocan entre sí.

Histograma de frecuencias absolutas

Distribución de unidades elementales según variable


Frecuencia simple absoluta

𝑓"

𝑓!
𝑓#
𝑓$
𝑓%

𝐿!" 𝐿#" = 𝐿!$ 𝐿#$ = 𝐿!% 𝐿#% = 𝐿!& 𝐿#& = 𝐿!' 𝐿#'
Variable
Fuente: Unidad de medición

Histograma de frecuencias relativas

Distribución de unidades elementales según variable


Frecuencia simple relativa

ℎ"

ℎ!
ℎ#
ℎ$
ℎ%

𝐿!" 𝐿#" = 𝐿!$ 𝐿#$ = 𝐿!% 𝐿#% = 𝐿!& 𝐿#& = 𝐿!' 𝐿#'
Variable
Fuente: Unidad de medición

Histograma de frecuencias porcentuales

Distribución de unidades elementales según variable


Frecuencia simple porcentual

𝑝"

𝑝!
𝑝#
𝑝$
𝑝%

𝐿!" 𝐿#" = 𝐿!$ 𝐿#$ = 𝐿!% 𝐿#% = 𝐿!& 𝐿#& = 𝐿!' 𝐿#'
Variable
Fuente: Unidad de medición
Estadística Descriptiva 2022 01 59
Polígono de frecuencias
Un polígono de frecuencias es un gráfico de líneas que une los puntos asociados a las marcas de clase
de una variable. La altura del punto asociado a cada marca de clase es proporcional a la frecuencia de
dicho valor.
Se realiza uniendo con segmentos de recta los puntos de intersección de las marcas de clase con las
frecuencias (absolutas, relativas o porcentuales).
Los polígonos de frecuencias se cierran creando dos intervalos ficticios, uno antes del primer intervalo
y uno después del último.
Si los intervalos creados toman valores que pueden no ser reales, igual se crea el intervalo, como,
ejemplo, tiempos negativos.

Distribución de unidades elementales según variable


Frecuencia simple

𝑥"´ − 𝑤 𝑥"´ 𝑥#´ 𝑥'´ 𝑥(´ 𝑥(´ + 𝑤


Variable
Fuente: Unidad de medición

Ojiva
La ojiva es la gráfica de una distribución acumulada de frecuencias.
Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de cada
intervalo y la frecuencia acumulada respectiva.
La ojiva usa los límites de los intervalos y no las marcas de clase.
Con la ojiva se puede estimar fácilmente el número o porcentaje de observaciones que corresponden
a un intervalo determinado.

Distribución de unidades elementales según variable


100%
𝑃$
100%
Frecuencia acumulada

𝑃#
porcentual

75% 𝑃"

50% 𝑃!

25%

𝐿%" 𝐿&" 𝐿&# 𝐿&' 𝐿&( 𝐿&)


Variable
Fuente: Unidad de medición
Estadística Descriptiva 2022 01 60
Ejercicios

45. Grafique el histograma, el polígono de frecuencias y la ojiva de frecuencias porcentuales con los
datos de la muestra del ejercicio de las papas nativas.

46. En economía, la prima de riesgo es el sobreprecio que paga un país para financiarse en los merca-
dos en comparación con otros países. Cuanto mayor es el riesgo país, más alta será su prima de
riesgo. Significa la confianza de los inversores en la solidez de una economía. La prima de riesgo de
los países de la Unión Europea se calcula respecto de Alemania porque su deuda pública es la que
tiene menor riesgo de impago. Para el caso de España, la agencia de calificación de riesgos A ha
medido la prima de riesgo durante 50 días desde junio del 2017.

España. Distribución de días según prima de riesgo. Junio y julio del 2017
Prima de riesgo Marca de clase fi hi Fi Hi
[ 120 ; 130 ] 125 1 0,0200 1 0,0200
] 130 ; 140 ] 135 3 0,0600 4 0,0800
] 140 ; 150 ] 145 11 0,2200 15 0,3000
] 150 ; 160 ] 155 14 0,2800 29 0,5800
] 160 ; 170 ] 165 12 0,2400 41 0,8200
] 170 ; 180 ] 175 6 0,1200 47 0,9400
] 180 ; 190 ] 185 3 0,0600 50 1,0000
Fuente: Agencia de Calificación de Riesgos A.

Grafique el histograma, el polígono de frecuencias y la ojiva de frecuencias relativas.


Estadística Descriptiva 2022 01 61
Distribuciones de frecuencias de dos o más grupos de datos con intervalos comunes

La idea básica para distribuciones de frecuencias de dos o más grupos de datos es tener intervalos
comunes, es decir, que los límites de los intervalos para ambas distribuciones sean iguales. Para ello,
debemos seguir los siguientes pasos:

• Hallar el valor mínimo de todos los datos y el valor máximo de todos los grupos de datos, y usarlos
para calcular el rango.
• Siguiendo la regla de Sturges, el número de intervalos 𝑘 es:

𝑘 = 1 + 3,322 𝑙𝑜𝑔#, (𝑛)

El valor de 𝑛 es el máximo del número de datos de cada grupo. Tener en cuenta que no es la suma
de ambos tamaños muestrales.
• Luego se construye cada distribución de frecuencias, usando las mismas reglas de la distribución
de frecuencias de una variable continua.

Ejemplo 20

La empresa de investigación de mercado A lleva a cabo un estudio para obtener indicadores que le
permitan inferir respecto al consumo de energía eléctrica mensual (medido en kilovatios, redondeado
al entero más próximo) de las familias en los departamentos de Arequipa y Tacna. Dicho estudio, sus-
tentado en el análisis de muestras aleatorias tomadas en ambos departamentos, arrojó los siguientes
resultados:

Arequipa
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666

Tacna
217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424
426 429 438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636

Usando la regla de Sturges, calcule intervalos comunes y marcas de clase de una tabla de distribución
de frecuencias que permita comparar los datos.

Solución

Hallar el mínimo de todos los datos (217) y el máximo de todos los datos (666) de ambas ciudades, y
usarlos para calcular el rango. Calcular el número de categorías, el número de datos es el máximo
número de datos (40) entre ambas ciudades. Tener en cuenta que no es la suma de ambos tamaños
muestrales.
𝑅𝑎𝑛𝑔𝑜 = 𝑟 = 666 – 217 = 449
Estadística Descriptiva 2022 01 62
Siguiendo la regla de Sturges, el número de intervalos es:

𝑘 = 1 + 3,322 𝑙𝑜𝑔#, (𝑛) = 1 + 3,322 𝑙𝑜𝑔#, (40) = 6,322

El valor de 𝑘 se redondea por redondeo simple; en este caso, 𝑘 = 6.

La amplitud se redondea por exceso a cero decimales, pues los datos tienen cero decimales.

𝑟 449
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑤 = = = 74,83 ≈ 75
𝑘 6

Distribución de clientes según consumo eléctrico


Consumo de energía Marca de clase
[217 ; 292] 254,5
]292 ; 367] 329,5
]367 ; 442] 404,5
]442 ; 517] 479,5
]517 ; 592] 554,5
]592 ; 667] 629,5
Fuente: Empresa A
Estadística Descriptiva 2022 01 63
Ejercicios

47. Se extrajeron dos muestras aleatorias, la primera de 80 pasajeros de clase económica y la segunda
de 60 pasajeros de clase ejecutiva. Indique la clase que tenga valores concentrados en los valores
bajos.

Peso del equipaje de mano en clase económica Peso del equipaje de mano en clase ejecutiva
7,9 8,9 9,8 10,8 11,2 11,8 12,3 13,2 6,0 8,2 8,5 8,9 9,7 10,8
7,9 8,9 10,1 10,8 11,3 11,9 12,4 13,4 6,5 8,2 8,5 8,9 9,8 11,0
8,0 9,0 10,2 10,9 11,4 12,0 12,4 13,5 6,8 8,2 8,5 8,9 9,9 11,2
8,0 9,1 10,2 11,0 11,4 12,0 12,4 13,6 6,8 8,3 8,6 9,0 9,9 11,6
8,1 9,1 10,3 11,0 11,5 12,1 12,5 13,7 6,9 8,3 8,6 9,1 10,0 11,7
8,1 9,3 10,4 11,0 11,5 12,1 12,5 13,9 7,1 8,3 8,7 9,1 10,0 12,2
8,2 9,4 10,6 11,1 11,5 12,1 12,6 14,2 7,1 8,4 8,7 9,3 10,3 12,5
8,5 9,5 10,6 11,1 11,6 12,2 12,7 14,6 7,2 8,4 8,7 9,4 10,5 12,9
8,6 9,7 10,7 11,1 11,7 12,2 12,9 14,6 7,7 8,4 8,8 9,6 10,5 13,0
8,8 9,7 10,8 11,2 11,7 12,3 13,1 14,8 8,0 8,4 8,8 9,7 10,6 13,0
Fuente: Aerolínea Wayra

Solución
Interpretación
Determinar la clase que tenga valores concentrados en los valores bajos.

Representación
Vamos a realizar dos distribuciones de frecuencia y un polígono de frecuencias con intervalos comunes.

Cálculo
El valor máximo de todos los datos es 14,8 kilos y el mínimo es 6,0 kilos.

Luego, el rango de todos los datos es:

𝑟 = 𝑚á𝑥𝑖𝑚𝑜 − 𝑚í𝑛𝑖𝑚𝑜 = 14,8 − 6,0 = 8,8 kilos

Siguiendo Sturges, la cantidad de intervalos es igual a:

𝑘 = 1 + 3,322 𝑙𝑜𝑔(𝑚á𝑥𝑖𝑚𝑜 (80,60))

𝑘 = 1 + 3,322 𝑙𝑜𝑔(80) = 7,3

Luego, como 𝑘 es un valor entero, se tiene que:

𝑘 = 7
Estadística Descriptiva 2022 01 64
La amplitud es igual al rango entre la cantidad de intervalos, esto es,

𝑟 8,8
𝑤= = = 1,26
𝑘 7

Como los datos tienen un decimal, la amplitud es:

𝑤 = 1,3

Peso del equipaje de mano en clase económica Peso del equipaje de mano en clase ejecutiva
7,9 8,9 9,8 10,8 11,2 11,8 12,3 13,2 6,0 8,2 8,5 8,9 9,7 10,8
7,9 8,9 10,1 10,8 11,3 11,9 12,4 13,4 6,5 8,2 8,5 8,9 9,8 11,0
8,0 9,0 10,2 10,9 11,4 12,0 12,4 13,5 6,8 8,2 8,5 8,9 9,9 11,2
8,0 9,1 10,2 11,0 11,4 12,0 12,4 13,6 6,8 8,3 8,6 9,0 9,9 11,6
8,1 9,1 10,3 11,0 11,5 12,1 12,5 13,7 6,9 8,3 8,6 9,1 10,0 11,7
8,1 9,3 10,4 11,0 11,5 12,1 12,5 13,9 7,1 8,3 8,7 9,1 10,0 12,2
8,2 9,4 10,6 11,1 11,5 12,1 12,6 14,2 7,1 8,4 8,7 9,3 10,3 12,5
8,5 9,5 10,6 11,1 11,6 12,2 12,7 14,6 7,2 8,4 8,7 9,4 10,5 12,9
8,6 9,7 10,7 11,1 11,7 12,2 12,9 14,6 7,7 8,4 8,8 9,6 10,5 13,0
8,8 9,7 10,8 11,2 11,7 12,3 13,1 14,8 8,0 8,4 8,8 9,7 10,6 13,0

Distribución de pasajeros de clase económica según peso de equipaje


Intervalo Marca de clase Frecuencia absoluta fi Frecuencia relativa hi
[6,0 ; 7,3] 6,65 0 0.0000
]7,3 ; 8,6] 7,95 9 0.1125
]8,6 ; 9,9] 9,25 12 0.1500
]9,9 ; 11,2] 10,55 20 0.2500
]11,2 ; 12,5] 11,85 25 0.3125
]12,5 ; 13,8] 13,15 9 0.1125
]13,8 ; 15,1] 14,45 5 0.0625
Fuente: Aerolínea Wayra

Distribución de pasajeros de clase ejecutiva según peso de equipaje


Intervalo Marca de clase Frecuencia absoluta fi Frecuencia relativa hi
[6,0 ; 7,3] 6,65 8 0.1333
]7,3 ; 8,6] 7,95 17 0.2833
]8,6 ; 9,9] 9,25 19 0.3167
]9,9 ; 11,2] 10,55 9 0.1500
]11,2 ; 12,5] 11,85 4 0.0667
]12,5 ; 13,8] 13,15 3 0.0500
]13,8 ; 15,1] 14,45 0 0.0000
Fuente: Aerolínea Wayra
Estadística Descriptiva 2022 01 65

La clase que tiene valores concentrados en los valores bajos es ejecutiva.


Estadística Descriptiva 2022 01 66

Medidas de tendencia central

Una medida de localización o de tendencia central se refiere al valor central que representa a los datos
de una determinada variable.

En este curso veremos la media, mediana y moda.

Media
La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de dichos
valores dividida entre el número de valores.

Cálculo de la media aritmética

La fórmula para la media poblacional (parámetro) es:



∑5!6# 𝑥!
𝜇=
𝑁

La fórmula para la media muestral (estadístico) es:

∑7!6# 𝑥!
𝑥̅ =
𝑛

En Excel se usa la función =PROMEDIO(datos).

Características de la media

Se puede calcular para datos medidos en escala de intervalo o razón.


El cálculo de la media es sencillo y es una medida muy conocida.
El valor de la media es sensible a los valores extremos, por lo que varía mucho con valores muy grandes
o muy pequeños con respecto a los demás.

Si cada uno de los 𝑛 valores 𝑥! es transformado en:

𝑦! = 𝑎 𝑥! + 𝑏

siendo 𝑎 y 𝑏 constantes, entonces, la media de los 𝑛 valores 𝑦! es:

𝑦h = 𝑎𝑥̅ + 𝑏
Estadística Descriptiva 2022 01 67
Ejemplo 21

La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más impor-
tante de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federación In-
ternacional de Voleibol (FIVB) y contó con 16 equipos. En la figura se muestra algunas jugadoras de la
selección serbia. Calcule la media de la estatura de estas jugadoras.

Solución

La media muestral es 𝑥̅ = 186,56 cm.

Esto quiere decir que la estatura de las jugadoras de voleibol de Serbia está alrededor de 185,56 cm.
Estadística Descriptiva 2022 01 68
Ejercicios

48. Según los Censos Nacionales del 2017 en el Perú, la media de la edad de los peruanos es 31,51
años. Interprete este valor.

La edad de los mperuanos está alrededor de 31,51 años.

49. En 2018, la media del consumo anual per cápita de carne de pollo en Lima Metropolitana fue de
80,5 kilogramos. Interprete este valor.

El consumo anual per cápita de carne de pollo en Lima Metropolitana estuvo alrededor de 80,5
kilogramos

50. A continuación, se presenta la información de una muestra de empleados de la compañía A.

Empleado Ingreso mensual (soles) Experiencia laboral (años)


1 2020 4,6
2 3410 8,8
3 1967 2,1
4 1630 1,2
5 2502 5,2
6 1677 1,1
7 4286 4,9
8 2952 2,8

Calcule e interprete el valor de la media de cada una de las variables.

Variable Valor Interpretación


El ingreso menual de los trabajadores está
Ingreso mensual, en soles 2555,5 soles
alrededor de 2555,5 soles
La experiencia laboral está alrededor de
Experiencia laboral, en años 3,84 años
3,84 años.

51. Calcule la media de los siguientes grupos de números.

Grupo 1 1 2 3 4 5 6 7

Grupo 2 1 2 3 4 5 6 700

¿Qué nota al calcular la media de cada grupo?

La media se ve afectada por valores extremos.


Estadística Descriptiva 2022 01 69
52. Una empresa ha decidido hacer dos ofertas a su sindicato sobre el aumento de sueldo anual a sus
trabajadores:

• Aumento general del 4%.


• Aumento general del 2,5% más un bono de 80 soles.

Si el sueldo promedio es de 4500 soles, ¿cuál de las dos ofertas debe aceptar el sindicato si lo que
desea es hacer máximo el sueldo medio de los trabajadores?

Si cada uno de los 𝑛 valores 𝑥! es transformado en:

𝑦! = 𝑎 𝑥! + 𝑏

siendo 𝑎 y 𝑏 constantes, entonces, la media de los 𝑛 valores 𝑦! es:

𝑦h = 𝑎𝑥̅ + 𝑏

Oferta 1: Aumento general del 4%

𝑦h = 𝑎𝑥̅ + 𝑏

𝑦h = (1 + 0,04) × 4500 + 0 = 4680 soles

Oferta 2: Aumento general del 2,5% más un bono de 80 soles

𝑦h = 𝑎𝑥̅ + 𝑏

𝑦h = (1 + 0,025) × 4500 + 80 = 4692,5 soles

La oferta que debe aceptar el sindicato si lo que desea es hacer máximo el sueldo medio de los
trabajadores es la oferta 2 (4692,5 > 46980).

53. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años. Calcule e interprete la media de la estatura de la muestra.

1,67 1,70 1,83 1,65 1,70 1,65 1,60 1,70 1,61 1,69
Rpta: 1,68 m.

54. Se muestra un gráfico del CIES Football Observatory sobre la media de estatura de las 32 seleccio-
nes que participaron en el Mundial de Rusia 2018. Bélgica es el equipo con mayor altura y Perú es
la 31°. Interprete el valor en el caso peruano.
Estadística Descriptiva 2022 01 70

55. En una empresa el sueldo medio es 2500 soles. La gerencia, luego de la negociación con el sindi-
cato, decide realizar un aumento del 3,5% y un bono de 150 soles a cada trabajador. Calcule el
nuevo sueldo medio. Rpta: 2737,5 soles

56. Una tienda rebaja los precios, en 12%, a toda su línea de casacas. Si la media de los precios de las
casacas antes de la rebaja era de 155 soles. Calcule la nueva media de los precios.
Rpta: 136,4 soles
Estadística Descriptiva 2022 01 71
Mediana

La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto.
El 50% de las observaciones son menores o iguales a la mediana.

El 50% de las unidades elementales presen- El 50% de las unidades elementales presen-
tan valores en la variable de estudio iguales tan valores en la variable de estudio mayo-
o menores a la mediana. res a la mediana.

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 (𝑀𝑒)

Cálculo de la mediana

1. Primero, ordenamos los datos de manera ascendente.

2. Calculamos la posición 𝑖 de la mediana.

𝑛+1
𝑖 = 50 k l = 0,5(𝑛 + 1) = 𝐸, 𝑑
100

donde:
𝑛 es el tamaño de muestra
𝐸 es la parte entera
0, 𝐷 es la parte decimal

3. Luego, calculamos la mediana.

Si 𝑑 = 0, entonces 𝑚𝑒 = 𝑋[9]

Si 𝑑 ≠ 0, entonces 𝑚𝑒 = 𝑋[9] + 0,5N𝑋[9;#] − 𝑋[9] O

donde:
𝑋[9] es el dato de la posición 𝐸
𝑋[9;#] es el dato de la posición 𝐸 + 1

En Excel se usa la función =MEDIANA(datos).

Características de la mediana
• Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
• El valor de la mediana depende del número de datos observados.
• La mediana es un estadístico que no se ve afectado por valores extremos (mínimo y máximo). Por
eso se le utiliza cuando hay datos inusuales o el polígono de frecuencias no es simétrico.
Estadística Descriptiva 2022 01 72
Ejemplo 22

La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más impor-
tante de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federación In-
ternacional de Voleibol (FIVB).

En la figura se muestra algunas jugadoras de la selección de República Dominicana. Calcule e interprete


la mediana de la estatura de estas jugadoras.

Solución

Primero, ordenamos los datos.

Posición 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12° 13° 14° 15°


Estatura 167 171 174 182 183 183 186 186 188 188 190 190 194 196 201

Luego, calculamos la posición de la mediana. La posición 𝑖 es:

𝑖 = 0,5 (𝑛 + 1) = 0,5 × (15 + 1) = 8,0 = 𝐸, 𝑑


Estadística Descriptiva 2022 01 73

Como 𝑑 = 0, entonces la mediana es el valor en la posición 𝑖 = 8, es decir, 𝑚𝑒 = 𝑋[<] = 186 cm.

Se interpreta como:
• El 50% de las jugadoras de voleibol de República Dominicana miden 186 centímetros o menos.
• El 50% de las jugadoras de voleibol de República Dominicana miden hasta 186 centímetros.
• El 50% de las jugadoras de voleibol de República Dominicana miden como máximo 186 centíme-
tros.
Estadística Descriptiva 2022 01 74
Ejercicios

57. Según los Censos Nacionales del 2017 en el Perú, la mediana de la edad de los peruanos es 29
años. Interprete este valor.

El 50% de los peruanos tiene 29 años o menos.


El 50% de los peruanos tiene hasta 29 años.
El 50% de los peruanos tiene como máximo 29 años.

58. El Ministerio de Trabajo y el INEI ejecutaron la “Encuesta Nacional Especializada de Trabajo Infantil
2015” cuyo objetivo fue caracterizar el trabajo infantil en el Perú. La población tuvo de 5 a 17 años
de edad. La mediana del tiempo que trabajan a la semana fue de 14 horas. Interprete este valor.

El 50% de los niños de 5 a 7 años en el Perú que trabajan labora hasta 14 horas semanales.

59. Se registra los tiempos, en minutos, que se demora una cajera en atender a algunos clientes del
supermercado A.

5,3 2,7 10,7 8,2 3,0 5,4 5,6 10,2 11,3 2,6 2,6 5,4 3,5 7,0 11,5

Calcule e interprete el valor de la mediana. Rpta: 5,4 minutos

El 50% de los clientes del supermercado A en la muestra es atendido en hasta 5,4 minutos.

60. Calcule la mediana de los siguientes grupos de números.

Grupo 1 7 10 11 13 16 17 18

Grupo 2 7 10 11 13 16 17 180

¿Qué concluye al calcular la mediana de cada grupo?

La mediana no se ve afectada por valores extremos.

61. Complete los siguientes textos:

“La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho con-
junto. El ……… son menores o igual a la mediana.”

“Usar la mediana como medida de tendencia central es preferible a usar la media cuando ……..”.
Estadística Descriptiva 2022 01 75
Moda
La moda de un conjunto de datos de una variable es el valor que se presenta con mayor frecuencia.

Cálculo de la moda
En Excel, para calcular la moda de valores numéricos se usa la función =MODA.UNO(datos) que brinda
como resultado una sola moda, incluso si el conjunto de números tiene más de una moda y la función
=MODA.VARIOS(datos) que brinda como resultado una o más modas, según corresponda al conjunto
de números.
En Excel, para calcular la moda se puede usar tablas dinámicas.

Características de la moda
• La moda se puede calcular para cualquier escala de medición.
• El valor de la moda no se ve afectada por valores extremos.
• La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más
modas (multimodal). Algunas series de datos no tienen moda.

Ejemplo 23
La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más impor-
tante de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federación In-
ternacional de Voleibol (FIVB) y contó con 16 equipos. En la figura se muestra algunas jugadoras de la
selección de China. Calcule e interprete la moda de la estatura de estas jugadoras.

Solución
La moda es 187 cm. La estatura más frecuente entre las jugadoras de la selección de vóley de China
es 187 cm.
Estadística Descriptiva 2022 01 76
Ejercicios

62. Según los Censos Nacionales del 2017 en el Perú, la moda de la edad de los peruanos es 8 años.
Interprete este valor. En el momento del censo había 547 909 peruanos de 8 años.

La edad más frecuente es ocho años.

63. En el año 2016 se realizó el Primer Censo Nacional Penitenciario del Perú. Según este censo, de la
población penitenciaria que consumió alguna sustancia antes de cometer el delito, el 79,1% con-
sumió alcohol, marihuana 10,6% y pasta básica de cocaína 9,5%. Interprete el valor de la moda.

El valor de la moda es alcohol, pues su porcentaje es el mayor (79,1%).

La sustancia más frecuentemente consumida antes de cometer un delito es alcohol.

64. Calcule e interprete la moda de los siguientes datos, que corresponden al número de errores or-
tográficos por correo electrónico que cometen algunos gerentes de una empresa en una comuni-
cación escrita.

2 2 5 2 3 3 2 3 2 1 2 0 0 1 3 0 3 2 1 2
4 2 1 3 1 1 3 3 3 1 2 4 2 0 1 4 2 2 2 2

El número de errores ortográficos por correo electrónico que cometen algunos gerentes de una
empresa en una comunicación escrita más frecuente es 2.

65. Calcule la moda de los siguientes grupos de números.

Grupo 1 1 2 2 3 4 4 5

Grupo 2 1 2 2 3 4 4 500

¿Qué concluye al calcular la moda?


Estadística Descriptiva 2022 01 77
Media ponderada

La media ponderada permite calcular el valor medio considerando la importancia o peso de cada valor
sobre el total.

Cálculo de la media ponderada

La fórmula es:

∑7!6# 𝑥! 𝑤!
𝑥̅= =
∑7!6# 𝑤!

donde:

𝑥! : Observación individual
𝑤! : Peso asignado a cada observación
Estadística Descriptiva 2022 01 78
Ejercicios

66. Las notas de un alumno de Estadística Descriptiva son:

Evaluación Nota
Participación 1 20
Participación 2 17
Participación 3 10
Participación 4 15
Control 1 (5%) 15
Informe del trabajo de aplicación grupal (8%) 14
Sustentación del trabajo de aplicación (25%) 16
Participación 5 20
Participación 6 20
Participación 7 15
Participación 8 12
Evaluación de cierre de la Unidad II (20%) 12
Control 2 (8%) 13
Examen final (30%) 12

Si aprobó el curso con más de 14, el siguiente ciclo se matriculará en siete cursos. Indique lo que
hará el alumno.

2 × 17,33 + 5 × 15 + 8 × 14 + 25 × 16
𝐷𝐷1 = = 15,54
40

2 × 18,33 + 20 × 12 + 8 × 13
𝐷𝐷2 = = 12,68
30
Estadística Descriptiva 2022 01 79
40 × 15,54 + 30 × 12,68 + 30 × 12
𝑁𝑜𝑡𝑎 = = 13,62
100

Por lo tanto, el siguiente ciclo no se matriculará en siete cursos (13,62 < 14).
Estadística Descriptiva 2022 01 80

Medidas de variabilidad

Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero
no indican qué tan cercanos o lejanos están los datos de dicho valor central.

Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los
representa y, por lo tanto, permiten evaluar la confiabilidad de ese valor central.

Si la medida de dispersión:
• tiene un valor pequeño, los datos están concentrados alrededor de la medida de tendencia central,
• tiene un valor grande, los datos no están concentrados alrededor de la medida de tendencia cen-
tral.

Las medidas de variabilidad que estudiaremos son:


• Varianza
• Desviación estándar
• Coeficiente de variación
• Rango
• Rango intercuartil

Varianza

La varianza es el promedio de los cuadrados de la diferencia de cada dato con la media.

Las unidades de la varianza son las unidades de los datos al cuadrado.

Cálculo de la varianza

La fórmula para la varianza poblacional (parámetro) es:

∑5
!6#(𝑥! − 𝜇)
$
𝜎$ =
𝑁

En Excel se usa la función =VAR.P(datos).

La fórmula para la varianza muestral (estadístico) es:

∑7!6#(𝑥! − 𝑥̅ )$
𝑠$ =
𝑛−1

En Excel se usa la función =VAR.S(datos).


Estadística Descriptiva 2022 01 81
Desviación estándar

La desviación estándar es la raíz cuadrada positiva de la varianza.

La desviación estándar poblacional se denota por s. En Excel se usa la función =DESVEST.P(datos).

La desviación estándar muestral se denota por s. En Excel se usa la función =DESVEST.M(datos).

Características de la varianza y la desviación estándar

• La varianza y la desviación estándar se ven afectadas por valores extremos.


• La varianza y la desviación estándar son números reales no negativos.
• Se pueden calcular para variables medidas en escala de intervalo o razón.
• La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que, la
desviación estándar es expresada en las mismas unidades de los datos.
• Si cada uno de los 𝑛 valores 𝑥! es transformado en:

𝑦! = 𝑎 𝑥! + 𝑏

siendo 𝑎 y 𝑏 constantes, entonces, se tiene que:

o la relación entre las varianzas de los datos 𝑦! y 𝑥! es:

𝑆>$ = 𝑎$ 𝑆?$

o la relación entre las desviaciones estándar de los datos 𝑦! y 𝑥! es:

𝑆> = 𝑎𝑆?
Estadística Descriptiva 2022 01 82
Ejercicios

67. Calcule la desviación estándar de los siguientes grupos de números.

Grupo 1 1 2 3 4 5 6 7
Grupo 2 1 2 3 4 5 6 800

¿Qué concluye al calcular dicha medida de dispersión?


La desviación estándar se ve muy influida por valores extremos.

68. En una empresa se hace dos ofertas a su sindicato sobre el aumento de sueldo a sus trabajadores:
• Oferta 1: Aumento general del 4%.
• Oferta 2: Aumento del 2,5% más un bono de 80 soles.
Si el sindicato desea elegir la opción con la menor desviación estándar, indique la oferta que elegirá
si la antigua desviación estándar de los sueldos era de 650 soles.

Interpretación
Determinar la oferta que debe elegir el sindicato.

Representación
Usaremos la propiedad de transformación lineal de datos.

Cálculo
Si cada uno de los 𝑛 valores 𝑥! es transformado en:

𝑦! = 𝑎 𝑥! + 𝑏

siendo 𝑎 y 𝑏 constantes, entonces, se tiene que la relación entre las desviaciones estándar de los
datos 𝑦! y 𝑥! es:

𝑆> = 𝑎𝑆?

Oferta 1: Aumento general del 4%

𝑆> = (1 + 0,04) × 650 = 676 soles

Oferta 2: Aumento del 2,5% más un bono de 80 soles

𝑆> = (1 + 0,025) × 650 = 666,25 soles

Análisis y argumentación
La oferta que debe elegir el sindicato la oferta 2 (666,25 < 676).
Estadística Descriptiva 2022 01 83
69. En la ciudad 1 y 2 se extrae una muestra de siete personas y se registra los sueldos mensuales de
cada persona. Los datos se muestran en el cuadro siguiente.

Ciudad 1 1 2 3 4 5 6 7
Ciudad 2 1001 1002 1003 1004 1005 1006 1007

Calcule la desviación estándar de los sueldos mensuales. ¿Los ingresos de las dos ciudades tienen
la misma variabilidad?

Los dos grupos tienen la misma desviación estándar (2,1602). No, no tienen la misma variabilidad,
hay más variabilidad en los ingresos de la ciudad 1.

𝑠 2,1602
𝐶𝑉# = × 100% = × 100% = 54,01%
𝑥̅ 4

𝑠 2,1602
𝐶𝑉$ = × 100% = × 100% = 0,215%
𝑥̅ 1004

Hay más variabilidad en los ingresos de la ciudad 1 pues su coeficiente de variación es el mayor
(54,01% > 0,215%).

70. En una tienda, la desviación estándar de los precios de los jeans es de 20 soles, calcule la nueva
desviación estándar de los precios de los jeans si se realiza:

a. una rebaja del 6% de todos los precios. Rpta: 18,8 soles


b. una oferta y se rebaja ocho soles a cada precio. Rpta: 20,0 soles

71. Los siguientes datos corresponden a consumos, en soles, de alumnos en la cafetería de una uni-
versidad. Calcule la desviación estándar y la varianza. Rpta: 2,945 y 8,68

3,0 7,5 5,5 12,0 6,5 2,7 2,0 4,5 8,0 4,0 2,5 3,0 1,5 7,0
Estadística Descriptiva 2022 01 84
Coeficiente de variación

El coeficiente de variación (𝐶𝑉) de un conjunto de datos indica el porcentaje que es la desviación es-
tándar en comparación con la media.

Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones es-
tándar no es muy útil, por ejemplo, cuando las medias están muy distantes.

Es una medida de variabilidad relativa. No tiene unidades, está expresada en porcentaje.

Cálculo del coeficiente de variación

La fórmula para el coeficiente de variación poblacional (parámetro) es:

𝜎
𝐶𝑉 = × 100%
𝜇

La fórmula para el coeficiente de variación muestral (estadístico) es:



𝑠
𝐶𝑉 = × 100%
𝑥̅

Características del coeficiente de variación

El coeficiente de variación se calcula solamente en variables medidas en escala de razón y solo para
valores positivos.

Ejemplo 24

Los siguientes datos representan resúmenes del número de mediciones de resistencia a la tracción de
cierto artículo que realizaron dos grupos de técnicos.

Grupo 1
media = 3 y desviación estándar = 1,10

Grupo 2
media = 5 y desviación estándar = 1,66

En el grupo con las mediciones que presenten mayor dispersión, se revisará exhaustivamente el pro-
ceso de producción.
Estadística Descriptiva 2022 01 85
Solución

Interpretación
Determinar en qué grupo se revisará exhaustivamente el proceso de producción.

Representación
Como los promedios son diferentes, se usa como indicador de dispersión al coeficiente de variación.

Cálculo
Como nos piden que indiquemos el grupo que presente la mayor dispersión, calcularemos el coefi-
ciente de variación, mediante la fórmula:

𝑠
𝐶𝑉 = × 100%
𝑥̅

Reemplazando los valores en cada grupo, tendremos:

1,10
𝐶𝑉# = × 100% = 36,67%
3

1,66
𝐶𝑉$ = × 100% = 33,20%
5

Análisis y argumentación
Las mediciones son más dispersas en el grupo 1, pues su coeficiente de variación es mayor. Como el
coeficiente de variación es mayor en el grupo 1, entonces, se revisará exhaustivamente el proceso de
producción del grupo 1.
Estadística Descriptiva 2022 01 86
Ejercicios

72. Observe las dos imágenes siguientes.

Foto tomada de http://gastronomiaycia.republica.com/

Complete los siguientes textos, con respecto a la variabilidad de los tamaños de las manzanas en
ambos grupos.

a. En el grupo de la izquierda hay mayor homogeneidad en el peso de las manzanas.


b. En el grupo de la izquierda hay menor heterogeneidad/dispersión/variabilidad en el peso de
las manzanas.
c. En el grupo de la derecha hay mayor heterogeneidad/dispersión/variabilidad en el peso de las
manzanas.
d. En el grupo de la derecha hay menor homogeneidad en el peso de las manzanas.
e. Seguramente en el grupo de manzanas a la derecha, el coeficiente de variación del peso de las
manzanas es mayor al coeficiente de variación del grupo a la izquierda.

73. Según los Censos 2017: XII de Población, VII de Vivienda y III de Comunidades Indígenas se tiene
los siguientes resultados para la cantidad de personas en un hogar.

Medida de resumen Lima Loreto


Media 3,56 personas 4,24 personas
Mediana 3,00 personas 4,00 personas
Moda 3,00 personas 4,00 personas
Desviación estándar 2,00 personas 2,29 personas

¿En cuál de las dos ciudades se presenta mayor variabilidad en la cantidad de personas en un hogar
en el Perú?

Medida de resumen Lima Loreto


Coeficiente de 2,00 2,29
𝐶𝑉@! = × 100% = 56,2% 𝐶𝑉@A = × 100% = 54%
variación 3,56 4,24

La ciudad que presenta mayor variabilidad en la cantidad de personas en un hogar en el Perú es


Lima, pues el coeficiente de variación es el mayor (54,0% < 56,2%).
Estadística Descriptiva 2022 01 87
Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre el
dato mayor y el dato menor.

Cálculo del rango

𝑅𝑎𝑛𝑔𝑜 = 𝑟 = 𝑋BáD!BA − 𝑋Bí7!BA

Mínimo valor Máximo valor

Rango = Xmáx - Xmín

donde 𝑋BáD!BA y 𝑋Bí7!BA son los valores máximo y mínimo observados de la variable.

Características del rango


- Se puede calcular en variables medidas en escala de intervalo o razón.
- Se ve muy afectado por valores extremos.
Estadística Descriptiva 2022 01 88

Medidas de asimetría

Coeficiente de asimetría de Pearson

Mide si los datos aparecen ubicados simétricamente o no respecto de la media.

El coeficiente de asimetría se calcula con la siguiente fórmula:

𝑥̅ − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝐴𝑠 = 3 k l
𝑠

Si el coeficiente de asimetría 𝐴𝑠 es:

positivo, indica sesgo a la igual a cero, la distribución negativo, indica sesgo a la


derecha (cola derecha). es simétrica alrededor de la izquierda (cola izquierda).
La media es mayor a la media. La media es menor a la
mediana. La media es igual a la mediana.
Hay concentración mediana. Hay concentración
en valores bajos. en valores altos.
Estadística Descriptiva 2022 01 89
Ejercicios

74. El coeficiente de asimetría de los sueldos de los trabajadores en un país como el Perú seguramente
será positivo pues hay muchos sueldos bajos.

75. En un examen difícil de Estadística, el coeficiente de asimetría de los tiempos que toman los alum-
nos en resolverlo seguramente será negativo pues los alumnos van a tomar mucho tiempo para
resolverlo.

76. Seguramente, la edad de los peruanos tiene coeficiente de asimetría positivo.

Perú: Distribución porcentual de peruanos según edad por sexo. 2007 Y 2017

Fuente: Instituto Nacional de Estadística e Informática - Censos Nacionales de Población y Vivienda.

77. Seguramente, la edad de los japoneses tiene coeficiente de asimetría cercana a cero, negativa.

Japón: Distribución porcentual de japoneses según edad por sexo. 2020


Estadística Descriptiva 2022 01 90

78. Calcule el coeficiente de asimetría del precio del balón de gas de 10 kilos para el distrito de San
Luis según la página web https://www.facilito.gob.pe/facilito/actions/PreciosGLPAction.do del día
24 de marzo del 2022. Interprete dicho valor.

Distrito Marca Establecimiento Precio (soles)


Breña El Nazareno Erick David Tejada Méndez 54.00
Breña Rinde Gas Luvi Gas Breña 54.00
Breña Masgas Meza Huacachi Atilio 55.00
Breña Progas Díaz Mendoza Ronald Enrique 55.00
Breña Sursa El Verdecito Rendidor 55.00
Breña Zafiro Gas Distribuidora Avelo SAC 56.00
Breña Caligas Castillejo Morales Lucas Santiago 56.00
Breña Caserito De Lima Gas Distribuidora Avelo Sac 56.00
Breña Petro América Carlos Salvatierra Quispe 56.00
Breña Petro América Salvatierra Arbieto Denisse 56.00
Breña Caserito De Lima Gas Consorcio Cosme SAC 58.00
Breña Caserito De Lima Gas Vallegas 58.00
Breña Caserito De Lima Gas Distribuidora AJP E.I.R.L. 58.00
Breña Flama Gas Corp. Irma Elizabeth Luis Díaz 59.00
Breña Zafiro Gas Vallegas 59.00
Breña Caserito De Lima Gas Barreragas 59.50
Breña Zafiro Gas Distribuidora AJP E.I.R.L. 60.00
Breña Masgas Solgas S.A. 60.50
Breña Lima Gas Distribuidora Avelo SAC 61.00
Breña Pecsagas Castillejo Morales Lucas Santiago 61.50
Breña Zafiro Gas Barreragas 61.50
Breña Lima Gas Vallegas 62.00
Breña Solgas Meza Huacachi Atilio 62.00
Breña Lima Gas Consorcio Cosme SAC 62.00
Breña Lima Gas Barreragas 62.50
Breña Solgas Solgas S.A. 63.00
Breña Lima Gas Distribuidora AJP E.I.R.L. 63.70

Media 58.674 =PROMEDIO(A2:A28)


Mediana 59.000 =MEDIANA(A2:A28)
Desv. Estándar 3.041 =DESVEST.M(A2:A28)
As -0.322 =3*(D1-D2)/D3

Observamos que el coeficiente de asimetría es negativo (-0,322), por lo tanto, hay una concentra-
ción en valores altos.
Estadística Descriptiva 2022 01 91
79. El salario, en cientos de soles, de los trabajadores una empresa se presenta a continuación:

13 12 13 14 15 15 15 18 23 24 24 25 25 36 42 48 60

Calcule el coeficiente de asimetría de Pearson.


Estadística Descriptiva 2022 01 92

Medidas de posición
Cuantiles
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos
que comprenden el mismo número de valores. Los cuantiles más importantes son los denominados
cuartiles, deciles y percentiles.

67% 33%
Menores notas 𝑃FG Mejores notas

50% 50%
Menores notas 𝑀𝑒 = 𝑃H, = 𝑄$ = 𝐷H Mejores notas

90% 10%
Menores notas 𝑃I, = 𝐷I Mejores notas

25% 75%
Menores notas 𝑃$H = 𝑄# Mejores notas

Percentiles
Dividen el conjunto de datos en 100 partes porcentualmente iguales.

El 𝑘% de las unidades elementales presen- El (100 – 𝑘)% de las unidades elementales


tan valores en la variable de estudio iguales presentan valores en la variable de estudio
o menores al percentil 𝑘, 𝑃! . mayores al percentil 𝑘, 𝑃!

𝑃%
Cuartiles
• Dividen el conjunto de datos en cuatro partes porcentualmente iguales.
• Se les denota como cuartil 1 𝑄# , cuartil 2 𝑄$ y cuartil 3 𝑄) .
• Su equivalente en percentiles es 𝑃$H , 𝑃H, y 𝑃GH , respectivamente.

Deciles
• Dividen el conjunto de datos en diez partes porcentualmente iguales.
• Se les denota como decil 1 𝐷# , decil 2 𝐷$ , decil 3 𝐷) , …, decil 9 𝐷I .
• Su equivalente en percentiles es 𝑃#, , 𝑃$, , 𝑃), , … , 𝑃I, , respectivamente.
Estadística Descriptiva 2022 01 93
Ejemplo
Si queremos determinar el puntaje mínimo para estar en el quinto superior, debemos calcular el per-
centil 80.

El 80% de los El 20% de los


estudiantes tienen un estudiantes tienen
puntaje menor o igual un puntaje mayor al
al percentil 80. percentil 80.
Estadística Descriptiva 2022 01 94
Cálculo de un percentil

1. Primero, ordenamos los datos de manera ascendente.

2. Calculamos la posición 𝑖 del percentil 𝑘.

𝑛+1
𝑖=k l 𝑘 = 𝐸, 𝑑
100

donde:
𝑛 es el tamaño de muestra
𝐸 es la parte entera
0, 𝑑 es la parte decimal

3. Luego, calculamos el percentil 𝑘.

Si 𝑑 = 0, entonces 𝑃% = 𝑋[9]

Si 𝑑 ≠ 0, entonces 𝑃% = 𝑋[9] + 0, 𝑑N𝑋[9;#] − 𝑋[9] O

donde:
𝑋[9] es el dato de la posición 𝐸
𝑋[9;#] es el dato de la posición 𝐸 + 1

En Excel se usa la función =PERCENTIL.EXC(datos;k) donde k se escribe en forma decimal. Por ejemplo,
si se quiere calcular el percentil 25, se usa la función =PERCENTIL.EXC(datos;0.25).

Características de los percentiles


Se puede calcular en variables medidas en escala ordinal, de intervalo y razón.
El valor del percentil no se ve afectado por valores extremos.
Estadística Descriptiva 2022 01 95
Ejemplo 25
En la figura se muestran los datos de algunos jugadores de la selección peruana y su edad en agosto
del 2020. Calcule e interprete el percentil 75 de la edad de estos jugadores.

30 años 28 años 26 años 24 años 31 años 25 años

27 años 31 años 30 años 30 años 28 años 28 años

30 años 28 años 25 años 21 años 26 años 27 años

36 años 35 años 30 años 25 años 29 años

Solución
Primero, ordenamos los datos.

Posición 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12°


Edad 21 24 25 25 25 26 26 27 27 28 28 28

Posición 13° 14° 15° 16° 17° 18° 19° 20° 21° 22° 23°
Edad 28 29 30 30 30 30 30 31 31 35 36

Calculamos la posición 𝑖 del percentil 75.

𝑛+1
𝑖=k l 𝑘 = 𝐸, 𝑑
100

23 + 1
𝑖=k l 75 = 18,0
100

Como 𝑑 = 0, entonces 𝑃GH = 𝑋[#<] = 30 años.

Esto quiere decir que, en agosto del 2020, el 75% de los jugadores de la selección peruana de fútbol
tenía 30 años o menos.
Estadística Descriptiva 2022 01 96
Ejercicios
80. Según los Censos Nacionales del 2017 en el Perú, el percentil 20 de la edad de los peruanos es 11
años. Interprete este valor.

El 20% de los peruanos tiene 11 años o menos.


El 20% de los peruanos tiene hasta 11 años.
El 20% de los peruanos tiene como máximo 11 años.

Error común
El 20% de los peruanos tiene 11 años.

81. Según los Censos Nacionales del 2017 en el Perú, el percentil 49 del número de habitaciones que
tiene una vivienda es 2. Interprete este valor. ¿Podría este percentil ayudar a entender la gran
cantidad de casos de COVID 19 en el Perú?

Tomado del Manual del Empadronador/a Censos Nacional 2017 INEI.

82. Rosa María Augusta Palacios McBride es una abogada y periodista peruana. Actualmente conduce
el programa Sin Guion trasmitido por YouTube en el canal RTV-La República, programa sobre polí-
tica peruana. Se desea calcular algunas medidas de posición sobre el número de visualizaciones de
sus videos en marzo del 2022.

Día de es- Número de vi-


Título
treno sualizaciones
¿Vacancia el lunes? y Caso Pativilca 25 de marzo 88361
Caso Fujimori: “No se pedía la resurrección del indulto 24 de marzo 72490
El 31 de marzo se vencen 2 millones de dosis 23 de marzo 59058
Siguen los líos en Petroperú y Sagasti pide firmas 22 de marzo 70608
Petroperú en crisis 21 de marzo 74155
Alberto Fujimori indultado 18 de marzo 128493
La salud pública no puede estar en manos de un charlatán 17 de marzo 63944
El plan era dar el anuncio del adelanto de elecciones 16 de marzo 104115
Moción de vacancia admitida y Fiscalía despliega estrategia 15 de marzo 104865
Sobre Castillo: No debemos aceptar sorpresas de un jefe de Estado 14 de marzo 90269
En el Congreso no pasó nada y nada va a pasar 11 de marzo 73472
Sobre moción de vacancia contra Castillo: “Es bastante desordenada” 10 de marzo 88743
Castillo no se va, aunque Karelim López cacaree todo lo que sabe 9 de marzo 83170
Le van a dar la investidura porque este Congreso no quiere irse 8 de marzo 92315
Estadística Descriptiva 2022 01 97
Día de es- Número de vi-
Título
treno sualizaciones
Si no eres chotano, no eres nada. Es el clon del Juan Silva 7 de marzo 117963

a. Calcule e interprete el valor del percentil 80.

𝑃<, = 104 715 visualizaciones

En Excel se usa =PERCENTIL.EXC(A2:A16;0.8)

El 80% de los programas Sin Guion en la muestra tuvieron hasta 104715 visualizaciones.

b. ¿Cuál debe ser el mínimo valor del número de visualizaciones para pertenecer al 15% de sus videos
más vistos?

85% 15%
Menos vistos 𝑃<H Más vistos

Nos piden calcular el percentil 85.

𝑃<H = 112723,8 visualizaciones

En Excel se usa =PERCENTIL.EXC(A2:A16;0.85)

El mínimo valor del número de visualizaciones para pertenecer al 15% de sus videos más vistos es
112,723,8.

c. ¿Cuál debe ser el máximo valor del número de visualizaciones para pertenecer al 30% de sus videos
menos vistos?

30% 70%
Menos vistos 𝑃), Más vistos

Nos piden calcular el percentil 30.

𝑃), = 73 275,6 visualizaciones

En Excel se usa =PERCENTIL.EXC(A2:A16;0.30)

El máximo valor del número de visualizaciones para pertenecer al 30% de sus videos menos vistos
es 73 275,6.
Estadística Descriptiva 2022 01 98
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.

Cálculo del rango intercuartil

𝑅𝑎𝑛𝑔𝑜 𝑖𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = 𝑅𝐼𝐶 = 𝑄) – 𝑄# = 𝑃GH – 𝑃$H

25% 50% 25%

P25 RIC = P - P P75


75 25

Características del rango intercuartil


• Se puede calcular en variables medidas en escala de intervalo o razón.
• No se ve afectado por valores extremos.

Diagrama de cajas
El diagrama de cajas o box plot es una gráfica que describe la distribución de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango
intercuartil como medida de referencia de dispersión.

Valor atípico
Es un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera valor atípico
a cualquier punto mayor al límite superior (a la derecha) o menor al límite inferior (o a la izquierda); es
decir, que se encuentre fuera de los límites.

Un valor atípico aparece cuando:


• Hay un elemento extraño en la muestra.

• Hay un error de ingreso en los datos.

Edad de un perro, en años 1 1 3 30 6 8 12

• El registro es correcto pero es un caso poco común.


Estadística Descriptiva 2022 01 99
Pasos para trazar un diagrama de cajas

1. Dibuje el eje vertical, eje horizontal, título, rótulos de los ejes y fuente. La variable 1 (cuantitativa)
se representa en el eje vertical y la variable 2 en el eje horizontal.

Distribución de unidades elementales según variable 1 por variable 2


Variable 1 (Cuantitativa)
Unidad de medición

Categoría 1 Categoría 2 Categoría 3

Fuente: Variable 2

2. Trace un rectángulo con los extremos del percentil 25 y percentil 75, en cada categoría. En la caja
trace una recta horizontal en el lugar del percentil 50.

Distribución de unidades elementales según variable 1 por variable 2

𝑃&%
Variable 1 (Cuantitativa)

𝑃%'
Unidad de medición

𝑃"%

Categoría 1 Categoría 2 Categoría 3


Fuente: Variable 2

3. Ubique los límites inferior y superior mediante el rango intercuartil, el límite superior está a
1,5 𝑅𝐼𝐶 arriba del P75, mientras que, el límite inferior está a 1,5 𝑅𝐼𝐶 debajo del P25.

o Trace los bigotes desde los extremos de las cajas hasta los valores mínimo y máximo dentro de
los límites inferior y superior.
o Marque con asteriscos (*) las localizaciones de los valores atípicos.
Estadística Descriptiva 2022 01 100
Distribución de unidades elementales según variable 1 por variable 2

*
𝑃&%

Variable 1 (Cuantitativa)
𝑃%'

Unidad de medición
𝑃"%

*
Categoría 1 Categoría 2 Categoría 3
Fuente: Variable 2

En el diagrama de cajas, también se puede poner las categorías en el eje vertical, con lo que
las cajas y los bigotes estarán de forma horizontal.

Distribución de unidades elementales según variable 1


por variable 2
Categoría 1

*
Variable 2
Categoría 2
Categoría 3

𝑃"% 𝑃%' 𝑃&%

Variable 1 (Cuantitativa)
Fuente: Unidad de medición

Diagrama de cajas en Excel


Para construir un diagrama de cajas usando Excel:
• Seleccione las columnas con los datos, incluidos los rótulos.
• Haga clic en la pestaña Insertar y, a continuación, haga clic en (el icono de gráfico estadístico )

• Seleccione Cajas y bigotes .


Estadística Descriptiva 2022 01 101
Casos en la construcción del diagrama de cajas

En la construcción del diagrama de cajas se pueden presentar dos casos, cuando el valor mínimo o
máximo son valores atípicos.

Caso 1: Cuando el valor mínimo es un valor atípico


Si el valor mínimo es un valor atípico, entonces el bigote debe llegar hasta el dato siguiente al valor
mínimo, considerando a este valor como nuevo valor mínimo.

Por ejemplo, si el límite inferior 𝐿! = 1,7; el percentil 25 𝑃$H = 3,5 y los datos son:

1,5 1,8 2,2 3,4 4,2 … … … 5,8 6,7

Entonces:

3,5 Percentil 25 𝑃"#


Bigote inferior

Valor mínimo dentro de los límites 1,8


Límite inferior 𝐿! = 1,7
1,5
Valor atípico *

Caso 2: Cuando el valor máximo es un valor atípico


Si el valor máximo es un valor atípico, entonces el bigote debe llegar hasta el dato anterior al valor
máximo, considerando a este valor como nuevo valor máximo.

Por ejemplo, si el límite superior 𝐿* = 6,2, ; el percentil 75 𝑃GH = 3,8 y los datos son:

1,5 1,8 2,2 3,4 4,2 … … … 5,8 6,7

Entonces:

*
Valor atípico 6,7
Límite superior 𝐿$ = 6,2
Valor máximo dentro de los límites 5,8

Bigote superior
3,8 Percentil 75 𝑃%#
Estadística Descriptiva 2022 01 102
Interpretación de un diagrama de cajas

El diagrama de cajas permite:

• Comparar los cuartiles de dos o más conjuntos de datos.


• Comparar el rango de dos o más conjuntos de datos.
• Comparar el rango intercuartil de dos o más conjuntos de datos.
• Observar el tipo de distribución de los datos.
• Observar el tipo de distribución de los datos en el 50% central.
• Identificar la presencia de valores atípicos.
• Identificar los valores mínimos y máximos.

Distribución de elementos según variable cuantitativa por variable cualitativa

Valor atípico *
P75 *
P50
Variable cuantitativa

Máximo
P25
Rango Asimetría

RIC
Asimetría en el
50% central
* Valor atípico
Mínimo

Categoría A Categoría B Categoría C


Variable cualitativa
Fuente: ...

Ejemplo 26

Los registros policíacos del distrito A muestran los números de informes de delitos diarios para una
muestra de días durante los meses de invierno y una muestra de días durante los meses de verano.

Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28

Construya un gráfico que permita comparar, entre invierno y verano, los valores medianos, la variabi-
lidad y encontrar los valores atípicos del número de delitos diarios. Se destinará más efectivos policia-
les en la estación (invierno o verano) que presente mayor cantidad de delitos.
Estadística Descriptiva 2022 01 103
Solución

Interpretación
Se debe hacer un gráfico que permita comparar la cantidad de delitos diarios.

Representación
Se hará un diagrama de cajas del número de delitos diarios por estación.

Cálculo
Calculemos los percentiles y los rangos intercuartiles. Se debe calcular los percentiles con datos sim-
ples. No calcule la distribución de frecuencias.

Estadísticos Invierno Verano


Percentil 25 7,25 9,0
Percentil 50 16,0 20,0
Percentil 75 20,75 26,75
Rango intercuartil 20,75 – 7,25 = 13,5 26,75 – 9,0 = 17,75
Largo máximo del bigote = 1,5 RIC 1,5 x 13,5 = 20,25 1,5 x 17,75 = 26,625
Límite inferior = P25 – 1,5 RIC 7,25 – 20,25 = -13 9,0 – 26,625 = -17,625
Límite superior = P75 + 1,5 RIC 20,75 + 20,25 = 41 26,75 + 26,625 = 53,375

En el invierno, los bigotes llegan como mínimo a 5 y como máximo a 22 y en el verano, llegan como
mínimo a 5 y como máximo a 28.

Distribución de delitos según estación del año

Fuente: Comisaría del distrito A

Análisis y argumentación
La mediana es mayor en verano, el 𝑅𝐼𝐶 es más grande en invierno, no hay valores atípicos, pues ningún
dato está fuera de los límites.

De acuerdo al gráfico se debe destinar más efectivos policiales en verano.


Estadística Descriptiva 2022 01 104
Ejercicios
Se quiere comparar los tiempos para realizar una cierta tarea, con y sin capacitación. ¿Se podría afirmar
que la capacitación reduce el tiempo de realizar la tarea?

Tiempo, en minutos, para realizar una tarea, sin o con capacitación


Sin 10 13 20 22 25 26 27 30 34 35 35 40 41 42 43 46 47 54 80 86
Con 5 11 12 13 15 24 24 24 25 26 30 31 31 33 34 35 39 45 80

Solución

Interpretación

Representación

Cálculo

Estadísticos Sin capacitación Con capacitación


Percentil 25 15
Percentil 50 26
Percentil 75 34
Rango intercuartil 19
Largo máximo del bigote = 1,5 RIC 28,5
Límite inferior = P25 – 1,5 RIC -13,5
Límite superior = P75 + 1,5 RIC 62,5
Mínimo 5
Máximo 80

Distribución de trabajadores según tiempo por condición de capacitación


90
80
Tiempo en realizar la tarea

70
60
50
40
30
20
10
0
Sin capacitación Con capacitación
Condición de capacitación
Fuente: Empresa A

Análisis y argumentación
Estadística Descriptiva 2022 01 105
83. El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en la si-
guiente tabla.

6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60

Calcule el rango y el rango intercuartil de los datos. Rpta: Rango = 54, RIC = 6

84. De datos sacados de la Intranet de la Universidad A, se desea comparar el resultado de la primera


práctica de tres horarios de un curso de Estadística, para lo cual, se tienen los siguientes resultados.

H1 10 11 11 12 12 12 12 13 13 13 14 15 15 16 16 17 18 18 19 19 19 20
H2 4 11 11 11 12 12 13 13 14 14 15 15 16 16 15 16 16 17 17 18
H3 9 9 10 10 10 11 12 12 12 12 13 13 13 13 14 14 15 15 15 17

Construya un diagrama de cajas que permita comparar el resultado de los horarios.

Indique el horario con mayor mediana de notas, el horario con mayor rango intercuartil y el ho-
rario donde existen valores atípicos.
El horario con mayor mediana de notas es el horario 1 y 2 (14,5 puntos).
Estadística Descriptiva 2022 01 106

El horario con mayor rango intercuartil es el horario 1 (RIC = P75 – P25 = 18 - 12 = 6 puntos)

RIC

El horario donde existen valores atípicos es el horario 2 (El valor atípico es 4 puntos).

85. Complete el siguiente texto:

“Los datos atípicos se define como …”


“Se trazan los bigotes desde los ... de las cajas hasta los valores mínimo y máximo … de los límites
inferior y superior”.
Estadística Descriptiva 2022 01 107
Ejercicios adicionales

86. Complete el siguiente cuadro con la mejor respuesta posible de acuerdo con la frase mencionada.

Frase Se debe calcular o realizar:

“Calcule el valor más frecuente de los datos”

“Determine el grupo que tenga mayor variabilidad


en el 50% de los valores centrales”

“Encuentre el grupo que tenga valores concentra-


dos en los valores más pequeños”

“Determine el grupo que tenga mayor variabilidad


de los datos”

“Haga un gráfico que muestre la distribución por-


centual según la variable 1 por la variable 2”

“Calcule el valor mínimo para estar en el cuarto su-


perior de los datos”

“Calcule la mejor medida de tendencia central (me-


dia o mediana) cuando hay mucha asimetría”

“Realice un gráfico que permita visualizar los valo-


res atípicos”

“Calcule el valor para el cual los valores están alre-


dedor”

“Calcular el valor que está en el centro de los da-


tos”

“Haga un gráfico que muestre que pocos factores


son vitales y muchos son triviales”

“Calcule el valor máximo para estar en el quinto in-


ferior de los datos”

“Calcule un estadístico que se pueda calcular en to-


das las escalas de medición”

“Haga un gráfico que muestre las frecuencias acu-


muladas”

“Si la medida de variabilidad es igual a 15%, nos re-


ferimos a…”
Estadística Descriptiva 2022 01 108
87. Marque con una equis las medidas de resumen que se pueden calcular con una variable medida
en cada escala de medición.

Medida de resumen Nominal Ordinal Intervalo Razón


Media
Mediana
Moda
Percentil
Varianza
Desviación estándar
Coeficiente de variación
Rango
Rango intercuartil
Coeficiente de asimetría

88. Indique si son verdaderas o falsas las siguientes afirmaciones.

a. La mediana se puede calcular solo en variables cuantitativas.


b. La media es un valor que siempre está entre el mínimo valor y el máximo valor de los datos.
c. La media se puede calcular solo en variables medidas en escala de razón.
d. El percentil 90 es siempre mayor al percentil 10.
e. El cuartil 2 es igual al decil 5.
f. El percentil siempre se expresa en porcentaje.
g. Si todos los pesos son iguales, la media ponderada es igual a la media aritmética.
h. La media ponderada no tiene unidades.
i. El coeficiente de asimetría tiene unidades las mismas unidades que los datos.
j. Si a cada valor de un grupo de datos se le aumenta en 10%, el coeficiente de asimetría no va-
ría.
k. Si a cada valor de un grupo de datos se le aumenta 10 unidades, el coeficiente de asimetría
no varía.
l. En un diagrama de cajas siempre se puede conocer el máximo y mínimo de un grupo de da-
tos.
m. El coeficiente de variación se puede calcular en escalas de intervalo y de razón.
n. Si las unidades de los datos son minutos, la varianza se expresa en minutos al cuadrado.
o. El rango intercuartil se ve muy afectado por valores muy grandes o muy pequeños.
p. El coeficiente de variación tiene las mismas unidades que la varianza.

Rpta: F, V, F, F, V, F, V, F, F, V, V, V, F, V, F, F
Estadística Descriptiva 2022 01 109

Unidad 2. Teoría de la probabilidad

Logro de la unidad 2
Al finalizar la Unidad 2, el estudiante analiza situaciones reales de incertidumbre aplicando los con-
ceptos de probabilidades valorando su utilidad en la toma de decisiones.

Temario
• Reglas de conteo y combinaciones
• Probabilidad: concepto, experimento aleatorio, espacio muestral y evento
• Operaciones con eventos
• Probabilidad condicional
• Probabilidad total
• Teorema de Bayes
• Diagrama del árbol
• Eventos independientes
Estadística Descriptiva 2022 01 110

Experimentos, reglas de conteo y asignación de probabilidades


La probabilidad mide o cuantifica la posibilidad de ocurrencia de un evento.

Ejemplo 27

Ejemplo 28
El silencio sísmico de más de 270 años que se registra en Lima indica que existen altas probabilidades
de que la capital sea sacudida, en algún momento, por un sismo de magnitud superior a 8,5; advirtió
el presidente ejecutivo del Instituto Geofísico del Perú (IGP).
Estadística Descriptiva 2022 01 111
Experimento aleatorio
Es todo proceso que genera dos o más resultados bien definidos sin que se pueda predecir con certeza
cuál de ellos será observado u ocurrirá en cada realización del proceso. En cualquier repetición simple
de un experimento, ocurrirá uno y solo uno de los posibles resultados experimentales.

Espacio muestral
Es el conjunto de todos los posibles resultados de todos los resultados experimentales. Se le suele
simbolizar por 𝑆 o Ω.

Evento
Un evento es un subconjunto del espacio muestral. Al realizar un experimento, diremos que el evento
A ha ocurrido si el resultado obtenido es un elemento del evento A.

Probabilidad de un evento
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por tanto, la pro-
babilidad es una medida del grado de incertidumbre asociado con un evento.

Un valor de probabilidad cercano a 0 indica que es muy improbable que ocurra el evento, mientras
que una probabilidad cercana a 1 indica que es casi seguro que ocurra el evento.

El objetivo del cálculo de probabilidades es el obtener un valor numérico asociado con la ocurrencia
de determinado acontecimiento para facilitar la toma de decisiones relacionada con él.

Imposible Improbable Igualmente probable o improbable Probable Seguro


0 0,2 0,5 0,8 1

Definición clásica de probabilidad (a priori)

Sea un experimento aleatorio cuyo correspondiente espacio muestral W está formado por un número
finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces, definimos la
probabilidad de un evento 𝐴 como sigue:

𝑛(𝐴)
𝑃(𝐴) =
𝑛(Ω)

donde:
𝑛(𝐴) es el número de elementos del evento 𝐴
𝑛(Ω) es el número de elementos del espacio muestral
Estadística Descriptiva 2022 01 112
Ejercicios

89. Marque con un aspa, asignando una opción a la situación de acuerdo con su posibilidad de ocu-
rrencia.

Muy Poco Igualmente Muy


Bastante
Situación poco probable que
probable probable probable
probable ocurra o no
Una mujer será la próxima pre-
X
sidenta del Perú.
Perú clasificará al Mundial Qa-
X
tar 2022.
Aprobaré este curso. X

90. Complete el siguiente cuadro asignando probabilidades según su parecer.

Experimento aleatorio Espacio muestral Un evento Probabilidad


Se invierte en una empresa de
productos de higiene y se regis- Ω = {rentable; no ren-
𝐴 = {rentable} P(A) = 0,90
tra si la empresa es o no renta- table}
ble al final del año.

Se invierte en una empresa de


turismo y se registra si la em- Ω = {rentable; no ren-
𝐴 = {rentable} P(A) = 0,50
presa es o no rentable al final table}
del año.

91. Complete el siguiente cuadro.

Experimento aleatorio Espacio muestral Evento Probabilidad

Se lanza un dado, cal- 𝑛(𝐴) 2


cule la probabilidad de Ω = {1, 2, 3, 4, 5, 6} A = {3, 5} 𝑃(𝐴) = =
que salga 3 ó 5. 𝑛(Ω) 6

Se lanzan dos dados, A = {(2,6); (3,6); (4,6);


calcule la probabilidad Ω = {(1,1); (1,2); (5,6); (6,6); (3;5); (4,5); 𝑛(𝐴) 15
𝑃(𝐴) = =
de que la suma sea (1,3); …; (6,6)} (5,5) (6,5); (4,4) ;(5,4); 𝑛(𝑆) 36
mayor a 7. (6,4) (5,3); (6,3); (6,2)}
Se saca una bola de
una urna con tres bo- Ω = {𝑅# ; 𝑅$ ; 𝑅) ;
jas rojas y cuatro ne- 𝑛(𝐴) 3
𝑁# ; 𝑁$ ; 𝑁) ; 𝑁- } A = {𝑅# ; 𝑅$ ; 𝑅) } 𝑃(𝐴) = =
gras, calcule la proba- 𝑛 (𝑆) 7
bilidad de que sea
roja.
Estadística Descriptiva 2022 01 113
Ejercicios

92. Indicar, para cara uno de los siguientes experimentos aleatorios, los respectivos espacios mues-
trales: lanzar una moneda, jugar un partido de fútbol, jugar un partido de tenis, lanzar un dado,
lanzar dos dados.

93. Un experimento consiste en lanzar primero un dado para después lanzar una moneda, siempre y
cuando el número del dado sea par. Si el resultado del dado es impar, la moneda se lanza dos
veces. Determine el espacio muestral de este experimento.

94. Se lanzan dos dados, calcule la probabilidad de que la suma de los dos dados sea mayor a siete.
Rpta: 0,4167

95. De 50 conductores, nueve no tienen los papeles en regla. Si un policía escoge al azar a cinco con-
ductores y les pide sus papeles.

a. Calcule la probabilidad de que elija a dos que no tengan los papeles en regla. Rpta: 0,1811
b. Calcule la probabilidad de que elija al menos un conductor sin papeles en regla. Rpta: 0,6463

96. En un lote de polos, hay 70 polos rojos, 150 blancos y 90 azules. Si extrae un polo al azar.

a. ¿Cuál es la probabilidad de que el polo sea azul o blanco? Rpta: 0,7742


b. ¿Cuál es la probabilidad de que no sea azul? Rpta: 0,7097
Estadística Descriptiva 2022 01 114
Algunas relaciones básicas de probabilidad

Con frecuencia se construyen eventos mediante la combinación de eventos más sencillos. Es usual
emplear la notación de conjuntos para describir los eventos construidos de esta forma.

Sea 𝜀 un experimento aleatorio y Ω el espacio muestral asociado. Si 𝐴 y 𝐵 son dos eventos definidos
en Ω, se define las siguientes operaciones con eventos.

Complemento (AC)
Para un evento 𝐴 cualquiera se define su complemento 𝐴K como el evento consistente en todos los
puntos de Ω que no están en 𝐴.

Ac

Se tiene que

𝑃(𝐴) = 1 − 𝑃(𝐴K )

𝐴K se expresa como: “El evento 𝐴 no ocurre”.

Unión de eventos (A È B)
Para dos eventos 𝐴 y 𝐵, la unión del evento 𝐴 con el evento 𝐵 es el evento que contiene todos los
puntos de 𝑆 que pertenecen a 𝐴 o a 𝐵 o a ambos.

A B

𝐴 ∪ 𝐵 se expresa como: “Al menos uno de los eventos A o B ocurre”.


Estadística Descriptiva 2022 01 115
Intersección de eventos (A ∩ B)
Para dos eventos 𝐴 y 𝐵, la intersección de los eventos 𝐴 y 𝐵 es el evento que contiene todos los puntos
de Ω que pertenecen tanto a 𝐴 como a 𝐵.

A B

𝐴 ∩ 𝐵 se expresa como: “Ambos eventos, 𝐴 y 𝐵 ocurren a la vez”.

Diferencia de eventos (A - B)
Para dos eventos 𝐴 y 𝐵, la diferencia de los eventos 𝐴 menos 𝐵 es el evento que contiene todos los
puntos de Ω que pertenecen a 𝐴 y no pertenecen a 𝐵.

A B

𝐴 − 𝐵 se expresa como: “Ocurre el evento 𝐴 pero no el evento 𝐵”.

Diferencia simétrica de eventos (A ∆ B)


Para dos eventos 𝐴 y 𝐵, la diferencia simétrica de los eventos 𝐴 y 𝐵 es el evento que contiene todos
los puntos de Ω que pertenecen solo a 𝐴 o aquellos que solo pertenecen a 𝐵.

A B

𝐴 Δ 𝐵 se expresa como: “Ocurre solo uno de los eventos 𝐴 o 𝐵”.


Estadística Descriptiva 2022 01 116
Ejercicios
Un financista invierte en fondos mutuos y en la Bolsa de Valores.

Se definen los eventos:


𝐴:= que el financista tenga éxito en la inversión de fondos mutuos.
𝐵:= que el financista tenga éxito en la inversión en la Bolsa de Valores.

Escriba los siguientes eventos en función de los eventos 𝐴 y 𝐵. Además, grafique dicho evento en un
diagrama de Venn.

Solución

Evento Notación Diagrama de Venn

A B
que el financista tenga éxito en las dos inver-
𝐴∩𝐵
siones

A B
que el financista no tenga éxito en la Bolsa de K
𝐵
Valores

A B
que el financista tenga éxito en, al menos una,
𝐴∪𝐵
de sus inversiones

A B
que el financista tenga éxito solamente en una
𝐴 Δ 𝐵
de sus inversiones

A B
que el financista tenga éxito en la Bolsa de Va-
𝐵−𝐴
lores, pero no en los fondos mutuos
Estadística Descriptiva 2022 01 117
Eventos mutuamente excluyentes

Dos eventos son mutuamente excluyentes o disjuntos si no tienen puntos de Ω en común.

Los eventos 𝐴 y 𝐵 son mutuamente excluyentes si y solo si 𝐴 ∩ 𝐵 = f.

A B

Reglas de conteo y combinaciones

Regla de la adición

Si 𝐴 y 𝐵 son eventos mutuamente excluyentes, entonces:

𝑛(𝐴 ∪ 𝐵) = 𝑛(𝐴) + 𝑛(𝐵)

Regla de la multiplicación

Si un experimento se realiza por una sucesión de 𝑘 pasos, en el primer paso tiene 𝑛# resultados posi-
bles, el segundo tiene 𝑛$ resultados posibles y así sucesivamente, entonces el número total de resul-
tados del experimento es:

𝑛(𝐴) = 𝑛# × 𝑛$ × … × 𝑛%

Regla de conteo para combinaciones

La cantidad de formas de seleccionar 𝑥 objetos de un total de 𝑛 objetos distinguibles sin tomar en


cuenta el orden es:

𝑛!
𝑛(𝐴) = 𝐶D7 =
𝑥! (𝑛 − 𝑥)!
Estadística Descriptiva 2022 01 118
Ejercicios

97. Indique si los siguientes eventos son mutuamente excluyentes.

𝐴: Estudio mucho el curso Estadística, 𝐵: Desapruebo el curso Estadística No


𝐴: Apruebo el curso Estadística, 𝐵: Desapruebo el curso Estadística Sí
𝐴: Hoy estudio Administración y Negocios Internacionales en la UPC, 𝐵: Hoy estudio Administra-
ción y Marketing en la UPC Sí

98. Una persona puede elegir solo una de dos opciones para almorzar: una de cinco diferentes ham-
burguesas o una de diez pizzas diferentes. ¿De cuántas maneras diferentes puede almorzar dicha
persona?

Por el principio de la adición, pues los eventos son mutuamente excluyentes.

𝐴 ≔ que la persona elija una hamburguesa


𝐵 ≔ que la persona elija una pizza

𝑛(𝐴 ∪ 𝐵) = 𝑛(𝐴) + 𝑛(𝐵) = 5 + 10 = 15

99. Un restaurante tiene la siguiente carta. Si un menú consta de elegir un entrante, un segundo y un
postre, ¿de cuántas maneras diferentes puede elegir un cliente su menú?

Por el principio de la multiplicación.

𝑛(𝐴) = 𝑛# × 𝑛$ × 𝑛) = 5 × 5 × 4 = 100
Estadística Descriptiva 2022 01 119
100. En un vuelo, la aerolínea ha sobrevendido pasajes, por lo que tendrá que ofrecer premios a pasa-
jeros para que no viajen en ese vuelo. Si hay 15 pasajeros que viajan solos y están dispuestos a no
viajar y recibir los premios ¿De cuántas maneras diferentes se puede elegir a solo ocho de ellos?

Por la regla de combinaciones.

15!
𝑛(𝐴) = 𝐶<#H = = 6435
8! × (15 − 8)!

En Excel se usa =COMBINAT(15;8) = 6435


En Casio; 15; Shift; ÷; 8; =. 15C8 =6435

101. Para jugar la Tinka se debe elegir seis números de un total de 45, sin importar el orden.
a. ¿De cuántas maneras diferentes se puede elegir seis números de un total de 45?
b. ¿Cuál es la probabilidad de que una persona gane la Tinka con una jugada?

102. En un hogar hay diez personas y un encuestador necesita entrevistar a dos de ellas, sin importar
el orden. ¿De cuántas maneras diferentes se puede elegir a esas dos personas? Rpta: 45

103. Al fin del ciclo, los 30 alumnos de una sección deben elegir a tres de ellos al azar para que organi-
cen un “compartir”. ¿Cuántos grupos diferentes de tres personas se pueden elegir?
Rpta: 4060
Estadística Descriptiva 2022 01 120
Axiomas de la probabilidad

Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y 𝐴 un


evento definido en Ω, entonces la probabilidad del evento 𝐴, denotada por 𝑃(𝐴), es aquel número
que cumple los siguientes axiomas:

Axioma 1
0 £ 𝑃(𝐴) £ 1
Axioma 2
𝑃(𝑆) = 1
Axioma 3
Si 𝐴 y 𝐵 son dos eventos mutuamente excluyentes entonces:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

Ley aditiva para eventos cualesquiera

Sean A, B y C tres eventos cualesquiera, se cumple que:

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)– 𝑃(𝐴 ∩ 𝐵)

A B

𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐵 ∩ 𝐶) + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)

A B

C
Estadística Descriptiva 2022 01 121
104. La probabilidad de una persona sea contagiada por el virus A es de 0,12 y de que sea contagiada
por el virus B es 0,2; mientras que la probabilidad de que sea contagiada por alguno de los dos
virus es 0,25. Calcule la probabilidad de que ocurran los siguientes eventos.

Definamos los eventos.


𝐴 ≔ que la persona sea contagiada por el virus A 𝑃(𝐴) = 0,12
𝐵 ≔ que la persona sea contagiada por el virus B 𝑃(𝐵) = 0,20

Por ley aditiva, sabemos que:


𝑃(𝐴 ∪ 𝐵) = 0,25

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

0,25 = 0,12 + 0,20 − 𝑃(𝐴 ∩ 𝐵)

𝑃(𝐴 ∩ 𝐵) = 0,07

A B

0,05 0,07 0,13

0,75

Evento Probabilidad Diagrama de Venn

A B
que sean contagiados por los
𝑃(𝐴 ∩ 𝐵) = 0,07
dos virus.

A B
que sea contagiado por solo
𝑃(𝐴 ∆ 𝐵) = 0,05 + 0,13 = 0,18
un virus.

A B
que sea contagiado solo por el K
𝑃(𝐵 − 𝐴) = 𝑃(𝐴 ∩ 𝐵) = 0,13
virus B.

105. Un fabricante de teléfonos celulares acaba de lanzar dos modelos de smartphones económicos:
el L720 y el L520. La probabilidad de que el modelo L720 tenga éxito es 0,70 y en el modelo L520
es 0,60. La probabilidad de que al menos uno de los modelos tenga éxito es 0,90. Determine la
probabilidad de que se tenga éxito solo en uno de los modelos. Rpta: 0,5

106. La probabilidad de que una persona viaje a Alemania el próximo año es 0,40; a Bélgica es 0,5 y
Chipre es 0,37. Además, la probabilidad de viajar a Alemania y Bélgica es 0,15; a Alemania y Chipre
es 0,10 y a Bélgica y Chipre es 0,12. Si la probabilidad de que la persona viaje a por lo menos a una
ciudad es 0,95; calcule la probabilidad de que la persona viaje a una sola ciudad.
Estadística Descriptiva 2022 01 122

Probabilidad condicional

Sean los eventos 𝐴 y 𝐵 definidos en el espacio muestral Ω, entonces la probabilidad de que ocurra el
evento 𝐴 teniendo como condición que el evento 𝐵 ya ocurrió, se denomina probabilidad condicional.

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵) =
𝑃(𝐵)

“Lo que yo se” lo escribo a la derecha


“Lo pedido” lo escribo a la izquierda

A B

𝑃(𝐵)
𝑃(𝐴 ∩ 𝐵)

Ejemplo 29
En un grupo, conformado por hombres y mujeres, existen profesionales y no profesionales de acuerdo
con la siguiente tabla.

Condición Hombre (B) Mujer (Bc) Total


Profesional (A) 1 2 3
No profesional (Ac) 7 10 17
Total 8 12 20

Si se elige una mujer al azar, calcule la probabilidad de que sea profesional.


Solución
Primero, definamos los eventos necesarios para resolver este problema:
𝐵K := Que la persona escogida sea mujer
𝐴:= Que la persona escogida sea profesional
La probabilidad pedida es:
𝑃(𝐴 ∩ 𝐵K ) 2
𝑃(𝐴⁄𝐵K ) = = = 0,16667
𝑃(𝐵 )
K 12

Condición Hombre (B) Mujer (Bc) Total


Profesional (A) 1 2 3
No profesional (Ac) 7 10 17
Total 8 12 20
Estadística Descriptiva 2022 01 123
Ejemplo 30
El gerente de Wallmarket al distribuir los productos en las diferentes tiendas toma una muestra de 250
unidades de los tres productos y en los dos tipos de envases, del almacén con la idea de distribuirlos
aleatoriamente en las tiendas. La distribución de los productos es la siguiente:

Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250

a. Si se elige un producto al azar, para una de las tiendas, calcule la probabilidad de que sea jugo de
maracuyá y en frasco.
b. ¿Cuál es la probabilidad de que sea mermelada o el envase sea de sachet?
c. Si el envase es sachet, ¿cuál es la probabilidad de que sea esencia?

Solución

a. Si se elige un producto al azar, para una de las tiendas, calcule la probabilidad de que sea jugo de
maracuyá y en frasco.

Solución
Lo primero es definir los eventos necesarios.
𝐽:= que el producto elegido sea jugo
𝐹:= que la presentación elegida sea frasco

En la tabla observamos que lo pedido es:

62
𝑃(𝐽 ∩ 𝐹) = = 0,248
250

Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250

b. ¿Cuál es la probabilidad de que sea mermelada o el envase sea de sachet?

Solución
Sean los eventos:
𝑀:= que el producto elegido sea mermelada
𝑆:= que la presentación elegida sea sachet
Estadística Descriptiva 2022 01 124

En la tabla observamos que lo pedido es:

𝑃(𝑀 ∪ 𝑆) = 𝑃(𝑀) + 𝑃(𝑆) − 𝑃(𝑀 ∩ 𝑆)

88 120 50
= + − = 0,632
250 250 250

Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250

c. Si el envase es sachet, ¿cuál es la probabilidad de que sea esencia?

Solución

Sean los eventos:

𝐸:= que el producto elegido sea esencia


𝑆:= que la presentación elegida sea sachet

En la tabla observamos que lo pedido es:

20
𝑃(𝐸/𝑆) = = 0,167
120

Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
Estadística Descriptiva 2022 01 125
Ejemplo 31
La mayoría de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95 octanos y 97
octanos. Con frecuencia, alguna de cada está enriquecida con un aditivo. La tabla siguiente ilustra los
porcentajes de clientes que prefieren cada tipo.

90 octanos (B) 95 octanos (C) 97 octanos (D) Total


Con aditivo (A) 0,05 0,10 0,05 0,20
Sin aditivo (AC) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00

Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina.

a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?
b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado
gasolina de 97 octanos?
c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado
gasolina sin aditivo?

Solución

a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?

Solución

La probabilidad pedida es:

𝑃(𝐴 ∪ 𝐶 K ) = 𝑃(𝐴) + 𝑃(𝐶 K )– 𝑃(𝐴 ∩ 𝐶 K )

= 0,20 + 0,50 − (0,05 + 0,05) = 0,60

90 octanos (B) 95 octanos (C) 97 octanos (D) Total


Con aditivo (A) 0,05 0,10 0,05 0,20
Sin aditivo (AC) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00

b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado


gasolina de 97 octanos?

Solución
Estadística Descriptiva 2022 01 126
La probabilidad pedida es:

𝑃(𝐷 ∩ 𝐶 K )
𝑃(𝐷 ⁄𝐶 K ) =
𝑃 (𝐶 K )

0,30
= = 0,60
0,20 + 0,30

90 octanos (B) 95 octanos (C) 97 octanos (D) Total


Con aditivo (A) 0,05 0,10 0,05 0,20
Sin aditivo (AC) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00

c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado


gasolina sin aditivo?

Solución

La probabilidad pedida es:

𝑃(𝐴K ∩ 𝐵K )
𝑃(𝐴K ⁄𝐵K ) =
𝑃 (𝐵 K )

0,40 + 0,25
= = 0,8125
0,50 + 0,30

90 octanos (B) 95 octanos (C) 97 octanos (D) Total


Con aditivo (A) 0,05 0,10 0,05 0,20
Sin aditivo (AC) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00
Estadística Descriptiva 2022 01 127
Ejercicios

107. Objetivo específico: Analizar el comportamiento de los clientes considerando el destino de viaje,
el tipo de cliente y el modo de compra. Se ha obtenido la siguiente tabla.

Destino de viaje nacional (D) Destino de viaje internacional (E)


Tipo de cliente Compra presen- Compra por In- Compra Compra por In- Total
cial (F) ternet (G) presencial (F) ternet (G)
Premium (A) 12 28 38 13 91
Frecuente (B) 8 25 12 23 68
Ocasional (C) 7 15 9 10 41
Total 27 68 59 46 200

a. Si se elige al azar a un cliente que compra por Internet, calcule la probabilidad de que sea un viajero
premium.

Definamos los eventos necesarios.


𝐺 ≔ que el cliente compre por Internet
𝐴 ≔ que el cliente sea premium

La probabilidad pedida es:

28 + 13 41
𝑃(𝐴⁄𝐺 ) = =
68 + 46 114

Destino de viaje nacional (D) Destino de viaje internacional (E)


Tipo de cliente Compra presen- Compra por In- Compra Compra por In- Total
cial (F) ternet (G) presencial (F) ternet (G)
Premium (A) 28 13
Frecuente (B) 25 23
Ocasional (C) 15 10
Total 68 46

b. Si se elige al azar a un cliente frecuente, calcule la probabilidad de que compre pasajes con destino
nacional.

Definamos los eventos necesarios.


𝐵 ≔ que el cliente sea frecuente
𝐷 ≔ que el cliente compre destino nacional

La probabilidad pedida es:

8 + 25 33
𝑃(𝐷⁄𝐵 ) = =
68 68
Estadística Descriptiva 2022 01 128

Destino de viaje nacional (D) Destino de viaje internacional (E)


Tipo de cliente Compra presen- Compra por In- Compra Compra por In- Total
cial (F) ternet (G) presencial (F) ternet (G)
Premium (A)
Frecuente (B) 8 25 12 23 68
Ocasional (C)
Total

108. Según el II Censo Universitario, en el año 2010, 63 900 alumnos ingresaron a las universidades
públicas y 194 151 a las universidades privadas. De ellos, en las universidades públicas, 28 798
ingresantes fueron mujeres, mientras que en las privadas lo fueron 98 942.

a. Si se elige al azar a una ingresante, calcule la probabilidad de que estudie en una universidad
privada. Rpta: 0,77456
b. Si se elige al azar a un ingresante de universidad privada, calcule la probabilidad de que sea
mujer. Rpta: 0,50961

109. En una empresa hay 150 trabajadores; 25 de los hombres y 35 de las mujeres realizan actividades
de responsabilidad social en la empresa. El total de mujeres en la empresa es de 57.

a. Si elegimos al azar a un trabajador hombre, calcule la probabilidad de que realice actividades


de responsabilidad social. Rpta: 0,2688
b. Si elegimos al azar a un trabajador que no realice actividades de responsabilidad social, calcule
la probabilidad de que sea mujer. Rpta: 0,2444
c. Si elegimos al azar a un trabajador que realice actividades de responsabilidad social y que sea
mujer. Rpta: 0,2333
Estadística Descriptiva 2022 01 129
Ley multiplicativa para eventos cualesquiera

La ley multiplicativa se usa para calcular la probabilidad de una intersección de eventos.

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) 𝑃(𝐵/𝐴)

o de forma equivalente:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵) 𝑃(𝐴/𝐵)


Estadística Descriptiva 2022 01 130
Ejercicios

110. Un sistema de seguridad en una máquina tiene dos componentes. La probabilidad de que el pri-
mer componente falle es 0,75% y la probabilidad de que el segundo componente falle si el primero
ha fallado es 2%. El sistema falla si ambos componentes fallan. Si la probabilidad de que falle el
sistema de seguridad es mayor al 0,1% se pondrá un tercer componente de seguridad. Indique lo
que se hará.

Interpretación
Determinar si se pondrá un tercer componente de seguridad.

Representación
Definamos los eventos necesarios.
𝐴 ≔ que el primer componente falle 𝑃(𝐴) = 0,0075
𝐵 ≔ que el segundo componente falle 𝑃(𝐵⁄𝐴) = 0,02
Utilizaremos la ley multiplicativa.

Cálculo
La probabilidad pedida es la probabilidad de que falle el sistema de seguridad; el sistema falla si
ambos componentes fallan, es decir:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵 ⁄𝐴) = 0,0075 × 0,02 = 0,00015

𝑃(𝐵⁄𝐴) = 0,02 𝑃(𝐴 ∩ 𝐵)


𝑃(𝐴) = 0,0075
𝑃(𝐵K ⁄𝐴) = 0,98 𝑃(𝐴 ∩ 𝐵K )

𝑃(𝐵⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵)
𝑃(𝐴K ) = 0,9925
𝑃(𝐵K ⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵K )

Análisis y argumentación
La probabilidad de que falle el sistema de seguridad es 0,00015; que es menor a 0,001. Por lo
tanto, no se pondrá un tercer componente de seguridad.

111. Para elegir a una persona entre tres se prepara una bolsa con dos bolas negras y una bola blanca.
Los tres van sacando, por orden, una bola que no devuelven. Quien saque la bola blanca gana.
¿Quién lleva más ventaja: el primero, el segundo o el tercero? Rpta: Nadie
Estadística Descriptiva 2022 01 131
Partición del espacio muestral

Se denomina partición del espacio muestral Ω a una colección de 𝑘 eventos 𝐴# , 𝐴$ , , … , 𝐴% mutua-


mente excluyentes y cuya unión es el espacio muestral Ω, con las siguientes condiciones:

• 𝑃(𝐴! ) ≥ 0; para todo 𝑖 = 1, 2, 3, ⋯ , 𝑘


• 𝐴! ∩ 𝐴L = ∅ para todo 𝑖 ≠ 𝑗
• 𝐴# ∪ 𝐴$ ∪ ⋯ ∪ 𝐴% = Ω

W
𝐴# 𝐴$ … 𝐴%

Probabilidad total

Si 𝑘 eventos 𝐴# , 𝐴$ , , … , 𝐴% constituyen una partición del espacio muestral Ω, entonces la probabilidad


para cualquier evento 𝐵 de Ω se calcula:

𝑃(𝐵) = • 𝑃(𝐵 ∩ 𝐴! )
!6#

𝑃(𝐵) = • 𝑃(𝐴! )𝑃(𝐵/𝐴! )


!6#

La probabilidad pedida no es condicional.


W
𝐴# 𝐴$ … 𝐴%

𝐵
Estadística Descriptiva 2022 01 132
Árbol de probabilidades

El árbol de probabilidades es la tercera herramienta (el diagrama de Venn y la tabla de contingencias


son las dos herramientas anteriores) muy útil para el planteamiento de problemas, sobre todo cuando
hay como datos iniciales las probabilidades condicionales.

La elaboración de un árbol de probabilidades sencillo tiene la siguiente estructura:

𝑃(𝐵⁄𝐴) 𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴)
𝑃(𝐵K ⁄𝐴) 𝑃(𝐴 ∩ 𝐵K )

𝑃(𝐵⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵)
𝑃(𝐴K )
𝑃(𝐵K ⁄𝐴K ) 𝑃(𝐴K ∩ 𝐵K )

Teorema de Bayes

Si los 𝑘 eventos 𝐴# , 𝐴$ , 𝐴) , ⋯ , 𝐴% constituyen una partición del espacio muestral Ω y 𝑃(𝐴! ) ≠ 0 para
todo 𝑖 = 1, 2, 3, … , 𝑘; entonces para un evento 𝐵 cualquier contenido Ω tal que 𝑃(𝐵) ≠ 0.

𝑃(𝐴! ∩ 𝐵)
𝑃(𝐴! •𝐵) =
𝑃(𝐵)

Usando el teorema de la probabilidad total y la ley multiplicativa para eventos cualesquiera.

𝑃(𝐴! )𝑃(𝐵⁄𝐴! )
𝑃(𝐴! ⁄𝐵) = %
∑!6# 𝑃(𝐴! )𝑃(𝐵/𝐴! )

El teorema de Bayes establece una relación muy importante en la teoría de probabilidades y es la base
para la revisión de la asignación de probabilidades a la luz de información adicional.

Ejemplo 32

El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 2% de las usuarias y el 0,8% de
los usuarios han sufrido de algún tipo de robo durante el uso del Metropolitano.
Si se elige un usuario al azar que ha sido víctima de robo, calcule la probabilidad de que sea hombre y
la probabilidad de que sea mujer. Se va a establecer una oficina de protección al usuario y se pondrá
énfasis a los usuarios cuyo sexo tengan más probabilidad de sufrir algún tipo de robo.
Estadística Descriptiva 2022 01 133
Solución
Interpretación
Se va a determinar el sexo que tenga más probabilidad entre los que han sufrido un robo.

Representación
Sean los eventos:
𝑅:= Que el usuario sea víctima de robo
𝐻:= Que el usuario sea hombre.
𝑀:= Que el usuario sea mujer
Usaremos el teorema de la probabilidad total y el teorema de Bayes.

Cálculo
Por el teorema de la probabilidad total.

𝑃(𝑅⁄𝐻 ) = 0,008
𝑃(𝐻) = 0,55
𝑃(𝑅K ⁄𝐻) = 0,992

𝑃(𝑅 ⁄𝑀) = 0,020


𝑃(𝑀) = 0,45
𝑃(𝑅K ⁄𝑀) = 0,980

𝑃(𝑅) = 𝑃(𝐻)𝑃(𝑅⁄𝐻) + 𝑃(𝑀)𝑃(𝑅 ⁄𝑀)

𝑃(𝑅) = 0,55 × 0,008 + 0,45 × 0,020 = 0,0134

Por teorema de Bayes, calculemos cada probabilidad.

𝑃(𝐻) × 𝑃(𝑅 ⁄𝐻 ) 0,55 × 0,008


𝑃(𝐻 ⁄𝑅) = = = 0,3284
𝑃 (𝑅 ) 0,0134

𝑃(𝑀) × 𝑃(𝑅⁄𝑀) 0,45 × 0,020


𝑃(𝑀⁄𝑅 ) = = = 0,6716
𝑃 (𝑅 ) 0,0134

Análisis y argumentación
Entre los que han sufrido algún tipo de robo, las mujeres tienen una mayor probabilidad. Se pondrá
énfasis en la protección de las mujeres.
Estadística Descriptiva 2022 01 134
Ejemplo 33
Si Expórtame, una empresa que exporta productos alimenticios, distribuye sus productos de la si-
guiente manera: 45% en jugo, 35% en mermelada y el resto en esencia. Además, se sabe que la pro-
babilidad de que un jugo esté en mal estado es 4%, una mermelada es 2% y una esencia es 3%. Si de
los productos en mal estado se selecciona uno al azar, determine el tipo de producto que sea más
probable. Para dicho producto se establecerá un nuevo esquema de control de calidad.

Solución
Interpretación
Se debe determinar el tipo de producto que es más probable que esté en mal estado.

Representación
Sean los siguientes eventos:

𝐽: = que el producto elegido sea jugo


𝑀: = que el producto elegido sea mermelada
𝐸: = que el producto elegido sea esencia
𝐵: = que el producto elegido esté en buen estado

Para resolver este problema usaremos el teorema de Bayes.

Cálculo
Completemos el árbol de probabilidades.

𝑃(𝐵 ⁄𝐽) = 0,96


𝑃(𝐽) = 0,45
𝑃(𝐵K ⁄𝐽) = 0,04

𝑃(𝐵⁄𝑀) = 0,98
𝑃(𝑀) = 0,35
𝑃(𝐵K ⁄𝑀) = 0,02

𝑃(𝐵 ⁄𝐸) = 0,97


𝑃(𝐸) = 0,20
𝑃(𝐵K ⁄𝐸) = 0,03

Por el teorema de la probabilidad total, se tiene que:

𝑃(𝐵K ) = 𝑃(𝐽)𝑃(𝐵M ⁄𝐽) + 𝑃(𝑀)𝑃(𝐵M ⁄𝑀) + 𝑃(𝐸)𝑃(𝐵M ⁄𝐸 )

𝑃(𝐵K ) = 0,45 × 0,04 + 0,35 × 0,02 + 0,20 × 0,03 = 0,031


Estadística Descriptiva 2022 01 135
Por el teorema de Bayes, se tiene que:

𝑃(𝐽 ∩ 𝐵M ) 0,018
𝑃(𝐽⁄𝐵M ) = = = 𝟎, 𝟓𝟖𝟎𝟔
𝑃(𝐵M ) 0,031

𝑃(𝑀 ∩ 𝐵M ) 0,007
𝑃(𝑀⁄𝐵M ) = = = 0,2258
𝑃(𝐵M ) 0,031

𝑃(𝐸 ∩ 𝐵M ) 0,006
𝑃(𝐸⁄𝐵M ) = = = 0,1936
𝑃(𝐵M ) 0,031

Análisis y argumentación
De los productos en mal estado, el más probable es el jugo. Se establecerá un nuevo esquema de
control de calidad para los jugos.

Ejemplo 34

El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en
efectivo, con cheque o al crédito, con probabilidades respectivas de 0,3; 0,3 y 0,4.
La probabilidad de que una venta sea por más de $50, es igual a 0,2 si ésta es en efectivo, es igual a
0,9 si ésta es con cheque y es igual a 0,6 si ésta es al crédito.
Si compra por más de $50, ¿qué es más probable que haya pagado en efectivo, con cheque o al crédito?

Solución
Sean los eventos:
𝐸: La compra se realiza con dinero en efectivo
𝐶𝐻: La compra se realiza con cheque
𝐶: La compra se realiza al crédito
𝑀: La compra es por más de $ 50
𝑀M : La compra no es por más de $ 50

Con la información proporcionada, construimos el siguiente diagrama de árbol:

𝑃(𝑀⁄𝐸 ) = 0,2
𝑃(𝐸) = 0,3
𝑃(𝑀K ⁄𝐸) = 0,8

𝑃(𝑀⁄𝐶𝐻) = 0,9
𝑃(𝐶𝐻) = 0,3
𝑃(𝑀K ⁄𝐶𝐻) = 0,1

𝑃(𝑀⁄𝐶 ) = 0,6
𝑃(𝐶) = 0,4
𝑃(𝑀K ⁄𝐶 ) = 0,4
Estadística Descriptiva 2022 01 136
Por el teorema de la probabilidad total, se tiene que:

𝑃(𝑀) = 𝑃(𝐸)𝑃(𝑀⁄𝐸 ) + 𝑃(𝐶𝐻)𝑃(𝑀 ⁄𝐶𝐻) + 𝑃(𝐶)𝑃(𝑀⁄𝐶 )

𝑃(𝑀) = 0,3 × 0,2 + 0,3 × 0,9 + 0,4 × 0,6 = 0,57

Por el teorema de Bayes, se tiene que:

𝑃(𝐸 ∩ 𝑀) 0,3 × 0,2


𝑃(𝐸 ⁄𝑀) = = = 0,1053
𝑃(𝑀) 0,57

𝑃(𝐶𝐻 ∩ 𝑀) 0,3 × 0,9


𝑃(𝐶𝐻⁄𝑀) = = = 0,4737
𝑃(𝑀) 0,57

𝑃(𝐶 ∩ 𝑀) 0,4 × 0,6


𝑃(𝐶 ⁄𝑀) = = = 0,4211
𝑃(𝑀) 0,57

Se observa que es más probable la compra se haya hecho con cheque.


Estadística Descriptiva 2022 01 137
Ejercicios

112. En una empresa el 35% de los trabajadores son mujeres y el 65% son hombres. Un día ha llegado
tarde a trabajar el 2% de las mujeres y el 4% de los hombres.

a. Si se elige al azar a un trabajador, calcule la probabilidad de que haya llegado tarde.


b. Si se elige al azar a un trabajador que no ha llegado tarde, calcule la probabilidad de que sea
elegida una mujer.
Solución
Los eventos y el árbol de probabilidades necesarios para resolver este problema son:

𝐻:= que el trabajador elegido sea hombre


𝑀:= que el trabajador elegido sea mujer
𝑇:= que el trabajador haya llegado tarde

a. Si se elige al azar a un trabajador, calcule la probabilidad de que haya llegado tarde.

Usaremos el teorema de la probabilidad total, pues la probabilidad pedida no es condicional.

La probabilidad pedida es:

𝑃(𝑇) = 𝑃(𝐻)𝑃(𝑇⁄𝐻) + 𝑃(𝑀)𝑃(𝑇⁄𝑀) = 0,65 × 0,04 + 0,35 × 0,02 = 0,033

𝑃(𝑇) = 0,033

𝑃(𝑇⁄𝐻) = 0,04 𝑃(𝐻 ∩ 𝑇)


𝑃(𝐻) = 0,65
𝑃(𝑇 K ⁄𝐻 ) = 0,96 𝑃(𝐻 ∩ 𝑇 K )

𝑃(𝑇⁄𝑀) = 0,02 𝑃(𝑀 ∩ 𝑇)


𝑃(𝑀) = 0,35
𝑃(𝑇 K ⁄𝑀) = 0,98 𝑃(𝑀 ∩ 𝑇 K )

b. Si se elige, al azar a un trabajador que no ha llegado tarde, calcule la probabilidad de que sea
elegida una mujer.

Usaremos el teorema de Bayes, pues la probabilidad pedida es una condicional. La probabili-


dad pedida es:

𝑃(𝑀 ∩ 𝑇 K ) 0,35 × 0,98


𝑃(𝑀⁄𝑇 K ) = = = 0,354
𝑃(𝑇 K ) 1 − 0,033
Estadística Descriptiva 2022 01 138

𝑃(𝑇⁄𝐻) = 0,04 𝑃(𝐻 ∩ 𝑇)


𝑃(𝐻) = 0,65
𝑃(𝑇 K ⁄𝐻 ) = 0,96 𝑃(𝐻 ∩ 𝑇 K )

𝑃(𝑇⁄𝑀) = 0,02 𝑃(𝑀 ∩ 𝑇)


𝑃(𝑀) = 0,35
𝑃(𝑇 K ⁄𝑀) = 0,98 𝑃(𝑀 ∩ 𝑇 K )

113. Una empresa que fabrica polos mediante tres máquinas, A, B y C, producen el 25%, 30% y 45%,
respectivamente, del total de los polos producidos en la fábrica. Los porcentajes de producción
defectuosa de estas máquinas son del 2%, 4% y 3% respectivamente.

a. Si se elige un polo al azar; calcule la probabilidad de que sea no defectuoso. Rpta: 0,9695

Definamos los eventos necesarios.


𝐴 ≔ que el polo sea producido por la máquina A
𝐵 ≔ que el polo sea producido por la máquina B
𝐶 ≔ que el polo sea producido por la máquina C
𝐷 ≔ que el polo sea defectuoso
𝑃(𝐷⁄𝐴) = 0,02
𝑃(𝐴) = 0,25
𝑃(𝐷K ⁄𝐴) = 0,98

𝑃(𝐷⁄𝐵) = 0,04
𝑃(𝐵) = 0,30
𝑃(𝐷K ⁄𝐷 ) = 0,96

𝑃(𝐷⁄𝐶 ) = 0,03
𝑃(𝐶) = 0,45
𝑃(𝐷K ⁄𝐶 ) = 0,97

La probabilidad pedida es:

𝑃(𝐷K ) = 0,25 × 0,98 + 0,30 × 0,96 + 0,40 × 0,97 = 0,9695

b. Tomamos, al azar, un polo y resulta ser defectuoso; calcule la probabilidad de haber sido pro-
ducido por la máquina B. Rpta: 0,3934

La probabilidad pedida es:

𝑃(𝐵 ∩ 𝐷) 0,30 × 0,04


𝑃(𝐵⁄𝐷 ) = = = 0,3934
𝑃(𝐷) 1 − 0,9695
Estadística Descriptiva 2022 01 139

𝑃(𝐷⁄𝐴) = 0,02
𝑃(𝐴) = 0,25
𝑃(𝐷K ⁄𝐴) = 0,98

𝑃(𝐷⁄𝐵) = 0,04
𝑃(𝐵) = 0,30
𝑃(𝐷K ⁄𝐵 ) = 0,96

𝑃(𝐷⁄𝐶 ) = 0,03
𝑃(𝐶) = 0,45
𝑃(𝐷K ⁄𝐶 ) = 0,97
Estadística Descriptiva 2022 01 140

Eventos independientes

Si 𝑃(𝐴) ¹ 0, los eventos 𝐴 y 𝐵 son independientes si y solo si:

𝑃(𝐴/𝐵) = 𝑃(𝐴)

Ley de la multiplicación para eventos independientes

Si dos eventos 𝐴 y 𝐵 son independientes se cumple que:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) 𝑃(𝐵)

Si tres eventos 𝐴, 𝐵 y 𝐶 son independientes se cumple que:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) 𝑃(𝐵)

𝑃(𝐴 ∩ 𝐶) = 𝑃(𝐴)𝑃(𝐶)

𝑃(𝐵 ∩ 𝐶) = 𝑃(𝐵) 𝑃(𝐶)

𝑃(𝐴 ∩ 𝐵 ∩ 𝐶) = 𝑃(𝐴)𝑃(𝐵)𝑃(𝐶)
Estadística Descriptiva 2022 01 141
Ejercicios

114. Si dos eventos 𝐴 y 𝐵 son independientes, indique el diagrama de Venn correspondiente.

A B A B

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵)

El diagrama de Venn correspondiente es de la derecha. El diagrama de la izquierda corresponde


mutuamente excluyentes.

115. La probabilidad de que un emprendedor tenga éxito en un restaurante es del 30% y la probabili-
dad de que tenga éxito en una cafetería es del 35%. Si la probabilidad de tener éxito en al menos
uno de los negocios es mayor al 50% decidirá emprender los dos negocios. ¿Qué decisión se to-
mará? Asuma independencia.

Interpretación
Determinar si se decidirá emprender los dos negocios.

Representación
Definamos los eventos necesarios.
A:= que el emprendedor tenga éxito en un restaurante 𝑃(𝐴) = 0,30
B:= que un emprendedor tenga éxito en la cafetería 𝑃(𝐵) = 0,35
Usaremos la independencia de eventos.

Cálculo
Por independencia, se tiene que:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) = 0,30 × 0,35 = 0,105

A B

0,195 0,105 0,245

0,455

La probabilidad pedida es la probabilidad de tener éxito en al menos uno de los negocios, es decir:

𝑃(𝐴 ∪ 𝐵) = 0,195 + 0,105 + 0,245 = 0,545


Estadística Descriptiva 2022 01 142
Análisis y argumentación
La probabilidad de tener éxito en al menos uno de los negocios es 0,545; que es mayor a 0,5. Por
lo tanto, sí se decidirá emprender los dos negocios.

116. Un vendedor de artefactos eléctricos, en una tienda por departamentos sabe, por experiencia,
que el 2% de las personas que preguntan por un televisor finalmente lo compran. El vendedor ha
decidido que si no vende al menos un televisor ese día renunciará a su trabajo. Calcule la proba-
bilidad de que no renuncie si ese día preguntaron 50 clientes por televisores.

117. Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer trabajo es
del 70% y que sea aceptado en el segundo es del 50%. Si ser aceptado en dichos trabajos es inde-
pendiente entre sí.

a. ¿Cuál es la probabilidad de que al menos sea aceptado en uno de los trabajos? Rpta: 0,85
b. ¿Cuál es la probabilidad de que solamente sea aceptado en uno solo de los trabajos?
Rpta: 0,50

118. El pulpo Paul era un octópodo que fue empleado como oráculo para predecir los resultados de la
selección alemana de fútbol en el Mundial de Fútbol 2010, acertando los ocho emparejamientos
que se le propusieron, los siete partidos de Alemania en la Copa Mundial de Fútbol de 2010 y la
final entre España y Holanda. Antes de cada partido, a Paul se le presentaron dos contenedores
idénticos con comida: uno de ellos estaba marcado con una bandera, usualmente la de Alemania
y el otro con la bandera del equipo oponente. La elección de Paul se interpretaba como el equipo
que lograría la victoria. Si el pulpo Paul, en realidad, escogió los contenedores al azar, calcule la
probabilidad de acertar en los resultados de los ocho los partidos que le propusieron. Asuma in-
dependencia entre cada elección. Rpta: 0,0039

Definamos los eventos necesarios.

𝐴 ≔ que el pulpo Paul acierte los ocho partidos

𝐴! ≔ que acierte el partido 𝑖; 𝑖 = 1, 2, 3, … ,8

Establezcamos una relación entre los eventos.

𝐴 = 𝐴# ∩ 𝐴$ ∩ 𝐴) ∩ … ∩ 𝐴<

La probabilidad pedida es:

𝑃(𝐴) = 𝑃(𝐴# ∩ 𝐴$ ∩ 𝐴) ∩ … ∩ 𝐴< )

Por independencia de eventos, afirmaremos que:

𝑃(𝐴) = 𝑃(𝐴# )𝑃(𝐴$ ) … 𝑃(𝐴< )

Como el pulpo Paul elegión entre dos contenedores de comida.


Estadística Descriptiva 2022 01 143

𝑃(𝐴) = 0,50 × 0,50 × … × 0,50 = 0,50< = 0,0039

119. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en una
chica acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma independencia
entre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo menos con una
de ellas. Rpta: 0,8046
Estadística Descriptiva 2022 01 144

Unidad 3. Distribuciones de probabilidad y mues-


treo

Logro de la unidad 3
Al finalizar la Unidad 3, el estudiante aplica los conceptos de variable aleatoria, valor esperado y pro-
babilidad para la toma de decisiones responsables dentro de un escenario del ámbito empresarial.

Temario
• Definición de variable aleatoria discreta y continua
• Función de probabilidad de una variable aleatoria discreta
• Función de densidad y función de distribución acumulada de una variable aleatoria continua.
• Valor esperado y varianza de variables aleatorias discretas y continuas
• Estudio de propiedades de las siguientes distribuciones: binomial, hipergeométrica, Poisson, uni-
forme, normal, exponencial
• Muestreo aleatorio. Tipos de muestreo.
• Propiedad reproductiva de la distribución normal
• Distribución muestral de un promedio
• Teorema del límite central
Estadística Descriptiva 2022 01 145

Variable aleatoria
Se denomina variable aleatoria a una descripción numérica del resultado de un experimento.
La variable aleatoria atribuye a cada evento un número que no es aleatorio o imprevisible, sino fijo y
predeterminado.
Lo que es aleatorio es el experimento sobre cuyo espacio muestral se define la variable aleatoria.

Ejemplo

Un experimento aleatorio que consiste en lanzar un dado.

El espacio muestral 𝑆 = {1, 2, 3, 4, 5, 6}

Un evento posible 𝐴 = {3}

Definamos una variable 𝑋 ≔ número de la cara superior de un dado

El rango de la variable 𝑋 es: 𝑅? = {1, 2, 3, 4, 5, 6}

Reescribamos el evento 𝐴 = {3} = (𝑋 = 3)

La probabilidad de que suceda 𝐴 es

1
𝑃(𝐴) = 𝑃(𝑋 = 3) = 𝑓(3) =
6

Rango o recorrido de una variable aleatoria

Se llama rango o recorrido de una variable aleatoria 𝑋 y lo denotaremos 𝑅? , al conjunto de los valores
reales que la variable aleatoria puede tomar.

Tipos de variable aleatoria

Una variable aleatoria es discreta si puede asumir un conjunto finito o infinito numerable de valores
diferentes.
Una variable aleatoria es continua si puede asumir cualquier valor en un intervalo.
Estadística Descriptiva 2022 01 146
Ejercicios

120. Indique el tipo de la variable aleatoria y su rango.

Variable aleatoria Tipo Rango


𝑋: = número de veces que un alumno lleva un
Discreta 𝑅? = {0, 1, 2, 3, 4}
curso en la UPC
𝑌: = cantidad de horas que dedica un alumno a es-
Continua 𝑅? = [0, 24]
tudiar un curso el día previo al examen
Estadística Descriptiva 2022 01 147

Variable aleatoria discreta

Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se denota
𝑃(𝑋 = 𝑥).

Por ejemplo: número de alumnos matriculados por curso, cantidad de preguntas correctamente con-
testadas en una evaluación de personal, cantidad de clientes que visitan un centro comercial en un día
determinado.

Distribución de probabilidad de una variable aleatoria discreta

La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que asigna a
todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:

Condición 1
𝑓(𝑥) ≥ 0

Condición 2
• 𝑓(𝑥) = 1
N+

Definimos la función de probabilidad 𝑓(𝑥) como:

𝑓(𝑥) = 𝑃(𝑋 = 𝑥)

Ejemplo 35

Calcule 𝑎 para que la siguiente función sea una función de probabilidad. Grafique 𝑓(𝑥).

𝑎𝑥 10, 15, 20, 25


𝑓(𝑥) = —
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Solución

La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que asigna a
todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:

Condición 1

𝑓(𝑥) ≥ 0

La primera condición se cumple cuando a es mayor que cero, puesto que x > 0.
Estadística Descriptiva 2022 01 148
Condición 2

• 𝑓(𝑥) = 1
N+

La segunda condición se cumple si:

𝑎10 + 𝑎15 + 𝑎20 + 𝑎25 = 1

𝑎70 = 1

1
𝑎=
70

0.40 0.357
0.35
0.286
0.30
0.25 0.214
f(x)

0.20
0.143
0.15
0.10
0.05
0.00
0 5 10 15 20 25 30
X

Ejemplo 36

Sea 𝑋 el número de lanzamientos de un dado hasta que salga el primer seis. Determine la función de
probabilidad de la variable 𝑋 y calcule 𝑃(𝑋 > 3).

Solución
Sea la variable aleatoria 𝑋: = número de lanzamientos de un dado hasta que salga el primer seis.

El rango o recorrido de 𝑋 es:


𝑅? = {1, 2, 3, … }

La función de probabilidad 𝑓(𝑥) se deduce:

1
𝑓(1) = 𝑃(𝑋 = 1) =
6

5 1
𝑓(2) = 𝑃(𝑋 = 2) = ×
6 6
Estadística Descriptiva 2022 01 149
5 $ 1
𝑓(3) = 𝑃(𝑋 = 3) = k l ×
6 6

Luego, la función de probabilidad de la variable X es:

5 DO# 1
𝑓(𝑥 ) = 𝑃(𝑋 = 𝑥) = k l × 𝑥 = 1, 2, 3, …
6 6

La probabilidad pedida es:

𝑃(𝑋 > 3)

Dado el rango infinito de 𝑋, para poder calcular la probabilidad usar la siguiente propiedad:

𝑃(𝑋 > 3) = 1 − 𝑃(𝑋 ≤ 3)

= 1 − (𝑓(1) + 𝑓(2) + 𝑓(3))

5 #O# 1 5 $O# 1 5 )O# 1


= 1 − šk l × +k l × +k l × ›
6 6 6 6 6 6

1 5 5 )O# 25
=1−š + +k l × › = 0,5787
6 36 6 216
Estadística Descriptiva 2022 01 150
Ejercicios

121. Sea Ω el espacio muestral obtenido al lanzar una moneda dos veces y observar si sale cara (c) o
sello (s) cada vez. Indique el espacio muestral de dicho experimento y determine la función de
probabilidad de la variable <número de caras obtenidas al lanzar dos monedas>.

El experimento aleatorio es lanzar una moneda dos veces

El espacio muestral es Ω = {(𝑠, 𝑠); (𝑠, 𝑐); (𝑐, 𝑠); (𝑐, 𝑐)}

Definamos la variable aleatoria

𝑋 ≔ número de caras obtenidas al lanzar dos monedas

El rango de 𝑋 es:

𝑅? = {0, 1, 2}

La función de probabilidad será:

1
𝑓(0) = 𝑃(𝑋 = 0) =
4

2
𝑓(1) = 𝑃(𝑋 = 1) =
4

1
𝑓(2) = 𝑃(𝑋 = 2) =
4

𝒙 0 1 2
𝒇(𝒙) 0,25 0,50 0,25

122. Se lanza un dado, sea la variable aleatoria 𝑋 igual al número de la cara superior del dado. Deter-
mine y grafique la función de probabilidad de la variable 𝑋.

Definamos la variable aleatoria


Estadística Descriptiva 2022 01 151
𝑋 ≔ número de la cara superior de un dado

El rango de 𝑋 es:

𝑅? = {1, 2, 3, 4, 5, 6}

La función de probabilidad será:

1
𝑓(1) = 𝑃(𝑋 = 1) =
6

1
𝑓(2) = 𝑃(𝑋 = 2) =
6

Y así sucesivamente.

𝒙 1 2 3 4 5 6
𝒇(𝒙) 1/6 1/6 1/6 1/6 1/6 1/6

1
𝑓(𝑥) = •6 𝑥 = 1, 2, 3, 4, 5, 6
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

123. En un lote de 30 polos hay tres defectuosos. Se toma una muestra aleatoria de cinco polos y se
define la variable aleatoria 𝑋 como el número de polos defectuosos en la muestra.

a. Determine y grafique la función de probabilidad de la variable 𝑋.

3 defectuosos 𝑋: = número de defectusos


27 no defectuosos en la muestra de tamaño 5

Definamos la variable.

𝑋: = número de defectusos en la muestra de tamaño 5


Estadística Descriptiva 2022 01 152
El rango de 𝑋 es:

𝑅? = {0, 1, 2, 3}

La función de probabilidad será:

𝐶,) × 𝐶H$G
𝑓(0) = 𝑃(𝑋 = 0) = = 0,56650
𝐶H),

𝐶#) × 𝐶-$G
𝑓(1) = 𝑃(𝑋 = 1) = = 0,36946
𝐶H),

𝐶$) × 𝐶)$G
𝑓(2) = 𝑃(𝑋 = 2) = = 0,06158
𝐶H),

𝐶)) × 𝐶$$G
𝑓(3) = 𝑃(𝑋 = 3) = = 0,00246
𝐶H),

𝒙 0 1 2 3
𝒇(𝒙) 0,56650 0,36946 0,06158 0,00246

$G
𝐶D) × 𝐶HOD
𝑓(𝑥) = ž 𝐶H), 𝑥 = 0, 1, 2, 3
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

b. Calcule la probabilidad de tener dos polos defectuosos en la muestra. Rpta: 0,06158

La probabilidad pedida es:

𝑃(𝑋 = 2) = 𝑓(2) = 0,06516

c. Calcule la probabilidad de tener al menos un polo defectuoso en la muestra.


Rpta: 0,43350

La probabilidad pedida es:


Estadística Descriptiva 2022 01 153

𝑃(𝑋 ≥ 1) = 𝑓(1) + 𝑓(2) + 𝑓(3) = 0,36946 + 0,06158 + 0,00246 = 0,43350

Tambien, se pudo escribir así:

𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 < 1) = 1 − 𝑓(0) = 1 − 0,56650 = 0,43350


Estadística Descriptiva 2022 01 154
Valor esperado de una variable aleatoria discreta

El valor esperado o esperanza matemática de una variable aleatoria 𝑋 o media de una función de pro-
babilidad de 𝑋 se denota 𝐸(𝑋).

𝜇? = 𝐸(𝑋) = • 𝑥𝑓(𝑥)
NP7QA ?

Valor esperado de una función de variable aleatoria discreta

Sea 𝐺(𝑋) una función de la variable aleatoria continua 𝑋. El valor esperado de 𝐺(𝑋):

𝜇R(?) = 𝐸(𝐺(𝑋)) = • 𝐺(𝑥)𝑓(𝑥) 


NP7QA ?

Propiedades del valor esperado

• Si 𝑎 y 𝑏 son constantes, entonces:

𝐸(𝑎𝑋 + 𝑏) = 𝑎𝐸(𝑋) + 𝑏 = 𝑎 𝜇? + 𝑏

• Como casos particulares se tiene:

𝐸(𝑏) = 𝑏

𝐸(𝑋 + 𝑏) = 𝐸(𝑋) + 𝑏 = 𝜇? + 𝑏

𝐸(𝑎𝑋) = 𝑎 𝐸(𝑋) = 𝑎 𝜇?

• Si 𝑋 e 𝑌 son variables aleatorias, 𝑎 y 𝑏 son constantes, entonces:

𝐸(𝑎𝑋 + 𝑏𝑌) = 𝑎𝐸(𝑋) + 𝑏𝐸(𝑌)

• Como casos particulares se tiene:

𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)

𝐸(𝑋 – 𝑌) = 𝐸(𝑋) – 𝐸(𝑌)

• Si 𝑋 e 𝑌 son variables aleatorias independientes, 𝑎 y 𝑏 son constantes, entonces:

𝐸(𝑎 𝑋. 𝑏 𝑌) = 𝑎 𝑏 𝐸(𝑋) 𝐸(𝑌)


Estadística Descriptiva 2022 01 155
• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes, entonces:

𝐸(𝑋# . 𝑋$ . 𝑋) . . . 𝑋7 ) = 𝐸(𝑋# ). 𝐸(𝑋$ ). 𝐸(𝑋) ) . . . 𝐸(𝑋7 )

• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes y 𝑎# , 𝑎$ , 𝑎) , … , 𝑎7 son 𝑛 constantes,


entonces:

7 7

𝐸 ¡• 𝑎! 𝑋! ¢ = • 𝑎! 𝐸(𝑋! )
!6# !6#

• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias con la misma función de probabilidad, entonces se


cumple que 𝐸(𝑋! ) = µ, por lo tanto:

𝐸 ¡• 𝑋! ¢ = 𝑛𝜇
!6#

Varianza de una variable aleatoria discreta

La varianza 𝑉(𝑋) de una variable aleatoria discreta 𝑋 se calcula con:

𝑉(𝑋) = 𝐸(𝑋 $ ) − 𝐸(𝑋)$

La varianza de la variable aleatoria 𝑋 también se denota por 𝜎?$ o 𝜎 $ .

Desviación estándar de una variable aleatoria discreta

La desviación estándar de 𝑋 es la raíz cuadrada de la varianza de 𝑋.

Se denota por s? o 𝜎.

𝜎? = £𝜎?$

Varianza de una función de variable aleatoria discreta

$
𝜎R(?) = • (𝐺(𝑋) − 𝜇R(?) )$  𝑓(𝑥)
NP7QA ?
Estadística Descriptiva 2022 01 156
Propiedades de la varianza

• Si 𝑎 y 𝑏 son constantes, entonces:

𝑉(𝑏) = 0

𝑉(𝑎𝑋) = 𝑎$ 𝑉(𝑋)

𝑉(𝑋 + 𝑏) = 𝑉(𝑋)

• Si 𝑋 e 𝑌 son dos variables aleatorias independientes, 𝑎 y 𝑏 son dos constantes, entonces:

𝑉(𝑎𝑋 + 𝑏𝑌) = 𝑎$ 𝑉(𝑋) + 𝑏$ 𝑉(𝑌)

• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes y 𝑎# , 𝑎$ , 𝑎) , … , 𝑎7 son 𝑛 constantes,


entonces:

7 7

𝑉 ¡• 𝑎! 𝑋! ¢ = • 𝑎!$ 𝑉(𝑋! )
!6# !6#

• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes con la misma función de probabili-


dad, entonces se cumple que 𝑉(𝑋! ) = s$ y, por lo tanto:

𝑉 ¡• 𝑋! ¢ = 𝑛𝜎 $
!6#

Coeficiente de variación

Una de las medidas de variabilidad que podríamos usar es el coeficiente de variación, tal como lo usa-
mos en la unidad de medidas de resumen.

El coeficiente de variación se define de la siguiente manera:

𝜎? 𝜎?
𝐶𝑉 = × 100% = × 100%
𝐸(𝑋) 𝜇?
Estadística Descriptiva 2022 01 157
Ejemplo 37

Sea 𝑋 una variable aleatoria con la siguiente función de probabilidad. Calcular la varianza de 𝑋.

𝑎𝑥 1, 2, 3, 4, 5
𝑓(𝑥) = —
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Solución
Lo primero es determinar 𝑎, planteamos que

• 𝑓(𝑥) = 1
D6#

𝑓(1) + 𝑓(2) + 𝑓(3) + 𝑓(4) + 𝑓(5) = 1

𝑎×1+𝑎×2+𝑎×3+𝑎×4+𝑎×5=1

15𝑎 = 1

1
𝑎=
15

Lo pedido es:

H
$)
𝐸(𝑋 = • 𝑥 $ 𝑓(𝑥)
D6#

1 2 3 4 5
= 1$ × + 2$ × + 3$ + 4$ + 5$ = 15
15 15 15 15 15

El esperado de 𝑋 es:

H
1 2 3 4 5
𝐸(𝑋) = • 𝑥 𝑓(𝑥) = 1 × +2× +3 +4 +5
15 15 15 15 15
D6#

55
𝐸(𝑋) =
15

Luego se tiene que:

$ 55 $
𝑉(𝑋) = 𝐸(𝑋 $ ) − N𝐸(𝑋)O = 15 − k l = 1,556
15
Estadística Descriptiva 2022 01 158
Ejemplo 38
Caso Metropolitano
Se define la variable aleatoria 𝑋 definida como el número de recargas de la tarjeta de los usuarios del
Metropolitano a la semana con la siguiente función de probabilidad.

𝑿 ≔ número de recargas 0 1 2 3 4
𝒇(𝒙) 0,10 4𝑘 0,30 𝑘 0,10

a. Si un usuario recargó por lo menos una vez su tarjeta en una semana, calcule la probabilidad de
que dicho usuario recargue su tarjeta por lo menos dos veces en esa semana.
b. Si el costo de una recarga es de cinco soles y el Metropolitano tiene 560 mil usuarios, determine
el monto esperado semanal por recargas.

Solución

a. Si un usuario recargó por lo menos una vez su tarjeta en una semana, calcule la probabilidad de
que dicho usuario recargue su tarjeta por lo menos dos veces en esa semana.
Solución

Para que 𝑓(𝑥) sea una función de probabilidad debe cumplir que:

• 𝑓(𝑥) = 1
,

Determinemos el valor de 𝑘 para que 𝑓(𝑥) sea función de probabilidad. Por lo tanto:

𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3) + 𝑓(4) = 1

0,10 + 4𝑘 + 0,30 + 𝑘 + 0,10 = 1

𝑘 = 0,1

La función de probabilidad es:

𝑿: = número de recargas 0 1 2 3 4
𝒇(𝒙) 0,10 0,40 0,30 0,10 0,10

La probabilidad pedida es:

𝑃N(𝑋 ≥ 2) ∩ (𝑋 ≥ 1)O 𝑃(𝑋 ≥ 2)


𝑃(𝑋 ≥ 2⁄𝑋 ≥ 1) = =
𝑃(𝑋 ≥ 1) 𝑃(𝑋 ≥ 1)
Estadística Descriptiva 2022 01 159
𝑓(2) + 𝑓(3) + 𝑓(4)
=
𝑓 (1) + 𝑓(2) + 𝑓 (3) + 𝑓(4)

0,30 + 0,10 + 0,10 0,5


= = = 0,5556
0,40 + 0,30 + 0,10 + 0,10 0,9

b. Si el costo de una recarga es de cinco soles y el Metropolitano tiene 560 mil usuarios, determine
el monto esperado semanal por recargas.

Solución

Como cada persona paga cinco soles y son 560 mil usuarios, luego el monto semanal por recargas
𝑀(𝑋) es:

𝑀(𝑋) = 5 × 560000 𝑋

Luego, el monto esperado semanal por recargas es:

𝐸N𝑀(𝑋)O = 𝐸(5 × 560000 𝑋) = 2 800 000 𝐸(𝑋)

El valor esperado de 𝑋 es:


-

𝐸(𝑋) = • 𝑥𝑓(𝑥)
D6,

= 0 × 𝑓(0) + 1 × 𝑓(1) + 2 × 𝑓(2) + 3 × 𝑓(3) + 4 × 𝑓(4)

= 0 × 0,10 + 1 × 0,40 + 2 × 0,30 + 3 × 0,10 + 4 × 0,10 = 1,7

El esperado del monto semanal por recargas será:

𝐸N𝑀(𝑋)O = 2 800 000 𝐸(𝑋) = 2 800 000 × 1,7 = 4 760 000

Luego, el monto esperado semanal por recargas es 4 760 000 soles.


Estadística Descriptiva 2022 01 160
Ejercicio

124. La demanda diaria de un producto es una variable aleatoria 𝑋 cuya distribución de probabilidades
es simétrica y está dada por la tabla siguiente:

𝒙 1 2 3 4 5
𝒇(𝒙) 𝑎 0,20 𝑏 𝑐 0,05

La empresa obtiene por cada unidad demandada de producto 100 soles de utilidad. Si la cantidad
demanda en un día es mayor a dos unidades, se obtiene una utilidad adicional de 15 soles por
unidad demandada de producto.

a. Calcule el valor de 𝑎, 𝑏 y 𝑐. Rpta: 0,05; 0,50 y 0,20


b. Determine la probabilidad que la demanda diaria sea de por lo menos tres productos.
Rpta: 0,75
c. Calcule el valor esperado de la utilidad por la demanda diaria de productos.
Rpta: 330,75 soles

125. El número de personas que no se presentan a un vuelo se modela con una variable aleatoria 𝑋 con
la siguiente función de probabilidad.

𝒙 0 1 2 3 4 5 6
𝒇(𝒙) 0,20 0,25 0,22 0,15 0,10 0,05 𝑎

Si la media es mayor a dos, se comenzará a mandar un correo electrónico a los pasajeros recor-
dándoles el viaje. Indique la acción a tomar.

Interpretación
Determinar si se comenzará a mandar un correo electrónico a los pasajeros recordándoles el viaje.

Representación
Definamos la variable aleatoria.

𝑋 ≔ número de personas que no se presentan a un vuelo

El rango de 𝑋 es:

𝑅? = {0, 1, 2, 3, 4, 5, 6}

Determinemos el valor de 𝑎.

La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que
asigna a todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:
Estadística Descriptiva 2022 01 161
Condición 1
𝑓(6) = 𝑎 ≥ 0

Condición 2
• 𝑓(𝑥) = 1
N+

𝑓(0) + 𝑓(1) + ⋯ + 𝑓(6) = 1

0,20 + 0,25 + 0,22 + 0,15 + 0,10 + 0,05 + 𝑎 = 1

𝑎 = 0,03

𝒙 0 1 2 3 4 5 6
𝒇(𝒙) 0,20 0,25 0,22 0,15 0,10 0,05 0,03

Vamos a calcular la media de 𝑋.

Cálculo
Calculemos la media de 𝑋.

𝜇 = 𝐸(𝑋) = • 𝑥 𝑓(𝑥)
N+

𝜇 = 0 𝑓(0) + 1 𝑓(1) + 2𝑓(2) + ⋯ + 6 𝑓(6)

𝜇 = 0 × 0,22 + 1 × 0,25 + 2 × 0,22 + 3 × 0,15 + 4 × 0,10 + 5 × 0,05 + 6 × 0,03 = 1,97

𝜇 = 𝐸(𝑋) = 1,97 personas

Análisis y argumentación
La media del número de personas que no se presentan a un vuelo es 1,97, que es menor a 2. Por
lo tanto, no se comenzará a mandar un correo electrónico a los pasajeros recordándoles el viaje.

126. En una bodega, la demanda mensual del jugo en frasco se modela con la siguiente variable alea-
toria 𝑋 con la siguiente función de probabilidad.

𝑿: = número de frascos demandados 80 90 100 120 130 140


𝒇(𝒙) 0,15 0,25 0,35 0,10 0,10 0,05

Cada frasco cuesta tres soles y se vende cinco soles. Si la ganancia esperada mensual por este
concepto es mayor 200 soles entonces se dará unos frascos de promoción a las bodegas. Indique
lo que se hará.
Estadística Descriptiva 2022 01 162
127. El número de ensaladas demandadas al día en un restaurante se modela con una variable aleato-
ria 𝑋 que tiene la siguiente distribución de probabilidad.

𝒙 10 15 17 18 20 25
𝒇(𝒙) 𝑎 0,12 0,35 2𝑎 0,14 0,09

El costo de cada ensalada es de seis soles y las vende a diez soles. Toda ensalada no vendida en el
día se desecha. Calcule la media y desviación estándar de la utilidad diaria, si el restaurante prepara
20 ensaladas por día. Rpta: 49,5; 27,654

128. Se lanzan dos dados y sea la variable aleatoria 𝑋 igual a la suma de los números de las caras su-
periores. Calcule la media y la varianza de la variable 𝑋. Rpta: 7; 5,83333

Definamos una variable aleatoria.

𝑋 ≔ suma de los números de las caras superiores

El rango de X es:

𝑅? = {2, 3, … ,12}

La función de probabilidad de 𝑋 es:

# $ )
𝑓(2) = 𝑃(𝑋 = 2) = 𝑓(3) = 𝑃(𝑋 = 3) = 𝑓(4) = 𝑃(𝑋 = 4) =
)F )F )F

- H F
𝑓(5) = 𝑃(𝑋 = 5) = )F 𝑓(6) = 𝑃(𝑋 = 6) = )F 𝑓(7) = 𝑃(𝑋 = 7) = )F

H - )
𝑓(8) = 𝑃(𝑋 = 8) = )F 𝑓(9) = 𝑃(𝑋 = 9) = )F 𝑓(10) = 𝑃(𝑋 = 10) = )F

$ #
𝑓(11) = 𝑃(𝑋 = 11) = )F 𝑓(12) = 𝑃(𝑋 = 12) = )F

𝒙 2 3 4 5 6 7 8 9 10 11 12
𝒇(𝒙) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

𝑥−1
⎧ 𝑥 = 2, 3, 4, 5, 6, 7
⎪ 36
𝑓(𝑥) = 13 − 𝑥
⎨ 𝑥 = 8, 9, 10, 11, 12
⎪ 36
⎩ 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Estadística Descriptiva 2022 01 163

La media de X es:

𝜇 = 𝐸(𝑋) = • 𝑥 𝑓(𝑥)
N+

𝜇 = 2 𝑓(2) + 3 𝑓(3) + 4𝑓(4) + ⋯ + 12 𝑓(12)

1 2 3 1
𝜇 =2× + 3 × +4× + ⋯ + 12 × =7
36 36 36 36

El valor esperado de 𝑋 $ es:

𝐸(𝑋 $ ) = • 𝑥 $ 𝑓(𝑥)
N+

1 2 3 4 5 6 5 1
𝐸(𝑋 $ ) = 2$ × + 3$ × + 4$ × + 5$ × + 6$ × + 7$ × + 8$ × + ⋯ + 12$ ×
36 36 36 36 36 36 36 36

𝐸(𝑋 $ ) = 54,8333

La varianza 𝑉(𝑋) de una variable aleatoria discreta 𝑋 se calcula con:

𝑉(𝑋) = 𝐸(𝑋 $ ) − 𝐸(𝑋)$

𝑉(𝑋) = 54,8333 − 7$ = 5,8333

129. Un examen consta de 100 preguntas. Cada pregunta tiene cinco opciones para marcar y solo una
respuesta correcta Por cada respuesta correcta se le otorga al postulante un punto, mientras que
si la respuesta es incorrecta al postulante se le resta un cuarto de punto. Si un postulante contesta
todas las preguntas del examen al azar, calcule el valor esperado del puntaje obtenido.
Rpta: 37,5 puntos
Estadística Descriptiva 2022 01 164
Estadística Descriptiva 2022 01 165

Distribuciones de probabilidad de variable discreta


Distribución binomial

Un experimento binomial consiste en una serie de 𝑛 pruebas o ensayos, donde 𝑛 se fija antes de rea-
lizar el experimento.

• Las pruebas son idénticas y cada una de ellas puede resultar en uno de dos posibles resultados que
denotan éxito o fracaso.
• Las pruebas son independientes entre sí por lo que el resultado de un intento en particular no
influye en el resultado de cualquier otro.
• La probabilidad de éxito es constante de una prueba a otra y la denotamos como 𝑝.

Entonces para 𝑛 intentos y la probabilidad 𝑝 de éxito en cualquier intento, la probabilidad de tener 𝑥


éxitos en los 𝑛 intentos está dada por:

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶D7 𝑝 D (1 − 𝑝)7OD 𝑥 = 0,1,2, ⋯ , 𝑛

La variable binomial cuenta el número de éxitos en 𝑛 repeticiones semejantes e independientes con


probabilidad de éxito constante.

La variable aleatoria X sigue una distribución binomial con parámetros 𝑛 y 𝑝, se denota:

𝑋~𝐵(𝑛, 𝑝)

Ejemplo 39

4
𝑋~𝐵 k𝑛 = 5, 𝑝 = l
7
Estadística Descriptiva 2022 01 166
Media

µ = 𝐸(𝑋) = 𝑛𝑝

Varianza

s$ = 𝑉(𝑋) = 𝑛𝑝(1 − 𝑝)

Para el cálculo de probabilidades de una distribución binomial en Excel se usa la función:


=DISTR.BINOM.N(x; n = número de repeticiones; p = probabilidad de éxito; acumulado = 1)

Ejemplo 40
En el proceso de control de calidad se analiza 60 envases de los productos de Expórtame. Por investi-
gaciones anteriores se sabe que la probabilidad de que un envase esté en mal estado es de 0,01.

Se rechazarán los 60 productos si la probabilidad de seleccionar más de dos envases en mal estado es
mayor al 3%, ¿qué decisión se debe tomar?

Solución
Interpretación
Determinar si se rechazará los 60 productos.

Representación
Definamos la variable necesaria para resolver el problema:

𝑋: = número de envases en mal estado.

La variable 𝑋 se tiene una distribución binomial con parámetros:

𝑛: = número de ensayos = 60
𝑝: = probabilidad de éxito = 0,01

El rango de 𝑋 es 0, 1, 2,…, 60.

Entonces:

𝑋~ 𝐵(𝑛 = 60; 𝑝 = 0,01)

Cálculo
La probabilidad pedida es:

𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − (𝑓(0) + 𝑓(1) + 𝑓(2))

= 1 − 𝐶,F, 0,01, 0,99F, + 𝐶#F, 0,01# 0,99HI +𝐶$F, 0,01$ 0,99H<


Estadística Descriptiva 2022 01 167

𝑃(𝑋 > 2) = 0,0224

Análisis y argumentación
La probabilidad de seleccionar más de dos envases en mal estado es 0,0224. Como la probabilidad
pedida es menor al 3% (0,0224 < 0,03), entonces los 60 productos no serán rechazados.

Ejemplo 41
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 1% de las usuarias y el 0,8% de
los usuarios hombres han sufrido de algún tipo de robo durante el uso del Metropolitano. Si el sistema
tiene 560 mil usuarios, calcule el número esperado de usuarios que han sido víctimas de robo durante
el uso del Metropolitano.

Solución
Sean los eventos:
𝑅: = Que el usuario sea víctima de robo
𝐻: = Que el usuario sea hombre
𝑀: = Que el usuario sea mujer

Usaremos la distribución binomial y el teorema de la probabilidad total.

Usando el teorema de la probabilidad total tenemos que:


𝑃(𝑅⁄𝐻 ) = 0,008
𝑃(𝐻) = 0,55
𝑃(𝑅K ⁄𝐻) = 0,992

𝑃(𝑅⁄𝑀) = 0,01
𝑃(𝑀) = 0,45
𝑃(𝑅K ⁄𝑀) = 0,99

𝑃(𝑅) = 𝑃(𝐻) 𝑃(𝑅⁄𝐻) + 𝑃(𝑀) 𝑃(𝑅 ⁄𝑀)

𝑃(𝑅) = 0,55 × 0,008 + 0,45 × 0,01 = 0,0044 + 0,0045 = 0,0089

Sea la variable aleatoria 𝑌: = número de usuarios que han sido víctima de robo

𝑌~𝐵(𝑛 = 560 000; 𝑝 = 0,0089)

𝐸(𝑌) = 𝑛𝑝 = 560000 × 0,0089

El número esperado de usuarios que han sido víctima de robo es 4984 usuarios.
Estadística Descriptiva 2022 01 168
Ejemplo 42
Se sabe que el 12% de los usuarios del Metropolitano realizan conexiones de rutas. Si elegimos al azar
80 usuarios.
a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexiones.
b. Sea la variable Y definida como el número de usuarios que realizan conexiones de los 560mil usua-
rios. Calcule el valor esperado y varianza de Y.

Solución
a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexiones.

Solución
Sea 𝑋 ∶= cantidad de usuarios del Metropolitano que realizan conexiones de rutas en la muestra

𝑋~𝐵(𝑛 = 80; 𝑝 = 0,12)

El rango de 𝑋 es 𝑅? = {0,1, … ,80}

La probabilidad pedida es:

𝑃(8 ≤ 𝑋 ≤ 9) = 𝑓(8) + 𝑓(9) = 0,2623

En Excel, se usa la función =DISTR.BINOM.N(8;80;0.12;0)+DISTR.BINOM.N(9;80;0.12;0)

b. Sea la variable 𝑌 definida como el número de usuarios que realizan conexiones de los 560 mil usua-
rios. Calcule el valor esperado y varianza de 𝑌.

Solución

Sea 𝑌: = número de usuarios que realizan conexiones de los 560 mil usuarios

𝑌~𝐵(𝑛 = 560000; 𝑝 = 0,12)

El valor esperado y varianza de 𝑌 es:

𝐸(𝑌) = 𝑛𝑝 = 560 000 × 0,12 = 67000

𝑉(𝑌) = 𝑛𝑝(1 − 𝑝) = 560 000 × 0,12 × (1 − 0,12) = 59136


Estadística Descriptiva 2022 01 169
Ejercicios

130. Según el analista Rodrigo Parra, en el Perú, el 26 de marzo del 2022, el porcentaje de positividad
de pruebas moleculares fue de 1,0%, es decir, el 1,0% de las pruebas moleculares de detección
del COVID 19 hechas ese día dieron un resultado positivo. Asuma independencia entre las prue-
bas.

a. Si a un grupo de 100 peruanos se les realiza pruebas moleculares ese día, calcule la probabili-
dad de que tres den un resultado positivo a la prueba del COVID 19.
b. Si a un grupo de 120 peruanos se realiza pruebas moleculares ese día, calcule la probabilidad
de que haya al menos dos den positivo a la prueba del COVID 19.
c. Si en un grupo de 140 peruanos se realiza pruebas moleculares ese día, calcule la probabilidad
de que haya entre dos y cinco (incluyendo dos y cinco) den positivo a la prueba del COVID 19.
d. Si a 50000 peruanos se realizan pruebas moleculares ese día, calcule el valor esperado del
número de peruanos que den positivo a la prueba del COVID 19.

131. Una compañía de comida rápida sabe que el 90% de sus tiendas por franquicia tendrán éxito co-
mercial. Si el éxito de cada tienda se puede considerar independiente de las demás tiendas. Cal-
cule la probabilidad de que al menos dieciocho tiendas tengan éxito, si la compañía va a instalar
20 tiendas en el presente año. Rpta: 0, 6769

132. Según la Asociación para el Fomento de la Infraestructura Nacional el 48% de los hogares de Lima
no tienen acceso a agua potable de calidad, por no contar con la dosificación adecuada de cloro
o comprarla de manera informal a los camiones cisternas. Si se eligen al azar a diez hogares de
Lima, calcule la probabilidad de que cinco de ellos no tengan acceso agua potable de calidad.
Rpta: 0,2441
Estadística Descriptiva 2022 01 170
Distribución hipergeométrica
Consideremos 𝑁 elementos, de los cuales 𝑟 son considerados éxitos y, por lo tanto, 𝑁 − 𝑟 como fra-
casos. Como en el caso de la distribución binomial estamos interesados en saber la probabilidad de
obtener 𝑥 éxitos en una muestra de 𝑛 elementos.

El experimento hipergeométrico consiste en extraer al azar y sin sustitución 𝑛 elementos de un con-


junto de 𝑁 elementos, 𝑟 de los cuales son éxitos y 𝑁 − 𝑟 son fracasos.

La probabilidad de obtener de 𝑥 éxitos en la muestra de 𝑛 elementos es:

𝐶DU 𝐶7OD
5OU
𝑓(𝑥) = 𝑥 = 𝑚á𝑥{0, 𝑛 − (𝑁 − 𝑟)}, … , 𝑚í𝑛{𝑛, 𝑟}
𝐶75

El rango de 𝑋 en la mayoría de los casos va de 0 a 𝑛, pero no siempre, por lo que se debe analizar en
cada caso.

La variable hipergeométrica cuenta el número de éxitos en una muestra de tamaño 𝑛, tomada de una
vez de una población de tamaño 𝑁 donde hay 𝑟 éxitos.

Se dice que la variable aleatoria 𝑋 sigue una distribución hipergeométrica con parámetros 𝑛, 𝑟 y 𝑁 y
se denota:
𝑋~𝐻(𝑛, 𝑟, 𝑁)

Media
𝑟
𝜇 = 𝐸(𝑋) = 𝑛
𝑁
Varianza
𝑟 𝑟 𝑁−𝑛
𝜎$ = 𝑛 «1 − ¬ k l
𝑁 𝑁 𝑁−1

Para el cálculo de probabilidades de una distribución hipergeométrica en Excel se usa la función:


=DISTR.HIPERGEOM.N(x; n = tamaño de muestra; r = número de éxitos en población; N = tamaño de
la población; acumulado = 0)
Estadística Descriptiva 2022 01 171
Ejemplo 43
Luego de embalar un contenedor de envases de productos de Expórtame, se tienen 60 envases, de los
cuales 25 son frascos. Si selecciona una muestra aleatoria de 20 envases para el control de calidad.

a. Calcule la probabilidad de que ocho envases sean de frasco.


b. Calcule la variabilidad relativa de 𝑋 respecto a la media.

Solución

a. Calcule la probabilidad de que ocho envases sean de frasco.

Representación
Definamos la variable 𝑋: = número de envases de frasco seleccionados.

La variable 𝑋 se tiene una distribución hipergeométrica con parámetros:


𝑁 = 60 tamaño de la población
𝑟 = 25 número de éxitos en la población
𝑛 = 20 tamaño de la muestra.

El rango de 𝑋, es decir todos los valores que puede tomar la variable, es igual 0, 1, 2,…, 20.

Entonces,
𝑋~𝐻(𝑁 = 60; 𝑟 = 25; 𝑛 = 20)

𝑅? = {0, 1, … ,20}

Cálculo
La probabilidad pedida es:

𝐶<$H × 𝐶#$
)H
𝑃(𝑋 = 8) = F, = 0,2153
𝐶$,

b. Calcule la variabilidad relativa de X respecto a la media.

Solución
Lo que nos piden es calcular el coeficiente de variación de 𝑋.

Primero, hallemos el esperado y la varianza de 𝑋.

𝑟 25
𝜇 = 𝐸(𝑋) = 𝑛 = 20 = 8,333
𝑁 60

𝑟 𝑟 𝑁−𝑛
𝑉(𝑋) = 𝑛 «1 − ¬ k l
𝑁 𝑁 𝑁−1
Estadística Descriptiva 2022 01 172

25 25 60 − 25
= 20 k1 − l k l = 2,8337
60 60 60 − 1

El coeficiente de variación de 𝑋 es:

-𝑉(𝑋)
𝐶𝑉(𝑋) = × 100%
𝐸 (𝑋 )

√2,8337
= × 100% = 21,79%
8,3333

Ejemplo 44
La actriz Magaly Solier es la décima séptima mujer en denunciar una agresión sexual en un bus del
Metropolitano, desde noviembre del 2012. De las 17 denuncias, solo una está cerca de recibir senten-
cia. El agresor podría recibir de dos a cuatro años de prisión suspendida, cumplir trabajos comunitarios
o pagar reparación civil. Si se eligen al azar tres de las denuncias de las 17 existentes. Calcule la proba-
bilidad de elegir el caso que está cerca de recibir sentencia.

Solución

Sea X:= número de casos que están cerca de recibir sentencia

𝑋~𝐻(𝑁 = 17; 𝑛 = 3; 𝑟 = 1)

𝑅? = {0, 1}

𝑃(𝑋 = 1) = 𝑓(1) = 0,1765


Estadística Descriptiva 2022 01 173
Ejercicios

133. En un vuelo se van a servir 150 comidas. La oficina de control de calidad de los alimentos durante
el vuelo selecciona al azar cinco de ellas para verificar que en perfecto estado. Dentro de las 150
comidas, hay cuatro que no están en perfecto estado. Si se encuentra al menos una comida que
no esté en perfecto estado; se cambiará de proveedor. Calcule la probabilidad de que se cambie
de proveedor.

134. Un grupo de 25 amigos van a una discoteca, pero tres de ellos no tienen la edad permitida para
ingresar. Si la persona encargada en la puerta pedirá cuatro identificaciones al azar. Si a alguno
de los menores de edad se le pide la identificación, nadie en el grupo entrará a la discoteca. Cal-
cule la probabilidad de que todos entren a la discoteca. Rpta: 0,5783

135. La empresa San Fernando ha lanzado su campaña “Plato calato no”. Si de un total de 60 personas,
donde 34 recuerdan la campaña, se eligen al azar a ocho personas para entrevistarlos, calcule la
probabilidad de elegir al menos a tres personas que recuerden la campaña.
Rpta: 0,9402

136. En una distribuidora hay 25 televisores de los cuales seis son de tecnología OLED. Si se seleccionan
al azar diez televisores, calcule la probabilidad de que se haya seleccionado por lo menos dos
televisores de tecnología OLED. Rpta: 0,8022

137. Un comerciante recibe un lote de 30 computadoras portátiles. Para protegerse de una mala re-
mesa, el comerciante revisará diez computadoras y rechazará todo el lote si encuentra una o más
computadoras defectuosas. Si en el lote hay tres computadoras defectuosas, ¿cuál es la probabi-
lidad de que rechace el lote? Rpta: 0,7192
Estadística Descriptiva 2022 01 174
Distribución de Poisson

El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina
proceso de Poisson y posee las siguientes propiedades:

• El número de resultados que ocurre en un intervalo o región de espacio cualquiera es indepen-


diente del número que ocurre en cualquier otro intervalo o región del espacio disjunto.
• La probabilidad de que ocurra un solo resultado durante el intervalo muy corto o región muy pe-
queña es proporcional a la longitud del intervalo al tamaño de la región y no depende del número
de resultados que ocurren fuera del intervalo o región.
• La probabilidad de que ocurra más de un resultado en tal intervalo corto o caiga en tal región
pequeña es insignificante.

La probabilidad de tener 𝑥 resultados en un intervalo dado o en una región específica es:

𝑒 OV 𝜆D
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, …
𝑥!

x = número de éxitos por unidad de tiempo o región.


l = número esperado de éxitos por unidad de tiempo o región.
e = 2,71828…

Se dice que la variable aleatoria 𝑋 sigue una distribución de Poisson con parámetro l y se denota

𝑋~𝑃(l)

Media
µ = 𝐸(𝑋) = l

Varianza
s$ = 𝑉(𝑋) = l

Para el cálculo de probabilidades de una distribución Poisson en Excel se usa la función:


=POISSON.DIST(x; media = lambda; acumulado = 0)
Estadística Descriptiva 2022 01 175
Ejemplo 45
Suponga que el número de llamadas que llegan a una central telefónica es 0,5 por minuto en promedio.

a. Calcule la probabilidad de que en un minuto no lleguen llamadas.


b. Calcule la probabilidad de que en un minuto lleguen más de tres llamadas.
c. Calcule la probabilidad de que en tres minutos lleguen menos de cinco llamadas.
d. Calcule la probabilidad de que en cinco minutos lleguen más de dos llamadas.

Solución

a. Calcule la probabilidad de que en un minuto no lleguen llamadas.

Solución
Definamos la variable necesaria:
𝑋: = número de llamadas en un minuto

l = 0,5 llamadas por minuto

𝑋~𝑃(𝜆 = 0,5)

La probabilidad pedida es:

𝑒 O,,H 0,5,
𝑃(𝑋 = 0) = 𝑓(0) = = 0,6065
0!

En Excel, se usa la función =POISSON.DIST(0;0.5;0) = 0,6065

b. Calcule la probabilidad de que en un minuto lleguen más de tres llamadas.

Solución

La probabilidad pedida es:

𝑃(𝑋 > 3) = 1 − 𝑃(𝑋 ≤ 3) = 1 − (𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3))

𝑒 O,,H 0,5, 𝑒 O,,H 0,5# 𝑒 O,,H 0,5$ 𝑒 O,,H 0,5)


= 1−š + + + ›
0! 1! 2! 3!

= 1 − (0,6065 + 0,3033 + 0,0758 + 0,0126) = 1 − 0,9982 = 0,0018

En Excel, se usa la función =1-POISSON.DIST(3;0.5;1) = 0,0018


Estadística Descriptiva 2022 01 176
c. Calcule la probabilidad de que en tres minutos lleguen menos de cinco llamadas.

Solución
Definamos una nueva variable, pues ha cambiado la unidad de tiempo.

𝑌: = número de llamadas en tres minutos

𝑌~𝑃(𝜆 =? )

Calculemos el valor de lambda 𝜆, usando una regla de tres simple:

1 𝑚𝑖𝑛𝑢𝑡𝑜 0,5
3 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝜆

De donde:
l = 1,5 llamadas

𝑌~𝑃(𝜆 = 1,5)

La probabilidad pedida es:

𝑃(𝑌 < 5) = 𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3) + 𝑓(4)

𝑒 O#,H 1,5, 𝑒 O#,H 1,5# 𝑒 O#,H 1,5$ 𝑒 O#,H 1,5) 𝑒 O#,H 1,5-
= + + + +
0! 1! 2! 3! 4!

= 0,2231 + 0,3347 + 0,2510 + 0,1255 + 0,0471 = 0,98142

En Excel, se usa la función =POISSON.DIST(4;1.5;1) = 0,98142

d. Calcule la probabilidad de que en cinco minutos lleguen más de dos llamadas.

Solución
Definamos una nueva variable, pues ha cambiado la unidad de tiempo.

𝑊: = número de llamadas en cinco minutos

𝑊~𝑃(𝜆 =? )

Calculemos el valor de lambda 𝜆, usando una regla de tres simple:

1 𝑚𝑖𝑛𝑢𝑡𝑜 0,5
5 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝜆
De donde:
l = 2,5 llamadas
Estadística Descriptiva 2022 01 177

𝑊~𝑃(𝜆 = 2,5)

La probabilidad pedida es:

𝑃(𝑊 > 2) = 1 − 𝑃(𝑊 ≤ 2)

= 1 − (𝑓(0) + 𝑓(1) + 𝑓(2))

𝑒 O$,H 2,5, 𝑒 O$,H 2,5# 𝑒 O$,H 2,5$


=1−š + + ›
0! 1! 2!

= 1 − (0,0821 + 0,2052 + 0,2565) = 0,45652

En Excel, se usa la función =1-POISSON.DIST(2;2.5;1) = 0,45652

Ejemplo 46
El administrador de un almacén ha observado que, en promedio, ingresan al establecimiento 20 per-
sonas cada 30 minutos. ¿Cuál es la probabilidad de que en seis minutos ingresen al almacén a lo más
cinco clientes pero más de tres?

Solución

Definamos la variable adecuada:


𝑋: = número de personas que entren al establecimiento en un periodo de seis minutos.

𝑋~𝑃(𝜆 =? )

Calculemos el valor de lambda 𝜆, usando una regla de tres simple:

30 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 20
6 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝜆

De donde:
l=4

𝑋~𝑃(𝜆 = 4)

La probabilidad pedida es:

𝑃(3 < 𝑋 ≤ 5) = 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5)

= 𝑓(4) + 𝑓(5)
Estadística Descriptiva 2022 01 178
𝑒 O- 4- 𝑒 O- 4H
= + = 0,3517
4! 5!

En Excel, se usa la función =POISSON.DIST(5;4;1)-POISSON.DIST(3;4;1) = 0,3517

Ejemplo 47
Si se sabe que en cada 100 metros de longitud de un cable hay un promedio de 80 puntos por los cuales
este puede ser seccionado. ¿Cuál es la probabilidad de que en un tramo de 13,5 metros se encuentren
cinco puntos de seccionamiento?

Solución

Definamos la variable adecuada:

𝑋: = número de puntos de seccionamiento

Como nos dicen que la variable cuenta puntos por unidad de longitud, se tiene que:

𝑋~𝑃(l)

Calculemos el valor de lambda 𝜆, usando una regla de tres simple:

100 𝑚𝑒𝑡𝑟𝑜𝑠 80 𝑝𝑢𝑛𝑡𝑜𝑠


13,5 𝑚𝑒𝑡𝑟𝑜𝑠 𝜆

De donde:
𝑋~𝑃(𝜆 = 10,8)

La probabilidad pedida es:

𝑒 O#,,< 10,8OH
𝑃(𝑋 = 5) = 𝑓(5) = = 0,025
5!

En Excel, se usa la función =POISSON.DIST(5;10.8;0).

Observe que si lambda l sale un valor que no es entero, no se debe redondear a un entero.

Ejemplo 48
El número de unidades envasados por una persona se modela con una variable Poisson con un prome-
dio 10 unidades por cada 20 minutos.

a. ¿Cuál es la probabilidad de que en 20 minutos se envasen 12 productos?


b. Si la máquina funciona durante dos horas consecutivas, calcule la probabilidad de que se hayan
envasado 50 productos.
Estadística Descriptiva 2022 01 179
Solución

a. ¿Cuál es la probabilidad de que en 20 minutos se envasen 12 productos?

Solución

Definamos la variable adecuada:

𝑋: = número de productos que se envasan en 20 minutos

𝑋~𝑃(𝜆 = 10)

La probabilidad pedida es:

𝑒 O#, 10O#$
𝑃(𝑋 = 12) = 𝑓(12) = = 0,095
12!

En Excel, se usa la función =POISSON.DIST(12;10;0)

b. Si la máquina funciona durante dos horas consecutivas, calcule la probabilidad de que se hayan
envasado 50 productos.

Solución

Definamos la variable adecuada:

𝑌: = número de personas que entren al establecimiento en un periodo de dos horas

𝑌~𝑃(𝜆 =? )

Calculemos el valor de lambda 𝜆, usando una regla de tres simple:

20 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 10
120 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝜆

De donde:
𝑌~𝑃(𝜆 = 60)

La probabilidad pedida es:

𝑒 OF, 60OH,
𝑃(𝑌 = 50) = 𝑓(50) = = 0,0233
50!

En Excel, se usa la función =POISSON.DIST(60;50;0)


Estadística Descriptiva 2022 01 180

Ejemplo 49
El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia, queja o re-
clamo. El número de correos electrónicos que llegan a la cuenta de correo se modela como una varia-
ble aleatoria Poisson con una media de ocho correos por día. Calcule la probabilidad que en medio día
llegue más de tres correos con consultas, sugerencias, quejas o reclamos. Si esta probabilidad es mayor
a 0,8 se destinará a una persona para que conteste los correos diariamente.

Solución

Interpretación
Determinar si la probabilidad de que lleguen más de tres correos es mayor a 0,8.

Representación
Sea
𝑋: = número de correos electrónicos llegados a la cuenta de correo del Metropolitano en medio día.

8 𝑐𝑜𝑟𝑟𝑒𝑜𝑠
l = × 0,5 = 4
1 𝑑í𝑎

Luego:
𝑋~𝑃(l = 4)

Cálculo
La probabilidad pedida es:

𝑃(𝑋 > 3) = 1 − 𝑃(𝑋 ≤ 3)

)
𝑒 O- 4D
=1−•
𝑥!
D6,

= 1– (0,0183 + 0,0733 + 0,1465 + 0,1954) = 1– 0,4335 = 0,5665

En Excel, se usa la función =1-POISSON.DIST(3;4;1) = 0,5665.

Análisis y argumentación

La probabilidad de que lleguen más de tres correros es 0,5665 que es menor a 0,8. Como no es mayor
a 0,8 no se destinará a una persona para que conteste los correos diariamente.
Estadística Descriptiva 2022 01 181
Ejercicios

138. El número de llamadas hacia una azafata por los pasajeros durante un vuelo se modela con una
variable Poisson con una media de 0,25 llamadas cada diez minutos.

a. Calcule la probabilidad de que una azafata no reciba ninguna llamada en un viaje de 50 minu-
tos.
b. Calcule la probabilidad de que una azafata reciba más de una llamada en un viaje de 800 mi-
nutos.
c. Si una azafata ya recibió una llamada durante los primeros minutos del viaje, calcule la proba-
bilidad de que reciba dos llamadas más durante dicho viaje de 60 minutos.

139. En una pastelería, el número demandado de un cierto tipo de torta se modela con una variable
Poisson con una media de tres tortas al día. La pastelería, siempre, produce tres tortas diarias.
Cada torta cuesta producirla 50 soles y se vende a 80 soles. Toda torta no vendida en el día se
remata en 20 soles y siempre las compran todas las tortas a ese precio. Calcule el valor esperado
de la utilidad por dicho concepto. Rpta: 49,67 soles
Estadística Descriptiva 2022 01 182

Variable aleatoria continua

Es una variable cuyo rango es un conjunto infinito no numerable de valores.

Por ejemplo: peso, en kilos, de una persona, tiempo en resolver la primera pregunta del examen parcial
de un curso o volumen, en decibeles, en una discoteca a una hora determinada.

Función de densidad de una variable aleatoria continua

Se denomina función densidad de probabilidad 𝑓(𝑥) de una variable aleatoria continua a la función
que satisface:

Condición 1
𝑓(𝑥) ≥ 0 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑥 ∈ 𝑅

Condición 2
;X

³ 𝑓(𝑥)𝑑𝑥 = 1
OX

Se cumple que:
Y

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ³ 𝑓(𝑥)𝑑𝑥
P

!(#)

!(# ≤ % ≤ &)

% &

Para variables continuas se cumple:

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)


Estadística Descriptiva 2022 01 183
Ejemplo 50
Para cierto negocio por correo electrónico la proporción de los pedidos procesados en 24 horas tiene
la función de densidad de probabilidad.

𝑓(𝑥) = —2(1 − 𝑥)
0≤𝑥≤1
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Compruebe si f(x) es una función de densidad.

Solución
Se debe comprobar dos condiciones

Primera condición: 𝑓(𝑥) ≥ 0 para todo x Î R.

Esta se cumple pues para 0 ≤ 𝑥 ≤ 1 es:

𝑓(𝑥) = 2(1 − 𝑥) ≥ 0

;X
Segunda condición: ∫OX 𝑓(𝑥)𝑑𝑥 = 1
Existen varias formas de comprobar la segunda condición.

Primera forma
Integrando la función de densidad 𝑓(𝑥) y verificando que el área es igual a 1 y que cada 𝑓(𝑥) sea
positivo.

# # #
𝑥$
³ 𝑓(𝑥)𝑑𝑥 = ³ 2(1 − 𝑥)𝑑𝑥 = š2𝑥 − 2 ›µ = (2𝑥 − 𝑥 $ )|#,
2 ,
, ,

Ahora debemos evaluar en 0 y en 1.

= (2 × 1– 1$ ) − (2 × 1– 0$ ) = 1

Segunda forma
Calculando el área del triángulo a partir de la gráfica y verificando que el área es igual a 1 y que
cada f(x) sea positivo.

𝑏×ℎ 1×2
Á𝑟𝑒𝑎 = = =1
2 2

Tercera forma
Integrando la función de densidad 𝑓(𝑥) de 0 a 1; usando algún programa informático.

³ 𝑓(𝑥)𝑑𝑥
,,<
Estadística Descriptiva 2022 01 184

Puede usar está página web:


https://www.wolframalpha.com/input/?i=integrate+2%281-x%29+from+x+%3D+0+to+1

b. ¿Cuál es la probabilidad que al menos el 80% de los pedidos sean procesados dentro de 24 horas?

Solución
Existen varias formas de calcular la probabilidad pedida.

𝑃(𝑋 ≥ 0,8)

Primera forma
Integrando la función de densidad 𝑓(𝑥) de 0,8 a 1.

# #

𝑃(𝑋 ≥ 0,8) = ³ 𝑓(𝑥)𝑑𝑥 = ³ 2(1 − 𝑥)𝑑𝑥


,,< ,,<

= (2𝑥 − 𝑥 $ )|#,,< = 0,04

Segunda forma
Calculando el área de triángulo desde 0,8 a 1.

𝑏 × ℎ (1 − 0,8) × N2(1 − 0,8)O


𝑃(𝑋 ≥ 0,8) = = = 0,04
2 2
Estadística Descriptiva 2022 01 185
Observe que, para la segunda forma de resolución, se usó la función de densidad para hallar la
altura del triángulo.

Tercera forma
Integrando la función de densidad 𝑓(𝑥) de 0,8 a 1; usando algún programa informático.

𝑃(𝑋 ≥ 0,8) = ³ 𝑓(𝑥)𝑑𝑥


,,<
Puede usar está página web:
https://www.wolframalpha.com/input/?i=integrate+2%281-x%29+from+x+%3D+0.8+to+1

c. Si el porcentaje de pedidos procesados en 24 horas es mayor al 80%, calcular la probabilidad de


que sea mayor a 90%.

Solución

La probabilidad pedida es:

𝑃N(𝑋 > 0,9) ∩ (𝑋 > 0,8)O 𝑃(𝑋 > 0,9)


𝑃(𝑋 > 0,9⁄𝑋 > 0,8) = =
𝑃(𝑋 > 0,8) 𝑃(𝑋 > 0,8)

#
∫,,I 2(1 − 𝑥)𝑑𝑥 0,01
= # = = 0,25
∫,,< 2(1 − 𝑥 )𝑑𝑥 0,04
Estadística Descriptiva 2022 01 186
Ejercicios

140. Una variable aleatoria continua tiene la siguiente función de densidad de probabilidad:

𝑎𝑥 0<𝑥<7
𝑓(𝑥) = —
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Calcule la probabilidad de 𝑃(2 < 𝑋 < 5).

141. La duración (en minutos) de una llamada telefónica en la sala de profesores puede modelarse por
una variable aleatoria X con la siguiente función de densidad:

𝑎(3 − 𝑥) 0<𝑥<3
𝑓(𝑥) = —
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Determine el valor de 𝑎. Rpta: 0,2222


b. Calcule la probabilidad de que una llamada dure menos de un minuto y medio.
Rpta: 0,75
c. Si una llamada ya duró un minuto, calcule la probabilidad de que dure más de dos minutos.
Rpta: 0,25
Estadística Descriptiva 2022 01 187
Función de distribución acumulada de probabilidad

La función de distribución acumulada de una variable aleatoria continua 𝑋 con función de densidad
𝑓(𝑥) se define por:

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) −¥ < 𝑥 < +¥

Se tiene que:
𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝐹(𝑏) − 𝐹(𝑎)

Para variables continuas se cumple:

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)

Propiedades
• Se cumple que:

𝑑𝐹(𝑥)
= 𝑓(𝑥)
𝑑𝑥

• 𝐹(𝑥) es una función que siempre está entre 0 y 1 (0 ≤ 𝐹(𝑥) ≤ 1); pues es igual a una probabili-
dad.

• 𝐹(𝑥) es una función que nunca decrece.

lim 𝐹(𝑥) = 0
D→OX

lim 𝐹(𝑥) = 1
D→;X

1.0
𝐹(𝑥)
0.8

0.6

0.4

0.2

0.0
-2 -1 0 1 2 3 4 5
Estadística Descriptiva 2022 01 188
Ejemplo 51
Las ventas diarias (en miles de dólares) de una bodega es una variable aleatoria continua 𝑋 que tiene
la función densidad:

2(𝑥 + 2)
𝑓(𝑥) = • 0≤𝑥≤1
5
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Construya su respectiva función de distribución acumulada de probabilidad.

Solución

Primera forma: Integrando

Para el tramo [0; 1] usaremos la definición de la función de distribución acumulada

D D
2(𝑡 + 2) 2 𝑡$
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ³ 𝑑𝑡 = š + 2𝑡›µ
, 5 5 2 ,

2 𝑥$ 2 0$ 2 𝑥$ 1
𝐹(𝑥) = š + 2𝑥› − š + 2 × 0› = š + 2𝑥› = 𝑥(𝑥 + 4)
5 2 5 2 5 2 5

La función de distribución 𝐹(𝑥) se expresa de la siguiente manera:

1 𝑥≥1
1
𝐹(𝑥) = » 𝑥(𝑥 + 4) 0 < 𝑥 < 1
5
0 𝑥≤0

Segunda forma: Integrar usando algún programa informático

Para el tramo [0; 1] usaremos la definición de la función de distribución acumulada

D
2(𝑡 + 2) 1
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ³ 𝑑𝑡 = 𝑥(𝑥 + 4)
, 5 5

Puede usar páginas como https://www.wolframalpha.com/ y pedir que calcule la integral corres-
pondiente.
Estadística Descriptiva 2022 01 189

b. ¿Cuál sería la venta mínima del 25% de los mayores montos diarios de venta?

Solución
Calcularemos el percentil 75; 𝑃GH = 𝑚

𝑃(𝑋 ≤ 𝑚) = 0,75

1.0
0.9
0.8
0.7
0.6 0,75
𝐹(𝑥)

0.5
0.4
0.3
0.2
0.1 0,78
0.0
-0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2

1
𝐹(𝑚) = 𝑚(𝑚 + 4) = 0,75
5

Resolviendo la ecuación se tienen que 𝑚 = 0,78; por lo que el percentil 75 es 780 dólares.
Estadística Descriptiva 2022 01 190
Ejemplo 52
Encuentre el rango intercuartil de 𝑋, si 𝑋 es el tiempo de vida de un sistema es una variable aleatoria,
en años, cuya función de distribución acumulada es:

0 𝑥≤5
𝐹(𝑥) = • 25
1 − $ 𝑥$ > 5
𝑥

a. Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la


probabilidad que pertenezca al quinto superior?
b. Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la
probabilidad que pertenezca al quinto superior?

Solución
a. Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la
probabilidad que pertenezca al quinto superior?

Solución

Sea 𝑋: = tiempo, en años, de vida de un sistema.

Para calcular el rango intercuartil, debemos hallar el cuartil 1 y el cuartil 3, para esto hay dos posi-
bilidades: integrar la función de densidad 𝑓(𝑥) o reemplazar en la función de distribución acumu-
lada.

Por definición de cuartil 3, el 75% de los datos es menor o igual a él, es decir:

𝑃(𝑋 ≤ 𝑄) ) = 0,75

o lo que es lo mismo:

𝐹(𝑄) ) = 0,75

25
1− = 0,75
𝑄)$

de donde:

𝑄) = 10

Haciendo lo mismo para el cuartil 1.

𝑃(𝑋 ≤ 𝑄# ) = 0,25

𝐹(𝑄# ) = 0,25
Estadística Descriptiva 2022 01 191

25
1− = 0,25
𝑄#$
de donde:

𝑄) = 5,7735

Luego:

𝑅𝐼𝐶 = 𝑄) − 𝑄# = 4,23

b. Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la


probabilidad que pertenezca al quinto superior?

Solución

Como nos dicen que “ya se sabe que está en el cuarto superior”, es una probabilidad condicional.
Para estar en el quinto superior tiene que tener un tiempo de vida mayor al percentil 80, además
como se sabe que esta en el cuarto superior tiene un tiempo de vida mayor al percentil 75.

Por lo tanto, la probabilidad pedida es:

𝑃(𝑋 > 𝑃<, ⁄𝑋 > 𝑃GH )

Por la definición de probabilidad condicional.

𝑃 «(𝑋 > 𝑃<, ) ∩ N(𝑋 > 𝑃GH )O¬


=
𝑃(𝑋 > 𝑃GH )

𝑃(𝑋 > 𝑃<, )


=
𝑃(𝑋 > 𝑃GH )

Por la definición de percentil el 𝑃(𝑋 > 𝑃<, ) = 0,20 y el 𝑃(𝑋 > 𝑃GH ) = 0,25.

𝑃(𝑋 > 𝑃<, ) 0,20


𝑃(𝑋 > 𝑃<, ⁄𝑋 > 𝑃GH ) = = = 0,80
𝑃(𝑋 > 𝑃GH ) 0,25
Estadística Descriptiva 2022 01 192
Ejercicios

142. Sea 𝐹(𝑥) la función de distribución acumulada de la variable 𝑋.

1 𝑥>2
𝐹(𝑥) = •𝑥 − 1 1 ≤ 𝑥 ≤ 2
0 𝑥<1

Calcule la probabilidad de que 𝑋 esté entre 1,5 y 1,8.

143. Sea 𝑋 una variable aleatoria que modela la cantidad de tiempo en minutos que una persona tarda
en responder una pregunta de un examen y que tiene la siguiente función de densidad:

𝑓(𝑥) = —𝑎(6 − 𝑥) 0<𝑥<6


0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Determine la función de distribución acumulada 𝐹(𝑥) de la variable aleatoria 𝑋.


b. Use la función de distribución acumulada 𝐹(𝑥) de la variable 𝑋 para calcular la probabilidad
de que una persona se tarde hasta cuatro minutos en responder una pregunta.
c. Use la función de distribución acumulada 𝐹(𝑥) de la variable 𝑋 para calcular la probabilidad
de que una persona se tarde más de cinco minutos en responder una pregunta.
d. Use la función de distribución acumulada 𝐹(𝑥) de la variable 𝑋 para calcular la probabilidad
de que una persona se tarde entre dos y cinco minutos en responder una pregunta.

144. Para una estación gasolinera las ventas semanales, medidas en miles de galones, se modela con
una variable aleatoria 𝑋 que tiene la función de densidad que se muestra a continuación:

𝑥−1 1<𝑥≤2
𝑓(𝑥) = •3 − 𝑥 2<𝑥<3
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Calcule la probabilidad de que en una semana cualquiera venda al menos 1500 galones de
gasolina. Rpta. 0,875
b. Determine la función de distribución de probabilidad acumulada.
c. Calcule la venta semanal esperada. Rpta. 2,000

145. La proporción de personas que responden a una encuesta enviada por correo electrónico se mo-
dela con una variable aleatoria 𝑋 con la siguiente función de densidad:

𝑓(𝑥) = —𝑎(2𝑥 + 9) 0<𝑥<1


0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Determine y grafique la función de distribución acumulada de la variable aleatoria 𝑋.


b. Use la función de distribución acumulada para calcular la probabilidad de que respondan entre
60% y 80% de las personas a la encuesta. Rpta: 0,208
c. Use la función de distribución acumulada para calcular la mediana de 𝑋.
Rpta: 0,52493
Estadística Descriptiva 2022 01 193
Valor esperado de una variable aleatoria continua

El valor esperado o esperanza matemática de una variable aleatoria 𝑋 o media de una distribución de
probabilidad de 𝑋 se denota 𝐸(𝑋).

 ;X
𝜇? = 𝐸(𝑋) = ³ 𝑥 𝑓(𝑥) 𝑑𝑥
 OX

Valor esperado de una función de variable aleatoria continua

Sea 𝐺(𝑋) una función de la variable aleatoria continua 𝑋.

El valor esperado de 𝐺(𝑋):

 ;∞
𝜇R(?) = 𝐸(𝐺(𝑋)) = ³ 𝐺(𝑥)𝑓(𝑥) 𝑑𝑥
 O∞

Propiedades del valor esperado

• Si 𝑎 y 𝑏 son constantes, entonces:

𝐸(𝑎𝑋 + 𝑏) = 𝑎𝐸(𝑋) + 𝑏 = 𝑎 𝜇? + 𝑏

• Como casos particulares se tiene:

𝐸(𝑏) = 𝑏

𝐸(𝑋 + 𝑏) = 𝐸(𝑋) + 𝑏 = 𝜇? + 𝑏

𝐸(𝑎𝑋) = 𝑎 𝐸(𝑋) = 𝑎 𝜇?

• Si 𝑋 e 𝑌 son variables aleatorias, 𝑎 y 𝑏 son constantes, entonces:

𝐸(𝑎𝑋 + 𝑏𝑌) = 𝑎𝐸(𝑋) + 𝑏𝐸(𝑌)

• Como casos particulares se tiene:

𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)

𝐸(𝑋 – 𝑌) = 𝐸(𝑋) – 𝐸(𝑌)

• Si 𝑋 e 𝑌 son variables aleatorias independientes, 𝑎 y 𝑏 son constantes, entonces:


Estadística Descriptiva 2022 01 194
𝐸(𝑎 𝑋. 𝑏 𝑌) = 𝑎 𝑏 𝐸(𝑋) 𝐸(𝑌)

• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes, entonces:

𝐸(𝑋# . 𝑋$ . 𝑋) . . . 𝑋7 ) = 𝐸(𝑋# ). 𝐸(𝑋$ ). 𝐸(𝑋) ) . . . 𝐸(𝑋7 )

• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes y 𝑎# , 𝑎$ , 𝑎) , … , 𝑎7 son 𝑛 constantes,


entonces:

7 7

𝐸 ¡• 𝑎! 𝑋! ¢ = • 𝑎! 𝐸(𝑋! )
!6# !6#

• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias con la misma función de densidad, entonces se cum-


ple que 𝐸(𝑋! ) = µ, por lo tanto:

𝐸 ¡• 𝑋! ¢ = 𝑛𝜇
!6#

Varianza de una variable aleatoria continua

;X
𝜎?$ = 𝑉(𝑋) = ³ (𝑥 − 𝜇)$  𝑓(𝑥) 𝑑𝑥
OX

𝜎?$ = 𝑉(𝑋) = 𝐸(𝑋 $ ) − 𝐸(𝑋)$

Desviación estándar de una variable aleatoria continua

𝜎? = -𝑉(𝑋)

Varianza de una función de variable aleatoria continua

;X
$
𝜎R(?) =³ (𝐺(𝑋) − 𝜇R(?) )$  𝑓(𝑥) 𝑑𝑥
OX

Propiedades de la varianza

• Si 𝑎 y 𝑏 son constantes, entonces:

𝑉(𝑏) = 0

𝑉(𝑎𝑋) = 𝑎$ 𝑉(𝑋)
Estadística Descriptiva 2022 01 195
𝑉(𝑋 + 𝑏) = 𝑉(𝑋)

• Si 𝑋 e 𝑌 son dos variables aleatorias independientes, 𝑎 y 𝑏 son dos constantes, entonces:

𝑉(𝑎𝑋 + 𝑏𝑌) = 𝑎$ 𝑉(𝑋) + 𝑏$ 𝑉(𝑌)

• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes y 𝑎# , 𝑎$ , 𝑎) , … , 𝑎7 son 𝑛 constantes,


entonces:

7 7

𝑉 ¡• 𝑎! 𝑋! ¢ = • 𝑎!$ 𝑉(𝑋! )
!6# !6#

• Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes con la misma función de densidad,


entonces se cumple que 𝑉(𝑋! ) = s$ y, por lo tanto:

𝑉 ¡• 𝑋! ¢ = 𝑛𝜎 $
!6#

Coeficiente de variación

Una de las medidas de variabilidad que podríamos usar es el coeficiente de variación, tal como lo usa-
mos en la unidad de medidas de resumen.

El coeficiente de variación se define de la siguiente manera:

𝜎?
𝐶𝑉 = × 100%
𝐸(𝑋)

Ejemplo 53

Caso Metropolitano
La distancia, en metros, que recorre un usuario caminando para llegar a una estación del Metropoli-
tano se modela con la variable aleatoria X con la siguiente función de densidad.

𝑥
0 < 𝑥 < 500
𝑓(𝑥) = » 250000
𝑥
𝑎− 500 ≤ 𝑥 < 1000
250000

a. Calcule el esperado y la varianza de 𝑋.

Solución
Estadística Descriptiva 2022 01 196
Primero hallemos 𝑎.

H,, #,,,
𝑥 𝑥
³ 𝑑𝑥 + ³ 𝑎 − 𝑑𝑥 = 1
250000 250000
, H,,

De donde:

1
𝑎 =
250

Calculemos el esperado y la varianza de 𝑋.

H,, #,,,
𝑥 1 𝑥
𝐸(𝑋) = ³ 𝑥 𝑑𝑥 + ³ 𝑥 − 𝑑𝑥 = 500
250000 250 250000
, H,,

H,, #,,,
𝑥 $
1 𝑥
𝑉(𝑋) = ³ 𝑥 𝑑𝑥 + ³ 𝑥 $ − 𝑑𝑥 − 500$ = 41 666,7
250000 250 250000
, H,,

b. Calcule la probabilidad de que un usuario camine entre 300 y 700 metros para llegar a una esta-
ción.

Solución

La probabilidad pedida es:

G,,

𝑃(300 < 𝑋 < 700) = ³ 𝑓(𝑥)𝑑𝑥


),,

Como la función de densidad está definida de forma diferente en los tramos [300;500[ y [500;700],
entonces la integral es:

H,, G,,
𝑥 1 𝑥
𝑃(300 < 𝑋 < 700) = ³ 𝑑𝑥 + ³ − 𝑑𝑥 = 0,64
250000 250 250000
),, H,,
Estadística Descriptiva 2022 01 197
Ejercicios

146. El sobrepeso, en kilos, del equipaje de mano de un pasajero se modela con una variable aleatoria
𝑋 con la siguiente función de densidad de probabilidad:

𝑓(𝑥) = —𝑘(8 − 𝑥)
4≤𝑥≤6
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Si la desviación estándar de la variable aleatoria del sobrepeso es mayor a medio kilo, se va a


restringir el sobrepeso permitido en el equipaje de mano. Indique lo que se hará.

Solución

Interpretación

Representación

Cálculo

Análisis y argumentación

147. El tiempo, en minutos, que se tarda una persona en ser atendido en el counter del aeropuerto se
modela con una variable aleatoria 𝑋:

𝑓(𝑥) = —𝑘(8 − 𝑥) 4≤𝑥≤8


0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Determine la media de la variable aleatoria 𝑋.

148. El gerente comercial de la sucursal de Surco informa que el gasto mensual, en cientos de soles,
por la venta de libros a sus clientes es una variable aleatoria que tiene la siguiente función de
densidad:

1
𝑓(𝑥) = •8 𝑥 + 𝑎 2≤𝑥≤6
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Calcule el valor esperado del gasto mensual en libros. Rpta: 467 soles
Estadística Descriptiva 2022 01 198

Distribuciones de probabilidad de variable continua


Distribución uniforme

Función de densidad

1
𝑓(𝑥) = •𝑏 − 𝑎 𝑎≤𝑥≤𝑏
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Se dice que 𝑋 tiene una distribución uniforme y se denota:

𝑋~𝑈(𝑎, 𝑏)

Media
(𝑎 + 𝑏)
𝜇=
2
Varianza
(𝑏 − 𝑎)$
𝜎$ =
12

La función de distribución acumulada 𝐹(𝑥) de una variable uniforme es:

0 𝑥<𝑎
𝑥−𝑎
𝐹(𝑥) = ž 𝑎≤𝑥≤𝑏
𝑏−𝑎
1 𝑥>𝑏
Estadística Descriptiva 2022 01 199
Ejemplo 54

En ciertos experimentos, el error cometido al determinar la densidad de una sustancia es una variable
aleatoria cuya distribución es uniforme con 𝑎 = -0,025 y 𝑏 = 0,025.

a. ¿Cuál es la probabilidad de que tal error esté entre 0,010 y 0,015?


b. ¿Cuál es el error esperado cometido?

Solución

a. ¿Cuál es la probabilidad de que tal error esté entre 0,010 y 0,015?

Solución

Sea X:= error al determinar la densidad de una sustancia

𝑋~𝑈(𝑎 = −0,025, 𝑏 = 0,025)

Tiene la siguiente función de densidad

1
𝑓(𝑥) = •0,025 − (−0,025) −0,025 ≤ 𝑥 ≤ 0,025
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

1
𝑓(𝑥) = •0,05 −0,025 ≤ 𝑥 ≤ 0,025
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

La probabilidad pedida es:

𝑃(0,010 ≤ 𝑋 ≤ 0,015)

Existen dos formas de calcular esta probabilidad:

Integrando la función de densidad 𝑓(𝑥) o calculándola a partir del área del rectángulo.

,,,#H
1
𝑃(0,010 ≤ 𝑋 ≤ 0,015) = ³ 𝑑𝑥 = 0,10
0,050
,,,#,
Estadística Descriptiva 2022 01 200
b. ¿Cuál es el error esperado cometido?

Solución

La variable

𝑋~𝑈(𝑎 = −0,025, 𝑏 = 0,025)

tiene el siguiente valor esperado de errores

(𝑎 + 𝑏) (−0,025 + 0,025)
𝜇= = =0
2 2

Ejemplo 55

La llegada de cada uno de los empleados a su centro de labores se produce independientemente, de


acuerdo a la distribución uniforme en el intervalo comprendido entre las 8:00 y 8:25 am.

De una muestra de 10 empleados, calcule la probabilidad de que cuatro de ellos hayan llegado entre
las 8:15 y 8:20 AM.

Solución
Sea X:= tiempo, en minutos, desde las 8 AM hasta la hora de llegada de los empleados al centro de
trabajo, luego:

𝑋~𝑈(0, 25)

La función de densidad es :

1
𝑓(𝑥) = •25 0 ≤ 𝑥 ≤ 25
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Se define la variable:
𝑌: = número de empleados que llegan al centro de trabajo entre 8:15 y 8:20 AM.

𝑌~𝐵(𝑛 = 10; 𝑝 =? )

Debe calcularse la probabilidad de éxito p de que un empleado llegue al centro de trabajo entre 8:15
y 8:20 AM esto es:

$H
1
𝑝 = 𝑃(15 < 𝑋 < 25) = ³ 𝑑𝑥 = 0,20
25
#H
Estadística Descriptiva 2022 01 201
Entonces:

𝑌~𝐵(𝑛 = 10; 𝑝 = 0,20)

Luego la función de probabilidad es:

𝑃(𝑌 = 𝑦) = 𝑓(𝑦) = 𝐶\#, 0,20\ (1 − 0,20)#,O\ 𝑦 = 0, 1, … , 10

La probabilidad pedida es:

𝑃(𝑌 = 4) = 𝑓(4) = 𝐶-#, 0,20- (1 − 0,20)#,O- = 0,0881

En Excel, se usa la función = DISTR.BINOM.N(4;10;0.2;0) = 0,0881


Estadística Descriptiva 2022 01 202
Ejercicios

149. El tiempo en el que un avión llega a su destino con respecto a su hora programada se modela con
una variable aleatoria uniforme de parámetros -10 y 20. De tal manera que los valores negativos
indican que el avión llegó antes de la hora programada y los valores positivos indican que el avión
llegó después de la hora programada. Si la probabilidad de que un avión llegue con un retraso
mayor a 10 minutos es mayor al 20%, se revisarán los protocolos de salida de un avión. Indique lo
que se hará.

Solución
Interpretación

Representación

Cálculo

Análisis y argumentación

150. El tiempo en el que un avión llega a su destino con respecto a su hora programada se modela con
una variable aleatoria uniforme de parámetros -10 y 20. De tal manera que los valores negativos
indican que el avión llegó antes de la hora programada y los valores positivos indican que el avión
llegó después de la hora programada. Si la probabilidad de que un avión llegue con un retraso
mayor a 10 minutos es mayor al 20%, se revisarán los protocolos de salida de un avión. Indique lo
que se hará.
a. Calcule la probabilidad de que la diferencia entre la hora de llegada programada y la hora de
llegada sea mayor a seis minutos.
b. Si se escoge al azar 20 vuelos, calcule la probabilidad de que, como máximo, se tenga un vuelo
con retraso mayor a ocho minutos.

151. La variable X se distribuye uniformemente con media igual a 24 y varianza igual a 12, calcular los
parámetros de la función de densidad. Rpta: a = 18, b = 30

152. La función de Excel =ALEATORIO() genera un número con distribución uniforme con parámetros
a igual a cero y b igual a uno. Sea 𝑋 una variable aleatoria definida como el número generado por
dicha función.

a. Calcule la probabilidad de que la función genere un número aleatorio entre 0,2 y 0,7.
Rpta: 0,50
b. Use la función de distribución acumulada 𝐹(𝑥) para calcular 𝑃(0,15 < 𝑋 < 0,55).
Rpta: 0,40

153. El tiempo, en minutos, que demora un servicio de delivery en entregar una pizza puede modelarse
por una variable aleatoria uniforme con parámetros 10 y 38. Si la pizza se tarda más de 30 minutos
en ser entregada, el cliente no la pagará.

a. Si una familia pide una pizza, calcule la probabilidad de que le salga gratis.
Rpta: 0,2857
Estadística Descriptiva 2022 01 203
b. Si la familia pide una pizza diaria durante diez días seguidos, calcule la probabilidad de que por
lo menos una de ellas le salga gratis. Rpta: 0,9654
c. Una familia pidió una pizza hace 25 minutos y aún no ha llegado, ¿cuál es la probabilidad de
que le salga gratis? Rpta: 0,6154

154. Se ha observado que un servicio muy solicitado es llevar clientes de Jesús María a San Isidro. Se
define la variable uniforme 𝑋: = diferencia entre el tiempo programado y el tiempo real de lle-
gada del taxi, en minutos. Los parámetros de 𝑋 son -5 a 15, donde el signo negativo indica que el
vehículo llegó antes del tiempo estimado y el valor positivo indica que demoró más del tiempo
estimado.

𝑘 −5 ≤ 𝑥 ≤ 15
𝑓(𝑥) = —
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. Calcule la probabilidad que uno de estos servicios haya tenido un retraso mayor a cinco minu-
tos. Rpta: 0,50
b. Calcule el tiempo mínimo para pertenecer al 20% de los clientes que más demoran en llegar a
su destino. Si este tiempo es mayor a los 10 minutos se realizará un análisis de los tiempos
reales para cumplir con este servicio. ¿Qué decisión se tomará? Rpta: 11 minutos
c. Se elige aleatoriamente a diez de estos servicios, calcule la probabilidad de que cuatro lleguen
antes del tiempo programado. Rpta: 0,14600
Estadística Descriptiva 2022 01 204
Distribución exponencial
En variables que representan los tiempos de vida útil, tiempos de sobrevivencia, en tiempos de ocu-
rrencia en procesos de Poisson se suele utilizar la distribución exponencial.

La variable aleatoria 𝑋 tiene una distribución exponencial con parámetro 𝛽 (𝛽 > 0) si su función de
densidad de probabilidad es:

1 O]D
𝑓(𝑥) = •𝛽  𝑒
𝑥≥0
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Se denota:
𝑋 ~ 𝐸𝑥𝑝(𝛽)

Se lee que la variable aleatoria 𝑋 sigue una distribución exponencial con parámetro 𝛽.

Función de distribución acumulada

0 𝑥<0
𝐹(𝑥) = —
1 −   𝑒 OD/] 𝑥≥0

𝛽>0

Características
La variable puede tomar valores de 0 a +¥, no toma valores negativos.
La gráfica es descendente con sesgo a la derecha.
Existe una curva para cada valor de 𝛽.

Media
𝜇D = 𝐸(𝑋) = 𝛽

Varianza
𝜎?$ = 𝛽$

En Excel, se usa la función =DISTR.EXP.N(x; lambda = 1/beta; acumulado = 1)


Estadística Descriptiva 2022 01 205
Cálculo de un percentil
Para el cálculo del percentil 𝑃% pueden usar el SOLVE de la calculadora:

_
O ,
1−𝑒 ] =𝑘

Por ejemplo, si se quiere calcular el percentil 90 se debe resolver la siguiente ecuación:

_
O -.
1−𝑒 ] = 0,9

En Excel, se usa la función 𝑃%

=INV.GAMMA(k/100;1;beta)

Por ejemplo, si se quiere calcular el percentil 90, 𝑃I, =INV.GAMMA(0.9;1;beta).

Ejemplo 56

El ingeniero de planta de una línea aérea sabe que la duración promedio de los neumáticos de las
avionetas es de 1,5 años. Si la duración de los neumáticos tiene una distribución exponencial.

a. ¿Cuál es la probabilidad de que los neumáticos duren a lo más 1,6 años?

Solución

Definamos la variable aleatoria 𝑋: duración de neumáticos de las avionetas.

𝑋~𝐸𝑥𝑝(𝛽 = 1,5)

La probabilidad pedida es:

#,F
O
𝑃(𝑋 ≤ 1,6) = 𝐹(1,6) = 1 − 𝑒 #,H = 0,6558

b. ¿Cuál es la probabilidad de que los neumáticos duren más de dos años?

Solución

La probabilidad pedida es:

𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2)

$
O
= 1 − 𝐹(2) = 1 − k1 − 𝑒 #,H l = 0,2636
Estadística Descriptiva 2022 01 206
c. La gerencia de la línea aérea está evaluando la posibilidad de cambiar de proveedor si el tiempo
mínimo del 25% de los neumáticos que tienen una mayor duración es menor a 1,8 años.

Solución

Interpretación
Determinar si se va a cambiar de proveedor.

Representación
Se debe calcular el percentil 75 de la variable <duración de neumáticos de las avionetas>.

Cálculo
El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración lo representamos
por 𝑡B!7 .

𝑃(𝑋 > 𝑡B!7 ) = 0,25

𝑃(𝑋 > 𝑡B!7 ) = 1 − 𝑃(𝑋 ≤ 𝑡B!7 )

`
O /01
= 1 − 𝐹(𝑡B!7 ) = 1 − k1 − 𝑒 #,H l

`
O /01
=𝑒 #,H = 0,25

2
O /01
Tomamos logaritmo neperiano a ambos lados de la ecuación 𝑒 3,5 = 0,25

`
O /01
𝑙𝑛 k𝑒 #,H l = ln (0,25)

𝑡B!7
− = −1,3863
1,5

𝑡B!7 = 2,08 𝑎ñ𝑜𝑠

Análisis y argumentación
El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración es mayor a 1,8 años
(2,08 > 1,8). Por tanto, no se va a cambiar de proveedor.
Estadística Descriptiva 2022 01 207
Ejercicios

155. El tiempo, en días, que transcurre desde la adquisición de un vehículo nuevo hasta que se presenta
la primera falla mecánica se modela con una variable aleatoria exponencial con media de 500 días.

a. Calcule la probabilidad de que el tiempo que transcurre desde la adquisición de un vehículo


nuevo hasta que se presenta la primera falla mecánica sea mayor a 600 días.
b. Se elige al azar un vehículo, se observa que han pasado 300 días y no se ha presentado ninguna
falla mecánica, calcule la probabilidad de que pasen como máximo 200 días más antes de que
se presente la primera falla mecánica. Rpta: 0,3297
c. Calcule e interprete el cuartil 3 del tiempo que transcurre desde la adquisición de un vehículo
nuevo hasta que se presenta la primera falla mecánica. Rpta: 693,14 días
d. Calcule la probabilidad de que un vehículo, elegido al azar, presente la primera falla mecánica
después de los 700 días. Si esta probabilidad es menor del 80% se considera una falla impor-
tante y se solicitará el pago de la garantía al proveedor de la flota. ¿Cuál será la decisión?
Rpta: 0,2466

156. La vida útil, en meses, de un artefacto eléctrico es una variable aleatoria con distribución expo-
nencial con parámetro 𝛽. El fabricante afirma que el 90% de estos componentes tienen una vida
útil que supera los 60 meses. ¿Cuál es la media de la vida útil de estos componentes?
Rpta: 569,47 meses
Estadística Descriptiva 2022 01 208
Distribución normal

Función de densidad

Se dice que la variable aleatoria 𝑋 sigue una distribución normal con parámetros µ y s.

Se denota con:

𝑋~𝑁(µ, s$ )

La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de tendencia
central coinciden.

El rango de la variable normal es toda la recta real, esto es, de –¥ a + ¥.

Para el cálculo de probabilidades acumuladas en Excel se usa la función:

=DISTR.NORM.N(x; media; desviación estándar; acumulado = 1)

Para el cálculo del percentil 𝑃% en Excel se usa la función:

=INV.NORM(k; media; desviación estándar)

Por ejemplo, si se quiere calcular el percentil 90, 𝑘 = 0,9.

Estandarización
Se toma como referencia una distribución normal estándar (µ = 0 y s2 = 1). Se usa el cambio de variable:

𝑋−𝜇
𝑍=
𝜎

Se denota con:

𝑍~𝑁(µ = 0, s$ = 1)
Estadística Descriptiva 2022 01 209

Cálculo de una probabilidad de una variable normal

Para calcular una probabilidad de una variable normal existen varias posibilidades, entre ellas puede
usar:
• Estandarizar la variable para usar la tabla de la normal estándar.
• Usar un programa informático, como, por ejemplo, Excel.

Cálculo de una probabilidad usando de la tabla normal estándar

Para calcular una probabilidad usando la tabla normal estándar debemos estandarizar la variable y
obtenemos un valor de 𝑍.

𝑃(𝑋 ≤ 𝑎)

𝑋−𝜇 𝑎−𝜇
= 𝑃k ≤ l
𝜎 𝜎

𝑎−𝜇
= 𝑃 «𝑍 ≤ ¬
𝜎

POa
El valor de b
se redondea a dos decimales, usando redondeo simple.

• En la primera columna de este valor buscamos el valor de las unidades y las décimas.
• En la fila correspondiente al valor de la columna buscamos el valor de las centésimas.
• Su intersección nos dará la probabilidad.

La tabla normal estándar siempre nos dará el valor del área hacia la izquierda de Z.

𝑎−𝜇
𝑃 𝑍≤
𝜎
𝑎−𝜇
-4 -3 -2 -1 00 1 2 3 4
𝜎
Estadística Descriptiva 2022 01 210
Cálculo de una probabilidad de una variable normal usando Excel

Con Excel, se usa la función =DISTR.NORM.N(x;media;desv_estándar;acumulado)

• x: es el valor para el que desea la distribución.


• media: es la media aritmética de la distribución.
• desv_estándar: es la desviación estándar de la distribución, un número positivo.
• acumulado: Use acumulado = 1 para calcular la probabillidad.

La función siempre nos dará el valor del área hacia la izquierda de x.

Sea 𝑋 una variable normal tal que:

𝑋~𝑁(𝜇 = 30; 𝜎 $ = 5$ )

Calcule:
𝑃(𝑋 ≤ 37,8)
Solución

Primera forma: Usando la tabla de la normal estándar

Estandarizando la variable para usar la tabla de la normal estándar.

𝑋 − 𝜇 37,8 − 𝜇
𝑃(𝑋 ≤ 37,8) = 𝑃 k ≤ l
𝜎 𝜎

37,8 − 30
= 𝑃 k𝑍 ≤ l
5

= 𝑃(𝑍 ≤ 1,56)

Usando la tabla de la distribución normal estándar.

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449

Tenemos que:
𝑃(𝑍 ≤ 1,56) = 0,94062
Estadística Descriptiva 2022 01 211

0,94062

-4 -3 -2 -1 0 11,562 3 4

Segunda forma: Usando Excel

Usando algún programa estadístico como Excel.

En Excel, se usa =DISTR.NORM.N(1.56;0;1;1) = 0,94062

Cálculo de un percentil de una variable normal

Para calcular un percentil de una variable normal existen varias posibilidades:


• Estandarizar la variable para usar la tabla de la normal estándar
• Usar un programa informático, como, por ejemplo, Excel.

Cálculo de un percentil usando de la tabla normal estándar

Para calcular un percentil usamos la tabla normal estándar de forma inversa.

Para calcular el percentil 𝑘, se plantea la ecuación:

𝑃(𝑋 ≤ 𝑃% ) = 0, 𝑘

Luego, debemos estandarizar la variable.

𝑋 − 𝜇 𝑃% − 𝜇
𝑃k ≤ l = 0, 𝑘
𝜎 𝜎

𝑃% − 𝜇
𝑃 k𝑍 ≤ l = 0, 𝑘
𝜎

Luego, se busca dentro de la tabla el valor más cercano a 0, 𝑘. A partir de ese número dentro de la
tabla, salimos a la primera columna y primera fila y sumamos los números encontrados y obtendere-
mos el valor c.
Estadística Descriptiva 2022 01 212

0, 𝑘

𝑃! − 𝜇
-4 -3 -2 -1 00 1 2 = 𝑐3 4
𝜎
El valor del percentil se obtiene de la ecuación:

𝑃% = 𝜇 + 𝑐 𝜎

Cálculo de un percentil de una variable normal usando Excel

Con Excel, se usa la función =INV.NORM(probabilidad;media;desv_estándar).

• probabilidad: es un número entre 0 y 1. Por ejemplo, para calcular el percentil 70; use 0,7.
• media: es la media aritmética de la distribución.
• desv_estándar: es la desviación estándar de la distribución, un número positivo.
Estadística Descriptiva 2022 01 213
Tabla de la distribución normal estándar
Área bajo la curva normal: [P(Z £ z ) = a ]
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350

-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275

-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866

-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Estadística Descriptiva 2022 01 214
Tabla de la distribución normal estándar
Área bajo la curva normal: [P(Z £ z ) = a ]
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891

1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670

2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861

3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Estadística Descriptiva 2022 01 215
Ejercicios

157. Si 𝑍~ 𝑁(µ = 0, s$ = 1), calcular:

𝑃(𝑍 < 0,24) = …..

-4 -3 -2 -1 0 10,24 2 3 4

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793

𝑃(𝑍 > −3,56) = …..

-4 -3 -3,56
-2 -1 0 1 2 3 4

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
Estadística Descriptiva 2022 01 216

𝑃(0,30 < 𝑍 < 0,59) =

-4 -3 -2 -1 0 0,30 1 0,59 2 3 4

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490

Hallar 𝑐 para que 𝑃(𝑍 < 𝑐) = 0,63307.

-4 -3 -2 -1 0 1 c 2 3 4

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
Estadística Descriptiva 2022 01 217
Ejemplo 57
El gasto mensual de un usuario en el Metropolitano se modela con una variable normal con media de
100 soles y una desviación estándar de cinco soles. Se elige un usuario al azar.

a. Calcule la probabilidad de que gaste más de 105 soles.


b. Calcule la probabilidad de que gaste entre 90 y 110 soles.
c. Determine el gasto mensual mínimo para que esté en 10% de los que más gastan.

Solución

a. Calcule la probabilidad de que gaste más de 105 soles.

Solución
Defianmos la variable aleatoria
𝑋: = gasto mensual de un usuario en el Metropolitano

𝑋~𝑁(𝜇 = 100; 𝜎 $ = 5$ )

La probabilidad pedida es:

𝑃(𝑋 > 105)

Cálculo usando la tabla de la normal estándar

Como usamos la tabla normal estándar debemos usar el complemento, pues la tabla nos da el área
izquierda.

𝑃(𝑋 > 105) = 1 − 𝑃(𝑋 ≤ 105)

105 − 100
= 1 − 𝑃 k𝑍 ≤ l = 1 − 𝑃(𝑍 ≤ 1)
5

= 1 − 0,84134 = 0,15866

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100

Cálculo usando Excel

En Excel, se usa la función =1-DISTR.NORM.N(105;100;5;1)

b. Calcule la probabilidad de que gaste entre 90 y 110 soles.


Estadística Descriptiva 2022 01 218

Solución
La probabilidad pedida es:

𝑃(90 ≤ 𝑋 ≤ 110)

Estandarizamos, es decir, restamos la media 𝜇 y dividimos entre la desviación estándar 𝜎:

90 − 𝜇 𝑋 − 𝜇 110 − 𝜇
= 𝑃k ≤ ≤ l
𝜎 𝜎 𝜎

90 − 100 𝑋 − 100 110 − 100


= 𝑃k ≤ ≤ l
5 5 5

= 𝑃(−2 ≤ 𝑍 ≤ 2)

Usando la tabla de la normal estándar.

= 0,97725– 0,02275 = 0,9545

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537

z -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00


-2,1 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872

Cálculo usando Excel

En Excel, se usa la función =DISTR.NORM.N(110;100;5;1)-DISTR.NORM.N(90;100;5;1).

c. Determine el gasto mensual mínimo para que esté en 10% de los que más gastan.

Solución

Como nos piden determinar el gasto mensual mínimo para que esté en 10% de los que más gastan
Nos piden calcular el percentil 90.

𝑃(𝑋 ≤ 𝑎) = 0,90

Estandarizando:
Estadística Descriptiva 2022 01 219
𝑎 − 100
𝑃 k𝑍 ≤ l = 0,90
5

Buscamos el valor más cercano a 0,90; en este caso; 0,89973. Salimos a los bordes y obtenemos el
valor de 1,28.

z 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


1,1 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774

Luego:
𝑎 − 100
= 1,28
5

𝑎 = 1,28 × 5 + 100

𝑎 = 106,4

Cálculo usando Excel

En Excel, se usa la función =INV.NORM(0.9;100;5) = 106,4.

Ejemplo 58
En Buck Café, la máquina surtidora de refrescos está ajustada de tal forma que sirve en promedio 250
mililitros por vaso. Si la cantidad de refresco servido en los vasos sigue, aproximadamente, una distri-
bución normal con una desviación estándar de 10 mililitros. ¿Qué proporción de los vasos servidos
contendrán entre 240 y 255 mililitros de refresco?

Solución
Sea 𝑋: = cantidad de refresco servido por vaso

𝑋~𝑁(𝜇 = 250, s$ = 10$ )

La probabilidad pedida es:

𝑃(240 ≤ 𝑋 ≤ 255)

Cálculo usando la tabla de la normal estándar

Estandarizando se tiene:

240 − 𝜇 𝑋 − 𝜇 255 − 𝜇
= 𝑃k ≤ ≤ l
𝜎 𝜎 𝜎
Estadística Descriptiva 2022 01 220
240 − 250 255 − 250
= 𝑃k ≤𝑍≤ l
10 10

𝑃(−1 ≤ 𝑍 ≤ 0,5)

= 0,69146 − 0,15866 = 0,5328

Usando la tabla de la distribución normal estándar.

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175

z -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00


-1,1 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406

Cálculo usando Excel

En Excel, se usa la función =DISTR.NORM.N(255;250;10;1)-DISTR.NORM.N(240;250;10;1) = 0,5328

Ejemplo 59
Se informa que la cantidad de azúcar de los paquetes marcados con un kilo, tiene distribución normal
con media µ kilogramos y desviación estándar 0,02 kilogramos. Deteminar el valor de µ si la cantidad
de azúcar que contiene cada paquete es menor o igual a 0,95 kilos con probabilidad 0,102.

Solución

Sea 𝑋: = pesos de los paquetes de azúcar, en kilogramos

𝑋~𝑁(𝜇 =? , s$ = 0,02$ )

La condición establecida es:

𝑃(𝑋 ≤ 0,95) = 0,102

Estandarizando, es decir, restando la media y dividiendo que la desviación estándar, se tiene:

𝑋 − 𝜇 0,95 − 𝜇
𝑃k ≤ l = 0,102
𝜎 𝜎

Cálculo usando la tabla de la normal estándar

0,95 − 𝜇
𝑃 k𝑍 ≤ l = 0,102
𝜎
Estadística Descriptiva 2022 01 221

Usando la tabla normal estándar para calcular el valor z correspondiente.

0,95 − 𝜇
= −1,27
0,02

Dentro de la tabla de la normal estándar, buscamos el valor más cercano a 0,102; en este caso,
0,10204. Saliendo a los bordes, obtenemos el valor de -1,27.

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01


-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350

De donde:

0,95 − 𝜇 = −1,27 × 0,02

𝜇 = 0,9754

Cálculo usando Excel

0,95 − 𝜇
𝑃 k𝑍 ≤ l = 0,102
0,02

En Excel, se usa la función =INV.NORM(0.102;0;1) = -1,27 = -1,27

Luego
0,95 − 𝜇
= −1,27
0,02

De donde:

𝜇 = 0,9754
Estadística Descriptiva 2022 01 222
Ejercicios

158. La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una variable
aleatoria que tiene una distribución normal con una media igual a 400 soles y una desviación
estándar igual a 80 soles.

a. Calcule la probabilidad de que un cliente ahorre menos de 450 soles en un mes.


b. Calcule la probabilidad de que un cliente ahorre más de 360 soles mensuales.
c. Calcule la probabilidad que el ahorro mensual de un cliente esté entre 350 y 500 soles.
d. ¿Cuál es el ahorro mínimo mensual para estar en el 25% de los clientes que más ahorran?
e. ¿Cuál es el ahorro máximo mensual para estar en el 8% de los clientes que menos ahorran?
f. Si se elige al azar a 4000 clientes, calcule el valor esperado del número de clientes que ahorran
más de 500 soles.

159. El tiempo de incapacidad debido a un accidente laboral leve que tiene un trabajador de una em-
presa durante un mes se modela con una variable normal con una media de 90 horas y una des-
viación estándar de 18 horas. Si una persona ya tuvo 80 horas de incapacidad, calcule la probabi-
lidad de que tenga por lo menos 20 horas más. Rpta. 0,4070

160. Una compañía ha comprado una prueba para seleccionar personal. Los que han diseñado la
prueba saben que las notas siguen una distribución normal con una media de 75 puntos y una
desviación estándar de diez puntos. Calcule la probabilidad de que una persona que rinda esta
prueba obtenga una nota superior a 90 puntos. Rpta: 0,06681

161. En una ciudad se estima que la temperatura máxima en un día del mes de enero puede modelarse
con una variable normal con media 30°C y desviación estándar 2°C.

a. Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la temperatura
máxima sea menor a 31°C. Rpta: 0,69146
b. Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la temperatura
máxima esté entre 28,5 y 32°C. Rpta: 0,61472
c. Calcule el número esperado de días en el mes de enero en que la temperatura máxima es
mayor a 33°C. Asuma independencia entre las temperaturas de un día y otro.
Rpta: 2,07

162. Marque la opción correcta.

La moda de una variable aleatoria normal 𝑋 es:


a. Igual a cero.
b. El esperado de 𝑋.
c. Aquel valor para el cual 𝑓(𝑀𝑒) = 0,5, donde 𝑓 es la función de densidad de 𝑋.
d. No se puede determinar sin saber la desviación estándar.
e. Es el valor que acumula más del 50% del área. Rpta: b
Estadística Descriptiva 2022 01 223

Muestreo

Elemento
Es el objeto sobre el cual se hace la medición. También llamada unidad elemental.

Población muestreada
Es la colección de todos los elementos posibles que podrían extraerse en una muestra.

Marco muestral
Es una lista de los elementos que están disponibles para su elección en la etapa de muestreo.

Censo
Es el estudio completo de todos los elementos de la población.

Parámetro
Es un resumen de una característica de una población.

Estadístico
Es un resumen de una característica de una muestra.

Ventajas del muestreo


• Ahorro de dinero debido a que se consideran menos unidades para trabajar.
• Ahorro de tiempo, dado que el número de mediciones solo es de una parte representativa de la
población.
• Mayor precisión, la muestra puede ser más precisa porque reduce la magnitud de los errores no
muestrales, debido a que:
• Existe menos personal necesario para hacer las mediciones (u observaciones).
• Hay personal con mejor preparación.
• Puede variar las condiciones del estudio si se demora su ejecución.
• Conveniencia, es conveniente el uso de una muestra si el estudio ocasiona la destrucción de la
unidad estudiada.

Desventajas del muestreo


• Las estimaciones resultantes del muestreo están afectas al inevitable error de muestreo.
• La información proveniente de una muestra no proporciona información tipo inventario para cada
uno de los elementos de la población.
• Las estimaciones no pueden subdividirse para pequeños dominios de análisis, considerando que
no todos ellos pueden estar representados debidamente en la muestra.
• Requiere de personal especializado y experimentado.
Estadística Descriptiva 2022 01 224

Muestreo probabilístico
En el muestreo probabilístico, la selección de cada elemento de la muestra se hace siguiendo reglas
matemáticas de decisión. Todos los elementos de la población tienen una probabilidad real y conocida
de ser seleccionados. Existen diversos métodos de muestreo probabilístico como, por ejemplo:

Muestreo aleatorio simple


Se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo de una po-
blación que contiene un total de N unidades. Se garantiza que cada una de las muestras posibles tiene
la misma probabilidad de ser elegida.

Muestreo sistemático
Se selecciona un primer elemento aleatoriamente y, luego, los demás elementos que conformarán la
muestra cada cierto intervalo. Este muestreo supone que se cuenta con una enumeración completa
de los elementos de la población.

Muestreo estratificado
Se selecciona la muestra de los diversos estratos. Un estrato es una parte de la población, cuyos ele-
mentos tienen características similares. El objetivo de estratificar la población es buscar homogenei-
dad entre los estratos.
Estadística Descriptiva 2022 01 225

Muestreo aleatorio simple

En este procedimiento, se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de
muestreo de una población que contiene un total de N unidades.
Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.

Pasos por seguir para seleccionar una muestra simple aleatoria

1. Enumere las unidades del marco muestral con números sucesivos.


2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios.

El muestreo aleatorio simple presenta dos propiedades:

Representativo: Cada unidad tiene las mismas posibilidades de ser escogida.


Independencia: La selección de una unidad no influye en la selección de otras unidades.

Pero en el mundo real es difícil encontrar muestras completamente independientes y representativas.


Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método
no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta varias
veces a los que tienen varios números.

Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente,
información acerca del ingreso mensual (en soles) y años cumplidos en la empresa de cada uno de sus
trabajadores.
Estadística Descriptiva 2022 01 226
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las columnas C4,
C8, C11 y C15 de la tabla de números aleatorios.

Trabajadores registrados
Ingreso Ingreso Ingreso Años en la
Nº Años en la empresa Nº Años en la empresa Nº
(en soles) (en soles) (en soles) empresa
1 2300 5 51 2100 13 101 2400 16
2 2800 11 52 2100 9 102 1700 0
3 2400 4 53 1800 1 103 2500 12
4 2500 2 54 2000 9 104 1700 3
5 2300 3 55 2100 10 105 2400 17
6 2100 2 56 1900 4 106 2400 16
7 1700 2 57 2000 10 107 1900 7
8 2000 0 58 2300 11 108 1700 1
9 2200 7 59 2000 7 109 2100 6
10 2100 4 60 1700 1 110 2000 5
11 1700 0 61 1900 6 111 2000 3
12 2500 2 62 2000 9 112 2500 13
13 2800 13 63 2400 17 113 1700 0
14 2400 9 64 1700 0 114 2500 19
15 1700 1 65 1700 2 115 1700 3
16 2400 9 66 2400 17 116 2600 19
17 2200 10 67 2500 13 117 1600 1
18 2200 4 68 2600 16 118 1800 6
19 2300 10 69 2100 14 119 2100 10
20 2800 11 70 1900 7 120 1700 0
21 2100 7 71 2000 9 121 2400 16
22 1700 1 72 1800 7 122 2600 17
23 2500 6 73 2100 10 123 2100 10
24 2400 9 74 2300 12 124 2100 8
25 2700 17 75 2700 20 125 2400 17
26 1700 0 76 2800 20 126 1700 1
27 1600 2 77 1800 3 127 2600 20
28 2600 17 78 1700 5 128 2400 16
29 2500 13 79 1700 4 129 2700 17
30 2500 16 80 1700 0 130 2100 12
31 2700 17 81 1700 1 131 1600 0
32 1700 1 82 2100 6 132 2100 15
33 1600 1 83 2600 17 133 1900 5
34 2400 11 84 2400 9 134 2100 12
35 1900 3 85 2600 19 135 2200 12
36 1800 5 86 1900 7 136 2400 13
37 1800 3 87 1600 0 137 1800 4
38 2400 14 88 1900 3 138 2600 17
39 2600 16 89 2100 14 139 2700 20
40 2700 18 90 1700 0 140 2500 16
41 2100 11 91 2100 15 141 2500 16
42 2300 14 92 1700 1 142 1900 6
43 1700 0 93 2300 14 143 2100 15
44 2200 13 94 2500 16 144 1700 9
45 2900 20 95 2600 18 145 1500 0
46 1800 5 96 1900 3 146 1800 18
47 2100 16 97 2500 19 147 2100 10
48 2000 12 98 1800 6 148 2700 19
49 2000 12 99 1700 2 149 1800 9
50 2900 20 100 2000 10 150 2100 15
Estadística Descriptiva 2022 01 227

Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios. Como el marco muestral tiene 150 elementos usemos las
columnas C4, C5 y C6, para elegir números de tres cifras y luego C8, C9 y C10.

Los elementos seleccionados son:

Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística Descriptiva 2022 01 228
Ejemplo 60

Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente,
información acerca del ingreso mensual (en soles) y años cumplidos en la empresa de cada uno de sus
trabajadores.

Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio.

Use las columnas C4, C8, C11 y C15 de la tabla de números aleatorios.

Trabajadores registrados
Ingreso Ingreso Ingreso Años en la
Nº Años en la empresa Nº Años en la empresa Nº
(en soles) (en soles) (en soles) empresa
1 2300 5 51 2100 13 101 2400 16
2 2800 11 52 2100 9 102 1700 0
3 2400 4 53 1800 1 103 2500 12
4 2500 2 54 2000 9 104 1700 3
5 2300 3 55 2100 10 105 2400 17
6 2100 2 56 1900 4 106 2400 16
7 1700 2 57 2000 10 107 1900 7
8 2000 0 58 2300 11 108 1700 1
9 2200 7 59 2000 7 109 2100 6
10 2100 4 60 1700 1 110 2000 5
11 1700 0 61 1900 6 111 2000 3
12 2500 2 62 2000 9 112 2500 13
13 2800 13 63 2400 17 113 1700 0
14 2400 9 64 1700 0 114 2500 19
15 1700 1 65 1700 2 115 1700 3
16 2400 9 66 2400 17 116 2600 19
17 2200 10 67 2500 13 117 1600 1
18 2200 4 68 2600 16 118 1800 6
19 2300 10 69 2100 14 119 2100 10
20 2800 11 70 1900 7 120 1700 0
21 2100 7 71 2000 9 121 2400 16
22 1700 1 72 1800 7 122 2600 17
23 2500 6 73 2100 10 123 2100 10
24 2400 9 74 2300 12 124 2100 8
25 2700 17 75 2700 20 125 2400 17
26 1700 0 76 2800 20 126 1700 1
27 1600 2 77 1800 3 127 2600 20
28 2600 17 78 1700 5 128 2400 16
29 2500 13 79 1700 4 129 2700 17
30 2500 16 80 1700 0 130 2100 12
31 2700 17 81 1700 1 131 1600 0
32 1700 1 82 2100 6 132 2100 15
33 1600 1 83 2600 17 133 1900 5
34 2400 11 84 2400 9 134 2100 12
35 1900 3 85 2600 19 135 2200 12
36 1800 5 86 1900 7 136 2400 13
Estadística Descriptiva 2022 01 229
Ingreso Ingreso Ingreso Años en la
Nº Años en la empresa Nº Años en la empresa Nº
(en soles) (en soles) (en soles) empresa
37 1800 3 87 1600 0 137 1800 4
38 2400 14 88 1900 3 138 2600 17
39 2600 16 89 2100 14 139 2700 20
40 2700 18 90 1700 0 140 2500 16
41 2100 11 91 2100 15 141 2500 16
42 2300 14 92 1700 1 142 1900 6
43 1700 0 93 2300 14 143 2100 15
44 2200 13 94 2500 16 144 1700 9
45 2900 20 95 2600 18 145 1500 0
46 1800 5 96 1900 3 146 1800 18
47 2100 16 97 2500 19 147 2100 10
48 2000 12 98 1800 6 148 2700 19
49 2000 12 99 1700 2 149 1800 9
50 2900 20 100 2000 10 150 2100 15

Solución

Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios.

Como el marco muestral tiene 150 elementos usemos las columnas C4, C5 y C6, para elegir números de
tres cifras y luego C8, C9 y C10.

Los elementos seleccionados son:

Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
Estadística Descriptiva 2022 01 230
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística Descriptiva 2022 01 231
Ejercicios

163. Una empresa de 500 trabajadores se quiere elegir a 7 personas usando muestreo aleatorio
simple. Use las columnas C2, C5 y C12.

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística Descriptiva 2022 01 232

Muestreo sistemático

En el muestreo sistemático se elige un elemento del marco muestral cada cierto intervalo. Este mues-
treo supone que se cuenta con una enumeración completa de los elementos de la población.

Procedimiento para seleccionar una muestra sistemática

1. Calcule el valor de k, donde:


𝑁
𝑘=
𝑛

El valor de k se redondea al valor del entero menor.

2. Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio (A).

3. A partir de este número elegido, seleccione el siguiente que ocupa la posición (A + k) del listado
del marco muestral y así sucesivamente hasta completar la muestra.
Estadística Descriptiva 2022 01 233
Ejemplo 61

Se tiene una población de 12 personas y se desea elegir a cuatro de ellas mediante un muestreo siste-
mático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C3, C6 y C12.

Solución

Calculemos el valor de k, donde:

𝑁 12
𝑘= = =3
𝑛 4

El valor de k se redondea al valor del entero menor, luego k = 3.

Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque aleatorio (A). Ob-
servando la columna C3 de la tabla de números aleatorios tenemos que A = 2.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la quinta
posición (3 + 2 = 5) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es
decir, elegiremos los datos de las posiciones 2, 5, 8 y 11.

Ejemplo 62

Se tiene una población de 15 personas y se desea elegir a seis de ellas mediante un muestreo sistemá-
tico. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C4, C8 y C1.

Solución

Calculemos el valor de k, donde:

𝑁 15
𝑘= = = 2,5
𝑛 6

El valor de k se redondea al valor del entero menor, luego k = 2.

Seleccionemos aleatoriamente un número entero entre 1 y k = 2, llamado arranque aleatorio (A). Ob-
servando la columna C4 de la tabla de números aleatorios tenemos que A = 1.
Estadística Descriptiva 2022 01 234

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la tercera
posición (1 + 2 = 3) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es
decir, elegiremos los datos de las posiciones 1, 3, 5, 7, 9 y 11.

Ejemplo 63
Se tiene información de 40 personas de un barrio de Lima Metropolitana. Obtenga una muestra alea-
toria de ocho personas usando el muestreo sistemático y elabore una tabla con los elementos selec-
cionados. Utilice las columnas C8; C10; C11 de la tabla de números aleatorios.

Individuos registrados
Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 74
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162

Solución

Calculemos el valor de k, donde:

𝑁 40
𝑘= = =5
𝑛 8

El valor de k se redondea al valor del entero menor, luego k = 5.


Estadística Descriptiva 2022 01 235
Seleccionemos aleatoriamente un número entero entre 1 y k = 5, llamado arranque aleatorio (A).

Observando la columna C8 de la tabla de números aleatorios tenemos que A = 5.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la décima
posición (5 + 5 = 10) del listado del marco muestral y así sucesivamente hasta completar la muestra.
Es decir, elegiremos los datos de las posiciones 5, 10, 15, 20, 25, 30, 35 y 40.

Los elementos seleccionados son:

Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura


1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 74
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162
Estadística Descriptiva 2022 01 236
Ejercicios

164. Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la


tabla que se muestra a continuación información acerca de las variables: ingreso mensual (en so-
les), nivel de educación y años cumplidos en la empresa.

Años en
Ingreso Nivel de Años en Ingreso Nivel de Años en Ingreso Nivel de
Nº Nº Nº em-
(soles) educación empresa (soles) educación empresa (soles) educación
presa
1 2300 Secundaria 5 51 2100 Técnica 13 101 2400 Técnica 16
2 2800 Secundaria 11 52 2100 Técnica 9 102 1700 Técnica 0
3 2400 Secundaria 4 53 1800 Técnica 1 103 2500 Técnica 12
4 2500 Secundaria 2 54 2000 Técnica 9 104 1700 Técnica 3
5 2300 Secundaria 3 55 2100 Técnica 10 105 2400 Técnica 17
6 2100 Secundaria 2 56 1900 Técnica 4 106 2400 Técnica 16
7 1700 Secundaria 2 57 2000 Técnica 10 107 1900 Técnica 7
8 2000 Secundaria 0 58 2300 Técnica 11 108 1700 Técnica 1
9 2200 Secundaria 7 59 2000 Técnica 7 109 2100 Técnica 6
10 2100 Secundaria 4 60 1700 Técnica 1 110 2000 Técnica 5
11 1700 Secundaria 1 61 1900 Técnica 6 111 2000 Superior 3
12 2500 Secundaria 2 62 2000 Técnica 9 112 2500 Superior 13
13 2800 Secundaria 13 63 2400 Técnica 17 113 1700 Superior 0
14 2400 Secundaria 9 64 1700 Técnica 0 114 2500 Superior 19
15 1700 Secundaria 1 65 1700 Técnica 2 115 1700 Superior 3
16 2400 Secundaria 9 66 2400 Técnica 17 116 2600 Superior 19
17 2200 Secundaria 10 67 2500 Técnica 13 117 1600 Superior 1
18 2200 Secundaria 4 68 2600 Técnica 16 118 1800 Superior 6
19 2300 Secundaria 10 69 2100 Técnica 14 119 2100 Superior 10
20 2800 Secundaria 11 70 1900 Técnica 7 120 1700 Superior 0
21 2100 Secundaria 7 71 2000 Técnica 9 121 2400 Superior 16
22 1700 Secundaria 1 72 1800 Técnica 7 122 2600 Superior 17
23 2500 Secundaria 6 73 2100 Técnica 10 123 2100 Superior 10
24 2400 Secundaria 9 74 2300 Técnica 12 124 2100 Superior 8
25 2700 Secundaria 17 75 2700 Técnica 20 125 2400 Superior 17
26 1700 Secundaria 0 76 2800 Técnica 20 126 1700 Superior 1
27 1600 Secundaria 2 77 1800 Técnica 3 127 2600 Superior 20
28 2600 Secundaria 17 78 1700 Técnica 5 128 2400 Superior 16
29 2500 Secundaria 13 79 1700 Técnica 4 129 2700 Superior 17
30 2500 Secundaria 16 80 1700 Técnica 0 130 2100 Superior 12
31 2700 Secundaria 17 81 1700 Técnica 1 131 1600 Superior 0
32 1700 Secundaria 1 82 2100 Técnica 6 132 2100 Superior 15
33 1600 Secundaria 1 83 2600 Técnica 17 133 1900 Superior 5
34 2400 Secundaria 11 84 2400 Técnica 9 134 2100 Superior 12
Estadística Descriptiva 2022 01 237
35 1900 Secundaria 3 85 2600 Técnica 19 135 2200 Superior 12
36 1800 Secundaria 5 86 1900 Técnica 7 136 2400 Superior 13
37 1800 Secundaria 3 87 1600 Técnica 0 137 1800 Superior 4
38 2400 Secundaria 14 88 1900 Técnica 3 138 2600 Superior 17
39 2600 Secundaria 16 89 2100 Técnica 14 139 2700 Superior 20
40 2700 Secundaria 18 90 1700 Técnica 0 140 2500 Superior 16
41 2100 Técnica 11 91 2100 Técnica 15 141 2500 Superior 16
42 2300 Técnica 14 92 1700 Técnica 1 142 1900 Superior 6
43 1700 Técnica 0 93 2300 Técnica 14 143 2100 Superior 15
44 2200 Técnica 13 94 2500 Técnica 16 144 1700 Superior 9
45 2900 Técnica 20 95 2600 Técnica 18 145 1500 Superior 0
46 1800 Técnica 5 96 1900 Técnica 3 146 1800 Superior 18
47 2100 Técnica 16 97 2500 Técnica 19 147 2100 Superior 10
48 2000 Técnica 12 98 1800 Técnica 6 148 2700 Superior 19
49 2000 Técnica 12 99 1700 Técnica 2 149 1800 Superior 9
50 2900 Técnica 20 100 2000 Técnica 10 150 2100 Superior 15

Aplique el muestreo sistemático para seleccionar una muestra de ocho empleados y elabore un listado
con los elementos seleccionados. Utilice la columna C3, C9, y C12 de la tabla de números aleatorios. Con
la muestra obtenido, calcule el porcentaje muestral de trabajadores con ingresos mayores a 2000 so-
les.

Solución
Estadística Descriptiva 2022 01 238

Muestreo estratificado
Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de sus
elementos.

El objetivo de estratificar la población es buscar homogeneidad entre los estratos.

Pasos a seguir para seleccionar una muestra estratificada

1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a todos
los elementos de la población y que cada elemento pertenezca solamente a un estrato.
2. Calcule la cantidad de elementos a seleccionar en cada estrato.
3. Seleccione muestras aleatorias simples para cada uno de los estratos.
Estadística Descriptiva 2022 01 239
Recomendaciones para el uso de muestras estratificadas
• Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén rela-
cionadas entre sí.
• No se considera la formación de muchos estratos, generalmente se usa entre tres y ocho estratos.
• Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto, pueden no ser
considerados.

Ejemplo 64
La siguiente tabla muestra a los 120 alumnos de la especialidad de Comunicaciones, de la universidad
A, a quienes se les preguntó por su aplicación preferida para escuchar música y por la cantidad de
horas a la semana que la usaba.

Posición App Horas Posición App Horas Posición App Horas


1 Spotify 8 41 Spotify 16 81 YouTube Music 14
2 Spotify 9 42 Spotify 9 82 YouTube Music 8
3 Spotify 14 43 Spotify 8 83 YouTube Music 7
4 Spotify 12 44 Spotify 9 84 YouTube Music 15
5 Spotify 10 45 Spotify 4 85 YouTube Music 5
6 Spotify 9 46 Spotify 6 86 YouTube Music 8
7 Spotify 4 47 Spotify 7 87 YouTube Music 7
8 Spotify 10 48 Spotify 9 88 Amazon Music 6
9 Spotify 12 49 Spotify 8 89 Amazon Music 9
10 Spotify 10 50 Spotify 10 90 Amazon Music 9
11 Spotify 11 51 Spotify 12 91 Amazon Music 4
12 Spotify 13 52 Spotify 11 92 Amazon Music 2
13 Spotify 4 53 Spotify 9 93 Amazon Music 11
14 Spotify 2 54 Spotify 8 94 Amazon Music 2
15 Spotify 6 55 Spotify 4 95 Amazon Music 3
16 Spotify 4 56 Spotify 6 96 Amazon Music 8
17 Spotify 9 57 Spotify 7 97 Amazon Music 6
18 Spotify 5 58 Spotify 8 98 Amazon Music 7
19 Spotify 12 59 Spotify 7 99 Amazon Music 9
20 Spotify 7 60 Spotify 3 100 Amazon Music 4
21 Spotify 4 61 Spotify 6 101 Amazon Music 8
22 Spotify 6 62 Spotify 9 102 Amazon Music 7
23 Spotify 7 63 Spotify 2 103 Amazon Music 7
24 Spotify 8 64 Spotify 5 104 Amazon Music 9
25 Spotify 9 65 Spotify 1 105 Amazon Music 6
26 Spotify 10 66 Spotify 4 106 Amazon Music 7
27 Spotify 5 67 YouTube Music 7 107 Amazon Music 9
28 Spotify 4 68 YouTube Music 6 108 Amazon Music 8
29 Spotify 7 69 YouTube Music 7 109 Amazon Music 3
30 Spotify 4 70 YouTube Music 8 110 Amazon Music 11
31 Spotify 4 71 YouTube Music 4 111 Amazon Music 13
32 Spotify 6 72 YouTube Music 5 112 Amazon Music 14
33 Spotify 7 73 YouTube Music 3 113 Amazon Music 9
34 Spotify 5 74 YouTube Music 6 114 Amazon Music 8
35 Spotify 8 75 YouTube Music 5 115 Amazon Music 6
36 Spotify 9 76 YouTube Music 8 116 Amazon Music 5
37 Spotify 4 77 YouTube Music 7 117 Amazon Music 7
38 Spotify 5 78 YouTube Music 9 118 Amazon Music 3
39 Spotify 2 79 YouTube Music 10 119 Amazon Music 6
40 Spotify 9 80 YouTube Music 3 120 Amazon Music 5
Estadística Descriptiva 2022 01 240
Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable
<aplicación preferida> como variable de estratificación. Elabore un listado con el alumno seleccionado
y la cantidad de horas a la semana que escucha música con la aplicación de su preferencia. Para el
estrato 1 use las columnas C1, C5 y C9, para el estrato 2 use las columnas C7, C3, C8 y C15 y para el
estrato 3 use C12, C5, C8, C14, C1, y C7. Con la muestra obtenida calcule el promedio de horas a la
semana que los alumnos escuchan música con la aplicación de su preferencia.

Solución

Posición 𝑵𝒉
Estrato 𝑵𝒉 𝒏𝒉 = ×𝒏
(desde – hasta) 𝑵
𝑁# 66
1. Spotify N1 = 66 1 - 66 𝑛# = ×𝑛 = × 12 = 6,6 ≈ 7
𝑁 120
𝑁$ 21
2. Youtube Music N2 = 21 67 - 87 𝑛$ = ×𝑛 = × 12 = 2,1 ≈ 2
𝑁 120
𝑁) 33
3. Amazon Music N3 = 33 88 - 120 𝑛) = ×𝑛 = × 12 = 3,3 ≈ 3
𝑁 120
Total N = 120 𝑛 = 12

Posición App Horas Posición App Horas Posición App Horas


1 Spotify 8 41 Spotify 16 81 YouTube Music 14
2 Spotify 9 42 Spotify 9 82 YouTube Music 8
3 Spotify 14 43 Spotify 8 83 YouTube Music 7
4 Spotify 12 44 Spotify 9 84 YouTube Music 15
5 Spotify 10 45 Spotify 4 85 YouTube Music 5
6 Spotify 9 46 Spotify 6 86 YouTube Music 8
7 Spotify 4 47 Spotify 7 87 YouTube Music 7
8 Spotify 10 48 Spotify 9 88 Amazon Music 6
9 Spotify 12 49 Spotify 8 89 Amazon Music 9
10 Spotify 10 50 Spotify 10 90 Amazon Music 9
11 Spotify 11 51 Spotify 12 91 Amazon Music 4
12 Spotify 13 52 Spotify 11 92 Amazon Music 2
13 Spotify 4 53 Spotify 9 93 Amazon Music 11
14 Spotify 2 54 Spotify 8 94 Amazon Music 2
15 Spotify 6 55 Spotify 4 95 Amazon Music 3
16 Spotify 4 56 Spotify 6 96 Amazon Music 8
17 Spotify 9 57 Spotify 7 97 Amazon Music 6
18 Spotify 5 58 Spotify 8 98 Amazon Music 7
19 Spotify 12 59 Spotify 7 99 Amazon Music 9
20 Spotify 7 60 Spotify 3 100 Amazon Music 4
21 Spotify 4 61 Spotify 6 101 Amazon Music 8
22 Spotify 6 62 Spotify 9 102 Amazon Music 7
23 Spotify 7 63 Spotify 2 103 Amazon Music 7
24 Spotify 8 64 Spotify 5 104 Amazon Music 9
25 Spotify 9 65 Spotify 1 105 Amazon Music 6
26 Spotify 10 66 Spotify 4 106 Amazon Music 7
27 Spotify 5 67 YouTube Music 7 107 Amazon Music 9
28 Spotify 4 68 YouTube Music 6 108 Amazon Music 8
29 Spotify 7 69 YouTube Music 7 109 Amazon Music 3
30 Spotify 4 70 YouTube Music 8 110 Amazon Music 11
31 Spotify 4 71 YouTube Music 4 111 Amazon Music 13
Estadística Descriptiva 2022 01 241
32 Spotify 6 72 YouTube Music 5 112 Amazon Music 14
33 Spotify 7 73 YouTube Music 3 113 Amazon Music 9
34 Spotify 5 74 YouTube Music 6 114 Amazon Music 8
35 Spotify 8 75 YouTube Music 5 115 Amazon Music 6
36 Spotify 9 76 YouTube Music 8 116 Amazon Music 5
37 Spotify 4 77 YouTube Music 7 117 Amazon Music 7
38 Spotify 5 78 YouTube Music 9 118 Amazon Music 3
39 Spotify 2 79 YouTube Music 10 119 Amazon Music 6
40 Spotify 9 80 YouTube Music 3 120 Amazon Music 5

Estrato 1: Estrato 2: Estrato 3:


Spotify YouTube Music Amazon Music
Posición Horas Posición Horas Posición Horas
48 9 84 15 119 6
2 9 73 3 110 11
16 4 100 4
29 7
61 6
13 4
45 4

Entonces, con los doce elementos seleccionados en la muestra se tiene que la media muestral de horas
a la semana que los alumnos escuchan música a través de la aplicación de su preferencia es 6,83 horas.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
Estadística Descriptiva 2022 01 242
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

Ejemplo 65

La empresa de telecomunicaciones RTV tiene 120 empleados de los cuales tiene información de las
variables: ingreso en soles, nivel de educación y años en la empresa.

Años
Ingreso Años Ingreso Nivel de Ingreso Años
Nivel de cumplidos Nivel de edu-
Nº (en so- cumplidos Nº (en so- educa- Nº (en so- cumplidos
educación en la em- cación
les) en la empresa les) ción les) en la empresa
presa
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
Estadística Descriptiva 2022 01 243
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Técnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Técnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Técnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Técnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Técnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Técnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Técnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Técnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Técnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Técnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Técnica 10 110 2500 Superior 16
31 2100 Técnica 11 71 2400 Técnica 16 111 2500 Superior 16
32 2300 Técnica 14 72 1700 Técnica 0 112 1900 Superior 6
33 1700 Técnica 0 73 2500 Técnica 12 113 2100 Superior 15
34 2200 Técnica 13 74 1700 Técnica 3 114 1700 Superior 9
35 2900 Técnica 20 75 2400 Técnica 17 115 1500 Superior 0
36 1800 Técnica 5 76 2400 Técnica 16 116 1800 Superior 18
37 2100 Técnica 16 77 1900 Técnica 7 117 2100 Superior 10
38 2000 Técnica 12 78 1700 Técnica 1 118 2700 Superior 19
39 2000 Técnica 12 79 2100 Técnica 6 119 1800 Superior 9
40 2900 Técnica 20 80 2000 Técnica 5 120 2100 Superior 15

Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como variable
de estratificación el nivel educacional. Elabore un listado identificando la posición de cada empleado
seleccionado. Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9,
C10 y C11 y para el estrato 3 use las columnas C4, C3, C5 y C7.

Solución

Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3 son:
secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos mues-
tras aleatorias simples.

Números de elemen- Posiciones #!


Estratos Cantidad seleccionada por estrato 𝑛" = ×𝑛
tos en el estrato 𝑁" (desde – hasta) $

𝑁% 30
1. Secundaria 𝑁% = 30 1 – 30 𝑛% = ×𝑛 = × 16 = 4
𝑛 120

𝑁& 50
2. Técnica 𝑁& = 50 31 – 80 𝑛& = ×𝑛 = × 16 = 6,67 ≈ 7
𝑛 120
𝑁' 40
3. Superior 𝑁' = 40 81 – 120 𝑛' = ×𝑛 = × 16 = 5,33 ≈ 5
𝑛 120

Total 𝑵 = 120 𝒏 = 16

Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y C5.
Observemos que las posiciones de los elementos a elegir están entre el 1 y el 30.
Estadística Descriptiva 2022 01 244
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

Luego, el cuadro con las posiciones de los elementos seleccionados para el estrato Secundaria es:

Estrato Secundaria Posición 2 16 29 13

Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10 y C11.
Observemos que las posiciones de los elementos a elegir están entre el 31 y el 80.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:

Estrato Técnica Posición 54 62 66 77 48 67 44

Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y C7.
Observemos que las posiciones de los elementos a elegir están entre el 81 y el 120.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:
Estadística Descriptiva 2022 01 245

Estrato Superior Posición 114 81 97 105 83

Años
Ingreso Años Ingreso Nivel de Ingreso Años
Nivel de cumplidos Nivel de edu-
Nº (en so- cumplidos Nº (en so- educa- Nº (en so- cumplidos
educación en la em- cación
les) en la empresa les) ción les) en la empresa
presa
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Técnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Técnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Técnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Técnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Técnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Técnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Técnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Técnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Técnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Técnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Técnica 10 110 2500 Superior 16
31 2100 Técnica 11 71 2400 Técnica 16 111 2500 Superior 16
32 2300 Técnica 14 72 1700 Técnica 0 112 1900 Superior 6
33 1700 Técnica 0 73 2500 Técnica 12 113 2100 Superior 15
34 2200 Técnica 13 74 1700 Técnica 3 114 1700 Superior 9
35 2900 Técnica 20 75 2400 Técnica 17 115 1500 Superior 0
36 1800 Técnica 5 76 2400 Técnica 16 116 1800 Superior 18
37 2100 Técnica 16 77 1900 Técnica 7 117 2100 Superior 10
38 2000 Técnica 12 78 1700 Técnica 1 118 2700 Superior 19
39 2000 Técnica 12 79 2100 Técnica 6 119 1800 Superior 9
40 2900 Técnica 20 80 2000 Técnica 5 120 2100 Superior 15
Estadística Descriptiva 2022 01 246
Ejercicios

165. Objetivo específico: Determinar los clientes a seleccionar para realizar un estudio sobre me-
joras en el servicio de mantenimiento.

Juan Pérez, dueño de un taller de mantenimiento de multimarca desea aplicar


técnicas estadísticas que le permitan mejoras en el servicio de mantenimiento,
para ello ha decidido realizar una encuesta a 11 clientes entre los 150 clientes
atendidos en el último mes, indicando la posición del dato seleccionado y el va-
lor de las variables solicitadas de acuerdo con los siguientes tipos de muestreo.

a. Usando muestreo aleatorio simple, calcule el porcentaje de autos Hyundai seleccionados en su


muestra. De la tabla de números aleatorios use las columnas: C4, C1, C12, C5, C13, C7, C15 y C10.
b. Usando muestreo aleatorio sistemático, calcule el porcentaje de clientes que pagaron más de 300
soles seleccionados en su muestra. De la tabla de números aleatorios use la columna C7.
c. Se desea estimar el pago promedio usando muestreo aleatorio estratificado. Use las columnas de
números aleatorios que se indican: Afinamiento, C17, C2, C15, C4, C13, C6, C11, C1; Dirección: C7,
C12, C5, C4, C3, C16, C2, C9; Frenos: C6, C2, C5, C14, C3, C16, C18, C1; Luces: C3, C12, C5, C17, C7,
C9, C1,C6, C8, C10; Nivelación: C13, C12, C5, C7, C17, C1, C3, C8, C4
La siguiente tabla muestra a los 150 clientes del taller de mantenimiento atendidos en el último mes.

Servicio so- Servicio Servicio


N° Marca Tipo licitado Pago N° Marca Tipo solicitado Pago N° Marca Tipo solicitado Pago
1 Toyota Auto Afinamiento 514 51 Honda Camioneta Dirección 496 101 Mitsubishi Camioneta Luces 716
2 Nissan Auto Afinamiento 289 52 Hyundai Camioneta Dirección 324 102 Hyundai Auto Luces 403
3 Hyundai Camioneta Afinamiento 480 53 Hyundai Camioneta Dirección 623 103 Mitsubishi Camioneta Luces 556
4 Honda Camioneta Afinamiento 419 54 Nissan Camioneta Dirección 478 104 Honda Auto Luces 362
5 Mitsubishi Auto Afinamiento 354 55 Toyota Camioneta Dirección 441 105 Hyundai Auto Luces 417
6 Hyundai Camioneta Afinamiento 404 56 Hyundai Auto Dirección 476 106 Hyundai Auto Luces 504
7 Nissan Camioneta Afinamiento 542 57 Toyota Camioneta Dirección 413 107 Hyundai Auto Luces 379
8 Hyundai Camioneta Afinamiento 408 58 Nissan Auto Dirección 512 108 Honda Camioneta Luces 457
9 Hyundai Camioneta Afinamiento 385 59 Nissan Auto Dirección 440 109 Mitsubishi Camioneta Luces 449
10 Mitsubishi Camioneta Afinamiento 419 60 Mitsubishi Auto Dirección 472 110 Hyundai Camioneta Luces 458
11 Hyundai Camioneta Afinamiento 598 61 Nissan Camioneta Dirección 556 111 Nissan Auto Luces 443
12 Hyundai Camioneta Afinamiento 366 62 Mitsubishi Camioneta Dirección 380 112 Hyundai Auto Luces 505
13 Nissan Auto Afinamiento 380 63 Honda Camioneta Frenos 703 113 Hyundai Auto Luces 434
14 Honda Auto Afinamiento 479 64 Honda Auto Frenos 462 114 Honda Auto Luces 380
15 Hyundai Auto Afinamiento 466 65 Nissan Auto Frenos 414 115 Nissan Camioneta Luces 522
16 Nissan Auto Afinamiento 387 66 Toyota Auto Frenos 326 116 Hyundai Camioneta Luces 544
17 Mitsubishi Camioneta Afinamiento 435 67 Honda Auto Frenos 193 117 Nissan Auto Luces 576
18 Honda Auto Afinamiento 426 68 Honda Camioneta Frenos 604 118 Honda Camioneta Luces 452
19 Toyota Auto Afinamiento 528 69 Honda Auto Frenos 524 119 Hyundai Auto Luces 558
20 Nissan Auto Afinamiento 475 70 Hyundai Auto Frenos 348 120 Mitsubishi Camioneta Luces 335
21 Honda Camioneta Afinamiento 517 71 Hyundai Auto Frenos 390 121 Nissan Auto Luces 375
22 Hyundai Auto Afinamiento 600 72 Toyota Auto Frenos 586 122 Toyota Camioneta Luces 468
23 Nissan Auto Afinamiento 229 73 Honda Camioneta Frenos 482 123 Hyundai Auto Luces 424
24 Honda Camioneta Afinamiento 434 74 Nissan Auto Frenos 450 124 Mitsubishi Auto Luces 496
25 Mitsubishi Camioneta Afinamiento 370 75 Hyundai Auto Frenos 538 125 Nissan Auto Nivelación 437
26 Toyota Auto Afinamiento 436 76 Hyundai Auto Frenos 245 126 Hyundai Auto Nivelación 458
27 Hyundai Auto Afinamiento 385 77 Nissan Auto Frenos 331 127 Mitsubishi Auto Nivelación 382
28 Toyota Auto Afinamiento 472 78 Nissan Auto Frenos 457 128 Nissan Auto Nivelación 464
29 Hyundai Camioneta Afinamiento 479 79 Toyota Auto Frenos 503 129 Mitsubishi Auto Nivelación 592
30 Hyundai Auto Afinamiento 483 80 Mitsubishi Auto Frenos 487 130 Toyota Auto Nivelación 403
31 Toyota Camioneta Afinamiento 366 81 Toyota Auto Frenos 206 131 Honda Auto Nivelación 455
32 Honda Auto Afinamiento 410 82 Toyota Camioneta Frenos 465 132 Toyota Camioneta Nivelación 394
Estadística Descriptiva 2022 01 247
33 Hyundai Auto Afinamiento 432 83 Hyundai Camioneta Frenos 341 133 Nissan Auto Nivelación 387
34 Hyundai Auto Afinamiento 333 84 Toyota Camioneta Frenos 421 134 Hyundai Auto Nivelación 559
35 Nissan Auto Afinamiento 484 85 Honda Auto Frenos 269 135 Mitsubishi Camioneta Nivelación 394
36 Toyota Auto Dirección 235 86 Toyota Auto Frenos 540 136 Honda Auto Nivelación 442
37 Honda Camioneta Dirección 800 87 Hyundai Auto Frenos 531 137 Toyota Camioneta Nivelación 589
38 Hyundai Auto Dirección 519 88 Hyundai Auto Frenos 529 138 Honda Auto Nivelación 489
39 Honda Auto Dirección 315 89 Honda Camioneta Frenos 499 139 Honda Camioneta Nivelación 580
40 Mitsubishi Camioneta Dirección 445 90 Mitsubishi Auto Frenos 474 140 Hyundai Auto Nivelación 322
41 Hyundai Auto Dirección 555 91 Toyota Camioneta Frenos 434 141 Hyundai Auto Nivelación 414
42 Hyundai Camioneta Dirección 479 92 Honda Camioneta Luces 371 142 Honda Auto Nivelación 382
43 Toyota Auto Dirección 497 93 Nissan Auto Luces 800 143 Toyota Auto Nivelación 542
44 Honda Camioneta Dirección 380 94 Honda Auto Luces 421 144 Nissan Auto Nivelación 394
45 Hyundai Auto Dirección 455 95 Nissan Camioneta Luces 583 145 Hyundai Camioneta Nivelación 558
46 Nissan Camioneta Dirección 505 96 Honda Camioneta Luces 400 146 Honda Camioneta Nivelación 393
47 Mitsubishi Auto Dirección 463 97 Hyundai Auto Luces 351 147 Hyundai Camioneta Nivelación 256
48 Hyundai Camioneta Dirección 361 98 Mitsubishi Auto Luces 385 148 Toyota Auto Nivelación 278
49 Hyundai Auto Dirección 630 99 Hyundai Camioneta Luces 377 149 Hyundai Auto Nivelación 290
50 Hyundai Camioneta Dirección 585 100 Honda Camioneta Luces 331 150 Mitsubishi Camioneta Nivelación 555
Estadística Descriptiva 2022 01 248
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística Descriptiva 2022 01 249

Propiedad reproductiva de la normal


Igual que sucede con otras distribuciones, como la de Bernoulli, la binomial o la de Poisson, la variable
aleatoria de la distribución normal es reproductiva; esto quiere decir que, si sumamos variables alea-
torias de distribución normal, la variable suma también es otra variable de distribución normal.

La reproductividad de la variable normal nos asegura que un histograma de estos valores tendrá el
aspecto de la curva de Gauss. La forma de saber los parámetros concretos (media y desviación están-
dar) de la variable suma nos la da el siguiente resultado teórico.

Si 𝑋# , 𝑋$ , 𝑋) , … , 𝑋7 son 𝑛 variables aleatorias independientes, tales que:

𝑋! ~𝑁(𝜇! , s$! )

para cada 𝑖 = 1, 2, 3, ⋯ , 𝑛; entonces, la variable aleatoria Y está distribuida normalmente.

𝑆 = 𝑐# 𝑋# + 𝑐$ 𝑋$ + ⋯ + 𝑐7 𝑋7 = • 𝑐! 𝑋! ~𝑁(𝜇d ; 𝜎d$ )
!6#

donde 𝑐# , 𝑐$ , … , 𝑐7 son constantes.

Media
7

𝐸(𝑆) = 𝜇d = 𝑐# 𝜇# + 𝑐$ 𝜇$ + ⋯ + 𝑐7 𝜇7 = • 𝑐! 𝜇!
!6#

Varianza
7

𝑉(𝑆) = 𝜎d$ = 𝑐#$ 𝜎#$ + 𝑐$$ 𝜎$$ + ⋯+ 𝑐7$ 𝜎7$ = • 𝑐!$ 𝜎!$
!6#

Como caso particular, si tenemos que 𝑐! = 1.

7 7 7

𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 = • 𝑋! ~𝑁 ¡• 𝜇! ; • 𝜎!$ ¢
!6# !6# !6#

Como casos particulares, si 𝑋# y 𝑋$ tienen distribuciones normales 𝑋# ~𝑁(𝜇# ; 𝜎#$ ) y 𝑋$ ~𝑁(𝜇$ ; 𝜎$$ )
respectivamente, entonces:

𝑆 = 𝑋# + 𝑋$ ~𝑁(𝜇# + 𝜇$ ; 𝜎#$ + 𝜎$$ )

𝑆 = 𝑋# − 𝑋$ ~𝑁(𝜇# − 𝜇$ ; 𝜎#$ + 𝜎$$ )


Estadística Descriptiva 2022 01 250
Ejemplo 66
Dos supermercados compiten por tomar el liderazgo del mercado. Un estudio reciente de una compa-
ñía de investigación de mercado estimó que las ventas diarias (en miles de dólares) de los dos super-
mercados se distribuyen normalmente con medias de 15 y 17 y desviaciones estándar de 3 y 4 respec-
tivamente.
a. Calcule la probabilidad de que el segundo supermercado obtenga mayores ventas que el primer
supermercado en el primer día.
b. Calcule la probabilidad de que la diferencia entre las ventas diarias de ambos supermercados no
supere los 1000 dólares.

Solución
a. Calcule la probabilidad de que el segundo supermercado obtenga mayores ventas que el primer
supermercado en el primer día.

Solución

Sean las variables:

𝑋: = ventas diarias del primer supermercado

𝑋~𝑁(15; 9)

𝑌: = ventas diarias del segundo supermercado

𝑌~𝑁(17; 16)

Se pide:
𝑃(𝑌 > 𝑋) = 𝑃(𝑌 − 𝑋 > 0)

Sea la variable:
𝑊 =𝑌−𝑋

Por la propiedad reproductiva de la distribución normal, se tiene:

𝑊~𝑁(1 × 17 + (−1) × 15; (1)$ × 16 + (−1)$ × 9)

𝑊~𝑁(2; 25)

La probabilidad pedida es:

𝑊−2 0−2
𝑃(𝑌– 𝑋 > 0) = 𝑃(𝑊 > 0) = 𝑃 k > l
5 5

= 𝑃(𝑍 > −0,4) = 1 − 0,34458 = 0,65542


Estadística Descriptiva 2022 01 251
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209

b. Calcule la probabilidad de que la diferencia entre las ventas diarias de ambos supermercados no
supere los 1000 dólares.

Solución

En este caso, se pide calcular la probabilidad de la diferencia entre las ventas de los supermercados
sea menor o igual a 1000 dólares.

𝑃(|𝑊| ≤ 1)

= 𝑃(−1 ≤ 𝑊 ≤ 1)

−1 − 2 𝑊 − 2 1 − 2
= 𝑃k ≤ ≤ l
5 5 5

= 𝑃(−0,6 ≤ 𝑍 ≤ −0,2) = 0,42074 − 0,27425 = 0,14649

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017

En Excel, se usa la función =DISTR.NORM.N(1;2;5;1)-DISTR.NORM.N(-1;2;5;1)


Estadística Descriptiva 2022 01 252
Ejemplo 67
Caso Metropolitano
El peso de un usuario hombre del Metropolitano se modela con una variable normal con media de 75
kilos y desviación estándar de 15 kilos, mientras que para una usuaria mujer con media de 60 kilos y
desviación estándar de 10 kilos. Si en un bus hay 50 hombres y 30 mujeres.

a. Si se elige una persona al azar, calcule la probabilidad de que pese más de 70 kilos.
b. Calcule la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere 5500 kilos.

Solución

a. Si se elige una persona al azar, calcule la probabilidad de que pese más de 70 kilos.

Solución
Sean los eventos:
𝐴: = una persona pese más de 70 kilos
𝐻: = Que el usuario sea hombre
50
𝑃(𝐻) = = 0,625
80
𝑀: = Que el usuario sea mujer
30
𝑃(𝑀) = = 0,375
80

Sean las variables aleatorias:

𝑋: = peso de un hombre

𝑋~𝑁(75; 15$ )
𝑌: = peso de una mujer

𝑌~𝑁(60; 10$ )

Usaremos teorema de la probabilidad total:

𝑃(𝐴) = 𝑃(𝐻)𝑃(𝐴/𝐻) + 𝑃(𝑀)𝑃(𝐴/𝑀)

Calculemos cada una de las probabilidades condicionadas

𝑃(𝐴⁄𝐻) = 𝑃(𝑋 > 70) = 1 − 𝑃(𝑍 < −0,33) = 1 − 0,37070 = 0,6293

z -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00


-0,4 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
Estadística Descriptiva 2022 01 253
𝑃(𝐴⁄𝑀 ) = 𝑃(𝑌 > 70) = 1 − 𝑃(𝑍 < 1) = 1 − 0,8413 = 0,1587

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100

Luego:

𝑃(𝐴⁄𝐻) = 0,6293
𝑃(𝐻) = 0,625
𝑃(𝐴K ⁄𝐻 ) = 0,3707

𝑃(𝐴⁄𝑀) = 0,1587
𝑃(𝑀) = 0,375
𝑃(𝐴K ⁄𝑀) = 0,8413

𝑃(𝐴) = 𝑃(𝐻)𝑃(𝐴⁄𝐻) + 𝑃(𝑀) 𝑃(𝐴⁄𝑀)

= 0,625 × 0,6293 + 0,375 × 0,1587 = 0,4528

b. Calcule la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere 5500 kilos.

Solución

Sea 𝑌: = el peso total de los 50 hombres y 30 mujeres

H, ),

𝑌 = • 𝑋! + • 𝑌!
!6# !6#

Por propiedad reproductiva de la normal, se tiene que:

𝑌~𝑁(50 × 75 + 30 × 60; 50 × 15$ + 30 × 10$ )

Es decir:

𝑌~𝑁(5550; 14250)

La probabilidad pedida es la probabilidad de que el peso total de los 50 hombres y 30 mujeres


supere 5500 kilos.
Estadística Descriptiva 2022 01 254
𝑃(𝑌 > 5500)

Estandarizando:

𝑌 − 5550 5500 − 5550


= 𝑃k > l
√14250 √14250

= 𝑃(𝑍 > −0,42)

= 1 − 𝑃(𝑍 ≤ −0,42)

z -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00


-0,5 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209

= 1 − 0,33724 = 0,66276

Cálculo usando Excel


En Excel, se usa la función =1-DISTR.NORM.N(5500;5550;RAIZ(14250);1)
Estadística Descriptiva 2022 01 255
Ejercicios
166. Si 𝑋# , 𝑋$ son dos variables normales, tales que:

𝑋# ~𝑁(µ# = 8, 𝜎#$ = 12)


𝑋$ ~𝑁Nµ$ = 10, 𝜎$$ = 20O

Indique la distribución de la variable 𝑆 y sus parámetros.

a. 𝑆 = 𝑋# + 𝑋$

𝑆 = 𝑋# + 𝑋$ ~ 𝑁(… ; … )

𝑆 ~ 𝑁(… ; … )

b. 𝑆 = 𝑋# − 𝑋$

𝑆 = 𝑋# − 𝑋$ ~ 𝑁(… ; … )

𝑆 ~ 𝑁(… ; … )

167. En un estudio de evaluación de la atención de un servicio de cafeterías, los tiempos, en minutos,


que tardan en atender a un cliente las cafeterías A y B se modelaron con las variables aleatorias
𝑋~𝑁(4,9) y 𝑌~𝑁(5,16) respectivamente y de manera independiente. Si en cada cafetería son
atendidas 20 personas, halle la probabilidad de que el tiempo total de atención en la cafetería B
sea mayor que el de la cafetería A. Rpta. 0,81327

168. Una familia tiene tres hijos. El monto de la propina semanal que se le da a cada hijo puede mode-
larse como una variable normal. Al menor se le da en media 23,5 soles por semana con una des-
viación estándar de 3 soles, al segundo hijo se le da el doble que al menor y al mayor se le da el
triple que al menor. Calcular la probabilidad de que en cuatro semanas la suma total recibida en
propinas por los tres sume más de 600 soles. Rpta. 0,15866

169. El peso de los pasajeros adultos de un avión se modela con una variable normal:
• en mujeres, con media 65 kilos y desviación estándar 15 kilos.
• en hombres, con media 80 kilos y desviación estándar 20 kilos.
a. Si la probabilidad de que 10 pasajeras mujeres y 10 pasajeros hombres pesen más de 1500
kilos es mayor a 0,3 se va a restringir la cantidad de pasajeros en las avionetas pequeñas.
Indique lo que hará la compañía.
b. En un avión el 60% de los pasajeros son hombres. Si la probabilidad de que una persona pese
más de 75 kilos es mayor a 0,3 se restringirá el peso de los equipajes de mano. Indique lo que
se hará.
Estadística Descriptiva 2022 01 256

Distribución muestral de un estadístico


Es la lista de posibles valores de un estadístico y la probabilidad asociada a cada valor.

Distribución de la media muestral de una población normal

Si 𝑋# , 𝑋$ , … , 𝑋7 son 𝑛 variables independientes con distribución normal, tales que 𝑋! con media µ y
varianza 𝜎 $ , entonces la distribución de la variable media muestral 𝑋h es la siguiente:

𝑋# + 𝑋$ + ⋯ + 𝑋7
𝑋h = ~𝑁N𝜇?e ; 𝜎?$e O
𝑛

Â
Media de la variable media muestral 𝑿
𝜇?e = 𝜇

Â
Varianza de la variable media muestral 𝑿
𝜎$
𝜎?$e =
𝑛
Es decir:
𝑋# + 𝑋$ + ⋯ + 𝑋7 𝜎$
𝑋h = ≈ 𝑁 š𝜇; ›
𝑛 𝑛

Distribución de la media muestral de una población no normal (Teorema del


límite central)

Si 𝑋# , 𝑋$ , … , 𝑋7 son 𝑛 variables independientes e igualmente distribuidas, tales que 𝑋! con media 𝜇 y


varianza 𝜎 $ , entonces la variable aleatoria 𝑋h tiene una distribución aproximadamente normal a me-
dida que 𝑛 crece, independientemente de la distribución de la población.

La distribución muestral de la media muestral (𝑋h) se aproxima a la distribución normal si 𝑛 ³ 30.

𝑋# + 𝑋$ + ⋯ + 𝑋7
𝑋h = ≈ 𝑁N𝜇?e ; 𝜎?$e O
𝑛

Â
Media de la variable media muestral 𝑿
𝜇?e = 𝜇

Â
Varianza de la variable media muestral 𝑿
𝜎$
𝜎?$e =
𝑛
Es decir:
𝑋# + 𝑋$ + ⋯ + 𝑋7 𝜎$
𝑋h = ≈ 𝑁 š𝜇; ›
𝑛 𝑛
Estadística Descriptiva 2022 01 257
Distribución de la suma muestral de una población normal

Si 𝑋# , 𝑋$ , … , 𝑋7 son 𝑛 variables independientes con distribución normal, tales que 𝑋! con media µ y
varianza 𝜎 $ , entonces la distribución de la variable suma muestral 𝑋h, por propiedad reproductiva de
la normal, es la siguiente:

𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ~𝑁(𝜇d ; 𝜎d$ )

Media de la variable suma muestral 𝑺


𝜇d = 𝑛𝜇

Varianza de la variable suma muestral 𝑺


𝜎d$ = 𝑛𝜎 $

Es decir:

𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ~𝑁(𝑛𝜇; 𝑛𝜎 $ )

Distribución de la suma muestral de una población no normal (Teorema del


límite central)

Si 𝑋# , 𝑋$ , … , 𝑋7 son 𝑛 variables independientes e igualmente distribuidas, tales que 𝑋! con media 𝜇 y


varianza 𝜎 $ , entonces la variable aleatoria 𝑆 tiene una distribución aproximadamente normal a me-
dida que 𝑛 crece, independientemente de la distribución de la población.

La distribución de la suma muestral 𝑆 se aproxima a la distribución normal si 𝑛 ³ 30.

𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ≈ 𝑁(𝜇d ; 𝜎d$ )

Media de la variable suma muestral 𝑺


𝜇d = 𝑛𝜇

Varianza de la variable suma muestral 𝑺


𝜎d$ = 𝑛𝜎 $

Es decir:

𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋7 ≈ 𝑁(𝑛𝜇; 𝑛𝜎 $ )
Estadística Descriptiva 2022 01 258
Ejemplo 68

Caso Metropolitano
El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia, queja o re-
clamo. El número de correos electrónicos que llegan a la cuenta de correo se modela como una varia-
ble aleatoria Poisson con una media de ocho correos por día.
Si se eligen al azar 100 días, calcule la probabilidad que la cantidad total de correos recibidos en esos
100 días esté entre 790 y 810.

Solución
Sea
𝑋! = número de correos electrónicos que llegan a la cuenta de correo del Metropolitano en el día, 𝑖 =
1, … ,100

𝑋! ~𝑃(𝜆 = 8)

Por lo tanto, de las propiedades de la distribución de 𝑋 sabemos que:

𝜇 = 𝐸(𝑋) = 𝜆 = 8

𝜎 $ = 𝑉(𝑋) = 𝜆 = 8

Sea Y := cantidad total de correos en los 100 días

#,,

𝑆 = • 𝑋!
!6#
Usaremos el teorema central del límite.

Usando la distribución de la suma muestral:

Por teorema central del límite, se tiene que:

𝑆 ≈ 𝑁(𝑛𝜇; 𝑛𝜎 $ )

Reemplazando los valores, se tiene que:

𝑆 ≈ 𝑁(𝑛𝜇 = 100 × 8; 𝑛𝜎 $ = 100 × 8)

𝑆 ≈ 𝑁(800; 800)
La probabilidad pedida es:

𝑃(790 < 𝑆 < 810)


Estadística Descriptiva 2022 01 259
= 𝑃(−0,35 < 𝑍 < 0,35)

= 0,63683 − 0,36317 = 0,27366

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793

En Excel, se usa la función:


=DISTR.NORM.N(810;800;RAIZ(800);1)-DISTR.NORM.N(790;800; RAIZ(800);1)

Usando la distribución de la distribución de la media muestral

La probabilidad pedida es:

𝑃(790 < 𝑆 < 810)

Si dividimos la suma 𝑆 entre el tamaño de muestra 𝑛 = 100, obtendremos la media muestral 𝑋h.

790 𝑆 810
= 𝑃k < < l
100 100 100

= 𝑃(7,9 < 𝑋h < 8,1)

Por teorema central del límite:


𝜎$
𝑋h ≈ 𝑁 š𝜇, ›
𝑛

Reemplazando los valores tendremos:

𝜎$ 8
𝑋h ≈ 𝑁 š𝜇 = 8, = ›
𝑛 100

𝑋h ≈ 𝑁(8; 0,08)

Volviendo a la probabilidad pedida:

𝑃(790 < 𝑆 < 810)


Estadística Descriptiva 2022 01 260
= 𝑃(7,9 < 𝑋h < 8,1)

7,9 − 8 8,1 − 8
= 𝑃k <𝑍< l
√0,08 √0,08

= 𝑃(−0,35 < 𝑍 < 0,35)

= 0,63683 − 0,36317 = 0,27366

En Excel, se usa la función:


=DISTR.NORM.N(8.1;8;RAIZ(0.08);1)-DISTR.NORM.N(7.9;8; RAIZ(0.08);1).

Ejemplo 69
Caso Metropolitano
Se define la variable aleatoria 𝑋: = número de días a la semana que un usuario usa el Metropolitano.
Esta variable presenta la siguiente función de probabilidad.

𝑿: = número de días 0 1 2 3 4 5 6 7
𝒇(𝒙) 0,05 0,10 0,15 0,15 0,20 0,25 0,05 0,05

Si se elige al azar una muestra de 1000 usuarios, calcule la probabilidad de que la media muestral del
número de días que usan el Metropolitana esté entre 3,5 y 3,6 días. Si esta probabilidad supera a 0,6
entonces se mantendrá la cantidad de buses actual.

Solución
Interpretación
Determinar si se mantendrá la cantidad de buses actual.

Representación
Definamos las variables necesarias:
𝑋: = número de días a la semana que un usuario usa el Metropolitano.

𝜎$
𝑋 ≈ 𝑁 š𝜇, ›
𝑛

𝑋h: = media muestral del número de días a la semana que un usuario usa el Metropolitano.

Por teorema central del límite, se tiene que:

𝜎$
𝑋h ≈ 𝑁 š𝜇, ›
𝑛
Estadística Descriptiva 2022 01 261
Cálculo
Para resolver el problema necesita establecer los parámetros de la distribución de la variable media
muestral 𝑋h, por ello necestamos calcular 𝜇 y 𝜎 $ .

Calculemos la media de 𝑋.

𝜇 = 𝐸(𝑋) = • 𝑥𝑓(𝑥)
D6,

= 0 × 𝑓(0) + ⋯ + 7 × 𝑓(7)

= 0 × 0,05 + ⋯ + 7 × 0,05

𝜇 = 𝐸(𝑋) = 3,55

Calculemos la varianza de 𝑋.

$
𝜎 $ = 𝑉(𝑋) = 𝐸(𝑋 $ ) − N𝐸(𝑋)O

= • 𝑥 $ 𝑓(𝑥) − 3,55$
D6,

= (0$ × 0,05 + ⋯ + 7$ × 0,05) − 3,55$ = 3,1475

𝜎 $ = 𝑉(𝑋) = 3,1475

Ya mencionamos que la distribución de la variable media muestral 𝑋h es:

𝜎$
𝑋h ≈ 𝑁 š𝜇, ›
𝑛

Reemplazando los valores en dicha expresión, tenemos que:

𝜎 $ 3,1475
𝑋h ≈ 𝑁 š𝜇 = 3,55, = ›
𝑛 1000

𝑋h ≈ 𝑁(3,55; 0,0031475)

La probabilidad pedida es:

𝑃(3,5 < 𝑋h < 3,6)

Estandarizando, se tiene que:


Estadística Descriptiva 2022 01 262

3,5 − 3,55 𝑋h − 3,55 3,6 − 3,55


= 𝑃š < < ›
-0,0031475 -0,0031475 -0,0031475

= 𝑃(−0,89 < 𝑍 < 0,89)

= 0,81327 − 0,18673 = 0,62654

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891

En Excel, se usa la función


=DISTR.NORM.N(3.6;3.55;RAIZ(0.0031475);1)-DISTR.NORM.N(3.5;3.55;RAIZ(0.0031475);1)

Análisis y argumentación
La probabilidad pedida es 0,62654, que es mayor a 0,6. Por lo tanto, se mantendrá la cantidad de buses
actual.

Ejemplo 70
Caso Metropolitano
El tiempo de espera para tomar un bus de un usuario se modela con una variable uniforme con pará-
metros 0 y 10 minutos. Si la probabilidad de que la media del tiempo de espera de esos 500 usuarios
seleccionados al azar es mayor a 5,2 minutos supera al 10%, entonces, se va a aumentar la cantidad
de buses.

Solución
Interpretación
Determinar si se va a aumentar la cantidad de buses.

Representación
Definamos las variables necesarias:
𝑋: = tiempo de espera de un usuario
𝑋~𝑈(𝑎 = 0, 𝑏 = 10)

𝑋h: = media muestral del tiempo de espera de un usuario


Por teorema central del límite, se tiene que:
𝜎$
𝑋h ≈ 𝑁 š𝜇, ›
𝑛
Estadística Descriptiva 2022 01 263

Cálculo
Por propiedad de la variable uniforme, se tiene que:

𝑎 + 𝑏 0 + 10
𝜇= = =5
2 2

(𝑏 − 𝑎)$ (10 − 0)$


𝜎$ = = = 8,3333
12 12

Por teorema central del límite, se tiene que la distribución de la media muestral 𝑋h es:

𝜎$
𝑋h ≈ 𝑁 š𝜇, ›
𝑛
Reemplazando los valores:

𝜎 $ 8,3333
𝑋h ≈ 𝑁 š𝜇 = 5, = ›
𝑛 500

𝑋h ≈ 𝑁(5; 0,01667)

La probabilidad pedida es:

𝑃(𝑋h > 5,2)

Estandarizando, se tiene:

𝑋h − 5 5,2 − 5
= 𝑃š > ›
√0,01667 √0,01667

= 𝑃(𝑍 > 1,55) = 1 − 0,93943 = 0,06069

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449

En Excel, se usa la función: =1-DISTR.NORM.N(5.2;5;RAIZ(0.01667);1)

Análisis y argumentación
La probabilidad de que la media del tiempo de espera de esos 500 usuarios seleccionados al azar es
mayor 5,2 minutos es es 0,06069, que no supera a 0,1 (10%). Por lo tanto, no se aumentará la cantidad
de buses.
Estadística Descriptiva 2022 01 264
Ejercicios

170. Según los Censos Nacionales del 2017, la media de la edad de los peruanos es 31,51 años y la
desviación estándar es 21,27. Si se toma una muestra de 5000 personas, calcule la probabilidad
de que la media muestral esté entre 31,4 y 31,6 años. Asuma que la edad sigue una distribución
normal.

171. La cantidad de mango que exporta una empresa mensualmente se modela con una variable alea-
toria con media de 25 toneladas y desviación estándar de cuatro toneladas. Calcular la probabili-
dad de que la cantidad exportada en tres años sea menor a 920 toneladas. Asuma independencia
entre las cantidades mensuales exportadas. Rpta. 0,79673

172. El tiempo, en segundos, que tarda un auxiliar de vuelo, en segundos, en servir las bebidas a un
pasajero se modela con una variable aleatoria 𝑋 con la siguiente función de densidad:

𝑎(20 − 𝑥) 10 ≤ 𝑥 ≤ 20
𝑓(𝑥) = —
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Si la probabilidad de que un auxiliar de vuelo se demore más de 22 minutos al servir a 100 pasa-
jeros es mayor a 0,7 se adelantará el momento de entregar las bebidas. Indique la decisión.

Solución

Interpretación
Representación
Cálculo
Análisis y argumentación

173. Según los Censos Nacionales del 2017, la media de la cantidad de habitaciones por vivienda es 2,9
habitaciones y la desviación estándar es 1,76. Si se toma una muestra de 6000 viviendas, calcule
la probabilidad de que la media muestral del número de habitaciones esté entre 2,88 y 2,92 habi-
taciones.

174. Lima y El Cairo son las dos principales ciudades del mundo situadas en zonas desérticas y con
extremo estrés hídrico. En París, Zúrich o Berlín, el consumo medio por persona de agua bordea
los 130 litros por día. Sin embargo, en Lima el consumo medio por persona es de 250 litros por
día con una desviación estándar de 60 litros por día. Si se toma una muestra en Lima de 100 per-
sonas, calcule la probabilidad de que el consumo total muestral en un día sea menor a 24 mil
litros. Rpta. 0,04746

175. El número de vuelos nacionales cancelados en un día se modela con la variable aleatoria 𝑋 con la
siguiente función de probabilidad:

𝒙 0 1 2 3 4 5
𝒇(𝒙) 0,40 0,25 0,15 0,10 0,05 0,05
Estadística Descriptiva 2022 01 265
Se toma una muestra de 100 días, calcule la probabilidad de que se cancelen entre 125 a 135
vuelos nacionales. Rpta: 0,29931

176. Marque la afirmación correcta.


El teorema del límite central afirma que:
a. A medida que el tamaño poblacional crece, la distribución de la media poblacional tiende a una
distribución normal
b. A medida que el tamaño poblacional crece, la distribución de la media muestral tiende a una
distribución normal
c. A medida que el tamaño muestral crece, la distribución de la media poblacional tiende a una
distribución normal
d. A medida que el tamaño muestral crece, la distribución de la media muestral tiende a una dis-
tribución normal. Rpta: d.

177. Marque la afirmación correcta.


El teorema del límite central afirma que:
a. La suma de variables aleatorias normales independientes es una variable normal
b. La suma de más de 30 variables aleatorias normales independientes es una variable normal
c. La suma de más de 30 variables aleatorias independientes es una variable normal
d. La suma de más de 30 variables aleatorias independientes es aproximadamente una variable
normal Rpta: d.
Estadística Descriptiva 2022 01 266

Tablas estadísticas
Todas las tablas de este manual han sido calculadas usando el MS Excel.
Tabla de la distribución normal estándar
Área bajo la curva normal: [P(Z £ z ) = a ]
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350

-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275

-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866

-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Estadística Descriptiva 2022 01 267

Tabla de la distribución normal estándar


Área bajo la curva normal: [P(Z £ z ) = a ]

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891

1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670

2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861

3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Estadística Descriptiva 2022 01 268

Índice

Axiomas de la probabilidad, 107 circular, 27


Desviación estándar, 73 de barras, 26
Distribución de barras agrupadas, 41
binomial, 141 de Pareto, 32
de frecuencias, 21, 46, 48 Histograma, 53
de la media muestral, 232, 233 Ojiva, 54
de probabilidad, 128, 129 Polígono de frecuencias, 54
hipergeométrica, 146 Media, 60
normal, 184 ponderada, 70
Poisson, 150 Mediana, 64
uniforme continua, 174 Medidas de posición
Escalas de medición, 13 Percentiles, 83
Espacio muestral, 99 Moda, 68
Estadística Muestreo
Definición, 5 aleatorio simple, 201
estadístico, 18 estratificado, 214
Evento, 99 probabilístico, 200
Complemento, 102 sistemático, 208
Eventos Parámetro, 18
independientes, 124 Población, 8
Intersección de, 103 Probabilidad
mutuamente excluyentes, 105 Teorema de Bayes, 118
Unión de, 102 Propiedad reproductiva de la normal, 225
Experimento aleatorio, 99 Variable, 16
Función aleatoria continua, 158
de densidad, 158 aleatoria discreta, 129
de distribución acumulada, 163 Varianza, 72
Gráfico

También podría gustarte