Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Aplicada I
Cuaderno de trabajo
Los profesores del curso
Área de Ciencias - Agosto 2023
Estadística Aplicada I 2023 02 2
Tabla de contenido
Sistema de evaluación
La nota final del curso se obtiene de acuerdo a la siguiente fórmula:
Plan calendario
Sesión con
Tareas o trabajos (Se entregan
Sesión con el docente AAD
Sem Fecha hasta el domingo de la semana Control/Taller
(Tres horas) (Una hora
a las 11.59 pm)
asincrónica)
1 14/08 19/08 Presentación del curso Tarea 1: Organización de datos Foro de
Presentación del trabajo de aplicación cualitativos consultas
Organización de datos cualitativos Diagrama de Pareto
Diagrama de Pareto
2 21/08 26/08 Organización de datos cuantitativos Tarea 2: Organización de datos Foro de Taller 1 en Excel:
discretos y continuos cuantitativos discretos y consultas Organización de datos
Tablas de doble entrada continuos cualitativos
Tablas de doble entrada Diagrama de Pareto
Tablas de doble entrada
3 28/08 02/09 Medidas de tendencia central, media Tarea 3: Medidas de tendencia Foro de Taller 2 en Excel: Medidas
ponderada y propiedades de la media central y dispersión consultas de tendencia central y
Medidas de dispersión dispersión
4 04/09 09/09 Medidas de posición Tarea 4: Medidas de posición y Foro de Taller 3 en Excel: Medidas
Medidas de asimetría y diagrama de asimetría, diagrama de cajas consultas de posición y asimetría,
cajas diagrama de cajas
5 11/09 16/09 Revisión del trabajo de aplicación Tarea 5: Toda la unidad 1 Foro de
DD1: Control 1 (5%)
Entrega de trabajo de consultas
Temas: Toda la Unidad 1
aplicación (5%)
6 18/09 23/09 Para las secciones semipresenciales: Foro de
Repaso para la sustentación individual consultas
del cierre de la unidad 1
Para las secciones a distancia:
Sustentación individual de cierre de
la unidad 1 (20%)
Para los alumnos que no sustentan,
actividad individual que puede
reemplazar una tarea.
7 25/09 30/09 Para las secciones semipresenciales: Foro de
Sustentación individual del cierre de consultas
la unidad 1 (20%)
Para las secciones a distancia:
Sustentación individual de cierre de
la unidad 1 (20%)
Para los alumnos que no sustentan,
actividad individual que puede
reemplazar una tarea.
8 02/10 07/10 Retroalimentación de sustentación de cierre de unidad 1
9 09/10 14/10 Definición básicas de probabilidad, Tarea 6: Definición básicas de Foro de
probabilidad en tabla doble entrada y probabilidad, probabilidad en consultas
probabilidad condicional tabla doble entrada y
probabilidad condicional
10 16/10 21/10 Probabilidad total y teorema de Tarea 7: Probabilidad total y Foro de
Bayes. Eventos independientes teorema de Bayes, eventos consultas
Variable aleatoria discreta independientes y variable
aleatoria discreta
11 23/10 28/10 Distribución binomial y Poisson Tarea 8: Distribución binomial Foro de
DD1: Control 2 (5%)
Distribución exponencial y Poisson, exponencial y consultas
Temas: Toda la Unidad 2
Distribución normal normal
12 30/10 04/11 Propiedad reproductiva de la Tarea 9: Propiedad Foro de
distribución normal y definición de reproductiva de la normal y consultas
distribución muestral de la media y definición de distribución
teorema del límite central muestral de la media y
teorema del límite central
13 06/11 11/11 Muestreo: muestreo aleatorio simple, Tarea 10: Muestreo: simple, Foro de
sistemático y estratificado. sistemático y estratificado. consultas
Tamaño de muestra para estimar la Tamaño de muestra para
media y proporción estimar la media y proporción
14 13/11 18/11 Sustentación individual de cierre de Foro de DD2: Control 3 (5%)
las unidades 2 y 3 (15%) consultas Temas: Toda la unidad 3
15 20/11 25/11 Sustentación individual 1 de trabajo Foro de
final (10%) consultas
Logro
Al término de la unidad, el estudiante entiende claramente la información presentada en tablas y
gráficas. Asimismo, calcula resúmenes obtenidos a partir de un conjunto de datos y los utiliza para dar
solución a un problema dentro de un contexto real o de su especialidad.
Temario
• Definiciones básicas
• Organización de datos cualitativos: Tablas de distribución de frecuencias y representaciones
gráficas
• Organización de datos cualitativos (diagrama de Pareto)
• Organización de datos cuantitativos: Tablas de distribución de frecuencias y
representaciones gráficas para variables cuantitativas discretas y continuas
• Tablas y gráficos comparativos para variables cuantitativas continuas
• Medidas de tendencia central: media aritmética, mediana, moda, media ponderada. Propiedades
de la media
• Medidas de posición: cuartiles, deciles y percentiles
• Medidas de dispersión: rango, varianza, desviación estándar, coeficiente de variación y rango
intercuartil
• Medidas de asimetría
Bibliografía
Estadística Aplicada I 2023 02 7
Definiciones básicas
Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar,
organizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.
La palabra estadística tiene su origen en la palabra alemana statistik que fue creada
por Godofredo Achenwall (1719 – 1772). El significado de estadística hace referencia
a la ciencia del Estado. Esto es debido a que, en la Edad Moderna, la estadística se
utilizó principalmente para registrar nacimientos y defunciones.
Recopilar datos
Organizar datos
Analizar datos
Presentar datos
Tomar decisiones
Estadística Aplicada I 2023 02 8
Estadística descriptiva
Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más características de una población o tomar
decisiones referentes a una población, basados en los resultados obtenidos del estudio de muestras
elegidas adecuadamente.
Estas conclusiones no tienen que ser totalmente válidas, pueden tener cierto margen de error, por eso
se dan con una medida de confiabilidad o probabilidad.
Estadística descriptiva
Métodos de recolección, caracterización, resumen y
presentación de características de datos
Definiciones
Unidad elemental
También llamada unidad de análisis, unidad estadística o elemento. Es el objeto sobre el cual se hace
la medición. Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que las unidades
de análisis son los individuos.
Población
Es la totalidad de elementos que queremos estudiar y que están agrupados bajo una o más
características comunes y que conforman el universo a ser investigado. Pueden ser personas, objetos,
conceptos, etc. de los cuales intentamos sacar conclusiones a partir de una o más características
observables de naturaleza cualitativa o cuantitativa que se pueden medir en ellos.
Muestra
Es una parte o subconjunto de la población que se selecciona para su análisis y así obtener información
acerca de la población de la que proviene. Una muestra será representativa, en el sentido de que cada
unidad muestreada representará las características de una cantidad conocida de unidades en la
población.
Variable
Es una característica de interés de la población definida por la investigación estadística y que puede
tomar dos o más valores en distintas unidades de análisis.
Dato
Son los valores numéricos o no numéricos que otorga la característica de interés de cada unidad
elemental.
Observación
Es el conjunto de datos de una unidad elemental. La observación se obtiene para cada unidad
elemental.
Dato
Observación
Unidad elemental
Estadística Aplicada I 2023 02 10
Ejemplo 1
Variables: Sexo
Función
Edad
Sueldo
Número de capacitaciones
Ejercicios
1. Según una publicación de Ipsos, el 95% de los egresados la UPC trabajan en la carrera que
estudiaron. Determine la población, muestra y unidad elemental de dicha investigación.
2. En el Perú, según la ley N° 29664, la vulnerabilidad es la susceptibilidad de sufrir daños por acción
de un peligro. El análisis de la vulnerabilidad es el proceso mediante el cual se evalúan las
condiciones existentes de la población expuesta y sus medios de vida. Para evaluar la
vulnerabilidad de una vivienda se miden las siguientes variables, entre otras.
3. En una mina de extracción de mineral, se lleva a cabo una evaluación de la calidad del mineral en
un gran depósito que se extiende a lo largo de una vasta área. El objetivo es determinar la
concentración promedio de un metal valioso en el mineral. La unidad elemental es un cubo de
mineral de 1 metro de lado. La población total en el depósito se estima en 500,000 unidades
elementales. Para la investigación se va a elegir al azar el 0,5% de las unidades elementales.
Indique la muestra.
4. De acuerdo con los Censos Nacionales de Población y Vivienda 2017, el 72% de los hogares en el
Perú no cuenta con conexión de Internet. Determine la población, muestra y unidad elemental
para el censo del 2017.
Estadística Aplicada I 2023 02 12
5. En un estudio de ingeniería para investigar las fisuras por desgaste en aviones que llegaron al
aeropuerto Jorge Chávez el presente año, se tomó una muestra de 50 aviones a los que se les
hizo un estudio detallado de su estado. Determine la población, muestra y unidad elemental.
6. La empresa Star llevó a cabo un estudio entre los usuarios de Internet en Trujillo para analizar el
mercado de posibles compradores a través de este servicio. Como parte del estudio se recolectó
una muestra de 1500 usuarios.
Durante la recolección de datos se registró que uno de los usuarios tiene 28 años, dos
computadoras en casa con Internet, considera que la calidad del servicio prestado es buena,
diariamente usa el servicio de Internet 3,5 horas y la computadora con mayor uso del servicio de
Internet es Asus. De acuerdo con el texto, identifique un dato y una posible observación.
Estadística Aplicada I 2023 02 13
Tipos de variables
Cualitativa
Variable Discreta
Cuantitativa
Continua
Variable cualitativa
Variable cuantitativa
Es una variable que al ser medida queda expresada por un número que se utiliza para identificar una
característica o atributo.
Una variable es cuantitativa discreta si el conjunto de posibles valores que toma es finito o infinito
numerable, es decir, que sólo puede tomar ciertos valores en un intervalo determinado.
Una variable es cuantitativa continua si el conjunto de posibles valores es infinito no numerable, es decir,
que puede tomar cualquier valor en un intervalo determinado.
Ejemplo 2
Las siguientes variables son de una encuesta aplicada a un postulante a un trabajo de ingeniería:
Variable cuantitativa discreta∶ número de capacitaciones que llevó el año anterior; número de trabajos
que ha tenido en los últimos dos años.
Variable cuantitativa continua∶ tiempo que demora para trasladarse de su casa al trabajo, en minutos;
salario actual, en soles.
Estadística Aplicada I 2023 02 14
Escala de medición
Otra forma común de clasificar las variables es mediante el uso de cuatro niveles de medición; nominal,
ordinal, de intervalo y de razón. Cuando la estadística se aplica a problemas reales el nivel de medición
de las variables es un factor importante para determinar el procedimiento a usar.
Nominal
Se usa cuando los datos sólo pueden clasificarse en categorías o
modalidades. Si se le identificase mediante un número, este sólo se
utiliza como una etiqueta.
Ordinal
Se usa cuando los datos que reflejan diferentes grados de propiedad o
atributo de estudio. Se pueden ordenar en forma ascendente o
descendente (jerarquía), de tal manera que puedan expresar grados de
la característica medida.
Intervalo
Se utiliza cuando los datos miden cuantitativamente la intensidad del
atributo en estudio y, además, las diferencias iguales entre estos valores
indican diferencias iguales en las cuantías de los atributos medidos.
Razón
Si los cocientes o razones de los números asignados a las unidades
estadísticas reflejan los cocientes de las cuantías de las propiedades que
se miden.
Ejemplo 3
• Número de celular
• Longitud de cable de fibra óptica usado en una instalación industrial (metros)
• Marca de un medidor láser de distancia (Bosch, Hilti, Suaoki, Leica)
• Tiempo de vida útil de una laptop (años)
• Peso de un celular, en kilogramos
• Grado en el ejército (general, coronel, comandante, etc.)
• Kilometraje de un auto (kilómetros por año)
• Tamaño de una bebida (pequeña, mediana, grande)
• Año de fabricación de un celular
Solución
Ejercicios
Número de Contenido de
Número Contenido Opinión de Presentación
Marca defectos por alcohol (%
de botella (ml) calidad de botella
botella volumen)
1 Imperial 0 1100 Buena 1100 ml. 4,85
2 Dorada 1 354 Regular 355 ml. 5,23
3 Tropical 0 355 Buena 355 ml. 4,94
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
1000 Ducal 4 645 Mala 650 ml. 5,20
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
2000 Tropical 0 355 Buena 355 ml. 4,95
Marca
Contenido, en mililitros
Opinión de calidad
Presentación de botella
Contenido de alcohol
10. Computer Soft es una compañía dedicada a brindar servicios integrales de informática y de
telecomunicaciones a empresas en todo el país. La gerencia de la compañía desea reforzar su
fuerza de ventas en Lima y, como parte de un estudio realizado, se analizó la información
correspondiente a una muestra de 30 empresas de la ciudad de Lima a las que se les brindó los
servicios informáticos de la compañía. Las variables consideradas en dicho estudio fueron:
• Lenguaje de programación (Cobol, Java, Informixs - 4gl, etc.)
Estadística Aplicada I 2023 02 18
11. Indique el tipo de variable y la escala de medición de las variables observadas en una muestra de
secciones de tuberías de agua.
a. Diámetro de la tubería (pulgadas)
b. Material de la tubería (hierro negro, hierro galvanizado, PVC, bronce cobrado)
c. Ubicación (subterránea, aérea)
d. Longitud de la tubería (pies)
e. Estabilidad del suelo circundante (inestable, moderadamente estable o estable)
f. Corrosividad del suelo circundante (corrosivo o no corrosivo)
Rpta. a. Cuantitativa continua, razón; b. Cualitativa,
nominal; c. Cualitativa, nominal; d. Cuantitativa continua,
razón; e. Cualitativa, ordinal; f. Cualitativa, nominal.
Estadística Aplicada I 2023 02 19
Parámetro
Medida que describe una característica resumen de las unidades que componen una población.
Estadístico
Medida que describe una característica resumen de las unidades que componen una muestra.
Por ejemplo, se tiene una población de 17 personas y sacamos una muestra de tamaño 6 y calculamos
dos parámetros: la media poblacional de la edad y la proporción poblacional de mujeres. Además,
sacamos una muestra de tamaño 6 y calculamos dos estadísticos: la media muestral de la edad y la
proporción muestral de mujeres. Observamos que no son iguales.
Estadística Aplicada I 2023 02 20
Ejemplo 4
La gerencia de la empresa Star llevó a cabo un estudio entre los usuarios de Internet en Trujillo para
poder analizar el mercado de posibles compradores a través de este servicio. Como parte del estudio
realizado se analizó la información correspondiente a una muestra de 1500 usuarios.
Por datos históricos de la empresa se sabe que, en promedio los usuarios utilizan el servicio de Internet
3,75 horas al día. Además, de la muestra de usuarios se obtuvo que el número promedio de
computadoras que cuentan con el servicio de Internet en sus casas es de 2,5 y el 12% piensan que la
calidad del servicio de Internet es regular.
Solución
Ejercicios
12. Green es una empresa que se dedica a la producción de productos agroindustriales, cuenta con
4325 trabajadores. Para la aplicación efectiva de una filosofía de administración para la calidad
total (TQM) en toda la empresa y así incrementar la productividad, el consejo directivo de la
empresa ha puesto en marcha un estudio del perfil de sus trabajadores para medir la satisfacción
laboral. Para dicho estudio se tomó una encuesta a 175 trabajadores seleccionados de forma
aleatoria. A continuación, se presenta el modelo de la encuesta que fue utilizada en el estudio.
3. Posición en la empresa
9. Las oportunidades de obtener un ascenso, ¿Son mejores o peores para personas de su género?
11. ¿Rechazaría otro trabajo de mejor paga para quedarse en Green S.A.?
𝑓!
ℎ! =
𝑛
𝑝! = ℎ! × 100%
Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la
columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la variable.
• Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias simples
absolutas, relativas y porcentuales.
• Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las frecuencias
acumuladas absolutas, relativas y porcentuales.
Ejemplo 5
Tomado de “Estado de la población peruana 2020. INEI. Fondo de Población de Naciones Unidas”
Estadística Aplicada I 2023 02 25
Ejercicios
14. A un grupo de compradores de auto tomados al azar, se les preguntó sobre el color de su auto.
Los resultados obtenidos fueron:
Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde Blanco Azul
Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul Verde Negro
Azul Blanco Verde Blanco Blanco Rojo Blanco Rojo Azul Verde Blanco Negro
Negro Rojo Negro Rojo Rojo Verde Negro Negro Blanco Blanco Azul Blanco
Distribución de …. según ……
Variable Frecuencia absoluta 𝒇𝒊 Frecuencia relativa 𝒉𝒊 Frecuencia porcentual 𝒑𝒊
Blanco
Azul
Verde
Negro
Rojo
Total 1 100%
Fuente: Empresa A
15. Una tienda que se dedica a la venta de productos electrónicos realiza un estudio sobre la marca
de laptop que prefieren sus clientes, para lo cual realizaron una encuesta a 30 de sus clientes. Se
obtuvieron los siguientes resultados:
Distribución de … según …
Variable Frecuencia absoluta 𝒇𝒊 Frecuencia relativa 𝒉𝒊 Frecuencia porcentual 𝒑𝒊
Toshiba
Hp
Apple
Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el eje de ordenadas las frecuencias
absolutas, relativas o porcentuales.
Ejemplo 6
Distribución de peruanos en pobreza según nivel de educación alcanzado, 2019
(Porcentaje)
Ejemplo 7
Distribución porcentual de peruanos según departamento de residencia
Estadística Aplicada I 2023 02 28
Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo que es proporcional
a la frecuencia que representan. También se denomina diagrama de sector circular, gráfico tipo torta
o pastel.
Ejemplo 8
Distribución de peruanos en pobreza extrema según región natural, 2019
Ejemplo 9
Ejemplo 10
Ejemplo 11
La universidad A realizó una encuesta a 30 estudiantes que están terminando el colegio con la finalidad
de conocer sus preferencias profesionales. De los datos obtenidos se construyó la siguiente tabla:
Solución
Estadística Aplicada I 2023 02 30
Solución
Negocios
10.0%
Derecho
13.3%
Ingeniería
26.7% Gastronomía
20.0%
Fuente: Universidad A
Ejemplo 12
Se aplicó una encuesta a una muestra de 30 empleados de la empresa Motores A. Se preguntó por la
función que desempeña. Los datos se presentan a continuación:
Solución
Estadística Aplicada I 2023 02 31
35%
30%
25% 20.00%
20% 16.67% 16.67%
15%
10% 6.67%
5%
0%
Obrero Producción Profesional Servicios Técnico
Función
Fuente: Motores A S.A.
Servicios Obrero
6.67% 40.00%
Profesional
20.00%
Producción
Fuente: Motores A S.A.
16.67%
Estadística Aplicada I 2023 02 32
Diagrama de Pareto
El diagrama de Pareto es una representación gráfica que permite identificar y seleccionar los aspectos
prioritarios que hay que tratar en un determinado problema.
También se conoce como diagrama ABC o Ley de las prioridades 80 - 20, que dice: “el 80% de los
problemas que ocurren en cualquier actividad son ocasionados por el 20% de los elementos que
intervienen en producirlos” (pocos vitales, muchos triviales).
Según este concepto se tiene un problema con muchas causas, podemos decir que el 20% de las causas
resuelven el 80 % del problema. Por ejemplo, en control de calidad, se puede mostrar que la mayoría
de los defectos surgen de un número pequeño de causas.
Los pasos para la elaboración del diagrama de Pareto son los siguientes:
• La categoría Otros se coloca al final, no importa cuán grande sea, pues está compuesta por
categorías cuyas frecuencias son menores al valor de la variable con frecuencia más pequeña
listada individualmente.
• Agregue a la tabla de distribución de frecuencias una columna para la frecuencia acumulada.
2. Dibuje los ejes verticales y horizontal, título, rótulos de los ejes y fuente.
• En el eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una de
las categorías incluida la categoría Otros.
Estadística Aplicada I 2023 02 33
Frecuencia simple
75%
50%
25%
Variable
Fuente:
75%
50%
25%
Variable
Fuente:
4. Dibuje la línea de frecuencias acumuladas (curva de Pareto). Indique las etiquetas de datos de las
frecuencias simples y de las frecuencias acumuladas.
100% 100%
𝑃#
Frecuencia simple
75%
𝑃"
𝑃!
50%
25%
Variable
Fuente:
Estadística Aplicada I 2023 02 34
Ejemplo 13
El gerente de producción de una empresa, que produce asientos de fibra de vidrio, quiere identificar
los problemas más frecuentes reportados en la fabricación de este producto, y planear soluciones de
acuerdo con la recurrencia del problema. Al extraer una muestra aleatoria de productos fallados,
obtuvo los siguientes resultados:
¿Cuáles son los problemas más frecuentes reportados en la fabricación, para que el gerente de
producción planifique soluciones de acuerdo con la recurrencia de los problemas?
Solución
Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categoría Otros va al final.
Luego, se calcula las frecuencias relativas y las relativas acumuladas.
Se puede realizar el gráfico usando las frecuencias simples absolutas 𝑓! y las frecuencias porcentuales
𝑃! .
Estadística Aplicada I 2023 02 35
60.5%
120 60%
80 71 40%
35.5%
50
40 28 20%
16 12 14
9
0 0%
Superficie rugosa Medidas fuera de Color inadecuado Forma no simétrica Desprendimiento de Bordes afilados Otros
norma capa protectora
Los problemas más frecuentes en la producción de los asientos de fibra de vidrio son: superficie rugosa,
medidas fuera de norma y color inadecuado, los cuales representan un 74,5% de los problemas.
Ejemplo 14
Termas S.A.C. es una empresa que fabrica y comercializa dentro y fuera del Perú, termas para el
calentamiento del agua para uso doméstico e industrial. Debido a la fuerte competencia de los
productos importados, la empresa se encuentra en un proceso de mejora continua, por este motivo el
jefe de control de calidad selecciona al azar 75 termas del área de reclamos.
Solución
Ordenamos la tabla de distribución de frecuencias en forma descendente por las frecuencias simples,
con la categoría Otros al final.
60.00%
60% 60%
Ejemplo 15
Emapa es una empresa de agua y alcantarillado que presenta muchos problemas en sus diferentes
procesos, los cuales generan pérdidas a la empresa y el malestar e insatisfacción de los usuarios.
Para conocer cuáles son las quejas más frecuentes reportadas por los clientes, que le permita a la
empresa establecer un plan de mejora, se elaboró un diagrama de Pareto con los 120 registros de las
quejas reportadas por los clientes en el último mes. Tal como se muestra a continuación:
Si los dos tipos de queja más frecuentes acumulan más del 70% de las quejas se va a realizar un plan
de mejora enfocándose en esos dos tipos de queja. Indique lo que hará la empresa.
Solución
Interpretación
Representación
Cálculo
98.33% 100.00%
120 91.67% 100%
70%
80
60%
46.67%
60 56 50%
40 40%
40
30%
20%
20 14
8 10%
2
0 0%
Rotura de red Problemas en el Rotura de red Filtraciones en la otros
pública medidor domiciliaria conexión
Tipo de queja
Fuente: Emapa S.A.C.
Análisis y argumentación
El porcentaje de quejas reportadas por los clientes se centran en rotura de red pública y problemas en
el medidor es del 80% que es mayor al 70%.
Por lo tanto, se va a realizar un plan de mejora enfocándose en esos dos tipos de queja, rotura de red
pública y problemas de medidor.
Estadística Aplicada I 2023 02 39
Ejercicios
En base a la información presentada, determine los principales problemas a ser atendidos con
prioridad por la empresa, con el procedimiento estadístico más adecuado.
64.10%
60% 60%
48.72%
40% 40%
25.64%
23.08%
20% 25.64% 15.38% 20%
14.10% 12.82%
8.97%
0% 0%
Embutición Textura Nitrificación Embarrado Sabor Otros
Problema más importante
Fuente: La Italiana
17. En la empresa Metal S.A.C. presentan fallas en una pieza AWR-3500 que sirve de repuesto en
aviones comerciales. Durante todo el mes de febrero del 2019 se observaron las piezas con algún
defecto y se registró el tipo de defecto identificado.
Si Metal S.A.C. desea reducir al menos el 75% de los defectos ¿cuáles de esos defectos deben de
resolverse?
Estadística Aplicada I 2023 02 41
La representación gráfica de la variable cuantitativa discreta es similar al caso cualitativo, sólo que no
se emplean columnas sino líneas verticales para cada valor, denominados bastones o varas.
Ejemplo 16
La empresa APS ha registrado, durante 20 días, los reclamos de un producto defectuoso elaborado por
una de sus máquinas industriales. De los datos obtenidos se construyó la siguiente tabla:
0%
0 1 2 3 4 5
Número de reclamos
Fuente: Empresa APS
Ejemplo 17
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores
(trabajadores) de la empresa Creativa S.A. en lo que va del año.
0 0 0 1 1 1 1 1 1 1 1 1 1 1 1
1 1 2 2 2 2 2 2 2 2 2 2 3 3 5
14
12 10
10
8
6
3
4 2
1
2
0
0 1 2 3 4 5 6
Número de capacitaciones recibidas
Fuente: Empresa Creativa S.A.
Estadística Aplicada I 2023 02 43
c. Interprete 𝑓$ , 𝐹$ , ℎ$ 𝑦 𝑃$ .
Ejercicios
18. El gerente del Banco A está interesado en estudiar el comportamiento del número de cuentas de
ahorros cerradas por día; para ello se tomó una muestrade 60 días.
40%
35%
30%
25%
20%
15%
10%
5%
0%
0 1 2 3 4 5 6
19. El jefe de control de calidad de una empresa agroindustrial está interesado en estudiar el
comportamiento del número de productos defectuosos por lote. La información disponible para
este fin se muestra a continuación:
0 0 0 0 0 0 0 0 1 1
1 1 1 1 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 3
3 4 4 4 4 4 4 5 5 5
Para agrupar 𝑛 datos de una muestra, los pasos son los siguientes:
𝑟 = 𝑋𝑚á𝑥 – 𝑋𝑚í𝑛
𝑘 = 1 + 3,322 𝑙𝑜𝑔(𝑛)
En la siguiente tabla se indica el número de intervalos (𝑘) según diversos valores del tamaño de
muestra (𝑛), usando la regla de Sturges.
𝑟
𝑤=
𝑘
Por ejemplo:
Estadística Aplicada I 2023 02 46
𝒓 𝒘
Si los datos tienen 𝒘=
𝒌 (redondeo por exceso)
cero decimales 𝑤 = 50,2381 𝑤 = 51
una cifra decimal 𝑤 = 50,2381 𝑤 = 50,3
dos cifras decimales 𝑤 = 50,2381 𝑤 = 50,24
tres cifras decimales 𝑤 = 50,2381 𝑤 = 50,239
dos cifras decimales 𝑤 = 0,38000 𝑤 = 0,38
dos cifras decimales 𝑤 = 0,38001 𝑤 = 0,39
cero decimales 𝑤 = 0,38001 𝑤 = 1,0
• Partiendo del dato de menor valor 𝑋𝑚𝑖𝑛 se determinan cada uno de los límites de intervalos
sumando la amplitud de clase a cada valor obtenido.
• Si los datos son cuantitativos continuos, el límite superior de un intervalo es el límite inferior
del siguiente intervalo. Se considera que el intervalo es abierto en el límite inferior y cerrado
en el límite superior, con excepción en el primer intervalo en el que los dos límites son
cerrados.
La marca de clase es el punto medio de cada clase. Se calcula como la semisuma de los límites de
cada clase. Representa a todos los datos que están contenidos en dicha clase.
Histograma
Es la representación por medio de barras rectangulares, siendo la base de cada barra proporcional a la
amplitud de la clase.
• Se indican los límites de los intervalos.
• En el eje horizontal va la escala de la variable. Su título debe indicar el nombre de la variable y su
unidad de medición.
• En el vertical va la escala de la frecuencia absoluta o frecuencia porcentual.
𝑓"
Frecuencia simple
𝑓!
𝑓#
𝑓$
𝑓%
𝐿!" 𝐿#" = 𝐿!$ 𝐿#$ = 𝐿!% 𝐿#% = 𝐿!& 𝐿#& = 𝐿!' 𝐿#'
Variable
Fuente: Unidad de medición
Polígono de frecuencias
Es la representación por medio de una figura poligonal cerrada, que se obtiene uniendo con segmentos
de recta los puntos de intersección de las marcas de clase con las frecuencias.
• Cada punto del polígono se obtiene levantando desde la marca de clase en el eje horizontal una
vertical que corresponde a su respectiva frecuencia (relativa o absoluta).
• En este gráfico se usan las marcas de clase y no los límites de los intervalos.
• El polígono siempre va cerrado en los extremos. Para esto, considere marcas de clase adicionales
con frecuencia cero al inicio y al final del polígono.
• En el eje horizontal va la escala de la variable. Su título debe indicar el nombre de la variable y sus
unidades de medición.
• En el vertical va la escala de la frecuencia.
Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de cada
intervalo y la frecuencia acumulada respectiva.
Con la ojiva se puede estimar fácilmente el número o porcentaje de observaciones que corresponden
a un intervalo determinado.
75%
𝑃#
𝑃"
50%
𝑃!
25%
Ejemplo 18
El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. Los datos de los pagos de impuestos, en soles, de 48 viviendas elegidas
al azar en el 2015 son:
145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1
Solución
a. Elabore la tabla de frecuencias para la variable “Pago por impuestos municipales” para el presente
año.
Usamos redondeo simple sin decimales a que el número de intervalos es un número entero. Luego:
𝑘=7
Usamos redondeo por exceso a un decimal debido a que los datos tienen como máximo un
decimal. Luego:
𝑤 = 29,5
10
8 7 7
6
6
4 3 3
2
0
145.1 - 174.6 - 204.1 - 233.6 - 263.1 - 292.6 - 322.1 - 351.6
Pago de impuesto municipal
Fuente: Oficina de Rentas de la Municipalidad
20%
14.58% 14.58%
15% 12.50%
10%
6.25% 6.25%
5%
0%
130.35 159.85 189.35 218.85 248.35 277.85 307.35 336.85 366.35
Pago de impuesto municipal
Fuente: Oficina de Rentas de la Municipalidad
159,85 – w 336.85 + w
Estadística Aplicada I 2023 02 51
70%
58.34%
60%
50%
40% 33.34%
30%
20% 12.50%
10% 6.25%
0%
145.1 174.6 204.1 233.6 263.1 292.6 322.1 351.6
Pago de impuesto municipal
Fuente: Oficina de Rentas de la Municipalidad
Estadística Aplicada I 2023 02 52
Ejercicios
5 5 6 7 7 10 11 11 12 12 13 13 15 16 16
17 18 18 19 20 20 20 21 21 21 21 22 22 23 24
24 25 25 25 25 25 26 26 27 27 27 28 28 28 30
Marca de clase 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
[.…. ; …..]
].…. ; …..]
].…. ; …..]
].…. ; …..]
].…. ; …..]
].…. ; …..]
Total 45 1
Fuente: Empresa A
21. Los datos corresponden a los ingresos, en cientos de soles, de una muestra de 60 clientes del
Banco A.
5,25 7,22 8,53 9,27 9,54 10,21 10,32 10,45 10,52 10,76
10,85 11,25 11,56 12,42 13,27 14,65 15,72 16,85 17,22 18,56
19,32 20,56 21,72 22,85 23,12 24,32 25,65 26,72 28,72 29,65
31,42 32,71 33,55 34,28 35,21 37,45 38,32 39,65 41,22 43,28
45,72 47,32 49,45 51,27 52,38 54,75 55,81 56,27 57,45 58,22
59,32 61,45 63,75 65,72 66,85 69,32 69,54 72,30 75,81 77,42
52,0 94,7 95,1 97,5 102,5 104,1 106,0 125,2 125,6 146,0
146,8 158,6 158,7 162,6 166,2 166,2 166,2 166,2 168,2 169,7
196,0 204,9 204,9 204,9 204,9 208,3 215,2 217,5 218,1 218,1
218,1 218,1 220,9 226,2 235,0 239,7 242,2 259,6 261,6 277,2
286,5 287,0 297,8 313,9 315,0 316,2 338,6 359,9 363,1 398,3
Comparación de distribuciones
Si se va a agrupar datos de dos o más muestras para analizarlas comparativamente, tome en cuenta
adicionalmente lo siguiente:
• El rango se determina tomando el dato mayor de todas las muestras menos el dato menor de todas
las muestras.
• Si las muestras tienen tamaño distinto, para determinar el número de intervalos se toma el tamaño
de muestra más grande.
• Al agrupar los datos en clases, los datos de cada muestra se agrupan independientemente, de tal
manera que haya tantas tablas de distribución como muestras, pero todas empleando las mismas
clases.
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝐿!% + 𝐿*%
]𝐿!% − 𝐿*% ] 𝑥%´ = 𝑓% ℎ% 𝑛# 1,00 𝑓% ℎ% 𝑛$ 1,00
2
Total 𝒏𝟏 1 𝒏𝟐 1
Fuente:
Ejemplo 19
La empresa Fico presenta a continuación los datos correspondientes a la duración (en horas) de una
muestra de 40 focos de 100 watts producidos de la marca A y una muestra de 35 focos de 100 watts de
la marca B.
Marca A
684 697 720 773 821 831 835 848 852 852
859 860 868 870 876 893 899 905 909 911
922 924 926 926 938 939 943 946 954 971
972 977 984 1005 1014 1016 1041 1052 1080 1093
Marca B
819 836 888 897 903 907 912 918 942 943
952 959 962 986 994 1004 1005 1007 1015 1016
1018 1020 1034 1038 1072 1077 1077 1096 1100 1113
1113 1116 1153 1154 1172
Estadística Aplicada I 2023 02 55
a. Elabore las tablas de distribución de frecuencias de los datos de ambas muestras de tal manera
que permita su comparación apropiadamente.
Para la marca A, el valor máximo es 1093 horas y el valor mínimo es 684 horas.
Para la marca B, el valor máximo es 1172 horas y el valor mínimo es 819 horas.
Siguiendo la regla de Sturges, se elige el mayor de los dos tamaños de muestra, en este caso 𝑛# =
40, por tanto, el número de intervalos 𝑘 es:
𝑟 488
𝑤= = = 81,3
𝑘 6
Usamos redondeo por exceso a cero decimales debido a que los datos tienen no tienen decimales,
por tanto, 𝑤 = 82 horas.
28.6%
30% 25.7%
25% 22.9%
25.0%
20% 17.2%
15% 15.0%
12.5%
10% 5.7%
7.5%
5%
0%
643 725 807 889 971 1053 1135 1217
Duración (en horas)
Marca A Marca B
Fuente: Fico S.A.
c. Por norma ISO 9001, la duración de un foco debe ser mayor de 930 horas. ¿Qué marca de foco es
la que cumple en mayor porcentaje con esta norma?
La marca B es la que cumple en mayor porcentaje con la norma ISO 9001 debido a que el 77,14%
de los focos tienen una duración mayor a 930 horas, a diferencia de la marca A que tiene un menor
porcentaje de cumplimiento (40%).
Ejercicios
23. El ingeniero de control de calidad de la fábrica de aluminio G&E, por las constantes quejas que
recibe sobre la longitud de dichas láminas decide comparar las longitudes de las láminas en dos
turnos existentes, si se sabe que la longitud de la lámina debe estar entre 300 ∓ 8 mm. A
continuación, se muestra la longitud de las láminas en cada turno.
Tarde
290 290 290 290 291
293 294 295 295 298
298 300 304 305 306
313 314 315 321 327
Noche
282 286 296 296 297
298 298 300 301 304
306 310 310 310 311
312 313 313 315 315
316 317 319 319 319
320 320 320 321 322
324 324 325 328
Construya los intervalos comunes, marcas de clase y frecuencia absoluta simple para las
distribuciones de frecuencias, de manera que permita realizar comparaciones entre los dos
turnos. Utilice la regla de Sturges.
Ubicación nueva
8,51 8,65 8,68 8,72 8,78 8,8 8,82 8,82 8,83 9,14
9,19 9,27 9,35 9,36 9,37 9,39 9,43 9,48 9,49 9,54
9,55 9,60 9,63 9,64 9,70 9,75 9,85 9,87 9,95 9,98
10,01 10,03 10,05 10,05 10,09 10,1 10,12 10,12 10,15 10,15
a. Elabore las tablas de distribución de frecuencias de los datos de ambas muestras de tal manera
que permita su comparación apropiadamente.
b. Elabore los polígonos de frecuencias para su comparación.
c. Elabore un informe sustentado de sus conclusiones.
Estadística Aplicada I 2023 02 58
Variable 2
Variable 1
Variable 1
Variable 1 Variable 1 Variable 2 Variable 2
• Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El
alto de cada barra es proporcional a la frecuencia de cada categoría.
• Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada
categoría. El alto de cada barra es proporcional a la frecuencia de cada categoría.
• Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada
categoría. El alto de cada barra es el mismo para cada categoría.
Ejemplo 20
La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La encuesta
se aplicó a una muestra de 805 hogares según nivel socioeconómico (𝑁𝑆𝐸) y área de residencia. Los
resultados se presentan a continuación:
Solución
a. Indique el título de la tabla de doble entrada.
Distribución de hogares según área de residencia y nivel socioeconómico
Distribución de hogares según nivel socioeconómico y área de residencia
Estadística Aplicada I 2023 02 59
20% 18.01%
15% 13.04%
11.68%
10%
5.96%
4.72%
5%
1.86%
0.25% 0.37%
0%
NSE A NSE B NSE C NSE D NSE E
Nivel socieconómico
25%
18.01% 21.74%
20%
15% 22.36%
10% 0.37%
13.04% 11.68%
5% 0.25%
5.96% 4.72%
0% 1.86%
NSE A NSE B NSE C NSE D NSE E
Nivel socieconómico
Tabla 3. Distribución porcentual de hogares según área de residencia por nivel socioeconómico
Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 88,24% 11,76% 100%
Nivel socioeconómico B 94,12% 5,88% 100%
Nivel socioeconómico C 42,00% 𝟓𝟖, 𝟎𝟎% 100%
Nivel socioeconómico D 34,94% 65,06% 100%
Nivel socioeconómico E 17,43% 82,57% 100%
Total 37,27% 62,73% 100%
Fuente: Diario Siglo XXI
Estadística Aplicada I 2023 02 61
70% 65.06%
58.00%
60%
50% 42.00%
40% 34.94%
30%
17.43%
20% 11.76%
10% 5.88%
0%
NSE A NSE B NSE C NSE D NSE E
Nivel socieconómico
70% 58.00%
65.06%
60% 82.57%
50%
94.12%
88.24%
40%
30%
20% 42.00%
34.94%
10% 17.43%
0%
NSE A NSE B NSE C NSE D NSE E
Nivel socieconómico
Del total de hogares que pertenecen al nivel socioeconómico C, el 58% se encuentran en área rural.
Estadística Aplicada I 2023 02 62
Tabla 4. Distribución porcentual de hogares según nivel socioeconómico por área de residencia
Área de residencia
Nivel socio- Total
económico Área urbana Área rural
15 2 17
NSE A × 100% = 5,0% × 100% = 0,40% × 100% = 2,11%
300 505 805
48 3 51
NSE B × 100% = 16,0% × 100% = 0,59% × 100% = 6,34%
300 505 805
105 𝟏𝟒𝟓 250
NSE C × 100% = 35,0% × 𝟏𝟎𝟎% = 𝟐𝟖, 𝟕𝟏% × 100% = 31,05%
300 𝟓𝟎𝟓 805
94 175 269
NSE D × 100% = 31,3% × 100% = 34,65% × 100% = 33,42%
300 505 805
38 180 218
NSE E × 100% = 12,7% × 100% = 35,64% × 100% = 27,08%
300 505 805
Total 𝟏𝟎𝟎% 𝟏𝟎𝟎, 𝟎𝟎% 𝟏𝟎𝟎, 𝟎𝟎%
Fuente: Diario Siglo XXI
Tabla 4. Distribución porcentual de hogares según nivel socioeconómico por área de residencia
Área de residencia
Nivel socio-
económico Área urbana Área rural Total
NSE A 5,00% 0,40% 2,11%
NSE B 16,00% 0,59% 6,34%
NSE C 35,0% 𝟐𝟖, 𝟕𝟏% 31,05%
NSE D 31,33% 34,65% 33,42%
NSE E 12,67% 35,64% 27,08%
Total 𝟏𝟎𝟎% 𝟏𝟎𝟎, 𝟎𝟎% 𝟏𝟎𝟎, 𝟎𝟎%
Fuente: Diario Siglo XXI
30%
25%
20% 16.00%
15% 12.67%
10%
5.00%
5%
0.40% 0.59%
0%
Área urbana Área rural
Área de residencia
70% 31.33%
60% NSE E
50% NSE D
34.65%
40% 35.00%
NSE C
30% NSE B
20% NSE A
28.71%
16.00%
10% 0.59%
5.00% 0.40%
0%
Área urbana Área rural
Área de residencia
Fuente: Diario Siglo XXI
Del total de hogares que se encuentran en área rural, el 28,71% pertenecen el nivel socioeconómico C.
Estadística Aplicada I 2023 02 64
Ejercicios
25. En una investigación, publicada en el 2021, basada en cifras de las encuestas de salud de Statistics
Netherlands, GGDs y RIVM se analizaron los datos de la estatura de holandeses hombres. Este
estudio está limitado a personas nacidas en los Países Bajos.
Año de nacimiento Menos de 175 cm 175-179 cm 180-184 cm 185-189 cm 190-194cm Más de 194 cm
1930 - 1934 42.3% 26.2% 19.4% 8.8% 2.7% 0.6%
1935 - 1939 38.5% 27.0% 20.3% 10.2% 3.2% 0.8%
1940 - 1944 33.5% 25.8% 23.9% 11.2% 4.6% 1.0%
1945 - 1949 26.3% 25.4% 25.7% 15.1% 5.7% 1.8%
1950 - 1954 21.4% 25.5% 26.7% 16.9% 7.0% 2.5%
1955 - 1959 16.4% 23.0% 28.2% 20.0% 9.0% 3.4%
1960 - 1964 13.9% 20.7% 28.2% 22.0% 10.7% 4.5%
1965 - 1969 10.8% 18.4% 27.4% 24.7% 12.6% 6.1%
1970 - 1974 10.6% 17.2% 27.0% 24.4% 13.7% 7.1%
1975 - 1979 9.3% 18.8% 25.6% 24.7% 13.8% 7.8%
1980 - 1984 9.9% 16.9% 27.3% 24.3% 13.5% 8.1%
1985 - 1989 11.1% 17.7% 25.3% 25.3% 13.3% 7.3%
1990 - 1994 11.9% 17.9% 25.9% 23.6% 13.5% 7.2%
1995 - 1999 11.5% 17.7% 26.5% 24.1% 13.1% 7.1%
2000 - 2001 11.7% 16.8% 27.1% 23.8% 13.5% 7.1%
Fuente: CBS, GGDs y RIVM
b. Entre los que nacieron entre el año 2000 y 2001, indique el porcentaje que mide más de 194
cm.
c. Entre los que nacieron entre el año 1970 y 1974, indique el porcentaje que mide por lo menos
180 cm.
d. Entre los que nacieron entre el año 1930 y 1934, indique el porcentaje que mide como máximo
179 cm.
e. Entre los que nacieron entre el año 1980 y 1984, indique el porcentaje que mide entre 180 y
189 cm.
f. Entre los que nacieron entre el año 2000 y 2001, indique el porcentaje que mide más de 189
cm.
g. A partir del gráfico, ¿qué puede concluir acerca de la estatura de los hombres nacidos en los
Países Bajos?
10% 9.6%
9.2%
7.8% 7.5%
Porcentaje de cajas
8% 7.5% 7.5%
7.1%
5.8% 6.3% 6.3%
6% 5.8% 5.4%
5.0% 5.0%
5.0%
4%
2%
0%
Chocapic Fitnees Nesquik Snacker Trix
Presentacion
27. Osiptel es un organismo técnico especializado que regula y supervisa el mercado de servicios
públicos de telecomunicaciones y vela por los derechos del usuario. Osiptel decidió realizar una
investigación en 6000 hogares de Lima Metropolitana, sobre el uso principal del Internet y el
turno en el que utiliza el Internet. La investigación estuvo a cargo de un ingeniero de software,
quien muestra los datos obtenidos de una muestra de hogares en la siguiente tabla y gráfico:
60%
51.9%
Porcentaje de hogares
50% 44.7%
43.2%
40.5% 39.7%
40%
33.8%
29.8% 30.8%
30% 26.5%
25.5%
20.0%
20% 16.2% 17.3%
14.3%
10%
0%
Buscar información Juegos Otros Redes sociales Trabajo
Uso principal de Internet
28. El área de mantenimiento de Dream Perú quiere identificar la existencia de algún tipo de
problema en los equipos de las diferentes áreas de producción y cuáles de estas son perjudicadas
debido a las constantes paradas no programadas. Se realizó un estudio en donde el jefe de
producción muestra la siguiente información en una tabla y un gráfico, obtenidos al analizar el
turno de trabajo y la planta de producción de los registros de paradas.
26.7% 26.9%
23.6% 25.3% 25.9%
24.7%
25% 23.6% 23.3%
21.7% 22.3%
20%
Chimbote
Ica
15%
Lima
10% Tacna
5%
0%
Mañana Tarde Noche
Fuente:Dream Perú S.A. Turno de trabajo
45.8% 48.1%
50%
41.7% 40.0%
40% 37.0%
30%
20%
10%
0%
Exceso de velocidad Imprudencia del Ebriedad del Imprudencia del Desacato de señales
conductor conductor peaton de transito
Causa del siniestro
Moda
Cuartil
Decil
Desviación estándar
Coeficiente de variación
Rango intercuartil
Ejemplo 21
El salario medio en España se situó en 25896 euros brutos al año en 2021, el salario mediano en 21638
euros al año y el salario más frecuente fue de 18502 euros.
Se observa una brecha salarial por sexo, el sueldo medio de los hombres es 28388 euros y el de las
mujeres 23175 euros.
Estadística Aplicada I 2023 02 72
Interpretación de la media
∑=
!># 𝑥!
𝜇=
𝑁
Media muestral (Estadístico)
∑<!># 𝑥!
𝑥̅ =
𝑛
donde:
𝑥! : dato
𝑁 : tamaño de la población
𝑛 : tamaño de la muestra
∑%!># 𝑥! 𝑓!
𝜇=
𝑁
∑%!># 𝑥! 𝑓!
𝑥̅ =
𝑛
donde:
𝑥! : valor de la variable
𝑓! : frecuencia de cada clase
𝑁 : tamaño de la población
𝑛 : tamaño de la muestra
Estadística Aplicada I 2023 02 73
∑%!># 𝑥!´ 𝑓!
𝜇=
𝑁
∑%!># 𝑥!´ 𝑓!
𝑥̅ =
𝑛
donde:
𝑥!´ : marca de clase
𝑓! : frecuencia de cada clase
𝑁 : tamaño de la población
𝑛 : tamaño de la muestra
Características de la media
Ejemplo 22
Los siguientes datos corresponden al número de defectos por cada placa integrada, en una muestra
de 30 placas seleccionadas al azar de un proceso de producción.
4 2 4 2 1 3 3 1 3 3 4 1 1 4 1
5 5 5 3 1 3 1 4 1 1 2 4 1 4 1
Solución
La media del número de defectos de las 30 placas es de 2,6 defectos por placa.
Ejemplo 23
Los siguientes datos corresponden al espesor, en pulgadas, de una muestra aleatoria de varillas de
fierro corrugado.
1,73 1,73 1,84 1,71 1,61 1,50 1,78 1,50 1,90 1,81 1,72 1,84 1,75 1,69 1,63
1,51 1,77 1,81 1,77 1,80 1,68 1,56 1,71 1,78 1,49 1,57 1,71 1,82 1,66 1,69
Estadística Aplicada I 2023 02 74
Solución
El promedio del espesor de la muestra de varillas de fierro corrugado es 1,702 pulgadas. El espesor de
las varillas de fierro corrugado está alrededor de 1,702 pulgadas.
Ejemplo 24
A continuación, se muestra la distribución del número de máquinas que se sobrecalientan por día en
la planta REX S.A.
Solución
Calculemos la media:
∑%!># 𝑥! 𝑓!
𝑥̅ =
𝑛
0 × 13 + 1 × 10 + 2 × 4 + 3 × 3
𝑥̅ = = 0,9
30
El número de máquinas que se sobrecalientan está alrededor de 0,9 máquinas por día.
Estadística Aplicada I 2023 02 75
Ejercicios
30. De la página web ponteencarrera.pe se extrajo el siguiente cuadro que muestra los ingresos
medios de egresados jóvenes universitarios entre 2017 y 2019 en el Perú. Interprete el valor del
ingreso medio de los egresados de Estadística.
Ingresos mensuales de trabajadores jóvenes que egresaron de la universidad entre 2017 y 2019
31. Una fábrica de productos electrónicos ensambla artefactos en una línea de producción. Para
mejorar la eficiencia, la fábrica está interesada en calcular la media del tiempo que lleva
ensamblar un artefacto. Se ha tomado una muestra al azar y se ha medido el tiempo, en minutos
que tarda un operario en ensamblar un artefacto. Calcule e interprete lo pedido.
15 12 10 9 12 11 10 13 11
32. A continuación, se muestra la distribución del número de computadoras que fallan por día:
33. A continuación, se presenta el peso (en gramos) en forma agrupada para una muestra de
cargadores de celulares. Calcule e interprete la media.
34. En la siguiente tabla se muestra la distribución del tiempo, en horas, de duración de los
componentes electrónicos de las marcas Alpha y Beta sometidos a un trabajo continuo:
Calcule e interprete la media para el tiempo de duración de los componentes de las marcas Alpha
y Beta respectivamente.
Estadística Aplicada I 2023 02 77
Mediana
La mediana es el valor que ocupa la posición central de un conjunto de 𝑛 datos ordenados de una
variable en estudio.
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 (𝑚𝑒)
Interpretación de la mediana
• El 50% de las unidades elementales tienen un valor de la variable 𝑋 menor o igual a la mediana.
• El 50% de las unidades elementales tienen un valor de la variable 𝑋 hasta la mediana.
• El 50% de las unidades elementales tienen un valor de la variable 𝑋 como máximo la mediana.
Ejemplo 25
La Encuesta Nacional de Demografía y Salud (ENDES) es llevada a cabo por el Instituto Nacional de
Estadística e Informática (INEI) de Perú. Esta encuesta se realiza periódicamente y proporciona datos
valiosos sobre temas como la salud materna e infantil, la planificación familiar, el acceso a servicios de
salud, la nutrición, la mortalidad, entre otros indicadores clave relacionados con la salud y la
demografía.
La mediana de la edad a la primera relación sexual en mujeres de 25 a 49 años en el Perú es 18,4 años.
Esto se interprete que el 50% de las mujeres de 25 a 49 años en el Perú tuvo su primera relación sexual
a los 18,4 años o menos.
Cálculo de la mediana
Si 𝑛 es impar:
𝑚𝑒 = 𝑋 <A#
@ $ B
Si 𝑛 es par:
𝑋@<B + 𝑋@<A#B
$ $
𝑚𝑒 =
2
Características de la mediana
Ejemplo 26
A continuación, se muestra el tiempo de vida (en días) de 12 baterías de litio seleccionadas al azar.
Halle e interprete la mediana del tiempo de vida de las baterías.
479 510 487 465 473 504 517 485 516 536 462 511
Solución
𝑋[#] 𝑋[$] 𝑋['] 𝑋[&] 𝑋[E] 𝑿[𝟔] 𝑋[G] 𝑋[H] 𝑋[I] 𝑋[#0] 𝑋[##] 𝑋[#$]
462 465 473 479 485 487 504 510 511 516 517 536
Como 𝑛 = 12 es par.
𝑋@<B + 𝑋@<A#B 𝑋 #$ + 𝑋 #$
$ $
@
$
B @
$
A#B 𝑋[J] + 𝑋[G] 487 + 504
𝑚𝑒 = = = = = 495,5
2 2 2 2
El 50% de las baterías de litio tienen un tiempo de vida de hasta 495,5 días.
Ejemplo 27
A continuación, se muestra el tiempo de vida (en días) de 11 baterías de litio seleccionadas al azar.
Halle e interprete la mediana del tiempo de vida de las baterías.
487 489 498 571 571 560 530 509 495 461 500
Estadística Aplicada I 2023 02 79
Solución
𝑋[#] 𝑋[$] 𝑋['] 𝑋[&] 𝑋[E] 𝑿[𝟔] 𝑋[G] 𝑋[H] 𝑋[I] 𝑋[#0] 𝑋[##]
461 487 489 495 498 500 509 530 560 571 571
Como 𝑛 = 11 es impar.
El 50% de las baterías de litio tienen un tiempo de vida de 500 días o menos.
Ejemplo 28
Los datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) son:
9,99 10,00 10,00 10,26 25,00 9,84 9,96 9,98 10,05 10,12
Solución
𝑋[#] 𝑋[$] 𝑋['] 𝑋[&] 𝑿[𝟓] 𝑿[𝟔] 𝑋[G] 𝑋[H] 𝑋[I] 𝑋[#0]
9,84 9,96 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00
Como 𝑛 = 10 es par.
𝑋@<B + 𝑋@<A#B 𝑋 #0 + 𝑋 #0
$ $
@
$
B @
$
A#B 𝑋[E] + 𝑋[J] 10 + 10
𝑚𝑒 = = = = = 10
2 2 2 2
Ejercicios
35. Según los Censos Nacionales del 2017 en el Perú, la mediana de la edad de los peruanos es 29
años. Interprete este valor.
37. Los siguientes datos corresponden al número de accidentes laborales que sucede semanalmente
en un taller mecánico.
1 2 0 2 1 3 3 1 3 0 5 1 3 1 3 1 2 1
Moda
La moda es el valor que presenta la mayor frecuencia de un conjunto de datos observados de una
variable. Se denota por 𝑚𝑜.
Interpretación de la moda
Características de la moda
• Es la única medida de tendencia central que se obtiene para cualquier escala de medición.
• El valor de la moda no se ve afectada por valores extremos.
• La moda no siempre es un valor único. En una serie de datos se puede tener dos modas (bimodal)
o más de dos modas (multimodal).
• En un conjunto de datos no necesariamente se va a encontrar moda.
Ejemplo 29
El video con más vistas en Yotube es “Baby Shark Dance”, producida por
The Pinkfong Company, una compañía de entretenimiento educativo de
Corea del Sur. Al 13 de agosto del 2023, este video tenía más de 13 mil
millones de vistas. El valor de la moda es “Baby Shark Dance” y se
interpreta como el video visto con mayor frecuencia en Youtube.
Ejemplo 30
Los siguientes datos corresponden al número de piezas producidas (en cientos de piezas) diariamente
para una muestra aleatoria de 26 días.
4 2 4 2 2 3 3 1 3 3 4 1 1 5 5 5 3 1 3 2 4 2 1 5 2 3
Solución
En este caso, el resultado de la moda es igual a tres piezas diariamente. Esto significa que la cantidad
de piezas producidas con mayor frecuencia equivale a tres piezas diariamente.
Problema fi hi pi Pi
Estadística Aplicada I 2023 02 82
Ejemplo 31
El tiempo, en minutos, que toma en producirse cada una de nueve piezas metálicas tomadas al azar
de la empresa Indus Metal se muestran a continuación:
Tiempo 47 42 27 39 57 37 33 37 42
Solución
Tiempo 47 42 27 39 57 37 33 37 42
Es un caso bimodal (dos modas). Los tiempos más frecuentes en producir una pieza metálica son 37 y
42 minutos.
Ejemplo 32
El número de piezas vendidas más frecuente por los trabajadores es de cuatro piezas.
Estadística Aplicada I 2023 02 83
Estadística Aplicada I 2023 02 84
Ejercicios
38. Según los Censos Nacionales del 2017 en el Perú, la moda de la edad de los peruanos es 8 años.
Interprete este valor. En el momento del censo había 547 909 peruanos de 8 años.
39. A continuación, se presenta una muestra aleatoria de 13 telas de fibra de algodón registrando su
resistencia a la tensión (N/m²).
40. En una empresa que fabrica hornos microondas, la gerencia encargó al jefe de control de calidad
que informe sobre los problemas que reportan los clientes en sus hornos microondas. Se tomó
una muestra del área de reparaciones y se encontró la siguiente información:
41. El jefe de control de calidad de una empresa agroindustrial está interesado en estudiar el
comportamiento del número de productos defectuosos por lote. La información disponible para
este fin se muestra a continuación:
0 0 0 0 0 0 0 0 1 1
1 1 1 1 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 3
3 4 4 4 4 4 4 5 5 5
42. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas de
ahorros cerradas por día. La información disponible para este fin se muestra a continuación:
1 2 3 4 0 0 2 3 0 1 4 1 4 4 0 4 3 1 2 2
1 5 0 5 4 1 0 2 1 3 0 3 2 1 1 5 4 3 2 1
Ubicación antigua
8,05 8,72 8,72 8,80 9,55 9,7 9,73 9,80 9,80 9,84
9,84 9,87 9,87 9,95 9,97 9,98 9,98 10,00 10,01 10,02
10,03 10,05 10,05 10,12 10,15 10,15 10,26 10,26 10,29 10,55
Ubicación nueva
8,51 8,65 8,68 8,72 8,78 8,8 8,82 8,82 8,83 9,14
9,19 9,27 9,35 9,36 9,37 9,39 9,43 9,48 9,49 9,54
9,55 9,60 9,63 9,64 9,70 9,75 9,85 9,87 9,95 9,98
10,01 10,03 10,05 10,05 10,09 10,1 10,12 10,12 10,15 10,15
44. Una muestra de 30 trabajadores de una plataforma petrolera marina formó parte de un ejercicio
de escape del área. Para ello se registraron los siguientes tiempos, en minutos, empleados en la
evacuación.
También llamada media pesada. Permite calcular el valor medio considerando la importancia o peso
de cada valor sobre el total.
∑<!># 𝑥! 𝑤!
𝑥̅L =
∑<!># 𝑤!
donde:
𝑥! : observación individual
𝑤! : peso asignado a cada observación
Ejemplo 33
A continuación, se muestra el salario mensual (en soles) para diferentes ingenieros en una empresa
exportadora de tecnología emergente.
Solución
El salario de los ingenieros de la empresa exportadora de tecnología emergente está alrededor de 4510
soles.
Estadística Aplicada I 2023 02 87
Ejercicios
45. Las notas de un alumno del curso Estadística Aplicada I son las siguientes:
El valor de la media es sensible a los valores extremos, por lo que varía mucho con valores muy grandes
o pequeños con respecto a los demás.
𝑦! = 𝑎𝑥! + 𝑏
𝑦v = 𝑎𝑥̅ + 𝑏
Ejemplo 34
Se sabe que el tiempo promedio para derretir un metal pesado con un método estándar es de 5,5
minutos, actualmente en el mercado existen dos alternativas modernas (A y B) para derretir el metal.
La empresa Iron Forte S.A. desea adquirir una de las dos alternativas, y para ello se conoce lo siguiente:
• El tiempo para derretir el metal disminuye en 12,5% si se utiliza la alternativa A.
• El tiempo para derretir el metal disminuye en un 10% si se utiliza el método B y adicional disminuye
un minuto fijo por contar con radiación electromagnética.
¿Cuál de las dos alternativas permitirá a la empresa derretir el metal pesado en un tiempo promedio
más rápido?
Solución
Alternativa A
𝑦v = 𝑎𝑥̅ + 𝑏
El tiempo promedio para derretir un metal pesado con la alternativa A es 4,8125 minutos.
Alternativa B
𝑦v = 𝑎𝑥̅ + 𝑏
El tiempo promedio para derretir un metal pesado con la alternativa B es 3,95 minutos.
La alternativa que permitirá a la empresa derretir el metal pesado con un tiempo promedio más rápido
se obtiene al utilizar la alternativa B.
Estadística Aplicada I 2023 02 89
Ejemplo 35
Se sabe que los ingresos mensuales que perciben los trabajadores de una planta de producción tienen
un promedio de 2800 soles, determine el nuevo ingreso promedio que se obtendría luego de realizar
los siguientes aumentos:
Solución
Solución
𝑦v = 𝑎𝑥̅ + 𝑏
Solución
𝑦v = 𝑎𝑥̅ + 𝑏
c. los ingresos se incrementan en un 12,5% más una bonificación de 125 soles, entonces:
Solución
𝑦v = 𝑎𝑥̅ + 𝑏
Ejercicios
46. En una empresa textil, la distribución de salarios tiene una media aritmética de 600 dólares. Como
solución a un conflicto laboral, la gerencia propone un reajuste por medio de dos alternativas.
Propuesta I
Un aumento general del 8% de los salarios.
Propuesta II
Un aumento general del 4% de los salarios más un aumento adicional de 20 dólares a cada
trabajador.
47. En una cotización para adquirir drones, la empresa A ofrece las siguientes alternativas:
• La primera consiste en un aumento del precio en un 5% por contar con garantía de dos años.
• La segunda consiste en una disminución del precio en un 3% más 200 dólares por garantía de
dos años.
Indique la alternativa más conveniente del precio promedio de los drones, si el precio promedio
actual es de 1800 dólares.
48. En una empresa que vende ropa tiene un lote de 500 jeans que quiere rematar, para lo cual realiza
dos ofertas:
Si el lote costaba antes de las ofertas 30 mil soles y se vende todo el lote junto, indique qué oferta
produce el menor precio promedio por jean.
49. Un fabricante desea adquirir una máquina para el llenado de bolsas de 150 gramos. Se realizan
20 ensayos con la máquina obteniéndose los siguientes pesos, en gramos:
143 145 146 148 149 150 150 150 150 150
150 150 150 150 150 151 152 154 155 155
Posteriormente a las mediciones, se detectó que el equipo de medición que se empleó para medir
los pesos de las bolsas producidas por la máquina estaba descalibrado.
El verdadero peso de una bolsa es 5% menor al peso medido. Indique el peso promedio verdadero
de bolsas producidas por la máquina.
Estadística Aplicada I 2023 02 91
Los cuantiles más importantes son los denominados cuartiles, deciles y percentiles.
Percentiles
• Dividen el conjunto de datos en 100 partes porcentualmente iguales.
𝑃%
Cuartiles
Deciles
Décimo Décimo
inferior superior
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
𝐷# = 𝑃#0 𝐷$ 𝐷' 𝐷& 𝐷E 𝐷J 𝐷G 𝐷H 𝐷I = 𝑃I0
Ejemplo
Si queremos determinar el puntaje mínimo para estar en el quinto superior, debemos calcular el
percentil 80.
Cálculo de un percentil
𝑛+1
𝑖={ | 𝑘 = 𝐸, 𝑑
100
Si 𝑑 = 0, entonces 𝑃% = 𝑋[M]
Ejemplo 36
Se cuenta con los datos de los tiempos, en minutos, de ensamblaje de CPUs de 12 trabajadores. Calcule
e interprete el percentil 45.
15 12 18 22 24 10 9 13 25 18 12 14
Solución
Primero, ordenemos los datos ordenados.
𝑋[#] 𝑋[$] 𝑋['] 𝑋[&] 𝑿[𝟓] 𝑿[𝟔] 𝑋[G] 𝑋[H] 𝑋[I] 𝑋[#0] 𝑋[##] 𝑋[#$]
9 10 12 12 13 14 15 18 18 22 24 25
𝑛+1 12 + 1
𝑖={ |𝑘 = { | 45 = 5,85 = 𝐸, 𝑑
100 100
De donde 𝐸 = 5 y 𝑑 = 0,85.
El 45% de los trabajadores ensamblan los CPUs en un tiempo máximo de 13,85 minutos.
Ejemplo 37
Exprese los siguientes valores como percentiles.
• Q1 = P25
• Q3 = P75
• Me = P50
• D3 = P30
• D6 = P60
Estadística Aplicada I 2023 02 94
Ejercicios
50. En una empresa, el jefe de Recursos Humanos está interesado en analizar el impacto en los
empleados al suprimir las horas extras de trabajo pagadas. Con este fin se extrae una muestra
aleatoria de 60 empleados tomando los datos de un día al azar. A continuación, se muestran las
horas de trabajo por día de cada empleado.
7,6 7,7 8,0 8,0 8,0 8,1 8,1 8,2 8,2 8,2 8,2 8,2 8,2 8,3 8,3
8,3 8,4 8,4 8,4 8,4 8,5 8,5 8,5 8,6 8,6 8,7 8,7 8,7 8,8 8,8
8,9 8,9 8,9 9,0 9,1 9,1 9,3 9,4 9,6 9,7 9,7 9,8 9,9 9,9 10,0
10,0 10,3 10,5 10,5 10,6 10,8 11,0 11,2 11,6 11,7 12,2 12,5 12,9 13,3 14,5
a. Calcule el número de pernos máximo, fabricados semanalmente, para estar en el 15% de los
operarios con menor rendimiento.
b. Calcule el número de pernos mínimo, fabricados semanalmente, para estar en quinto superior
de los operarios con mayor rendimiento.
52. La empresa Computronix es una compañía distribuidora de equipos de cómputo. Jean Carlos jefe
del área de logística preocupado por la disminución de las ventas diarias, propondrá al directorio
la implementación de la promoción del pago en 12 cuotas sin intereses, siempre que más del 18%
de días registren como máximo un monto de venta de 151 soles.
60,2 92,6 95,9 97,5 102,5 104,1 106,0 125,2 125,6 146,0
146,8 158,6 158,7 162,6 166,2 166,2 166,2 166,2 168,2 169,7
196,0 204,9 204,9 204,9 204,9 208,3 215,2 217,5 218,1 218,1
218,1 218,1 220,9 226,2 235,0 239,7 242,2 259,6 261,6 277,2
286,5 287,0 297,8 313,9 315,0 316,2 338,6 359,9 363,1 398,3
¿La empresa debe implementar la promoción de las ventas en cuotas sin interés?
Estadística Aplicada I 2023 02 95
53. Se ha registrado el número de problemas con el celular de 25 clientes de telefonía móvil en Lima,
usuarios de la operadora A, tal como se muestra a continuación:
4 7 4 7 6 8 7 5 7 5 7 4 7
8 6 5 6 6 5 6 6 7 4 6 4
La operadora A planifica hacer un descuento especial al 20% de los clientes que registra el mayor
número de problemas con el celular, ¿A partir de qué número de problemas, al cliente se va a
hacer el descuento especial?
Estadística Aplicada I 2023 02 96
Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de la
medida de tendencia central, en cambio si la medida de dispersión tiene un valor grande, los datos no
están concentrados alrededor de la medida de tendencia central.
Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre dato
mayor y el dato menor:
𝑟 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
donde:
Ejemplo 38
El jefe de control de calidad de la empresa industrial de termas eléctricas Thermosol S.A. selecciona
una muestra al azar de 12 termas, y registra el número de defectos que presenta cada terma. Calcule
el rango.
2 1 2 4 1 3 2 3 2 0 5 1
Solución
El valor máximo es
𝑋𝑚𝑎𝑥 = 5
El valor mínimo es
𝑋𝑚𝑖𝑛 = 0
Luego el rango es 𝑟 = 5 – 0 = 5. Esto indica que la amplitud del número de defectos en las ternas es de
5.
Estadística Aplicada I 2023 02 97
Varianza
Es una medida del grado de dispersión o variación de los valores de una variable con respecto a su
media o promedio.
Varianza poblacional
∑=
!>#(𝑥! − 𝜇)
$
𝜎$ =
𝑁
Varianza muestral
∑<!>#(𝑥! − 𝑥̅ )$
𝑠$ =
𝑛−1
Varianza poblacional
Varianza muestral
∑%!># 𝑓! (𝑥! − 𝑥̅ )$
𝑠$ =
𝑛−1
Estadística Aplicada I 2023 02 98
Desviación estándar
La desviación estándar es la raíz cuadrada positiva de la varianza, mide la cantidad típica en la que los
valores del conjunto de observaciones difieren de la media.
𝜎 = €𝜎 $
𝑠 = €𝑠 $
Ejemplo 39
A continuación, se presenta la cantidad de plomo en una muestra de agua potable, en miligramos por
litro. Calcule la varianza y la desviación estándar.
45 62 30 25 36 60 47 19 16 38 10 35 31 21 22 25
Solución
Varianza
∑<!>#(𝑥! − 𝑥̅ )$
𝑠$ = = 224,3833
𝑛−1
Desviación estándar
𝑠 = €224,3833 = 14,9794
Estadística Aplicada I 2023 02 99
Coeficiente de variación
• Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o
iguales unidades.
𝜎
𝐶𝑉 = × 100%
𝜇
𝑠
𝐶𝑉 = × 100%
𝑥̅
Ejemplo 40
Solución
𝑠# 1,10
𝐶𝑉# = × 100% = × 100% = 36,67%
𝑥̅# 3
𝑠$ 1,66
𝐶𝑉$ = × 100% = × 100% = 33,207%
𝑥̅$ 5
Ejemplo 41
La fábrica de colchones A cuenta con dos plantas (A y B). El área de seguridad industrial desea analizar
la variabilidad del número de accidentes industriales en las plantas. Para el estudio se tomó una
muestra aleatoria de 100 días laborables para cada planta. La información se muestra a continuación:
Distribución de días laborables según número Distribución de días laborables según número
de accidentes en la planta A de accidentes en la planta B
Número de accidentes Número de días Número de accidentes Número de días
0 10 0 15
1 15 1 10
2 30 2 35
3 35 3 25
4 10 4 15
Total 100 Total 100
Fuente: Colchones A S.A. Fuente: Rímac S.A.
¿En cuál de las dos plantas el número de accidentes presenta mayor homogeneidad? Justifique su
respuesta.
Solución
0 × 10 + 1 × 15 + 2 × 30 + 3 × 35 + 4 × 10
𝑥̅7 = = 2,2
100
𝑠7 = 1,1282
0 × 15 + 1 × 10 + 2 × 35 + 3 × 25 + 4 × 15
𝑥̅9 = = 2,15
100
𝑠9 = 1,2422
𝑠7 1,1282
𝐶𝑉7 = × 100% = × 100% = 51,28%
𝑥̅7 2,2
𝑠9 1,2422
𝐶𝑉9 = × 100% = × 100% = 57,78%
𝑥̅9 2,15
Se observa que en la planta A, el coeficiente de variación es menor, por lo tanto, en esta planta existe
mayor homogeneidad en el número de accidentes.
Estadística Aplicada I 2023 02 101
Ejercicios
54. Una ingeniera ambiental realiza un estudio de calidad del agua en dos ríos para evaluar la
concentración de un contaminante específico, río A y río B.
Para ello, tomó muestras en diferentes sitios a lo largo de los ríos durante algunos días
consecutivos. Obtuvo los siguientes resultados:
• Para el río A, la media de la concentración del contaminante es 5,6 miligramos por litro (mg/l)
y su desviación estándar es 1,4 mg/l.
• Para el río B, la media de la concentración del contaminante es 4,7 mg/l y su desviación
estándar es 1,5 mg/l.
La ingeniera desea determinar que río tiene la menor variabilidad de la concentración del
contaminante.
Tecnología A 138 126 125 124 119 119 137 110 119 155
Tecnología B 130 126 129 130 127 129 132 128 124 132
Determine con cuál de las dos tecnologías, los tiempos de transmisión de un archivo son más
homogéneos.
56. La empresa Electro S.A. dedicada a la venta de artefactos electrónicos para el hogar, opera 200
tiendas en diferentes lugares del país. Los últimos informes indican que las ventas semanales han
descendido a tal punto que se han tenido que cerrar algunas tiendas.
Determine en cuál de las tiendas las ventas realizadas son más homogéneas.
57. Se tiene tres marcas de bombillas A, B y C. Se presenta a continuación la duración (en días)
registrada de cierto número de bombillas de cada marca.
Marca B Marca C
Duración (días) Número de bombillas Duración (días) Número de bombillas
3 2 [0 – 5] 4
11 4 ]5 – 10] 8
15 3 ]10 – 15] 12
20 1 ]15 – 20] 2
Fuente: Electro S.A. Fuente: Electro S.A.
¿Qué marca compraría usted y por qué? Sustente su respuesta a base del análisis de las medidas
de dispersión de los datos presentados.
58. El ingeniero de control de calidad de la fábrica de cobre R&J, por las constantes quejas que recibe
sobre la longitud de dichas láminas decide comparar las longitudes de las láminas en dos turnos
existentes. A continuación, se presenta la longitud de las láminas tomadas al azar en cada turno.
Tarde
290 290 290 290 291 293 294 295 295 298 298 300 304 305 306
Noche
282 286 296 296 297 298 298 300 301 304 306 310 310 310 311
59. El jefe de cuadrillas de operarios de la empresa de agua y alcantarillado Emapa S.A. supervisa la
reparación de la red pública y domiciliaria. El jefe afirma que hay mayor heterogeneidad en el
tiempo efectivo de reparación en la red domiciliaria, si esa afirmación se comprueba, se tendrá
que convocar más trabajadores para reparar esa red. Para analizar la situación se muestra la
siguiente información:
60. El jefe de producción de la empresa A debe decidir qué tipo de proveedor abastecerá a la empresa
de placas de un material necesario para la producción. En general, las placas de los materiales
ofrecidos por ambos proveedores son muy similares en precio y en casi todas las características
físicas estudiadas salvo en el de resistencia a la tracción, característica en la que se concentraron
las pruebas. A mayor resistencia a la tracción del material, mejor es su calidad. Las pruebas de
resistencia a la tracción (en kilogramos) de algunas placas de materiales de ambos proveedores
se muestra en la siguiente tabla resumida:
Estadística Aplicada I 2023 02 103
Medidas de asimetría
Las medidas de asimetría permiten determinar la forma de una distribución para un conjunto de datos.
• Si los datos se distribuyen con igual frecuencia y alejados por debajo y por encima de la media, se
dice que la distribución es simétrica.
• Si los datos que son menores a la media son más frecuentes que aquellos por encima de la media
o viceversa, se dice que la distribución es asimétrica.
• Si la distribución es asimétrica positiva; existe mayor concentración de valores a la izquierda de la
media.
• Si la distribución es asimétrica negativa; existe mayor concentración de valores a la derecha de la
media.
Se tiene que:
• Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
concentración de datos en los valores altos.
• Si un grupo de datos tiene un coeficiente de asimetría nulo, esto significa que hay una
concentración de datos alrededor de la media.
• Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
concentración de datos en los valores bajos.
Estadística Aplicada I 2023 02 105
Ejemplo 42
Se tomó una muestra aleatoria de seis piezas de engranaje de un almacén para ser utilizados en
maquinarias industriales y se calculó los siguientes estadísticos para la variable antigüedad en años,
los resultados fueron los siguientes:
14 15 16 16 20 21
Solución
𝐴𝑠 = 0,716
Como el 𝐴𝑠 > 0, entonces existe asimetría positiva, por lo que la concentración de la antigüedad de las
piezas de engranaje se encuentra en los valores bajos.
Estadística Aplicada I 2023 02 106
Ejercicios
61. Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede
soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de
resistencia, los ingenieros toman una muestra al azar, la prueban y llegan a la conclusión sobre
qué tanta tensión, en promedio, puede resistir este tipo de concreto. A continuación, se presenta
la tensión (en kg/cm2) obtenidos de una muestra al azar de 30 bloques de concreto que se
utilizarán para construir un puente:
1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8 3,0 3,0 3,2 3,2 3,2
3,4 3,4 3,5 3,5 3,6 3,6 3,6 3,6 3,7 3,8 3,9 3,9 4,0 4,0 4,0
62. Se realizó un estudio para evaluar el tiempo, en minutos, que utiliza cada trabajador de una planta
hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las válvulas de
control. Para ello se eligieron al azar 45 de ellos tal como se muestra a continuación:
5 5 6 7 7 10 11 11 12 12 13 13 15 16 16
17 18 18 19 20 20 20 21 21 21 21 22 22 23 24
24 25 25 25 25 25 26 26 27 27 27 28 28 28 30
63. Con base en un célebre experimento, Henry Cavendish (1731 -1810) ofreció evidencias directas
de la ley de la gravitación universal de Newton. En el experimento se determinó el peso de masas
de objetos, la medida de la fuerza de atracción se usó para calcular la densidad de la Tierra. Los
valores de la densidad de la Tierra, en orden temporal por filas son:
5,1 5,27 5,29 5,29 5,3 5,34 5,34 5,36 5,39 5,42 5,44 5,46
5,47 5,53 5,57 5,58 5,62 5,63 5,65 5,68 5,75 5,79 5,85 5,82
Calcule e interprete la asimetría para la variable en estudio.
64. El jefe de Recursos Humanos desea información de la cantidad de faltas que han tenido los
trabajadores en el mes anterior. Se seleccionó a 40 trabajadores y registró el número de faltas.
65. El jefe de producción de una planta industrial está evaluando el tiempo de producción de las
piezas de telas, en minutos. Él afirma que la mayor concentración de los tiempos de producción
se podría encontrar en los valores altos. Si fuera correcta tal afirmación se tendría que realizar
mantenimiento a las maquinas tejedoras. Para tal propósito ha seleccionado una muestra
aleatoria de 16 piezas de telas, los datos se muestran a continuación:
3 4 4 4 5 5 6 6 8 8 8 8 8 9 9 9
66. Investigadores del Massachussets Institute of Technology (MIT) realizaron, el 9 de abril de 1993,
un estudio sobre asteroides. Al observar 53 de estos asteroides con el telescopio Hiltner del
observatorio de MIT; se registró el número de exposiciones de imagen espectral.
Rango intercuartil
Nota
Si la pregunta es “comparar la variabilidad” se calcula coeficiente de variación.
Si la pregunta es “comparar la variabilidad en el 50% central” se calcula el rango intercuartil.
Ejemplo 43
Se quiere elegir una compañía de taxi para lo cual se toma una muestra de viajes entre dos distritos.
Se desea elegir aquella compañía que presente la menor variabilidad en el 50% central de los tiempos.
Taxi A 15 20 34 23 45 10 14 15 17 23 28 34 62 14 18
Taxi B 12 34 23 50 45 34 28 22 21 40 34 23 55 17 23
Solución
Como piden elegir la compañía que tenga menor variabilidad en el 50% central, se va a elegir la
compañía con el menor rango intercuartil.
Para el taxi A
Para el taxi B
Se va elegir la compañía de taxi B, pues tiene el menor rango intercuartil (18 < 19).
Estadística Aplicada I 2023 02 109
Ejercicios
68. Covisa es una empresa de construcción civil, compra actualmente los ladrillos al proveedor FAX
S.A. Para continuar con el proveedor o cambiarlo, ha decidido realizar un análisis de la resistencia
transversal de los ladrillos, en Mn/m2. A continuación, se presenta los resultados de una muestra
de 27 ladrillos fabricados por el proveedor.
3 4 4 4 5 5 6 8 8
8 8 8 9 9 11 11 11 11
11 12 13 13 14 15 15 17 17
69. Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede
soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de
resistencia, los ingenieros toman una muestra, la prueban y llegan a la conclusión sobre qué tanta
tensión, en promedio, puede resistir este tipo de concreto. A continuación, se presenta la tensión
(en kg/cm2) obtenidos de una muestra aleatoria de 20 bloques de concreto que se utilizarán para
construir un puente.
1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8
3,0 3,0 3,2 3,2 3,2 3,4 3,4 3,5 3,5 3,6
70. Los siguientes datos corresponden a las mediciones de la emisión diaria (en toneladas) de óxido
de azufre de una planta industrial.
7,7 9,4 11,0 11,2 13,9 15,2 15,8 17,3 18,5 20 22,7 23,9 24,5 26,4
Diagrama de cajas
El diagrama de cajas o box plot es una gráfica que describe la distribución de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango
intercuartil como medida de referencia de dispersión.
Valor atípico
Fuente:
Variable 2
Estadística Aplicada I 2023 02 111
2. Trace un rectángulo con los extremos del percentil 25 y percentil 75, en cada categoría. En la caja
trace una recta horizontal en el lugar del percentil 50.
𝑃"%
Fuente: Variable 2
3. Ubique los límites inferior y superior mediante el rango intercuartil, el límite superior está a 1,5
RIC arriba del P75, mientras que, el límite inferior está a 1,5 RIC debajo del P25.
o Trace los bigotes desde los extremos de las cajas hasta los valores mínimo y máximo dentro de
los límites inferior y superior.
*
𝑃&%
Variable 1 (Cuantitativa)
𝑃%'
Unidad de medición
𝑃"%
*
Categoría 1 Categoría 2 Categoría 3
Fuente: Variable 2
Estadística Aplicada I 2023 02 112
En la construcción del diagrama de cajas se pueden presentar dos casos, cuando el valor mínimo o
máximo son valores atípicos.
Si el valor mínimo es un valor atípico, entonces el bigote debe llegar hasta el dato siguiente al valor
mínimo, considerando a este valor como nuevo valor mínimo.
Por ejemplo, si el límite inferior 𝐿! = 1,7; el percentil 25 𝑃$E = 3,5 y los datos son:
Entonces:
Si el valor máximo es un valor atípico, entonces el bigote debe llegar hasta el dato anterior al valor
máximo, considerando a este valor como nuevo valor máximo.
Por ejemplo, si el límite superior 𝐿* = 6,2, ; el percentil 75 𝑃GE = 3,8 y los datos son:
Entonces:
*
Valor atípico 6,7
Límite superior 𝐿$ = 6,2
Valor máximo dentro de los límites 5,8
Bigote superior
3,8 Percentil 75 𝑃%#
Estadística Aplicada I 2023 02 113
Valor atípico *
P75 *
P50
Variable cuantitativa
Máximo
P25
Rango Asimetría
RIC
Asimetría en el
50% central
Valor atípico
*
Mínimo
Ejemplo 44
Tentel S.A. desea comparar el tiempo de conexión a Internet en los teléfonos celulares de sus clientes
de acuerdo con sus dos principales usos: Facebook y WhatsApp. Para llevar a cabo la comparación se
desea elaborar un diagrama de cajas. Complete la gráfica:
100
90
80
68.25
63
60
54 57.00
40
33.25
20 24
15
0
Facebook WhatsApp
Fuente: Telnet S.A. Tipo de uso de Internet
a. Complete la gráfica con el diagrama de cajas del tiempo de uso del WhatsApp. Utilice los siguientes
datos:
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
b. En el 50% central, indique el tipo de asimetría de la distribución del tiempo de uso de Facebook.
c. En el 50% central, ¿qué tiempos de uso son más homogéneos?
d. ¿Los tiempos de uso del WhatsApp tiene valor atípico? Si fuera así, ¿cuál es el valor?
Solución
a. Complete la gráfica con el diagrama de cajas del tiempo de uso del WhatsApp.
Solución
Calculamos los percentiles 25, 50 y 75 con los datos de los tiempos de los clientes que usan el
WhatsApp.
𝑘 × (𝑛 + 1) 25 × (16 + 1)
𝑖= = = 4,25
100 100
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
𝑘 × (𝑛 + 1) 50 × (16 + 1)
𝑖= = = 8,5
100 100
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
𝑘 × (𝑛 + 1) 75 × (16 + 1)
𝑖= = = 12,75
100 100
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
Estadística Aplicada I 2023 02 116
El extremo del bigote superior = 118, pues el límite superior es 120,75 y, por tanto, el máximo de
los valores dentro los límites es 118. El valor 132 será un valor atípico.
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
100
90
80
68.25
63
60
54 57.00
40
33.25
20 24
15
0
Facebook WhatsApp
Fuente: Telnet S.A. Tipo de uso de Internet
Solución
b. En el 50% central, la distribución del tiempo de uso del Facebook tiene asimetría positiva.
c. En el 50% central, son más homogéneos con el uso del WhatsApp, pues su rango intercuartil es 35
minutos es menor que el rango intercuartil del uso de Facebook que es de 36 minutos.
d. El valor 132 de los tiempos de uso del WhatsApp es un valor atípico, pues está fuera de los límites.
Estadística Aplicada I 2023 02 117
Ejercicios
71. Un ingeniero eléctrico está realizando una investigación acerca de la duración de los focos
eléctricos fabricado por dos empresas, para ello ha recolectado dos muestras aleatorias con datos
correspondientes a la duración (en horas) de una muestra de 40 focos de 100 watts producidos
por la empresa Alfa y una muestra de 40 focos de 100 watts producidos por la empresa Gamma.
El ingeniero afirma que las duraciones de los focos fabricados por la empresa Alfa están
concentradas en valores altos y las duraciones de los focos fabricados por la empresa Gamma
están concentrados en valores bajos, y por lo tanto los focos fabricados por Alfa son más
confiables.
¿Serán confiables los focos fabricados por Alfa? Utilice dimensiones para su solución. Complete
el diagrama de cajas.
1250
1,230.00
1150
1,093.00 1,092.50
1050
1,015.50
971.75
950 945.25
916.50
850 853.75
819.00
750
684.00
650
Estadística Aplicada I 2023 02 118
72. La empresa Tricon realiza un estudio sobre el tiempo de espera en las obras. Considera que esta
variable es necesaria pues el concreto premezclado tiene un tiempo de vida de aproximadamente
tres horas. A continuación, se presentan los datos de los tiempos de espera, en minutos, de las
45 obras a las cuales se envió el concreto premezclado desde la planta de los Olivos:
23 34 37 38 41 43 44 46 47 48 49 49 51 51 52
53 54 55 57 58 58 58 58 59 59 60 60 60 60 61
62 62 62 63 63 63 64 65 70 73 74 76 78 88 89
También se presenta el diagrama de cajas de los tiempos de espera (en minutos) para las plantas
de Lurín y Callao, desde donde se envía el concreto premezclado.
Distribución
Tiempo de espera dedel
obras según tiempo
concreto de espera por
premezclado porplanta
planta
( en minutos)
80
74
Tiempos de espera, en minutos
70 67
60 58 56.75 58
53
Datos
50 49.5
40 39 39,25
30
23 25
20
LURIN CALLAO OLIVOS
Unidad 2. Aplicaciones de
distribuciones de probabilidad
Logro
Al término de la unidad, el estudiante utiliza las distribuciones de probabilidad para modelar variables
dentro de situaciones de incertidumbre en contextos reales.
Temario
Bibliografía
Estadística Aplicada I 2023 02 120
Conceptos
Experimento aleatorio
Es un proceso que, al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera
más de un posible resultado que no puede ser determinado de antemano. Se denota por ε.
Ejemplo 45
𝜀# Lanzamiento de un dado
𝜀$ Traslado de productos de un almacén al centro de distribución
𝜀' Selección de un producto para la inspección de calidad
𝜀& Registrar el tiempo de vida de un celular en meses
Espacio muestral
Es el conjunto de todos los posibles resultados de un experimento aleatorio. Se le suele simbolizar
como W.
Ejemplo 46
• Si lanzamos un dado y anotamos el número que muestra la cara superior, entonces el espacio
muestral es:
W = {1, 2, 3, 4, 5, 6}
Evento
También denominado suceso. Un evento es cada tipo posible de ocurrencia o conjunto de ocurrencias
del experimento e estudiado, es decir, un evento es cualquier subconjunto del espacio muestral W
asociado al experimentoe. Se le suele simbolizar con cualquier letra mayúscula.
Estadística Aplicada I 2023 02 121
Ejemplo 47
𝐴 = {1}
𝐵 = {2, 4, 6}
𝐶 = {𝑡/0 < 𝑡 ≤ 7}
𝐷 = {𝑡/𝑡 ≥ 4}
𝐸 = {𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜}
𝐹 = {𝑁𝑜 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜}
Evento simple
Es un evento definido por una sola característica.
Ejemplo 48
En el caso de lanzar un dado, algunos eventos simples son:
𝐴 = {1}
𝐵 = {4}
𝐶 = {𝑡/0 < 𝑡 ≤ 7}
𝐷 = {𝑡/𝑡 ≥ 4}
Evento compuesto
Evento definido por dos o más características. También se le denomina evento compuesto.
Ejemplo 49
En el caso de lanzar un dado, un evento conjunto es:
𝐶 = {𝑡 / 𝑡 ³ 4 ∧ 𝑡 £ 7}
Estadística Aplicada I 2023 02 122
Ejemplo 50
Complemento de un evento
Para un evento 𝐴 cualquiera se define su complemento 𝐴N , 𝐴´ ; 𝐴̅ como el evento consistente en todos
los puntos de W que no están en 𝐴. Se tiene que:
𝑃(𝐴O ) = 1 − 𝑃(𝐴)
𝑃(𝐴) = 1 − 𝑃(𝐴O )
Ac
A
A
Ejemplo 51
Entonces:
𝐴O = {1, 3, 5, 6}
Estadística Aplicada I 2023 02 123
A B
Ejemplo 52
𝐴 = {2, 4}
𝐵 = {1, 3}
Los eventos 𝐴 y 𝐵 son mutuamente excluyentes pues son disjuntos, si ocurre 𝐴 necesariamente no
ocurre 𝐵.
𝐶 = {𝑡/𝑡 ≤ 4}
𝐷 = {𝑡/𝑡 > 7}
Eventos independientes
Son aquellos eventos en los que la ocurrencia de un evento no influye en la ocurrencia de otro o de
otros eventos.
Ejemplo 53
Un sistema está conformado por tres componentes que funcionan independientemente. Sean los
siguientes eventos:
Concepto de probabilidad
Las decisiones que toma un ingeniero a menudo se basan en un análisis de situaciones como las
siguientes:
Probabilidad
La probabilidad es la evaluación numérica de la posibilidad de que un evento ocurra. Los valores de
probabilidad siempre se asignan en una escala de 0 a 1.
0≤𝑝≤1
Un valor de probabilidad cercano a 0 indica que es muy improbable que ocurra el evento, mientras
que una probabilidad cercana a 1 indica que es casi seguro que ocurra el evento.
El objetivo del cálculo de probabilidades es el obtener un valor numérico asociado con la ocurrencia
de determinado acontecimiento para facilitar la toma de decisiones relacionada con él.
Sea un experimento aleatorio cuyo correspondiente espacio muestral W está formado por un número
finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces, definimos la
probabilidad de un evento 𝐴 como sigue:
𝑛(𝐴)
𝑃(𝐴) =
𝑛(W)
donde:
Axiomas de probabilidad
En Matemáticas, un axioma es cada uno de los principios indemostrables sobre los que, por medio de
un razonamiento deductivo, se construye una teoría. Los axiomas de probabilidad fueron establecidos
en 1933 cuando Andréi Kolmogorov publicó su libro Los fundamentos de la teoría de la probabilidad.
Primer axioma
Segundo axioma
𝑃(W) = 1
Tercer axioma
Teoremas de probabilidad
𝑃(f) = 0
Diagramas de Venn
Una primera herramienta muy útil para mostrar la relación entre el espacio muestral y los eventos que
lo componen es el diagrama de Venn (teoría de conjuntos) donde el espacio muestral, representado
por un rectángulo, es el equivalente al conjunto universo y los eventos del espacio muestral,
representados por figuras geométricas cerradas, generalmente por círculos dentro del rectángulo,
equivalen a los conjuntos.
Los diagramas de Venn fueron desarrollados por John Venn (Drypool, 4 de agosto de 1834 - Cambridge,
4 de abril de 1923), matemático y lógico británico.
Unión de eventos
Para dos eventos 𝐴 y 𝐵, la unión de los eventos 𝐴 y 𝐵 expresado como 𝐴 ∪ 𝐵 es el evento que
contienen todos los puntos de W que pertenecen a 𝐴 o a 𝐵 o a ambos.
A B
Intersección de eventos
Para dos eventos 𝐴 y 𝐵, la intersección de los eventos 𝐴 y 𝐵 expresado como (𝐴 ∩ 𝐵) es el evento que
contienen todos los puntos de W que pertenecen tanto a 𝐴 como a 𝐵.
A B
Diferencia de eventos
Para dos eventos 𝐴 y 𝐵, la diferencia de los eventos 𝐴 y 𝐵 es el evento que contienen todos los puntos
de W que pertenecen a 𝐴 y no pertenecen a 𝐵.
A B
Para dos eventos 𝐴 y 𝐵, la diferencia simétrica de los eventos 𝐴 y 𝐵 es el evento que contienen todos
los puntos de W que pertenecen solo a 𝐴 o aquellos que solo pertenecen a 𝐵.
A B
Ejercicios
73. El 30% de los estudiantes en una universidad son limeños, el 10 % estudian ingeniería, el 1%
estudian ingeniería y son limeños. Se selecciona al azar a un estudiante
74. El 12% de los trabajadores de una empresa padece de hipertensión arterial y el 17% padece de
diabetes. Además, el 25% padece hipertensión arterial o diabetes. Se selecciona al azar a un
trabajador.
Ejemplo 54
Ingenieros de la planta mecánica de la empresa Indumental prueban una nueva técnica de soldadura
de arco. Se muestreo 300 soldaduras, las cuales fueron analizadas y clasificadas según el resultado de
la prueba de apariencia, así como por el resultado de la prueba de inspección de rayos X, tal como se
muestra en la siguiente tabla:
Solución
𝑛(𝑁 ∩ 𝑌) 63
𝑃(𝑁 ∩ 𝑌) = = = 0,21
𝑛(W) 300
Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
Estadística Aplicada I 2023 02 130
b. Calcule la probabilidad de que el resultado tenga una apariencia que sea buena.
Solución
𝑛(𝐵) 75
𝑃(𝐵) = = = 0,25
𝑛(W) 300
Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
Solución
Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
Estadística Aplicada I 2023 02 131
Solución
𝑃(𝑀N ∪ 𝑍) = 0,72
Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
Estadística Aplicada I 2023 02 132
Ejercicios
75. La empresa Plast&Cos fabrica placas circulares plásticas de policarbonato, pero últimamente sus
productos han sido devueltos por la baja resistencia encontrada. Por ello, el área de control de
calidad ha seleccionado al azar 300 placas circulares y analizado la resistencia a las rayaduras y a
los impactos. Los resultados se encuentran en la siguiente tabla.
a. Calcule la probabilidad de que su resistencia a las rayaduras y a los impactos sea alta.
Rpta. 0,22667
b. Calcule la probabilidad de que su resistencia a las rayaduras sea media o su resistencia a los
impactos sea baja. Rpta. 0,51667
c. Calcule la probabilidad de que su resistencia a las rayaduras no sea baja o su resistencia a
los impactos sea alta. Rpta. 0,89667
d. Si entre las placas con alta resistencia a las rayaduras se elige una al azar, calcule la
probabilidad de que su resistencia a los impactos sea alta.
76. Se presenta una tabla donde se resume los pedidos realizados durante el último año clasificado
por tamaño de empresa, ciudad donde se ubica el proveedor y si el pedido sufrió algún retraso.
Distribución de pedidos de madera según tamaño de la empresa, ciudad y retraso del pedido
Pedido con retraso Pedido sin retraso
Tamaño de empresa Total
Pucallpa(P) Ucayali(U) Satipo(T) Pucallpa(P) Ucayali(U) Satipo(T)
Mediana (A) 5 20 10 30 5 15 85
Pequeña (B) 15 30 15 20 10 15 105
Microempresa (C) 20 40 25 12 3 10 110
Total 40 90 50 62 18 40 300
Fuente: Elaboración propia
Probabilidad condicional
Sean los eventos 𝐴 y 𝐵 ∈ W, entonces la probabilidad de que ocurra el evento 𝐴 teniendo como
condición que el evento 𝐵 ya ocurrió, se denomina probabilidad condicional.
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵) =
𝑃 (𝐵)
A B
𝑃(𝐵)
𝑃(𝐴 ∩ 𝐵)
Primer axioma
0 ≤ 𝑃(𝐴⁄𝐵) ≤ 1
Segundo axioma
𝑃(W⁄𝐵) = 1
Tercer axioma
%
𝑃(∪%!># 𝐴! ⁄𝐵) = „ 𝑃(𝐴! ⁄𝐵 )
!>#
Ejemplo 55
En una muestra aleatoria de 30 alumnos de la universidad A los resultados se clasifican por sexo y por
carrera. El resumen de los resultados se muestra en la siguiente tabla:
Solución
2
𝑃(𝐵 ∩ 𝑀) 30
𝑃(𝐵 «𝑀) = = = 0,1111
𝑃(𝑀) 18
30
Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software (C) 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30
Solución
𝑃(𝐵 ∩ 𝐹) 3
𝑃(𝐵«𝐹) = = = 0,25
𝑃(𝐹) 12
Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software (C) 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30
Estadística Aplicada I 2023 02 135
Solución
𝑃(𝐸 O ∩ 𝑀) 5 + 2 + 2 + 1
𝑃(𝐸 O «𝑀) = = = 0,5556
𝑃(𝑀) 18
Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software (C) 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30
Estadística Aplicada I 2023 02 136
Ejercicios
a. Si la condición del troquel arroja cantidad media de partículas, ¿cuál es la probabilidad que
la calidad de la placa sea regular? Rpta. 0,46297
b. Si se sabe que la calidad de la placa es buena, ¿cuál es la probabilidad de que el troquel arroje
gran cantidad de partícula? Rpta. 0,37838
c. Dado que la condición del troquel es sin partículas, ¿cuál es la probabilidad de que la calidad
de la placa no sea mala? Rpta. 0,75
78. Flama Gas S. A. es una empresa que fabrica y comercializa termas a gas para uso doméstico e
industrial. La empresa cuenta con dos plantas de producción ubicadas en Ate y Callao. En la
siguiente tabla se muestra información acerca de la producción de termas:
79. La mayoría de las estaciones de servicio Súper Gas S.A. venden tres tipos de gasolina: 90 octanos,
95 octanos y 97 octanos. Con frecuencia, alguna de cada está enriquecida con un aditivo. La tabla
siguiente ilustra la cantidad de clientes que prefieren cada tipo.
a. Calcule la probabilidad que haya comprado gasolina con aditivo o no sea de 95 octanos.
Rpta. 0,66667
b. Si el cliente no compró gasolina de 95 octanos, calcule la probabilidad que haya comprado
gasolina de 97 octanos. Rpta. 0,71429
c. Si el cliente no compró gasolina de 90 octanos, calcule la probabilidad que haya comprado
gasolina sin aditivo.
d. Calcule la probabilidad que un cliente compre gasolina sin aditivo. Rpta. 0,66667
e. Calcule la probabilidad que un cliente no compre gasolina de 97 octanos. Rpta. 0,58333
f. Calcule la probabilidad que un cliente compre gasolina de 95 octanos sin aditivos.
Rpta. 0,33333
80. Los equipos usan tres tipos de lubricantes (mineral, sintético y semisintético) que incluyen o no
cierto aditivo. La tabla siguiente ilustra la cantidad de equipos averiados del área de producción
de colchones, distribuidos por marca y tipo de lubricante empleado (con y sin aditivo).
Eventos independientes
Son aquellos eventos en los que la ocurrencia de un evento no influye en la ocurrencia de otro u otros
eventos.
𝑃(𝐴⁄𝐵) = 𝑃(𝐴)
𝑃(𝐵/𝐴) = 𝑃(𝐵)
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵/𝐴)
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵)
𝑃(𝐴 ∩ 𝐵) = 0
Propiedades
Si los eventos 𝐴 y 𝐵 son independientes, entonces también son independientes:
𝐴 y 𝐵O , es decir,
𝑃(𝐴 ∩ 𝐵O ) = 𝑃(𝐴)𝑃(𝐵O )
𝐴O y 𝐵, es decir,
𝑃(𝐴O ∩ 𝐵) = 𝑃(𝐴O )𝑃(𝐵)
𝐴O y 𝐵O ,es decir,
𝑃(𝐴O ∩ 𝐵O ) = 𝑃(𝐴O )𝑃(𝐵O )
Ejemplo 56
El dispositivo de un submarino tiene cuatro válvulas que funcionan de manera independiente, cuyas
probabilidades de fallar son, respectivamente, iguales a 0,08; 0,12; 0,22 y 0,34.
Solución
𝑃(𝑉)
Se cumple que:
= 1 − 0,4168
𝑃(𝑉) = 0,5832
Solución
Definamos los eventos necesarios:
𝑃(𝐴) = 𝑃(𝑉# ∩ 𝑉$O ∩ 𝑉'O ∩ 𝑉&O ) = 0,08 × 0,88 × 0,78 × 0,66 = 0,0362
Estadística Aplicada I 2023 02 140
𝑃(𝐶) = 𝑃(𝑉#O ∩ 𝑉$O ∩ 𝑉' ∩ 𝑉&O ) = 0,92 × 0,88 × 0,22 × 0,66 = 0,1176
𝑃(𝐷) = 𝑃(𝑉#O ∩ 𝑉$O ∩ 𝑉'O ∩ 𝑉& ) = 0,92 × 0,88 × 0,78 × 0,34 = 0,2147
𝑃(𝑆) = 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶 ∪ 𝐷)
𝑃(𝑆) = 0,4253
Estadística Aplicada I 2023 02 141
Ejercicios
81. Para señalar las emergencias que pudieran presentarse en una fábrica se ha instalado dos alarmas
que funcionan independientemente. La probabilidad que la alarma A funcione durante una
emergencia es igual a 0,95 y de que la alarma B funcione es 0,90. Calcule la probabilidad que
durante una emergencia se logre activar sola una alarma. Rpta. 0,14
82. En la fabricación de cierto producto se presenta el defecto tipo 1 con una probabilidad de 0,01 y
el defecto tipo 2 con una probabilidad de 0,05. La ocurrencia de los defectos en los productos es
independiente.
a. Calcule la probabilidad de que un artículo tenga ambos defectos. Rpta. 0,0005
b. Calcule la probabilidad de que un artículo tenga solo el defecto 1. Rpta. 0,0095
c. Calcule la probabilidad de que un artículo contenga solo un defecto. Rpta. 0,0590
d. Calcule la probabilidad de que no tenga ningún defecto. Rpta. 0,9405
84. Un sistema está conformado por cinco componentes que funcionan independientemente. La
probabilidad de que un componente funcione correctamente es 0,70.
a. Calcule la probabilidad de que al menos un componente funcione correctamente.
Rpta. 0,99757
b. Calcule la probabilidad de que al menos un componente no funcione correctamente.
Rpta. 0,83193
85. El análisis de confiabilidad constituye la rama de la ingeniería que se dedica al cálculo de las tasas
de fallas de los sistemas. Un sistema contiene dos componentes, A y B, conectados en serie como
se muestra en el diagrama siguiente:
A B
El sistema funcionará sólo si ambos componentes funcionan. El componente A funciona con una
probabilidad de 0,98 y el componente B funciona con una probabilidad de 0,95. Suponga que A y
B funcionan de manera independiente. Calcule la probabilidad que el sistema funcione.
Rpta. 0,931
87. El número de trabajadores que se necesitan para reparar un cierto equipo es 3. En un día les
corresponde reparar a Andrés, Marcos y Fernando. La probabilidad de que Andrés falle en su
tarea es 0,05; Marcos falle es 0,06; Fernando falle es 0,08. Los tres trabajadores realizan su tarea
de manera independiente. Calcule la probabilidad que al menos uno de ellos falle en su tarea.
Estadística Aplicada I 2023 02 143
W
𝐴# 𝐴$ … 𝐴%
Probabilidad total
𝑃(𝐵) = „ 𝑃(𝐵 ∩ 𝐴! )
!>#
W
𝐴# 𝐴$ … 𝐴%
𝐵
Estadística Aplicada I 2023 02 144
Árbol de probabilidades
𝑃(𝐵⁄𝐴) 𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴)
𝑃(𝐵% ⁄𝐴) 𝑃(𝐴 ∩ 𝐵% )
𝑃(𝐵⁄𝐴% ) 𝑃(𝐴% ∩ 𝐵)
𝑃(𝐴% )
𝑃(𝐵% ⁄𝐴% ) 𝑃(𝐴% ∩ 𝐵% )
Teorema de Bayes
Si los 𝑘 eventos 𝐴# , 𝐴$ , 𝐴' , ⋯ , 𝐴% constituyen una partición del espacio muestral Ω y 𝑃(𝐴! ) ≠ 0 para
todo 𝑖 = 1, 2, 3, … , 𝑘; entonces para un evento 𝐵 cualquier contenido Ω tal que 𝑃(𝐵) ≠ 0.
𝑃(𝐴! ∩ 𝐵)
𝑃(𝐴! «𝐵) =
𝑃(𝐵)
𝑃(𝐴! )𝑃(𝐵⁄𝐴! )
𝑃(𝐴! ⁄𝐵) = %
∑!># 𝑃(𝐴! )𝑃(𝐵/𝐴! )
Ejemplo 57
Una empresa de manufactura recibe embarques de una determinada pieza de dos proveedores.
Actualmente el 65% de las piezas adquiridas por la empresa provienen del proveedor 1 y 35% restante
del proveedor 2.
La calidad de las piezas adquiridas varía con la fuente de suministro. Con base a los datos históricos se
sabe que la probabilidad que una pieza del proveedor 1 sea defectuosa es 0,02 y la probabilidad de
que una pieza del proveedor 2 sea defectuosa es 0,05.
Si seleccionamos al azar una de las piezas adquiridas por la empresa, calcule la probabilidad de que
sea defectuosa.
Solución
Se definen los siguientes eventos.
Ejemplo 58
La empresa de tejidos A se dedica a la fabricación de tejidos de lana de primera calidad. Para la próxima
temporada de invierno está elaborando un producto exclusivo que se espera sea todo un éxito.
Solución
𝐴: = el artículo es producido por la máquina tipo A, luego se tiene que 𝑃(𝐴) = 0,40
𝐵: = el artículo es producido por la máquina tipo B, luego se tiene que 𝑃(𝐵) = 0,35
𝐶: = el artículo es producido por la máquina tipo C, luego se tiene que 𝑃(𝐶) = 0,25
𝐷: = el artículo es defectuoso.
𝐷O : = el artículo no es defectuoso.
Estadística Aplicada I 2023 02 146
Solución
𝑃(𝐴 ∩ 𝐷O )
𝑃(𝐵O ∪ 𝐶 O ⁄𝐷O ) = 𝑃(𝐴⁄𝐷O ) =
𝑃(𝐷O )
0,40 × 0,97
= = 0,3961
1 − 0,0205
Ejemplo 59
Para la empresa tecnológica A, se estima que la probabilidad de hacer un servicio en Lima es de 0,60 y
en el interior del país es de 0,40.
Solución
Se define los eventos necesarios:
Estadística Aplicada I 2023 02 147
Solución
b. Si el servicio contratado no fue de help desk, calcule la probabilidad de que haya sido para Lima.
Solución
Ejemplo 60
Los clientes acostumbran a evaluar en forma preliminar el diseño de sus productos. En el pasado, 95%
de sus productos de gran éxito recibieron críticas favorables, 60% de los productos con éxito moderado
recibieron críticas favorables y 10% de los productos sin mucho éxito recibieron críticas favorables.
Además, 40% de los productos han sido de gran éxito, 35% han sido de éxito moderado y 25% han sido
productos sin mucho éxito.
Solución
Estadística Aplicada I 2023 02 148
Solución
b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño de
gran éxito?
Solución
c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto
de gran éxito?
Solución
Ejercicios
88. Se evalua la calidad del agua en un pozo abandonado en una industria. El 10% de los pozos de
agua en la región están contaminados debido a la actividad industrial pasada. Se perfora un nuevo
pozo y se evalúa la calidad del agua.
- Si el agua está contaminada, las pruebas de laboratorio detectan contaminantes con una
probabilidad del 97%.
- Si el agua no está contaminada, las pruebas de laboratorio dicen que detectan contaminantes
con una probabilidad del 4%.
Si la prueba en el nuevo pozo arroja que el agua está contaminada, calcule la probabilidad de que
el pozo realmente esté contaminado.
89. Tres máquinas, A, B y C producen el 45%, 30% y 25% respectivamente del total de las piezas
producidas en una fábrica. Los porcentajes de producción de defectuosos de estas máquinas son
del 3%, 4% y 5% respectivamente.
90. Una compañía de desarrollo urbano está considerando la posibilidad de construir un centro
comercial y una autopista en un sector de la ciudad.
Si el consejo municipal aprueba esta autopista, hay una posibilidad de 0,90 que la compañía
construya el centro comercial, en tanto que, si la autopista no es aprobada, la probabilidad que
construya el centro comercial es del 0,20. Basándose en la información disponible el presidente
de la compañía estima que hay una probabilidad de 0,60 de que apruebe la autopista.
91. Dos empresas A y B consideran la posibilidad de competir en una licitación para la construcción
de una carretera, la cual puede ser concedida o no dependiendo del monto de la propuesta. La
empresa A hace una propuesta y la probabilidad de que gane la licitación es 0,75 siempre y
cuando B no se haya presentado. La probabilidad de que B se presente a la licitación es 0,80 y, en
ese caso, la probabilidad de que la empresa A gane la licitación es sólo de 1/3. ¿Cuál es la
probabilidad de que A gane la licitación? Rpta. 0,4167
92. Una empresa de manufactura utiliza tres líneas de producción diferentes, A1, A2 y A3, para
fabricar un componente en particular. De lo fabricado por la línea A1, 5% necesita volver a
trabajarse para corregir un defecto, en tanto que 8% de los componentes de A2 necesitan volver
a trabajarse para corregir un defecto y 10% de los de A3 necesitan volver a trabajarse para
corregir un defecto. Se sabe que el 50% de todos los componentes son producidos por la línea
A1, en tanto que 30% son producidos por la línea A2 y el 20% vienen de la línea A3. Si se extrae
un componente al azar, calcule la probabilidad de que este componente necesite volver a
trabajarse para corregirle un defecto. Rpta. 0,069
Estadística Aplicada I 2023 02 150
93. Suponga que tres ingenieros industriales (Luis, Juan y Pedro) de diferentes áreas de la empresa A
están cerca de jubilarse, dichos ingenieros solicitan sus pedidos al proveedor de servicios. Se sabe
que Luis solicita el 50% de los pedidos, Juan el 20% y Peter el 30%. Se conoce que Luis comete
cinco errores por cada 100 pedidos; Juan se equivoca el 9% de las veces, y Peter la mitad de las
veces que Juan.
a. Calcule la probabilidad de que un pedido sea solicitado con error. Rpta. 0,0565
b. Si un pedido ha sido solicitado con error, calcule la probabilidad de que el ingeniero Luis haya
solicitado el pedido. Rpta. 0,44248
94. Dercosa es una próspera empresa que lidera el mercado de reparación de autos en el Cono Norte.
Del total de servicios que brindaron el año pasado, aproximadamente el 40% fueron del área
mecánica, el 35% del área mantenimiento y el resto de otras áreas. Además, se sabe que el costo
de mantenimiento de un servicio es mayor a mil soles, en el 1%, 2% y 5% de las áreas mecánicas,
mantenimiento y resto de áreas, respectivamente. Dercosa implementará una promoción para
los servicios de mantenimiento si más del 25% de los servicios que tienen un costo mayor de mil
soles son del área de mantenimiento.
Estadística Aplicada I 2023 02 151
Al término de la unidad, el estudiante aplica los conceptos de distribuciones muestrales para la toma
de decisiones y estima un tamaño de muestra óptimo para dar respuesta a un problema en el ámbito
de su especialidad.
Temario
• Definición de variable aleatoria
• Función de probabilidad de una variable aleatoria discreta
• Distribución binomial y de Poisson
• Función de densidad de una variable aleatoria continua
• Distribución uniforme, exponencial y normal
• Propiedad reproductiva de la normal
• Distribución muestral de la media
• Teorema central del límite
• Introducción al muestreo
• Tamaño de muestra
Bibliografía
Estadística Aplicada I 2023 02 152
Variable aleatoria
Se denomina variable aleatoria a toda función que asocia cada elemento de un espacio muestral Ω a
un número real.
La variable aleatoria es una función que atribuye a cada evento un número que no es aleatorio o
imprevisible, sino fijo y predeterminado. Lo que es aleatorio es el resultado del experimento sobre
cuyo espacio muestral se define la variable aleatoria.
Ejemplo 61
Por ejemplo, para lanzar una moneda una vez, el resultado experimental puede ser cara o sello,
ninguno de los cuales tiene un valor numérico natural. Sin embargo, aun así, podemos expresar los
resultados en función de una variable aleatoria, una posibilidad es asignar (𝑋 = 1) si el resultado del
experimento es cara y (𝑋 = 0) si el resultado experimental es sello.
Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito
numerable.
Una variable aleatoria es continua si el conjunto de valores que puede tomar es infinito no numerable.
Estadística Aplicada I 2023 02 153
𝑃(𝑋 = 𝑥! )
Ejemplo 62
Solución
La variable aleatoria 𝑋 es <número de buses que entran al taller para algún servicio> y su rango es
𝑅Q = {0, 1, 2, 3, 4, 5}
La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que asigna a
todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:
Condición 1
𝑓(𝑥) ≥ 0
Condición 2
„ 𝑓(𝑥) = 1
R+
𝑓(𝑥) = 𝑃(𝑋 = 𝑥)
Ejemplo 63
La cantidad de almuerzos demandados al día en el comedor universitario se modela con una variable
aleatoria 𝑋 que tiene la siguiente distribución de probabilidad.
𝒙 10 15 17 18 20 25
𝒇(𝒙) 𝑎 0,12 0,35 2𝑎 0,14 0,09
Solución
Solución
Solución
Solución
Solución
f. Si se sabe que en este día la demanda será a lo más de 18 platos, ¿Cuál es la probabilidad que se
demanden más de 15 platos?
Solución
Ejemplo 64
Calcule 𝑎 para que la siguiente función sea una función de probabilidad y grafique 𝑓(𝑥).
𝑓(𝑥) = 𝑎𝑥 𝑥 = 1, 2, 3, 4, 5
Solución
„ 𝑓(𝑥) = 1𝑎 + 2𝑎 + 3𝑎 + 4𝑎 + 5𝑎 = 1
5>#
De donde
𝑎 = 1/15
El valor esperado o esperanza matemática de una variable aleatoria 𝑋 o media de una distribución de
probabilidad de 𝑋 se denota 𝐸(𝑋).
<
𝜇Q = 𝐸(𝑋) = „ 𝑥! 𝑓(𝑥! )
!>#
Se interpreta como el valor que se espera obtener en promedio al experimentar una y otra vez.
Sea 𝐺(𝑋) una función de la variable aleatoria discreta 𝑋. El valor esperado de 𝐺(𝑋) es
<
• Si 𝑋# , 𝑋$ , 𝑋' , … , 𝑋< son 𝑛 variables aleatorias independientes y 𝑎# , 𝑎$ , 𝑎' , … , 𝑎< son 𝑛 constantes,
entonces:
< <
𝐸 ±„ 𝑎! 𝑋! ² = „ 𝑎! 𝐸(𝑋! )
!># !>#
• Si 𝑋# , 𝑋$ , 𝑋' , … , 𝑋< son 𝑛 variables aleatorias independientes y 𝑎# , 𝑎$ , 𝑎' , … , 𝑎< son 𝑛 constantes,
entonces:
< <
𝑉 ±„ 𝑎! 𝑋! ² = „ 𝑎!$ 𝑉(𝑋! )
!># !>#
Estadística Aplicada I 2023 02 157
𝜎Q = €𝑉(𝑋)
Coeficiente de variación
Una de las medidas de variabilidad que podríamos usar es el coeficiente de variación, tal como lo
usamos en la unidad de medidas de resumen. Esta vez definiremos el coeficiente de variación 𝐶𝑉 de
la siguiente manera:
𝜎Q 𝜎Q
𝐶𝑉 = × 100% = × 100%
𝐸(𝑋) 𝜇Q
Ejemplo 65
La cantidad de almuerzos demandados al día en el comedor universitario se modela con una variable
aleatoria 𝑋 que tiene la siguiente distribución de probabilidad.
𝒙 10 15 17 18 20 25
𝒇(𝒙) 0,10 0,12 0,35 0,20 0,14 0,09
El costo de cada almuerzo es de seis soles y las vende a diez soles. Todo almuerzo no vendido en el día
se desecha. Calcule el valor esperado y la variabilidad relativa de la utilidad diaria.
Solución
Calculemos el valor esperado de la utilidad diaria.
𝐸(𝑋) = „ 𝑥! 𝑓(𝑥! )
!>#
𝑈(𝑋) = 4𝑋
Para obtener la variabilidad relativa de la utilidad diaria debemos calcular el coeficiente de variación,
y para ello, la media y desviación estándar de 𝑋.
$
𝑉(𝑋) = 𝐸(𝑋 $ ) − T𝐸(𝑋)U
!>#
𝐸(𝑋 $ ) = 10$ × 0,10 + 15$ × 0,12 + 17$ × 0,35 + ⋯ + 25$ × 0,09 = 315,2
$
𝑉(𝑋) = 𝐸(𝑋 $ ) − T𝐸(𝑋)U
$
𝜎T(Q) = 𝑉T𝑈(𝑋)U
= 𝑉(4𝑋)
= 4$ 𝑉(𝑋)
= 4$ × 12,44 = 199,04
𝜎T = €199,04 = 14,1082
𝜎T(Q)
𝐶𝑉T(Q) = × 100%
𝜇T(Q)
14,1082
𝐶𝑉T(Q) = × 100% = 20,39%
69,2
Estadística Aplicada I 2023 02 159
Ejemplo 66
𝑥
𝑓 (𝑥 ) = 𝑥 = 0, 1, 2, 3, 4
10
a. Calcule 𝐸(3𝑋 + 8)
Solución
0 1 2 3 4
𝐸(𝑋) = 0 × +1× +2× +3× +4× =3
10 10 10 10 10
𝐸(3𝑋 + 8) = 3𝐸(𝑋) + 8 = 3 × 3 + 8 = 17
Solución
!>#
0 1 2 3 4
𝐸(𝑋 $ ) = 0$ × + 1$ × + 2$ × + 3$ × + 4$ × = 10
10 10 10 10 10
Se sabe que:
𝑉(𝑋) = 10 − 3$ = 1
𝑉(𝑎𝑋) = 𝑎$ 𝑉(𝑋)
𝑉(2𝑋 − 7) = 2$ 𝑉(𝑋) = 4 × 1 = 4
Estadística Aplicada I 2023 02 160
Ejercicios
95. En una tienda de venta de artefactos electrónicos, la demanda mensual de impresoras es una
variable aleatoria con la siguiente función de probabilidad.
a. Determine el valor de 𝑘.
b. Calcule la probabilidad de que la demanda mensual sea de 80 impresoras.
c. Calcule la probabilidad de que la demanda mensual sea mayor a 90 impresoras.
d. Si se sabe la demanda este mes será mayor a 90 impresoras, ¿cuál es la probabilidad que se
demanden como máximo 130 impresoras?
e. Calcule la media y desviación estándar de la demanda mensual.
f. Cada impresora cuesta 85 dólares y se vende a 100 dólares, calcule la media y desviación
estándar de la ganancia mensual.
$
𝑓(𝑥) = ´𝑘 𝑥 𝑥 = 1, 2, 3, 4, 6
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Calcule 𝑘 para que la función sea una función de probabilidad. Rpta. 0,25
b. 𝑃(2 ≤ 𝑋 < 4) Rpta. 0,3125
c. 𝑃(𝑋 ≤ 4/𝑋 > 1)
97. La demanda diaria de una herramienta en el almacén es una variable aleatoria 𝑋 cuya distribución
de probabilidades está dada por la tabla que sigue:
𝒙 1 2 3 4 5
𝒇(𝒙) 𝑎 4 / 16 𝑏 𝑐 1/16
98. Una empresa produce artículos perecibles. A continuación, se presenta una tabla con los datos
históricos de las demandas semanales obtenidas en las últimas 50 semanas y el número de
semanas de ocurrencia.
99. Considere un grupo de cinco donantes de sangre, de los cuales solo dos tienen sangre ORh+. Se
obtiene cinco muestras de sangre, una de cada individuo y en forma aleatoria son analizadas una
por una, hasta identificar una muestra ORh+. Si se quiere calcular la probabilidad de encontrar
una muestra de dicho tipo de sangre luego de una cantidad de pruebas.
Distribución binomial
El experimento consiste en una serie de 𝑛 intentos, pruebas o ensayos, donde 𝑛 se fija antes de realizar
el experimento.
Las pruebas son idénticas y cada uno de ellos puede resultar en uno de dos posibles resultados que
denotan éxito o fracaso.
Las pruebas son independientes entre sí por lo que el resultado de un intento en particular no influye
en el resultado de cualquier otro.
El rango de la variable 𝑋 es 0, 1, 2, ⋯ , 𝑛.
Se dice que la variable aleatoria 𝑋 sigue una distribución binomial con parámetros 𝑛 y 𝑝 y se denota:
𝑋 ~ 𝐵 (𝑛, 𝑝)
Ejemplo
Se tienen cinco urnas que contienen siete bolas cada una, tres bolas negras y cuatro bolas rojas. Se
saca una bola de cada urna y se cuenta el número de bolas rojas obtenidas en las cinco repeticiones.
A este proceso se le denomina proceso binomial, pues solo hay dos posibilidades (bola roja o negra),
las extracciones son independientes y la probabilidad de obtener un éxito (bola roja) es constante.
Estadística Aplicada I 2023 02 163
Características
Para valores de 𝑛 suficientemente grandes (𝑛 > 50), y sólo tomando en cuenta los valores relevantes
de probabilidad, la distribución es prácticamente simétrica.
Media
𝜇Q = 𝐸(𝑋) = 𝑛𝑝
Varianza
𝜎5$ = 𝑛𝑝(1 − 𝑝)
Estadística Aplicada I 2023 02 164
Ejemplo 67
Se sabe que una máquina que está funcionando normalmente, el 10% de las piezas producidas resultan
defectuosas. Supongamos que seleccionamos al azar tres piezas producidas con la máquina y que
estamos interesados en el número de piezas defectuosas encontradas.
Solución
Solución
Dado el experimento descrito, definimos la variable aleatoria como:
Verificamos las cuatro características del experimento para que la variable 𝑋 siga una distribución
binomial:
• El experimento se puede describir como una secuencia de tres intentos idénticos, un intento
por cada una de las tres piezas seleccionadas.
• Para cada uno de los intentos son posibles dos resultados: pieza defectuosa y pieza no
defectuosa. En concordancia a cómo hemos definido la variable aleatoria, encontrar una pieza
defectuosa será éxito y una no defectuosa será fracaso.
• La probabilidad de pieza defectuosa es 0,10 y la de pieza no defectuosa es 0,90 y se supone
que se mantiene constante para todas las piezas.
• La condición de una pieza defectuosa es independiente de la condición de otras piezas.
𝑋 ~ 𝐵 (𝑛 = 3; 𝑝 = 0,10)
𝒙 𝒇(𝒙) = 𝑷(𝑿 = 𝒙)
0 0,729
1 0,243
2 0,027
3 0,001
Estadística Aplicada I 2023 02 165
0.5
0.4
0.3 0.243
0.2
0.1 0.027
0.001
0
0 1 2 3 4
Número de piezas defectuosas
Solución
Ejercicios
102. Una compañía encuestadora va a entrevistar a 50 personas en un área rural. Se sabe que la
probabilidad de que una persona en el área rural esté indocumentada es de 0,10; calcule la
probabilidad de que se entreviste a cinco personas indocumentadas.
103. Una empresa fabrica diariamente una cantidad invariable de productos. La probabilidad de que
un producto resulte defectuoso es constante de tal manera que la cantidad de productos
defectuosos fabricados diariamente tiene un promedio de 3 y una varianza de 2,4. Si los
productos se fabrican independientemente uno de otro, calcule la probabilidad de que en un día
en particular se fabrique más de tres productos defectuosos. Rpta. 0,3518
104. El ingeniero de control de calidad de la fábrica de láminas de aluminio afirma que, conforme a los
registros históricos, de cada 10 láminas que se inspecciona, en promedio 1,2 láminas presentan
fallas de longitud y de arqueo. Considere que las fallas se presentan de forma independiente.
Justifique qué distribución tiene la variable <cantidad de láminas de aluminio que presentan fallas
de longitud y de arqueo en un total de 10 láminas inspeccionadas>. Indique en forma explícita el
valor de los parámetros de la distribución identificada. Rpta. B(10;0,12)
105. El ingeniero internista de Transmin sabe que del total de operarios que ingresan a las galerías
mineras el 20% de estos presentan problemas de adaptación. Para rediseñar la selección de los
operarios desea obtener algunas probabilidades:
106. Un aparato de cocina tiene 16 partes funcionales, cada una de las cuales tiene una probabilidad
de 0,99 de funcionar correctamente hasta el fin del período de garantía del producto. Las partes
funcionan de manera independiente, pero si dos o más no funcionan, el aparato tampoco. ¿Cuál
es la probabilidad de que uno de estos aparatos seleccionado al azar funcione bien durante todo
el periodo de garantía?
107. Una aerolínea tiene la política de vender hasta 22 boletos para viajar en un avión que cuenta con
20 asientos para pasajeros. Estudios anteriores revelaron que solo el 90% de los pasajeros que se
registran en un determinado vuelo, se presentan al aeropuerto para viajar en ese vuelo. Calcular
la probabilidad de que no haya suficientes asientos disponibles para los pasajeros, en un vuelo en
el que se vendieron 22 boletos.
Estadística Aplicada I 2023 02 168
Distribución Poisson
Se usa en situaciones en los que el experimento da lugar a valores numéricos discretos de una variable
aleatoria que ocurren durante un intervalo dado o una región específica.
El intervalo puede ser cualquier lapso como minutos, días, semanas, etc. y la región específica puede
ser una línea, un área o quizá una pieza de material, una carretera, etc.
El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina
proceso de Poisson y posee las siguientes propiedades:
Se dice que la variable aleatoria 𝑋 sigue una distribución de Poisson con parámetro l y se denota:
𝑋~𝑃(l)
El rango de la variable 𝑋 es 𝑅Q = 0, 1, 2, ⋯
𝑒 UV 𝜆5
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, …
𝑥!
donde:
Características
Siempre es una distribución sesgada a la derecha. A medida que l aumenta y se toma en cuenta solo
los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.
Media
µQ = 𝐸(𝑋) = l
Varianza
𝜎Q$ = 𝜆
Ejemplo 68
El ingeniero encargado del área de producción de Desternit, se sabe que por cada cinco horas de
trabajo continuo se obtiene en promedio 1,5 láminas con defectos de arqueo.
a. Calcule la probabilidad que en una jornada de cinco horas de trabajo se hayan producido dos
láminas con defectos de arqueo.
Solución
𝑋 ~ 𝑃(𝜆 = 1,5)
Rango: 𝑅Q = 0, 1, 2, 3, …
𝑒 U#,E × 1,5$
𝑃(𝑋 = 2) = = 0,2510
2!
b. Calcule la probabilidad de que en una jornada de ocho horas de trabajo se hayan producido más
de una lámina con defectos de arqueo.
Solución
Por cada cinco horas de trabajo continuo λ = 1,5, aplicando regla de tres simple, diremos que por
cada ocho horas de trabajo continuo.
1,5 × 8
𝜆= = 2,4
5
Ejercicios
109. El número de personas que llega a un restaurante puede modelarse por una variable Poisson con
un promedio de 0,8 personas por minuto.
110. La única cajera de una agencia bancaria sabe por experiencia que entre las cinco y las seis de la
tarde (hora en que cierra el banco) llegan a su agencia en forma aleatoria un promedio dos
personas por minuto. La cajera está obligada a atender a todas las personas que llegan hasta las
seis de la tarde. Tres minutos antes de las seis de la tarde no hay nadie en la cola y en ese
momento ella recibe una llamada telefónica que la obliga a ausentarse de su puesto durante cinco
minutos. Calcule la probabilidad de que al volver a su puesto hayan más de tres personas en la
cola. Rpta. 0,8488
a. Calcule la probabilidad de que en un día ocurra exactamente dos accidentes. Rpta. 0,14379
b. Calcule la probabilidad de que en un día ocurra menos de un accidente. Rpta. 0,44933
c. Calcule la probabilidad de que en un día ocurra al menos dos accidentes. Rpta. 0,19121
d. La Municipalidad inspeccionará 18 horas de tránsito vehicular continuo y si la probabilidad de
que se haya presentado dos accidentes de tránsito supera el 8% se asignará un policía de
tránsito en horas punta. ¿La Municipalidad de Lima asignará un policía de tránsito?
Rpta. 0,09879
112. El número de buques que llegan a un puerto sigue una distribución de Poisson con una media de
tres buques por día. Cada buque se demora en el puerto por los menos tres días y el puerto tiene
capacidad para ocho buques. Si en este momento, no hay ningún buque atracado en el puerto,
calcular la probabilidad de que el puerto se llene en los siguientes dos días.
113. El número de torres de alta tensión que se caen por año en una ciudad puede modelarse por una
variable aleatoria de Poisson, con una desviación estándar de 1,5 torres por año. El costo de
reparar una torre caída es 200 000 dólares y la compañía destina como máximo 600 000 dólares
anuales para reparar torres. Calcule el gasto anual esperado en la reparación de torres.
Estadística Aplicada I 2023 02 171
Se denomina función de densidad de probabilidad 𝑓(𝑥) de una variable aleatoria continua a la función
que satisface:
Condición 1
Condición 2
AW
º 𝑓(𝑥)𝑑𝑥 = 1
UW
Se cumple que:
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = º 𝑓(𝑥)𝑑𝑥
Y
La función de distribución acumulada de una variable aleatoria continua 𝑋 con función densidad 𝑓(𝑥)
se define por:
Se cumple:
El valor esperado o esperanza matemática de una variable aleatoria 𝑋 o media de una distribución de
probabilidad de 𝑋 se denota 𝐸(𝑋).
Estadística Aplicada I 2023 02 172
AW
𝜇Q = 𝐸(𝑋) = º 𝑥 𝑓(𝑥) 𝑑𝑥
UW
Sea 𝐺(𝑋) una función de la variable aleatoria continua 𝑋. El valor esperado de 𝐺(𝑋):
A∞
𝜇S(Q) = 𝐸(𝐺(𝑋)) = º 𝐺(𝑥)𝑓(𝑥) 𝑑𝑥
U∞
• Si 𝑋# , 𝑋$ , 𝑋' , … , 𝑋< son 𝑛 variables aleatorias independientes y 𝑎# , 𝑎$ , 𝑎' , … , 𝑎< son 𝑛 constantes,
entonces:
< <
𝐸 ±„ 𝑎! 𝑋! ² = „ 𝑎! 𝐸(𝑋! )
!># !>#
AW
$
𝜎S(Q) =º (𝐺(𝑋) − 𝜇S(Q) )$ 𝑓(𝑥) 𝑑𝑥
UW
Propiedades de la varianza
• Si 𝑋# , 𝑋$ , 𝑋' , … , 𝑋< son 𝑛 variables aleatorias independientes y 𝑎# , 𝑎$ , 𝑎' , … , 𝑎< son 𝑛 constantes,
entonces:
< <
𝑉 ±„ 𝑎! 𝑋! ² = „ 𝑎!$ 𝑉(𝑋! )
!># !>#
𝜎Q = €𝑉(𝑋)
Estadística Aplicada I 2023 02 174
Distribución exponencial
En variables que representan los tiempos de vida útil, tiempos de sobrevivencia, en tiempos de
ocurrencia en procesos de Poisson se suele utilizar la distribución exponencial.
La variable aleatoria 𝑋 tiene una distribución exponencial con parámetro 𝛽 (𝛽 > 0) si su función de
densidad de probabilidad es:
1 U[5
𝑓(𝑥) = ¿𝛽 𝑒
𝑥≥0
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Se dice que 𝑋 sigue una distribución exponencial con parámetro 𝛽 y se denota 𝑋~𝐸𝑥𝑝(𝛽)
𝑓(𝑥) P ( x < x 0 ) = 1 - e - x0 / b
X
x0
0 𝑥<0
𝐹(𝑥) = À U
5
1− 𝑒 [ 𝑥≥0
𝛽>0
Características
Media
𝜇5 = 𝐸(𝑋) = 𝛽
Varianza
𝜎Q$ = 𝛽$
Estadística Aplicada I 2023 02 175
La distribución exponencial posee la propiedad de “no tener memoria”, en general, dado cualquier
valor 𝑎, 𝑏 > 0, se cumple que:
Vamos a establecer la relación que existe entre una variable Poisson y una variable exponencial.
𝑋~𝑃(𝜆)
Dicha variable 𝑇 se modela con una distribución exponencial con media 𝛽, es decir:
𝑇~𝐸𝑥𝑝(𝛽)
Se cumple que la relación entre los parámetros de las distribuciones Poisson y exponencial es:
1
𝜆=
𝛽
Ejemplo 69
Definamos una variable aleatoria como:
𝑋 ≔ número de clientes que llegan a una farmacia por minuto con media 𝜆 = 2
𝑋~𝑃(𝜆 = 2)
Dicha variable 𝑇 se modela con una distribución exponencial con media 𝛽. Se cumple que la relación
entre los parámetros es:
1
𝜆=2=
𝛽
Por lo tanto, podemos conocer el valor del parámetro 𝛽 de la distribución exponencial, a partir del
valor del parámetro 𝜆 de la distribución Poisson.
1
𝑇~𝐸𝑥𝑝 {𝛽 = |
2
0 𝑇
Con ello, podemos calcular la probabilidad de que el primer cliente llegue antes de los 45 segundos, es
decir:
Para calcular esta probabilildad podemos usar diversos métodos, como por ejemplo, usar la función
,
U
de distribución acumulada 𝐹(𝑥) = 1 − 𝑒 - .
0,GE
U #
𝑃(𝑇 < 0,75) = 1 − 𝑒 $ = 0,7769
Vamos a establecer la relación que existe entre una variable Poisson y una variable exponencial.
𝑋~𝑃(𝜆)
Dicha variable 𝑇 se modela con una distribución exponencial con media 𝛽, es decir:
𝑇~𝐸𝑥𝑝(𝛽)
1
𝜆=
𝛽
Ejemplo 70
𝑋~𝑃(𝜆 = 2)
Dicha variable 𝑇 se modela con una distribución exponencial con media 𝛽. Se cumple que la relación
entre los parámetros es:
1
𝜆=2=
𝛽
Por lo tanto, podemos conocer el valor del parámetro 𝛽 de la distribución exponencial, a partir del
valor del parámetro 𝜆 de la distribución Poisson.
1
𝑇~𝐸𝑥𝑝 {𝛽 = |
2
0 𝑇# 𝑇$
Con ello, podemos calcular la probabilidad de que el tiempo que transcurre entre la llegada de un
cliente y el siguiente sea mayor a 15 segundos, es decir:
Para calcular esta probabilildad podemos usar diversos métodos, como por ejemplo, usar la función
,
U
de distribución acumulada 𝐹(𝑥) = 1 − 𝑒 - .
0,$E 0,$E
U # U #
𝑃(𝑇 > 0,25) = 1 − Â1 − 𝑒 $ Ã = 𝑒 $ = 0,6065
Ejemplo 71
El ingeniero de planta de una línea aérea sabe que la duración promedio de los neumáticos de las
avionetas es de 1,5 años. Si la duración de los neumáticos tiene una distribución exponencial.
Estadística Aplicada I 2023 02 178
Solución
Definamos la variable aleatoria 𝑋: duración de neumáticos de las avionetas.
𝑋~𝐸𝑥𝑝(𝛽 = 1,5)
#,J
U
𝑃(𝑋 ≤ 1,6) = 𝐹(1,6) = 1 − 𝑒 #,E = 0,6558
Solución
$
U
= 1 − 𝐹(2) = 1 − {1 − 𝑒 #,E | = 0,2636
Solución
Interpretación
Representación
Cálculo
El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración lo representamos
por 𝑡3!< .
\
U ./0
= 1 − 𝐹(𝑡3!< ) = 1 − {1 − 𝑒 #,E |
\
U ./0
=𝑒 #,E = 0,25
1
U ./0
Tomamos logaritmo neperiano a ambos lados de la ecuación 𝑒 2,4 = 0,25
Estadística Aplicada I 2023 02 179
\
U ./0
𝑙𝑛 {𝑒 #,E | = ln (0,25)
𝑡3!<
− = −1,3863
1,5
Análisis y argumentación
El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración es mayor a 1,8 años
(2,08 > 1,8). Por tanto, no se va a cambiar de proveedor.
Estadística Aplicada I 2023 02 180
Ejercicios
114. El tiempo, en minutos, que demora una llamada telefónica se modela con una variable
exponencial con una media de 5 minutos. Calcular la probabilidad de que la duración de una
llamada sea mayor a seis minutos.
115. En un proyecto de desarrollo de software, se evalua el tiempo entre fallas de un sistema que ha
sido recientemente implementado. Se observa que el tiempo entre fallas sigue una distribución
exponencial con una media de 8 horas. Calcule la probabilidad de que el tiempo entre una falla y
otra esté entre 7 y 9 horas.
116. El número de mensajes de WhatsApp que le llegan a una persona se modela con una variable
Poisson con una media de tres mensajes por minuto. Calcule la probabilidad de que el tiempo
que transcurre entre un mensaje y el siguiente sea mayor a 20 segundos.
117. El tiempo de vida de un tipo de marcapasos puede modelarse por una variable con distribución
exponencial con media de 12 años.
a. Calcule la probabilidad de que un marcapasos de este tipo tenga una vida útil mayor a 13 años.
b. Calcule el tiempo mínimo para estar en el 25% de los marcapasos con mayor tiempo de vida.
c. Si el marcapasos lleva funcionando correctamente diez años en un paciente, calcule la
probabilidad de que su vida útil sea mayor a 15 años.
118. El tiempo que toma ajustar las máquinas que están produciendo láminas de aluminio con
defectos de arqueo, tiene una distribución exponencial con media de dos horas.
a. Calcule la probabilidad de que el tiempo de ajuste de una máquina que produce láminas de
aluminio con fallas de arqueo supere las 2,5 horas. Rpta. 0,28650
b. Determine el máximo tiempo de ajuste de una máquina que produce láminas de aluminio con
fallas de arqueo para que esté considerado dentro del 20% de los ajustes más rápidos.
Rpta. 0,4463
119. El tiempo de duración, en meses, de un tipo de resistencia eléctrica del modelo XFF se modela
con una variable aleatoria continua con la siguiente función de densidad de probabilidad:
U0,E5
𝑓(𝑥) = ´0,5𝑒 𝑥≥0
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Calcule la probabilidad de que una resistencia dure más de cuatro meses. Rpta. 0,13534
b. Si una resistencia eléctrica ya duró cuatro meses, calcule la probabilidad que dure como
máximo un mes más. Rpta. 0,39347
c. Las normas técnicas indican que el percentil 75 del tiempo de duración de la resistencia debe
ser mayor a los tres meses, ¿la resistencia eléctrica del modelo XFF cumple con las normas
técnicas? Rpta. No; 2,77
d. Si se prueban diez resistencias eléctricas, ¿cuál es la probabilidad de que ninguna dure más de
cuatro meses. Rpta. 0,23359
120. La empresa Sysmat ofrece equipos de aire acondicionado para galerías mineras al jefe de área de
logística de Trasmin. El representante de ventas de Sysmat indica que el tiempo de vida de los
equipos de aire acondicionado sigue una distribución exponencial con tiempo promedio de dos
años.
Estadística Aplicada I 2023 02 181
a. Sysmat indica que si un equipo se malogra antes de 1,8 años será repuesto por uno nuevo. Si
la probabilidad de que no se llegue a usar la garantía ofrecida por Sysmat es mayor al 50%;
Trasmin evaluará comprar los equipos de Sysmat. Rpta. No; 0,41
b. Con el fin de comprar definitivamente los equipos de Sysmat. El jefe de logística plantea la
siguiente situación: Si selecciona al azar un equipo de aire acondicionado que ya duró 2 años,
la probabilidad que dure como máximo medio año más es mayor a 0,2; se compran los equipos
a Sysmat. ¿Cuál será la decisión de Trasmin? Rpta. 0,22120
c. ¿Cuál sería el tiempo de vida máximo que tendría el 50% de los equipos de aire acondicionado
que compraría Trasmin? Rpta. 1,386
Estadística Aplicada I 2023 02 182
Distribución normal
Función de densidad
1 # 5U^ 5
𝑓(𝑥) = 𝑒 U$ ]_ ` 𝑥∈ℝ
𝜎√2𝜋
Se dice que la variable aleatoria 𝑋 sigue una distribución normal con parámetros µ y s2 y se denota:
𝑋~𝑁(µ, s$ )
Características
Estandarización
𝑋−𝜇
𝑍=
𝜎
Para calcular una probabilidad de una variable normal existen varias posibilidades, entre ellas puede
usar:
Para calcular una probabilidad usando la tabla normal estándar debemos estandarizar la variable y
obtenemos un valor de Z.
𝑃(𝑋 ≤ 𝑎)
𝑋−𝜇 𝑎−𝜇
= 𝑃{ ≤ |
𝜎 𝜎
𝑎−𝜇
= 𝑃 É𝑍 ≤ Ê
𝜎
YU^
El valor de _
se redondea a dos decimales, usando redondeo simple.
• En la primera columna de este valor buscamos el valor de las unidades y las décimas.
• En la fila correspondiente al valor de la columna buscamos el valor de las centésimas.
• Su intersección nos dará la probabilidad.
La tabla normal estándar siempre nos dará el valor del área hacia la izquierda de Z.
𝑎−𝜇
𝑃 𝑍≤
𝜎
𝑎−𝜇
-4 -3 -2 -1 00 1 2 3 4
𝜎
Cálculo de una probabilidad de una variable normal usando Excel
Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,00003 0,00003 0,00007 0,00004 0,00004 0,00004 0,00004 0,00004 0,00005 0,00005
-3,8 0,00005 0,00005 0,00005 0,00006 0,00006 0,00006 0,00006 0,00007 0,00005 0,00007
-3,7 0,00008 0,00008 0,00008 0,00009 0,00009 0,00009 0,00010 0,00010 0,00010 0,00011
-3,6 0,00011 0,00012 0,00012 0,00013 0,00013 0,00014 0,00014 0,00015 0,00015 0,00017
-3,5 0,00017 0,00017 0,00018 0,00019 0,00019 0,00020 0,00021 0,00022 0,00022 0,00023
-3,4 0,00024 0,00025 0,00026 0,00027 0,00028 0,00029 0,00030 0,00031 0,00033 0,00037
-3,3 0,00035 0,00036 0,00038 0,00039 0,00040 0,00042 0,00043 0,00045 0,00047 0,00048
-3,2 0,00050 0,00052 0,00054 0,00056 0,00058 0,00060 0,00062 0,00064 0,00066 0,00067
-3,1 0,00071 0,00074 0,00076 0,00079 0,00082 0,00085 0,00087 0,00090 0,00094 0,00097
-3,0 0,00100 0,00104 0,00107 0,00111 0,00114 0,00118 0,00122 0,00126 0,00131 0,00135
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Estadística Aplicada I 2023 02 185
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900
3,1 0,99903 0,99907 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99945
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99982 0,99982 0,99983 0,99984
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99991 0,99991 0,99991 0,99992 0,99992 0,99992 0,99993
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997
Estadística Aplicada I 2023 02 186
Ejemplo 72
𝑋~𝑁(𝜇 = 30; 𝜎 $ = 5$ )
Calcule:
𝑃(𝑋 ≤ 37,8)
Solución
𝑃(𝑋 ≤ 37,8)
𝑋 − 𝜇 37,8 − 𝜇
= 𝑃{ ≤ |
𝜎 𝜎
37,8 − 30
= 𝑃 {𝑍 ≤ |
5
= 𝑃(𝑍 ≤ 1,56)
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
Tenemos que:
𝑃(𝑍 ≤ 1,56) = 0,94062
0,94062
-4 -3 -2 -1 0 11,562 3 4
𝑃(𝑋 ≤ 𝑃% ) = 0, 𝑘
𝑋 − 𝜇 𝑃% − 𝜇
𝑃{ ≤ | = 0, 𝑘
𝜎 𝜎
𝑃% − 𝜇
𝑃 {𝑍 ≤ | = 0, 𝑘
𝜎
Luego, se busca dentro de la tabla el valor más cercano a 0, 𝑘. A partir de ese número dentro de la
tabla, salimos a la primera columna y fila y sumamos los números encontrados y obtendremos el valor
c.
0, 𝑘
𝑃! − 𝜇
-4 -3 -2 -1 00 1 2 = 𝑐3 4
𝜎
El valor del percentil se obtiene de la ecuación:
𝑃% = 𝜇 + 𝑐 𝜎
Ejemplo 73
𝑋~𝑁(𝜇 = 30; 𝜎 $ = 5$ )
0,94950
-4 -3 -2 -1 0 1 𝑃! 2 3 4
Solución
Primera forma: Estandarizando la variable X para usar la tabla de la normal estándar.
𝑃(𝑋 ≤ 𝑃% ) = 0,94950
𝑋 − 𝜇 𝑃% − 𝜇
𝑃{ ≤ | = 0,94950
𝜎 𝜎
𝑃% − 30
𝑃 {𝑍 ≤ | = 0,94950
5
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
𝑃% − 30
= 1,64
5
𝑃% = 30 + 1,64 × 5 = 38,2
Ejemplo 74
El ingeniero de operaciones de una aerolínea es el encargado de monitorear el tiempo de vuelo de los
aviones destinados a Sudamérica. Una de las rutas que generalmente presenta problemas es al
aeropuerto de Río de Janeiro. Sabe que el tiempo de vuelo tienen una distribución normal con una
media de 4 horas y desviación estándar de 0,25 horas. Dicho ingeniero desea calcular algunas
probabilidades para presentar el informe anual.
Solución
La variable 𝑋 ∶= tiempo de vuelo de un avión destinado a Río de Janeiro, en minutos
𝑋 − 𝜇 230 − 240
= 𝑃{ < |
𝜎 15
Si vamos a usar la tabla de distribución normal estándar, siempre se redondea −0,66667 a dos
decimales, por redondeo simple, es decir:
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
Observe que la respuesta es ligeramente diferente, debido al redondeo a dos decimales al usar la
tabla normal estándar.
Estadística Aplicada I 2023 02 190
Solución
La probabilidad pedida es:
Como la tabla normal siempre nos da el área hacia la izquierda, usaremos el complemento.
Estandarizando.
𝑋 − 𝜇 286 − 240
= 1−𝑃{ ≤ |
𝜎 15
= 1 − 𝑃(Z ≤ 3,06667)
Si vamos a usar la tabla de distribución normal estándar, siempre se redondea −3,06667 a dos
decimales, por redondeo simple, es decir:
= 1 − 𝑃(𝑍 ≤ 3,07)
= 1 − 0,99893 = 0,00107
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
c. Se considera tiempo de vuelos aceptables aquellos que están en el intervalo de [230 – 270]
minutos ¿Cuál es la probabilidad de que el vuelo sea considerado como aceptable?
Solución
𝑃(230 ≤ 𝑋 ≤ 270)
= 𝑃(−0,67 ≤ 𝑍 ≤ 2,00)
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
d. Se sabe que el 10% de los vuelos que tardan más recibirán asistencia técnica ni bien lleguen al
aeropuerto, cuál será el tiempo mínimo de vuelo para que dicho avión reciba asistencia técnica.
Solución
Denominemos 𝑡3!< al tiempo mínimo de vuelo para que dicho avión reciba asistencia técnica.
Estandarizando.
𝑡3!< − 240
𝑃 {𝑍 < | = 0,90
15
Buscamos en la tabla normal estándar el valor más cercano a 0,90 (0,89973) y salimos a los bordes
de la tabla, luego el valor buscado es 1,28
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
𝑡3!< − 240
= 1,28
15
𝑡3!< = 259,2
Estadística Aplicada I 2023 02 192
El tiempo mínimo de vuelo para que dicho avión reciba asistencia técnica es 259,2 minutos.
e. Si se seleccionan ocho vuelos que van a Rio de Janeiro, ¿cuál es la probabilidad de que a lo más
uno supera los 286 minutos de tiempo de vuelo.
Solución
Definimos la variable:
𝑌 =: número de vuelos que superan los 286 minutos de tiempo de vuelo de una muestra de ocho
vuelos.
𝑌~𝐵(𝑛; 𝑝)
De la parte b, se sabe que la probabilidad de que el vuelo supere los 286 minutos es 0,00107.
Por lo tanto:
𝑌~𝐵(𝑛 = 8; 𝑝 = 0,00107)
𝑃(𝑌 ≤ 1) = 0,99997
Usando Excel
Ejemplo 75
Una compañía telefónica ha determinado que el tiempo total de duración de las llamadas realizadas
mensualmente por sus clientes, medido en minutos, sigue una distribución normal de media 100 y
desviación estándar 25.
Solución
Definamos la variable:
𝑋 ≔ tiempo total de duración de las llamadas realizadas mensualmente por un cliente, en minutos
Estandarizando:
Usando Excel
c. La empresa decide iniciar una campaña para premiar a aquellos clientes que acumulen en llamadas
como mínimo tres horas. ¿Qué porcentaje de los usuarios se beneficiarán en dicha campaña?
180 − 100
= 1 − 𝑃 {𝑍 ≤ | = 1 − 𝑃(𝑍 ≤ 3,20)
25
= 1 − 0,999313 = 0,000687
Usando Excel
d. El gerente de ventas decidirá incentivar a los clientes que facturan poco con un sistema de
retribuciones. Desea incluir en ese programa al 4% de los clientes, siempre y cuando la duración de
llamadas realizadas al mes no supere los 60 minutos. Determine la duración total en minutos que
debe acumular como máximo un cliente para ser incluido en la promoción y con este resultado
¿cuál será la decisión que debe tomar el gerente?
Solución
Interpretación
Determinar si se va a incentivar a los clientes que facturan poco con un sistema de retribuciones.
Representación
Vamos a usar la distribución normal y calcularemos la duración total en minutos que debe acumular
como máximo un cliente para ser incluido en la promoción.
Cálculo
Para calcular la duración total en minutos que debe acumular como máximo un cliente para ser
incluido en la promoción debemos calcular el percentil 4.
Buscamos dentro de la tabla el valor más cercano a 0,04; en este caso, es 0,04006. Luego, salimos
a los bordes de la tabla, obteniendo el valor -1,75.
Estadística Aplicada I 2023 02 195
𝑃& − 100
= −1,75
25
Despejando:
Usando Excel
Análisis y argumentación
La duración total en minutos que debe acumular como máximo un cliente para ser incluido en la
promoción es 56,23 minutos que es menor a 60 minutos.
Por tanto, sí se va a incentivar a los clientes que facturan poco con un sistema de retribuciones,
pues 56,25 minutos es menor a 60 minutos.
Ejemplo 76
La corporación Metálica S.A. fabrica barras de construcción de acero. Se sabe que los pesos de las
barras de construcción de 5/8” de diámetro tienen distribución normal con media de 4,5 kg y varianza
de 0,64 kg2. Según disposición de la norma técnica si el peso de una barra de construcción se encuentra
entre 4,46 y 4,66 kilogramos se considera dentro de la especificación técnica.
¿Cuál es la probabilidad de que el peso de una barra seleccionada aleatoriamente se encuentre fuera
de la especificación técnica?
Solución
Definamos la variable:
𝑃(𝑋 < 4,46) + 𝑃(𝑋 > 4,66) = 1 − 𝑃(4,46 < 𝑋 < 4,66)
= 1 − 0,09920 = 0,9008
Ejemplo 77
La empresa de bebidas gasificadas Coke’s tiene por política hacer un informe técnico del sistema de
embotellado de sus productos. Las normas indican que una máquina embotelladora está ajustada para
servir en promedio de 500 mililitros por botella. Si la cantidad de refresco se distribuye normalmente
con una desviación estándar de nueve mililitros.
Solución
Definamos la variable:
𝑋 ≔ contenido de una botella en mililitros
𝑋~𝑁(𝜇 = 500; 𝜎 $ = 9$ )
b. Las normas técnicas de llenado establecen que el contenido del líquido debe estar en el rango de
[490 – 510] mililitros. Si en la producción de un día, más del 25% de las botellas no cumplen las
normas técnicas se tendrá que parar la producción. ¿Cuál será la decisión?
Interpretación
Determinar si se tendrá que parar la producción.
Representación
Vamos a usar la distribución normal y calcularemos una probabilidad.
Cálculo
La probabilidad pedida es:
Análisis y argumentación
El porcentaje de botellas que no cumplen las normas técnicas es de 26,652% que es mayor al 25%.
Por tanto, sí se tendrá que parar la producción, pues 26,652% > 25%.
c. Si el llenado de botellas admite como máximo 520 mililitros ¿Cuántas botellas aproximadamente
se derramarán en las siguientes 1000 botellas?
Solución
La probabilidad de que derrame una botella es:
Solución
𝑃$G = 494,4847
e. Si se selecciona una muestra de seis botellas, ¿cuál es la probabilidad que ninguna de estas botellas
contenga más de 505 mililitros?
Solución
𝑌~𝐵(𝑛 = 6; 𝑝 = 0,289257)
f. Calcule el contenido mínimo para estar en el 10% de las botellas con mayor contenido.
Solución
𝑃I0 = 511,534
El contenido mínimo para estar en el 10% de las botellas con mayor contenido es 511,534 mililitros.
Estadística Aplicada I 2023 02 198
Ejercicios
121. La vida útil de un equipo de excavación se modela con una variable normal con una media de 3,1
años y una desviación estándar de 1,1 años. El equipo tiene garantía de un año y, por tanto, será
reemplazado por uno nuevo si se malogra antes de un año. Calcule la probabilidad de que un
equpo de excavación sea reemplazado por uno nuevo.
122. La corporación Metálica fabrica barras de construcción de acero. Se sabe que los pesos de las
barras de construcción tienen distribución normal con media de 1,5 kg y varianza de 0,0025 kg2
por cada metro. Según disposición de la norma técnica si el peso de una barra de construcción se
encuentra entre 1,49 kg y 1,51 kg se considera dentro de la especificación técnica.
123. Un blíster es un envase con una cavidad en forma de ampolla donde se aloja el producto, de tal
forma que permite presentarlo en el punto de venta y protegerlo de golpes. El proceso de colado
es la actividad final en la producción de las tabletas antes del blisteado. El tiempo de colado se
considera una variable aleatoria normalmente distribuida con media de 17 segundos y una
desviación estándar de 2,5 segundos. Según el departamento de producción el tiempo de colado
debe encontrarse entre 15 y 25 segundos.
124. Los bastidores que utilizan las máquinas torneadoras deben ser de muy buena calidad y acabado
para alargar el tiempo de vida útil de las máquinas. Según datos anteriores, el tiempo de vida útil
de una máquina torneadora tiene una distribución normal con media 600 días con una
variabilidad de 1089 días2. Si una máquina torneadora viene trabajando 570 días, calcule la
probabilidad de que su vida útil sea menor a 610 días. Rpta. 0,5345
125. El tiempo de incapacidad debido a un accidente laboral leve que tiene un trabajador de una
empresa durante un mes se modela con una variable normal con una media de 90 horas y una
desviación estándar de 18 horas. Si una persona ya tuvo 80 horas de incapacidad, calcule la
probabilidad de que tenga por lo menos 20 horas más. Rpta. 0,4071
126. Las notas finales del curso de Estadística Aplicada siguen aproximadamente una distribución
normal con una media de 12. Si el 95,44 % de los estudiantes que siguieron el curso obtuvieron
calificaciones entre 8 y 16.
127. La empresa de bebidas gasificadas Coke’s tiene por política hacer un informe técnico del sistema
de embotellado de sus productos. Las normas indican que una máquina embotelladora está
ajustada para servir en promedio de 500 mililitros por botella. Si la cantidad de refresco se
distribuye normalmente con una desviación estándar de cinco mililitros.
a. Calcule la probabilidad que una botella contenga menos de 503 mililitros. Rpta. 0,7257
b. Las normas técnicas de llenado establecen que el contenido del líquido debe estar en el rango
de [495 – 505] mililitros. Si en la producción de un día, más del 25% de las botellas no cumplen
las normas técnicas se tendrá que parar la producción. Indique si se detendrá la producción.
Rpta. 0,68269; se detendrá
c. Si por error se toman botellas con capacidad de llenado máximo de 510 mililitros, ¿cuántas
botellas se espera que se derramen en las siguientes cien mil botellas? Rpta. 2275
d. ¿Debajo de qué valor se obtiene el 25% de botellas con menor contenido? Rpta. 496,63
e. Si se selecciona una muestra de seis botellas, calcule la probabilidad de que ninguna de botella
contenga más de 505 mililitros. Rpta. 0,35467
Estadística Aplicada I 2023 02 200
• Si 𝑋# , 𝑋$ , 𝑋' , … , 𝑋< son 𝑛 variables aleatorias normales independientes, tales que 𝑋! ~𝑁(𝜇! , s$! )
respectivamente, entonces:
< < <
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋< = „ 𝑋! ~𝑁 ±„ 𝜇! ; „ 𝜎!$ ²
!># !># !>#
• Si 𝑋# , 𝑋$ , 𝑋' , … , 𝑋< son 𝑛 variables aleatorias normales independientes, tales que 𝑋! ~𝑁T𝜇! , s$! U;
respectivamente, entonces:
< < <
Ejemplo 78
En una industria metalmecánica, se tienen tres brazos mecánicos, sean 𝑋# , 𝑋$ y 𝑋' el tiempo que se
demora un brazo en ensamblar una pieza de un producto.
Solución
𝑆 = 𝑋# + 𝑋$ + 𝑋'
Solución
Estandarizando:
55 − 54
= 1 − 𝑃 {𝑍 ≤ |
0,3
= 1 − 𝑃(𝑍 ≤ 3,3333)
Se redondea a dos cifras en la parte decimal para buscar en la tabla normal estándar.
c. Calcule la probabilidad de que el tiempo total de ensamblaje sea a lo más de 54,6 minutos.
Solución
𝑃(𝑆 ≤ 54,6)
Estandarizando.
54,6 − 54
= 𝑃 {𝑍 ≤ |
0,3
= 𝑃(𝑍 ≤ 2) = 0,9772
Ejemplo 79
El transporte es un punto importante en el traslado de la carga vía terrestre. Por estudios anteriores
se sabe que el costo de un producto a transportar hacia su destino sigue una distribución normal con
media de 14 dólares y una desviación estándar de tres dólares. Urbaner desea llevar productos a
transportar al Cono Norte de Lima.
a. ¿Cuál es la probabilidad de que el costo de transportar 100 productos supere los 1450 dólares?
Solución
𝑆 = 𝑋# + 𝑋$ + ⋯ + 𝑋#00
Estandarizando:
1450 − 1400 5
= 1 − 𝑃 {𝑍 ≤ | = 1 − 𝑃 {𝑍 ≤ |
√900 3
Para poder usar la tabla normal estándar, redondeamos el valor de Z a dos decimales.
= 1 − 𝑃(𝑍 ≤ 1,67)
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
= 1– 0,95254 = 0,04746
Solución
Como la probabilidad es menor al 10% (4,746% < 10%), por lo tanto, Urbaner sería el único
distribuidor de productos para el Cono Norte de Lima.
Estadística Aplicada I 2023 02 204
Ejemplo 80
El ingeniero de producción desea determinar el peso restante del producto al llegar a su destino final.
a. ¿Cuál es la probabilidad de que el peso restante del producto al llegar a su destino sea mayor a 15
gramos?
Solución
Como dice que la variabilidad es de 4 gramos2, se refiere a la varianza pues está en unidades al
cuadrado.
𝑆~𝑁(13,55; 5,69)
15 − 13,55
= 1 − 𝑃 {𝑍 ≤ |
2,385
= 1 − 𝑃(𝑍 ≤ 0,607966)
Estadística Aplicada I 2023 02 205
Para poder usar la tabla normal estándar, redondeamos el valor de 𝑍 a dos decimales.
= 1 − 𝑃(𝑍 ≤ 0,61)
= 1– 0,7291 = 0,2709
b. Si el valor de la probabilidad que el peso restante del producto al llegar a su destino sea mayor a
15 gramos es mayor al 25%; el ingeniero de producción optará por transportar sus productos a su
destino final usando contenedores aislantes para evitar la pérdida de peso por evaporación.
Indique la decisión tomará el ingeniero de producción.
Solución
Como la probabilidad es mayor al 25% (27,09% > 25,00%), por lo tanto, el ingeniero de control
usará contenedores aislantes.
Estadística Aplicada I 2023 02 206
Ejercicios
128. La empresa fabricante de detergentes Clean tiene asignada una máquina para el llenado y sellado
de las bolsas de detergente. El peso de detergente que la máquina deposita en las bolsas se
modela con una variable normal con media de 130 gramos y desviación estándar de 4 gramos y
que el peso de las bolsas vacías utilizadas en el embolsado del detergente se modela con una
variable normal con media 20 gramos y una desviación estándar de 1,2 gramos.
a. Se toma al azar una bolsa llena de detergente a la salida del proceso de embolsado. Calcule la
probabilidad de que tenga un peso mayor a 155 gramos. Rpta. 0,11560
b. Calcule el peso mínimo de una bolsa llena de detergente para estar considerada en el 14,46%
de las bolsas con mayores pesos. Rpta. 154,43
129. En la estación de servicio se vende gasolina de 90, 95 y 97 octanos, los precios por galón son 12,8;
15,6 y 16,2 soles respectivamente.
Sean 𝑋# , 𝑋$ , 𝑋' la cantidad de galones vendidos de cada tipo en un día en particular. Además, se
sabe que 𝑋# , 𝑋$ , 𝑋' son variables independientes y se distribuyen normalmente con medias 960,
1600 y 300 galones y desviaciones estándares de 90, 150 y 25 galones, respectivamente.
Determine la media y la desviación estándar del ingreso por la venta de gasolina en un día en
particular. Rpta. 42108; 2639,46
130. Dos baterías de las marcas A y B tienen una durabilidad que se modela con dos variables aleatorias
independientes normales con medias 4000 y 4200 horas y desviaciones estándares de 36 y 38
horas respectivamente. Calcule la variabilidad relativa de la diferencia de la durabilidad de las
baterías de la marca B y la marca A. Rpta. CV = 26,17%
131. El peso de un adulto peruano puede modelarse con una variable aleatoria normal. El peso medio
para los varones es de 72 kilos y de 64 kilos para las mujeres, mientras que sus desviaciones
estándar fueron de ocho kilos y cuatro kilos, respectivamente.
a. Si se elige, al azar, a un hombre y una mujer, calcular la probabilidad de que la mujer pese más
que el hombre.
b. Si se elige a dos hombres y a dos mujeres, calcular la probabilidad de que la suma total de
pesos supere los 260 kilos.
c. Si en un grupo de peruanos, el 60% de las personas son varones y se elige a una persona al
azar, calcule la probabilidad de que dicha persona pese entre 65 y 72 kilos.
Estadística Aplicada I 2023 02 207
Distribución muestral
A partir de la población se puede tomar muestras del mismo tamaño (𝑛). Los estadísticos tomarán
diferentes valores de muestra en muestra. Una distribución muestral es la lista de posibles valores de
un estadístico y la probabilidad asociada a cada valor. Se puede construir varias distribuciones
muestrales a partir de una población y dependerá del tipo de estadístico que se tome como referencia.
𝑋~? (𝜇; 𝜎 $ )
𝐸(𝑋v) = 𝜇Qb = 𝜇Q
𝜎$
𝜎Q$b =
𝑛
Es decir:
𝜎$
𝑋v~? ¸𝜇; ¹
𝑛
𝐸(𝑋v) = 𝜇Qb = 𝜇Q
𝜎$ 𝑁 − 𝑛
𝜎Q$b = { |
𝑛 𝑁−1
𝜎$ 𝑁 − 𝑛
𝑋v~? ±𝜇; { |²
𝑛 𝑁−1
Estadística Aplicada I 2023 02 208
Sea 𝑋 es una variable aleatoria con distribución normal con media 𝜇 y varianza 𝜎2;
𝑋~𝑁(𝜇; 𝜎 $ )
entonces, se cumple que la variable media muestral 𝑋v es una variable aleatoria normal, para 𝑛 ≥ 2.
𝜎$
𝑋v~𝑁 ¸𝜇, ¹
𝑛
Si, además, se conoce el tamaño poblacional, entonces la distribución de la media muestral es:
𝜎$ 𝑁 − 𝑛
𝑋v~𝑁 ±𝜇, { |²
𝑛 𝑁−1
Sea 𝑋 es una variable aleatoria (discreta o continua) con media 𝜇 y varianza 𝜎2.
Entonces se cumple que, para 𝑛 ≥ 30, la media muestral 𝑋v se aproxima a una distribución normal.
𝜎$
𝑋v ≈ 𝑁 ¸𝜇, ¹
𝑛
Si, además, se conoce el tamaño poblacional, entonces la distribución de la media muestral es:
𝜎$ 𝑁 − 𝑛
𝑋v ≈ 𝑁 ±𝜇, { |²
𝑛 𝑁−1
Ejemplo 81
La duración de una pila tiene distribución normal con media 100 horas y desviación estándar de 20
horas. Si se selecciona una muestra aleatoria de 16 pilas, calcule la probabilidad de que la media
muestral sea mayor a 105 horas.
Solución
Definamos las variables necesarias.
𝜎 $ 20$
𝑋v~𝑁 ¸𝜇 = 100, = ¹
𝑛 16
Estadística Aplicada I 2023 02 209
𝑋v~𝑁(100; 25)
𝑋v~𝑁(100; 5$ )
La probabilidad pedida es la probabilidad de que la media muestral sea mayor a 105 horas, es decir:
Estandarizando
105 − 100
𝑃(𝑋v > 105) = 1 − 𝑃(𝑋v ≤ 105) = 1 − 𝑃 {𝑍 ≤ |
5
= 1 − 𝑃(𝑍 ≤ 1) = 1 − 𝐹(1)
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
Ejemplo 82
La distribución del ingreso familiar en Lima Metropolitana es asimétrica, con sesgo hacia la derecha. El
último censo revela que el ingreso familiar medio es de 1667 soles con una desviación estándar de 200
soles. En una muestra aleatoria de 180 familias, calcule la probabilidad de que el ingreso familiar medio
de la muestra difiera del ingreso familiar medio de la población en menos de 35 soles.
Solución
𝑋~ ¿ ? (𝜇 = 1667, 𝜎 $ = 200$ )
Sea 𝑋v:= media muestral del ingreso de las 180 familias en Lima Metropolitana
𝜎 $ 200$
𝑋v ≈¿ ? ¸𝜇 = 1667, = ¹
𝑛 180
Estadística Aplicada I 2023 02 210
Por el teorema del límite central para 𝑛 = 180 > 30, se cumple que:
𝜎 $ 200$
𝑋v ≈ 𝑁 ¸𝜇 = 1667, = ¹
𝑛 180
𝜎$
𝑋v ≈ 𝑁 ¸𝜇 = 1667, = 222,2222¹
𝑛
−35 𝑋v − 𝜇 35
𝑃Â 𝜎 < 𝜎 < 𝜎 Ã
√𝑛 √𝑛 √𝑛
−35 35
𝑃{ <𝑍< |
14,9071 14,9071
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
La probabilidad de que la media muestral del ingreso familiar difiera del ingreso familiar medio
poblacional en menos de 35 soles es 0,98122.
Estadística Aplicada I 2023 02 211
Ejemplo 83
Una máquina embotelladora de gaseosas envasa su producto en botellas cuyo contenido sigue una
distribución normal con media igual a 12 onzas y varianza 0,0625 onzas2. Las especificaciones de
calidad establecen que el contenido debe estar en el intervalo [11,75; 12,25].
Si se eligen seis botellas al azar, calcule la probabilidad de que la media del contenido de las seis
botellas esté fuera de los límites establecidos.
Solución
𝜎 $ 0,0625
𝑋v~𝑁 ¸𝜇 = 12; = ¹
𝑛 6
𝑋v~𝑁(12; 0,0104167)
La probabilidad pedida es que el contenido promedio de las seis botellas esté fuera de los límites
establecidos, es decir:
En Excel se usa:
Ejemplo 84
El tiempo que demora un cliente en ser atendido con un nuevo sistema en cierta agencia bancaria es
una variable aleatoria con media igual a 1,5 minutos y desviación estándar de 0,35 minutos. Suponga
que esta agencia bancaria cuenta con un total de 200 clientes y 𝑋# , 𝑋$ , …,𝑋&0 es una muestra sin
reemplazo de esta población. Calcule la probabilidad de que el tiempo promedio de atención de la
muestra de clientes esté entre 1,40 y 1,75 minutos.
Solución
𝑋 ≔ tiempo que demora un cliente en ser atendido con un nuevo sistema en una agencia bancaria
𝜎$ 𝑁 − 𝑛 0,35$ 200 − 40
𝑋v~¿ ? ±𝜇 = 1,5; { |= { |²
𝑛 𝑁−1 40 200 − 1
Como el tamaño de muestra 𝑛 = 40 ≥ 30, usaremos el teorema del límite central, luego la variable
media muestral 𝑋v se distribuye aproximadamente normal.
𝑋v ≈ 𝑁(1,5; 0,00246231)
La probabilidad pedida es que el tiempo promedio de atención de la muestra de clientes sea a lo más
de 1,75 pero mayor a 1,40 minutos, es decir:
Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
Se usa la función:
=DISTR.NORM.N(1.75;1.5;0.049622;1)-DISTR.NORM.N(1.4;1.5;0.049622;1)
Ejemplo 85
El tiempo (en minutos) hasta que ocurra el primer pedido de acceso a una base de datos cada día es
descrito como una variable aleatoria continua exponencial T con media igual a dos minutos. Si de 36
días escogidos al azar se sumaran los tiempos hasta que ocurra el primer pedido de cada día, ¿cuál es
la probabilidad de que dicha suma supere los 84 minutos?
Solución
Definamos las variables necesarias.
𝑇 ≔ tiempo (en minutos) hasta que ocurra el primer pedido de acceso a una base de datos cada día
𝑇~𝐸𝑥𝑝(𝛽 = 2)
La media de 𝑇 es:
𝜇=𝛽=2
La varianza de 𝑇 es:
𝜎 $ = 𝛽$ = 4
𝑆 ≔ suma muestral de los tiempos (en minutos) hasta que ocurra el primer pedido de los 36 días
𝑆 84
𝑃{ > |
𝑛 𝑛
84
= 𝑃 {𝑇v > | = 𝑃(𝑇v > 2,3333)
36
𝑇v ≔ media muestral de los tiempos hasta que ocurra el primer pedido de los 36 días
𝜎$ 4
𝑇v~¿ ? ¸𝜇 = 2; = ¹
𝑛 36
𝜎$ 4
𝑇v ≈ 𝑁 ¸𝜇 = 2; = ¹
𝑛 36
𝑇v ≈ 𝑁(2; 0,111111)
Ejemplo 86
Se sabe que el tiempo de producción de fierros de construcción tiene una distribución normal con
media igual a 15 minutos y varianza igual a 2,1 minutos2. Se toma al azar una muestra de 25 fierros y
se pide calcular lo siguiente:
a. Calcule la probabilidad que la media del tiempo de producción se encuentre entre 12 y 16 minutos.
b. El área de calidad determina que, si el porcentaje que el tiempo promedio de producción se
encuentra entre 12 y 16 minutos es mayor que 60%, entonces comprará otra máquina laminadora.
¿Se comprará otra máquina laminadora?
c. ¿Cuál es el tiempo promedio que se requiere para estar en el 40,129% de los tiempos de
producción más bajos?
Solución
a. Calcule la probabilidad que la media del tiempo de producción se encuentre entre 12 y 16 minutos.
Solución
𝜎 $ 2,1
𝑋v~𝑁 ¸𝜇 = 15; = ¹
𝑛 25
𝑋v~𝑁(15; 0,084)
La probabilidad pedida es que la media del tiempo de producción de los 25 fierros se encuentre
entre 12 y 16 minutos, es decir:
Solución
La probabilidad pedida es que la media del tiempo de producción de los 25 fierros se encuentre
entre 12 y 16 minutos, es decir:
Como el porcentaje pedido es mayor al 60% (99,972% > 60%), por tanto, sí comprará otra máquina
laminadora.
c. ¿Cuál es el tiempo promedio que se requiere para estar en el 40,129% de los tiempos de
producción más bajos?
Solución
Tenemos que:
𝑋v~𝑁(15; 0,084)
Ejercicios
132. La duración de un componente eléctrico sigue una distribución exponencial con una media de
1000 horas.
a. Calcular la probabilidad de que la media de las duraciones de 50 componentes esté entre 980
y 1020 horas.
b. Calcular la probabilidad de que la suma de las duraciones de 50 componentes sea de más de
54000 horas.
133. Sea 𝑋 una variable aleatoria normal que denota la concentración de cierto contaminante con una
media de 10 partes por millón y una desviación estándar de 1,25 partes por millón. Se considera
tóxica una concentración cuando posee más de nueve partes por millón. Se toma una muestra
aleatoria de nueve concentraciones de este contaminante, calcule la probabilidad de que la
concentración promedio muestral sea mayor a nueve partes por millón. Rpta. 0,9918
134. El tiempo de descarga de una batería de cierto modelo de celular se modela con una variable
exponencial con media igual a 18 horas. ¿Cuál es la probabilidad de que la suma del tiempo de
las descargas de una muestra aleatoria de 36 de estas baterías supere las 666 horas?
Rpta. 0,4338
135. Se sabe que el tiempo de producción de fierros de construcción tiene una distribución normal con
media igual a 15 minutos y varianza igual a 2,1 minutos2. Se toma al azar una muestra de 25
fierros, calcule la probabilidad que la media del tiempo de producción se encuentre entre 12 y 16
minutos.
136. El tiempo, en minutos, que se tarda una persona en realizar una tarea puede modelarse por una
variable aleatoria con la siguiente función de densidad.
𝑥
0 < 𝑥 < 10
𝑓(𝑥) = À50
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Si se toma al azar una muestra de 32 personas, calcule la probabilidad de que el tiempo medio que
se tardan en realizar dicha tarea sea más de 7 minutos.
137. Se lanza un dado mil veces y se registra el número de la cara superior. Calcule la probabilidad de
que la media muestral de los mil lanzamientos esté entre 3,4 y 3,6.
Estadística Aplicada I 2023 02 217
Introducción al muestreo
Un gran objetivo de la Estadística es hacer inferencias acerca de una población con base en información
en una muestra. Esto motiva el estudio del problema del muestreo. Muchos estudios estadísticos se
inician con la selección de una muestra. Este proceso recibe el nombre de muestreo el cual comprende:
Para realizar una encuesta de muestreo, es necesario seguir los siguientes pasos:
1. Define el objetivo de la encuesta: Antes de comenzar, es importante tener claro qué es lo que se
desea investigar. Esto ayudará a determinar el tamaño y la composición de la muestra que se
requiere.
6. Diseño de la encuesta: El siguiente paso es diseñar las preguntas que se incluirán en la encuesta.
Es importante que las preguntas sean claras, precisas y relevantes para el objetivo de la
investigación.
8. Análisis de los resultados: Una vez recogidos los datos, es necesario analizarlos para obtener
conclusiones y responder al objetivo de la investigación.
Recuerda que es importante seguir las normas éticas para realizar una encuesta, como por ejemplo,
garantizar la confidencialidad de los datos y obtener el consentimiento de los participantes.
Estadística Aplicada I 2023 02 218
Unidad elemental
Es el objeto sobre el cual se hace la medición. También llamada unidad de observación, unidad de
análisis. unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con
frecuencia ocurre que la unidad elemental es cada individuo. También podría ser, por ejemplo, una
empresa, un colegio o un día, dependiendo de los objetivos y de la información que se quiere
recolectar.
Población muestreada
Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra; es
decir, es la población de donde se extrae la muestra.
Unidad de muestreo
Es la unidad donde realizamos la muestra.
Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los
individuos que pertenecen a la población objetivo. En vez de eso, la unidad de muestreo es cada familia
y la unidad elemental es cada individuo que vive en una familia.
Marco muestral
Es una lista de las unidades de muestreo que están disponibles para elección. Generalmente la unidad
elemental es la unidad de muestreo, pero no siempre.
Tipos de muestreo
• Muestreo no probabilístico
• Muestreo probabilístico
Muestreo no probabilístico
El muestreo no probabilístico es una técnica de muestreo donde las muestras se recogen en un proceso
que no brinda a todos los individuos de la población iguales oportunidades de ser seleccionados.
La desventaja es que esta muestra no es representativa. Por lo tanto, los resultados de la investigación
no pueden ser utilizados en generalizaciones respecto de toda la población.
Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas.
En este método, cada elemento de la población tiene la misma probabilidad de ser seleccionado para
participar en la encuesta. Es un método adecuado para poblaciones homogéneas y cuando se desea
una representatividad equitativa de todos los elementos de la población.
Se selecciona una muestra en forma aleatoria y sin reemplazo a 𝑛 unidades de muestreo de una
población que contiene un total de 𝑁 unidades. Se garantiza que cada una de las muestras posibles
tiene la misma probabilidad de ser elegida.
Muestreo sistemático
En este método, se eligen los elementos de la población mediante un intervalo fijo. Por ejemplo, si la
población es de 1000 elementos y se desea una muestra de 100, el intervalo sería de 10 (1000/100=10).
Se comienza seleccionando un elemento al azar y después se eligen los siguientes en intervalos de 10.
Este método es adecuado para poblaciones homogéneas y cuando se desea una representatividad
equitativa.
Se selecciona un primer elemento aleatoriamente y, luego, los demás elementos que conformarán la
muestra cada cierto intervalo. Este muestreo supone que se cuenta con una enumeración completa
de los elementos de la población.
Estadística Aplicada I 2023 02 220
Muestreo estratificado
En este método, la población se divide en subgrupos o estratos con características similares y se realiza
un muestreo independiente en cada estrato. Este método es adecuado cuando la población es
heterogénea y se desea obtener una representatividad equitativa de cada subgrupo o estrato.
Se selecciona la muestra de los diversos estratos. Un estrato es una parte de la población, cuyos
elementos tienen características similares. El objetivo de estratificar la población es buscar
homogeneidad entre los estratos.
La elección del método de muestreo depende del objetivo de la investigación y de las características
de la población.
En general, el muestreo aleatorio simple es un buen punto de partida para muchas investigaciones. Si
la población es muy heterogénea, el muestreo estratificado puede ser una buena opción para obtener
una muestra representativa. En el caso de una población muy grande, el muestreo sistemático puede
ser más eficiente que el muestreo aleatorio simple.
Es importante destacar que no existe un método de muestreo "mejor" en general, sino que la elección
depende de las características específicas de la población y del objetivo de la investigación. Por lo
tanto, es importante evaluar cuidadosamente las opciones antes de decidir cuál método utilizar.
Estadística Aplicada I 2023 02 221
Es el procedimiento por el cual se selecciona una muestra en forma aleatoria y sin reemplazo a n
unidades de muestreo de una población que contiene un total de N unidades.
Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.
2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios.
Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método
no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta varias
veces a los que tienen varios números.
Estadística Aplicada I 2023 02 223
Ejemplo 87
Se desea seleccionar una muestra de cinco clientes usando muestreo aleatorio simple y se tiene el
marco muestral, la lista enumerada de la población de clientes de la empresa de 350 clientes. Use las
columnas C6, C15 y C4.
Marco muestral
Número Cliente
001 Carlos Torres
002 Manuel Benavides
003 Ricardo Montoya
004 Rosario Castro
⋮ ⋮
349 Julia Martín
N = 350 Renato Alvarado
Solución
Se debe seleccionar cinco números del 1 al 350 sin reemplazo, es decir sin que se repitan. El número
máximo por seleccionar es 350 que tiene tres dígitos, entonces tomaremos de la tabla de números
aleatorios tres columnas consecutivas.
Comenzaremos con la columna C6 para iniciar la selección. Se tomarán tres columnas consecutivas
hacia la derecha a partir de C6, esto es: C6 C7 C8. Los números deben estar comprendidos entre 1 y
350.
Los números seleccionados serán: 84; 40; 124; 245 y 332. Las columnas C15 y C4 no se usarán.
Estadística Aplicada I 2023 02 224
Ejemplo 88
El gerente de una empresa automotriz que tiene un total de 150 empleados requiere seleccionar a 12
empleados al azar para que conformen un equipo de prueba, utilizando un nuevo método de
transporte y para estimar el ingreso mensual.
a. Seleccione una muestra de 12 trabajadores usando muestreo aleatorio simple. Elabore un listado
con el número o código seleccionado y el valor del ingreso quincenal. Considere las columnas C4,
C8, C11 y C15 de la tabla de números aleatorios para la selección. ¿A qué colaboradores
seleccionará para conformar el equipo de prueba?
Seleccionaremos 12 elementos del marco muestral. Como el marco muestral tiene 150 elementos
y este valor tiene 3 cifras o dígitos, entonces se utilizarán 3 columnas consecutivas para seleccionar
los elementos, se iniciará la selección con las columnas C4 C5 C6.
Muestreo estratificado
Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de sus
elementos. El objetivo del diseño estratificado es dar un tratamiento especial a cada estrato, ya sea
por razones administrativas, de costo, logísticas o minimizar variabilidad. La característica del estrato
es que dentro del él los datos son homogéneos pero heterogéneos entre sí.
• Si se usa más de una variable para formar los estratos, no deben estén relacionadas entre sí.
• No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y ocho.
• Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto, pueden no ser
considerados.
• La variable de estratificación la suele sugerir el investigador o el estadístico.
Estadística Aplicada I 2023 02 227
Ejemplo 89
La empresa de telecomunicaciones RVTV tiene 120 empleados de los cuales tiene información de las
variables: ingreso mensual, en soles; nivel de educación y años en la empresa (Años).
a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como
variable de estratificación el nivel de educación. Elabore un listado identificando el número
seleccionado y el valor respectivo de los años cumplidos en la empresa. Para el estrato 1 use las
columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use
C4, C3, C5 y C7.
b. Con la muestra, calcule la proporción de empleados que tienen más de 12 años en la empresa.
Estadística Aplicada I 2023 02 228
Solución
a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como
variable de estratificación el nivel de educación. Elabore un listado identificando el número
seleccionado y el valor respectivo de los años cumplidos en la empresa.
Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11
y para el estrato 3 use C4, C3, C5 y C7.
Solución
Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3
son: secundaria, técnica y superior, respectivamente.
𝑁# 30
Secundaria 𝑁# = 30 1 – 30 𝑛# = ×𝑛 = × 16 = 4
𝑁 120
𝑁$ 50
Técnica 𝑁$ = 50 31 – 80 𝑛$ = ×𝑛 = × 16 = 6,7 ≈ 7
𝑁 120
𝑁' 40
Superior 𝑁' = 40 81 – 120 𝑛' = ×𝑛 = × 16 = 5,3 ≈ 5
𝑁 120
Total 𝑁 = 120 𝑛 = 16
Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y
C5. Observemos que las posiciones de los primeros elementos a elegir están entre 1 y 30.
Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:
Posición 2 16 29 13
Años en la empresa 11 9 13 13
Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10
y C11. Observemos que las posiciones de los elementos a elegir están entre 31 y 80.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:
Posición 54 62 66 77 48 67 44
Años en la empresa 9 1 3 7 11 19 9
Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5
y C7. Observemos que las posiciones de los elementos a elegir están entre 81 y 120.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:
b. Con la muestra obtenida calcule la proporción de empleados que tienen más de 12 años en la
empresa.
Solución
Luego, con los elementos seleccionados se tiene que la proporción de empleados con más de 12
años en la empresa es igual a 4/16 = 0,25.
Estadística Aplicada I 2023 02 230
Muestreo sistemático
En el muestreo sistemático se debe elegir un elemento del marco muestral cada cierto intervalo. Este
muestreo supone que se cuenta con una enumeración completa de los elementos de la población.
Una característica importante del muestreo sistemático es que presenta menos variabilidad que el
muestreo aleatorio simple, esto debido a la presencia de una estratificación innata en el diseño del
muestreo sistemático.
Por ejemplo, si el valor de 𝑘 es un número de dos cifras, entonces deberá agregar a la columna
dada por enunciado una columna correlativa para completar un número de dos cifras.
3. A partir de este número elegido, seleccione el siguiente que ocupa la posición (𝐴 + 𝑘) del listado
del marco muestral y así sucesivamente hasta completar la muestra.
Estadística Aplicada I 2023 02 231
Ejemplo 90
Se tiene a continuación una población de 15 personas a quienes se les consultó su edad. Se desea elegir
a cuatro de ellas mediante un muestreo sistemático.
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Edad 12 15 23 10 32 65 34 23 43 54 22 34 56 34 25
Solución
𝑁 15
𝑘= = = 3,75
𝑛 4
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Edad 12 10 34 54
Estadística Aplicada I 2023 02 232
Ejemplo 91
Obtenga una muestra de siete personas usando el muestreo sistemático y elabore una tabla con la
posición seleccionada. Utilice la columna C5.
Solución
𝑁 40
𝑘= = = 5,71
𝑛 7
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
La muestra será:
Posición 1 6 11 16 21 26 31
Sexo Mujer Mujer Hombre Mujer Mujer Mujer Mujer
Edad 15 24 18 30 16 28 34
Estatura 154 170 177 163 168 161 169
J
El porcentaje muestral de mujeres ÉG × 100%Ê = 85,71%.
Estadística Aplicada I 2023 02 234
Ejercicios
138. En una población estudiada, hay 2000 mujeres y 8000 hombres. Si queremos seleccionar una
muestra de 250 individuos en dicha población. ¿Cuántos mujeres deben ser elegidas en la
muestra si queremos usar muestreo estratificado por sexo? Rpta. 50
139. La empresa de telecomunicaciones RVTV tiene 120 empleados de los cuales tiene información de
las variables: ingreso mensual, en soles; nivel de educación y años en la empresa (Años).
a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use las
columnas C1, C4, C8, C9, C17.
b. Con la muestra, calcule la proporción de empleados que tienen más de 12 años en la empresa.
a. Usando muestreo simple aleatorio obtenga una muestra de tamaño 10 y con esa muestra
calcule el porcentaje de empleados que respondieron que el clima laboral era regular. Use C3.
b. Usando muestreo simple aleatorio obtenga una muestra de tamaño 10 y con esa muestra
calcule el porcentaje de empleados que respondieron que el clima laboral era regular. Use C3.
c. Usando muestreo sistemático obtenga una muestra de tamaño 10 y con esa muestra calcule
el porcentaje de empleados que respondieron que el clima laboral era regular. Use C3.
d. Calcule el porcentaje poblacional de empleados que respondieron que el clima laboral era
regular y compárelos con los estadísticos encontrados.
141. Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla
que se muestra a continuación información acerca de las variables: nivel educativo y años
cumplidos en la empresa (años).
Aplique el muestreo sistemático para seleccionar una muestra de tamaño 13 empleados. Elabore
un listado con la posición seleccionada y el valor de los años cumplidos en la empresa y nivel
educativo. Utilice la columna C7, C10 y C15 de la tabla de números aleatorios. Con la muestra
obtenida, estime e interprete para la variable, años en la empresa el promedio y la mediana.
Obtenga, además, la proporción de empleados con nivel técnico.
La empresa está interesada en saber si existe una alta rotación de personal, debido a ello, el
departamento de recursos humanos ha hecho un censo. Los resultados se muestran en la base
de datos siguiente.
Estadística Aplicada I 2023 02 237
Marco muestral
Número Permanencia Grado de Remuneración
Posición Sexo Edad Motivo de cese
de hijos (meses) instrucción bruta
1 M 0 33 26 Titulado 5000 Renuncia voluntaria
2 M 1 34 10 Titulado 12075 Renuncia voluntaria
3 M 0 30 11 Titulado 3000 Renuncia voluntaria
4 F 0 28 3 Titulado 1500 Renuncia voluntaria
5 M 0 27 2 Titulado 800 Renuncia voluntaria
6 M 0 28 28 Titulado 3000 Renuncia voluntaria
7 F 1 39 12 Post grado 5575 Renuncia voluntaria
8 F 1 38 32 Técnico completa 2000 Renuncia voluntaria
9 F 0 32 1 Técnico completa 2700 Renuncia voluntaria
10 F 0 26 0 Técnico completa 2575 Renuncia voluntaria
11 M 0 35 52 Titulado 12000 Renuncia voluntaria
12 F 0 28 0 Titulado 2000 Renuncia voluntaria
13 F 1 32 1 Titulado 3575 Renuncia voluntaria
14 M 0 25 15 Titulado 1500 Renuncia voluntaria
15 F 2 34 55 Post grado 5000 Renuncia voluntaria
16 F 0 31 2 Post grado 7500 Renuncia voluntaria
17 F 0 28 7 Titulado 2500 Renuncia voluntaria
18 F 1 29 1 Técnico completa 1500 Renuncia voluntaria
19 F 2 36 1 Post grado 4400 Renuncia voluntaria
20 F 2 37 10 Técnico completa 1985 Renuncia voluntaria
21 F 0 27 1 Titulado 3000 Renuncia voluntaria
22 F 0 27 5 Técnico completa 2200 Renuncia voluntaria
23 F 2 28 3 Técnico completa 2300 Renuncia voluntaria
24 F 0 37 20 Titulado 3085 Renuncia voluntaria
25 F 0 35 2 Técnico completa 1885 Renuncia voluntaria
26 F 2 51 23 Post grado 15085 Renuncia voluntaria
27 F 0 37 20 Titulado 3085 Renuncia voluntaria
28 F 0 35 2 Técnico completa 1885 Renuncia voluntaria
29 F 0 28 1 Técnico completa 1500 Renuncia voluntaria
30 F 0 27 1 Técnico completa 1500 Renuncia voluntaria
31 F 0 25 2 Técnico completa 1800 Renuncia voluntaria
32 F 0 30 2 Técnico completa 1800 Renuncia voluntaria
33 F 0 42 2 Titulado 2585 Renuncia voluntaria
34 F 0 29 3 Técnico completa 3000 Renuncia voluntaria
35 F 2 38 49 Post grado 6085 Renuncia voluntaria
36 M 0 24 33 Titulado 1800 Renuncia voluntaria
37 F 0 41 3 Técnico completa 950 Renuncia voluntaria
38 F 0 28 0 Técnico completa 1700 Renuncia voluntaria
39 F 0 22 0 Titulado 850 Renuncia voluntaria
40 F 0 29 6 Titulado 2800 Renuncia voluntaria
41 M 0 29 58 Titulado 2200 Renuncia voluntaria
42 F 1 41 26 Post grado 7000 Renuncia voluntaria
43 F 0 25 18 Titulado 1500 Renuncia voluntaria
44 M 0 27 7 Titulado 2000 Renuncia voluntaria
45 F 2 39 9 Titulado 3885 Renuncia voluntaria
46 F 1 28 9 Post grado 4585 Renuncia voluntaria
47 M 0 25 22 Titulado 1800 Renuncia voluntaria
48 F 0 34 41 Titulado 3300 Renuncia voluntaria
49 F 1 31 1 Titulado 2085 Renuncia voluntaria
50 F 1 39 3 Post grado 8085 Renuncia voluntaria
51 M 0 22 16 Post grado 1500 Renuncia voluntaria
52 F 0 25 2 Técnico completa 1200 Renuncia voluntaria
Estadística Aplicada I 2023 02 238
a. Se desea seleccionar una muestra de 13 trabajadores usando muestreo simple aleatorio. Use
las columnas C3, C1, C14 y C12 de la tabla de números aleatorios y encuentre el porcentaje de
trabajadores cuyo motivo de cese fue por renuncia voluntaria.
b. Se desea estimar la edad promedio de los trabajadores que cesan aplicando muestreo
estratificado con una muestra de 10 empleados. Use como variable de estratificación la
variable <motivo de cese>. Para el estrato 1 use las columnas C2, C4 y C5, para el estrato 2 use
las columnas C8, C7, C5 y C11 y para el estrato 3 use las columnas C13, C14, C16 y C17.
c. ¿Está de acuerdo con usar la variable de estratificación <motivo de cese>? Si no está de
acuerdo, ¿qué otra variable usaría?
d. ¿Qué ventaja cree que tiene usar, en este caso, un muestreo estratificado a un muestreo
aleatorio simple?
e. Aplique el muestreo estratificado por motivo de cese para seleccionar una muestra de 10
empleados para estimar la edad promedio de los trabajadores.
143. Los siguientes datos han sido extraídos de una investigación realizada por La Defensoría del
Pueblo, Comisión de la Verdad y Reconciliación, Comité Internacional Cruz Roja y Coordinadora
Nacional de Derechos Humanos sobre un total de 150 personas extraviadas en el Perú entre los
años 1980 y 1996 en los tres principales departamentos donde hubo el brote terrorista:
Ayacucho, Huánuco y San Martín. Las variables que se consideraron fueron: Lugar de procedencia
(lugar), sexo y edad al momento de la desaparición. Los datos se presentan a continuación:
Nº Lugar Sexo Edad Nº Procedencia Sexo Edad Nº Lugar Sexo Edad Nº Lugar Sexo Edad
1 Ayacucho M 12 39 Ayacucho M 22 77 Ayacucho M 33 115 Huánuco M 28
2 Ayacucho M 40 40 Ayacucho F 23 78 Ayacucho M 22 116 Huánuco M 36
3 Ayacucho M 20 41 Ayacucho M 50 79 Ayacucho M 70 117 Huánuco M 27
4 Ayacucho M 43 42 Ayacucho M 26 80 Ayacucho M 34 118 Huánuco M 24
5 Ayacucho M 28 43 Ayacucho F 19 81 Ayacucho M 69 119 Huánuco M 45
6 Ayacucho M 12 44 Ayacucho M 54 82 Ayacucho F 31 120 Huánuco M 21
7 Ayacucho F 15 45 Ayacucho M 13 83 Huánuco M 21 121 Huánuco M 66
8 Ayacucho M 28 46 Ayacucho M 46 84 Huánuco M 27 122 Huánuco F 70
9 Ayacucho M 13 47 Ayacucho M 28 85 Huánuco F 19 123 Huánuco F 26
10 Ayacucho M 45 48 Ayacucho M 46 86 Huánuco M 27 124 Huánuco M 26
11 Ayacucho M 10 49 Ayacucho M 42 87 Huánuco M 20 125 Huánuco M 14
12 Ayacucho F 25 50 Ayacucho M 40 88 Huánuco M 25 126 Huánuco M 18
13 Ayacucho M 24 51 Ayacucho M 44 89 Huánuco M 18 127 Huánuco M 28
14 Ayacucho M 32 52 Ayacucho M 39 90 Huánuco M 47 128 San Martín M 25
15 Ayacucho M 48 53 Ayacucho M 17 91 Huánuco M 28 129 San Martín M 32
16 Ayacucho M 23 54 Ayacucho F 19 92 Huánuco M 32 130 San Martín M 22
17 Ayacucho F 7 55 Ayacucho M 24 93 Huánuco M 18 131 San Martín M 21
Estadística Aplicada I 2023 02 240
Nº Lugar Sexo Edad Nº Procedencia Sexo Edad Nº Lugar Sexo Edad Nº Lugar Sexo Edad
18 Ayacucho F 5 56 Ayacucho F 15 94 Huánuco M 22 132 San Martín M 28
19 Ayacucho M 4 57 Ayacucho M 17 95 Huánuco M 28 133 San Martín M 18
20 Ayacucho F 9 58 Ayacucho M 22 96 Huánuco M 31 134 San Martín M 29
21 Ayacucho M 6 59 Ayacucho M 50 97 Huánuco M 34 135 San Martín M 20
22 Ayacucho M 66 60 Ayacucho M 42 98 Huánuco M 25 136 San Martín M 18
23 Ayacucho M 18 61 Ayacucho M 19 99 Huánuco M 27 137 San Martín M 21
24 Ayacucho F 36 62 Ayacucho M 21 100 Huánuco M 19 138 San Martín M 26
25 Ayacucho M 26 63 Ayacucho M 15 101 Huánuco M 24 139 San Martín M 23
26 Ayacucho M 17 64 Ayacucho M 43 102 Huánuco M 28 140 San Martín M 35
27 Ayacucho M 28 65 Ayacucho M 16 103 Huánuco F 4 141 San Martín M 17
28 Ayacucho M 30 66 Ayacucho M 30 104 Huánuco F 2 142 San Martín M 32
29 Ayacucho F 19 67 Ayacucho M 48 105 Huánuco M 33 143 San Martín F 32
30 Ayacucho M 17 68 Ayacucho M 45 106 Huánuco M 25 144 San Martín M 41
31 Ayacucho F 20 69 Ayacucho M 41 107 Huánuco M 21 145 San Martín M 26
32 Ayacucho M 21 70 Ayacucho M 23 108 Huánuco M 21 146 San Martín M 20
33 Ayacucho M 37 71 Ayacucho M 22 109 Huánuco M 30 147 San Martín M 21
34 Ayacucho M 58 72 Ayacucho M 20 110 Huánuco M 21 148 San Martín M 15
35 Ayacucho M 18 73 Ayacucho M 22 111 Huánuco M 21 149 San Martín M 22
36 Ayacucho F 18 74 Ayacucho M 16 112 Huánuco M 54 150 San Martín M 45
37 Ayacucho M 19 75 Ayacucho M 45 113 Huánuco M 38
38 Ayacucho M 18 76 Ayacucho F 56 114 Huánuco M 16
144. El director de una empresa tiene la lista de todo su personal y desea obtener una muestra
aleatoria de los colaboradores para conocer el grado de satisfacción que estos tienen en su centro
de trabajo y estimar el tiempo promedio de servicio. El siguiente cuadro presenta el número o
código del colaborador, el tiempo de servicio en meses y la edad en años.
7 129 46 47 98 30 87 124 56
8 129 46 48 98 30 88 98 56
9 91 43 49 73 23 89 98 56
10 96 46 50 73 23 90 106 45
11 110 67 51 95 33 91 129 46
12 129 46 52 95 33 92 106 45
13 100 35 53 96 46 93 129 46
14 99 49 54 96 46 94 124 56
15 113 55 55 110 67 95 98 56
16 101 39 56 124 56 96 98 56
17 86 45 57 90 36 97 104 53
18 104 42 58 90 36 98 106 45
19 126 57 59 101 35 99 129 46
20 98 30 60 101 35 100 124 56
21 126 58 61 124 56 101 98 56
22 98 30 62 95 33 102 117 30
23 101 39 63 95 33 103 99 49
24 86 40 64 96 42 104 104 33
25 104 42 65 96 46 105 94 35
26 99 49 66 110 67 106 101 39
27 113 55 67 124 56 107 123 44
28 98 30 68 99 49 108 98 30
29 126 57 69 131 32 109 88 60
30 98 31 70 131 333 110 123 40
31 104 53 71 113 55 111 98 30
32 104 53 72 94 35 112 88 59
33 81 29 73 93 42 113 101 39
34 124 56 74 91 47 114 117 30
35 91 43 75 91 47 115 90 36
36 106 45 76 86 41 116 98 30
37 106 45 77 93 42 117 88 59
38 91 43 78 91 47 118 123 40
39 104 63 79 91 47 119 98 30
40 104 53 80 86 45 120 88 59
Ejemplo 92
Para las encuestas de actualidad política en el Perú, es usual encuestar alrededor de 1200 personas. Si
el cuadrado grande representa a los 24 millones de peruanos que pueden votar, cada cuadradito
representa a 600 personas; por lo tanto, en las encuestas se eligen a dos cuadraditos. Es decir, se le
pregunta al 0,005% de la población y no se pregunta al 99,995%. ¿Se puede confiar en las encuestas?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 ## 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 ##
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
11 11
12 12
13 13
14 14
15 15
16 16
17 17
18 18
19 19
20 20
21 21
22 22
23 23
24 24
25 25
26 26
27 27
28 28
29 29
30 30
31 31
32 32
33 33
34 34
35 35
36 36
37 37
38 38
39 39
40 40
41 41
42 42
43 43
44 44
45 45
46 46
47 47
48 48
49 49
50 50
51 51
52 52
53 53
54 54
55 55
56 56
57 57
58 58
59 59
60 60
61 61
62 62
63 63
64 64
65 65
66 66
67 67
68 68
69 69
70 70
71 71
72 72
73 73
74 74
75 75
76 76
77 77
78 78
79 79
80 80
81 81
82 82
83 83
84 84
85 85
86 86
87 87
88 88
89 89
90 90
91 91
92 92
93 93
94 94
95 95
96 96
97 97
98 98
99 99
100 ## ##
101 ##
102 ##
103 ##
104 ##
105 ##
106 ##
107 ##
108 ##
109 ##
110 ##
111 ##
112 ##
113 ##
114 ##
115 ##
116 ##
117 ##
118 ##
119 ##
120 ##
121 ##
122 ##
123 ##
124 ##
125 ##
126 ##
127 ##
128 ##
129 ##
130 ##
131 ##
132 ##
133 ##
134 ##
135 ##
136 ##
137 ##
138 ##
139 ##
140 ##
141 ##
142 ##
143 ##
144 ##
145 ##
146 ##
147 ##
148 ##
149 ##
150 ##
151 ##
152 ##
153 ##
154 ##
155 ##
156 ##
157 ##
158 ##
159 ##
160 ##
161 ##
162 ##
163 ##
164 ##
165 ##
166 ##
167 ##
168 ##
169 ##
170 ##
171 ##
172 ##
173 ##
174 ##
175 ##
176 ##
177 ##
178 ##
179 ##
180 ##
181 ##
182 ##
183 ##
184 ##
185 ##
186 ##
187 ##
188 ##
189 ##
190 ##
191 ##
192 ##
193 ##
194 ##
195 ##
196 ##
197 ##
198 ##
199 ##
200 ##
Estadística Aplicada I 2023 02 243
Ficha técnica
La ficha técnica es el documento donde consta la metodología y el proceso que se ha seguido para
realizar un estudio social o de mercado.
Variabilidad
Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias
será más pequeño.
Generalmente la variabilidad es un valor desconocido y hay que estimarlo a partir de datos de estudios
previos, muestra piloto o estudios anteriores similares.
Nos da una idea clara de hasta dónde y con qué probabilidad una estimación basada en una muestra
se diferencia del valor del parámetro, que se hubiera obtenido por medio de un censo completo.
En un estudio, el margen de error lo fija el investigador. Por ejemplo, si queremos estimar el valor de
la media del gasto mensual en transporte de una persona en Lima, el margen de error podría
establecerse en cuatro soles; mientras que si queremos estimar el porcentaje de personas que están
a favor de una cierta ley, el margen de error podría establecer en 2,8%.
Nivel de confianza
d
Con este nivel de confianza, se obtiene el valor 𝑍#U6 , que corresponde al percentil É1 − Ê × 100% de
5 $
la distribución normal estándar.
(1 − 𝛼) = 0,90
𝛼 = 0,10
0,95
0,90
0,05 0,05
-4 -3 -2 -1 0 1 2 3 4
Buscando en la tabla el valor más cercano a la suma de 0,90 y 0,05; es decir; a 0,95 que es 0,94950.
Una vez hallado el valor hallado el valor más cercano a 0,95; salimos a los bordes de la tabla normal
estándar.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
Si el objetivo del estudio es estimar la media de una población, la fórmula para calcular el tamaño de
muestra (𝑛) es:
𝑧]#Ud` 𝑠 $
$
𝑛=¸ ¹
𝑒
• 𝑍#U6 se encuentra con la distribución normal estándar, teniendo en cuenta el nivel de confianza
5
que crea conveniente el investigador. Este nivel de confianza, en proporción, se coloca en la parte
central de la distribución normal estándar. 𝑍#U6 debe ser redondeado a dos decimales.
5
• 𝑠: es la desviación estándar muestral de la variable que debe ser cuantitativa. Se redondea a cuatro
decimales por redondeo simple.
• 𝑒: el margen de error lo fija el investigador y está en las mismas unidades de los datos. Por ejemplo,
si la variable es ingresos las unidades serán soles o dólares, si la variable es el tiempo en realizar
una actividad las unidades estarán dadas en horas, minutos o segundos, según sea el caso.
Cuando no se conoce el tamaño de la población 𝑁 (es un valor muy grande) se asume población infinita
y no se incluye N en la fórmula.
Cuando se conoce el tamaño de la población 𝑁 (es un valor no muy grande) se asume población finita
y se realiza un ajuste al valor del tamaño de muestra obtenido con la fórmula anterior y se corrige n
con la siguiente fórmula:
𝑛
𝑛O = 𝑛
1+𝑁
• El valor de 𝑛 obtenido en la fórmula anterior se ingresa con cuatro decimales por redondeo simple.
Ejemplo 93
Un estudiante realiza un estudio para conocer el ingreso familiar promedio y la asignación de estos
ingresos en cada rubro, como alimentación, educación, salud y otros, en la ciudad de Lima. ¿A cuántas
familias deberá considerar en el estudio si se desea tener un nivel de confianza del 95%, un error
máximo de 500 soles, y mediante una muestra piloto se obtuvo una desviación estándar del ingreso
familiar de 3600 soles?
Solución
Se quiere estimar la media del ingreso familiar, en soles, por tanto, la fórmula es:
$
𝑍]#Ud` 𝑠
$
𝑛=± ²
𝑒
0,975
0,95
0,025 0,025
-4 -3 -2 -1 0 1 2 3 4
𝑍0,IGE = 1,96
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
1,96 × 3600 $
𝑛={ | = 199,14
500
El valor del tamaño de muestra siempre se redondea por exceso, por tanto, se debe entrevistar a 200
familias. Como no se conoce el tamaño de la población 𝑁, no es necesario corregir el valor de 𝑛.
Estadística Aplicada I 2023 02 248
Ejemplo 94
Universal es una nueva emisora de carácter político y a una semana de estar al aire cuenta con 3000
radioescuchas. El gerente desea realizar un estudio para estimar el tiempo de conexión promedio de
los oyentes. Al seleccionar una muestra piloto se obtuvieron los siguientes resultados, en horas:
3,2 4,8 5,3 9,1 6,3 8,2 6,5 9,6 10,3 8,6
6,3 7,9 8,2 7,9 6,9 9,3 8,6 6,8 10,1 9,0
¿Cuál debe ser el tamaño de muestra de oyentes que se necesita si desea tener un error de estimación
de 0,15 horas con un nivel de confianza del 94%?
Solución
𝑒 = 0,15
𝑠 = 1,8600
(1 − 𝛼) = 0,94
0,97
0,94
0,03 0,03
-4 -3 -2 -1 0 1 2 3 4
𝑍0,IG = 1,88
En la tabla normal buscamos el valor más cercano a 0,97 que es 0,96995; luego salimos a los bordes y
obtenemos el valor 1,88.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
Estadística Aplicada I 2023 02 249
1,88 × 1,8600 $
𝑛={ | = 543,4493
0,15
𝑛 543,4493
𝑛O = 𝑛= = 460,1
1+ 543,4493
𝑁 1 + 3000
El valor del tamaño de muestra siempre se redondea por exceso, por tanto, se necesita entrevistar a
461 radioescuchas.
Estadística Aplicada I 2023 02 250
𝑍$ d 𝑝̂ (1 − 𝑝̂ )
]#U $ `
𝑛=
𝑒$
• 𝑍#U6 el valor de 𝑍 se encuentra con la distribución normal estándar, teniendo en cuenta el nivel de
5
confianza que crea conveniente el investigador.
• si se tiene una estimación previa 𝑝̂ se la usa. Esta estimación puede provenir de estudios
anteriores o de una muestra piloto. Se usa con cuatro decimales por redondeo simple.
• si no se tiene una estimación previa, se usa 𝑝̂ = 0,5.
Cuando no se conoce el tamaño de la población 𝑁 o es un valor muy grande, se asume que la población
es infinita y, por tanto, no se incluye 𝑁 en la fórmula del tamaño de muestra.
Cuando se conoce el tamaño de poblacional 𝑁, la población será finita y se realiza un ajuste al valor
del tamaño de muestra obtenido con la fórmula anterior y se corrige 𝑛 con la siguiente fórmula:
𝑛
𝑛O = 𝑛
1+𝑁
• El valor de 𝑛 obtenido en la fórmula anterior se ingresa con cuatro decimales por redondeo simple.
Ejemplo 95
Una compañía de investigación de mercado quiere estimar el porcentaje de hogares que tienen
Internet en casa, ¿cuántos hogares debe considerarse en el estudio si desea tener una confianza del
95% de que el porcentaje muestral difiera del poblacional a lo más en 4,5%.
Solución
Se quiere estimar 𝑝 = proporción poblacional de hogares con Internet, por tanto, la fórmula es:
$
𝑍#U d 𝑝̂ (1 − 𝑝̂ )
$
𝑛=
𝑒$
0,975
0,95
0,025 0,025
-4 -3 -2 -1 0 1 2 3 4
𝑍0,IGE = 1,96
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
El valor del tamaño de muestra siempre se redondea por exceso, por tanto, se debe considerar a 475
hogares.
Estadística Aplicada I 2023 02 252
Ejercicios
145. Calcule el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que demoran los
estudiantes en llegar a la universidad, de un total de 6400 estudiantes, si se considera un nivel de
confianza del 96% y un error de estimación de 0,1 horas. De una muestra piloto de ocho alumnos,
se obtuvo los siguientes resultados:
146. Infodata es una empresa privada que asesora en temas informáticos al Ministerio de Educación y
quiere realizar un estudio sobre el tiempo que llevan los usuarios de la Biblioteca Nacional en las
salas de búsqueda computarizada. Para realizar dicho estudio tomó una muestra piloto de 20
usuarios de la Biblioteca Nacional, obteniéndose los siguientes tiempos en minutos.
5,4 4,6 10,1 8,0 6,6 7,0 4,6 9,9 4,0 12,1
9,8 5,5 4,5 6,7 7,8 4,9 5,0 6,4 4,4 5,9
¿Cuál es el tamaño de muestra que se debe seleccionar para hacer una encuesta, si se desea tener
un margen de error de medio minuto con un nivel de confianza del 98%?
147. La gerencia de una compañía de seguros ha observado el creciente uso de teléfonos celulares de
parte de los conductores, teniendo como resultado un mayor número de accidentes
automovilísticos, considerando implementar tarifas más altas en sus seguros. Se desea estimar el
porcentaje de conductores que hablan por teléfono mientras conducen, con un margen de error
de 3% y un nivel de confianza del 90% ¿cuál es el tamaño de muestra?
148. Se quiere estimar el porcentaje poblacional de productos defectuosos de una línea de producción
¿Qué tamaño de muestra debe obtener el ingeniero encargado, si se quiere tener una confianza
del 99% con un margen de error de 2,5%? En una muestra piloto de 360 productos se obtuvo 15
de productos defectuosos.
149. En una encuesta realizada entre estudiantes universitarios de Lima, el 32% de los encuestados
dijeron que la situación económica del país había mejorado en el último año. ¿Qué tan grande se
necesita que sea la muestra de estudiantes para una nueva encuesta, si se desea tener una
confianza de 95% y un margen de error de 2,2%?
150. El alcalde de un distrito desea estimar la proporción de residentes que conocen la propuesta
respecto al uso de fondos municipales para mejorar la limpieza del distrito. En una muestra piloto
de 120 residentes, 75 no conocen dicha propuesta. ¿Qué tamaño de muestra necesita seleccionar
si requiere una confianza del 98% y un margen de error del 4%?
151. Para estimar el porcentaje de electores a favor de un candidato, una encuestadora debe
determinar el tamaño de la muestra de una población de diez mil electores. ¿Qué tan grande
debe ser la muestra si se quiere tener una confianza del 97% y un margen de error del 2,8%?
Estadística Aplicada I 2023 02 254
Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,00003 0,00003 0,00007 0,00004 0,00004 0,00004 0,00004 0,00004 0,00005 0,00005
-3,8 0,00005 0,00005 0,00005 0,00006 0,00006 0,00006 0,00006 0,00007 0,00005 0,00007
-3,7 0,00008 0,00008 0,00008 0,00009 0,00009 0,00009 0,00010 0,00010 0,00010 0,00011
-3,6 0,00011 0,00012 0,00012 0,00013 0,00013 0,00014 0,00014 0,00015 0,00015 0,00017
-3,5 0,00017 0,00017 0,00018 0,00019 0,00019 0,00020 0,00021 0,00022 0,00022 0,00023
-3,4 0,00024 0,00025 0,00026 0,00027 0,00028 0,00029 0,00030 0,00031 0,00033 0,00037
-3,3 0,00035 0,00036 0,00038 0,00039 0,00040 0,00042 0,00043 0,00045 0,00047 0,00048
-3,2 0,00050 0,00052 0,00054 0,00056 0,00058 0,00060 0,00062 0,00064 0,00066 0,00067
-3,1 0,00071 0,00074 0,00076 0,00079 0,00082 0,00085 0,00087 0,00090 0,00094 0,00097
-3,0 0,00100 0,00104 0,00107 0,00111 0,00114 0,00118 0,00122 0,00126 0,00131 0,00135
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Estadística Aplicada I 2023 02 255
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900
3,1 0,99903 0,99907 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99945
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99982 0,99982 0,99983 0,99984
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99991 0,99991 0,99991 0,99992 0,99992 0,99992 0,99993
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997
Estadística Aplicada I 2023 02 256
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística Aplicada I 2023 02 257
Índice