Está en la página 1de 122

CUADERNO DE TRABAJO

EPE
MATERIAL DE TRABAJO PARA EL CURSO
ESTADÍSTICA APLICADA 1
1 CE86 Estadística Aplicada 1

Contenido
Estadística Aplicada 1 4
Logro del curso 4
Competencia: Razonamiento cuantitativo 4
Unidad 1. 6
Conceptos Básicos. Organización de datos. 6
Estadística 6
Subdivisión de la Estadística 6
Población 6
Muestra 7
Unidad elemental 7
Encuesta 7
Dato 8
Observación 8
Variable 9
Escalas de medición 11
Organización y presentación de datos 17
Tabla de distribución de frecuencias para variables cualitativas 18
Representación gráfica de variables cualitativas 19
Tabla de distribución de frecuencias de variables cuantitativas discretas 24
Representación gráfica de variables cuantitativas discretas 24
Tabla de distribución de frecuencias: variables cuantitativas continuas 27
Representación gráfica de variables cuantitativas continuas 30
Ejercicios propuestos 32
Unidad 2. 37
Medidas de resumen: Medidas de tendencia central, de posición y de variación 37
Medidas de tendencia central
Media 38
Mediana 39
Moda 40
Propiedades de la media aritmética 41
Medidas de posición o cuantiles 42
Percentil 44
Medidas de dispersión o variabilidad 45
Varianza 45
Desviación estándar 45
Coeficiente de variación 46
Medida de asimetría 49
Coeficiente de asimetría de Fisher 49
Ejercicios propuestos 55
Unidad 3. 57
Probabilidades 57
EPE 2

Experimento aleatorio 57
Espacio muestral 57
Evento 57
Probabilidad
Definición clásica de probabilidad 58
Álgebra de eventos 59
Complemento de un evento 59
Unión de eventos 59
Intersección de eventos 59
Axiomas de la probabilidad 59
Teoremas de probabilidad60
3 CE86 Estadística Aplicada 1

Probabilidad condicional 61
Partición de un espacio muestral 64
Diagrama de árbol64
Teorema de la probabilidad total 64
Teorema de Bayes 64
Ejercicios propuestos
Unidad 4. 70
Variable aleatoria 70
Distribución Normal 86
Función de densidad 86
Características 86
Estandarización 87
Ejercicios propuestos 93
Unidad 5. 96
Muestreo 96
Conceptos importantes 97
Tipos de muestreo probabilístico 98
Muestreo aleatorio simple 98
Muestreo estratificado 105
Tamaño de muestra 111
Tamaño de muestra (n) si el objetivo del estudio es estimar la media o promedio (µ) de una población
112
Tamaño de muestra (n) si el objetivo del estudio es estimar la proporción (p) de una población 115
EPE 4

Estadística Aplicada 1
LOGRO DEL CURSO
Al finalizar el curso, el estudiante analiza datos estadísticos que le permitan tomar decisiones so -
bre problemáticas reales, propias de su profesión.

Competencia: Razonamiento cuantitativo


5 CE86 Estadística Aplicada 1

Es la capacidad para interpretar, representar, comunicar y utilizar información cuantitativa diversa


en situaciones de contexto real.
Implica calcular, razonar, emitir juicios y tomar decisiones con base en esta información cuantitati-
va.

Dimensiones Indicación sobre lo que hará el estudiante

Habilidad para identificar el problema a resolver en el contexto de la situación.

¿Qué significa?

El estudiante redacta el problema, con un lenguaje sencillo, como pregunta u


Interpretación objetivo

Habilidad para elegir la herramienta, fórmula o técnica estadística que usará para
resolver el problema.

¿Qué significa?

Representación El estudiante indica la variable, tabla, gráfico, medida y/o herramienta estadís-
tica que utilizará en la solución del problema.

Habilidad de calcular para obtener los resultados.

¿Qué significa?

El estudiante muestra los cálculos realizados para dar respuesta al problema.


Cálculo

Habilidad de entender los resultados.

¿Qué significa?

Análisis El estudiante indica con que valor calculado responde el problema.

Habilidad de comunicar y sustentar la decisión final en base a su análisis.

¿Qué significa?

El estudiante redacta la decisión que tomará a partir del resultado de su análi-


Argumentación sis.
EPE 6

Unidad 1.
LOGRO
Al finalizar la unidad 1, el estudiante elabora y analiza datos organizados en tablas y gráficos.

Conceptos Básicos. Organización de datos.


7 CE86 Estadística Aplicada 1

Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, organizar,
presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.

Recopilar información:

Organizar información:

Organizar, Presentar, Analizar la información:

El estudio de la estadística se divide en dos ramas:

Estadística descriptiva (lo vemos en ESTAD. APLICADA 1)


Son métodos asociados a la caracterización, resumen y presentación de datos, que permiten describirlos
apropiadamente.
Comprende el uso de gráficos, tablas e indicadores de resumen obtenidos al realizar algunos cálculos.

Estadística inferencial (lo vemos en ESTAD. APLICADA 2)


Son métodos y técnicas que hacen posible estimar una o más características de una población o tomar deci-
siones referentes a una población, basados en los resultados obtenidos del estudio de muestras elegidas
EPE 8

adecuadamente. Estas conclusiones tienen cierto margen de error, por eso se dan con una medida de con-
fiabilidad.

La estadística apoya al tratamiento de información en los procesos investigativos por lo que se debe tener
en cuenta los siguientes términos:
9 CE86 Estadística Aplicada 1

Censo vs Encuesta
Un censo es un método para recopilar datos de toda una población. Los datos recopilados, sobre las varia-
bles de estudio, son precisos y detallados.
Una encuesta es un método de recopilación de datos de parte de una población que puede enfocarse en
conocer diferentes tipos de temas e información, como opiniones, comportamientos, preferencias de con -
sumidores, etc.
EPE 10

Ejercicio 1
La empresa SAI, Systems Artificial Intelligence, se dedica al desa-
rrollo de sistemas basados en inteligencia artificial y está confor-
mada por un equipo de especialistas de ingeniería industrial y de
sistemas. Para cumplir con las metas del próximo año, la empresa
actualmente se ha sometido a un proceso de evaluación. Por tal
motivo la empresa evaluadora ha seleccionado al azar 105 pro-
ductos de sistemas de inteligencia artificial desarrollados en los
últimos cinco años.
11 CE86 Estadística Aplicada 1

Determine la población, muestra, unidad elemental.

TODOS los productos de sistemas de inteligencia artificial desarrollados en los


Población
últimos cinco años
105 productos de sistemas de inteligencia artificial desarrollados en los últimos
Muestra
cinco años
Unidad elemental Un sistema de inteligencia artificial desarrollados en los últimos cinco años

Ejercicio 2
La empresa constructora Concreto S.A., para realizar un control de calidad de sus instrumentos, está anali-
zando 158 teodolitos electrónicos actualmente en uso. El propósito es estimar la vida útil promedio de es -
tos instrumentos. Determine:

Población TODOS los teodolitos electrónicos de la empresa constructora Concreto S.A.


Muestra 158 teodolitos electrónicos de la empresa constructora Concreto S.A.
Unidad elemental Un instrumento/teodolito de la empresa constructora Concreto S.A.

Ejercicio 3
Se desea estimar el promedio diario de clientes que ingresan a Promart, para lo cual se decide elegir cinco
días al azar del presente mes y registrar el número de clientes que ingresó cada día a la tienda. Determine:

Población

Muestra

Unidad elemental

Ejercicio 4
Pyrite es una empresa minera extranjera que cuenta con experiencia de más de dos décadas en trabajos de
movimiento de tierras, excavaciones, demoliciones, obra civil y otras actividades relacionadas con el sector
minero y de construcción civil. En los últimos meses ve al Perú como una propuesta interesante por su cre-
cimiento en la industria de la construcción. Antes de tomar una decisión investiga, mediante un estudio, la
rentabilidad de una muestra de 120 obras realizadas en Arequipa durante el tercer trimestre del año pasa-
do. Identifique:
TODAS las obras realizadas en Arequipa durante el tercer trimestre del año pa-
Población
sado
Muestra 120 obras realizadas en Arequipa durante el tercer trimestre del año pasado
Unidad elemental Una obra realizada en Arequipa durante el tercer trimestre del año pasado

Cuando se tiene definido el objetivo de una investigación, el siguiente paso es recolectar la información
“midiendo” las características de interés llamadas variables. La medición de las variables y su registro gene -
rará datos, observaciones o registros y su clasificación ordenada generará una base de datos:

Dato
Es el resultado de medir una característica de una unidad elemental.
EPE 12

Observación / Registro
Es el conjunto de datos obtenidos al medir las características de una unidad elemental.
La observación o registro se obtiene para cada unidad elemental.
13 Dato Dato Aplicada 1
CE86 Estadística

Observación o Registro
Variable
Se define así a una característica que presentan los elementos de una población y que puede asumir dife-
rentes valores cuando se realiza su medición.

Calidad en la producción de una va-


rilla corrugada de acero
Estatura (cm) (buena, regular, defectuosa) Lectura de voltímetro digital

Variables cualitativas
También son conocidas como categóricas. Son aquellas variables que al ser medidas quedan expresadas por
etiquetas o nombres que se utilizan para identificar una característica o atributo.

Variables cuantitativas
Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para identificar una
característica o atributo.
Estas a su vez pueden clasificarse en discretas o continuas.

 Una variable es cuantitativa discreta si el conjunto de posibles valores que toma es finito o infinito numera-
ble, es decir, que sólo puede tomar ciertos valores en un intervalo determinado.

 Una variable es cuantitativa continua si el conjunto de posibles valores es infinito no numerable, es decir,
que puede tomar cualquier valor en un intervalo determinado.
EPE 14

Ejercicio 5
La Corporación Aceros Perú es una empresa que se dedica a la industria del acero. Actualmente, la empresa
produce principalmente barras de acero dulce siendo su principal mercado el sector de la construcción. Al
departamento de control de calidad se le ha encargado realizar un estudio sobre las devoluciones. Al selec -
cionar una muestra aleatoria de 80 barras de acero dulce de la sección de devoluciones del almacén, se mi -
dieron las siguientes características:
1.- Uso más frecuente de barras de acero dulce:
 Estribos  Vigas cajón
 Tableros  Vigas
15 CE86 Estadística Aplicada 1

 Losas
2.- Resistencia a la tracción: ………………… (Kg/cm2)
3- Categoría del límite de fluencia
 Alta  Regular  Baja
4.- Tipo de defecto
 Pliegues  Marcas mecánicas  Porosidad
 Grietas  Fisuras  Corrosión

Considerando esta información, determine la población bajo estudio, la muestra analizada, la unidad ele-
mental y el tipo de variable.
Población TODAS las barras de acero dulce de la sección de devoluciones del almacén
Muestra 80 barras de acero dulce de la sección de devoluciones del almacén
Unidad elemental Una barra

Variable Tipo de variable

1. Cualitativa
2. Cuantitativa Continua
3. Cualitativa
4. Cualitativa

Ejercicio 6
La empresa SAI, Systems Artificial Intelligence, se dedica al desarrollo de sistemas basados en inteligencia
artificial y está conformada por un equipo de especialistas de ingeniería industrial y de sistemas. Para cum-
plir con las metas del próximo año, la empresa actualmente se ha sometido a un proceso de evaluación. Por
tal motivo la empresa evaluadora ha seleccionado al azar 105 productos de sistemas de inteligencia artifi -
cial desarrollados en los últimos cinco años. Las características de interés auditadas son:
I. Utilidades (en cientos de miles de soles)
II. Tiempo de desarrollo (días) (30, 32, 35, 30, 28, 32 días)
III. Número de programadores. (3, 2, 5, 3, 8, 7 programadores)
IV. Tipo de problemas: Falta de programadores, pocas capacitaciones, insuficientes reuniones de coordi-
nación, falta de diseñadores.
V. Nivel de dificultad: Básico, promedio, avanzado.
Determine el tipo de cada variable.

Variable Tipo de variable

I Cuantitativa continua
II Cuantitativa continua (se puede demorar 30, pero también 284 días o 532 días)
III Cuantitativa continua (puede que sean 3 programadores, pero también 284 programadores, tc)
IV Cualitativas
V Cualitativas

Ejercicio 7
EPE 16

El banco A estudió la información que dieron sus clientes en el presente mes al solicitar un préstamo vehi-
cular. Al analizar una muestra de 180 clientes se obtuvieron algunos resultados que se muestran:
I. El 12% declaró tener un trabajo independiente.
II. La media de la edad de los clientes al solicitar un préstamo fue de 41,3 años. (18, 20, 21, 18, 19 edades)
III. El 50% declaró ser casado.
IV. La media del monto de las solicitudes fue de 3025 soles.
Identifique la variable de interés y el tipo de variable.

Solución
17 CE86 Estadística Aplicada 1

Variable Tipo de variable Estimador


Porcentual/Porcenta-
I. Tipo de Trabajo Cualitativa
je
II. Edad Cuantitativa Continua Promedio/media
Porcentual/Porcenta-
III. Estado Civil Cualitativa
je
IV. Monto de las solicitudes Cuantitativa Continua Promedio/media

Escalas de medición de las variables

Ejemplos de variables según su escala de medición:

Ejercicio 8
Las redes basadas en cableado de fibra óptica están muy extendidas en su uso dentro del entorno de las te-
lecomunicaciones y redes de área local. Poseen una gran capacidad para transmitir datos.
Habitualmente el profesional que demanda un cableado de fibra óptica lo hace para conectar puntos con
gran necesidad de caudal de información, o bien para establecer líneas de datos de alta seguridad.
EPE 18

Optical Network, empresa dedicada al cableado de fibra óptica, como parte de un estudio, analiza la infor-
mación recopilada correspondiente a las siguientes variables:
I. Tipos de instalación más solicitada (Aprovechando una canalización existente, Tendido aéreo, Tendido
por fachada, Realizando obra civil)
II. Cantidad de servidores (computadoras grandes) por empresa
III. Costo de instalación (en dólares)
IV. Modelo de pistola pasacable usada (EZ50, EZ100, EZ300). Ordenadas por orden cronológico y mejoras
realizadas.
Identifique el tipo de variable y la escala de medición correspondiente.
Variable Tipo de variable Escala de medición
19 CE86 Estadística Aplicada 1

I Cualitativa Nominal
II Cuantitativa continua Razón
III Cuantitativa continua Razón
IV Cualitativa Ordinal

Ejercicio 9
Complete la siguiente tabla:
Variable Tipo de variable Escala de medición
Longitud de cable de fibra óptica usado
Cuantitativa continua Razón
en una instalación industrial
Marca de un medidor láser de distancia Cualitativa Nominal

Tiempo de vida útil de una laptop. Cuantitativa discreta Razón


Grado en el ejército (general, coronel,
Cualitativa Ordinal
comandante, etc.)
Tamaño de una bebida (personal, me-
Cualitativa Ordinal
diana, grande)

Cuando se resume la información contenida en un conjunto de datos, es necesario


especificar el nombre de la medida de resumen, promedio, por ejemplo, y si ésta
procede de una muestra o población:
Parámetro
Un parámetro es un valor que representa alguna característica de la población.

Estadístico
Un estadístico o estimador es un valor que representa alguna característica de la muestra.
Algunos parámetros y estadísticos que se pueden calcular son:

Ejemplo 1.
“En las elecciones congresales del 2020, el 24.6% de congresistas electos fueron de sexo femenino”.
EPE 20

En este ejemplo, el parámetro es <porcentaje poblacional de votantes que lo hicieron por mujeres> y su
valor es 24.6%. Es parámetro pues el porcentaje se calculó considerando todos los votos válidos.
21 CE86 Estadística Aplicada 1

Fuente: Resultados oficiales de la ONPE al 100% (2020)

Ejemplo 2.
En este ejemplo, desde que el porcentaje fue calculado a partir de una muestra obtenida antes de la vota-
ción, estaríamos hablando de un estadístico: “porcentaje muestral de electores que votarían a favor del
partido morado”. Su valor: 4%

Fuente: Ipsos-Perú

Ejercicio 10
El banco A estudió la información que dieron sus clientes en el presente mes al solicitar un préstamo vehi-
cular. Al analizar una muestra de 180 clientes se obtuvieron algunos resultados que se muestran:
V. El 12% declaró tener un trabajo independiente.
VI. La media de la edad de los clientes al solicitar un préstamo fue de 41,3 años.
VII. El 50% declaró ser casado.
VIII. La media del monto de las solicitudes fue de 3025 soles.
Identifique el estimador y el valor del estimador para cada una de las variables.
Solución

Nombre Variable Tipo de Variable Estimador Valor

V. Tipo de trabajo Cualitativo Porcentual 12%


VI. Edad Cuantitativo Continuo Media 41,3 a
EPE 22

VII. Estado Civil Cualitativo Porcentual 50%


VIII. Monto de las solicitudes Cuantitativo Continuo Media 3025

Ejemplo 3.

La gerencia general de un hotel desea invertir en publicidad para incrementar la cantidad de huéspedes ex-
tranjeros en el hotel. Se desea conocer qué características del hotel es conveniente resaltar en la publici -
dad, para ello aplicó una encuesta a una muestra aleatoria de 56 mujeres y 64 hombres extranjeros que se
hospedaron entre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:
23 CE86 Estadística Aplicada 1

Precio dispuesto Número de acom-


País de
N° Edad a pagar por habitación pañantes Criterio de selección del hotel
procedencia
en dólares por viaje
1 25 Inglaterra 80 0 Limpieza del dormitorio
2 35 Argentina 60 2 Precio
3 45 Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Francia 45 0 Precio
5 72 Francia 55 1 Amigable y cordial staff de empleados
6 28 Estados Unidos 65 2 Precio
7 45 Estados Unidos 60 1 Precio
… … … … … …

Después de procesar la información se obtuvieron los siguientes resultados:


 El 34% de los huéspedes extranjeros procede de los Estados Unidos.
 La edad promedio de los huéspedes es de 35,2 años.
 El número de acompañantes por huésped extranjero más frecuente es de dos personas.
 El criterio de selección más frecuente es el precio.
Responda a las siguientes preguntas:
a. Determine la población, la muestra y la unidad elemental.
b. ¿Cuántas observaciones hay?
c. ¿Cuántos datos conforman una observación?
d. ¿Cuántos datos hay en total?
e. Proporcione un ejemplo de dato y uno de observación.
f. Indique la escala y el tipo de cada variable.
g. Identifique el estimador y el valor del estimador para cada variable de la base de datos.

Solución
a. Determine la población, la muestra y la unidad elemental.
Todos los huéspedes extranjeros que se hospedaron en el hotel La Posada entre
Población
enero y mayo del presente año.
(Algunos) 120 huéspedes extranjeros que se hospedaron en el hotel La Posada
Muestra
entre enero y mayo del presente año.
Un huésped extranjero que se hospedó en el hotel La Posada entre enero y ma-
Unidad elemental
yo del presente año.

b. ¿Cuántas observaciones hay? Hay 120 observaciones


c. ¿Cuántos datos conforman una observación? Seis datos
d. ¿Cuántos datos hay en total? Hay 720 datos (6 x 120)
e. Proporcione un ejemplo de dato y uno de observación.

Dato X4 = 65 años
Observación X4 = 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio
f. Indique la escala y el tipo de cada variable.

Variable Tipo de variable Escala de medición

Edad Cuantitativa continua Razón

Género Cualitativa Nominal

País de procedencia Cualitativa Nominal


EPE 24

Precio dispuesto a pagar por habitación Cuantitativa continua Razón

Número de acompañantes por viaje Cuantitativa discreta Razón

Criterio de selección del hotel Cualitativa Nominal

g. Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos.

Variable Estimador Valor del estimador


Lugar de procedencia Proporción de huéspedes 0,34
25 CE86 Estadística Aplicada 1

que procede de EEUU


Edad de los huéspedes Promedio 35,2 años
Número de acompañantes Moda 2
Criterio de selección del hotel Moda Precio
EPE 26

Organización y presentación de datos

Luego de haber definido los objetivos de investigación, de haber decidido qué variables medir y luego de
registrar las mediciones obtenemos una base de datos como la mostrada. A partir de esta información pro-
cedenos a resumirla construyendo tablas de frecuencias, gráficos y posteriormente medidas de resumen
como promedios, varianzas, etc.
27 CE86 Estadística Aplicada 1
Antigüedad del
Edad del Clase del Monto asegurador Problemas frecuentes registrados
Aseguradora Causa de siniestro vehículo (años)
titular vehículo (miles de dólares) por los titulares
del vehículo
Rivera 48 Auto Choque 1 18.0 Otros
Mapres 56 Auto Choque 1 17.7 Mi seguro está por vencer
Rivera 57 Camioneta panel Choque 1 18.4 Falta de información
Rivera 61 Camioneta panel Robo parcial 1 18.5 No realice reporte policial
Auténtica 52 Station wagon Choque 2 13.0 El asesor demoró en llegar al siniestro
Atlántico 66 Camioneta rural Choque 1 19.8 Falta de información
Atlántico 53 Camioneta rural Otros 1 20.3 No realice reporte policial
Rivera 47 Auto Choque 1 16.8 Falta de información
Auténtica 46 Auto Choque 1 14.2 Falta de información
Auténtica 47 Auto Daños materiales 2 12.2 El asesor demoró en llegar al siniestro
Rivera 62 Camioneta rural Choque 2 19.6 Falta de información
Mapres 31 Auto Rotura de lunas 1 15.0 No realice reporte policial
Mapres 49 Auto Choque 2 14.4 Otros
Mapres 53 Camioneta rural Choque 1 20.5 No realice reporte policial
Atlántico 42 Auto Choque 2 11.2 Otros
Atlántico 35 Station wagon Choque 1 13.2 No realice reporte policial
Atlántico 46 Auto Choque 1 17.4 Otros
Auténtica 48 Auto Choque 1 16.7 No realice reporte policial
Atlántico 65 Camioneta rural Choque 1 19.0 Mi seguro está por vencer
Mapres 53 Camioneta rural Choque 0 25.1 No realice reporte policial
Mapres 62 Auto Choque 1 18.6 No realice reporte policial
Atlántico 32 Auto Choque 1 17.4 Otros
Rivera 31 Station wagon Robo parcial 3 13.5 Otros
Auténtica 34 Auto Choque 0 10.7 No realice reporte policial
Atlántico 45 Auto Choque 0 14.4 Falta de información
Auténtica 43 Station wagon Choque 4 13.2 Falta de información

.
EPE 28

Tabla de distribución de frecuencias o tablas estadísticas

Muestra en forma resumida la clasificación de los datos recolectados presentando el conteo de observacio -
nes para cada categoría de la variable, así como también las frecuencias porcentuales.

Frecuencias absolutas, relativas y porcentuales

 La frecuencia absoluta simple (fi ) es la cantidad de elementos que pertenecen a esa clase.
 La frecuencia relativa simple (hi ) es la proporción de elementos que pertenecen a esa clase.
29 CE86 Estadística Aplicada 1

 La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.

Tabla de distribución de frecuencias para variables cualitativas


Se deberá presentar en una primera columna las diferentes categorías que le corresponden a la variable
cualitativa y en las siguientes columnas las frecuencias i hi pi
Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias absolutas y relativas.
Si la variable está medida en escala ordinal, tendrá sentido mostrar las frecuencias absolutas acumuladas
(Fi) y relativas acumuladas (Hi).
La distribución de frecuencias se presentará en una tabla con la siguiente estructura:

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi

Categoría 1 f1

Categoría 2 f2

… … … …

Categoría k fk
Fuente: ……………………………………..

Ejercicio 11
Motores S.A. es una empresa que brinda servicios de mantenimiento y reparación de autos. El último se -
mestre reporta se siguiente información sobre la función del trabajador dentro de la empresa:
Obrero Profesional Técnico Servicios Obrero Obrero Obrero Obrero
Profesional Producción Técnico Producción Obrero Producción Obrero Obrero
Obrero Técnico Profesional Obrero Técnico Producción Profesional
Obrero Producción Técnico Profesional Servicios Obrero Profesional
a. Presente la tabla de distribución de frecuencias.
b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.
c. Realice e interprete el gráfico de barras de frecuencias absolutas.

Solución
a. Presente la tabla de distribución de frecuencias.
Título: …………………………………………………………………………………………………………
Función fi hi pi
Obrero 12 0.400 40.0%
Producción 5 0.167 16.7%
Profesional 6 0.200 20.0%
Servicios 2 0.067 6.7%
EPE 30

Técnico 5 0.167 16.7%


Total 30
Fuente: ……………………………………………………………………………

b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.


f1 = de un total de ……….… trabajadores, …………… son ……………………..……………
p4 = el …………… de los trabajadores son ……………………………….……
31 CE86 Estadística Aplicada 1

Representación gráfica de variables cualitativas

Gráfico de barras/columnas
En el eje horizontal (o vertical) se representa las categorías de la variable y en el otro eje las frecuencias ab -
solutas, relativas o porcentuales.
EPE 32

Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo que es proporcional a la
frecuencia que representan. También se denomina diagrama de sector circular, gráfico tipo torta o pastel.
Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras.

Por ejemplo, ¿Cuál es el sistema operativo más popular del mundo?


33 CE86 Estadística Aplicada 1

Ejemplo 4.
Un estudio realizado por una empresa dedicada al comercio electrónico evalúa los principales temas de
búsqueda en internet obteniendo los siguientes resultados:

Distribución de visitas en internet según tema de búsqueda


Visitas a contenidos fi hi pi
Deportes 133 0.221 22.1%
Cultura 122 0.203 20.3%
Sociedad 119 0.199 19.9%
Tecnología 107 0.179 17.9%
Otros 119 0.198 19.8%
Total 600 1.0000 100.00%
Fuente: Universidad A

Interpretación
Del gráfico se puede observar que en menor por-
centaje, el 17.9% de búsquedas en internet co-
rresponden al rubro Tecnología

Ejercicio 12
Motores S.A. es una empresa que brinda servicios de mantenimiento y reparación de autos. El último se -
mestre reporta la siguiente información sobre la función del trabajador dentro de la empresa:
Obrero Profesional Técnico Servicios Obrero Obrero Obrero Obrero
Profesional Producción Técnico Producción Obrero Producción Obrero Obrero
Obrero Técnico Profesional Obrero Técnico Producción Profesional
Obrero Producción Técnico Profesional Servicios Obrero Profesional
EPE 34

Realice el gráfico de barras y circular, luego interprete lo observado.


35 CE86 Estadística Aplicada 1

Ejercicio 13
Comente el siguiente gráfico:
EPE 36

Diagrama de Pareto
El diagrama de Pareto es una representación gráfica que permite identificar y seleccionar los aspectos
prioritarios que hay que tratar para dar solución a la mayor cantidad de problemas reportados.
La regla de Pareto propone: “El 80% de los problemas que ocurren en cualquier actividad son ocasionados
por el 20% de los elementos que intervienen en producirlos”. Esto también se conoce como “los pocos vi-
tales y muchos triviales”
La regla o ley 80-20 también se interpreta como: “En un 20% de los factores o causas se concentra el 80%
del efecto”
37 CE86 Estadística Aplicada 1

Su uso más común:


 Buscar causas principales que generan la mayoría de los problemas reportados
 Identificar oportunidades para mejorar
 Identificar productos para mejora de la calidad
 Evaluar los resultados de cambios en el proceso comparando diagramas sucesivos

Pasos para su construcción:


1. Construya la distribución de frecuencias ordenando las categorías en forma decreciente respecto
de la frecuencia absoluta simple. La categoría “Otros” es ubicada en la última posición sin importar
cuán grande sea su frecuencia
2. Dibujar un eje vertical derecho, un eje vertical izquierdo y un eje horizontal
3. En el eje vertical derecho: usar una escala de 0% a 100%
4. En el eje vertical izquierdo: usar una escala de 0 hasta el total de observaciones (n)
5. En el eje horizontal: considerar las categorías de la variable cualitativa ya ordenadas (paso 1)
6. Elaborar el gráfico de barras considerando el eje vertical izquierdo
7. Elaborar el gráfico de líneas considerando el eje vertical derecho (Curva de Pareto)

Ejemplo 5.
La siguiente tabla muestra información ordenada de Defensa Civil sobre los defectos observados con mayor
frecuencia en los puentes vecinales construidos en estructura de madera de cierta localidad del interior del
país:
Defectos fi hi Hi Hi%
Pandeos y rajaduras 40 0.32 0.32 32
Pudrimiento de las piezas 30 0.24 0.56 56
Efectos del desgaste 20 0.16 0.72 72
Deformaciones 15 0.12 0.84 84
Ataques de insectos 10 0.08 0.92 92
Acción de fuego 5 0.04 0.96 96
Otros 5 0.04 1 100
Total 125 1

Con la información mostrada construya un gráfico de Pareto y determine los principales defectos a ser
atendidos con prioridad que generan como máximo un 75% de los defectos reportados.

Fuente: Defensa civil

Gráfico de Pareto con Excel:


EPE 38

Elaborada la tabla de frecuencias, con


las categorías ya ordenadas, seleccione
la columna de categorías, la columna fi,
CTRL, columna Hi
39 CE86 Estadística Aplicada 1

Del menú principal elegir “Insertar”, “gráficos


recomendados”, “Todos los gráficos”, “Cua-
dro combinado”

 Luego, doble clic sobre la línea horizontal, elegir “Eje secundario”


 Doble clic sobre el eje vertical izquierdo: Máximo = número de datos, Mínimo = 0
 Doble clic sobre el eje vertical derecho: Máximo = 1, Mínimo = 0
 Finalmente se debe configurar el título principal y los títulos de los ejes verticales y horizontal
EPE 40

Tabla de distribución de frecuencias de variables cuantitativas discretas


Es la representación sistemáticamente organizada de los valores que presenta una variable cuantitativa dis -
creta, así como sus frecuencias absolutas simples y relativas. Además, se complementa la información con
las frecuencias absolutas y relativas acumuladas.
La estructura de la tabla de frecuencias para una variable cuantitativa discreta es la que se muestra:

Distribución de <unidades elementales> según <variable>


Valores de la varia- Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
ble discreta absoluta fi relativa hi acumulada Fi acumulada Hi
41 CE86 Estadística Aplicada 1

x1 f1

x2 f2

… … … … …

xk fk
Fuente:……………………………………………………………………………………..

Representación gráfica de variables cuantitativas discretas

Gráfico de bastones o de varas


Por lo general, el gráfico de bastones es utilizado cuando la variable cuantitativa es discreta.
Su uso es adecuado cuando existen muchas observaciones, pero pocos valores de la variable.

Ejemplo 6.
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores (trabajado-
res) de la empresa Creativa en lo que va del año.
1 2 2 0 1 1 3 2 1 1 2 0 2 1 1 1 2 2 1 1 1 2 2 1 5 2 1 0 3 1

a. Presente la tabla de distribución de frecuencias.


Distribución de colaboradores según número de capacitaciones recibidas
Número de capacitaciones fi hi Fi Hi
0 3 0.100 3 0.1000
1 14 0.467 17 0.5667
2 10 0.333 27 0.9000
3 2 0.067 29 0.9667
5 1 0.033 30 1.0000
Total 30 1.000
Fuente: Empresa Creativa

b. Interprete f2 , F2 , h3 y H2%
f2 = 14 De 30 colaboradores, 14 han recibido solo una capacitación al año
F2 = 17 De 30 colaboradores, 17 han recibido de una a menos capacitaciones al año
h2 = 0,467 La proporción de colaboradores que han recibido solo una capacitación al año es 0,467
H2%= 56,7% El 56,7% de los colaboradores han recibido de una a menos capacitaciones al año
c. Presente e interprete el gráfico de bastones de frecuencias absolutas para los siguientes datos.
EPE 42
43 CE86 Estadística Aplicada 1

Interpretación
De un total de treinta colaboradores, catorce de ellos han recibido una capacitación y solo un colaborador
ha recibido cinco capacitaciones en lo que va del año

Ejercicio 14
Luego de un periodo de tres meses de entrenamiento, los trabajadores que se integran a la empresa meta-
lúrgica Meppsa S.A. deben asistir a un máximo de 6 capacitaciones el primer año. A continuación, se mues -
tra el número de capacitaciones a las que asistieron los trabajadores incorporados a la empresa el último
año:
1 6 3 4 6 3 2 3 6 3 3 4 6 3 6 3 3 6 4 1
2 6 4 3 1 6 2 4 1 2 2 3 6 3 4 2 1 4 6 2

Solución
a. Presente la tabla de distribución de frecuencias.
Título: …………………………………………………………………..……………………………………………………………………………
X numero de capacitaciones fi hi Fi Hi
1 5
2 7
3 11
4 7
6 10
total N es 30
Fuente: …………………………………………………………………………………

b. Interprete los siguientes valores:

f3 = …………...
F2 = ………..…
h1 = …………..
H4 = …………..

c. Presente e interprete el gráfico de bastones.


EPE 44

Tabla de distribución de frecuencias: variables cuantitativas continuas

Para agrupar convenientemente los datos obtenidos al medir una variable cuantitativa continua, seguire-
mos el siguiente procedimiento:

1ro: Determinar el Rango


Está determinado por la diferencia entre el máximo y mínimo valor:
45 CE86 Estadística Aplicada 1

Rango = Xmáx - Xmín


2do: Calcular el número de intervalos
Usaremos la regla de Sturges, la cual propone:
k = 1 + 3,322 x log n
Si la estimación tiene decimales, se toma el entero más próximo (redondeo simple).

3ro: Determinar la amplitud o ancho de cada intervalo


Se calcula de la siguiente manera:

W se redondea por exceso y con la cantidad de decimales que presenten los datos.

Por ejemplo:
w
Si los datos tienen
(redondeo a más)
Cero decimales w = 50.2381 w = 51
Una cifra decimal w = 50.2381 w = 50.3
Dos cifras decimales w = 50.2381 w = 50.24
Dos cifras decimales w = 0.38000
Dos cifras decimales w = 0.38001

Marcas de clase ( )
Son los puntos medios de los límites de cada intervalo.

Ejemplo 7.
El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que pagan
los vecinos del distrito. Los datos de los pagos de impuestos, en soles, de 48 viviendas elegidas al azar en el
2015 son:

145.1 151 159 195.6 196.9 202.6 204.9 206.1 206.5 208 208 209.3
216.3 225.9 227.1 231.2 234.8 238.4 239.9 241.1 242.9 244 247.7 249.5
252.5 257.1 259.2 262.5 265.2 271 286.7 288.1 289.1 291 291.9 294.5
303.6 305.8 315.4 315.5 317.2 320.2 324.8 331.1 331.7 344.6 346.7 351.1

Elabore la tabla de frecuencias para la variable “Pago por impuestos municipales” para el presente año.

Solución
El rango r se calcula con:
r = valor máximo – valor mínimo = 351,1 – 145,1 = 206

Número de intervalos es: (redondeo simple)

La amplitud se calcula por:

Usamos redondeo por exceso a un decimal debido a que los datos tienen como máximo un decimal.

A continuación, la tabla de distribución de frecuencias.


EPE 46

Distribución de viviendas según pago de impuesto municipal (en soles)


Pago de impuestos Marca de clase fi hi Fi Hi
[145.1 ; 174.6] 159.85 3 0.0625 3 0.0625
]174.6 ; 204.1] 189.35 3 0.0625 6 0.1250
]204.1 ; 233.6] 218.85 10 0.2084 16 0.3334
]233.6 ; 263.1] 248.35 12 0.2500 28 0.5834
]263.1 ; 292.6] 277.85 7 0.1458 35 0.7292
]292.6 ; 322.1] 307.35 7 0.1458 42 0.8750
]322.1 ; 351.6] 336.85 6 0.1250 48 1.0000
47 CE86 Estadística Aplicada 1

Total 48 1.000
Fuente: Oficina de Rentas de la Municipalidad

Interprete:

f2 = 3 En tres viviendas pagaron más de 174.60 soles y hasta de 204.10 soles

F2 = 6 En seis viviendas pagaron hasta 204.10 soles

h3 %= 20.84% El 20.84% de las viviendas pagaron más de 204.10 soles y hasta 233.6 soles

H3 %= 33.34% El 33.34% de las viviendas pagaron hasta 233.60 soles

Ejercicio 15
MetalTec es una empresa que brinda servicios de instalación, mantenimiento y reparación de estructuras
metálicas que viene operando desde el año 2005. La gerencia se ha propuesto eva luar la eficiencia para
atender los pedidos de sus clientes. Con este propósito selecciona aleatoriamente una muestra de registros
de ventas resaltando siguientes características:
 Tiempo que se tarda para atender un pedido.
 Nivel de satisfacción del cliente (completamente satisfecho, satisfecho, poco satisfecho nada satisfecho)
 Distrito en el que se encuentra el cliente.
Algunos de los resultados obtenidos luego de analizar la muestra, fueron:
 El tiempo promedio de atención es de 52 minutos.
 En cuanto al nivel de satisfacción el 31.5% estaban completamente satisfecho, 33.7% satisfecho, 29.2% poco sa-
tisfecho y el resto nada satisfecho.
 El 30% de los pedidos son realizados en el distrito de Ate.
a) Determine la población, muestra, variables, tipo de variables, escalas de medición

Población

Muestra

Unidad elemental

Variable Tipo Escala

I.
II.
III.

b) Los tiempos en atender los pedidos (minutos), se presentan a continuación:


73.7 69.3 32.2 33.7 64.9 10 99.3
3.6 15 24.6 35 23.7 66 36.8
7.3 58.5 31.8 6.7 53.9 63.9 24.2
7.6 73.8 85.9 15.7 88.3 50.3 79.3
9.9 12.3 10.1 12.6 42 5.1 85.9
Presente los datos en una tabla de frecuencia.

Solución
Cálculo de los límites de los intervalos
EPE 48

Máximo =MAX(datos)
Mínimo =MIN(datos)
Rango =MAX(datos) – MIN(datos)
Cantidad de datos (n) =CONTAR(datos)
k (por regla de Sturges) =1+3,322*LOG10(n)
k (entero)
w (amplitud) =Rango/k (entero)
w (redondeada por exceso)
49 CE86 Estadística Aplicada 1

Distribución de ……………………… según ……………………..….


Marca de cla-
Tiempo de servicio fi hi Fi Hi
se
  
  
  
  
  
  
  

Fuente: …………………………….

Interprete:

f4 = …………..

F2 = ………….

h1 = …………..

H4 = ………….

Representación gráfica de variables cuantitativas continuas


Histograma

Este gráfico se realiza a partir de una tabla de frecuencias absolutas, relativas o porcentuales.
 Se traza colocando la variable sobre el eje horizontal y las frecuencias sobre el eje vertical.
 Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase sobre
el eje horizontal y cuya altura es proporcional a la frecuencia correspondiente.

Ejercicio 16
EPE 50

A continuación, se muestra el número de camiones vendidos para el mercado nacional y extranjero que se
reportó en 209 meses.
Título: …………….………………………………………………………………………………………………………………………………
Marca de clase fi hi Fi Hi
[10 , 20 6
20 , 30 15
30 , 40 45
40 , 50 63
50 , 60 80
51 CE86 Estadística Aplicada 1

Total
Fuente: Empresa A

Grafique el histograma de frecuencias relativas.

Solución

Fuente: …………………………………………………………………….
Interpretación

Ejemplo 8.
La gerencia de una compañía, que brinda servicios de llamadas por celulares, está preocupada por el poco
monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de administración
que eligiera, del mes de enero, una muestra de clientes de Lima y registró el monto que costaron sus llama -
das, en soles.
El encargado mostró los resultados en una tabla de distribución de frecuencias:

Distribución de clientes según monto de las llamadas (en soles)


Marca de cla-
Monto de llamadas fi hi Fi Hi
se
0  10  5 12 0.1000 12 0.1000
10 20  15 22 0.1833 34 0.2833
20 30  25 45 0.3750 79 0.6583
30 40  35 23 0.1917 102 0.8500
40 50  45 12 0.1000 114 0.9500
50 60  55 6 0.0500 120 1.0000
Total 120 1
Fuente: Área de Administración

Grafique el histograma de frecuencias porcentuales.


EPE 52

Solución
53 CE86 Estadística Aplicada 1

Interpretación
A partir del gráfico podemos observar que el 37,5% de los clientes de Lima tienen montos superiores a 20 y
como máximo de 30 soles y que solo el 5% de estos clientes tienen montos superiores a 50 y como máximo
de 60 soles.
EPE 54

Ejercicios propuestos

1. Pyrite es una empresa minera extranjera que cuenta con experiencia de más de dos décadas en
trabajos de movimiento de tierras, excavaciones, demoliciones, obra civil y otras actividades relaciona-
das con el sector minero y de construcción civil. En los últimos meses ve al Perú como una propuesta
interesante por su crecimiento en la industria de la construcción. Antes de tomar una decisión investi-
ga, mediante un estudio, la rentabilidad de una muestra de 120 obras realizadas en Arequipa durante
el tercer trimestre del año pasado. Entre las variables consideradas se encuentran:

Nro Variable Unidad / Descripción


55 CE86 Estadística Aplicada 1

01 Profundidad de excavación mt
02 Tipo de terreno Roca dura / Tierra fuerte / Roca blanda o tri-
turada
03 Maquinaria Pala excavadora / Compresor / retroexcava-
dora
04 Nro de camiones contratados
05 Costo total de la obra soles

Identifique la población, muestra, variables, tipo de variables, escalas de medición

2. El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad en el departamento


de Lima y por las consecuencias que esto podría generar, especialmente en algunos distritos como el
Cercado de Lima. Por esta razón Defensa Civil realizó un diagnóstico de la situación de las viviendas en
el mencionado distrito a través de una muestra de 1200 viviendas seleccionadas al azar. Se registraron
las siguientes variables:
I. Tiempo de construida la vivienda (años).
II.Tipo de material usado en la construcción (1 = Cemento, 2 = Adobe, 3 = Quincha, 4: Material prefa-
bricado)
III. Número de habitaciones por vivienda.
IV. Área del terreno en donde se construyó la vivienda.

a. De acuerdo con el enunciado anterior identifique la población, la muestra y unidad elemental.


b. Identifique el tipo de variable y la escala de medición de cada variable.

3. Indique el tipo de variable y la escala de medición de las características observadas al analizar una
muestra de secciones de tuberías de agua.

Variable Tipo de variable Escala de medición


Diámetro de la tubería (pulgadas)
Material de la tubería
Año de instalación
Ubicación (subterránea, aérea)
Longitud de la tubería (pies)
Estabilidad del suelo circundante (inestable,
moderadamente estable o estable)
Corrosividad del suelo circundante (corrosivo
o no corrosivo)

4. Se encuestó a 245 estudiantes de la universidad A. Se sabe que en esta universidad el 72% del
alumnado pertenece al área de Humanidades y el resto al área de Ciencias.
Después de procesar la información muestral se obtuvo que:
 56% eran mujeres,
 el 33,2% prefiere el rock como género musical,
 el 45,7% gusta de la emisora 104,7 VIVA F.M.
 la media del número de veces que un oyente llamó a la radio en el último mes fue de 2,86 llamadas
y la moda de esa misma variable fue igual a uno.
Identifique el estimador o parámetro y su valor para cada una de las variables.
EPE 56

5. A un grupo de compradores de auto tomados al azar, se les preguntó sobre el color de su auto. Los re -
sultados obtenidos fueron:
Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde Blanco Azul
Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul Verde Negro
Azul Blanco Verde Blanco Blanco Rojo Blanco Rojo Azul Verde Blanco Negro
Negro Rojo Negro Rojo Rojo Verde Negro Negro Blanco Blanco Azul Blanco
a. Presente la tabla de distribución de frecuencias que resuma la información de la variable.
b. Realice un gráfico circular. ¿Qué puede observar acerca del color de auto?
57 CE86 Estadística Aplicada 1

6. Complete la siguiente tabla de distribución de frecuencias que representa el número de fallas re-
portadas en el acabado de automóviles. Antes de salir al mercado el lote producido, se analizó una
muestra de 100 autos.

Número de fallas fi Fi hi% Hi%


1 5%
2 14% 19%
3 18
4 62
5 20
6 92%
7 97%
8
Total

a. Identificar la unidad de análisis, variable y su tipo.


b. Interprete los valores f3, h2%, F6, H5%

7. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas de


ahorros cerradas por día. La información disponible para este fin se muestra a continuación:

0 3 1 2 1 0 2 3 0 1 4 1 4 4 0 4 3 1 2 2
1 5 0 5 4 1 0 2 1 3 0 3 2 1 1 2 5 4 0 1

a. Construya la tabla de distribución de frecuencias para la variable en estudio.


b. Construya el gráfico de bastones para representar la variable en estudio.

8. Los datos corresponden a los ingresos, en cientos de soles, de una muestra de 60 clientes del banco
A.
5.25 7.22 8.53 9.27 9.54 10.21 10.32 10.45 10.52 10.76
10.85 11.25 11.56 12.42 13.27 14.65 15.72 16.85 17.22 18.56
19.32 20.56 21.72 22.85 23.12 24.32 25.65 26.72 28.72 29.65
31.42 32.71 33.55 34.28 35.21 37.45 38.32 39.65 41.22 43.28
45.72 47.32 49.45 51.27 52.38 54.75 55.81 56.27 57.45 58.22
59.32 61.45 63.75 65.72 66.85 69.32 69.54 72.30 75.81 77.42
a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges.
b. Interprete los valores de f2, h3 y H4.

9. “La Italiana” es una empresa dedicada a la fa- bri-


cación de embutidos cárnicos que enfoca su pro- ce-
so de producción en mejorar y optimizar sus pro- duc-
tos para qué de esta forma, puedan cumplir con los
estándares del mercado e incluso superarlos. La em-
presa está interesada en identificar los problemas
principales que afectan la elaboración de embuti- dos
crudos curados.

Problema más importante fi


Embarrado 11 En base a la información presentada cons-
truya el diagrama de Pareto y determine
Embutición 20
los principales problemas a ser atendidos
EPE 58

Nitrificación 12 con prioridad por la empresa.


Otros 10
Sabor 7
Textura 18

10. La tabla muestra la distribución del ingreso familiar diario correspondiente a 80 familias.

Ingreso familiar diario fi Fi hi


[160 – 170
170 – 180 48 60
59 CE86 Estadística Aplicada 1

180 – 190 0.125


190 – 200 0.075
200 – 210
Fuente: Ciudad A

a. Complete los elementos faltantes de la tabla de frecuencias.


b. Determine el número de familias que ganan hasta 190 soles.
c. Determine el porcentaje de familias que ganan más de 180 soles y hasta 190 soles.
d. Determine el porcentaje de familias que ganan más de 170 soles y hasta 200 soles.
e. Determine el porcentaje de familias que ganan más de 190 soles.

11. Se ha demostrado que el PH del café está relacionado con la acidez percibida del café. Un PH entre
4.5 y 5.5 es el rango preferido para una buena taza de café. A continuación, se presenta el PH de una
muestra de tazas de café instantáneo Buencafé tradición producido por la empresa:

3.0 3.1 3.3 3.5 3.8 3.9 3.9 4.2 4.3 4.4
4.4 4.5 4.5 4.5 4.6 4.7 4.7 4.8 4.9 4.9
5.0 5.1 5.1 5.2 5.3 5.3 5.3 5.4 5.4 5.5
5.5 5.6 5.6 5.7 5.7 5.8 5.8 5.8 5.9 5.9
5.9 5.9 6.0 6.0 6.0 6.1 6.1 6.2 6.3 6.5

a. Elabore una tabla de frecuencias para la variable involucrada.


b. Construya un histograma de frecuencias

12. DIFUNDE es una de las principales corporaciones empresariales mundiales líder en la promoción
y gestión de infraestructuras (construcción, industrial, agua y servicios) y energías renovables. Su ofer-
ta cubre toda la cadena de valor desde el diseño y la construcción, hasta la operación y el manteni -
miento. De los últimos proyectos realizados ha registrado las principales dificultades que se presenta-
ron en el desarrollo de cada uno de ellos:
Problema Número de proyectos
Dificultad para importar material 60
Otros 10
Atrasos en pagos por el inversionista 8
Accesibilidad a la zona 14
Falta de profesional calificado 28
Total 120
Determine los principales problemas a los que se debe dar solución para atender a lo más el 75% de
las dificultades presentadas en los proyectos realizados.

13. Se tiene información sobre los problemas de soporte técnico encontrados durante la instalación
y configuración de VaryPlot, programa usado en ingeniería civil. Construya un gráfico apropiado para
identificar los problemas a resolver con prioridad y atender, como máximo al 82% de problemas repor-
tados. La información resumida se presenta a continuación.

Problema Descripción fi
A Error en la actualización 200
B Permisos insuficientes 150
C Problemas con el sistema de nombres de dominio (DNS) 70
D Forestprep o Domainprep no finalizaron correctamente 80
E Falta el contenedor de conexiones de Active Directory 20
Otros Otros problemas 40
EPE 60

14. Tito´s, empresa dedicada a la venta de comida rápida por delivery, desea elevar el nivel de satisfac-
ción de sus clientes. Para atender las quejas más relevantes, llevó a cabo una encuesta por teléfono
entre 200 clientes que realizaron pedidos durante el último mes. Las quejas manifestadas por estos
clientes se resumen a continuación:

Quejas hi
Tiempo de entrega del pedido 0,40
Calidad del producto entregado 0,15
Error en el pedido 0,20
Otros 0,10
61 CE86 Estadística Aplicada 1

Cordialidad del empleado 0,10


No existe variedad 0,03
Precio 0,02

Presentando un gráfico apropiado, ¿Qué recomendaría al gerente de esta empresa de venta de comi-
da rápida por delivery?

15. CBT es un distribuidor de productos de automatización eléctricos y transmisiones de potencia.


Últimamente, a pesar de la innovación en tecnología, se ha observado un constante retraso en las
entregas por lo que el gerente desea saber cuáles son los errores más frecuentes para tomar una
acción de mejora. Por tanto, diseñó un formato donde se registran los errores de cada orden que no
se entregan a tiempo. Realice un análisis de los tipos de errores que se presentan en la entrega a
destiempo de los pedidos y ayude al gerente a decidir cuáles son las causas principales de este pro-
blema.
Tipo de error fi
Error en el producto solicitado 37
Error en la cantidad solicitada 24
La orden de compra no está en el sistema 17
Falta de stock 5
Dirección de envío errónea 24
Doble envío 15
Otros errores de menor frecuencia 18

16. Dream Perú S.A.C. es una empresa industrial que, entre otras cosas, se dedica a la fabricación de
colchones. En la planta de producción el jefe de control de calidad está realizando una inspección de
los defectos de fabricación y de esa manera adoptar medidas correctivas. Si el jefe de control de cali-
dad desea corregir hasta un 76% de los defectos. ¿cuáles se deben de corregir con prioridad? Utilice la
siguiente información:

Defectos Reportados fi

Agujeros 38

Motas 46

Resortes 54

Otros 9

Deformaciones 12

Costuras 25

Total 184

17. Perú Plast S.A. es una empresa, qué entre otras cosas fabrica bolsas plásticas. El jefe de control de
calidad está realizando una inspección de los posibles defectos de producción, para este propósito eli-
ge una muestra aleatoria de bolsas plásticas de la producción. Es su propósito corregir a lo más el 65%
de los defectos reportados. Si llegara a detectar al menos tres defectos, entonces elevaría un informe
técnico al jefe de producción recomendándole calibrar sus máquinas.
EPE 62

En base al análisis del caso, ¿el jefe de control de calidad elevará el informe técnico al jefe de produc -
ción? Utilice las dimensiones del razonamiento cuantitativo para resolver el caso y la siguiente infor-
mación:
Nº de bolsas plásticas
Defectos
Mucha tinta 36
Costuras endebles 55
Sin el peso adecuado 28
Otros 12
Tinta contaminante 16
63 CE86 Estadística Aplicada 1

Mal diseño 23
Total 170
EPE 64

Unidad 2.
LOGRO
Al finalizar la unidad 2, el estudiante interpreta resultados obtenidos de medidas descriptivas.

Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que se obtienen al
medir variables sobre los elementos de una muestra o población.
65 CE86 Estadística Aplicada 1

Podemos distinguir cuatro grupos:

Fuente: Diario El Comercio 25/04/2018

Medidas de tendencia central


Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del cual tien -
den a concentrarse o distribuirse las demás observaciones. El objetivo es conseguir un valor que sea repre -
sentativo del conjunto total de datos que se está analizando.

Los ingresos, en dólares, para un grupo de perso-


nas son los siguientes:
2650, 2500, 2580, 2420, 2350
El ingreso promedio es $ 2500
¿Es éste un valor representativo del ingreso para
este grupo de personas?
EPE 66

Los ingresos, en dólares, para un grupo de perso-


nas son los siguientes:
2650, 2500, 2580, 2420, 15200
El ingreso promedio es $ 5070
¿Es éste un valor representativo del ingreso para
este grupo de personas?

Si el promedio no es representativo, ¿qué alternativas disponemos si se quiere hallar un valor central alre -
dedor del cual se distribuyen los demás?
67 CE86 Estadística Aplicada 1

Media
La media de un conjunto de valores de una variable es la suma de dichos valores dividida entre el número
de valores. También se le denomina media aritmética o promedio.

La fórmula para calcular la media es:


 Media muestral
 Media poblacional

En Excel, use la función =PROMEDIO(DATOS)

Analice la siguiente información:


Ingreso promedio mensual según grupos de edad
Variación
Marzo-Abril- Marzo-Abril-
Absoluta Porcentual
Mayo 2018 Mayo 2019
(Soles) (%)
Total 1 650,0 1 723,7 73,7 4,5
Grupos de edad
De 14 a 24 años 1 030,0 1 083,8 53,8 5,2
De 25 a 44 años 1 746,0 1 778,6 32,6 1,9
De 45 y más años 1864,6 1 955,2 90,6 4,9

Ejemplo 9.
Los siguientes datos corresponden al número de visitas al mes que una muestra de 30 estudiantes realizó a
la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1

Variable:
Tipo de variable:
Escala:
Calcule e interprete la media de la variable en estudio.

Solución
La media del número de visitas de los 30 estudiantes es de 2,6 visitas al mes.
Esto significa que el número de visitas al mes a la cafetería de la universidad está alrededor de 2,6 veces al
mes.

Ejercicio 17
Los siguientes datos corresponden a la estatura, en metros, de una muestra aleatoria de hombres peruanos
de 18 años.
1.73 1.73 1.84 1.71 1.61 1.50 1.78
EPE 68

Calcule e interprete el promedio de la variable en estudio.

Solución
El promedio de la estatura de una muestra de hombres peruanos de 18 años es …………………………………..….
Interpretación:
69 CE86 Estadística Aplicada 1

Mediana
La mediana de un conjunto de datos observados de una variable es el valor que ocupa la posición central
una vez puestos los datos en orden de magnitud, es decir, ordenados de menor a mayor.
La mediana es el valor tal que aproximadamente el 50% de las observaciones son menores o iguales a su
valor. Se denota por Me.

En Excel, use la función =MEDIANA(DATOS)

Ejercicio 18
Interprete las siguientes afirmaciones.
La mediana de la edad de las peruanas es 28 años.

La mediana de la estatura de los peruanos es 1.68 metros.

Características de la mediana

 Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.


 La mediana es una medida robusta, es decir, no se ve afectada por valores extremos. Por eso se le uti-
liza cuando hay datos inusuales o la distribución de frecuencias no es simétrica.

Ejercicio 19
Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de estu-
diantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1

Calcule e interprete la mediana de la variable en estudio.

Solución
Me = …………
Interpretación: 50% de los estudiantes visitaron la cafetería de la universidad como máximo …………… veces

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor fre-
cuencia. Se denota por Mo.

Características de la moda
EPE 70

 La moda se puede calcular para cualquier escala de medición.


 El valor de la moda no se ve afectada por valores extremos.
 La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más de
dos modas (multimodal).
 Un conjunto de datos pudiera incluso no tener moda.
 La moda es una medida menos importante que la mediana o la media debido a su ambigüedad.

En Excel, use la función =MODA.VARIOS(DATOS)

Ejercicio 20
71 CE86 Estadística Aplicada 1

Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de estu-
diantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1 2 4 1 4 1
5 5 5 3 1 3 1 4 1 1 5 2 3 2 1 6 2 3 2 8

Calcule e interprete la moda de la variable en estudio.

Solución
Mo = …….
Interpretación: Los estudiantes visitan con mayor frecuencia la cafetería de la universidad …………………… vez
al mes.

Ejercicio 21
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados de la
carrera de Ingeniería de Redes y Comunicaciones.

Edad (años) 25 20 21 31 21 24 30 21 22 31 21 28 31 31 24
Estatura (cm) 154 154 154 184 173 170 176 188 168 161 171 175 187 161 161

Calcule e interprete la moda de la edad y la moda de la estatura.


Solución

Propiedades de la media aritmética


 El valor de la media es sensible a los valores extremos, por lo que varía mucho con valores muy grandes
o pequeños con respecto a los demás.
 El promedio de una cantidad constante es la misma constante: M(K) = K
 Si una variable X se expresa como: Y = aX ± K,
siendo a y k constantes, entonces: M(Y) = M(aX ± K) = aM(X) ± K
 Si n1 datos tienen media y n2 datos tienen media , luego la media de los n1+ n2 datos es:

Ejemplo 10.
En una negociación por aumento de salarios, la gerencia de la empresa A ofrece a sus empleados dos alter -
nativas.
 La primera consiste en un aumento general del 5%.
 La segunda consiste en un aumento general del 2% más un bono de 150 soles.
Indique la alternativa que da a los empleados el mayor promedio de sueldos, si la media de los sueldos es
actualmente de 3700 soles.

Solución
Alternativa 1
X: Salario M(X) = 3700
Y: Nuevo salario Y = X + 0.05X
EPE 72

Y = 1.05X
M(Y) = M(1.05X)
M(Y) = 1.05M(X) = 1.05*3700 = 3885
Alternativa 2
X: Salario M(X) = 3700
Y: Nuevo salario Y = X + 0.02X + 150
Y = 1.02X + 150
M(Y) = M(1.02X+ 150)
M(Y) = 1.02M(X) + 150 = 1.02*3700 + 150 = 3924

Decisión
73 CE86 Estadística Aplicada 1

Ejercicio 22
Se sabe que los ingresos mensuales que perciben los trabajadores de una empresa tienen un promedio de
2800 soles, determine el nuevo ingreso promedio que se obtendría luego de realizar los siguientes aumen-
tos:
a. los ingresos de los trabajadores se incrementan en 250 soles.
b. los ingresos se incrementan en un 7.5%.
c. los ingresos se incrementan en un 12.5% más una bonificación de 125 soles.

Solución

Relación entre Media, Mediana y Moda


Para conocer la forma que presenta la distribución de un conjunto de datos unimodal podemos cuantificar
el grado de deformación horizontal comparando las tres medidas de tendencia central:

 Si los datos se concentran alrededor de la media con igual frecuencia por debajo y encima de la media,
se dice que la distribución es simétrica. En este caso coinciden la media, mediana y moda.
 Si la concentración de datos ocurre hacia los valores menores, diremos que la distribución es Asimétrica
positiva o de sesgo derecho.
 Si la concentración de datos ocurre hacia los valores mayores, diremos que la distribución es Asimétrica
negativa o de sesgo izquierdo.

Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media
Distribución Asimétrica Negativa Distribución Simétrica Distribución Asimétrica Positiva
EPE 74

Medidas de posición o cuantiles


Las medidas de posición o cuantiles son los valores que determinan la posición de un dato respecto a todos
los demás datos de una serie y que previamente ha sido ordenada de menor a mayor.

Los cuantiles más importantes dividen a los datos ordenados de menor a mayor en 4, 10 y 100 cantidades
iguales de datos, denominándose cuartiles, deciles y percentiles, respectivamente.
75 CE86 Estadística Aplicada 1
EPE 76
77 CE86 Estadística Aplicada 1

Percentiles
Los percentiles dividen el conjunto de datos en 100 partes porcentualmente iguales.
El percentil k, Pk, es el valor tal que aproximadamente el k% de los datos ordenados es menor o igual a ese
valor y el (100 – k)% de los datos es mayor a ese valor.

En Excel, use la función =PERCENTIL.EXC(datos; k/100)

Ejercicio 23
Interprete la siguiente afirmación:
De acuerdo con la Organización Mundial de la Salud (OMS), el percentil 15 del peso de una niña de un año
en el mundo es ocho kilos.

Ejercicio 24
Indique, en los siguientes casos, el percentil adecuado:
50% de las observaciones 50% de las observaciones
P…..

30% de las observaciones 70% de las observaciones


P…..

60% de las observaciones 40% de las observaciones


P…..

22% de las observaciones 33% de las observaciones 45% de las observaciones


P…… P……..

Ejercicio 25
A continuación, se presentan los ingresos mensuales, en soles, de un grupo de trabajadores de una empre -
sa:
2548 3120 1870 2458 3000 2890 1500 4005 1900 2410 2300 2870
2710 2955 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

a. Calcule el ingreso mensual mínimo para estar en el 15% de los trabajadores que más ganan.
b. Calcule el ingreso mensual mínimo para estar en el quinto superior de los trabajadores que más ganan.
Solución

a. Calcule el ingreso mensual mínimo para estar en el 15% de los trabajadores que más ganan.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)


EPE 78

b. Calcule el ingreso mensual mínimo para estar en el quinto superior de los trabajadores que más ganan.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)


79 CE86 Estadística Aplicada 1

Medidas de dispersión o variabilidad


Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero no in-
dican qué tan cercanos o lejanos están los datos de dicho valor central.
Las medidas de dispersión o variabilidad indican cuán alejados están los valores de una variable del valor
que los representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.
Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de la me-
dida de tendencia central, en cambio si la medida de dispersión tiene un valor grande, los datos no están
concentrados alrededor de la medida de tendencia central.

Varianza
La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a su media
aritmética.

Se calcula usando la siguiente fórmula:

Varianza poblacional

Varianza muestral

En Excel, use la función =VAR.S(datos)

Desviación estándar
Se define como la raíz cuadrada positiva de la varianza.

En Excel, use la función =DESVEST.M(datos)

Características de la varianza y la desviación estándar


 La varianza y la desviación estándar son números reales no negativos.
 Se pueden calcular para variables medidas en escala de intervalo o razón.
 Se ven afectadas por valores extremos.
 La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que la desviación
estándar es expresada en las mismas unidades de los datos.

Ejemplo 11.
Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respuestas
mostradas en la siguiente tabla:
2 1 2 4 1 3 2 3 2 0 5 1

Calcule la varianza y la desviación estándar de la variable en estudio.


Solución
En Excel, use la función:
 =VAR.S para calcular la varianza muestral, s2 = 1,9697 hijos2.
 =DESVEST.M para calcular la desviación estándar muestral, s = 1,4035 hijos.
EPE 80

Coeficiente de variación
Las medidas de dispersión estudiadas son medidas de variación absolutas, pues se expresan en las mismas
unidades que la variable, excepto la varianza que se expresa en unidades al cuadrado.

Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales unida-
des, pero difieren a tal punto que una comparación directa de las respectivas desviaciones estándar no es
muy útil, por ejemplo, cuando las medias están muy distantes.
Es una medida libre de unidades por lo que es útil para comparar la variabilidad de dos o mas grupos de da -
tos, aunque estén expresados en diferentes unidades de medida.
81 CE86 Estadística Aplicada 1

Al coeficiente de variación también se le denomina una medida de dispersión relativa.


El coeficiente de variación (CV) de un conjunto de datos indica el porcentaje que es la desviación estándar
en comparación con la media.
Se calcula en variables medidas en escala de razón.

Cálculo del CV
La fórmula para su cálculo es:
Coeficiente de variación poblacional

Coeficiente de variación muestral

En Excel, use la función =DESVEST.M(datos)/PROMEDIO(datos)

Ejercicio 26
Usando la opción <Análisis de datos> y la función =PERCENTIL.EXC(datos; k/100) de Excel se ha obtenido la
siguiente tabla de las respuestas obtenidas del tiempo de servicio en una encuesta realizada a una muestra
de 400 empleados de la empresa A realizada el presente año.
Estadísticos Casado Soltero Divorciado
Media 141.823 143.285 135.75
Mediana 132 112 128
Moda 94 #N/A 124
Desviación estándar 46.042 65.288 45.921
Varianza de la muestra 2119.904 4262.571 2108.733
Coeficiente de asimetría 1.612 1.958 0.059
Rango 180 181 139
Mínimo 94 99 61
Máximo 274 280 200
Cuenta 170 70 160
Percentil 25 120.2 110.6 128.6
Percentil 75 186.7 198.6 187.4
a. ¿En qué estado civil el tiempo de servicio presenta mayor dispersión?
b. ¿En qué estado civil el tiempo de servicio es más disperso en el 50% central?

Solución
a. ¿En qué estado civil, el tiempo de servicio presenta mayor dispersión?
Estado civil Media Desviación estándar Coeficiente de variación
Casado
Conviviente
Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el estado civil …………………………….….............


porque …………………………………………………………………………………………………………………………………………..

b. ¿En qué estado civil el tiempo de servicio es más dispersión en el 50% central?
Estado civil Q1 Q3 RIC
Casado
Soltero
EPE 82

Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el 50% central de los datos es en el estado civil
…………………………….. porque ………………………………………………………………………………………….…………

Ejercicio 27
Los datos presentados a continuación corresponden a los montos y el tipo de pago realizados por una
muestra de 100 clientes de una cadena de supermercados. Los directivos de esta empresa pidieron tomar
la muestra para conocer el comportamiento de los pagos de los clientes.
Cheque
83 CE86 Estadística Aplicada 1

5.00 17.87 18.77 21.11 22.67 25.96 30.60 31.07 31.74 34.67
35.38 36.09 36.48 37.20 37.60 37.94 38.58 39.55 40.51 41.10
41.58 42.69 42.83 43.14 48.95 49.21 50.58 51.66 52.04 52.87
54.84 55.40 57.59 58.11 58.64 58.75 59.78 69.22 72.46 78.16
Efectivo
1.09 1.27 1.85 2.44 2.87 2.96 3.31 3.65 4.34 4.75
5.08 5.15 5.91 5.98 6.93 7.02 7.17 7.22 7.40 7.41
7.88 8.81 8.85 9.00 11.17 11.54 11.77 12.07 13.09 14.28
15.07 15.10 15.57 16.28 16.38 16.69 18.09 20.48
Tarjeta
14.44 19.78 22.59 25.57 26.57 26.91 27.66 27.89 33.76 44.53
46.13 46.24 48.11 50.30 52.35 52.63 53.32 54.19 55.21 57.55
69.77 94.36
a. ¿Cuál de las tres formas de pago presenta mayor homogeneidad?
b. ¿Cuál de las tres formas de pago presenta mayor homogeneidad en el 50% central?

Solución
a. ¿Cuál de las tres formas de pago presenta mayor homogeneidad?
Para calcular el coeficiente de variación use las funciones:
 =PROMEDIO(datos) para calcular la media
 =DESVEST.M(datos) para calcular la desviación estándar.
Luego, divida cada desviación estándar entre su respectiva media.
Forma de pago Media Desviación estándar Coeficiente de variación
Cheque
Efectivo
Tarjeta

Por lo tanto, la forma de pago más homogénea es…………………………………………………………….. porque


……………………………………………………………………………………………………………………………………………………..

b. ¿Cuál de las tres formas de pago presenta mayor homogeneidad en el 50% central?
Forma de pago
Cheque
Efectivo
Tarjeta

Por lo tanto, la forma de pago más homogénea en el 50% central es ……………………………….. porque
……………………………………………………………………………………………………………………………………………..

Ejemplo 12.
Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto artículo
que realizaron dos grupos de técnicos.
Grupo 1: Media = 3 y desviación estándar = 1,10 Grupo 2: Media = 5 y desviación estándar = 1,66
¿En cuál de los grupos el número de mediciones es más disperso?

Solución
EPE 84

Se usa como indicador el coeficiente de variación:

El número de mediciones es más disperso en el grupo 1, puesto que su coeficiente de variación es mayor.
85 CE86 Estadística Aplicada 1

Medida de asimetría
Para conocer la forma que presenta un conjunto unimodal de datos podemos cuantificar el grado de defor-
mación horizontal calculando el Coeficiente de Asimetría de Fisher (As)

 Si los datos se concentran alrededor de la media con igual frecuencia por debajo y encima de la media,
se dice que la distribución es simétrica. En este caso coinciden la media, mediana y moda. As = 0
 Si la concentración de datos ocurre hacia los valores menores, diremos que la distribución es Asimétrica
positiva o de sesgo derecho. As > 0
 Si la concentración de datos ocurre hacia los valores mayores, diremos que la distribución es Asimétrica
negativa o de sesgo izquierdo. As < 0

Coeficiente de asimetría de Fisher

El coeficiente de asimetría de Fisher se define como:

Se tiene que:

En Excel, use la función =COEFICIENTE.ASIMETRIA(datos).

Ejercicio 28
Complete los siguientes textos:
 Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una concentra -
ción de datos en los valores …………………………………………
 Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una concentración
de datos en los valores …………………………………………
 En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de asimetría
…………………..…….., porque ………………………………..…………………………………………
 En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente tienen un
coeficiente de asimetría ……………………………………….………….., porque ………………………………..
…………………………………………………………………………………………………

Ejercicio 29
La empresa A desea saber si la capacitación en una tarea ha reducido el tiempo en que se fabrica un cierto
producto. Para lo cual ha tomado una muestra de productos realizados por personas capacitadas y no capa-
citadas, encontrando el mismo tiempo medio de fabricación del producto para ambos grupos, sin embargo,
el coeficiente de asimetría de los tiempos de las personas capacitadas es positivo, mientras que, el coefi -
ciente de asimetría de los tiempos de las personas no capacitadas es negativo. ¿Parecen indicar los datos
que la capacitación sirve para reducir el tiempo de fabricación?
EPE 86

Solución

Ejercicio 30
Los datos presentados corresponden a la cantidad de dinero gastado, en soles, para comprar regalos navi-
deños entre un grupo de hombres y de mujeres durante el mes de diciembre pasado en Lima Metropolita-
na. Calcule e interprete el coeficiente de asimetría de Fisher en ambos grupos.
87 CE86 Estadística Aplicada 1

Mujeres
460 507 575 420 568 558 581 334 400 426 434 290 468 546 419 726 364 432 519 503
470 519 430 250 514 447 504 543 350 473 614 441 630 432 417 421 531 523 321 405
450 393 553 430 421 461 320 930 290 718 361 383 477 280 385 416 398 503 431 406
407 558 313 387 585 503 527 511 383 402 453 429 499 179 600 373 459 410 850 847

Hombres
498 349 185 80 324 616 680 355 352 648 696 308 581 481 297 205 285 175 447 603
626 368 275 149 100 254 540 279 275 200 538 604 575 600 137 734 436 284 198 610
767 80 266 537 358 624 120 244 341 724 425 305 75 688 253 514 236 475 606 475
271 230 466 120 398 60 429 517 268 580 431 173 612 317 529 647 542 544 464 610

Solución
Usando la función =COEFICIENTE.ASIMETRIA(datos), tendremos los siguientes resultados.

Sexo Coeficiente de asimetría de Fisher


Femenino

Masculino

Por lo tanto,
 el gasto de las mujeres presenta asimetría ……………………………………, sus valores están concentrados en
los valores ………………………….…………………..…
 el gasto de los hombres presenta asimetría ……………………………………, sus valores están concentrados en
los valores ………………………….…………………..…

Ejercicio 31 Caso: Natural Power Nutrition


Natural Power Nutrition es una empresa peruana líder en el mercado de vitaminas y complementos nutri-
cionales para la salud y el deporte. Son representantes de marcas mundialmente reconocidas. El gerente de
la empresa, preocupado por la baja demanda a inicios del año, desea identificar los principales problemas
que ocasionaron la migración de sus clientes a la competencia, realizó un estudio. En dicho estudio se en-
cuestó a 200 clientes, a los cuales se midió las siguientes variables:
 Edad: Edad del cliente, en años.
 Tipo de suplemento: Proteína, quemador de grasa, ganador de masa, preentreno y aminoácidos.
 Sexo: Sexo del cliente (Femenino, masculino).
 Nivel de satisfacción: Nivel de satisfacción del cliente respecto a la atención (Totalmente satisfecho, sa-
tisfecho, insatisfecho, totalmente insatisfecho).
 Problemas reportados: Los productos no llegan a tiempo, error de envío de tipo de producto, consultor
desconoce los productos del catálogo, no responden a tiempo los reclamos presentados por Facebook,
muy pocos puntos de ventas, otros
 Tipo de compra: Compra por internet, compra directa de tienda, compra directo a consultor
 Monto de compra: Monto de compra del cliente durante al mes (en soles).
 Tipo de pago: Tipo de pago que el cliente realiza en su compra (Efectivo, tarjeta de débito, tarjeta de
crédito)
 Número de productos: Número de productos que compra el cliente al mes.
 Tiempo de demora: Es el tiempo que demora en llegar el producto a su casa (minutos)
Parte de la base de datos obtenida con la información de los clientes se muestra a continuación:
Monto de Tiempo
Tipo de suple- Nivel de sa- Problema re- Tipo de Tipo de Número de
ID Edad Sexo compra uni- de demo-
mento tisfacción portado compra pago productos
tario ra
EPE 88

1 23 Aminoácidos Femenino Satisfecho Ninguno Internet 153 Crédito 1 100


Pocos puntos de
2 21 Preentreno Femenino Insatisfecho Consultor 153 Crédito 1 50
venta
. . . . . . . . . . .
Totalmente
200 31 Ganador masa Masculino Ninguno Internet 150 Crédito 3 55
satisfecho

Parte 1: Conocimientos
1. Complete la información solicitada, indique:
Población
Muestra
89 CE86 Estadística Aplicada 1

Unidad elemental
2. Complete los espacios en la tabla considerando la información del estudio:

Nombre de la variable Tipo de variable Escala Dato Gráfico


Tipo de suplemento
Ordinal
149 soles
Cuantitativa discreta
3. Algunos resultados del estudio mostraron:
 El 37,5% de los clientes encuestados realizan su compra por Internet.
 El tiempo promedio de demora de productos al mes es de 1,2 horas.
 El 20% de los clientes realiza su pago con tarjeta de crédito.
 La edad promedio de los clientes es 22 años.
 El problema más común que los clientes manifiestan es que hay muy pocos puntos de ventas

Complete los espacios en blanco considerando los resultados del estudio.

Nombre de la variable Tipo de variable Estadístico Valor del estadístico

4. De la base de datos complete los siguientes espacios en blanco:


Cantidad total de datos
Cantidad total de observaciones
Cantidad de datos que conforman una observación
Un ejemplo de observación

Objetivo 1: Determinar el producto comprado con más preferencia por los clientes al mes.
Complete los datos faltantes en el gráfico y responda a los enunciados solicitados.

a. Responda al objetivo. ……………………………………………………………………………………………………………………


b. El número de clientes que han comprado quemador de grasa es: ………………………………….…………….
c. Interprete h2%...................................................................……………………………………………..……………...
EPE 90

d. Construya la tabla de frecuencia usando el gráfico de columnas.


Título: ……………………………………………………………………………………….

Tipo de suplemento Número de clientes hi


91 CE86 Estadística Aplicada 1

Fuente: …………………………………………

Objetivo 2: Determinar el número de productos comprados menos frecuente por los clientes al mes
Complete el valor faltante en el gráfico y responda los enunciados solicitados.

a. Responda al objetivo.
b. El número de productos mínimo comprados por la mitad de sus clientes es: …………….
c. Interpretar h3%.
d. El porcentaje de clientes que compran más de tres productos es: ………………………………
e. Interprete F2.

Objetivo 3: Determinar la distribución de los clientes respecto al tiempo de demora que llega el producto a
su casa.
El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable
estudiada en su objetivo. Para esto se extrajo una muestra al azar y se registró los siguientes datos:
68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168
a. Construya la tabla de distribución de frecuencias, use la regla de Sturges.
b. Interprete h2%.
c. Interprete F4.

Objetivo 4: Clasificar los montos de compras al mes de sus clientes.


a. Complete los elementos faltantes del histograma de frecuencias del monto de compra al mes.

Teniendo en cuenta el gráfico de frecuencia construye la tabla de frecuencias.


EPE 92

Objetivo 5: Identificar la concentración de los clientes respecto al tiempo de demora que llega el producto
a su casa.

El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable
estudiada en su objetivo. Para esto extrae una muestra al azar y registra los siguientes datos:

68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168
93 CE86 Estadística Aplicada 1

a. A partir de los datos, calcule el indicador pertinente que permita responder al objetivo.
b. Responda al objetivo.
c. La empresa contratará más motorizados si se tardan mucho en enviar sus productos, ¿deben contratar
más motorizados?

Objetivo 6: Comparar el monto de compra entre los clientes de sexo femenino y los de sexo masculino.
Los datos representan el monto de compra de los clientes por sexo.
Femenino Masculino
Media Media 153,606
Mediana 154.000 Mediana 168.000
Moda 153.000 Moda 149.000
Desviación estándar 37.527 Desviación estándar
Varianza de la muestra Varianza de la muestra 1921.955
Coeficiente de asimetría -0.609 Coeficiente de asimetría -0.612
Rango 139 Rango 165
Suma 15436 Suma
Cuenta 101 Cuenta 99
a. Encuentre los valores faltantes de los clientes, tanto de sexo masculino como femenino.
b. Encuentre el valor del coeficiente de variación.
c. Indique el sexo con los montos de compra más homogéneos.
d. La empresa emprenderá una campaña promocional al sexo que presente mayor dispersión, ¿cuál es el
sexo que debe emprender la campaña?

Parte 2: Toma de decisión


Al gerente de Natural Power Nutrition le ha llegado información que las ventas de sus productos se ha in-
crementado en estos últimos meses del año por el cual estaría pensando en abrir otra tienda siempre y
cuando se verifiquen al menos dos de las siguientes tres situaciones:

Situación 1.
Si por lo menos el 35% de clientes han comprado más de tres productos al mes. (Debe realizar la respectiva
tabla de frecuencias).
Situación 2.
Si el monto promedio de compra por las mujeres es mayor respecto al de los hombres.
Situación 3.
Si los montos de compra de las mujeres son más homogéneos respecto a los montos comprados por los
hombres.

Responda usando resultados anteriores y considerando las 5 dimensiones.


EPE 94

Ejercicios propuestos

18. Todos los vehículos que circulan en Lima Metropolitana deben pasar las revisiones técnicas. Inicial-
mente la empresa encargada de dichas revisiones contaba con dos plantas: Cono Norte y Cono Sur. Se
desea investigar si se necesitaba abrir más plantas, analizando el tiempo de atención por vehículo. Los
tiempos, en minutos, en ser atendidos a una muestra aleatoria de vehículos particulares que asistieron
a cada una de las plantas se presenta a continuación:

Cono Norte
95 CE86 Estadística Aplicada 1

12.6 12.6 12.6 12.8 12.9 12.9 13.1 13.1 13.5 13.5 13.7 13.8 13.8 14.1 14.1 14.3 15.1
Cono Sur
10.9 10.9 10.9 11.2 11.6 11.8 11.8 11.8 12.2 12.2 12.3 13.3 13.3 13.4 13.4 13.4 21.3

a. ¿En cuál de las plantas el tiempo medio de atención es mayor?


b. ¿En cuál de las plantas se tiene una mayor mediana? Interprete.
c. ¿Cuál es el tiempo de atención más frecuente en ambas plantas? Interprete.
d. ¿Cuál debe ser el tiempo de atención mínimo en la planta del Cono Norte para pertenecer al 25%
de los clientes que esperan más?
e. ¿Cuál debe ser el tiempo de atención máximo en la planta del Cono Sur para pertenecer al 25% de
los clientes que esperan menos?
f. ¿Se puede afirmar que el tiempo de atención es más homogéneo en el Cono Norte que en el Cono
Sur?
g. ¿Es posible afirmar que en el Cono Sur el tiempo de atención es más homogéneo en el 50% central
que en el Cono Norte?
h. Compare la simetría del tiempo que demoran en ser atendidos los vehículos particulares que asis-
tieron a las plantas del Cono Norte y Cono Sur usando el coeficiente de Fisher.

19. Un agente de compras puso a prueba una muestra de 20 baterías de calculadoras de bolsillo de un fa-
bricante. Cada batería se probó en una calculadora programada para llevar a cabo un ciclo de cálculos
ordinarios. El tiempo de vida, en horas, de las baterías se muestra a continuación:

11.9 11.9 12.0 12.0 12.0 12.4 12.3 12.1 12.5 12.0 12.0 12.0 12.1 12.1 12.1 12.2 12.2 12.2 12.2 12.2
Si el agente de compras quiere encontrar un tiempo máximo para el 18% de las baterías que duran me-
nos y un tiempo mínimo para el 23% de los que duran más, ¿cuál serían esos tiempos de vida? Justifi-
que numéricamente su respuesta.

20. La siguiente información corresponde al tiempo de servicio, en meses, de una muestra de publicistas
que laboran en dos conocidas agencias de la capital.
Agencia A Agencia B
Media 18.93 Media 19.64
Mediana 14.00 Mediana 15.00
Moda 6.00 Moda 11.00
Desviación estándar 15.78 Varianza 94.2841
Muestra 15 Muestra 25
a. ¿Qué tipo de asimetría presenta la distribución del tiempo de servicio de la agencia A?
b. ¿En cuál de las agencias publicitarias el tiempo de servicio (en meses) es más homogéneo?

21. La constructora A está evaluando la posibilidad de expandir sus servicios de construcción de bloques
de departamentos en el norte (Piura, Tumbes). Para tal fin, realizó un estudio de las construcciones
realizadas por otras constructoras respecto a la ganancia obtenida en 300 departamentos construidos
en cada lugar. Asimismo, se detalló la ganancia según nivel socioeconómico del lugar. Los datos se en-
cuentran en miles de soles.

Cuadro 1: Resumen estadístico global


Ganancia (en miles soles) - Piura Ganancia (en miles soles) - Tumbes
Media 453.96 Media 256.22
Mediana 454.7 Mediana 233.57
EPE 96

Moda 459.1 Moda 140.4


Desviación estándar 90.01 Desviación estándar 112.45
Percentil 10 336.2 Percentil 10 100.24
Percentil 25 380.7 Percentil 25 140.96
Percentil 75 529 Percentil 75 335.74
Percentil 90 575.1 Percentil 90 480.01

Cuadro 2: Resumen estadístico por nivel socioeconómico del lugar en construcción


Nivel Ganancia - Piura Ganancia – Tumbes
socio-eco- Departamentos Media Desviación estándar Departamentos Media Varianza
97 CE86 Estadística Aplicada 1

nómico
A 100 556.12 30.34 60 430.25 658.95
B 120 447.54 24.52 90 315.64 927.2
C 80 335.91 50.98 150 150.96 1628.12

a. Tomando en cuenta la información presentada en el cuadro 2, ¿cuál es la ganancia media para los
niveles socioeconómicos de Piura?
b. ¿Cuál es la ganancia mínima (en miles de soles) que se obtiene para estar comprendido entre el
10% de las obras con mayores ganancias en Tumbes? Interprete.
c. ¿Cuál es la ganancia máxima (en miles de soles) que se obtiene para estar comprendido entre el
90% de las obras con menores ganancias en Piura? Interprete.
d. El jefe de finanzas, desea conocer en qué lugar deberá darle mayor prioridad en la ejecución de
obras. Ya que se busca mayor homogeneidad en el nivel de ganancias. Considerando la información
del cuadro 1, indique el estadístico que deberá utilizar el jefe de finanzas: varianza, media, rango in-
tercuartil, coeficiente de variación o mediana. ¿Cuál sería su valor?
e. ¿Cuál de los siguientes gráficos representa mejor la distribución de la ganancia en Tumbes?

f. Si se compara la información de clientes de los tres niveles socioeconómicos de Tumbes, ¿en cuál
nivel socioeconómico se observa que la ganancia es más heterogénea? Interprete.
EPE 98

Unidad 3.
LOGRO
Al finalizar la unidad, el estudiante aplica la teoría de la probabilidad para la toma de decisiones en ba-
se a datos históricos y en condiciones de incertidumbre.
99 CE86 Estadística Aplicada 1

Probabilidades
Se define la probabilidad como una medida numérica de la posibilidad de que ocurra un evento. Por tanto,
las probabilidades son una medida del grado de incertidumbre asociado con cada uno de los eventos pre-
viamente enunciados.
Los valores de probabilidad se encuentran en una escala de 0 a 1. Los valores cercanos a 0 indican que las
posibilidades de que ocurra un evento son muy bajas y los cercanos a 1 indican que es casi seguro que ocu -
rra un evento.
Formalmente, necesitamos conocer ¿qué es un evento? y diferenciar un experimento aleatorio de uno que
no es aleatorio.

Se deja caer un objeto desde la parte alta de un edificio Se lanza un dado y se anota el resultado de
como se indica en la figura la cara superior

Si tarda 8 segundos en caer, ¿Cómo determina la altura ¿es éste un experimento aleatorio?, ¿Qué
del edificio?, ¿estamos ante un experimento aleatorio? características tiene?

Experimento aleatorio
Es un proceso que, al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera más
de un posible resultado que no puede ser determinado de antemano. Se denota por ε.

Espacio muestral
Es el conjunto de todos los posibles resultados que genera un experimento aleatorio. Se denota por Ω o S.
Cada elemento del espacio muestral se denomina punto muestral.

Evento
Es todo subconjunto de un espacio muestral. Se denota mediante letras mayúsculas, por ejemplo, A, B, C, …
o X1, X2, X3.
EPE 100

Ejercicio 32
Marque con un aspa, asignando una opción a la situación descrita de acuerdo con su posibilidad de ocu -
rrencia.
Muy poco Poco Igualmente proba- Bastante Muy
Situación
probable probable ble que ocurra o no probable probable
Aprobaré este curso
Lanzo un dado y sale un número par
El PBI del Perú crecerá 4% este año
Perú se clasificará al Mundial 2022
101 CE86 Estadística Aplicada 1

Definición clásica de probabilidad


La definición clásica propone que, si el espacio muestral es numerable y cada punto muestral tiene la mis-
ma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento A definido sobre W es:

Ejercicio 33

Experimento aleatorio Lanzar un dado y registrar lo que sale en la cara superior


Espacio muestral Ω = {1, 2, 3, 4, 5, 6}
Eventos A = {1}
B = {1, 2, 3}
Probabilidad =………………………..……

=………………………..……
Ejercicio 34
Experimento aleatorio Lanzar dos monedas y registrar lo que sale en la cara superior
Espacio muestral Ω = {(……. , …….), (……. , …….), (……. , …….), (……. , …….)}
Evento A = {que salgan dos caras} = {(……., …….)}
Probabilidad =………………………..……
Ejercicio 35
Experimento aleatorio Sacar una bola y anotar su color de una urna que contiene tres bo-
las rojas y cuatro negras
Evento: A = {que salga una bola roja}
Probabilidad =………………………..……
Ejercicio 36
Sea el experimento aleatorio ε: lanzar dos dados simultáneamente y anotar el número de la cara superior
de cada dado. ¿Por qué se considera aleatorio?

Escriba el espacio muestral

Calcule la probabilidad de que los números de las caras superiores de los dados sumen más de siete.

Álgebra de eventos
Sea un experimento aleatorio y Ω el espacio muestral asociado. Si A y B son dos eventos definidos en Ω,
se define:
EPE 102

Complemento de un evento
Para un evento A cualquiera se define su complemento como el evento consistente en todos los puntos
de S que no están en A.
Se tiene que P(AC) = 1 - P(A)

se expresa como: “El evento A no ocurre”


103 CE86 Estadística Aplicada 1

Unión de eventos
Para dos eventos A y B, la unión del evento A con el evento B (A  B) es el
evento que contienen todos los puntos de S que pertenecen a A o a B o a
ambos.

se expresa como: “Al menos uno de los eventos A o B ocurre”.

Intersección de eventos
Para dos eventos A y B, la intersección de los eventos A y B (A  B) es el
evento que contienen todos los puntos de S que pertenecen tanto a A como
a B.

se expresa como: “Ambos eventos, A y B ocurren a la vez”.

Axiomas de la probabilidad

Un axioma es una proposición o enunciado tan evidente


que se considera que no requiere demostración.

Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y A un evento
definido en Ω, entonces la probabilidad del evento A, denotada por P(A), es aquel número que cumple los
siguientes axiomas:
 Axioma 1: 0 £ P(A)
 Axioma 2: P(Ω) = 1
 Axioma 3: Si A y B son dos eventos mutuamente excluyentes entonces:
P(A È B) = P(A) + P(B)

Teoremas de probabilidad
 P(f) = 0, donde  es el evento imposible.
 P(AC) = 1 – P(A)
 Si A y B son eventos cualesquiera, entonces:
P(A È B) = P(A) + P(B) – P(A Ç B)

Ejemplo 13.
Una fábrica trabaja con dos máquinas procesadoras A y B. La probabilidad que la máquina procesadora A
funcione correctamente es 0,85 y que la máquina procesadora B funciones correctamente es 0,78. La pro-
babilidad de que al menos uno de las dos funcione correctamente es 0,92. Determine la probabilidad de
que funcione correctamente sólo una máquina.

Solución
Definamos los eventos:
EPE 104

A: Máquina procesadora A funciona correctamente. P(A)=0,85


B: Máquina procesadora B funciona correctamente. P(B)=0,78
P(AUB)=0,92 (al menos uno de las dos funcione correctamente)
Probabilidad de que funcione correctamente sólo una máquina:
Funciona correctamente solo A ó solo B
P(B∩Ac) + P(A∩Bc ) ?
Por teorema: P(B∩A ) = P(B)-P(A∩B) y P(A∩Bc) = P(A)-P(A∩B)
c

Por teorema:
P(AUB)=P(A)+P(B)-P(A∩B) despejamos P(A∩B)=0,85+0,78-0,92=0,71
Reemplazamos:
P(B∩Ac) = P(B)-P(A∩B) = 0,78-0,71=0,07
105 CE86 Estadística Aplicada 1

P(A∩Bc) = P(A)-P(A∩B)=0,85-0,71= 0,14

Respuesta es 0,07+0,14=0,21

Ejercicio 37
Tarjeta A, es el sistema de lealtad que implementó la cadena de supermercados A, que cuenta con sucursa-
les en Arequipa, Ica y Trujillo. Gracias al uso de la tarjeta A, la cadena de supermercados A recibe la informa-
ción detallada de las compras de sus clientes, creando de esta manera una base de datos con sus perfiles.
Se desea mejorar el sistema de lealtad, para lo cual se entrevistó a 170 clientes de la cadena de supermer-
cados A que poseen la tarjeta A. Se obtuvo la siguiente información.

Sucursal
Total
Nivel de educación Arequipa Ica Trujillo
Escolar 33 26 23 82
Superior 35 20 12 67
Posgrado 12 4 5 21
Total 80 50 40 170
Se elige un cliente al azar.
a. ¿Cuál es la probabilidad de que tenga nivel educativo superior
b. ¿Cuál es la probabilidad de que el cliente pertenezca a la sucursal de Trujillo?
c. ¿Cuál es la probabilidad de que el cliente pertenezca a la sucursal de Trujillo y tenga nivel
educativo superior?
d. ¿Cuál es la probabilidad de que sea de Arequipa o tenga posgrado?
e. ¿Cuál es la probabilidad de que tenga un nivel educativo mínimo superior?
f. ¿Cuál es la probabilidad de que tenga un nivel educativo máximo superior y pertenezca a la
sucursal de Ica?

Ejercicio 38
El 30% de los estudiantes en una universidad son limeños, el 10 % estudian ingeniería, el 1% estudian inge-
niería y son limeños. Si se selecciona al azar un estudiante:
a) ¿Cuál es la probabilidad de que sea limeño o no pertenezca a la facultada de ingeniería?
b) ¿Cuál es la probabilidad de que solo sea un estudiante de ingeniería?
c) ¿Cuál es la probabilidad de que no sea limeño?
d) ¿Cuál es la probabilidad de que no sea limeño ni estudiante de ingeniería?

Probabilidad condicional
Sea un experimento aleatorio y W el espacio muestral asociado. Sean A, B dos eventos definidos en W. La
probabilidad de ocurrencia del evento A sabiendo que el evento B ha ocurrido se denota por P(A/B) y se lla-
ma probabilidad condicional de A dado B:

Ejercicio 39
EPE 106

Tarjeta A, es el sistema de lealtad que implementó la cadena de supermercados A, que cuenta con sucursa-
les en Arequipa, Ica y Trujillo. Gracias al uso de la tarjeta A, la cadena de supermercados A recibe la informa-
ción detallada de las compras de sus clientes, creando de esta manera una base de datos con sus perfiles.
Se desea mejorar el sistema de lealtad, para lo cual se entrevistó a 170 clientes de la cadena de supermer-
cados A que poseen la tarjeta A. Se obtuvo la siguiente información.

Sucursal
Total
Nivel de educación Arequipa Ica Trujillo
Escolar 33 26 23 82
Superior 35 20 12 67
107 CE86 Estadística Aplicada 1

Posgrado 12 4 5 21
Total 80 50 40 170
Se elige un cliente al azar.
a) Calcule la probabilidad de que tenga un nivel educativo superior, si se sabe que es de Trujillo.
b) Si el cliente tiene nivel superior, ¿qué porcentaje pertenecen a la ciudad de Ica?

Ejercicio 40
Se seleccionó una muestra aleatoria de trabajadores de la empresa A para determinar sus planes de jubila -
ción después de cumplir los 65 años de edad. Los trabajadores en la muestra se dividieron en: ejecutivos,
empleados y obreros. Los resultados obtenidos fueron:

………………………………………………………………………………………………………………………………………

Planes después de los 65 años


Trabajador Total
Se jubile (D) No se jubile (E) No ha decidido su jubilación (F)
Ejecutivo (A) 8 3 1
Empleado (B) 20 10 5
Obrero (C) 50 22 11
Total 78 35 130
Fuente: Empresa A

Se selecciona a un trabajador al azar.


a. Si se sabe que no ha decidido sobre su jubilación, calcule la probabilidad que sea obrero.
b. Si se sabe que no es ejecutivo, calcule la probabilidad que se jubile.

Ejercicio 41
En el presente ciclo académico, en la facultad de ingeniería se han matriculados 1500 estudiantes, de los
cuales 300 son del quinto superior. El 45% de los estudiantes del quinto superior son mujeres, mientras que
el 65% de los que no son del quinto superior son mujeres.
a. Si se escoge al azar el expediente de un estudiante matriculado para una entrevista personal y se com-
prueba que es del quinto superior, ¿cuál es la probabilidad de que sea el expediente de una mujer?
a. Si se escoge al azar el expediente de un estudiante matriculado para una entrevista personal y es varón,
¿cuál es la probabilidad de que sea el expediente de un estudiante que está en el quinto superior?

Ejercicio 42
En la ciudad A se realizó una encuesta a personas adultas para conocer la opinión que tienen respecto a
una nueva ley del gobierno local. La siguiente tabla muestra los resultados de la encuesta. Los entrevista-
dos fueron clasificados según su sexo.
………………………………………………………………………………………………………………………………………………
Opinión
Total
Sexo A favor En contra Ni a favor no en contra
Masculino 110 290 90 490
Femenino 140 170 150 460
Total 250 460 240 950
Fuente: Municipalidad de la ciudad A

Se selecciona a una persona al azar.


a. Si se eligió a un hombre, calcule la probabilidad que esté en contra de la nueva ley.
b. Si se eligió a una persona a favor de la nueva ley, calcule la probabilidad que sea hombre.
EPE 108

c. Si se eligió a una mujer, calcule la probabilidad que no esté en contra de la nueva ley.
d. Calcule la probabilidad de que esté a favor o en contra de la nueva ley.
Ejemplo 14.

Un instituto de investigaciones académicas desea determinar si existe relación entre el interés de un estu-
diante en finanzas, su habilidad en matemáticas y su género. Se selecciona una muestra de 200 estudiantes
y mediante una prueba se mide su habilidad matemática y su interés en finanzas. Los resultados fueron los
siguientes:
Género
Interés Femenino (A1) Masculino (A2)
Total
en finanzas Habilidad en matemáticas Habilidad en matemáticas
Baja (C1) Media (C2) Alta (C3) Baja (C1) Media (C2) Alta (C3)
109 CE86 Estadística Aplicada 1

Bajo (B1) 25 9 6 35 6 10 91
Medio (B2) 4 22 7 11 21 3 68
Alto (B3) 2 5 15 3 7 9 41
Total 31 36 28 49 34 22 200

Se selecciona un estudiante al azar.

a. ¿Cuál es la probabilidad de seleccionar un estudiante con un interés alto en finanzas?


Sea el evento B3: Interés alto en finanzas.

b. ¿Cuál es la probabilidad de que no tenga una alta habilidad en matemáticas y tenga un interés medio
en finanzas?
Sean los eventos:
C3: Habilidad alta en matemáticas
B2: Interés medio en finanzas

c. ¿Cuál es la probabilidad de que sea hombre o tenga un bajo interés en finanzas?


Sean los eventos:
A2: Masculino
B1: Interés bajo en finanzas

Independencia de eventos
Sean dos eventos A y B. Se dice que son mutuamente independientes si la ocurrencia de un evento no influ-
ye en la ocurrencia del otro.
Dados los eventos A y B independientes, entonces se cumple que:
P(A/B) = P(A) y P(B/A) = P(B)
Luego por el teorema de la multiplicación:
P(A  B) = P(A)xP(B

Ejercicio 43
En la fabricación de cierto producto se presenta el defecto tipo 1 con una probabilidad de 0,01 y el defecto
tipo 2 con una probabilidad de 0,05. Si las ocurrencias de los defectos en los productos son independientes,
calcule la probabilidad de que:
a. Un artículo tenga ambos defectos.
b. Un artículo solo el defecto 1
c. Un artículo contenga solo un defecto.
d. No tenga ningún defecto.

Ejercicio 44
Un sistema está conformado por tres componentes que funcionan independientemente.
La probabilidad de que un componente funcione correctamente es 0,70.
a. Calcule la probabilidad de que al menos un componente funcione correctamente.
b. calcule la probabilidad de que al menos un componente no funcione correctamente.
EPE 110

Partición de un espacio muestral


Sean E1, E2, ... , Ek eventos definidos en Ω, tales que:
Ei Ç Ej = f, para todo i ¹ j Todos los eventos disjuntos dos a dos.
La unión de todos los eventos es el espacio muestral.
Entonces,
se dice que los eventos E1, E2, ... , Ek definen una partición del espacio muestral Ω.
Gráficamente:
111 CE86 Estadística Aplicada 1

Diagrama de árbol

Es la representación gráfica de los resultados posibles de la realización de un experimento aleatorio. Cada


parte terminal representa un resultado posible del experimento aleatorio y las probabilidades se indican en
las ramas.

Teorema de la probabilidad total


Sea A un evento cualquiera definido sobre Ω y sea E1, E2,..., Ek una partición del espacio muestral entonces:

Teorema de Bayes
Sea un experimento aleatorio, A un evento cualquiera definido sobre Ω y E1, E2, ... , Ek una partición del
espacio muestral Ω, entonces:

para j = 1, 2,…, k

Ejemplo 15.
Una empresa de manufactura recibe embarques de una determinada pieza de dos proveedores. Actual-
mente el 65% de las piezas adquiridas por la empresa provienen del proveedor 1 y 35% restante del pro-
veedor 2. La calidad de las piezas adquiridas varía con la fuente de suministro. Con base a los datos históri-
cos se sabe que la probabilidad que una pieza del proveedor 1 sea defectuosa es 0,02 y la probabilidad de
que una pieza del proveedor 2 sea defectuosa es 0,05.
Si seleccionamos al azar una de las piezas adquiridas por la empresa, ¿cuál es la probabilidad de que sea de-
fectuosa?

Solución
Sean los eventos:
E1 = La pieza proviene del proveedor 1, luego se tiene que P(E1) = 0,65
EPE 112

E2 = La pieza proviene del proveedor 2, luego se tiene que P(E2) = 0,35


A = Pieza defectuosa.
Ac = Pieza no defectuosa.
P(A/E1) = 0,02 y consecuentemente P(Ac/E1) = 0,98.
P(A/E2) = 0,05 y consecuentemente P(Ac/E2) = 0,95.

Luego, el diagrama de árbol correspondiente es:


113 CE86 Estadística Aplicada 1

Entonces, P(A) = P(A/E1) P(E1) + P(A/E2) P(E2) = 0,02 × 0,65 + 0,05 × 0,35 = 0,0305

Ejercicio 45
Tres máquinas: A, B y C, producen el 45%, 30% y 25% respectivamente del total de las piezas producidas en
una fábrica. Los porcentajes de producción de defectuosos de estas máquinas son del 3%, 4% y 5%.
a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?
b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que haya sido producida
por la máquina B?
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?

Ejercicio 46
En un estudio, se afirma que el seguro vehicular es el más importante en términos de facturación anual en
el mercado asegurador de riesgos generales. Las participaciones de las empresas del mercado asegurador
de vehículos son: Seguros A con 40%, Seguros B con 35%; y otros seguros con 25%.
Se sabe que el porcentaje de siniestros vehiculares (S) registrados el año pasado de cada aseguradora es:
Seguros A es 5%, Seguros B es 8% y otros es 10%.
a. Calcule la probabilidad de que el seguro vehicular registre siniestro el año pasado.
b. Si se tiene un siniestro vehicular del año pasado, calcule la probabilidad de que sea de Seguros A.
c. Calcule la probabilidad de que el seguro vehicular registre siniestro el año pasado.
d. Si se tiene un siniestro vehicular del año pasado, calcule la probabilidad de que sea de Seguros A.

Ejemplo 16.
La empresa de tejidos A se dedica a la fabricación de tejidos de lana de primera calidad. Para la próxima
temporada de invierno está elaborando un producto exclusivo que se espera sea todo un éxito. La empresa
A cuenta con tres tipos de máquinas tejedoras A, B y C:
 el tipo A produce el 40% de la producción y un 3% de piezas defectuosas,
 el tipo B produce el 35% de la producción y un 1% de piezas defectuosas,
 el tipo C produce el 25% de la producción y un 2% de piezas defectuosas.
El departamento de control de calidad selecciona un artículo de toda la producción y lo analiza.
a. ¿Cuál es la probabilidad de que un artículo seleccionado al azar sea defectuoso?
b. Si el producto seleccionado no fue defectuoso, ¿cuál es la probabilidad de que no haya sido producido
por las máquinas tipo B o C?

Solución
Se definen los siguientes eventos.
A: un artículo es producido por la máquina tipo A
B: un artículo es producido por la máquina tipo B
C: un artículo es producido por la máquina tipo C
D: Un artículo es defectuoso.

Se tiene que:
P(A) = 0,40; P(B) = 0,35; P(C) = 0,25; P(D/A) = 0,03; P(D/B) = 0,01; P(D/C) = 0,02
EPE 114

a. ¿Cuál es la probabilidad de que un artículo seleccionado al azar sea defectuoso?


Por el teorema de la probabilidad total.
P(D) = P(A) P(D/A) + P(B) P(D/B) + P(C) P(D/C)
P(D) = (0,4)(0,03) + (0,35)(0,01) + (0,25) (0,02) = 0,0205
Luego, la probabilidad de que un artículo seleccionado al azar sea defectuoso es 0,0205.
b. Si el producto seleccionado no fue defectuoso, ¿cuál es la probabilidad de que no haya sido producido
por las máquinas tipo B o C?
115 CE86 Estadística Aplicada 1

P(BC ∪ CC/DC) = P(A/DC) =

Ejercicio 47
Una compañía de desarrollo urbano analiza la posibilidad de construir un centro comercial en un sector de
la ciudad. Un elemento vital en esta consideración es un proyecto de una autopista que une este sector con
el centro de la ciudad. Si el Consejo municipal aprueba esta autopista, hay una posibilidad del 0,90 que la
compañía construya el centro comercial; en tanto, si la autopista no es aprobada, la probabilidad que
construya el centro comercial es del 0,20. Basándose en la información disponible el presidente de la
compañía estima que hay una probabilidad de 0,60 de que se apruebe la autopista.
a. ¿Cuál es la probabilidad de que la compañía construya el centro comercial?
b. Dado que el centro comercial sea construido, ¿Cuál es la posibilidad de que la autopista sea aprobada?

Ejemplo 17.
Los clientes acostumbran evaluar en forma preliminar el diseño de sus productos. En el pasado, 95% de sus
productos de gran éxito recibieron críticas favorables, 60% de los productos con éxito moderado recibieron
críticas favorables y 10% de los productos sin mucho éxito recibieron críticas favorables. Además, 40% de
los productos han sido de gran éxito, 35% han sido de éxito moderado y 25% han sido productos sin mucho
éxito.
a. ¿Cuál es la probabilidad de que un producto obtenga una crítica favorable?
b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño de gran
éxito?
c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto de
gran éxito?

Solución
Se define los eventos:
G: El producto ha tenido gran éxito; M: El producto ha tenido éxito moderado
P: El producto ha tenido poco éxito; F: El producto tuvo crítica favorable

5 P(F G)=0.40 x 0.95 = 0.380


)=0.9
P(F/G
P(F C/G)=
0.05
P(FC G)=0.40 x 0.05 = 0.02
40
) =0 .
P (G P(F M)=0.35 x 0.60 = 0.210
P(M)=0.35 )=0.60
P(F/M
P(F C/
M)=
P(P 0.40
) =0. P(FC M)=0.35 x 0.4 = 0.140
25

0 P(F P)=0.25 x 0.10 = 0.025


)=0.1
P(F/P

P(Fc P)=0.25 x 0.90 = 0.25

a. ¿Cuál es la probabilidad de que un producto obtenga una crítica favorable?

Usando el teorema de la probabilidad total, se tiene:

P(F) = 0.380 + 0.210 + 0.025 = 0.615

b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño de gran
éxito?
EPE 116

c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto de
gran éxito?

Ejercicios propuestos
117 CE86 Estadística Aplicada 1

22. La probabilidad de que la compra de un cliente esté influenciada por alguna red social es de 0,68, la
probabilidad de que la compra esté influenciada por la publicidad en televisión es de 0,50 y la probabi-
lidad de su compra esté influenciada por ambos factores es de 0,27.

a. ¿Cuál es la probabilidad de que alguna red social o por la publicidad en televisión?


b. ¿Qué probabilidad hay de que la próxima compra no esté influenciada por ambos factores

23. Una fábrica trabaja con dos máquinas procesadoras A y B. La probabilidad que la máquina procesa-
dora A funcione correctamente es 0,85 y que la máquina procesadora B funciones correctamente es
0,78. La probabilidad de que al menos uno de las dos funcione correctamente es 0,92. Determine la
probabilidad de que funcione correctamente sólo una máquina.

24. El 30% de los estudiantes en una universidad son limeños, el 10 % estudian ingeniería, el 1% estu-
dian ingeniería y son limeños. Si se selecciona al azar un estudiante:
EPE 118

a. ¿Cuál es la probabilidad de que sea limeño o no pertenezca a la facultada de ingeniería?


b. ¿Cuál es la probabilidad de que solo sea un estudiante de ingeniería?
c. ¿Cuál es la probabilidad de que no sea limeño?
d. ¿Cuál es la probabilidad de que no sea limeño ni estudiante de ingeniería?
25. En una encuesta de hogares realizada en la ciudad de Lima se entrevistó 248 hogares. La siguiente
tabla muestra los hogares clasificados según sus ingresos familiares, tenencia de auto y tenencia de ca-
sa propia.

Hogares con ingresos de $1000 o menos Hogares con ingresos de más de $1000
Con casa propia Sin casa propia Con casa propia Sin casa propia
119 CE86 Estadística Aplicada 1

Con auto 37 14 37 8
Sin auto 48 40 49 15

Si elegimos un hogar encuestado al azar de esta ciudad, calcule la probabilidad de que:


a. tenga casa propia.
b. tenga un ingreso mayor a $1000.
c. tenga un ingreso máximo de $1000 y tenga auto.
d. tenga casa propia o no tenga auto.
e. tenga un ingreso máximo de $1000 y que no tenga casa propia.

26. Debido al auge de la comunicación en línea, las empresas colocan cada vez más órdenes electróni-
cas. Una empresa de estudios socioeconómicos ha recopilado información acerca de las órdenes llena-
das correctamente por cuatro tipos de empresas. Los resultados obtenidos se muestran en la siguiente
tabla:

Industria
Orden llenada Farmacéutica Consumo Computadoras Telecomunicaciones
Correctamente 207 136 151 178
Incorrectamente 3 4 9 12

Si elegimos al azar una empresa de los rubros mencionados.

a. ¿Cuál es la probabilidad de que se elija una empresa de consumo y haya solicitado su orden de ma-
nera incorrecta?
b. Si la empresa elegida es de telecomunicaciones, ¿cuál es la probabilidad de que la orden haya sido
llenada de manera correcta?

27. Tres máquinas: A, B y C, producen el 45%, 30% y 25% respectivamente del total de las piezas produ-
cidas en una fábrica. Los porcentajes de producción de defectuosos de estas máquinas son del 3%, 4%
y 5%.
a. Si seleccionamos una pieza al azar ¿cuál es la probabilidad de que sea defectuosa?
b. Si tomamos al azar una pieza y resulta defectuosa ¿cuál es la probabilidad de que haya sido produ-
cida por la máquina B?
c. ¿Qué máquina tiene mayor probabilidad de haber producido una pieza defectuosa?

28. Una aerolínea desea analizar el comportamiento de los clientes considerando el destino de viaje, el
tipo de cliente y el modo de compra. Dentro de su proceso de creación de reportes, para ello, ha obte-
nido la siguiente tabla:

Destino de viaje nacional Destino de viaje internacional


Tipo de Compra Compra por Compra Compra por Total
cliente presencial Internet presencial Internet
Premiun 12 28 38 13 91
Frecuente 8 25 12 23 68
Ocasional 7 15 9 10 41
Total 27 68 59 46 200

a. Calcule la probabilidad de que una persona elegida al azar no compre pasajes por Internet y tenga
un destino de viaje nacional.
b. Si se elige al azar a un cliente ocasional, calcule la probabilidad de que compre pasajes por Internet.
EPE 120

29. Una institución extranjera no gubernamental está pensando invertir en un proyecto en nuestro
país, las opciones son tres, invertir en un proyecto de agricultura en un 40%, invertir en un proyecto
minero en un 35% y el resto de probabilidad se desea invertir en un proyecto de ganadería. Se obten -
dría apoyo del estado peruano en las probabilidades siguientes: 20%, 25% y 15% en los proyectos res-
pectivos mencionados anteriormente.
a. Si se elige un proyecto al azar ¿cuál es la probabilidad de recibir apoyo del estado?
b. Si no se recibió apoyo del estado, ¿cuál es la probabilidad que la institución no gubernamental in-
virtió en un proyecto minero?

30. A lo largo de los últimos cuatro años, se ha determinado que el 20% de las compras se han realiza -
do en Econo A, el 30% en Plaza B y el 25% en Tienda C. Se sabe además que el porcentaje de clientes
121 CE86 Estadística Aplicada 1

femeninos es del 90% si son de Econo A, 95% si son de Plaza B, 100% si son de Tienda C y 90% si son de
Todo D. Si se elige un cliente al azar y se determina que es de sexo masculino, ¿cuál es la probabilidad
que haya comprado en Plaza B?

31. En la fabricación de cierto producto se presenta el defecto tipo 1 con una probabilidad de 0,01 y el
defecto tipo 2 con una probabilidad de 0,05. Si las ocurrencias de los defectos en los productos son in -
dependientes, calcule la probabilidad de que:
a. Un artículo tenga ambos defectos.
a. Un artículo solo el defecto 1
b. Un artículo contenga solo un defecto.
c. No tenga ningún defecto

32. Un sistema está conformado por cinco componentes que funcionan independientemente. La pro-
babilidad de que un componente funcione correctamente es 0,70.
a. Calcule la probabilidad de que al menos un componente funcione correctamente.
b. calcule la probabilidad de que al menos un componente no funcione correctamente.

También podría gustarte