Está en la página 1de 189

Estadística

MA477
PREGRADO
Cuaderno de trabajo

Departamento de Ciencias
Línea de Estadística
Contenido

Unidad 1. Conceptos básicos.........................................................................................................7


1.1. ¿Por qué estudiar Estadística?............................................................................................7
1.2. Definición de Estadística.....................................................................................................7
1.3. Definiciones........................................................................................................................9
1.4. Tipos de variables según su naturaleza.............................................................................11
1.5. Escala de medición de una variable..................................................................................12
1.6. Parámetro y estimador (estadístico).................................................................................14
1.7. Series de tiempo y datos transversales.............................................................................16
1.8. Fuentes de datos..............................................................................................................17
Unidad 2. Organización de datos.................................................................................................19
2.1. Tablas de distribución de frecuencias...............................................................................19
2.2. Tabla de distribución de frecuencias de variable cualitativa............................................21
2.3. Tabla de distribución de frecuencias de variable cuantitativa discreta............................27
2.4. Gráficos estadísticos.........................................................................................................23
2.5. Gráficos estadísticos de variables cualitativas..................................................................24
2.6. Gráficos estadísticos de variables discretas......................................................................27
2.7. Tabla de distribución de frecuencias de variable cuantitativa continua...........................36
2.8. Gráfico de variables cuantitativas continuas....................................................................39
2.9. Distribuciones acumuladas...............................................................................................40
2.10. Tabulaciones cruzadas......................................................................................................27
2.11. Gráficos comparativos......................................................................................................29
Unidad 3. Medidas de resumen...................................................................................................61
3.1. Datos simples y datos agrupados.....................................................................................61
3.2. Medidas de tendencia central..........................................................................................62
3.3. Medidas de posición o cuantiles.......................................................................................74
3.4. Medidas de dispersión o de variabilidad..........................................................................77
3.5. Medidas de asimetría.......................................................................................................82
3.6. Medida de curtosis...........................................................................................................84
3.7. Diagrama de cajas.............................................................................................................87
Unidad 4. Probabilidad..............................................................................................................101
4.1. Definiciones....................................................................................................................101
4.2. Eventos y sus probabilidades..........................................................................................105
4.3. Operaciones con eventos...............................................................................................106
4.4. Axiomas de la probabilidad............................................................................................109
4.5. Teoremas........................................................................................................................109
4.6. Reglas de conteo............................................................................................................110
4.7. Probabilidad condicional................................................................................................111
4.8. Eventos independientes.................................................................................................114
4.9. Probabilidad total...........................................................................................................116
4.10. Teorema de Bayes..........................................................................................................116
Unidad 5. Variable aleatoria y distribuciones de probabilidad...................................................128
5.1. Variable aleatoria...........................................................................................................128
5.2. Variable aleatoria discreta..............................................................................................128
5.3. Distribución de probabilidad de una variable aleatoria discreta....................................128
5.4. Valor esperado de una variable aleatoria discreta.........................................................130
5.5. Varianza de una variable aleatoria discreta....................................................................133
5.6. Distribuciones de probabilidad de variables discretas....................................................134
5.7. Variable aleatoria continua.............................................................................................144
5.8. Función de densidad de una variable aleatoria continua...............................................144
MA477 Estadística 3

5.9. Función de distribución acumulada de probabilidad......................................................145


5.10. Valor esperado de una variable aleatoria continua........................................................148
5.11. Varianza de una variable aleatoria continua...................................................................149
5.12. Distribuciones de probabilidad de variable continuas....................................................151
4 MA477 Estadística

Estadística MA477
Logro del curso
Al finalizar el curso, el estudiante aplica los conceptos de la esta-
dística descriptiva en situaciones reales dentro de contextos re-
lacionado con su especialidad para tomar decisiones adecuadas
de manera ética.

Bibliografía básica
ANDERSON, David R (2016)
Estadística para Negocios y Economía. México, D.F.: Cengage Learning. (519.5
ANDE/E 2016)
Cuaderno de Trabajo del curso (2021-1)

Coordinador y profesores del curso

Segundo Jaramillo Vega : pcmasjar@upc.edu.pe (Coordinador)


Miguel Bonilla Morón : pcmambom@upc.edu.pe
Christian Mendoza Uriarte : pcmachme@upc.edu.pe

Sistema de evaluación
El promedio final (PF) se obtiene con la siguiente fórmula:

PF = 25%*DD1 + 45%*DD2 + 30%*TF

DD1 = 5%(Prom. Problemas propuestos) + 10%(Prom. Evaluación de Autoaprendizaje) + 10%


(Prom. Tareas)
DD2 = 15%(Prom. Control de acreditación de unidades) + 30%(Prom. Sustentación de acreditación
de unidades)
TF = 10% Control Final + 20% Sustentación Final

Razonamiento cuantitativo
Es la capacidad para interpretar, representar, comunicar y utilizar información cuantitativa diversa en
situaciones de contexto real.
Implica calcular, razonar, emitir juicios y tomar decisiones con base en esta información cuantitativa.

Interpretación Representación Cálculo Análisis Argumentación


MA477 Estadística 5

Dimensiones Indicación sobre lo que hará el estudiante

Habilidad para identificar el problema a resolver en el contexto de la situación.

¿Qué significa?
El estudiante redacta el problema, con un lenguaje sencillo, como pregunta u
Interpretación objetivo

Habilidad para elegir la herramienta, fórmula o técnica estadística que usará para re-
solver el problema.

¿Qué significa?
El estudiante indica la variable, tabla, gráfico, medida y/o herramienta estadís-
Representación tica que utilizará en la solución del problema.

Habilidad de calcular para obtener los resultados .

¿Qué significa?
El estudiante muestra los cálculos realizados para dar respuesta al problema.
Cálculo

Habilidad de entender los resultados.

¿Qué significa?
El estudiante indica con qué valor(es) calculado(s) responde el problema.
Análisis

Habilidad de comunicar y sustentar la decisión final en base a su análisis.

¿Qué significa?
El estudiante redacta la decisión que tomará a partir del resultado de su análi-
Argumentación sis.
6 MA477 Estadística

Unidad 1. Conceptos básicos


Logro de la unidad 1
Al finalizar la unidad, el estudiante identifica adecuadamente la información estadísti-
ca, distingue entre población y muestra; parámetros y estadísticos; además, reconoce
la subdivisión de la estadística y la clasificación de las variables.

1.1. ¿Por qué estudiar Estadística?

En Finanzas: Los analistas financieros emplean diversa información estadística como soporte para sus
recomendaciones de inversión.

En Economía: Los economistas hacen predicciones sobre el futuro de la economía, como el índice de
precios al consumidor, la tasa de desempleo o la utilización de la capacidad de producción.

1.2. Definición de Estadística

Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, or-
ganizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.

Recopilar datos Organizar datos Presentar datos Analizar datos Tomar decisiones

1.2.1. Subdivisión de la Estadística

Estadística

Descriptiva Inferencial

Estadística descriptiva
Son métodos asociados a la caracterización, resumen y presentación de da-
tos, que permiten describirlos apropiadamente. Comprende el uso de gráfi-
cos, tablas e indicadores de resumen obtenidos al realizar algunos cálculos.

Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más característi-
cas de una población o tomar decisiones referentes a una población, basa-
dos en los resultados obtenidos del estudio de muestras elegidas adecua- Flash
damente. Electora
Estas conclusiones no tienen que ser totalmente válidas, pueden tener
l
cierto margen de error, por eso se dan con una medida de confiabilidad o
probabilidad.
MA477 Estadística 7

Ejercicio 1
¿Qué parte de la Estadística ha sido usada para realizar la siguiente infografía?
Descriptiva

Fuente: http://larepublica.pe/politica/1283221-encuesta-gfk-piden-martin-vizcarra-luche-corrupcion

Ejercicio 2
¿Qué parte de la Estadística ha sido usada para realizar el siguiente gráfico?
Inferencial
8 MA477 Estadística

1.3. Definiciones

1.3.1. Población y muestra

Población es el conjunto de todos los elementos de interés en


determinado estudio.
Población Es un conjunto de personas, objetos, conceptos, etc. de los
cuales se sacan conclusiones a partir de una o más características
observables de naturaleza cualitativa o cuantitativa.

Muestra
Muestra es un subconjunto de la población.
Será representativa si se parece a la población de la que proviene.

Ejemplo 1.
La Secretaría Académica de una universidad está interesada en realizar un estudio sobre los motivos
por los cuales algunos alumnos del pregrado han decidido dar exámenes de recuperación ese ciclo.
La universidad cuenta con quince facultades y un total de 7 500 alumnos, de los cuales 830 han deci -
dido rendir exámenes de recuperación ese ciclo. De la población se va a entrevistar a una muestra
aleatoria de 200 alumnos. Defina la población y la muestra.

Solución

Los 830 alumnos que han


Población decidido dar exámenes de
recuperación ese ciclo.

Muestra Los 200 alumnos que han decidido dar


exámenes de recuperación ese ciclo.

Ejercicio 3
En Lima, se quiere estimar el porcentaje de trabajadores que están afiliados a la AFP Vida Eterna y
que han decidido cambiar a otra AFP. Indique la población y la muestra.

Todos los trabajadores


afiliados a la AFP Vida eterna
Población y que han decidido cambiar a
aotra AFP

Muestra Algunos trabajdores afiliados a la


AFP Vida eterna y que han decidido
cambiar a otra AFP
MA477 Estadística 9

1.3.2. Datos
Los datos son los hechos y los números que se recogen, analizan y resumen para su presentación e
interpretación.

1.3.3. Elementos (unidades elementales), variables y observación

Elementos (unidades
Observación
elementales) Variables
es el conjunto de
son las entidades acerca son las características de
mediciones obtenido de
de las cuales se reúnen interés de los elementos
un elemento particular
los datos
Ejemplo 2.

Ella responde: “Soy


Se le pregunta su
A una persona Camila, soy mujer y
nombre, género y edad.
(Elemento) tengo 19 años”
(Variables)
(Observación)

Ejercicio 4
En el Censo Nacional de Población y Vivienda 2017 se le preguntó a los jefes o jefas de hogar:
 tipo de vivienda (vivienda particular, vivienda colectiva),
 condición de ocupación de la vivienda (ocupada, desocupada)
 material predominante en las paredes exteriores (ladrillo, piedra, adobe, quincha, etc.).

(Elemento) (Variables) (Observación)

Ejercicio 5
En el I Censo Nacional de Investigación y Desarrollo en Centros de Investigación del año 2016 se le
preguntó a los encargados de las instituciones.
 sector Institucional al que pertenece la institución (Instituto público de investigación, educación
superior, institución privada sin fines de lucro, etc.).
 tipo de organización jurídica de la institución (Sociedad de sociedad de responsabilidad limitada,
sociedad anónima cerrada, sociedad colectiva, etc.)
 régimen de propiedad (Privada nacional, privada extranjera, estatal)

(Elemento) (Variables) (Observación)


10 MA477 Estadística

1.4. Tipos de variables según su naturaleza

Las variables se pueden clasificar en cualitativas o cuantitativas.

Variable Variable
cualitativa cuantitativa

Es una variable que


Es una variable que puede A su vez, la variable
puede ser medida en
ser expresada en escala cuantitativa se clasifica en
escala de intervalo o de
nominal u ordinal. discreta o continua.
razón.

Variable discreta
Tiene un número finito o infinito
numerable de posibles valores; es decir,
que en un intervalo solo puede tomar
ciertos valores.

Variable continua
Tiene un número infinito no numerable de
posibles valores; es decir, que en un
intervalo puede tomar cualquier valor.

Ejercicio 6
Se registran las siguientes variables del gerente general de una empresa. Indique el tipo de cada va-
riable:

Variable Tipo de variable

Número de teléfono

Grado académico de un gerente

Utilidad de una empresa

Número de acciones vendidas en la bolsa de valores

Condición de tener una maestría (sí, no)

Nacionalidad de un inversionista
MA477 Estadística 11

1.5. Escala de medición de una variable


La escala de medición permite determinar la cantidad de información que contienen los datos y el
análisis estadístico más apropiado.

Escala nominal Escala ordinal Escala de intervalo Escala de razón


Los diferentes valores La escala de medición Los datos son numéri- La escala de medición
que toma una variable ordinal permite esta- cos. La escala de medi- de razón tiene las pro-
medida en escala nomi- blecer un orden entre ción de intervalo tiene piedades de la escala
nal carecen de un or- los diferentes valores las propiedades de la de intervalo con la pro-
den o de un significado que toma la variable. escala ordinal, pero piedad adicional de te-
numérico, no pueden En esta escala de medi- con la característica ner un punto de parti-
utilizarse para realizar ción no es posible de- adicional que la dife- da natural o cero, que
cálculos. A menudo se terminar las diferencias rencia entre dos valo- indica que nada de la
asignan números a las entre los valores de la res cualesquiera de la variable se encuentra
diferentes categorías, variable o tales diferen- variable tiene un signi- presente. Para esta es-
pero no tienen signifi- cias carecen de senti- ficado. Sin embargo, cala de medición ade-
cado computacional y do. los valores en esta es- más de las diferencias,
cualquier promedio cala no tienen un punto las proporciones tam-
que se calcule carece de partida natural o bién tienen significado.
de sentido. cero.

Ejemplo 3.

Nominal Ordinal Intervalo Razón


El género de las El orden de mérito Las escalas de El sueldo de los
personas de los atletas en temperatura. Las empleados de una
El estado civil de una competición temperaturas en empresa
los empleados de El grado de grados centígrados El tiempo en
una empresa instrucción de los 0ºC, y 20ºC terminar un
Las carreras clientes de un equivalen a, en examen.
profesionales banco grados Fahrenheit,
universitarias. La opinión de los 32ºF, y 68ºF.
alumnos sobre su
universidad.

Se puede resumir lo anterior en la siguiente tabla, donde se presenta la relación entre los tipos de va -
riables y las escalas de medición:

Variable

Tipo Cualitativa Cuantitativa (discreta o continua)

Escala de medición Nominal Ordinal Intervalo Razón


12 MA477 Estadística

Ejemplo 4.

Indique el tipo de variable y la escala de medición de las siguientes variables:

Variables Tipo de variable Escala de medición


Rubro de una empresa Cualitativa Nominal

Total de activo corriente de una empresa Cuantitativa continua Razón

Número de cuentas por cobrar de una empresa Cuantitativa discreta Razón

Número de boletas de venta emitidas diariamente Cuantitativa discreta Razón

Ejercicio 7

Indique el tipo de las siguientes variables y su escala de medición:

Variable Tipo de variable Escala de medición

Tamaño de una empresa (gran, mediana,


pequeña micro)

RUC de una empresa

Año de fundación de la empresa

Número transacciones bancarias diarias


de una empresa

Dinero en caja al 31 de diciembre del


2017 de una empresa

Nombre comercial de una empresa

Número de personas que trabajan en la


empresa

Rubro de actividad comercial

Altura sobre el nivel del mar en la que se


encuentra las oficinas centrales
MA477 Estadística 13

1.6. Parámetro y estimador (estadístico)

Parámetro Representa alguna característica de la población.

Estimador Representa alguna característica de la muestra.

Ejemplo 5.
En un estudio entre alumnos de la UPC, se tomó una muestra aleatoria de 300 alumnos, indique dos
posibles parámetros y dos posibles estadísticos.

Edad promedio de todos los alumnos


Parámetro
Porcentaje poblacional de alumnos que trabajan

Edad promedio de los alumnos en la muestra


Estimador
Porcentaje muestral de alumnos que trabajan

Algunos parámetros y estadísticos que se pueden calcular son:

Ejercicio 8
Según el II Censo Nacional Económico 2008 ejecutados por el INEI, 48 mil contribuyentes pertenecen
al régimen de Sociedad Comercial Responsabilidad Limitada . Indique si este es un parámetro o un es-
timador.

Ejercicio 9
La encuesta nacional urbano-rural de El Comercio - Ipsos de abril del 2018 muestra que la corrupción
es el principal problema del país en la actualidad: un 57% de entrevistados lo considera así. La delin-
cuencia y la falta de seguridad se ubican en segundo lugar, le siguen una educación inadecuada con y
el desempleo y la falta de trabajo. Indique si este valor es un parámetro o un estimador.
14 MA477 Estadística

Ejercicio 10
Caso: Empresa DGS S.A.

DGS S.A. es una empresa de servicios industriales que labora en Lima


desde hace 4 años. Cuenta con especialistas en diferentes áreas de me-
cánica, electrónica, electricidad, neumática y soldadura cuya experiencia
y profesionalismo es contrastado por sus clientes a nivel nacional.

Cuenta con un departamento técnico que junto con los profesionales


brindan asesoría, servicio de mantenimiento y construcción de maquinarias industriales, satisfacien-
do la necesidad del cliente con gran flexibilidad y rapidez durante las 24 horas.

Sin embargo, últimamente la empresa está presentando retrasos en la ejecución de los trabajos,
tiempo que es contabilizado desde la recepción del trabajo hasta la entrega por parte de la empresa
al cliente.

El ingeniero de planta de la empresa desea realizar un análisis de las causas que ocasionan estos re-
trasos en los trabajos, la zona donde ocurren mayormente estas incidencias, las horas de trabajo que
involucran cada una de las tareas, el costo del material, entre otras variables, para lo cual registra la
información necesaria. Se obtuvo la siguiente base de datos:

Cod Zona Tipo de Área de Forma de Demora Número de Costo Horas de Días de Costo del Costo
servicio servicio pago personal material servicio retraso servicio total
1 Norte Asesoría Mecánica Contado Falta de 2 204,3 60 49 120 324,3
personal
2 Norest Instalación Electrónica Crédito a Certificado en 1 689.2 60 41 1200 1889.2
e 90 días trámite
3 Este Asesoría Neumática Contado Reprogramaci 1 21,2 6 35 120 141,2
ón
4 Este Mantenimie Mecánica Contado Movilidad en 1 30,0 6 21 60 90,0
nto reparación
5 Este Reemplazo Mecánica Contado Falta de stock 1 57,1 12 21 240 297,1
de equipos
… …

Con referencia al texto anterior, complete los siguientes espacios en blanco:

a. La unidad de análisis o elemento es …………………..………………………………….


………………………………………..

b. La población en estudio es …………………………………………………………………………..……………………………….

c. La variable “Número de personal” es de tipo ………………………………………………….


……………………………….. y su escala de medición es ………………………………………….
…………………………………..……………………………..

d. La variable “Actitud hacia el trabajo” es de tipo ……………………………………………………………………………..


y un posible estadístico a utilizar es ………………………………………….……………………..……………………………..

e. La variable “Días de retraso” es de tipo ………………………………………………….


……………………………………….. y un posible estadístico a utilizar es ………………………………………….
……………………..……………………………..

f. Una variable en estudio que tiene escala de razón es ………………………..…………………………………………..


y un posible dato para esta variable es …………………………………………………………………………………………..
MA477 Estadística 15

g. Una variable en estudio que tiene escala nominal es ………………………..…………………………………………..


y una posible observación para esta variable es ……………………………………………………………………………..
16 MA477 Estadística

1.7. Series de tiempo y datos transversales

Los datos se registran a lo largo de varios periodos


Series de tiempo
de tiempo

Los datos se registran en un mismo periodo de


Datos transversales
tiempo

Dos ejemplos de gráficos que muestran una serie de tiempo son los siguientes:

Fuente: http://estadisticas.bcrp.gob.pe

Un ejemplo de gráfico que muestra datos transversales es el siguiente:

Fuente. https://peru21.pe/peru/inseguridad-ciudadana-hampa-roba-2-millones-medio-celulares-ano-infografia-405965. Abril 2018.


MA477 Estadística 17

1.8. Fuentes de datos

Los datos se obtienen por medio de encuestas y estudios


Fuentes primarias experimentales realizados con el objeto de recolectar
nuevos datos.

Los datos se han compilado y están disponibles para el


Fuentes secundarias análisis estadístico.

Los siguientes sitios web son ejemplos de instituciones donde conseguir datos de fuente secundaria:
Fuentes públicas: Bases de datos de ministerios y de oficinas gubernamentales de estadística, como
por ejemplo.
 Instituto Nacional de Estadística e Informática www.inei.gob.pe
 Banco Central de Reserva del Perú www.bcrp.gob.pe/
 Ministerio de Salud del Perú www.minsa.gob.pe
 Ministerio de Trabajo www.mintra.org.pe
 Ministerio de Educación www.minedu.org.pe
 FAO. ONU para la Agricultura y Alimentación www.fao.org/corp/statistics/es/
Fuentes privadas: Bases de datos de las empresas, bases de datos que se compran a empresas de es-
tudios de mercado, bases de datos en Internet, como por ejemplo.
 Datum Perú www.datum.com.pe/
 Ipsos Apoyo. Opinión y Mercado www.ipsos-apoyo.com.pe/
 Imasen www.imasenperu.com/
 CPI www.cpi.com.pe/
 Gallup www.gallup.com

Ejercicios propuestos
18 MA477 Estadística

1. Se quiere estimar el porcentaje de medianas empresas. que desean invertir en la Bolsa de Valores
de Lima. Indique el elemento, la variable y una posible observación.

2. Identifique elemento. variables(s) y una observación en los siguientes casos:

 En una investigación. se quiere estimar el porcentaje de migrantes peruanos que viven en el


exterior que envía dinero regularmente a su familia en el Perú.
 En una investigación. se quiere estimar el promedio mensual. en millones de dólares. de las
exportaciones de harina de pescado en los últimos cinco años.
 En una investigación. se quiere estimar el promedio diario del número de movimientos de la
Bolsa de Valores de Lima durante el presente año.

3. Indique la escala de medición de las siguientes variables:

Variable Nomi- Ordi- Interva- Ra-


nal nal lo zón
Tiempo, en minutos, en responder este ejercicio
Código de un alumno en la UPC
Altura de una ciudad sobre el nivel del mar. en metros
Número de cursos que un alumno lleva en un ciclo
Grado de un terremoto en escala de Mercalli (muy débil,
leve, moderado, poco fuerte, fuerte, destructivo, etc.)

4. En una investigación en el Perú, defina la población, muestra, elemento y variables si se desea de-
terminar el promedio de la edad de las mujeres en edad fértil que usan métodos anticonceptivos.
El INEI considera a la edad fértil en las mujeres desde los 15 hasta los 49 años. Indique la pobla -
ción, la muestra, el elemento y una variable.

5. En una investigación en la ciudad de Lima, se quiere determinar el promedio diario de pasajeros


que usaron el sistema Metropolitano durante el año 2015. Indique la población y la muestra.

6. Según un estudio realizado por la BBVA Research en las primeras seis semanas del 2013, las inver-
siones privadas peruanas crecieron en un 12,5% respecto al año anterior, por las buenas condicio-
nes de financiamiento en el exterior y la confianza empresarial. El análisis detalla que las corpora-
ciones locales (financieras y no financieras) encontraron buenas condiciones de financiamiento en
mercados externos y ya emitieron bonos por US$ 1,300 millones, en promedio, en lo que va del
año. Indique los estadísticos nombrados y sus respectivos valores en el texto anterior. ¿Por qué
los encargados del estudio calcularon estadísticos y no parámetros?
MA477 Estadística 19

Unidad 2. Organización de datos


Logro de la unidad 1
Al finalizar la unidad, el estudiante aplica métodos de organización y presentación de
datos utilizando tablas y gráficos, a partir de datos reales, en función del tipo de varia -
ble y su escala de medición.

2.1. Tablas de distribución de frecuencias


Es un resumen, expresado en un cuadro, de un conjunto de datos que muestra las frecuencias
absolutas, relativas y porcentuales en cada una de varias clases que no se traslapan.

Caso: Empresa DGS S.A.


Se obtiene la siguiente base de datos:
Co Zona Tipo de Área de Forma de Demora Número de Costo Horas de Días de Costo del Costo
d servicio servicio pago personal material servicio retraso servicio total
1 Norte Asesoría Mecánica Contado Falta de 2 204,3 60 49 120 324,3
personal
2 Noreste Instalación Electrónica Crédito a 90 Certificado en 1 689.2 60 41 1200 1889.2
días trámite
3 Este Asesoría Neumática Contado Reprogramaci 1 21,2 6 35 120 141,2
ón
4 Este Mantenimiento Mecánica Contado Movilidad en 1 30 6 21 60 90
reparación
5 Este Reemplazo de Mecánica Contado Falta de stock 1 57,1 12 21 240 297,1
equipos
6 Este Asesoría Electricidad Contado Falta de 1 66,9 12 40 240 306,9
personal
7 Este Asesoría Electrónica Crédito a 60 Falta de 1 94,3 18 40 360 454,3
días personal
8 Noroes Reemplazo de Soldadura Crédito a 60 Falta de stock 2 104,8 12 40 240 344,8
te equipos días
9 Este Asesoría Mecánica contado Reprogramaci 1 120 6 40 120 240
ón
10 Oeste Reparación Electrónica Crédito a 90 Otros 1 36,8 24 29 840 876,8
días
11 Este Instalación Electricidad Crédito a 60 Certificado en 2 51,5 24 29 480 531,5
días trámite
12 Sur Asesoría Mecánica Crédito a 60 Reprogramaci 2 45.2 12 34 240 285.2
días ón
13 Sur Mantenimiento Electricidad contado Falta de 1 126,6 6 32 60 186,6
personal
14 Norte Asesoría Electricidad Crédito a 60 Falta de 2 113,7 12 23 240 353,7
días personal
15 SurOest Mantenimiento Soldadura Contado Movilidad en 1 45.2 6 36 60 105.2
e reparación
16 Sur Mantenimiento Mecánica Contado Falta de stock 1 67,7 6 28 60 127,7
17 Central Instalación Electrónica Crédito a 60 Tercerización 2 58.2 30 1 600 658.2
días
18 SurOest Asesoría Electricidad Contado Reprogramaci 1 156 6 45 120 276
e ón
19 Sur Mantenimiento Electricidad Contado Falta de 1 227,9 6 31 60 287,9
personal
20 Norte Reemplazo de Electrónica Crédito a 60 Tercerización 2 14.4 24 1 480 494.4
equipos días
21 Sur Asesoría Mecánica Contado Reprogramaci 1 45,7 6 48 120 165,7
ón
22 Noroes Asesoría Soldadura Contado Falta de 2 42,7 12 24 240 282,7
te personal
23 Norte Instalación Electrónica Crédito a 60 Tercerización 2 59.4 24 6 480 539.4
días
24 Norte Asesoría Electrónica Crédito a 60 Reprogramaci 2 148,5 18 55 360 508,5
días ón
25 Central Reemplazo de Electricidad Crédito a 60 Tercerización 2 263,1 12 1 240 503,1
equipos días
26 Noreste Asesoría Mecánica Contado Tercerización 1 19.2 6 7 120 139.2
27 Noreste Asesoría Electricidad Contado Falta de 1 21,3 6 46 120 141,3
personal
28 SurOest Asesoría Electricidad Contado Reprogramaci 1 36,8 12 41 240 276,8
e ón
20 MA477 Estadística

¿Qué podemos Una vez recopilada la información, con las variables


consideradas de mayor importancia, el siguiente paso es
hacer para
presentarla a través de una tabla de frecuencias o un
resumir esta gráfico que describa adecuadamente las características
información? más importantes.

2.1.1. Elementos de una tabla de distribución de frecuencias (TDF)

Frecuencia absoluta es la cantidad de elementos que pertenecen a esa clase.


(fi)
Frecuencia relativa es la proporción de elementos que pertenecen a esa clase.
(hi)
Frecuencia porcentual
(pi) es el porcentaje de elementos que pertenecen a esa clase.

Distribución de <unidades elementales> según <variable>


Frecuencia absoluta Frecuencia relativa Frecuencia absoluta Frecuencia relativa
Variables
fi hi acumulada Fi acumulada Hi

f1

f2

… … … …

fk
Total
Fuente
Se tiene que:

Es usual, usar en estos cuadros la frecuencia relativa en el ámbito académico y la frecuencia


porcentual fuera del ámbito académico.

Frecuencias acumuladas de una tabla de distribución de frecuencias

Frecuencia acumulada es la cantidad de elementos que pertenecen hasta esa clase.


absoluta (Fi)

Frecuencia acumulada es la proporción de elementos que pertenecen hastaa esa clase.


relativa (Hi)

Frecuencia acumulada
porcentual (Pi) es el porcentaje de elementos que pertenecen hasta esa clase .

Se tiene que:
MA477 Estadística 21
22 MA477 Estadística

2.2. Tabla de distribución de frecuencias de variable cualitativa

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>


Categorías Frecuencia absoluta fi Frecuencia relativa hi

Categoría 1 f1

Categoría 2 f2

… … …

Categoría k fk

Total
Fuente: ………………………………………..

Ejercicio 11
Según el informe “Perfil del Turista Extranjero 2016” realizado por Turismo in, un servicio de
PromPerú, se tiene la siguiente tabla:

Fuente: Perfil del Turista Extranjero 2016. PromPerú


* No incluye a peruanos residentes en el exterior

Solución

a. Indique el número de turistas que llegan por tratamientos médicos.

b. Indique el porcentaje de turistas que no vienen por vacaciones, recreación u ocio.


MA477 Estadística 23

Ejercicio 12
En los Censos Nacionales 2007 ejecutados por el INEI se preguntó a todos los peruanos el idioma o
lengua con el que aprendió hablar, obteniéndose los siguientes resultados:
Título:
Idioma o lengua con que aprendió a hablar Frecuencia absoluta fi Frecuencia porcentual pi
Castellano 21 713 165 84,13%
Quechua 3 360 331 13,02%
Aymará 443 248 1,72%
Otra lengua nativa 174 410 0,68%
Asháninka 67 724 0,26%
Es sordomudo 30 019 0,12%
Idioma extranjero 21 434 0,07%
Total 25 810 331 100%
Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda

a. Indique el número de peruanos que aprendieron a hablar en quechua.

b. Indique el porcentaje de peruanos que aprendieron a hablar en aymará.

c. Indique el porcentaje de peruanos que aprendieron a hablar en castellano o quechua.

d. Indique el valor de f3.

Ejercicio 13
Caso: Empresa DGS S.A.
Si el porcentaje de trabajos de la zona Norte supera al 40%, se contratará más personal. Organice la
siguiente información y proponga la decisión.
Norte Norte Este Este Este Este Este Norte Este Sur Sur Norte Norte Norte Este
Este Sur Sur Norte Sur Sur Este Sur Sur Norte Norte Norte Sur Norte Sur
Norte Este Sur Sur Norte Norte Norte Este Norte Sur Sur Este Sur Este Sur

Solución
Título: ………………………………………………………………………………………………………………………………………………………………….
Frecuencia absoluta fi Frecuencia relativa hi
Norte
Sur
Este

Fuente: ……………………………………………………………………..
24 MA477 Estadística

2.3. Gráficos estadísticos


William Playfair (1759-1823), economista e ingeniero escocés, es considerado el pionero de la esta-
dística gráfica. Fue el creador del gráfico circular, de sectores y de barras.
Los principios de su trabajo fueron los siguientes:
El método gráfico ayuda al
Un gráfico es una Las personas Un gráfico es más
cerebro, ya que permite
forma de simplificar lo ocupadas necesitan accesible que una
entender y memorizar
tedioso y lo complejo ayuda visual tabla
mejor.

Descripción del diagrama

En los ejes, siempre se debe Las fuentes de donde se obtuvieron los datos
El título del gráfico indicar explícitamente las que permitieron su construcción, así como
siempre debe ser variables que se está quiénes o qué entidad elaboró el diagrama y
indicado. representando y las cualquier otra información se debe indicar
respectivas unidades. siempre que sea relevante.

Ejercicio 14
Observe el siguiente gráfico e indique un posible error:

Uso del punto inicial del eje vertical

El punto de inicio del eje vertical debe empezar con un


El cambio de punto de inicio distinto de cero
cero para no distorsionar la impresión visual respecto
debe estar completamente justificado.
de la magnitud.

Ejercicio 15
Observe los dos gráficos siguientes e indique la posible diferencia de interpretación entre ambos.
MA477 Estadística 25

2.4. Gráficos estadísticos de variables cualitativas

2.4.1. Gráfico de barras


 Es una forma de representar datos cualitativos resumidos en una distribu-
ción de frecuencias.
 En uno de los ejes. se representan las categorías o clases de la variable;
para el otro eje, se puede usar una escala de frecuencias absolutas. relati-
vas o porcentuale s.
 Se traza una barra sobre cada indicador de clase de una altura proporcio-
nal a la frecuencia correspondiente.
 Las barras deben estar separadas para enfatizar el hecho de que cada clase es diferente de otra.

2.4.2. Gráfico circular


 Cuando se utiliza el gráfico circular, también llamado pastel, cada sector
circular representa la frecuencia observada de una clase o categoría.
 El sector circular que representa a una determinada clase o categoría de la
variable tiene un ángulo en el centro proporcional a la frecuencia relativa
de dicha clase. El ángulo que le corresponde a cada clase se obtiene multi-
plicando 360º por la respectiva frecuencia relativa.

Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras.

Ejemplo 6.
Un ejemplo de gráficos de barras y circular lo tenemos en el informe de la Primera Encuesta Virtual
para Personas LGBTI (Lesbianas, Gays, Bisexuales, Transexuales e Intersexuales) del 2017 realizado
por el INEI. Cabe señalar que la encuesta tiene un “carácter exploratorio, no probabilístico”, por
cuanto no se disponía de información sobre este grupo de población para realizar un diseño muestral
probabilístico. Por ello, los resultados de este estudio no necesariamente son representativos de la
población total LGBTI.
26 MA477 Estadística

Ejemplo 7.
La universidad A realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad
de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continuación:
Derecho Periodismo Ingeniería Administración
Ingeniería Deporte Gastronomía Ingeniería
Periodismo Ingeniería Periodismo Gastronomía
Administración Gastronomía Deporte Administración
Derecho Gastronomía Ingeniería Derecho
Ingeniería Ingeniería Gastronomía Gastronomía
Administración Deporte Ingeniería Periodismo
Derecho Administración

a. Obtenga la tabla de distribución de frecuencias.


Distribución de estudiantes según su preferencia profesional
Preferencia profesional fi hi pi
Administración 5 0,1667 16,67%
Gastronomía 6 0,2000 20,00%
Derecho 4 0,1333 13,33%
Deporte 3 0,1000 10,00%
Ingeniería 8 0,2667 26,67%
Periodismo 4 0,1333 13,33%
Total 30 1,0000 100,00%
Fuente: Universidad A

b. Interprete la frecuencia absoluta de la segunda categoría.


f2 = 6. De un total de treinta jóvenes, seis de ellos prefieren la carrera de chef.

c. Interprete la frecuencia porcentual de la tercera categoría.


p3 = 13,33%. El 13,3% de los jóvenes prefieren el Derecho como carrera profesional.
d. Presente el gráfico de barras de frecuencias porcentuales.

Interpretación
Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y
solo el 10% prefiere la carrera de Deporte.
MA477 Estadística 27

Ejercicio 16
Se aplicó una encuesta a una muestra de 30 empleados de la empresa Motores A. Se preguntó por la
función que desempeñaba. Los datos se presentan a continuación:
Obrero Profesional Técnico Servicios Obrero Obrero Obrero Obrero
Profesional Producción Técnico Producción Obrero Producción Obrero Obrero
Obrero Técnico Profesional Obrero Técnico Producción Profesional
Obrero Producción Técnico Profesional Servicios Obrero Profesional

a. Presente la tabla de distribución de frecuencias.

Distribución de …………………………………….…………………. según ……………………………………………..


Función fi hi pi
Obrero
Producción
Profesional
Servicios
Técnico
Total
Fuente: Motores A

b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.


f1 = De un total de ……….………………... trabajadores, ………………..……. son ……………………..……………

p1 = El ………………….….……% de los trabajadores son ………………………………..………………………….……

b. Realice e interprete el gráfico de circular de frecuencias porcentuales.

Distribución de …………………………………….…………………. según ……………………………………………..

Fuente: ……………………………….………..

Interpretación
28 MA477 Estadística

2.5. Tabulaciones cruzadas


Se usan para resumir de manera simultánea los datos para dos variables.
También son llamadas tablas de contingencia o de doble entrada.
Cuando hay dos variables. se suele estar interesado en observar si existe algún tipo de dependencia
entra las variables. de forma que una de ellas pudiera explicar el comportamiento de la otra.

Ejemplo 8.
El área de Recursos Humanos de una empresa de servicios desea analizar la relación de los trabajado-
res con la gerencia. Después de aplicar una encuesta se obtuvieron los siguientes resultados:
Distribución de trabajadores según su función y relación con la gerencia
Relación con la gerencia
Función Buena Regular Mala Total general
Apoyo/adm. 18 2 0  20
Obrero 10 29 20 59
Profesional 11 6 0 17
Técnico/ventas 19 7 0 26
Total general 58 44 20 122
Fuente: Área de Recursos Humanos.

Solución
Para interpretar los valores de una tabla absoluta cruzada hay que tener en cuenta si el valor que se
va a interpretar corresponde a un total de fila, a un total de columna o al valor de una celda.
Si deseamos interpretar el valor de una celda hay que tener presente que la celda tiene tres interpre -
taciones dado que existen tres totales, con respecto a su total de fila, con respecto a su total de co-
lumna y con respecto al gran total. Para ilustrarlo, tomaremos como ejemplo la tabla anterior.

Interpretación
• Total de fila: valor 59 → De un total de 122 trabajadores. 59 son obreros.
• Total de columna: valor 58 → De un total de 122 trabajadores. 58 manifiestan tener una buena
relación con la gerencia.
• Valor de celda: 10
Con respecto al gran total. De un total de 122 trabajadores. 10 son obreros y manifestaron tener
una buena relación con la gerencia.
Con respecto al total de su fila. De un total de 59 obreros. 10 manifestaron tener una buena rela -
ción con la gerencia.
Con respecto al total de su columna. De un total de 58 trabajadores que manifestaron tener una
buena relación con la gerencia. 10 son obreros.
MA477 Estadística 29

Frecuencias porcentuales respecto al total

Distribución porcentual de trabajadores según su función y relación con la gerencia


Relación con la gerencia
Función Total general
Buena Regular Mala
Apoyo/adm. 14.8% 1.6% 0.0% 16.4%
Obrero 8.2% 23.8% 16.4% 48.4%
Profesional 9.0% 4.9% 0.0% 13.9%
Técnico/ventas 15.6% 5.7% 0.0% 21.3%
Total general 47.5% 36.1% 16.4% 100.0%
Fuente: Área de Recursos Humanos

Interpretación
Del total de trabajadores.
- el 48.4% son obreros
- el 47.5% manifestaron tener una buena relación con la gerencia.
- el 23.8% son obreros y manifestaron tener una regular relación con la gerencia.

Frecuencias porcentuales respecto al total de filas

Distribución porcentual de trabajadores según relación con la gerencia por función


Relación con la gerencia Total
Función Buena Regular Mala general
Apoyo/adm. 90.0% 10.0% 0.0% 100.0%
Obrero 16.9% 49.2% 33.9% 100.0%
Profesional 64.7% 35.3% 0.0% 100.0%
Técnico/ventas 73.1% 26.9% 0.0% 100.0%
Total general 47.5% 36.1% 16.4% 100.0%
Fuente: Área de Recursos Humanos

Interpretación
Del total de obreros. el 49.2% tiene una regular relación con la gerencia.

Frecuencias porcentuales respecto al total de columnas

Distribución porcentual de trabajadores según función por tipo de relación con la gerencia
Relación con la gerencia Total
Función Buena Regular Mala general
Apoyo/adm. 31.0% 4.6% 0.0% 16.4%
Obrero 17.2% 65.9% 100.0% 48.4%
Profesional 19.0% 13.6% 0.0% 13.9%
Técnico/ventas 32.8% 15.9% 0.0% 21.3%
Total general 100.0% 100.0% 100.0% 100.0%
Fuente: Área de Recursos Humanos

Interpretación
Del total de trabajadores que tienen una relación regular con la gerencia. el 65.9% son obreros.
30 MA477 Estadística

2.6. Gráficos comparativos


 La tabla de doble entrada y su gráfico deben tener el mismo título.
 Una manera ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada corres-
ponde al total general o si ella corresponde al total de fila o al total de columna.
 Si la tabla o gráfico corresponde al total general entonces el título debe incluir las dos variables en
estudio separadas por la letra y. El orden de las variables es indistinto.
 Si la tabla o gráfico corresponde al total de fila 100% o columna 100%. el título incluye dos pala -
bras: según y por. donde según será la variable que va en la leyenda y por la variable que totaliza
el 100%.

2.6.1. Gráfico de barras comparativas


Distribución porcentual de trabajadores según función y relación con la gerencia
Función Buena relación Regular relación Mala relación Total
Apoyo/adm. 14.8% 1.6% 0.0% 16.4%
Obrero 8.2% 23.8% 16.4% 48.4%
Profesional 9.0% 4.9% 0.0% 13.9%
Técnico/ventas 15.6% 5.7% 0.0% 21.3%
Porcentaje de trabajadores

Total 47.5% 36.1% 16.4% 100.0%


Distribución porcentual de trabajadores según función y relación con la gerencia
25% 23.8%

20%

16.4%
15.6%
14.8%
15%
Buena
Regular
10%
8.2%
9.0% Mala

5.7%
4.9%
5%
1.6%

0%
Apoyo/adm. Obrero Profesional Técnico/ventas
Fu en te: Área d e Recursos Hu m an os Función

2.6.2. Gráfico de barras apiladas


Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada categoría.
El alto de cada barra es proporcional a la frecuencia de cada categoría.
Distribución porcentual de trabajadores según función y relación con la gerencia
Función Buena relación Regular relación Mala relación Total
Apoyo/adm. 14.8% 1.6% 0.0% 16.4%
Obrero 8.2% 23.8% 16.4% 48.4%
Profesional 9.0% 4.9% 0.0% 13.9%
Técnico/ventas 15.6% 5.7% 0.0% 21.3%
Total 47.5% 36.1% 16.4% 100.0%
MA477 Estadística 31

Porcentaje de trabajadores
Distribución porcentual de trabajadores según función y relación con la gerencia
50%
45%
40% 16.4%
Mala
35%
30% Regular
25% Buena
20% 23.8% 5.7%
15% 1.6%
4.9%
10%
14.8% 15.6%
5% 8.2% 9.0%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas

Fuen te: Área de Recurso s Hu m an os Función


32 MA477 Estadística

2.6.3. Gráfico de barras apiladas al 100%


Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada ca-
tegoría. El alto de cada barra es el mismo para cada categoría (100%).

Distribución porcentual de trabajadores según relación con la gerencia por función


Función Buena relación Regular relación Mala relación Total
Apoyo/adm. 90.0% 10.0% 0.0% 100.0%
Obrero 16.9% 49.2% 33.9% 100.0%
Profesional 64.7% 35.3% 0.0% 100.0%
Técnico/ventas 73.1% 26.9% 0.0% 100.0%
Total 47.5% 36.1% 16.4% 100.0%

Distribución porcentual de trabajadores según relación con la gerencia por función


100%
10.0%
Porcentaje de trabajadores

90%
26.9%
80% 33.9% 35.3%

70%
60%
Mala
50%
90.0% Regular
40% 49.2% Buena
73.1%
30% 64.7%

20%
10% 16.9%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas

Fuente: Área de Recursos Humanos Función

Distribución porcentual de trabajadores según función por relación con la gerencia


Función Buena relación Regular relación Mala relación Total
Apoyo/adm. 31.0% 4.5% 0.0% 16.4%
Obrero 17.2% 65.9% 100.0% 48.4%
Profesional 19.0% 13.6% 0.0% 13.9%
Técnico/ventas 32.8% 15.9% 0.0% 21.3%
Total 100.0% 100.0% 100.0% 100.0%

Distribución porcentual de trabajadores según función por relación con la gerencia


100%
15.9%
Porcentaje de trabajadores

90%
80% 32.8%
13.6%
70%
60% Técnico/ventas
19.0%
50% 100.0% Profesional
Obrero
40% 17.2%
65.9% Apoyo/adm.
30%
20%
31.0%
10%
4.5%
0%
Buena Regular Mala

Fuente: Área de Recursos Humanos Relación con la gerencia


MA477 Estadística 33

Ejercicio 17
En el II Censo Nacional Universitario del año 2010 realizado por el INEI se preguntó a los alumnos de
todo el Perú por su tipo de universidad y su género. Los datos se muestran en los siguientes cuadros.

Tabla 1. Perú. Alumnos censados en pregrado por género y tipo de universidad. 2010
Género Pública Privada Total
Mujer 135 082 247 743 382 825
Hombre 174 093 226 052 400 145
Total 309 175 473 795 782 970
Fuente: INEI. Censo Universitario. 2010

a. El valor “135 082” expresa que …………………………………………………………………………………………………....

b. Elabore un gráfico comparativo que permita ver la composición porcentual por género y tipo de
universidad.

Título ……………………………………………………………………………………………….……………………..……………….

Género Pública Privada Total


Mujer 17.25% 31.64% 48.89%
Hombre 22.23% 28.87% 51.11%
Total 39.49% 60.51% 100.00%
Fuente: ………………………………………………………………………

Título …………………………………………………………………………………….……………………..………………………….

Interprete el valor 31.64% de la tabla.


34 MA477 Estadística

c. Elabore un gráfico comparativo que permita ver la composición porcentual por género según
tipo de universidad.

Título …………………………………………………………………………………….……………………..………………………….
Género Pública Privada Total
Mujer 35.29% 64.71% 100.00%
Hombre 43.51% 56.49% 100.00%
Fuente: INEI. Censo Universitario. 2010

Interprete el valor 64.71% de la tabla.

d. Elabore un gráfico apilado al 100% que permita ver la composición porcentual por tipo de uni-
versidad según género.

Título …………………………………………………………………………………………………………..………………………….
Género Pública Privada
Mujer 43.69% 52.29%
Hombre 56.31% 47.71%
Total 100.00% 100.00%
Fuente: INEI. Censo Universitario. 2010

Interprete el valor 52.29% de la tabla.


MA477 Estadística 35

2.7. Tabla de distribución de frecuencias de variable cuantitativa discreta

Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la variable el
número de elementos (frecuencia) que la componen.

Es un cuadro que se calcula de la siguiente manera.

Distribución de <unidades elementales> según <variable>


Valores de la variable Frecuencia ab- Frecuencia re- Frecuencia absoluta acu- Frecuencia relativa
discreta soluta fi lativa hi mulada Fi acumulada Hi

x1 f1

x2 f2

… … … … …

xk fk

Total
Fuente:

Ejercicio 18
Caso: Empresa DGS S.A.
Se afirma que el más del 60% de trabajos que realiza la empresa cuenta por lo menos con 2 trabaja -
dores. ¿Es cierto esto? Tome en cuenta los siguientes datos correspondientes al número de trabaja -
dores involucrados en los trabajos.

3 3 4 4 3 2 1 4 3 3 3 4 3 3 3
1 2 4 2 4 3 2 2 3 1 2 1 4 3 2
4 3 2 2 3 1 4 3 2 1 4 3 2 1 4

Solución

Distribución de ………………………………………….…………………. según ……………………….………………………..


Frecuencia ab- Frecuencia re- Frecuencia absoluta acu- Frecuencia relativa
soluta fi lativa hi mulada Fi acumulada Hi

Total
Fuente: Empresa DGS S.A.

2.8. Gráficos estadísticos de variables discretas


36 MA477 Estadística

2.8.1. Gráfico de bastones o de varas


En este caso, la variable se ubica en el eje de las abscisas y las frecuencias absolutas, relativas o por -
centuales, en el eje ordenado.
El gráfico de bastones es utilizado cuando la variable es cuantitativa discreta.
Su uso es adecuado cuando existen muchas observaciones, pero pocos valores de la variable.

Ejercicio 19

Calcule e interprete f2 y h1.

Ejercicio 20
Los siguientes datos corresponden a una encuesta realizada por un grupo de estudiantes de la uni -
versidad A a una muestra de 40 aficionados al cine. Al formular la pregunta, ¿cuántas veces ha visto
su película preferida? las respuestas fueron las siguientes:
1 2 3 4 3 3 2 3 6 3 3 4 6 3 2 3 3 2 4 1
2 3 4 3 1 1 2 4 1 2 2 3 1 3 4 2 1 4 6 2
a. Presente la tabla de distribución de frecuencias.
Título: ………………………………………………………………..……………………………………………………………………………
fi hi Fi Hi

Fuente: …………………………………………………………………………………
MA477 Estadística 37

b. Interprete los siguientes valores.

f3 = …………...

F2 = ………..…

h1 = …………..

H4 = …………..

c. Presente el gráfico de bastones de frecuencias porcentuales.

d. Interprete el gráfico de bastones.

Ejemplo 9.
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores (tra -
bajadores) de la empresa Creativa en lo que va del año.

1 2 2 0 1 1 3 2 1 1 2 0 2 1 1 1 2 2 1 1 1 2 2 1 5 2 1 0 3 1

a. Presente la tabla de distribución de frecuencias.

Distribución de colaboradores según número de capacitaciones recibidas


Número de capacitaciones fi hi Fi Hi
0 3 0,100 3 0,1000
1 14 0,467 17 0,5667
2 10 0,333 27 0,9000
3 2 0,067 29 0,9667
5 1 0,033 30 1,0000
Total 30 1,000
Fuente: Empresa Creativa
38 MA477 Estadística

b. Interprete f2, F2, h3 y H2%

f2 = 14 De 30 colaboradores, 14 han recibido solo una capacitación al año.


De 30 colaboradores, 17 han recibido de una a menos capacitaciones al
F2 = 17
año.
La proporción de colaboradores que han recibido solo una capacitación
h2 = 0,467
al año es 0,467.
El 56,7% de los colaboradores han recibido de una a menos capacitacio-
H2%= 56,7%
nes al año.

c. Presente e interprete el gráfico de bastones de frecuencias absolutas para los siguientes datos.

Interpretación
De un total de treinta colaboradores, catorce de ellos han recibido una capacitación y solo un co -
laborador ha recibido cinco capacitaciones en lo que va del año

2.9. Tabla de distribución de frecuencias de variable cuantitativa continua

Es un resumen de un conjunto de datos que consiste en presentar para cada categoría el número de
elementos (frecuencia) que la componen.

Los tres pasos necesarios para definir en una distribución de frecuencias con datos cuantitativos son
los siguientes:

Determine la cantidad Determine el ancho Determine los límites


de clases de cada clase de cada clase

Cantidad de clases
 Se recomienda usar entre 5 y 20 clases, inclusive.
 La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas que
varias contendrían unos cuantos elementos.
 Para determinar el número de clases se usa la regla de Sturges: k=1+3,322 log n. Si la estimación
tiene decimales, se toma el entero más próximo.
MA477 Estadística 39

Amplitud de cada clase


 Se usa el mismo ancho para todas las clases.
 Se calcula de la siguiente manera:

 La amplitud se redondea al número inmediato superior de acuerdo con la cantidad de decimales


que tienen los datos o según la precisión con que se desea trabajar.
Por ejemplo:
r w
Si los datos tienen w=
k (redondeo a más)
Cero decimales w = 50,2381 w=
Una cifra decimal w = 50,2381 w=
Dos cifras decimales w = 50,2381 w=
Tres cifras decimales w = 50,2381 w=

Límites de cada clase


 Los límites de clase se escogen de tal manera que cada valor de dato pertenezca a una clase y
sólo a una.
 El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase. El límite
superior de clase es el valor máximo posible de los datos que se asigna a la clase.
 La marca de clase es el punto medio de los límites de cada intervalo.

Recordar lo siguiente:
La regla de Sturges no se usa para hallar la cantidad de datos. Es decir:

- si se tiene el número de datos n, entonces se puede calcular k,


- si se tiene determinado k, no se puede calcular el tamaño de muestra n con la regla de Sturges.

Ejemplo 10.
El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. La tabla muestra los pagos de impuestos, en soles, en el 2017 de 48
viviendas elegidas al azar.

145.1 216.3 252.5 303.6 196.9 234.8 265.2 317.2 206.5 242.9 289.1 331.7
151.0 225.9 257.1 305.8 202.6 238.4 271.0 320.2 208.0 244.0 291.0 344.6
159.0 227.1 259.2 315.4 204.9 239.9 286.7 324.8 208.0 247.7 291.9 346.7
195.6 231.2 262.5 315.5 206.1 241.1 288.1 331.1 209.3 249.5 294.5 351.1

Elabore la tabla de frecuencias para la variable: pago por impuestos municipales año 2012.

Solución
El rango r se calcula con:
r = valor máximo – valor mínimo = 351,1 – 145. 1 = 206

Siguiendo la regla de Sturges, el número de intervalos es:

El ancho del intervalo es:

(Redondeo por exceso a un decimal)


40 MA477 Estadística
Distribución de viviendas según monto de pago de impuestos municipales del año 2017
Pago de impuestos Marca de clase fi hi Fi Hi
[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1 ; 351,6] 336,85 6 0,1250 48 1,0000
Total 48 1,0000
Fuente: Oficina de Rentas

Ejercicio 21
El índice de endeudamiento mide la proporción de los activos totales que financian los acreedores de
la empresa. Cuando mayor es el índice mayor es el monto del dinero de otras personas que se usa
para generar utilidades. Con la finalidad de describir el comportamiento de este índice en un grupo
de empresas se seleccionó una muestra de 45 medianas empresas.

0.05 0.08 0.08 0.11 0.13 0.17 0.18 0.20 0.23 0.23 0.26 0.26 0.30 0.33 0.34
0.35 0.36 0.36 0.48 0.48 0.5 0.50 0.52 0.52 0.56 0.59 0.65 0.66 0.68 0.80
0.90 1.00 1.02 1.04 1.05 1.13 1.15 1.18 1.20 1.22 1.23 1.24 1.27 1.38 1.71

Construya la tabla de distribución de frecuencias de los datos.

Distribución de …………….………………………….…………………. según …………….……………………………………..


Clase Marca de Frecuencia ab- Frecuencia Frecuencia absoluta Frecuencia relativa
clase soluta fi relativa hi acumulada Fi acumulada Hi
 - 
 - 
 - 
 - 
 - 
 - 

Fuente: ……………………………………………

Indique lo que significan las siguientes frecuencias:

f4 =

F4 =

H4 =

h2 =
MA477 Estadística 41

2.10. Gráfico de variables cuantitativas continuas

Histograma Polígono de frecuencias Ojiva

2.10.1. Histograma
Un histograma es una representación gráfica de una variable en forma de barras, donde la altura de
cada barra es proporcional a la frecuencia de los valores representados.

 Se traza colocando la variable sobre el eje horizontal y las frecuencias sobre el eje vertical.
 Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase
sobre el eje horizontal y cuya altura es proporcional a la frecuencia correspondiente (absoluta,
relativa o porcentual).
 Los rectángulos adyacentes se tocan entre sí.

Un ejemplo de histograma es el siguiente gráfico:

2.10.2. Polígono de frecuencias


Un polígono de frecuencias es un gráfico de líneas que une los puntos asociados a las marcas de clase
de una variable. La altura del punto asociado a cada marca de clase es proporcional a la frecuencia de
dicho valor.
 Se realiza uniendo con segmentos de recta los puntos de intersección de las marcas de clase con
las frecuencias (absolutas, relativas o porcentuales).
 Los polígonos de frecuencias se cierran creando dos intervalos ficticios, uno antes del primer in -
tervalo y uno después del último.
 Si los intervalos creados toman valores que pueden no ser reales, igual se crea el intervalo, como,
ejemplo, tiempos negativos.
Un ejemplo de polígono de frecuencias es el siguiente gráfico:
42 MA477 Estadística

2.11. Distribuciones acumuladas


La distribución de frecuencias acumuladas muestra la cantidad de elementos con valores menores o
iguales al límite superior para cada clase.

2.11.1. Ojiva
La ojiva es la gráfica de una distribución acumulada de frecuencias.

 Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de
cada intervalo y la frecuencia acumulada respectiva.
 La ojiva usa los límites de los intervalos y no las marcas de clase.
 Con la ojiva se puede estimar fácilmente el número o porcentaje de observaciones que corres -
ponden a un intervalo determinado.

Un ejemplo de ojiva es el siguiente gráfico.


Distribución porcentual de empleados
según el tiempo de servicio
100.00%
100%
90% 95.42%
80% 84.75%
70%
Porcentaje acumulado

60%
50% 57.62%

40%
30%
20%
19.82%
10%
0%
0 4 8 12 16 20
Número de años
Fuente: Empresa A. Gerencia de RRHH

Ejemplo 11.
La gerencia de una compañía, que brinda servicios de llamadas por celulares, está preocupada por el
poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de admi-
nistración que eligiera, del mes de enero, una muestra de clientes de Lima y registró el monto que
costaron sus llamadas, en soles.

El encargado mostró los resultados en una tabla de distribución de frecuencias:

Distribución de clientes según monto de las llamadas, en soles


Monto de llamadas Marca de clase fi hi Fi Hi
0    12

25 45 0,3750 79
23 0,8500
0,1000 0,9500
120
Total 1
Fuente: Área de Administración
MA477 Estadística 43

Grafique el histograma de frecuencias porcentuales.

Interpretación
A partir del gráfico podemos observar que el 37,5% de los clientes de Lima tienen montos superiores
a 20 y como máximo de 30 soles y que solo el 5% de estos clientes tienen montos superiores a 50 y
como máximo de 60 soles.

Ejercicio 22
En economía, la prima de riesgo es el sobreprecio que paga un país para financiarse en los mercados
en comparación con otros países. De esta forma, cuanto mayor es el riesgo país, más alta será su pri -
ma de riesgo. Significa la confianza de los inversores en la solidez de una economía. La prima de ries-
go de los países de la Unión Europea se calcula respecto de Alemania porque se supone que su deu -
da pública es la que tiene menor riesgo de impago. Para el caso de España, la agencia de calificación
de riesgos A ha medido la prima de riesgo durante 50 días desde junio del 2018.
Distribución de días según prima de riesgo. España junio y julio del 2018
Prima de ries-
Marca de clase fi hi Fi Hi
go
[ 92 ; ] 1 0,0200
] ; ] 95 3 0,0600
] ; ] 0,2200 15 0,3000
] ; ] 29 0,5800
] ; ] 41 0,8200
] ; ] 0,1200 47 0,9400
] ; ] 50
Fuente: Agencia de Calificación de Riesgos A.

a. Grafique el histograma de frecuencias relativas.

12

10

8
Axis Title

0
Axis Title
44 MA477 Estadística

b. Grafique el polígono de frecuencias absolutas.

12

10

8
Axis Title

0
Axis Title

c. Grafique la ojiva de frecuencias porcentuales y determine si el 58% de los días la prima de riesgo
llegó, como máximo, a 483.

12

10

8
Axis Title

0
Axis Title

2.11.2. Distribuciones de frecuencias de dos o más grupos de datos con intervalos comunes

La idea básica para distribuciones de frecuencias de dos o más grupos de datos es tener intervalos
comunes, es decir, que los límites de los intervalos para ambas distribuciones sean iguales. Para ello,
debemos seguir los siguientes pasos:

 Hallar el mínimo de todos los datos y el máximo de todos los grupos de datos. y usarlos para cal -
cular el rango.
 Calcular el número de categorías. el número de datos es el máximo número de datos de cada
grupo. Tener en cuenta que no es la suma de ambos tamaños muestrales.
 Siguiendo la regla de Sturges. el número de intervalos es:

Ejemplo 12.
La empresa de investigación de mercado “Eléctrico” lleva a cabo un estudio para obtener indicadores
que le permitan inferir respecto al consumo de energía eléctrica mensual (medido en kilovatios. re -
MA477 Estadística 45

dondeado al entero más próximo) de las familias en los departamentos de Arequipa y Tacna. Dicho
estudio, sustentado en el análisis de muestras aleatorias tomadas en ambos departamentos, arrojó
los siguientes resultados:
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
Arequipa
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666

217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424 426 429
Tacna
438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636

Usando la regla de Sturges, calcule los intervalos comunes y marcas de clase de una tabla de distribu-
ción de frecuencias que permita comparar los datos.

Solución
 Calculamos el mínimo de todos los datos (217) y el máximo de todos los datos (666) de ambas
ciudades. y usarlos para calcular el rango.
 Calculamos el número de categorías, el número de datos es el máximo número de datos (40) en -
tre ambas ciudades. Tener en cuenta que no es la suma de ambos tamaños muestrales.

Siguiendo la regla de Sturges, el número de intervalos es:

(Redondeo simple)

Tabla 2. Intervalos comunes y marcas de clase de consumo eléctrico mensual para Arequipa y Tacna
Consumo de energía Marca de clase
217 ; 292 254,5
292 ; 367 329,5
367 ; 442 404,5
442 ; 517 479,5
517 ; 592 554,5
592 ; 667 629,5

Ejercicio 23
Un grupo de alumnos del curso de Estadística seleccionó ratios de liquidez de las empresas del sector
mineras y servicios, con la finalidad de poder comparar y decidir qué sector tiene mayor liquidez en
el ejercicio 2017. Con este fin se extraen dos muestras aleatorias. La primera de 30 empresas y la se -
gunda de 25 empresas. Se muestra la liquidez del ejercicio 2017 para las empresas seleccionadas.

Ratios de liquidez del ejercicio 2017 de las empresas mineras


0.334 0.339 0.644 0.716 1.062 1.193 1.514 1.541
1.814 1.886 1.911 2.114 2.149 2.576 2.986 3.073
4.883 5.845 5.984 5.984 6.409 8.241 9.352 11.346
12.367 12.786 13.456 14.011 14.246 14.578
Ratios de liquidez del ejercicio 2017 de las empresas de servicios
0.525 0.566 0.612 0.618 0.619 0.620 0.632 0.845 0.971
1.102 1.128 1.243 1.243 1.257 1.300 1.523 1.526 1.808
1.831 1.831 2.203 2.585 2.603 9.104 12.435
Determine las distribuciones de frecuencias y un polígono de frecuencias relativas que permita com -
parar los datos de ambas muestras.
46 MA477 Estadística

Distribución de …………….………………………….…………………. según …………….……………………………………..


Clase xc fc hc Fc Hc
 - 
 - 
 - 
 - 
 - 
 - 
Total
Distribución de …………….………………………….…………………. según …………….……………………………………..
Clase xs fs hc Fc Hc
 - 
 - 
 - 
 - 
 - 
 - 
Total
MA477 Estadística 47

Ejercicios propuestos

7. Indique si son verdaderas o falsas las siguientes afirmaciones:

a. El valor de un parámetro se puede conocer solamente si se realiza un censo.


b. Los datos de series de tiempo se coleccionan a lo largo de varios periodos de tiempo.
c. Solo las variables cuantitativas continuas pueden toman valores con decimales.
d. Variable es el conjunto de mediciones obtenido de un elemento particular.
e. Los cuadros de doble entrada usan exclusivamente variables ordinales o nominales.
f. En un gráfico circular, el ángulo que le corresponde a cada parte se obtiene multiplicando 360º
por la respectiva frecuencia absoluta dividida entre la cantidad de datos.
g. La frecuencia relativa de una clase es la proporción de elementos que pertenecen a esa clase.
h. En un gráfico de barras apiladas, el alto de cada barra es proporcional a la frecuencia de cada
categoría.
i. Para graficar las ojivas se usan las marcas de clase
j. Con la ojiva se puede estimar el porcentaje de observaciones que corresponde a un intervalo
determinado
k. Para el polígono de frecuencias solamente se usa las frecuencias relativas

8. Indique el tipo de las siguientes variables y su escala de medición.


a. Modalidad de contrato de un trabajador
b. Número de trabajadores por empresa
c. Monto asignado por CTS a los trabajadores de una empresa 2017
d. Puntaje en una evaluación de los trabajadores de una entidad financiera

9. El siguiente gráfico muestra la evolución de la inflación desde el año 1980 al 2013. Indique si el
índice de precios al consumidor IPC que obtiene el INEI es un parámetro o un estadístico.

10. Se tomó una muestra de 80 empresas y se registró el rubro de la empresa. Los resultados se
muestran en la siguiente tabla:
Servicios Mineras Seguros Seguros Seguros Mineras Servicios Mineras Producción Servicios
Mineras Servicios Servicios Servicios Servicios Servicios Mineras Mineras Mineras Mineras
Producción Mineras Mineras Mineras Seguros Mineras Otros Producción Producción Producción
Producción Producción Servicios Servicios Seguros Servicios Mineras Seguros Mineras Mineras
Mineras Seguros Producción Servicios Producción Mineras Producción Seguros Mineras Seguros
Servicios Mineras Mineras Mineras Servicios Servicios Servicios Mineras Mineras Servicios
Producción Producción Servicios Mineras Mineras Mineras Servicios Mineras Mineras Producción
Mineras Servicios Mineras Otros Otros Servicios Mineras Otros Seguros Mineras

Construya la distribución de frecuencias de los datos. Interprete el valor f4. h3 y h2%


48 MA477 Estadística

11. La empresa A programa diversos cursos de capacitación a sus trabajadores. Los siguientes
datos muestran el número de capacitaciones que 48 trabajadores han recibido en el presente
año.

4 3 2 2 1 3 2 4 1 6 3 1 3 1 3 2 1 2 1 1 1 6 2 3
1 1 1 1 4 2 2 4 1 2 2 2 1 3 1 2 2 1 2 2 1 2 1 2

Construya la tabla de distribución de frecuencias de la variable “número de capacitaciones” y


su respectivo gráfico de bastones.

12. En el IV Censo Nacional Económico 2008 realizado por el INEI, se preguntó la clase de
organización jurídica de los establecimientos censados. Los resultados se muestran en la si-
guiente tabla:

Tabla 3. ………………………………………………………………………………………………
Clase de organización fi hi
Sociedades 79 833 0.0849
Individuales 853 431 0.9076
Otra clase de organización 7 072 0.0075
Total 940 336

Realice un diagrama circular con dichos datos.

13. Se ha tomado un examen y registrado el tiempo empleado en terminarlo. Indique si son verda-
deras o falsas las siguientes afirmaciones con respecto al gráfico siguiente:

Distribución porcentual de alumnos según el tiempo en resolver un examen


100
90 100

80 80
Frecuencia acumulada

70
72
60
50
40 40
30
30
20
10
0
0 20 40 60 80 100
Tiempo (en minutos)
Fuente: Calidad Educativa Universidad A

Indique si son verdaderas o falsas las siguientes afirmaciones:


a. El número de personas que tarda 40 minutos o menos es 40
b. El número de personas que tarda más de 20 pero menos o igual a 70 minutos es 42
c. El porcentaje de personas que tarda más de 20 minutos es 70%
d. El porcentaje de personas que tarda 60 minutos o menos es 72%
e. El porcentaje de personas que tarda 20 minutos es 30%
MA477 Estadística 49

14. La empresa auditora A está organizando la información relacionada a las empresas con las que
trabaja. El siguiente cuadro corresponde al sector al que pertenecen estás empresas:

Sector fi hi hi %
Agricultura 100    
Minas   0.375  
Pesca     12.5%
Servicios 80    
Otros 20    
Total 400 1  

a. ¿Cuál es la variable estudiada y de qué tipo es?


b. Complete la tabla de distribución de frecuencias e interprete los valores más importantes.

15. Complete la siguiente tabla de distribución de frecuencias que representa el número de fallas
en libros contables encontrados en una muestra de 100 libros de los archivos de un contador.

Número de fallas fi Fi hi% Hi%


1 5%
2 14% 19%
3 18
4 62
5 20
6 92%
7 97%
8
Total

a. Identificar la unidad de análisis, variable y su tipo.


b. Interprete los valores f3. h2%. F6. H5%.

16. A continuación. se presenta la información del número de veces que una muestra de clientes
elegidos al azar del banco América presentaron solicitudes de préstamo.

Número de solicitudes de préstamo


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2
2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

Presente la tabla de distribución de frecuencias que resuma la información de la variable


cuantitativa y represente gráficamente. Interprete f3.

17. Los directivos de la empresa A solicitaron a los gerentes de cada una de sus dos locales de ven -
tas. A y B. que informen sobre los sueldos de todos sus trabajadores correspondientes al mes
de marzo del año en curso. La información proporcionada (en soles) por el gerente del local A
se muestra a continuación.
i Sueldos fi
1 [ 1 000 – 2 000 2
2  2 000 – 3 000 3
3  3 000 – 4 000 14
4  4 000 – 5 000 15
5  5 000 – 6 000 5
50 MA477 Estadística

6  6 000 – 7 000] 1
a. Complete la tabla anterior con la frecuencia relativa y las frecuencias acumuladas, absolu-
tas y relativas. Ponga títulos y fuente.
b. Interprete los valores de f3 , h4 y H2.
c. Los siguientes datos corresponden a los sueldos (en soles) del local B. Construya la tabla de
distribución de frecuencias usando la regla de Sturges.

58.7 99.3 118.1 173.3 177.5 205.3 206.2 206.3 222.9 224.4 602.7 505.7
242.9 245.7 260.9 262.0 265.9 272.9 273.2 274.0 275.9 295.0 544.8 503.3
299.8 319.7 319.9 324.5 328.1 330.0 332.3 338.9 342.1 364.1 522.2 501.2
372.3 373.0 381.3 393.8 394.5 419.2 432.4 435.0 436.1 441.6 518.8 463.3

18. Los datos corresponden a los ingresos, en cientos de soles, de una muestra de 60 clientes del
banco A.

5.25 7.22 8.53 9.27 9.54 10.21 10.32 10.45 10.52 10.76
10.85 11.25 11.56 12.42 13.27 14.65 15.72 16.85 17.22 18.56
19.32 20.56 21.72 22.85 23.12 24.32 25.65 26.72 28.72 29.65
31.42 32.71 33.55 34.28 35.21 37.45 38.32 39.65 41.22 43.28
45.72 47.32 49.45 51.27 52.38 54.75 55.81 56.27 57.45 58.22
59.32 61.45 63.75 65.72 66.85 69.32 69.54 72.30 75.81 77.42

a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges.


b. Interprete los valores de f2 , h3 y H4.

19. Sean las siguientes cantidades, las calificaciones en un curso de Estadística en el que se han
evaluado a 56 personas, siendo la escala de evaluación de 0 a 100.

58 89 73 59 87 63 43 59 64 74 63 63 82 95
73 81 44 69 30 38 75 66 76 84 72 82 59 75
63 72 52 55 75 43 48 52 77 68 47 53 36 65
67 61 87 39 62 75 69 53 79 95 50 38 70 84

Representar esta información en forma tabular. Elabore un informe ejecutivo

20. En una tabla de distribución de frecuencias simétrica con siete intervalos de clases de igual lon-
gitud, se conocen los datos siguientes:

w = 10 f1 = 8 f2 + f5 = 62 h3 = 0.21 H6 = 0.96

Reconstruya la tabla de distribución de frecuencias, sabiendo que el primer intervalo es [5 -


15.

21. La siguiente tabla corresponde a la distribución de frecuencias de los salarios, en soles, del últi-
mo mes de los empleados de la empresa A. Complete la tabla:
Distribución de trabajadores según salarios. en soles. del último mes
Marca de cla-
Salario fi hi Fi Hi
se
1200 1600        120  
   1800 300      0.42
         780  
      150      
MA477 Estadística 51

         1000  


Fuente: Empresa A
22. La tabla muestra la distribución del ingreso familiar diario correspondiente a 80 familias.

Ingreso familiar diario fi Fi hi


[160 – 170
170 – 180 48 60
180 – 190 0.125
190 – 200 0.075
200 – 210
Fuente: Ciudad A
a. Ponga título y fuente a la tabla.
b. Determine el número de familias que ganan hasta 190 soles.
c. Determine el porcentaje de familias que ganan más de 180 soles y hasta 190 soles.
d. Determine el porcentaje de familias que ganan más de 170 soles y hasta 200 soles.
e. Determine el porcentaje de familias que ganan más de 190 soles.

23. En los X Censos Nacionales de Población y V de Vivienda de año 2007 se preguntó por el tipo
de alumbrado de la vivienda según área (urbana o rural).

Tipo de alumbrado del hogar Área urbana Área rural Total


Electricidad 3 875 390 353 544 4 228 934
Kerosene (mechero / lamparín) 148 084 817 581 965 665
Petróleo / gas (lámpara) 6 219 11 479 17 698
Vela 201 220 312 327 513 547
Generador 6 562 6 819 13 381
Otro 70 647 20 608 91 255
No tiene 17 949 9 720 27 669
Total 4 326 071 1 532 078 5 858 149

a. Ponga título y fuente a la tabla.


b. Elabore una gráfica de barras apiladas al 100% que permita ver la composición del tipo de
alumbrado dentro de cada área.
c. Determine el porcentaje de hogares que son rurales.
d. Del total de hogares urbanos, determine el porcentaje que se alumbra con electricidad.
e. Del total de hogares rurales, determine el porcentaje que no se alumbra con electricidad.
f. Del total de hogares que se alumbran con electricidad, determine el porcentaje que son ru-
rales.

24. La siguiente tabla muestra el total de productos con quiebre de stock por sección y por motivo
del quiebre en el supermercado A.

Sección Artículo Problema Problema Quiebre Total


descontinuado comercial stock teórico logístico
Bebidas 2 12 16 88 118
Comestibles 4 25 56 220 305
Cuidado personal 2 14 15 84 115
Total 8 51 87 392 538

a. Ponga título y fuente a la tabla.


b. Construya un gráfico de barras apiladas al 100% por motivo del quiebre según sección.
52 MA477 Estadística

25. Responda o complete:


a. ¿Por qué se usan los gráficos de bastón para variables discretas en vez del gráfico de ba-
rras?
b. ¿Por qué si en un ejercicio nos dan la cantidad de intervalos? no se usa la regla de Sturges?
c. ¿Por qué se redondea por exceso la amplitud en las distribuciones de frecuencias de datos
continuos?
d. La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho
conjunto. El …………………………………………….. son menores o igual a la mediana.
e. Usar la mediana como medida de tendencia central es preferible a usar la media
cuando…………………………………………………….………………………

26. La Superintendencia de Banca y Seguros SBS registra en su boletín del mes de marzo de 2017,
el número de tarjetas de crédito por tipo de crédito y entidad financiera a diciembre de 2016.

Distribución de tarjetas de crédito según empresa bancaria y tipo de crédito. Diciembre 2016
Créditos Créditos a Créditos a Créditos a Créditos a
Créditos de
Empresas corporati- grandes mediana pequeñas microem- Total
consumo
vos empresas empresas empresas presas
Banco Continental 515 879 84 625 6 992 13 075 3 555 540 210
Banco de Comercio 1 725 77 2 23 12 10 1 849
Banco de Crédito del Perú
1 020 895 1 090 2 291 11 177 73 310 34 460 1 143 223
(con sucursales en el exterior)
Banco Financiero 152 003 2 63 328 324 847 153 567
B. Interamericano de Finanzas 25 946 124 209 1 578 1 060 515 29 432
Scotiabank Perú (con sucursa-
261 345 139 426 1 947 745 840 265 442
les en el exterior)
Citibank 135 590 - 27 - - 4 135 621
Interbank (con sucursales en
1 037 099 22 53 137 35 71 1 037 417
el exterior)
Mibanco 7 187 - - - - - 7.187
HSBC Bank Perú 36 640 - - - - - 36 640
Banco Falabella Perú 1 357 665 - - 1 - - 1 357 666
Banco Ripley 1 012 328 1 - - - - 1 012 329
Banco Azteca Perú 60 376 - - - - - 60 376
Banco Cencosud 61 679 - - - - - 61 679
Total banca múltiple 5 686 357 1 539 3 696 22 183 88 561 40 302 5 842 638
Fuente: SBS http://www.sbs.gob.pe/app/stats/EstadisticaBoletinEstadistico.asp 2017

a. Indique las variables usadas en la realización de esta tabla de doble entrada.


b. Rellene los espacios en blanco.
c. El número de tarjetas de crédito de consumo del Banco Interbank es…………………
d. El número de tarjetas de crédito a microempresas del Banco Scotiabank es …………………
e. El número de tarjetas de crédito a empresas medianas o grandes es: …………………
f. El ………….…….% de las tarjetas del Banco de Crédito son de grandes empresas.
g. El ………………..% de las tarjetas de crédito de consumo son del BBVA.
MA477 Estadística 53

Caso: El Metropolitano

El Metropolitano es el sistema integrado de transporte público para Lima, que cuenta con buses de
gran capacidad que circulan por corredores exclusivos, bajo el esquema de autobuses de tránsito rá -
pido BRT (Bus Rapid Transit en inglés). El primer corredor del Metropolitano conecta Lima Sur con
Lima Norte, recorriendo 16 distritos desde Chorrillos hasta Independencia.
El objetivo de este sistema es elevar la calidad de vida de los ciudadanos, al ahorrarles tiempo en el
traslado diario, proteger el medio ambiente, brindarles mayor seguridad, una mejor calidad de servi-
cio y trato más humano, especialmente a las personas de la tercera edad y con discapacidad. Una en-
trevista realizada al alcalde de Lima. Luís Castañeda, reveló lo siguientes resultados de todos los re-
gistros de la base de datos:

 El número promedio de usuarios diarios del Metropolitano es de 463 mil.


 El tiempo medio de recorrido desde el distrito de Independencia hasta Chorrillos es de una hora
con una desviación estándar de 15 minutos.

Frente a los reclamos de los usuarios del Metropolitano. Pro Transporte, organismo regulador del sis -
tema de transportes, ha solicitado un estudio para identificar los principales problemas y actuar con
estrategias inmediatas para mejorar el servicio analizando las siguientes variables:
 Estación (Angamos. Javier Prado y Canaval y Moreyra)
 Tiempo de viaje (en minutos)
 Tiempo de espera (en minutos)
 Ruta (A. B. Expreso 2 y Expreso 5)
 Llegó tarde al lugar de destino (Sí. No)
 Opinión sobre el servicio (bueno. muy bueno. malo. muy malo y regular)
 Principal problema que tiene al viajar en el Metropolitano (Buses muy llenos. colas muy largas en
los horarios puntas. etc.)
 Número de días que usó el servicio la semana anterior.

Uno de los usuarios comentó que la ruta que utiliza es el expreso 5, lo espera ocho minutos en la es -
tación de Angamos, no llega tarde a su destino y considera que el servicio es bueno.

Objetivo general: Realizar un diagnóstico del sistema de transporte del Metropolitano.

27. En base a la entrevista al alcalde de Lima. Luís Castañeda. complete la siguiente tabla:

Contexto Variable Parámetro o estadístico Valor


El número medio de usuarios diarios del
Metropolitano es de 463 mil.
El tiempo medio de recorrido desde Inde-
pendencia hasta Chorrillos es de 1 hora.

La consultora SY Data, ganó la propuesta para realizar el estudio. Por ello tomó una muestra
aleatoria de 120 usuarios de las estaciones Javier Prado. Angamos y Canaval y Moreyra del Me-
tropolitano.

28. Identifique la población en estudio. muestra. unidad elemental y observación.


54 MA477 Estadística

29. Indique la correspondencia de los siguientes enunciados:

A: Variable cualitativa B: Observación C: Dato D: Estadístico E: Parámetro

El número promedio de usuarios diarios del Metropolitano es de 463 mil.


La ruta que emplean los usuarios del metropolitano.
Un usuario comentó que la ruta que utiliza es el expreso 5, lo espera ocho minutos en
la estación de Angamos, no llega tarde a su destino y considera que el servicio es bue-
no.
Un usuario considera que el servicio es bueno.

30. Objetivo específico: Determinar la opinión más frecuente respecto al servicio del sistema de
transporte metropolitano.
Si la consultora SY Data, llega a demostrar que el porcentaje total de los usuarios que opinan
que el sistema de transporte del Metropolitano es malo o muy malo supera al 10%, entonces
Pro Transporte deberá analizar cuáles son las principales quejas de los usuarios del Metropoli -
tano. A continuación, se muestra la opinión que tiene el usuario sobre el servicio.

Realice la tabla de frecuencia y utilice el gráfico de barra que le permita a Pro Transporte iden -
tificar si deberá realizar el análisis de las principales quejas de los usuarios del Metropolitano.

31. Objetivo específico: Determinar la ruta más frecuente que usan los usuarios del Metropoli-
tano.
Pro Transporte deberá proponer incorporar un bus cuya ruta tenga el mayor porcentaje de
clientes. Realice la tabla de frecuencia y utilice un gráfico circular que permita a Pro Transporte
realizar dicha propuesta. A continuación, se muestra una muestra de rutas.

La consultora SY Data, muestra el siguiente cuadro 2:


MA477 Estadística 55
Cuadro 2
Estación
Total
Canaval y Javier
Principal queja Angamos general
Moreyra Prado
Buses muy llenos 5 2 8 15
Colas muy largas en los horarios punta 8 5 22 35
Falta de ventilación en las unidades 2 2 4 8
Otros 2 6 23 31
Reducido el horario de servicios especiales 4 9 18 31
Total general 21 24 75 120
Fuente: Empresa Pro Transporte

a. Indique el título de la tabla.


b. Interprete el valor 9 con respecto a la fila. con respecto a la columna y con respecto al total
c. Construya la tabla y gráfico de distribución porcentual de las principales quejas de los usua-
rios del Metropolitano por estación.
d. Calcule el porcentaje de usuarios que indican como principal queja colas muy largas en los
horarios punta y pertenecen a la estación Javier Prado.

32. Objetivo específico: Determinar el número de días a la semana más frecuente que usó un
usuario del Metropolitano en la semana anterior entre las 6:00 y 6:30 pm.
Ante la queja de los usuarios que indican buses muy llenos, el gerente de operaciones del Me -
tropolitano programará el número de buses vacíos que debe enviar a los paraderos en el hora -
rio de 6:00 y 6:30 pm para la siguiente semana, para ello evaluará el número de veces que un
usuario utilizó el servicio en este horario en la semana anterior. Si registra que más del 60% de
los usuarios usó el servicio la semana anterior mínimo cuatro veces en el horario de 6:00 y 6:30
pm, enviará a la estación tres buses vacíos entre las 6:00 y 6:30 pm. Usando el gráfico 1 que
muestra los resultados de una muestra de 40 usuarios de la estación de Javier Prado y el cua-
dro 3 con información de la estación de Angamos, ¿en qué estación el gerente debe proponer
el envío de tres buses vacíos en el horario de 6:00 y 6:30 pm?

Gráfico 1: Estación Javier Prado Cuadro 3: Estación Angamos

Variable hi

1 0.01
2 0.09
3 0.35
4 0.34
5 0.21

a. Indique la variable en estudio.


b. Complete todos los elementos del gráfico 1.
c. Para la estación de Angamos determine el porcentaje de usuarios que utilizó el servicio la
semana anterior como máximo dos veces.
d. Para la estación Javier prado interprete H4.
e. ¿En qué estación el gerente debe proponer la ampliación de buses vacíos en el horario de
6:00 a 6:30 pm?

33. Objetivo específico: Determinar el intervalo de tiempo de espera más frecuente de los usua-
rios de la ruta B del Metropolitano.
Pro Transporte ha establecido que la concesionaria para justificar un posible incremento en la
tarifa, debe implementar mejoras en el servicio para reducir el tiempo de espera de un usuario
que actualmente se sitúa entre los 15 y 20 minutos en el horario de mayor demanda, una de
56 MA477 Estadística

las medidas implementadas por el concesionario es un nuevo servicio expreso. Pro Transporte
indica que si por lo menos el 90% de los usuarios espera menos de 15.7 minutos, entonces
este será un buen indicador para una posible calificación del incremento de precios.
Tiempo de espera, en minutos, de la ruta B del Metropolitano
2.1 3.8 3.8 5.4 5.6 8.0 8.5 8.8 9.0 9.2 9.4 9.5 9.8 9.9 10.0
10.1 10.2 11.0 11.0 11.2 12.3 13.1 13.2 13.3 13.4 13.5 14.3 14.8 16.9 22.4
MA477 Estadística 57

Tiempo de espera en minutos estación Javier Prado


9.4 19.4 22.4 25.3 15.3 21.3 24.1 26.4 14.5 22.1 25.2 35.8
12.5 20.4 22.7 25.7 16.4 21.9 24.9 26.9 14.1 20.8 23.8 26.2

a. Identifique tipo de variable y su escala de medición.


b. Obtenga la tabla de distribución de frecuencias usando la regla de Sturges, se selecciona
una muestra de usuarios de la ruta B donde se registra el tiempo de espera en minutos.
c. Interprete h2 , F4 y H3.
d. ¿Se puede decir que hay un buen indicador para un incremento de precios del pasaje?

34. Usando polígonos de frecuencias comparativos, ¿se puede sugerir que un usuario del expreso
2 de la estación Angamos espera menos tiempo que un usuario de la estación de Javier Prado?

Tiempo de espera en minutos estación Angamos


6.8 15.5 19.4 23.6
7.5 15.8 20.7 24.0
11.2 16.2 21.0 25.4
11.7 16.5 21.5 26.7
12.0 18.9 22.0 28.1

Título: ………………………………………………………………………………………………………………………………….
Marca de clase Angamos Javier Prado
Límite inferior Límite superior ´
Xi fi pi fi pi
9.25 20% 4%
14.15 25% 21%
19.05 25% 17%
23.95 20% 50%
28.85 10% 4%
33.75 0% 4%
Total 20 100% 24 100%

Fuente: ……………………………………….…………………………….

35. El concesionario del Metropolitano después de aplicar mejoras en el servicio. como ampliar
nuevas rutas. incrementar el número de buses. desea conocer si el tiempo de espera ha mejo -
rado, a partir del gráfico 2, ¿puede sugerir los resultados que ha mejorado el tiempo de espera
del servicio?
58 MA477 Estadística

a. En la distribución del tiempo de espera antes de aplicar las mejoras, determine el porcenta-
je de usuarios que demoran más de 10.7 hasta 21.2 minutos.
b. En la distribución del tiempo de espera después de aplicar las mejoras, ¿qué porcentaje de
usuarios registran un tiempo de espera menor o igual a 21.2 minutos?
c. ¿Puede sugerir los resultados que ha mejorado el servicio? Justifique su respuesta numéri-
camente.

Caso: Cacao S.A.

Cacao S.A es una empresa dedicada a la fabricación de caramelos y chocolates diversos siendo una
de sus líneas la del chocolate “Choconut”; el gerente de producción ha notado, que últimamente se
están presentando una serie de problemas en el proceso productivo por lo que encarga a un equipo
especializado realizar un estudio con la finalidad de proponer soluciones.
Se selecciona una muestra de 81 trabajadores y se registra la información con respecto a una jornada
de trabajo de las siguientes variables:
 Planta: Ubicación de la planta en que opera el trabajador (Callao, Los Olivos y Ate)
 Turno: Turno en que se realiza la producción (Mañana, Tarde, Noche)
 Género: Género del trabajador, 1: Hombre 2: Mujer
 Capacitación: Si el trabajador ha tenido capacitación previa o no.
 Tiempo perdido: Tiempo perdido, en minutos, por cada trabajador debido a algún accidente den -
tro del proceso de producción.
 Número de barras de chocolate producidas.
 Número de defectuosos: Número de barras de chocolate defectuosas produci-
das por trabajador en la última jornada de trabajo.
 Principal problema: Insatisfacción por remuneraciones, alta rotación de perso-
nal. infraestructura inadecuada, falta mantenimiento de equipos, otros

Luego de procesados los datos de los trabajadores seleccionados se obtuvieron los siguientes re-
sultados:
 El número promedio defectuosos es de 25.73 artículos.
 El principal problema que identifican los trabajadores es la infraestructura inadecuada que repre-
senta el 48.15%.
 El 22% de los trabajadores del turno tarde recibió capacitación.

36. Indique la unidad de análisis o elemento, población y muestra.

37. Indique el tipo de variable y la escala de medida de las variables.

38. Complete el cuadro, indicando si se trata de un parámetro o de un estadístico y escriba el


nombre de la variable.

Estadístico o parámetro Valor Variable


MA477 Estadística 59

39. Con el objetivo de analizar la distribución porcentual de trabajadores por turno y capacitación
previa para determinar cuál de los grupos requiere capacitación con más urgencia.

Capacitación previa
Turno Sin capacitación Con capacitación Total
Mañana 10 7 17
Noche 19 18 37
Tarde 13 14 27
Total 42 39 81

a. Indique el título y fuente.


b. ¿Qué porcentaje de los trabajadores no recibieron capacitación y son del turno mañana?
c. ¿Qué porcentaje de los trabajadores son del turno tarde?
d. En el turno noche, ¿qué porcentaje de los trabajadores no recibieron capacitación?
e. Del total de trabajadores que recibieron capacitación previa, ¿qué porcentaje de los traba -
jadores son del turno tarde?
f. El porcentaje de trabajadores con capacitación por cada turno de trabajo debe exceder a
los que no recibieron capacitación. Si esta afirmación no se cumple se debe priorizar aquel
grupo menos capacitado a fin de que mejore su eficiencia. ¿En qué turno de trabajo se
debe priorizar la capacitación? Explique numéricamente su respuesta.

40. Con la finalidad de estudiar la distribución porcentual de los trabajadores con y sin capacita-
ción previa según el turno en que laboran, el departamento de RR.HH. elaboró el siguiente grá-
fico:

100%

90%
31.0%
35.9%
80%

70%

60%

50% TARDE
45.2%
NOCHE
40% MAÑANA

30%

20%
23.8%
10% 17.9%

0%
Sin Capacitación Con Capacitación

a. Indique todos los elementos omitidos en el gráfico.


b. Complete e interprete el porcentaje faltante.
c. Del análisis del gráfico anterior: De los trabajadores sin capacitación, aquel turno que ten-
gan un porcentaje mayoritario es el turno por priorizar para la capacitación. ¿En qué turno
de trabajo se debe priorizar la capacitación?

41. Con el objetivo de identificar en cuál planta existe un menor porcentaje de trabajadores sin ca-
pacitación se estudiará la distribución de los trabajadores según la planta donde laboran y si
tuvieron o no capacitación previa, en tal sentido el departamento de recursos humanos elabo -
ró el siguiente gráfico:
60 MA477 Estadística

Distribución de trabajadores según planta y si tuvieron capacitación previa o no


40

Número de trabajadores
35

30
19
25

20 13

15 7 Con capacitación

10 Sin Capacitación
17
13 12
5

0
Ate Callao Los Olivos

Fuente: Empresa Cacao S.A. Planta

Indique:
a. El número de trabajadores que no tienen capacitación es: ……….
b. Del total de la muestra, el número de trabajadores que son de la planta Callao y que si re -
cibieron capacitación es …………
c. Del total de trabajadores de la planta de los Olivos, el ………% tuvo capacitación previa.
d. Del total de muestra el ……….% laboran en la planta de Ate.
e. Se debe presupuestar las capacitaciones para aquella planta que tenga el porcentaje ma-
yor de trabajadores sin capacitación. ¿Cuál planta debe de elegirse?

42. Existe el problema del excesivo número de chocolates defectuosos. razón por la cual se analiza
la distribución del número de trabajadores según el número de chocolates defectuosos que
producen. en tal sentido el departamento de producción elaboró el siguiente gráfico.
28
30
23
25
18
20

15

10 7
5
5

0
10 11 12 13 14

Número de defectos

Indique:
a. Los elementos faltantes del gráfico.
b. Del total de la muestra, 28 trabajadores producen………………chocolates defectuosos.
c. Del total de la muestra, …..….. trabajadores producen entre 10 y 11 chocolates defectuosos.
d. El número de trabajadores producen de 11 a 13 artículos defectuosos es: …………………..…
e. El departamento de control de la calidad indica que cada trabajador puede generar como
máximo 12 chocolates defectuosos, sin embargo, se admite un mayor número de chocola-
tes defectuosos en algunos trabajadores con la condición de que en conjunto no supere el
20% del total de trabajadores. En caso contrario debería detenerse la producción para eva -
luar a fondo las fallas de calidad. De acuerdo al análisis de los datos: ¿La producción de cho -
colates debería detenerse?
MA477 Estadística 61

43. Otra preocupación del departamento de producción es el excesivo tiempo perdido por acci-
dentes. en tal sentido se elaboró la siguiente gráfica para estudiar la distribución del número
de trabajadores sin capacitación según el tiempo perdido por accidentes (en minutos):

a. Indique los elementos faltantes del gráfico.

16

14 14

12
11
10

6 6
5
4
4
2 2

0
21.5 26.5 31.5 36.5 41.5 46.5 51.5 56.5

b. Con el gráfico anterior, realice la tabla de distribución de frecuencias.

Intervalos Marca de clase fi hi % Fi Hi%


[ 0 - ] 21.5 0
( 4-6 ] 26.5 4
( ] 31.5 5
( ] 36.5 11
( ] 41.5 14
( ] 46.5 6
Total
Fuente: Empresa Cacao S.A.

c. Interprete f2 , F2, h3% y H4%.


d. Si el porcentaje de trabajadores con tiempo perdido mayor a 39 minutos supera al 50% la
situación requiere una inmediata evaluación, para lo cual debe detenerse la línea produc-
ción. En base a los datos recolectados ¿La línea de producción de chocolates se debe de
detener? Sustente su respuesta.

44. Los siguientes datos corresponden al tiempo perdido en minutos de los trabajadores con capa-
citación. (Observe que los datos están ordenados ascendentemente por columnas)

12.0 23.3 26.0 30.0 33.6 38.2 44.2 24.0 28.2 31.2 35.6 38.1 19.0
17.1 23.4 27.0 30.0 33.8 38.2 44.7 24.0 29.2 32.6 36.0 42.0 20.3
18.0 24.0 27.5 30.0 34.1 38.6 48.0 25.0 30.0 33.6 36.8 44.0 21.2

a. Construya la tabla de distribución de frecuencias para los datos anteriores mediante el mé-
todo de Sturges.

Título: ……………………………………………………………………………………………………………………..
62 MA477 Estadística

Intervalos Marca de clase fi Fi hi% Hi%


[ ]
( ]
( ]
( ]
( ]
( ]
Total
Fuente: Empresa Cacao S. A.

b. Interprete la frecuencia simple de mayor valor.


c. Si el tiempo perdido por accidentes es mayor a 30 minutos en un porcentaje de trabajado-
res mayor al 50%. se considera la capacitación deficiente. De acuerdo a los datos ¿se pue-
de considerar la capacitación de los trabajadores deficiente?

45. Por último, se analiza la variable tiempo de demora por accidentes de los trabajadores según
género con el objetivo de identificar cual grupo, de hombres o de mujeres requiere capacita-
ción con mayor urgencia a fin de disminuir el tiempo perdido en accidentes en la línea de pro -
ducción.

Distribución acumulada de los trabajadores según tiempo de demora por


accidentes y género
60

49
50 45

40
Número de trabajaodres

33
30 32
30
20 16 24 Fi Hombres

16 Fi Mujeres
8
10
2 4
0 1
12 19 26 33 40 47 54

Fuente: Cacao S.A. Tiempo de demora (minutos)

a. Complete la tabla de distribución de frecuencias.

Distribución de los trabajadores según tiempo de demora por accidentes por género
Hombres Mujeres Hombres Mujeres
Tiempo de demora Marca
fi fi Fi Fi
por accidentes de clase
[ ]
] ]
] ]
] ]
] ]
] ]
Total
Fuente: Empresa Cacao S.A.
MA477 Estadística 63

b. Interprete el valor de f4 para ambas distribuciones.


c. Interprete el valor de F3 para ambas distribuciones.
d. Analizando las dos distribuciones de los trabajadores hombres y de las mujeres, ¿qué gru-
po requiere capacitación más urgente por tener mayor porcentaje de trabajadores con
tiempos de demora mayor a 40 minutos?
64 MA477 Estadística

Unidad 3. Medidas de resumen


Logro de la Unidad 2
Al finalizar la unidad, el estudiante interpreta los resultados correspondientes a las me-
didas de resumen obtenidas de los datos de una situación real.

3.1. Datos simples y datos agrupados

Datos simples
Se denomina datos simples (datos no agrupados) a los valores que no están agrupados en distribu-
ciones de frecuencias.

Un ejemplo de datos simples es la siguiente tabla.

18.5 10.6 10.8 11.3 11.5 11.6 11.8 12 12.1 12.8


13 13.3 13.5 13.5 13.6 13.9 14 14.2 14.2 14.3

Datos agrupados
Se denomina datos agrupados a los valores que están agrupados en distribuciones de frecuencias.

Un ejemplo de ejemplo de datos agrupados es la siguiente tabla.

Distribución de obreros según descuentos, en dólares


Descuentos. en dólares Xi fi hi Fi Hi
[145.1 ; 174.6] 159.85 3 0.0625 3 0.0625
]174.6 ; 204.1] 189.35 3 0.0625 6 0.1250
]204.1 ; 233.6] 218.85 10 0.2084 16 0.3334
]233.6 ; 263.1] 248.35 12 0.2500 28 0.5834
]263.1 ; 292.6] 277.85 7 0.1458 35 0.7292
]292.6 ; 322.1] 307.35 7 0.1458 42 0.8750
]322.1 ; 351.6] 336.85 6 0.1250 48 1.0000
Total 48 1.0000

Ejercicio 24

Luego de una investigación se tiene muchos datos, con ellos se puede realizar algunos gráficos y
distribuciones de frecuencias, pero ¿cómo resumir la información en un solo número?
MA477 Estadística 65

3.2. Medidas de tendencia central

Una medida de localización o de tendencia central (MTC) se refiere al valor central que representa a
los datos de una determinada variable.

Media Media
Media Mediana Moda
ponderada geométrica

3.2.1. Media

La media (media aritmética o promedio) de un conjunto de valores de una variable es la suma de di -


chos valores dividida entre el número de valores.

Ejemplo 13.
 Según el Censo Nacional de Población 2007, la edad promedio de los peruanos es 28.4 años.
 En al año 2017, el consumo medio anual per cápita de carne de pollo en Lima fue de 58 kilos,
aproximadamente. según la Asociación Peruana de Avicultura (APA).
 En su informe titulado “Situación del Mercado Laboral en Lima Metropolitana”, el INEI señaló que
el ingreso promedio mensual se situó en S/. 1674.78 en los meses de diciembre, enero y febrero
del año 2018. Asimismo, detalló, que el ingreso promedio mensual de los hombres fue de S/. 1
894 (0.8% menos), mientras que el de las mujeres alcanzó los S/. 1 395 (5.4% más).
 En un informe del 23 de febrero del 2013, la consultora Arellano Marketing afirma que el gasto
diario por persona en un desayuno asciende a 1.8 soles, en promedio y que, en promedio, una fa -
milia peruana está conformada por 4.5 personas.

Fórmulas para la media aritmética

La fórmula para la media poblacional es:

Las fórmulas para la media muestral son:

Si se tienen datos simples no se construye la distribución de frecuencias para calcular la media o


cualquier otro estadístico, se prefiere el cálculo con los datos simples.
66 MA477 Estadística

Ejercicio 25
Los datos siguientes corresponden al margen de utilidad bruta, en porcentaje, de una muestra
aleatoria de diez empresas comerciales. Calcule e interprete la media del margen de utilidad bruta.

78.1 65.1 63.2 65.8 90.2 67.4 74.1 76.9 54.3 1.62

Media = 63.672 %

Interpretación. El margen de utilidad bruta de la muestra TIENDE, SE APROXIMA o ESTÁ ALREDEDOR


DEL 63.672%

Ejercicio 26
Los datos siguientes corresponden a la cantidad de ventas diarias de una muestra aleatoria de
empresas:

Distribución de empresas según número de ventas diarias


Número de ventas diarias fi hi Fi Hi
12 50 50 0.2778
13 78 128 0.7111
14 28 156 0.8667
15 14 170 0.9444
16 10 180 1.0000
Total 180 1    
Fuente: Empresas A.

Complete la tabla de distribución de frecuencias, calcule e interprete la media del número de ventas
de la muestra usando las frecuencias absolutas.

Promedio = 13.2 ventas diarias

INTERPRETACIÓN.

El número de ventas diarias tienden a 13.2 ventas


El número de ventas diarias esta alrededor de 13.2 ventas
El número de ventas diarias se aproxima a 13.2 ventas

Calcule la media del número de ventas de la muestra usando las frecuencias relativas.

Si el promedio de ventas es menor a 13.45, se impulsarán promociones. ¿Qué se hará?


MA477 Estadística 67

Ejercicio 27
Los datos siguientes corresponden al monto de retiro diario, en dólares, de una muestra aleatoria de
clientes de un banco. Complete la distribución de frecuencias.

Distribución de clientes de banco según monto de retiro. en dólares


Monto de retiro (en dólares) Marca de clase fi hi Fi Hi
 152 .   155 288  0.48
 . 164   161 0.32 480 0.80 
   .     167  570 0.95
   .     173 600 1.00 
Fuente: Banco A.

Calcule e interprete la media del monto de retiro diario de la muestra. Use las frecuencias absolutas.

Calcule e interprete la media del monto de retiro diario de la muestra. Use las frecuencias relativas.

Ejercicio 28

Calcule la media de los siguientes grupos de números:

Grupo 1
1 2 3 4 5 6 7
Grupo 2
1 2 3 4 5 6 900

¿Qué nota al calcular la media de cada grupo?

Características de la media
 Se puede calcular para datos medidos en escala de intervalo o razón.
 El cálculo de la media es sencillo y es una medida muy conocida.
 El valor de la media es sensible a los valores extremos. por lo que varía mucho con valores muy
grandes o muy pequeños con respecto a los demás.
68 MA477 Estadística

3.2.2. Mediana
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto.

Ejercicio 29
Indique que entiende en las siguientes afirmaciones:
 Según los Censos Nacionales 2007, la mediana de la edad de las mujeres que viven en Lima es
28 años, mientras que la edad de las mujeres que viven en Loreto es 19 años.

 Según un estudio, en mujeres, del Centro Peruano de Estudios Sociales CEPES (2000), en Lima
la mediana de la edad a la primera unión (vida conyugal) es de 23.6 años, mientras que en Lo -
reto es de 18 años.

 Según los Censos Nacionales 2007, la mediana del número de hijos que las mujeres peruanas,
mayores a 12 años, han tenido nacidos vivos es dos hijos.

Cálculo de la mediana
MA477 Estadística 69

Ejercicio 30

Grupo A

1.61 1.62 1.63 1.63 1.64 1.64 1.66 1.70 1.70 1.73 1.73 1.77 1.83

I = 0.5 n = 0.5 (13) = 6.5  i = 7  Me = 1.66 m

INTERPRETACIÓN:

El 50% los jugadores tienen una estatura como máximo de 1,66 metros
El 50% los jugadores tienen una estatura mínima de 1,66 metros

Grupo B

1.56 1.61 1.62 1.63 1.63 1.64 1.64 1.66 1.70 1.70 1.73 1.73 1.77 1.83
Imagen tomada de http://office.microsoft.com/es-hn/images/?CTT=97

En cada grupo se muestra la estatura de cada jugador. Calcule e interprete el valor de la mediana de
la estatura en cada grupo.

Ejercicio 31
Los datos siguientes corresponden a la cantidad de ventas diarias de una muestra aleatoria de
pequeñas empresas:
Distribución de empresas según número de ventas diarias
Número de ventas diarias fi hi Fi Hi
12 50 0.2778 50 0.2778
13 78 0.4333 128 0.7111
14 28 0.1556 156 0.8667
15 14 0.0778 170 0.9444
16 10 0.0556 180 1.0000
Total 180 1    

Calcule e interprete la mediana.


70 MA477 Estadística

Ejercicio 32
En una ciudad, se tomó una muestra aleatoria de 1000 personas y se les preguntó por su ingreso
mensual, en dólares, obteniéndose los siguientes resultados.

Título: ………………..……………………………………………………………………………………………………………………………
Ingresos (en dólares) Marca de clase fi hi Fi Hi
 300 . 700  500 104 0.104 104 0.104
 700 . 1 100  900 224 0.224 328 0.328
 1 100 . 1 500  1 300 437 0.437 765 0.765
 1 500 . 1 900  1 700 151 0.151 916 0.916
 1 900 . 2 300  2 100 84 0.084 1000 1.000
Fuente: Estudio A

Calcule e interprete la mediana del ingreso mensual. Use la fórmula


Me = 1100 + (400/437) [500 – 328 ] = $ 1257.43

Calcule la mediana del ingreso mensual. Use la fórmula


Me = 1100 + (400/0.437) [0.5 – 0.328 ] = $ 1257.43

Ejercicio 33
Calcule la mediana de los siguientes grupos de números.

Grupo 1
1 2 3 4 5 6 7
Grupo 2
1 2 3 4 5 6 700

¿Qué concluye al calcular la mediana de cada grupo?

Características de la mediana
 Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
 La mediana no se ve afectada por valores extremos, por lo que se prefiere como medida de ten -
dencia central cuando hay datos extremos o la distribución de frecuencias no es simétrica.
MA477 Estadística 71

3.2.3. Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia.

Ejercicio 34
Interprete las siguientes afirmaciones:

a. La moda de video visto en YouTube es Despacito, fue visto más de 5 mil millones de veces.

b. La moda de apellido (paterno o materno) de alumno en la UPC es Rodríguez.

c. La moda de idioma como lengua materna en el mundo es el chino mandarín, con más de 900
millones de personas.

Cálculo de la moda

Para datos en distribuciones de frecuencia por intervalo:

 si la moda está en el primer intervalo. entonces d1 es igual a la primera frecuencia


 si la moda está en el último intervalo. entonces d2 es igual a la última frecuencia.
72 MA477 Estadística

Ejercicio 35
Calcule e interprete la moda de los siguientes datos, que corresponden al número de transacciones
bancarias diarias que realiza una empresa. Para ello se tomó una muestra de 40 pequeñas empresas.
1 1 3 2 0 3 3 3 2 1 2 0 0 1 3 0 3 2 1 2
3 2 0 3 0 2 3 0 3 1 2 4 2 0 1 4 2 2 2 2

Ejercicio 36
Los datos siguientes corresponden a la cantidad de ventas diarias de una muestra aleatoria de
pequeñas empresas:
Distribución de empresas según número de ventas diarias
Número de ventas diarias fi hi Fi Hi
12 50 0.2778 50 0.2778
13 78 0.4333 128 0.7111
14 28 0.1556 156 0.8667
15 14 0.0778 170 0.9444
16 10 0.0556 180 1.0000
Total 180 1    

Calcule e interprete la mediana usando frecuencias absolutas y relativas.

Ejercicio 37
Calcule la moda de los siguientes grupos de números.
Grupo 1
1 2 4 4 5 5 7
Grupo 2
1 2 4 4 5 5 700
¿Qué concluye al calcular la moda?

Características de la moda
 La moda se puede calcular para cualquier escala de medición.
 El valor de la moda no se ve afectada por valores extremos.
 La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o
más modas (multimodal). Algunas series de datos no tienen moda.
MA477 Estadística 73

Propiedades de la media aritmética


 La suma de las desviaciones de un conjunto de datos respecto de su media es cero.
n

∑ ( xi −x ) =0
i=1

 Si se tienen n valores c = constante, entonces la media de todos los datos es la misma constante.

x i=c → x=c

 Si a todos los valores de la variable se les suma un mismo número, la media queda aumentada en


dicho número.
y i=x i +c → y =x+ c

 Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda
multiplicada por dicho número.

y i=cxi → y=c x

 Si cada uno de los n valores xi es transformado en: yi = a xi + b, siendo a y b constantes, entonces.


la media de los n valores yi es:

 Si n1 datos tienen media x 1 y n2 datos tienen media x 2, luego la media de los n1 + n2 datos es:

n1 x1 +n 2 x 2
x=
n1 +n 2

Ejercicio 38
Demuestre cada una de las propiedades anteriores.

Ejercicio 39
En una negociación por aumento de salarios, la gerencia de una empresa ofrece a sus empleados dos
alternativas. La primera consiste en un aumento general del 5%, mientras que, la segunda consiste
en un aumento general del 2% más un bono de 150 soles.

Indique la alternativa que da a los empleados el mayor promedio de sueldos, si la media de los
sueldos es actualmente de 1 800 soles.
74 MA477 Estadística

3.2.4. Media ponderada

Permite calcular el valor medio considerando la importancia o peso de cada valor sobre el total.

La fórmula es:

donde:
xi: Observación individual
wi: Peso asignado a cada observación

Ejercicio 40
Las notas de un alumno de Estadística son:

DD1 (8%) DD2 (12%) Examen parcial (15%) Examen final (40%) Trabajo final (25%)
12 10 13 13 13

¿Cuál es el promedio final del alumno?


MA477 Estadística 75

3.2.5. Media geométrica


La media geométrica de n valores positivos se define como la raíz enésima del producto de esos valo-
res. Es útil para promediar un conjunto de datos obtenidos en intervalos regulares de tiempo.
Por lo general expresan proporciones o tasa de cambio.
La fórmula es:

donde:
MG=f p =

n x1 x2 x x n

× ×… × n =n n =√ f 1 × f 2 × …× f n
x0 x1 x n−1 x0

fp: Factor de variación promedio


ft: Factor de variación en el período t
n: número de factores de variación

 Además, el factor de variación en un período de tiempo t determinado puede ser hallado como
el cociente del valor observado en ese período y el valor observado en el período anterior.
xt
f t=
x t−1
 La tasa de variación, it, indica el crecimiento o decrecimiento porcentual de la variable de un pe-
ríodo t respecto del período anterior, it = (fi – 1) x 100

 La tasa de variación promedio, ip, se obtiene por ip = (fp – 1) x 100

Ejemplo 14.
La siguiente tabla muestra el índice del flujo de vehículos de Lima durante el año 2017.

Lima: Índice mensual del flujo vehicular total 2020


Ene Feb Mar Abr May Jun Jul Ago Set Oct Nov Dic
167.2 160.0 152.0 156.1 143.1 139.6 155.8 156.7 147.1 156.9 149.8 174.3
Fuente: MTC - Provías Nacional

a. Determine la tasa promedio de crecimiento del flujo de vehículos en la ciudad de Lima.


Solución

Calculemos la tasa promedio f p=



11 xn
x0

MG=f p =

11 174.3
167.2
=1.00378
Tasa promedio de crecimiento ip = (fp – 1) x 100 = (1.00378 – 1) x 100 = 0.378%

b. Asumiendo que la tasa promedio de crecimiento anterior permanece constante. ¿En cuánto se
espera el flujo vehicular en Lima para el mes de abril de presente año?
Solución
Suponemos que el crecimiento mensual es constante e igual al 0.387%.
Enero 2021 174.3 x (1.00378)1 = 174.959
Febrero 2021 174.3 x (1.00378)2 = 175.620
Marzo 2021 174.3 x (1.00378)3 = 176.284
Abril 2021 174.3 x (1.00378)4 = 176.950
76 MA477 Estadística

Ejercicio 41
El director ejecutivo de una empresa desea determinar la tasa de variación promedio de los ingresos,
en miles de dólares, a partir de la siguiente tabla. Si esta tasa de variación es inferior a la media del
sector, que es del 10%, decidirá lanzar una nueva campaña de publicidad. ¿Qué decisión tomará el
director?

Año 2011 2012 2013 2014 2015


Ingresos 50 55 66 60 78
MA477 Estadística 77

3.3. Medidas de posición o cuantiles

Percentil Cuartil Decil Quintil

Cuartiles
Se denomina así a cada uno de los tres percentiles: P25, P50, P75 y se les denota como C1, C2 y C3 respec-
tivamente.

Decil
Se denomina así a cada uno de los nueve percentiles: P10, P20, …. P90 y se les denota como D1, D2 .…. D9
respectivamente.

Quintil
Se denomina así a cada uno de los cuatro percentiles: P20, P40, P60, P80 y se les denota como Q1, Q2, Q3 y
Q4 respectivamente.

Ejemplo 15.
Farid Matuk, ex jefe del INEI afirmaba en su cuenta de Twitter en el 2017: “Como reflejo de la desi -
gualdad y la pobreza, el quintil más rico adquiere 10 veces más kilos de vacuno que el quintil más po -
bre”.

Ejemplo 16.

Ejemplo 17.
La distribución del ingreso en el Perú deja mucho que desear, Según datos de la CEPAL, en el año
2003, el 20% más pobre de la población (Quintil I) recibía apenas el 3.8% del ingreso nacional, en tan-
to que el 20% más rico (Quintil V) recibía nada menos que el 55.2% del mismo. El Quintil II recibía el
7.9%, el Quintil III el 12.6% y el Quintil IV el 20.6%.
El decil 1, conformado por el 10% más pobre de la población, recibía apenas el 1.4%, en tanto que el
decil 10, conformado por el 10% más rico, recibía nada menos que el 39.2%.

Tomado de http://desarrolloperuano.blogspot.com/2007/07/la-distribucin-del-ingreso-y-el.html
78 MA477 Estadística

3.3.1. Percentil

El percentil k-ésimo Pk es un valor tal que por lo menos k por ciento de las observaciones son meno-
res o iguales que este valor.

Ejercicio 42
Indique lo que significa las siguientes afirmaciones.
a. Según los Censos Nacionales 2007 realizados por el INEI el percentil 30 de la edad de los perua -
nos es 14 años.

b. Según el II Censo Universitario 2010 realizado por el INEI el percentil 70 de la edad de los estu -
diantes de pregrado de las universidades peruanas es 24 años.

c. Según la publicación Growth of Dutch children del Amstel Institute en el año 2001, el percentil
50 de la estatura de holandeses de 19 años es 1.84 metros.

Cálculo del percentil


MA477 Estadística 79

Ejercicio 43
Dados los siguientes datos, correspondientes al número de trabajadores de 16 pequeñas empresas,
calcule e interprete el percentil 30 y el percentil 75.

14 35 40 14 48 25 8 3 1 5 3 5 6 4 3 5

Ejercicio 44
Calcule el percentil 35 de los siguientes datos.

xi fi hi
1 5 0.025
4 46 0.230
6 109 0.545
12 40 0.200

Ejercicio 45
Las notas de un curso de capacitación sobre análisis de riesgos se muestran en la siguiente distribu -
ción de frecuencias.

Distribución de alumnos según notas del curso de capacitación. Abril 2018


Notas Marca de clase fi hi Fi Hi
08 – 10 9 15 0.1056 15 0.1056
10 – 12 11 48 0.3380 63 0.4437
12 – 14 13 60 0.4225 123 0.8662
14 – 16 15 12 0.0845 135 0.9507
16 – 18 17 7 0.0493 142 1.0000
Fuente: Empresa A. Gerencia de RRHH

a. la nota mínima para estar en el décimo superior.


b. Calcule la nota máxima para estar en el 15% de las notas más bajas.
c. Calcule el porcentaje de personas que tuvo notas menores o iguales a 13.
d. Calcule el porcentaje de personas que tuvo notas mayores a 11.5 y menores o iguales a 17.5.

Ejercicio 46
Calcule el percentil 25 de los siguientes grupos de números.
80 MA477 Estadística

Grupo 1
1 2 3 4 5 6 7
Grupo 2
1 2 3 4 5 6 700

¿Qué concluye al calcular dicho percentil?

Características de los percentiles

 Se puede calcular en variables medidas en escala ordinal, de intervalo y razón.


 El valor del percentil no se ve afectado por valores extremos.

Ejemplo 18.
La siguiente tabla corresponde a la distribución de frecuencias de los 200 sueldos, en soles, del últi-
mo mes de los empleados de una empresa.

Tabla 4. Distribución de frecuencias de salarios del último mes


Salario (en soles) fi hi Fi Hi
450 – 650 32 0.160 32 0.160
650 – 850 40 0.200 72 0.360
850 – 1 050 60 0.300 132 0.660
1 050 – 1 250 48 0.240 180 0.900
1 250 – 1 450 20 0.100 200 1.000

Calcule el sueldo mínimo para estar en el 15% de los trabajadores mejores pagados.

3.4. Medidas de dispersión o de variabilidad

Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero
no indican qué tan cercanos o lejanos están los datos de dicho valor central.

Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los
representa y por lo tanto, permiten evaluar la confiabilidad de ese valor central.

Si la medida de dispersión:
- tiene un valor pequeño, los datos están concentrados alrededor de la medida de tendencia central.
- tiene un valor grande, los datos no están concentrados alrededor de la medida de tendencia cen-
tral.

Desviación Coeficiente de Rango


Varianza Rango
estándar variación intercuartil
MA477 Estadística 81

3.4.1. Varianza
La varianza es el promedio de los cuadrados de la diferencia de cada dato con la media.

Las unidades de la varianza son las unidades de los datos al cuadrado.

La fórmula para la varianza poblacional es

Cálculo de la varianza

3.4.2. Desviación estándar


La desviación estándar es la raíz cuadrada positiva de la varianza.
La desviación estándar poblacional se denota por  y la muestral por s.

Ejercicio 47
Los siguientes datos corresponden a consumos de alumnos en la cafetería de una universidad. Calcu -
le la desviación estándar y la varianza.

8.5 1.0 0.6 11.0 9.0 2.5 2.0 1.5 8.0 4.0 2.5 3.0 1.5 7.0

Ejercicio 48
Los datos corresponden a las notas de 327 participantes de un curso de capacitación del programa
SAP aplicado a las finanzas. Calcule la desviación estándar muestral.

Tabla 5. Distribución de participantes según notas del programa SAP aplicado a las Finanzas
xi fi hi Fi Hi
12 110 0.3364 110 0.3364
14 136 0.4159 246 0.7523
15 44 0.1346 290 0.8869
16 37 0.1131 327 1.0000
82 MA477 Estadística

Ejercicio 49
La siguiente tabla muestra la rentabilidad en porcentaje de una muestra de 90 acciones negociados
en una rueda de la bolsa en el último mes.

Tabla 6. Rentabilidad de 90 acciones en el último mes


Rentabilidad. en por- Marca de clase fi hi Fi Hi
centaje
 5.0 - 7.8 13 0.144 13 0.144
 7.8 - 10.6 20 0.222 33 0.367
10.6 - 13.4 38 0.422 71 0.789
13.4 - 16.2 19 0.211 90 1.000

Calcule la desviación estándar muestral.

Ejercicio 50
Calcule la desviación estándar de los siguientes grupos de números.

Grupo 1
1 2 3 4 5 6 7
Grupo 2
1 2 3 4 5 6 700

¿Qué concluye al calcular dicha medida de dispersión?

Características de la varianza y la desviación estándar

 La varianza y la desviación estándar se ven afectadas por valores extremos.


 La varianza y la desviación estándar son números reales no negativos.
 Se pueden calcular para variables medidas en escala de intervalo o razón.
 La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que, la
desviación estándar es expresada en las mismas unidades de los datos.
 Si cada uno de los n valores xi es transformado en yi = a xi + b, siendo a y b constantes. entonces.
la varianza de los n valores yi es

Ejercicio 51
En una tienda, la desviación estándar de los precios de los jeans es de 15.4 soles.

a. Si se realiza un aumento del 7% de todos los precios, calcule la nueva desviación estándar de los
precios de los jeans.
MA477 Estadística 83

b. Si se hace una oferta y se rebaja 10 soles a todos los precios, calcule la nueva desviación estándar
de los precios de los jeans.

3.4.3. Coeficiente de variación

El coeficiente de variación (CV) de un conjunto de datos indica lo grande que es la desviación están -
dar en comparación con la media.
Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones es-
tándar no es muy útil, por ejemplo, cuando las medias están muy distantes.
σ
La fórmula para el coeficiente de variación poblacional es: CV = × 100
μ
S
La fórmula para el coeficiente de variación muestral es: CV = ×100
x

Características del coeficiente de variación


El coeficiente de variación se calcula en variables medidas en escala de razón.
Se debe calcular para valores positivos.

Ejemplo 19.
Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto ar-
tículo que realizaron dos grupos de técnicos.
Grupo 1: media = 3 y desviación estándar = 1.10
Grupo 2: media = 5 y desviación estándar = 1.66
¿En cuál de los grupos el número de mediciones es más disperso?

Ejercicio 52
El siguiente cuadro muestra la distribución de los sueldos mensuales, en soles, de los empleados de
las empresas A y B.
Tabla 7. Distribución de trabajadores de salario mensual por empresas A y B
Sueldos Marca de clase Empresa A. fi Sueldos Marca de clase Empresa B. fi
[1 500 – 2 500] 2 000 60 [3 000 – 3 500] 3 250 16
]2 500 – 3 500] 3 000 120 ]3 500 – 4 000] 3 750 148
]3 500 – 4 500] 4 000 76 ]4 000 – 4 500] 4 250 46
]4 500 – 5 500] 5 000 68 ]4 500 – 5 000] 4 750 59
84 MA477 Estadística
MA477 Estadística 85

a. ¿Cuál de los grupos presenta mayor variabilidad de salarios?

3.4.4. Rango intercuartil

Es la diferencia entre el tercer y primer cuartil.

Rango intercuartil = RIC = Q3 – Q1= P75 – P25

Características del rango intercuartil

Se puede calcular en variables medidas en escala de intervalo o razón


No se ve afectado por valores extremos.

Ejercicio 53
El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en la siguiente
tabla.
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60

Calcule el rango intercuartil de los datos.

Ejercicio 54
La siguiente tabla muestra información de los precios, en soles, del artículo A en establecimientos
elegidos al azar en el distrito de La Molina.
86 MA477 Estadística

Tabla 8. Distribución de artículos A según su precio en establecimientos de La Molina


Intervalo de Marca de Frecuencia Frecuencia re- Frecuencia absoluta Frecuencia relativa
clase clase absoluta lativa acumulada acumulada
– 4
– 0.150
– 0.300 22
– 8.35 8
– 0.900
– 40
Fuente: Municipalidad de La Molina

Complete la tabla anterior si se sabe que el rango intercuartil es 0.8.

3.5. Medidas de asimetría

Además de las medidas de tendencia central y dispersión, podemos estar interesados en saber la for -
ma que presenta un conjunto de datos.

 Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la me -
dia. se dice que la distribución es simétrica.
 Si los datos que son menores a la media son más frecuentes que aquellos por encima de la media
o viceversa. se dice que la distribución es asimétrica.

3.5.1. Coeficiente de asimetría de Pearson

Mide si los datos aparecen ubicados simétricamente o no respecto de la media.

El coeficiente de asimetría para datos simples o agrupados se calcula con la siguiente fórmula:

As=3 ( x̄−Mediana
s )
MA477 Estadística 87

Si el coeficiente de simetría As es:

3.5.2.
Re-
la-

positivo, indica sesgo a la igual a cero la distribución negativo indica sesgo a la


derecha (cola derecha) es simétrica alrededor de izquierda (cola izquierda)
la media
ción entre media. mediana y moda
Para una distribución unimodal, es decir. que tenga una sola moda, se cumplen de manera general
las siguientes relaciones:

 Para una distribución asimétrica negativa: media < mediana < moda
 Para una distribución simétrica: media = mediana = moda
 Para una distribución asimétrica positiva: media > mediana > moda

Ejercicio 55
Complete los siguientes textos:
 Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una con-
centración de datos en los valores …………………………………………
 Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una concen-
tración de datos en los valores …………………………………………
 En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de asime-
tría …………………..……... porque ………………………………..…………………………………………
 En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente tie-
nen un coeficiente de asimetría …………………………….……….. porque
…………………………………………………… ………………………………..
…………………………………………………………………………………………………………………

Ejercicio 56
El salario, en cientos de soles, de los trabajadores una empresa se presenta a continuación:
10 12 13 13 14 15 15 15 18 23 24 24 25 25 36 42 48 63

Calcule e interprete el coeficiente de asimetría de Pearson.


88 MA477 Estadística

Ejercicio 57
El siguiente cuadro muestra la distribución de los sueldos mensuales de los empleados de las empre -
sas A y B.
Tabla 9. Distribución de frecuencias de sueldos mensuales de la empresa A y B
Sueldos Marca de clase Empresa A. fi Sueldos Marca de clase Empresa B. fi
[1 500 – 2 500] 2 000 45 [3 000 – 3 500] 3 250 18
]2 500 – 3 500] 3 000 148 ]3 500 – 4 000] 3 750 70
]3 500 – 4 500] 4 000 60 ]4 000 – 4 500] 4 250 70
]4 500 – 5 500] 5 000 15 ]4 500 – 5 000] 4 750 18
Calcule la asimetría de los dos grupos. Realice una conclusión.

Ejercicio 58
Si la distribución del monto de deuda de los clientes de la sucursal de una entidad financiera tiene
forma asimétrica con cola a la izquierda, el gerente financiero buscará una estrategia para revertir la
situación. ¿El gerente debe implementar alguna estrategia? Justifique su resultado numéricamente.
Si los datos corresponden a una muestra de 8 clientes.

Monto de deuda en miles de dólares de una muestra de clientes de una entidad financiera
12.3 13.6 8.2 5.6 7.2 6.8 7.2 5.6

3.6. Medida de curtosis

Cuando medimos una variable aleatoria, por lo general, los resultados que tienen una mayor fre -
cuencia son los que se sitúan en torno a la media de la distribución. Imaginemos la altura de los
alumnos de una clase. Si la altura media de la clase es 1.72 mts, lo más normal es que las alturas del
resto de los alumnos estén en torno a este valor (con cierto grado de variabilidad, pero sin ser esta
demasiado grande). Si esto sucede, se considera que la distribución de la variable aleatoria se distri -
buye con normalidad. Pero dada la infinidad de variables que se pueden medir, esto no siempre su-
cede así.

La curtosis (también conocida como medida de apuntamiento) es una medida estadística que deter-
mina el grado de concentración que presentan los valores de una variable alrededor de la zona cen -
tral de la distribución de frecuencias.

Esta medida no tiene un referente natural como en el caso de la simetría, sino que se sustenta en la
comparación respecto a una distribución de referencia. en concreto, la distribución normal o campa-
na de Gauss. En consecuencia, su obtención sólo tendrá sentido en variables cuya distribución de fre-
MA477 Estadística 89

cuencias sea similar a la de la curva normal (en la práctica ello se reduce. básicamente. a que sea uni -
modal y más o menos simétrica).

Así, de forma análoga a la asimetría, se diferencian 3 grandes categorías de apuntamiento:

Distribución leptocúrtica: Distribución mesocúrtica: Distribución platicúrtica:


existe una gran concentración existe una concentración nor- existe una baja concentración
de los valores en torno a su mal de los valores en torno a de los valores en torno a su
media. su media. media.

3.6.1. Cálculo del coeficiente de curtosis:

La curtosis es útil cuando la distribución es simétrica (o casi simétrica).

3( x−M e )
Si A s= =0 entonces ladistribución es simétrica
s
Si−0.05≤ A s< 0 o 0< A s ≤ 0.05 entonces la d istribución casi simétrica

1 (Q3−Q1) 1 ( P75−P 25)


K= =
2 ( D 9−D1) 2 ( P90−P 10)

Valor de coeficiente de curtosis Clasificación


K > 0.265 Leptocúrtica
0.235 ≤ K ≤ 0.265 Mesocúrtica
K < 0.235 Platicúrtica

Ejercicio 59
Calcular la medida de curtosis de los siguientes datos:

8, 5, 9, 10, 12, 7, 2, 6, 8, 9, 10, 7, 7.


90 MA477 Estadística

Ejercicio 60
Se ha obtenido la siguiente información referente al sueldo diario de un grupo de obreros:

Marca de
Sueldo fi
clase
70 – 75 3
75 – 80 3
80 – 85 7
85 – 90 10
90 – 95 12
95 – 100 8
MA477 Estadística 91

3.7. Diagrama de cajas X


Un diagrama de cajas es una gráfica que describe la distribución de un conjunto de datos tomando
como referencia los valores de los cuartiles como medida de posición y el valor del rango intercuartil
como medida de referencia de dispersión. Además, nos permite apreciar el tipo de distribución de
los datos (simétrica o asimétrica) y la identificación de valores extremos (datos atípicos).
Dato atípico

Es un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera dato atípico
a cualquier punto que esté:
 a más de 1.5(RIC) por arriba (o a la derecha) del tercer cuartil
 a más de 1.5(RIC) por debajo (o a la izquierda) del primer cuartil

Pasos para trazar un diagrama de cajas

Se traza un rectángulo En la caja se traza una recta vertical en el lugar de la


con los extremos en el mediana. Así, la línea de la mediana divide los datos
primer y tercer cuartil en dos partes iguales

Se ubican los límites mediante el rango


Se trazan los bigotes desde los intercuartil,
extremos de las cajas hasta los el límite superior está a 1,5 RIC arriba (o a
valores mínimo y máximo
la derecha) de Q3
dentro de los límites inferior y
superior el límite inferior está a 1,5 RIC debajo (o
ala izquierda) de Q1

Se marcan con un asterisco (*) las


localizaciones de los valores atípicos
92 MA477 Estadística

Ejercicio 61
Un inversionista está interesado en comprar acciones de tres empresas A, B y C, decidirá por aquella
acción que presente un mayor rendimiento y que sea más estable en los precios; es decir una menor
dispersión. Para lo cual, se tienen los siguientes resultados sobre rendimientos en soles de las tres ac-
ciones.

A 2 11 11 12 12 12 12 12 12 13 13 13 13 13 14 15 15 16 16 17 18 18 19 19 19 20
B 11 11 11 11 11 12 13 13 13 13 14 14 15 15 16 16 16 16 17 17 17 17 17 18    
C 1 3 9 11 11 11 11 11 11 11 12 12 13 13 13 13 13 13 13 14 14 14 14 20    

Construya un diagrama de cajas que le permita al inversionista decidir qué acción debe de comprar.

Título: …………………………………………….……………………………………………………

Fuente: …………………………………………………………………………………

a. La acción con mayor mediana de rendimiento es ……………..


b. La acción con mayor rango intercuartil es ………………
c. Los rendimientos de la acción A tiene asimetría ……………………………….……………………….
d. Existen valores atípicos en ……. ………………………………………………
MA477 Estadística 93

Ejemplo 20.
Los registros policíacos del distrito A muestran los siguientes números de informes de delitos diarios
para una muestra de días durante los meses de invierno y una muestra de días durante los meses de
verano.

Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28

Construya un gráfico que permita comparar, entre invierno y verano, los valores medios, la variabili -
dad y encontrar los valores atípicos del número de delitos diarios.

Solución
Se debe calcular los percentiles con datos simples. No calcule la distribución de frecuencias.
Calculemos los percentiles y los rangos intercuartiles.

Estadísticos Invierno Verano


Percentil 25 7.5 9.0
Percentil 50 16.0 20.0
Percentil 75 20.5 26.5
Rango intercuartil 20.5 – 7.5 = 13.0 26.5 – 9.0 = 17.5
Largo máximo del bigote = 1.5 RIC 1.5 x 13.0 = 19.5 1.5 x 17.5 = 26.25
Límite inferior = P25 – 1.5 RIC 7.5 – 19.5 = -12.0 9.0 – 26.25 = -17.25
Límite superior = P75 + 1.5 RIC 20.5 + 19.5 = 40 26.5 + 26.25 = 52.75

Para el invierno, de acuerdo con los datos, los bigotes llegan como mínimo a 5 y como máximo a 22.
Para el verano, de acuerdo con los datos, los bigotes llegan como mínimo a 5 y como máximo a 28.

No hay valores atípicos, pues ningún está fuera de los límites.

Distrito A. Distribución de días según número de delitos por estación


94 MA477 Estadística

Ejercicios propuestos

Caso Metropolitano

46. Objetivo específico 1: Determinar el número de días que usó el servicio la semana anterior de
los usuarios del servicio del Metropolitano.

Si el número de días promedio que usó el servicio la semana anterior supera los tres días, acu-
mulará un saldo a favor de 0.50 céntimos a su tarjeta.
Para el logro del objetivo se tuvo en cuenta la siguiente información proporcionada por el es-
tudio del perfil del usuario del Metropolitano.

Tabla 1: Distribución de los usuarios del Metropolitano según número de días que
usó el servicio la semana anterior
Número de días Número de usuarios
1 1
2 7
3 23
4 49
5 40
Fuente: Pro Transporte

Calcule e interprete el promedio de días que los usuarios usaron el servicio del metropolitano
la semana anterior.

47. Objetivo específico 2: Determinar el tiempo de espera de los usuarios del servicio del Metro-
politano.

Para el logro del objetivo se tuvo en cuenta la siguiente información proporcionada por el es-
tudio del perfil del usuario del Metropolitano.

Gráfico 1: Distribución de usuarios del Metropolitano según tiempo de


espera (minutos)
60

50
50
Número de usuarios

40
33
30
30 27
23
20
14 13
10
10

0
1.7 6.6 11.5 16.4 21.3 26.2 31.1 36 40.9
Fuente: Pro Transporte Tiempo de espera

a. Si la mitad de los usuarios tienen un tiempo de espera de a lo más 15 minutos, entonces


Pro transporte deberá aumentar buses en cada estación del Metropolitano.
b. El administrador de Pro transporte considera que el tiempo de espera más frecuente de los
usuarios del Metropolitano es de 15 minutos. ¿Es cierta está afirmación? Justifique su res -
puesta numéricamente.
MA477 Estadística 95

48. Objetivo específico 3: Comparar el tiempo que esperan los usuarios del Metropolitano antes y
después de haber incrementado el número de buses.

Para lograr el objetivo, se presenta gráficamente la distribución porcentual de los usuarios se-
gún tiempo de espera, antes y después de incrementar el número de buses. El concesionario
del metropolitano desea determinar el porcentaje de usuarios cuyos tiempos de espera supera
los 23 minutos. ¿Se puede concluir que se ha reducido el tiempo de espera de los usuarios del
servicio del metropolitano?

Gráfico 2: Distribución porcentual de los usuarios del metropolitano según tiempo de espe-
ra antes y después del incremento de buses

49. Objetivo específico 4: Determinar el porcentaje de usuarios del transporte público del Metro-
politano en los extremos de la distribución del tiempo de viaje.

Para el logro del objetivo se utilizará el gráfico 3.

Gráfico 3: Distribución de los usuarios del Metropolitano según el


tiempo de viaje
30 28
27

25
21
Cantidad de usuarios

20
13
15
11 10
10
4 6
5
0 0
0
10.95 14.05 17.15 20.25 23.35 26.45 29.55 32.65 35.75 38.85
Fuente: Pro Transporte Tiempo de viaje (minutos)

a. El tiempo mínimo de viaje para que un usuario del Metropolitano sea considerado dentro
del 20% de los que llegan más tarde a su destino.
b. El tiempo máximo de viaje para que un usuario del Metropolitano sea considerado dentro
del 10% de los que llegan más temprano a su destino.
c. Determine el porcentaje de usuarios del Metropolitano cuyo tiempo de viaje es menor de
25 minutos.
96 MA477 Estadística

50. Objetivo específico 5: Comparar la variabilidad de los tiempos de viaje de los usuarios del me-
tropolitano por estación de servicio.

Para el logro de este objetivo, se trabajará con las tablas que se muestran a continuación:

Tabla 2: Medidas estadísticas según estación


Estación Media Desviación estándar
Angamos 23.090 6.064
Carnaval y Moreyra 15.613 3.297

Tabla 3: Distribución de los usuarios de la estación Javier Prado, según tiempo de espera
Límite inferior Límite superior Marca fi
1.7   5
  13
18.5   20
  20
  12
  3
  2
Total   75

a. Determine el promedio y la desviación estándar de los tiempos de espera de los usuarios


del Metropolitano en la estación de Javier Prado.
b. ¿En cuál de las tres estaciones del metropolitano, los tiempos que esperan los usuarios
son más homogéneos? Justifique numéricamente.

51. Objetivo específico 6: Comparar los tiempos que esperan los usuarios para tomar los expresos
del Metropolitano antes y después del incremento de unidades.

Para lograr el objetivo se tiene la siguiente información sobre los tiempos que esperan los
usuarios de las rutas de los expresos 2 y 5:

Ruta Media Desviación estándar


Expreso 2 18.08 7.86
Expreso 5 17.17 6.21

La gerencia del Metropolitano ha incorporado más unidades para las rutas de los expresos 2
y 5, con lo cual reducirán los tiempos que esperan los usuarios del metropolitano de la si-
guiente manera:
Expreso 2: Reduce el tiempo de espera en 25%
Expreso 5: Reduce el tiempo de espera en 5 minutos

a. Si un usuario puede tomar cualquiera de los dos servicios, ¿cuál es el expreso que debe-
ría elegir después del incremento de las unidades, si su objetivo es la reducción del tiem -
po promedio de espera?
b. Si un usuario puede tomar cualquiera de los dos servicios, ¿cuál es el expreso que debe-
ría elegir después del incremento de las unidades, si su objetivo es el que presenta los
tiempos de espera más homogéneos?
MA477 Estadística 97

52. Objetivo específico 7: Comparar para las cuatro rutas del Metropolitano aquellas que presen-
tan menor variabilidad para los tiempos de espera.
Para el logro del objetivo, se tuvo en cuenta la siguiente información:

Ruta Media Desviación estándar


A 20.29 7.54
B 22.73 6.72
Expreso 2 18.08 7.86
Expreso 5 17.17 6.21
¿Cuál es la ruta que tiene los tiempos de espera más homogéneos?

53. Objetivo específico 8: Comparar por estación, la variabilidad para el número de días que los
clientes usaron el servicio del Metropolitano la semana pasada.
Para el logro de este objetivo se consideró la siguiente información:
Tabla 4: Distribución de usuarios del Metropolitano
según el número de días que usó el servicio la semana pasada según estación de servicio
Número de días Angamos Canaval y Moreyra Javier Prado
1 0 0 1
2 1 5 1
3 3 4 16
4 11 7 31
5 6 8 26
Total 21 24 75
Fuente: Pro Transporte

Determine la estación de servicio más homogénea y más heterogénea con respecto al número
de días que el usuario usó el servicio del Metropolitano la semana pasada.

54. Objetivo específico 9: Comparar los tiempos de viaje de los usuarios por estación de servicio.
Se presenta los tiempos de viaje para las estaciones de Angamos y Canaval y Moreyra:
Estación de Angamos
12.5 12.9 13.2 13.8 14.0 14.2 14.9 15.0 15.0 16.6 18.8
19.0 19.1 19.4 20.3 20.4 20.8 22.3 22.9 23.4 32.5
Estación de Canaval y Moreyra
7.2 16.1 16.4 17.4 17.8 18.4 19.3 19.4 19.9 20.4 20.7 20.7
21.3 21.7 22.1 22.1 22.4 22.7 23.5 23.6 23.7 24.8 25.1 40.5

Gráfico 4: Distribución dedelos


Gráfica de cajas losusuarios
segúnestación
usuarios según
tiempopor
de tiempo
viaje por estación
de viaje
40

Big sup = 36,8


35

30 Q3 = 29,4
Tiempo de viaje

25
Q2 = 26,5
Q1 = 22,3
20

15
Big inf = 13,1
10
Angamos Carnaval y Moreyra Javier Prado
Estación
98 MA477 Estadística

a. Completa para las estaciones de Angamos y Carnaval y Moreyra el cuartil 1, 2 y 3, los bigotes
y los datos atípicos si los hubiera.
b. Completa para las estaciones de Angamos y Carnaval y Moreyra el cuartil 1, 2 y 3, los bigotes
y los datos atípicos si los hubiera.
c. Responda a las siguientes interrogantes en base al gráfico.
 En el 50% central de los tiempos de viaje de los usuarios del Metropolitano, indique la es -
tación que presenta mayor homogeneidad.
 En el 50% central de los tiempos de viaje de los usuarios del Metropolitano, indique la es -
tación que presenta mayor concentración de usuarios en tiempos mayores de viaje.
 Indique las estaciones que presentan valores atípicos.
 Indique la estación que consideraría que tiene mayor tiempo de viaje.
 Indique la estación que presenta menores tiempos de viaje.

55. Objetivo específico 10: Comparar para las cuatro rutas del Metropolitano el tiempo que espe-
ran los usuarios en las estaciones del metropolitano
Para desarrollar este objetivo, se tuvo en cuenta la información presentada para cada ruta del
Metropolitano, sobre el tiempo de espera de los usuarios:
Ruta Media Mediana Desviación estándar Coeficiente de asimetría
A 20.29 24.70 7.54  
B 22.73 18.80 6.72  
Expreso 2 18.08 18.08 7.86  
Expreso 5 17.17 17.10 6.21  
Complete la tabla anterior y responda lo siguiente:
a. Indique la forma de la distribución del tiempo de espera de los usuarios de la ruta A.
b. Indique la forma de la distribución del tiempo de espera de los usuarios de la ruta B.
c. Indique la forma de la distribución del tiempo de espera de los usuarios de la ruta del ex-
preso 2.
d. ¿Qué opina sobre la distribución del tiempo de espera de los usuarios del expreso 5?

56. Objetivo específico 11: Comparar para las estaciones de servicios del metropolitano, la con-
centración de los tiempos que esperan los usuarios.
Para el logro del objetivo se tuvo en cuenta la siguiente información proporcionada por el es-
tudio del perfil del usuario del Metropolitano.
Tabla 5: Distribución de usuarios del Metropolitano
según el tiempo de espera en las estaciones de Angamos y Javier Prado
Tiempo de espera (minutos) Marca clase Angamos J. Prado
1.7 6.6 4.15 0 4
6.6 11.5 9.05 1 8
11.5 16.4 13.95 2 18
16.4 21.3 18.85 5 22
21.3 26.2 23.75 6 9
26.2 31.1 28.65 6 10
31.1 36.0 33.55 1 2
36.0 40.9 38.45 0 2
Total 21 75
Fuente: Pro Transporte

Calcule la medida de asimetría para el tiempo de espera en la estación de Angamos y Javier Pra -
do e indique el sesgo de cada una de las estaciones. ¿Podría afirmar que en una de las estacio-
nes los tiempos de espera se concentran más en los tiempos menores?
MA477 Estadística 99

Caso:Cacao S.A.
57. Durante una jornada de trabajo se midió la eficiencia de las máquinas por turno teniendo en
cuenta su tiempo perdido por turno debido a algún accidente dentro del proceso de produc-
ción.
Producción durante una jornada de trabajo
Turno Eficiencia (%) Tiempo perdido (minutos)
Mañana 98 27
Tarde 96 28
Tarde 95 34
Si la eficiencia promedio de las máquinas en una jornada de trabajo es inferior a 97% minutos
se solicitará un cambio de personal. ¿Se debe o no cambiar al personal?
58. Debido a los tiempos perdidos de los trabajadores en los accidentes, se piensa realizar una ca-
pacitación, pero debido a su bajo presupuesto elegirán al turno que tenga el mayor valor mo-
dal.

Distribución porcentual de trabajadores turno mañana según su tiempo perdido

100.00%
Porcentaje de trabajadores

100% 95.24%
90% 80.95%
80%
70%
60%
47.62%
50%
40%
30% 21.43%
20%
9.52%
10%
0%
24 29 34 39 44 49 54

Fuente: Cacao S.A Tiempo perdido (min)

Tiempo perdido de los trabajadores en el turno noche


12.0 23.3 26.0 30.0 33.6 38.2 44.2 34.1 38.2 45.5 18.0
17.1 23.4 27.0 30.0 33.6 38.2 44.7 24.0 27.5 30.0
a. Haga la tabla de frecuencias para el tiempo perdido de los trabajadores del turno mañana.
b. Encuentre el valor modal del tiempo perdido para el turno mañana y noche.
c. ¿A qué turno debería primero capacitar?

59. Se ha capacitado a los trabajadores para reducir los tiempos perdidos por incidencia de acci -
dentes. será efectiva si al comparar el tiempo perdido antes y después de la capacitación la mi -
tad de los trabajadores presentan menos tiempos perdidos después de recibir la capacitación.
Tiempo perdido antes de la capacitación
12.0 23.3 26.0 30.0 33.6 38.2 38.3 18.0 24.0 27.5 30.0
17.1 23.4 27.0 30.0 33.6 38.2 38.5 34.1 38.2 39.1
Tiempo perdido después de capacitación
Tiempo perdido Número de trabajadores
23 - 25 2
25 - 27 1
27 - 29 8
29 - 31 6
31 - 33 5
100 MA477 Estadística

¿Fue efectiva la capacitación?


MA477 Estadística 101

60. El departamento de control de la calidad indica que cada trabajador puede generar como má-
ximo once chocolates defectuosos, sin embargo, si el 35% de los trabajadores supera este lími -
te debería detenerse la producción para evaluar a fondo las fallas de calidad.

Distribución de los trabajadores según número de chocolates defectuosos que produce

30 28
Número de trabajadores

25 23

20 18

15

10 7
5
5

0
10 11 12 13 14

Fuente: Cacao S.A


Número de chocolates defectuosos

a. Determinar el número máximo de chocolates defectuosos que produce el 35% de los traba-
jadores de la empresa Cacao S.A.
b. De acuerdo al análisis de los datos: ¿La producción de chocolates debería detenerse?

61. La empresa está dispuesta a permitir solo cuarenta minutos como tiempo máximo de demora
debido a algún accidente dentro del proceso de producción, para aquellos trabajadores que
superen este tiempo pasarán a ser removidos de su puesto.

a. Determine el porcentaje de trabajadores de género femenino que supera el tiempo permi -


tido.
b. Determine el porcentaje de trabajadores de género masculino que supera el tiempo permi -
tido.
c. Determine el género de trabajadores que presenta mayor porcentaje de tiempo perdido
fuera de los límites permitido por la empresa.

Distribución de los trabajadores según su tiempo perdido por género

18 17
16
Número de trabajadores

14
12 12
12

10 Hombres
8 8
8 Mujeres
6 6
6
4
4 3
2
2 2
1
0
8.5 15.5 22.5 29.5 36.5 43.5 50.5 57.5

Fuente: Cacao S.A.


Tiempo perdido
102 MA477 Estadística

62. Se ha tenido sospecha que los trabajadores de género masculino suelen no ser rigurosos con
los protocolos de seguridad a diferencia de los trabajadores de género femenino. Se ha previs-
to una auditoría para identificar el género que presenta una mayor heterogeneidad en sus
tiempos de demora por accidentes para luego ser capacitados sobre los protocolos de seguri-
dad.

Distribución acumulada de trabajadores según tiempo de demora por ac-


cidentes y género
60

49
50 45
Número de trabajaodres

40
33
30 32
30
20 16 24
Fi
16 Hom-
8 bres
10
Fi Mu-
2 4 jeres
0 1
12 19 26 33 40 47 54
Fuente: Cacao S.A. Tiempo de demora (minutos)

¿Qué grupo de trabajadores debe ser capacitado sobre los protocolos de seguridad?

63. A continuación, se presenta los indicadores estadísticos registrados en sus tiempos perdidos
por incidencia de accidente en el proceso productivo antes de la capacitación y los resultados
medidos por reducción del tiempo por cada trabajador después de la capacitación.
Antes de recibir la capacitación Después de la capacitación
Turno Tiempo promedio Desviación estándar Reducción del tiempo por cada trabajador
Mañana 48 minutos 18 minutos En 10%
Tarde 47 minutos 16 minutos Menos 15 minutos
Noche 52 minutos 17 minutos 12% y menos 2 minutos
¿En qué turno fue más efectiva la capacitación, si su objetivo es el que presenta los tiempos
perdidos por accidente más homogéneos?

64. Objetivo específico: Comparar el número de barras defectuosas producidas según género.
La empresa tomó un grupo de trabajadores de 20 del género femenino y 25 del género mascu -
lino con los cuales se encontraron los siguientes indicadores estadísticos del número de choco -
lates defectuosos por género, tal como se muestra en la siguiente tabla:
Género Q2 Q1 RIC Q3 LIS LSS Big inf Big Sup
Masculino 11.5 10.0 5.0
Femenino 12.0 11.0 2.5
Lamentablemente, parte de la muestra de datos de ambos géneros se perdieron tal como se
muestra en la siguiente tabla:
Masculino 2 6 8 ………………………………………. 12 16
Femenino 8 9 9 ………………………………………. 15 18
a. Encuentre los indicadores estadísticos faltantes. (Q3, LIS, LSS, bigote inferior, big superior).
b. Graficar el diagrama de cajas para ambos géneros.
c. Dar respuesta al objetivo.
MA477 Estadística 103

65. Objetivo específico: Determinar el turno que será bonificado por presentar los menores tiem-
pos de demora por accidente
La empresa cuenta con la información proporcionada sobre los tiempos de demora por acci-
dente según turno.

Tiempos de demora por accidente


63

61

59
Tiempo en minutos

*
57

55

53
*
51
Piña Durazno Manzana
Mañana Tarde Noche
Fuente: Cocoa S.A Turnos

En el 50% de los tiempos de demora centrales responda a las siguientes interrogantes:


a. En qué turno(s) se presenta valores atípicos.
b. ¿Qué tipo de asimetría presentan los turnos en sus tiempos de demora?
c. ¿Qué turno presenta mayor homogeneidad en sus tiempos de demora?
d. ¿Qué turno presenta mayor tiempo de demora?
e. Se bonificará al turno que presente menores problemas de accidente durante sus proce-
sos de producción. ¿Qué turno recibirá la bonificación?

66. Sea x1. x2. … . xn los datos de una variable aleatoria continua de una muestra aleatoria de tama -
k
xi f i
ño n con media x=∑ donde cada intervalo se define como [xi , xi+1] y w = xi+1- xi. Si cada
i=1 n
dato original se transforma de la siguiente manera yi = a xi + b, siendo a y b constantes, de-
muestre que la media de los n valores yi es .

67. Sea x1, x2, … , xn los datos de una variable aleatoria continua de una muestra aleatoria de tama -

ño n con mediana o ,donde cada intervalo se de-

fine como [xi , xi+1] y w = xi+1 - xi. Si cada dato original se transforma de la siguiente manera yi = a
xi + b, siendo a y b constantes, demuestre que la mediana de los n valores yi es Me(y) = aMe(x)
+b
68. Si la producción ha experimentado un crecimiento del 30% del primer año al segundo año, un
incremento del 35% del segundo al tercer año y un decrecimiento del 15% del tercer al cuarto
año.
a. Calcule la tasa promedio de crecimiento de los últimos tres años.
b. Calcule la producción del quinto año si la del primer año ha sido 100.
104 MA477 Estadística

69. El nivel de exportación de harina de pescado durante los últimos tres años consecutivos, au -
mentó respecto al año anterior en: 70%, 50%, 10%. ¿Cuál es el aumento promedio anual del
nivel de exportación de harina de pescado para los últimos tres años?
MA477 Estadística 105

70. En el artículo “Estudios españoles de crecimiento 2008. Nuevos patrones antropométricos” se


muestra el siguiente gráfico:

Tomado de http://www.sciencedirect.com/science/article/pii/S1575092208758455

a. ¿Qué significa que para las jóvenes de 18 años el percentil 3 del peso sea 44 kilos?
b. ¿Qué significa que para las jóvenes de 19 años el percentil 50 de la talla es 1.64 metros?
71. Indique si son verdaderas o falsas las siguientes afirmaciones.
a. El percentil 30 es siempre menor al percentil 70
b. El cuartil 2 es igual al percentil 50
c. El percentil siempre se expresa en porcentaje
d. Si todos los pesos son iguales, la media ponderada es igual a la media aritmética
e. La media ponderada no tiene unidades
72. Para un conjunto de datos x1, x2, … , xn se tiene que la media x .
2 2
a. Demostrar si los valores de xi se transforman en yi = 0.001xi + 2, entonces SY =0.01 S X

k 2
( ∑ fix )2
fi( xi− x̄ ) 1
S 2x=∑
n−1 , entonces
S 2x=
n−1
( ∑ fixi2− n
)
b. Probar que si i

73. Indique si son verdaderas o falsas las siguientes afirmaciones.


a. La desviación estándar se puede calcular en escalas de intervalo y de razón
b. El rango intercuartil se ve muy afectado por valores muy grandes
c. El rango intercuartil se puede calcular en escalas ordinales, de intervalo y de razón
d. El coeficiente de variación se puede calcular en escalas ordinales, de intervalo y de razón
e. La desviación estándar es siempre menor que la varianza
f. Si las unidades de los datos son minutos, la varianza se expresa en minutos al cuadrado
g. El rango se ve muy afectado por valores muy grandes o muy pequeños
h. El coeficiente de variación tiene las mismas unidades que la desviación estándar
106 MA477 Estadística

74. Con la intención de conocer los hábitos y preferencias de los estudiantes acerca de los produc-
tos naturales. se contrató los servicios de la consultora Data Mining Today S.A. la cual elaboró
una encuesta para el estudio de mercado y se aplicó a 400 estudiantes de diferentes institucio-
nes educativas. Algunos resultados fueron:
 El 70% de los encuestados afirma que preferiría consumir productos naturales enlatados.
 La fruta más consumida por los encuestados es la manzana, seguida por el plátano y la
pera.
 El gasto promedio por semana en productos naturales es de 25 soles con una desviación
estándar de 5 soles.
 El 15% de los encuestados gasta más de 28 soles semanales en productos naturales.
 El 50% de los encuestados tiene una edad superior a 20 años.
 El número promedio de vasos de yogurt consumidos durante la semana es de 6.

En base a esta información indique:


Población
Una variable
Cuantitativa continua
Cuantitativa discreta

Nombre del estadísti-


Variable Valor del estadístico
co
Tendencia central
Dispersión
Posición

Lo siguiente es la respuesta de un alumno, póngale nota.


Población Los 400 estudiantes de diferentes instituciones educativas

Una variable
Cuantitativa conti-
Gasto promedio semanal en productos naturales
nua
Número promedio de vasos de yogurt consumidos durante la sema-
Cuantitativa discreta
na

Variable Nombre del estadístico Valor del estadístico


Tendencia Manzana. plátano y
Fruta consumida Moda
central pera
Gasto promedio semanal
Dispersión Desviación estándar 5 soles
en productos naturales
Posición Tipo de producto preferido Percentil 70

75. Indique si son verdaderas o falsas las siguientes afirmaciones.


a. El coeficiente de asimetría tiene las mismas unidades que los datos.
b. Si cada valor de un grupo de datos se aumenta en 10%, el coeficiente de asimetría no varía.
c. Si cada valor de un grupo de datos se le aumenta 10 unidades, el coeficiente de asimetría no
varía.
d. En un diagrama de cajas siempre se conocen el máximo y mínimo de un grupo de datos.
76. Complete:
 Los datos atípicos se definen como ………………………………………………...………………..
 Se trazan los bigotes desde los … ……………………... de las cajas hasta los valores mínimo y
máximo ……………..……………. de los límites inferior y superior.
MA477 Estadística 107
108 MA477 Estadística

Unidad 4. Probabilidad
Logro de la Unidad 3
Al finalizar la unidad, el estudiante aplica la teoría de la probabilidad en situaciones de
incertidumbre para la toma de decisiones en casos reales dentro del ámbito de su es -
pecialidad.

Actualmente, la teoría de la probabilidad es la base para las aplicaciones estadísticas tanto en investi -
gaciones sociales como en la toma de decisiones en la empresa. En el campo de la economía el cálcu -
lo de probabilidades es muy importante y usado pues el economista tendrá necesidad de tomar deci -
siones y más de la mitad de las veces habrá de hacerlo en condiciones de incertidumbre y con conoci-
miento bastante incompleto de las condiciones imperantes. Por ejemplo, deberán ser capaces de es -
timar la evolución del PBI de un país, la inflación, etc.

Ejemplo 21.
Indique en las situaciones en donde se tiene un componente aleatorio.
a. “Tengo un negocio y deseo estimar cuánto voy a vender hoy” SI
b. “Aplico una fuerza determinada a una cierta masa ¿cuánto se acelerará?” NO
c. “Compró diez mandarinas ¿cuántas de ellas estarán sabrosas?” SI
d. “Llego a la ventanilla de un banco ¿cuánto tiempo le tomará atenderme? SI
e. “He estudiado mucho para el examen ¿lo aprobaré?” SI
f. “Voy a patear un penal y con ello Perú irá al Mundial de Qatar, ¿lo meteré?” SI
g. “Me voy a casar con la persona indicada ¿me divorciaré algún día?” SI
h. “He tomado mucha cerveza y estoy manejando ¿chocaré?” SI

4.1. Reglas de conteo

4.1.1. Regla de la adición (O)


Si un experimento E1 puede ocurrir de n1 formas y un segundo experimento E2 de n2 formas, entonces
el experimento que consiste en realizar E 1 o E2 ocurre de n1 + n2 maneras.

Ejercicio 62
¿De cuántas maneras ocurre el experimento de lanzar una moneda o un dado?
3 maneras (primero el dado después la moneda o luego ambas)

Ejercicio 63
Una persona puede viajar de una ciudad a otra por carretera de tres formas y por tren de dos formas.
¿De cuántas formas puede viajar la persona de una ciudad a otra?
3 formas + 2 formas = 5 formas

Ejercicio 64
Se tiene los dígitos 1, 2, 3 y 4. ¿Cuántos números de cuatro cifras menores de 2367 se pueden for-
mar, si cada dígito se usa una sola vez?
1234 2134
1243 2143
1324 2341
1342 2314
1423
1432
10 formas posibles
MA477 Estadística 109

4.1.2. Regla de la multiplicación (y)


Si un experimento se realiza por una sucesión de k pasos, en el primer paso tiene n1 resultados posi-
bles, el segundo tiene n2 resultados posibles y así sucesivamente, entonces el número total de resul-
tados del experimento es n1 x n2 x … x nk.

Ejercicio 65
Una joven tiene 48 polos, 20 pantalones y 12 pares de zapatos. ¿De cuántas maneras diferentes se
puede vestir?
48 x 20 x 12 = 11520 formas diferentes para vestir

Ejercicio 66
En una cafetería universitaria se ofrece un menú que consiste en refresco, entrada o sopa, segundo y
postre. ¿De cuántas maneras diferentes puede formar su almuerzo un estudiante, si hay tres entra-
das posibles para escoger, dos sopas, cuatro segundos y tres postres?
(3 + 2) x 4 x 3 = 5 x 4 x 3 = 60 maneras diferentes de ele

Ejercicio 67
¿Cuántos números pares de tres dígitos se pueden formar con los dígitos 1, 2, 5, 6, 7, 8 y 9, si cada
dígito puede emplearse una sola vez?
Termina en 2 Termina en 6 Termina en 8
152 126
162 156
172 176
182 186
192 196
512 216
562 256
572 276
582 286
592 293

Que terminen en 2: 5 x 6 = 30
Que terminen en 2: 5 x 6 = 30
Que terminen en 2: 5 x 6 = 30

Tendria 90 diferetes formas de obtener números pares de tres dígitos.

4.1.3. Permutaciones o variaciones


La cantidad de formas en que se puede ordenar x objetos seleccionados de un total de n objetos dis-
tinguibles es:
n!
Pnx =
( n−x ) !
n = Total
x = condicional
110 MA477 Estadística

Ejercicio 68
En una empresa se van a rifar tres premios como incentivo, un viaje a Punta Cana, otro a Cancún y
otro a Punta Sal. Si hay 40 trabajadores, ¿de cuántas maneras diferentes se pueden repartir los pre -
mios?
40 40 !
P3 = =59280
( 40−3 ) !

Ejercicio 69
¿De cuántas maneras diferentes se pueden sentar ocho personas en una banca, con capacidad para
cinco personas?
8 8!
P5= =6720
( 8−5 ) !

Ejercicio 70
Los 10 obreros de una empresa (6 hombres y 4 mujeres) son evaluados. Si todos han obtenido dife -
rente puntaje:
a. ¿Cuántos listados diferentes se pueden hacer si se ordenan de mayor a menor?
Una sola forma

b. Si los hombres son ordenados entre ellos y las mujeres entre ellas mismas, ¿cuántos listados dife -
rentes se pueden hacer si se ordenan de mayor a menor?
1 1
C 1+C 1=1+1=2

Ejercicio 71
¿De cuántas maneras se pueden colocar 10 alumnos en una fila, de manera que dos de ellos, no que -
den juntos?
10 10 !
2 xC8 =2 =90
8 ! ( 10−8 ) !

4.1.4. Combinaciones
La cantidad de formas de seleccionar x objetos de un total de n objetos distinguibles sin tomar en
cuenta el orden es:
n!
C nx =
x ! ( n−x ) !
Ejercicio 72
En un hogar hay diez personas y un encuestador necesita entrevistar a dos de ellas, sin importar el
orden. ¿De cuántas maneras diferentes se puede elegir a esas dos personas?
10 10 !
C2 = =45
2 ! ( 10−2 ) !

Ejercicio 73
¿Cuántos grupos de 2 hombres y 3 mujeres se pueden formar con 5 hombres y 7 mujeres?
MA477 Estadística 111

Ejercicio 74
De 50 empresas, nueve no están al día con el pago de sus impuestos. La Sunat, con la finalidad de
identificar a las empresas evasoras, selecciona al azar a cinco empresas y las revisa.
a. ¿De cuántas maneras se pueden elegir a las nueve empresas?
50 50!
C5 = =2118760
5 ! ( 50−5 ) !

b. ¿En cuántos casos se eligen a dos empresas que no están al día con el pago de impuestos?
9 50−9 9 41 9! 41!
C 2 x C3 =C 2 x C3 = x =383760
2 ! ( 9−2 ) ! 3 ! ( 41−3 ) !

c. Calcule la probabilidad de que elija a dos empresas que no están al día con el pago de sus impues -
tos.
A: Elegir a dos empresas que no están al dia en el pago de sus impuestos (deudoras)
C29 x C 41
3 383760
P ( A )= =0.1811=18.11 %
C5 50
2118760

d. Calcule la probabilidad de que elija al menos una empresa que no está al día en el pago de sus im -
puestos.
C 91 x C 41
4 C 92 x C341 C 93 x C 41
2 C94 x C41
1 C 95 x C041
P ( X ≥1 ) = + + + +
C50
5 C50
5 C50
5 C 50
5 C 50
5

Ejercicio 75
Cuatro libros diferentes de matemática (M 1, M2, M3, M4), tres de Estadística (E1, E2 y E3) se colocan al
azar en un estante. Calcule la probabilidad que sólo los libros de Estadística estén todos juntos.

Ejercicio 76
Un grupo de ocho amigos se sientan, al azar, juntos en la misma fila en un cine. Calcule la probabili-
dad de que Diego, Claudia y Andrea se sienten juntos.
112 MA477 Estadística
MA477 Estadística 113

4.2. Definiciones

4.2.1. Experimento aleatorio


Se le suele simbolizar como E o , Es todo proceso que genera resultados bien definidos que cumple
con las siguientes características:

 Se puede repetir indefinidamente donde los resultados dependen del azar, por lo que no se pue-
den predecir con certeza
 Se puede describir el conjunto de todos los resultados posibles
 Cuando se repite un gran número de veces. aparece un modelo definido de regularidad

4.2.2. Espacio muestral


Es el conjunto de todos los posibles resultados de un experimento aleatorio.
Se le suele simbolizar como Ω o S.

E1: Lanzar un dado y observar el puntaje obtenido


S1 = {1, 2, 3, 4, 5, 6,]  n (S1) = 6
Sea el evento o suceso A: Obtener un numero primo
A = { 2, 3, 5 }  n(A) = 3
P [A] = n (A) / n(S1) = 3/6 = ½ = 0.5 = 50%

Ejercicio 77
Indicar, para cada uno de los siguientes experimentos aleatorios, los respectivos espacios muestrales:

• Lanzar un dado ……………………………………………………………………………………………………………………………


• Lanzar una moneda ……………………………………………………………………………………………………………….…….
• Lanzar dos dados ……………………………………………………………………………………………………………………….…
• Lanzar una moneda y un dado simultáneamente ……………………………………………………………………….…
• Jugar una partida de ajedrez .………..……………………………………………………………………………………………..
• Jugar un partido de voleibol …………………………………………………………………………………………….……………
• Invertir en la Bolsa .……………………………………………………………………………………………………………………...

Ejercicio 78
Un experimento consiste en lanzar primero un dado para después lanzar una moneda, siempre y
cuando el número del dado sea par. Si el resultado del dado es impar, la moneda se lanza dos veces.
Determine el espacio muestral de este experimento.

4.3. Eventos y sus probabilidades

4.3.1. Evento
Un evento es un subconjunto del espacio muestral.
114 MA477 Estadística

4.3.2. Probabilidad de un evento


La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por tanto, la pro -
babilidad es una medida del grado de incertidumbre asociado con un evento.

4.3.3. Definición clásica de la probabilidad de un evento


Sea un experimento aleatorio cuyo correspondiente espacio muestral S está formado por un número
n finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces definimos la
probabilidad de un evento como:

n( A) número de casos favorables al evento A


P ( A )= =
n(S ) número de casostotales

Una probabilidad cercana a 0 indica que es difícil que el evento ocurra, mientras que, una probabili -
dad cercana a 1 indica que es casi seguro que el evento ocurra.

Ejercicio 79
Se lanzan dos dados, calcule:
a. La probabilidad de que la suma sea cinco.

b. La probabilidad de que la suma de los dados sea menor a cinco.

4.4. Operaciones con eventos

Con frecuencia se construyen eventos mediante la combinación de eventos más sencillos. Es usual
emplear la notación de conjuntos para describir los eventos construidos de esta forma.

Sea  un experimento aleatorio y S el espacio muestral asociado.


Si A y B son dos eventos definidos en S, se define las siguientes operaciones con eventos:

4.4.1. Complemento (AC)


Para un evento A cualquiera se define su complemento, AC, como el
evento consistente en todos los puntos de S que no están en A.

Se tiene que: P(AC)= 1 – P(A)


MA477 Estadística 115

Ejercicio 80
Complete los espacios en blanco.

a. La probabilidad de que una empresa gane una licitación es 0.80, por lo tanto, la probabilidad de
que no la gane es _____

b. La probabilidad de que una persona gane la Tinka con una jugada es del 0.0000123%, por lo tanto,
la probabilidad de que no la gane en una jugada es __ ______________%.

4.4.2. Unión de eventos (A  B)


Para dos eventos A y B, la unión del evento A con el evento B es el
evento que contienen todos los puntos de S que pertenecen a A o
a B o a ambos.

A∪B se expresa como: “Al menos uno de los eventos A o B ocu-


rre”.

4.4.3. Intersección de eventos (A∩B)


Para dos eventos A y B, la intersección de los eventos A y B es el
evento que contienen todos los puntos de S que pertenecen tanto
a A como a B.

A∩B se expresa como: “Ambos eventos, A y B ocurren a la vez”.

4.4.4. Diferencia de eventos (A - B)


Para dos eventos A y B, la diferencia de los eventos A y B es el
evento que contienen todos los puntos de S que pertenecen a A y
no pertenecen a B.

A−B se expresa como: “Ocurre el evento A pero no el evento B”

4.4.5. Diferencia simétrica de eventos (A ∆ B)


Para dos eventos A y B, la diferencia simétrica de los eventos A y
B es el evento que contienen todos los puntos de S que pertene-
cen solo a A o aquellos que solo pertenecen a B.

A Δ B se expresa como: “Ocurre solamente uno de los eventos


A o B”
116 MA477 Estadística

4.4.6. Eventos mutuamente excluyentes


Dos eventos son mutuamente excluyentes o disjuntos si
no tienen puntos de S en común. Los eventos A y B son
mutuamente excluyentes si y solo si A Ç B = f.

Ejercicio 81
Indique si los siguientes eventos son mutuamente excluyentes:

a. A: Estudio mucho el curso Estadística, B: Desapruebo el curso Estadística……………….................


b. A: Estoy en mi casa en este momento, B: Estoy en clases en este momento…………….………………

Ejercicio 82
Una inversionista compra acciones de la empresa A y de la empresa B.

Se definen los eventos:


A:= que la inversionista obtenga ganancias con las acciones de la empresa A
B:= que la inversionista obtenga ganancias con las acciones de la empresa B

Escriba los siguientes eventos en función de los eventos A y B. Además, grafique dicho evento en un
diagrama de Venn:

Evento Notación Diagrama de Venn

que la inversionista obtenga ganancias con los


AnB
dos tipos de acciones.

que la inversionista no obtenga ganancias.

que la inversionista no obtenga ganancias con C


las acciones de la empresa B.
B

que la inversionista obtenga ganancias con las


acciones de la empresa B, pero no con las de A.

que la inversionista obtenga ganancia solamen-


A∆ B
te con una de las acciones
MA477 Estadística 117

que la inversionista obtenga ganancias con las


acciones de la empresa A. pero no con las de B.

que la inversionista obtenga ganancias.

que la inversionista obtenga ganancias con las


( A ∆ B )C
dos acciones o que no tenga ganancias.

4.5. Axiomas de la probabilidad


Sea un experimento aleatorio, S el espacio muestral asociado a dicho experimento aleatorio y A un
evento definido en S, entonces la probabilidad del evento A, denotada por P(A), es aquel número que
cumple los siguientes axiomas:

Axioma 3
Axioma 1 Axioma 2 Si A y B son dos eventos
mutuamente excluyentes
0  P(A)  1 P(S) = 1
entonces:
P(A  B) = P(A) + P(B)

Ejercicio 83
En un lote de polos, hay 20 polos rojos, 50 blancos y 36 azules. Si extrae un polo al azar:

a. ¿Cuál es la probabilidad de que el polo sea rojo o azul?

b. ¿Cuál es la probabilidad de que no sea blanco?

4.6. Teoremas

1. Si φ es un evento que no ocurre entonces. P(φ) = 0

2. Si Ac es el evento complementario del evento A entonces P(A c) = 1 – P(A)

3. Si dos eventos son tales que A ⊂ B entonces. P(A) ≤ P(B)

4. Si A y B eventos cualesquiera. entonces:

P(A È B) = P(A) + P(B) – P(A Ç B)

Ejercicio 84
Demuestre cada uno de los teoremas anteriores.

Ejercicio 85
Una empresa necesita aportaciones de sus socios para dos proyectos. La probabilidad de que sus so -
cios aporten para el proyecto de pago anticipado de deuda es 0.3 y la de que aporten para el proyec -
to de expansión de la capacidad productiva es de 0.6. La probabilidad de que aporten para ambos
proyectos es de 0.08 ¿Cuál es la probabilidad de que los socios solamente aporten para uno de los
proyectos?
118 MA477 Estadística

Sean los eventos:


A: Los socios aportan para el pago anticipado de deuda  P [A]= 0.3
B: Los socios aportan para el proyecto de expansion de la capacidad productiva  P [B]= 0.6
Interseccion:
P [A y B] = P [A n B] = 0.08
Diferencia simetrica:
P [A ∆ B] = 0.22 + 0.52 = 0.74

Union
P [A o B] = P [A U B] = P {A} + P[B] – P [A n B]
= 0.3 + 0.6 - 0.08
= 0.82
Probabilidad que los socios NO aporten para ambos proyectos: P [(A n B) C]
= 1 – 0.08
= 0.92
Ejercicio 86
Un fabricante de teléfonos celulares acaba de lanzar dos modelos de smartphones económicos: el
L720 y el L520. La probabilidad de que el modelo L720 tenga éxito es 0.70 y en el modelo L520 es del
0.60. La probabilidad de que tener éxito en al menos uno de ellos es del 0.90. Determine la probabili-
dad de que se tenga éxito solo en uno de los modelos.
Sean los eventos:
A: El modelo L720 tenga éxito  P [A] = 0.70
B: El modelo L520 tenga éxito  P [B] = 0.60

Union
P [A U B] = P {A} + P[B] – P [A n B] = 0.90

Interseccion
P [A n B] = 0.70 + 0.60
= 1.30 - 0.90
= 0.4

Diferencia simetrica:
P [A ∆ B] = 0.3 + 0.2 = 0.5

Ejercicio 87
Un inversionista desea invertir en la Bolsa de Valores de Lima, en las acciones de Aceros A y de ce-
mentos B, por eso se ha informado al respecto. La probabilidad de que las acciones de Aceros A su -
ban es 0.36, de que suban las de Cementos B es 0.45 y de que suban ambas acciones es 0.12. En base
a esta información se pide:

a. Calcule la probabilidad de que solo suban las acciones de Aceros A.


MA477 Estadística 119

b. Calcule la probabilidad de que solo suba una de las acciones.

c. Calcule la probabilidad de que al menos una de las acciones suba.

d. Calcule la probabilidad de que no suban ambas acciones.


120 MA477 Estadística

4.7. Probabilidad condicional


La probabilidad condicional se refiere a hallar la probabilidad de un evento conociendo cierta infor -
mación (condición).
P ( A∩B )
P ( A /B )=
P (B )
Ejercicio 88
El tema laboral ha estado siempre presente en la agenda nacional. Y no sólo la ampliación del merca -
do laboral es un punto de dicha agenda, sino también la calidad de los empleos ofrecidos. Con los da -
tos recogidos en un sondeo realizado en abril de 2018 a 318 personas de Lima Metropolitana, se
muestran los resultados de esta encuesta:
Independiente (I) Planilla (P) Otros (O) Total
Hombres (H) 110 31 41 182
Mujeres (M) 90 11 35 136
Total 200 42 76 318

a. Si se selecciona una persona al azar de la muestra, calcular la probabilidad de que sea hombre.
P [H] = n(H) / n(S) = 182/318
P [H] = 0.5723

b. Si se selecciona una persona al azar de la muestra, calcular la probabilidad de que sea mujer y es-
té en planilla. (probabilidad conjunta) Con el total
P [M y P] = P [M n P] = 11/ 318
P [M n P] = 0.0346
c. Si se selecciona una persona al azar de la muestra, calcular la probabilidad de que esté en planilla
o sea mujer.
P [P U M] = (42 + 136 – 11)/318 = 0.5252
d. Dado que la persona seleccionada está en planilla, calcule la probabilidad de que sea hombre.
(Condicional)
P [H/P] = 31/42 = 0.7380
e. Si la persona seleccionada es hombre, calcule la probabilidad de que sea independiente.
P [I/H] = 110/182 = 0.6044
MA477 Estadística 121

Ejercicio 89
Según el II Censo Universitario, en el año 2010, 63 900 alumnos ingresaron a las universidades públi -
cas y 194 151 a las universidades privadas. De ellos, en las universidades públicas. 28 798 ingresantes
fueron mujeres, mientras que en las privadas lo fueron 98 942.
Distribución de …………………………………. según ……………………………………….. y ………………………………….
Condición de universidad Mujer Hombre Total
Universidad pública 28 798 35 102 63 900
Universidad privada 98 942 95 209 194 151
Total 127 740 130 311 258 051
Fuente: II Censo Universitario, en el año 2010.INEI.

a. Si se elige al azar a una ingresante, calcule la probabilidad de que estudie en una universidad pri-
vada.
P [V/T] = 194151/158051 =0.7524
b. Si se elige al azar a un ingresante de universidad privada, calcule la probabilidad de que sea mujer.
P [M/V] = 98942/194151 = 0.5096
Ejercicio 90
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a todos los peruanos por los servicios de comunicación con los que contaba su hogar y su
área de residencia, obteniéndose los siguientes resultados:
Distribución de ……………………………….………. según …………………………………….. y
………………………………….
Servicios con que los cuenta el hogar Urbano Rural Total
Hogares sin ningún tipo de servicio 1 682 454 1 468 889 3 151 343
Solo tienen teléfono fijo 480 831 6 170 487 001
Solo tienen teléfono celular 1 299 037 138 721 1 437 758
Solo tienen Internet 3 336 275 3 611
Solo tienen TV por cable 56 343 2 688 59 031
Tienen teléfono fijo y teléfono celular 506 759 2 912 509 671
Tienen teléfono fijo e Internet 15 684 31 15 715
Tienen teléfono fijo y TV por cable 117 733 186 117 919
Tienen teléfono celular e Internet 9 970 84 10 054
Tienen teléfono celular y TV por cable 204 563 1 981 206 544
Tienen Internet y TV por cable 1 288 19 1 307
Tienen teléfono fijo. teléfono celular e Internet 93 103 110 93 213
Tienen teléfono fijo. teléfono celular y TV por cable 326 181 468 326 649
Tienen teléfono fijo. Internet y TV por cable 19 732 9 19 741
Tienen teléfono celular. Internet y TV por cable 15 424 49 15 473
Los cuatro servicios 298 911 133 299 044
Total 5 131 349 1 622 725 6 754 074
Fuente: Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática
122 MA477 Estadística

a. Si se elige al azar un hogar de zona urbana, calcule la probabilidad de que no tenga servicio al-
guno.

b. Si se elige al azar un hogar sin ningún servicio, calcule la probabilidad de que sea de zona rural.

c. Si se elige al azar un hogar de zona urbana, calcule la probabilidad de que cuente con dos servi -
cios.

d. Si se selecciona un hogar al azar, ¿cuál es la probabilidad de que sea de zona urbana y tenga
como mínimo tres servicios?

e. Si se selecciona un hogar al azar, ¿cuál es la probabilidad de que sea de zona urbana o no cuente
con servicio alguno?

Ejercicio 91
La mayoría de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95 octanos y 97
octanos. Con frecuencia, alguna de cada está enriquecida con un aditivo. La tabla siguiente ilustra los
porcentajes de clientes que prefieren cada tipo. Probalidades conjuntas
90 octanos (B) 95 octanos (C) 97 octanos (D) Total
Con aditivo(A) 0.05 0.10 0.05 0.20
Sin aditivo (AC) 0.15 0.40 0.25 0.80
Total 0.20 0.50 0.30 1.00
Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina:
a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?
P ( A∪C c ) =P ( A )+ P ( C c ) −P ( A∩C c ) =0 , 20+0 , 50−( 0 , 05+0 , 05)=0 , 60
b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado ga-
solina de 97 octanos?
c
P( D∩C ) 0 , 30
P ( D/Cc )= = =0 , 60
P (C c ) 0 , 50

c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado ga-
solina sin aditivo?
P ( A c∩Bc ) 0 ,65
P ( A c / Bc ) = = =0 ,8125
P (Bc ) 0 ,80
MA477 Estadística 123
124 MA477 Estadística

4.7.1. Ley multiplicativa para eventos cualesquiera


La ley multiplicativa se usa para calcular la probabilidad de una intersección de eventos.

P ( A∩B )=P ( A ) P ( B/ A ) =P ( B ) P ( A /B )

Ejercicio 92
Para otorgar un crédito a personas naturales, uno de los requisitos que piden los bancos es que no
debe tener deudas con entidades financieras que superen al 40% de sus ingresos. Para ello consultan
a un sistema interconectado en el que evalúa la tenencia de créditos en las diferentes instituciones
bancarias. Si una persona solicita un crédito a los bancos A y B. El banco B le aprueba el crédito si el
banco A no aprueba. Si la probabilidad de que el banco A no apruebe el crédito es 10%, y la probabili -
dad de que el banco B no aprueba si el banco A rechaza el crédito es 3%. Calcule la probabilidad de
que ambos bancos no aprueben el crédito.
Sean los eventos:
A: El banco A otorga el credito
B: El banco B otorga el credito

P [BC/AC) = 0.03
P [AC] = 0.1
Interseccion
P [BC n AC) =P [AC] * P [BC/AC) = 0.1 * 0.03 = 0.003

Ejercicio 93
Para elegir a una persona entre tres se prepara una bolsa con dos bolas negras y una bola blanca. Los
tres van sacando, por orden, una bola que no devuelven. Quien saque la bola blanca gana. ¿Quién
lleva más ventaja el primero, el segundo o el tercero?
Gana el que saca bola Blanca
2 bolas negras
1 bola blanca
P [ Gana 1] = P [B] = 1/3
P [ Gana 2] = P[N n B] =P [N] * P [B/N] =2/3 * ½ = 1/3
P [ Gana 3] = P[N n N n B] = P [N] * P[N/N] * P[B/NN] = 2/3 * ½ * 1/1 = 1/3

4.8. Eventos independientes

Si P(A)  0, los eventos A y B son independientes si y solo si:

P(A/B) = P(A)

P[A/B]=P[AnB]/P[B]  P[AnB]=P[B]P[A/B]

4.8.1. Ley de la multiplicación para eventos independientes

Si dos eventos A y B son independientes se cumple que:


P ( A∩B )=P ( A ) P ( B )

Tres eventos A, B y C son independientes si se cumple que:


P ( A∩B )=P ( A ) P ( B ) P ( A∩C )=P ( A ) P ( C ) P ( B∩C ) =P ( B ) P ( C )
P( A∩B∩C)=P( A )P( B) P(C)
MA477 Estadística 125

Ejercicio 94
Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer trabajo es del
60% y que sea aceptado en el segundo es del 40%. Si ser aceptado en dichos trabajos es indepen-
diente entre sí.
P [T1] = 0.6 P [T2] = 0.4

a. ¿Cuál es la probabilidad de que al menos sea aceptado en uno de los trabajos?


P [al menos uno sea aceptado] = P[T1 D T2]
P [T1 n T2] = P [T1] * P [T2] = 0.6 (0.4) = 0.24
P = [T1 U T2]
=0.88

¿Cuál es la probabilidad de que solamente sea aceptado en uno de los trabajos?


P = [T1 ∆ T2] = 0.52

Ejercicio 1
Una persona postula a tres trabajos. La probabilidad de que sea aceptado en el primer trabajo es del
0.6, que sea aceptado en el segundo es del 0.4 y en el tercer trabajo es 0.5. Si ser aceptado en dichos
trabajos es independiente entre sí.
a. ¿Cuál es la probabilidad de que sea aceptado en dos trabajos?

b. ¿Cuál es la probabilidad de que al menos sea aceptado en uno de los trabajos?

Ejercicio 2
El pulpo Paul es un octópodo que ha sido empleado como oráculo para predecir los resultados de la
selección alemana de fútbol en el Mundial de Fútbol 2010, acertando los ocho emparejamientos que
se le propusieron, los siete partidos de Alemania en la Copa Mundial de Fútbol de 2010 y la final en -
tre España y Holanda. Antes de cada partido, a Paul se le presentaron dos contenedores idénticos
con comida: uno de ellos estaba marcado con una bandera, usualmente la de Alemania y el otro con
la bandera del equipo oponente. La elección de Paul se interpretaba como el equipo que lograría la
126 MA477 Estadística

victoria. Si el pulpo Paul, en realidad, escogió los contenedores al azar, calcule la probabilidad de
acertar en los resultados de los ocho los partidos que le propusieron. Asuma independencia.

Ejercicio 3
Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en una chi-
ca acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma independencia en -
tre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo menos con una de ellas.
MA477 Estadística 127

Partición del espacio muestral


Sean los n eventos A1, A2, A3, .... , An mutuamente excluyentes y tales que entonces constituyen una
partición del espacio muestral S.

Árbol de probabilidades

Simples Condicionales Conjuntas

Si los eventos Ai y Bi son independientes, el árbol de probabilidades se simplifica dado que las proba-
bilidades condicionales serían iguales a las probabilidades simples correspondientes.

4.9. Probabilidad total

Sean los k eventos A1, A2, A3, ..... , An, mutuamente excluyentes y que constituyen una partición del es-
pacio muestral S, entonces para cualquier evento B de S se cumple:

P ( B ) =P ( B∩ A 1 ) + P ( B∩ A 2 ) + P ( B∩ A3 ) +.. .+ P ( B∩ A n )

Por la ley multiplicativa de eventos cualesquiera, se tiene finalmente que:


P ( B ) =P ( A 1 ) P ( B/ A 1 ) + P ( A 2 ) P ( B/ A 2 ) + .. .+ P ( A n ) P ( B/ A n )

4.10. Teorema de Bayes

Si los k eventos A1, A2, A3, .... , An, constituyen una partición del espacio muestral S, entonces para
cualquier evento B de S tal que P(B) > 0, se cumple:

( B)
Ai P ( A i ∩B )
P =
P ( B)

Por definición de probabilidad condicional y probabilidad total se tiene que:

( A B )= P ( A ) P ( B/ A )+ P ( A( ) P)( B/( A )+..) .+ P ( A ) P ( B / A )


i
P Ai P B / Ai
P
1 1 2 2 n n

El teorema de Bayes determina la probabilidad de un determinado evento se deba a una causa espe-
cífica.
128 MA477 Estadística

Ejercicio 4
Actualmente el 40% de nuestra población usa tarjeta Ripley, el 35% tarjeta CMR y 25% tarjeta Metro.
Pero lo más interesante es que el 70% de los que tienen tarjeta Ripley, el 60% de los que tienen tarje-
ta CMR y el 80% de los que tienen tarjeta Metro la usan para realizar compras a crédito.

Sean los eventos:

R : El cliente tiene tarjeta Ripley  P [R] = 0.40  P [D/R] = 0.70


C : El cliente tiene tarjeta CMR  P [C] = 0.35  P [D/C] = 0.60
M : El cliente tiene tarjeta Metro  P [M] = 0.25  P [D/M] = 0 .80
D : El cliente realiza su compra a crédito

a. Si se selecciona un cliente al azar, calcule el porcentaje de clientes que han efectuado sus com -
pras crédito.
P [ D] = 0.28 + 0.21 + 0.2 = 0.69  El porcentaje de clientes que han efectuado sus compras cre-
dito es del 69%

b. Calcule el porcentaje de clientes que hacen sus compras con tarjeta CMR y a crédito.
P [C n D] = 0.21  El porcentaje de clientes que hacen sus compras con tarjeta CMR y a credito
del 21%

c. Dado que efectuaron sus compras a crédito. calcule el porcentaje de clientes que usaron tarjeta
CMR. Ripley y Metro para pagar sus compras. Compare e interprete resultados.
P [C / D] = P [C n D] / P [ D] = 0.21 / 0.69 = 0.3043
P [R / D] = P [R n D] / P [ D] = 0.28 / 0.69 = 0.4058
P [M / D] = P [M n D] / P [ D] = 0.2 / 0.69 = 0.2899

Ejercicio 5
En una empresa el 25% de los trabajadores son mujeres y el 75% son hombres. Un día ha llegado tar-
de a trabajar el 3% de las mujeres y el 5% de los hombres.
a. Si se elige, al azar, a un trabajador calcule la probabilidad de que haya llegado tarde.

b. Si se elige, al azar, a un trabajador que ha llegado tarde, calcule la probabilidad de que sea elegida
una mujer.

Ejercicio 6
Para la elaboración de productos naturales enlatados de durazno, higo y uva de 200 gramos, se cuen -
ta con tres máquinas A, B y C las cuales producen el 25%, 45% y 30% de los productos, pero el 5%, 7%
MA477 Estadística 129

y 8% de los productos enlatados producidos por las maquinas A, B y C no cumple con las especifica-
ciones técnicas del contenido neto.
a. Calcule el porcentaje de productos enlatados que no cumplen las especificaciones técnicas.

b. Si una lata no cumple con las especificaciones técnicas, calcule la probabilidad de que haya sido
producida por la máquina A, máquina B, máquina C. Si el valor de estas probabilidades supera a
0.3 entonces, la maquina se debe ser cambiada. Será necesario cambiar alguna de las maquinas.

Ejercicio 7
La probabilidad de que un cajero terminalista muy capacitado de un banco declare que un billete de
100 dólares es falso, si lo es realmente, es de 98%, mientras que crea que es falso un billete verdade -
ro es de 0.4%. Por datos históricos se sabe que el 1.5% de los billetes de 100 dólares que llegan a ese
banco son falsos.

a. Si se elige un billete al azar, calcule la probabilidad de que sea verdadero.

b. Si un cajero terminalista ha declarado un billete como falso, calcule la probabilidad de que sea
verdadero.
130 MA477 Estadística

Ejercicio 8
Una empresa tiene tres vendedores A. B y C. los cuales han realizado. durante el último mes.
el 30%. 20% y 50% de las operaciones respectivamente. Se selecciona al azar una operación
de venta.

Distribución porcentual de las operaciones según error en la compra por vendedor

100%
90%
90% 87%
84%
80%
70%
60%
Porcentaje

A
50%
B
40% C
30%
20% 13%
16%
10%
10%
0%
Si No
Error en la compra

a. Calcule la probabilidad de que ésta tenga error en la orden de compra.

b. Si se selecciona al azar una operación de venta y ésta tiene error en la orden de compra; determi-
ne la probabilidad de que la operación de venta corresponda al vendedor B.

c. Si se establecen los eventos C: La operación fue realizada por el vendedor C y N: La operación no


tiene error en la orden de compra. ¿Son eventos independientes? Justifique.
MA477 Estadística 131
132 MA477 Estadística

Ejemplo 22.
El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en
efectivo, con cheque o al crédito, con probabilidades respectivas de 0.3; 0.3 y 0.4. La probabilidad de
que una venta sea por más de $50, es igual a 0.2 si ésta es en efectivo, es igual a 0.9 si ésta es con
cheque y es igual a 0.6 si ésta es al crédito.

a. ¿Cuál es la probabilidad de que una persona compre por más de $50?


b. Si compra por más de $50, ¿qué es más probable que haya pagado en efectivo, con cheque o al
crédito?

Solución
Sean los eventos:
E: La compra se realiza con dinero en efectivo
CH: La compra se realiza con cheque
C: La compra se realiza al crédito
M: La compra es por más de $ 50
MC: La compra no es por más de $ 50

Con la información proporcionada. construimos el siguiente diagrama de árbol:

Se pide calcular:

a) P ( M ) =0 ,30×0 , 20+0 , 30×0 , 90+0 , 40×0 , 60=0 , 57

b)

Se observa que es más probable la compra se haya hecho con cheque.


MA477 Estadística 133

Ejercicios propuestos

77. Si usted tiene 6 libros diferentes del curso A, 2 del curso B, 4 del curso C y desea colocarlos en un
estante:
a. ¿De cuántas maneras diferentes pueden colocarse, si los libros de cada curso deben estar
juntos?
b. ¿De cuántas maneras diferentes pueden colocarse, si solo los libros del curso C deben estar
juntos?

78. Con la finalidad de realizar un focus group una empresa decide elegir aleatoriamente un grupo
de trabajadores de un total de 7 trabajadores del sexo femenino, y 12 trabajadores del sexo
masculino que consideran que hay un clima laboral inadecuado en la empresa.
Nota: Para cada una de las siguientes preguntas, desarrolle el procedimiento, justificando cada
paso que realice.

a. ¿Cuántos casos posibles existen si se eligen 8 trabajadores, al azar, sin reemplazo y sin inte-
rés en el orden?
b. Si de cada género se eligen al azar, sin reemplazo y con interés en el orden, tres trabajadores;
¿cuántos casos posibles existen?
c. Se elige al azar un género, y del género elegido se eligen al azar y con reemplazo cuatro tra -
bajadores, ¿cuántos casos posibles existen?

79. De un conjunto de 8 hombres y 7 mujeres, ¿cuántos grupos de 10 miembros se pueden formar


si cada uno de ellos debe tener por lo menos 5 mujeres?

80. Indique si son verdaderas o falsas las siguientes afirmaciones.


a. Si dos eventos son mutuamente excluyentes entonces la ocurrencia de uno de ellos no influ -
ye en la ocurrencia del otro
b. El complemento del evento A no es mutuamente excluyente con el evento A
c. Si dos eventos son mutuamente excluyentes. entonces P(A) + P(B) = 1

81. Indique si son verdaderas o falsas las siguientes afirmaciones.


a. Si dos eventos son independientes, entonces serán también mutuamente excluyentes

b. Si dos eventos son independientes, entonces


c. Si dos eventos son independientes, entonces la ocurrencia de uno de ellos no influye en la
ocurrencia del otro evento
d. Si P ( A /B )=P ( A ) esto implica que A y B son eventos mutuamente excluyentes
e. Si P ( A /B )=P ( A ) esto implica que A y B son eventos independientes
f. Si P ( A /B )=0 esto implica que A y B son eventos mutuamente excluyentes, si P(B)>0

82. Se ha recibido dos lotes de artículos I y II. El lote I contiene 4 artículos de calidad A, 4 de calidad
B, y 2 de calidad C. El lote II contiene 5 artículos de calidad A, 3 de calidad B, y 2 de calidad C.
Para realizar un control de calidad se deberá tomar de cada lote una muestra aleatoria sin reem -
plazo.

a. Si se eligen dos artículos de cada lote, halle la probabilidad de que uno de ellos sea de calidad
C.
b. Si se eligen dos artículos de cada lote, y resulta que es de calidad A, halle la probabilidad de
que dicho artículo provenga del lote II.
134 MA477 Estadística

83. Suponga que en la empresa PUBLISA se tiene solamente los departamentos: A y B. En el depar -
tamento A laboran 20 personas, de las cuales: 10 son profesionales, 5 son técnicos, y 5 tienen
educación secundaria. En el departamento B laboran 16 personas, de las cuales: 9 son profesio -
nales, 4 son técnicos, y 3 tienen educación secundaria.

a. Si se elige al azar un departamento, y de él se eligen al azar y sin reemplazo una tras otra tres
personas, ¿cuántos casos posibles de selección existen? (Deje indicada su respuesta).
b. Si se elige al azar un departamento, y de él se eligen al azar y sin reemplazo una tras otra tres
personas. Determine la probabilidad de que solamente la última persona elegida sea profe-
sional. (Deje indicada su respuesta)
c. Si se eligen al azar y sin reemplazo dos personas de cada departamento, halle la probabilidad
de que al menos una de dichas personas sea profesional. (Deje indicada su respuesta)
d. Si se eligen al azar y con reemplazo tres personas de la empresa PUBLISA, halle la probabili-
dad de que una de ellas sea un técnico.
e. Si ambos departamentos tienen la misma probabilidad de ser elegidos, y se realiza el siguien -
te proceso de selección: primero se elige al azar un departamento y de él se eligen al azar y
sin reemplazo dos personas, una tras otra. Determine la probabilidad de que la persona ele -
gida labore en el departamento A, si se conoce que la última persona elegida fue un profesio-
nal.

84. Suponga que se tiene el siguiente cuadro en relación a cantidad de medidores de consumo de
agua, distribuidos en dos zonas (Z1 y Z2), clasificados por marca (M1, M2) y por modelo (A y B).
Nota: En cada una de las siguientes preguntas de este problema 2, debe identificar debidamen -
te a los eventos y desarrollar en forma clara el procedimiento, justificando cada paso. Se reco-
mienda trabajar con fracciones.

Zona 1 (Z1) Zona 2 (Z2)


Modelo M M Total
M1 M2
2 1
1
A 40 25 40 15 2
0
8
B 20 15 30 15
0
T
o 2
t 60 40 70 30 0
a 0
l

a. De cada zona se seleccionan, al azar y sin reemplazo, tres medidores. Establezca la cantidad
de elementos que tiene el espacio muestral. Luego, determine la probabilidad de seleccio-
nar dos medidores de la marca M1 y del modelo B de la Zona 1, si se sabe que se seleccio -
naron cinco medidores de la marca M1 y del modelo B.
b. Suponga que, primero, se selecciona al azar una zona, y que la elección de la zona 1 (Z1) es -
tá en relación 3 a 2 con la elección de la zona 2 (Z2). Luego, de la zona seleccionada, se elige
MA477 Estadística 135

al azar un medidor. Si se sabe que el medidor seleccionado es de la marca 2 y del modelo A;


determine la probabilidad de que el medidor elegido pertenezca a la zona 1. Establezca,
previamente, la cantidad de elementos del espacio muestral.

Caso Metropolitano

85. El 70% de los usuarios usan el Metropolitano para dirigirse a su trabajo, el 60% lo usa para regre-
sar a su casa y el 40% lo usa para ir a su trabajo y regresar a su casa.
a. ¿Cuál es la probabilidad de que un usuario seleccionado al azar use el servicio para dirigirse a
su trabajo o para regresar a su casa?
b. ¿Cuál es la probabilidad de que un usuario seleccionado al azar use el servicio solo para diri -
girse a su trabajo o solo para regresar a su casa?
c. Si el porcentaje de trabajadores que usan el servicio solo una vez al día es menor al 80% el
concesionario implementará un servicio denominado “el súper rápido”. Según sus resultados
la decisión será:

86. Para lograr este objetivo la consultora SY DATA, ganadora para realizar el estudio, seleccionó
una muestra de 200 usuarios de las estaciones Javier Prado, Angamos y Canaval y Moreyra del
Metropolitano. La distribución de los usuarios se presenta en las siguientes tablas de doble en-
trada:

Distribución de los usuarios según principales problemas. estación y sexo


Estación
Angamos Javier Prado Canaval y Moreyra
Mu- Mu-
Hombre Hombre Hombre Mujer
Principales problemas jer jer Total
Buses muy llenos 8 15 23 15 4 12 77
Colas muy largas 15 10 25 18 7 8 83
Otros 2 10 12 7 4 5 40
Total 25 35 60 40 15 25 200
Fuente: Pro Transporte

Se elige un usuario al azar: (Formalizar las probabilidades)


a. ¿Cuál es la probabilidad de que el usuario opine que el principal problema sean los buses
muy llenos o que sea de la estación de Javier Prado?
b. ¿Cuál es la probabilidad de que el usuario opine que el principal problema sea colas muy lar-
gas o que no sea de la estación de Angamos?
c. ¿Cuál es el porcentaje de usuarios hombres y el porcentaje de mujeres que opinan que el
principal problema son buses muy llenos?
d. ¿Cuál es el porcentaje de usuarios hombres y el porcentaje de mujeres que opinan que el
principal problema son colas muy largas?
e. ¿Cuál es la probabilidad que el usuario opine que el principal problema sean buses muy lle -
nos o que sea de la estación de Javier Prado?
f. ¿Cuál es el porcentaje de usuarios que opina que el principal problema son buses muy llenos
o que no sea de la estación de Angamos?

87. Objetivo específico 1: Analizar el comportamiento de los ganadores de un sorteo de tarjetas con
pasajes libres durante un mes, para fidelizar a los usuarios del Metropolitano.
El concesionario del Metropolitano, con la finalidad de fidelizar a los usuarios, realiza un sorteo
relámpago en la estación Canaval y Moreyra, ha decidido otorgar cuatro tarjetas con pases libres
durante un mes, para ello selecciona al azar a los ganadores de los 15 que encuentra en la esta -
ción, de los cuales tres son mujeres ¿cuál es la probabilidad de que reciba el premio al menos
una mujer?
136 MA477 Estadística

88. Objetivo específico 2: Comparar el principal problema por estación, para implementar mejoras
en el servicio.
Para lograr este objetivo la consultora SY DATA, ganadora para realizar el estudio, seleccionó
una muestra de 200 usuarios de las estaciones Javier Prado, Angamos y Canaval y Moreyra del
Metropolitano. La distribución de los usuarios se presenta en las siguientes tablas de doble en-
trada:

Distribución de los usuarios según principales problemas y estación


Estación
Principales problemas
Angamos (C) Javier Prado (D) Canaval y Moreyra (E) Total
Buses muy llenos (A) 23 38 16 77
Colas muy largas (B) 25 43 15 83
Otros 12 19 9 40
Total 60 100 40 200
Fuente: Pro Transporte
Se elige un usuario al azar. Formalizar las probabilidades.
a. Si el usuario es de la estación de Javier Prado, ¿cuál es la probabilidad de que opine que el
principal problema sean los buses muy llenos?
b. El concesionario, implementará un nuevo servicio rápido de la estación de Javier Prado en
el turno noche, si el porcentaje de usuarios de esta estación que opinan que el principal
problema sea buses muy llenos es mayor al 60%, ¿cuál es la decisión?

89. Objetivo específico 3: Evaluar la confianza de los usuarios del aplicativo para celulares con infor-
mación de los horarios de llegada de los buses para la implementación de otros aplicativos.
El concesionario del Metropolitano ha implementado un aplicativo para celulares, que advierte
el horario de llegada de buses. Para evaluar la confianza de los usuarios de este aplicativo. La
consultora SY DATA selecciona 200 usuarios al azar que tienen instalados este aplicativo: 70 de
la estación Javier Prado, 50 de Canaval y Moreyra y 80 de Angamos. De un sondeo previo se tie -
nen que el 80% de los usuarios de Javier Prado, 70% de los usuarios de Canaval y Moreyra y 50%
de los de Angamos, tienen confianza en el aplicativo. Si se elige un usuario al azar:
a. ¿Cuál es la probabilidad de que tenga confianza en el aplicativo?
b. Si el usuario tiene confianza en el aplicativo, ¿cuál es la probabilidad de que sea de la esta -
ción de Canaval y Moreyra?
c. Si más del 50% de los usuarios que tienen confianza con el aplicativo son de la estación de
Canaval y Moreyra, el concesionario implementará un servicio muy rápido para demostrar
que la aplicación muestra información para reducir el tiempo de espera, ¿los resultados su -
gieren al concesionario implementar el servicio en la estación Canaval y Moreyra?

90. Objetivo específico 4: Determinar la opinión del usuario acerca del servicio por estación, para
implementar mejoras en el servicio
Pro Transporte desea identificar ¿cuál es la opinión de los usuarios acerca del servicio del Metro-
politano por estación? Para ello la consultora le presenta los siguientes gráficos:
MA477 Estadística 137

Gráfico 1: Distribución porcentual de los usuarios según estación

Canaval y Moreyra Angamos


25% 40%

Javier Prado
35%

Fuente: SY DATA

Gráfico 2: Distribución porcentual de usuarios según opinión por estación del


Metropolitano
100%
14% 12% 18%
90%
80%
Porcentaje de usuarios

70%
60%
66% Malo
50% 68%
70% Regular
40% Bueno
30%
20%
10% 18% 22%
12%
0%
Angamos Javier Prado Canaval y Moreyra
Fuente: SY DATA Estación del Metropolitano

a. Si se selecciona un usuario al azar y este opina que el servicio es malo, ¿cuál es la probabili -
dad de que sea de la estación de Angamos?
b. Pro Transporte en las recomendaciones del estudio indica que si más del 60% de los usuarios
que opinan que el servicio es malo son de la estación de Angamos, sugiere al concesionario
ampliar una ventanilla para recargas para evitar un mayor tiempo de espera, ¿los resultados
indican que el concesionario debe ampliar una ventanilla?
91. La probabilidad que un usuario sufra un robo en la estación Canaval y Moreyra es 0.2 y que sufra
un robo en la estación Javier Prado es 0.05. Asumiendo que el sufrir robo en las estaciones es in -
dependiente y que un usuario. en determinado día acude a las dos estaciones:
a. ¿Cuál es la probabilidad que le roben en una de las estaciones?
b. ¿Cuál es la probabilidad que le roben en ambas estaciones?
c. ¿Cuál es la probabilidad que no le roben?
d. ¿Cuál es la probabilidad que le roben en al menos una estación?
92. La probabilidad que un usuario sufra un robo en la estación Canaval y Moreyra es 0.2, que sufra
un robo en la estación Javier Prado es 5% y en Angamos es 0.08. Asumiendo que el sufrir robo
en las estaciones es independiente y que un usuario, en determinado día acude a las tres esta-
ciones, ¿cuál es la probabilidad que le roben en al menos una de las estaciones?
Caso: Cacao S.A.
93. Objetivo específico 1: Analizar el grado de iniciativa por género y grupo de edad de los trabaja -
dores, para implementar un programa de capacitación
La consultora seleccionó una muestra de 150 trabajadores. Mostrando la distribución de los tra -
bajadores en la siguiente tabla:
Distribución de usuarios según grado de iniciativa, género y grupo de edad
Hombre (H) Mujer (M)
Total
Grado de iniciativa Joven (J) Adulto (G) Joven (J) Adulto (G)
Grado 2 (A) 15 5 10 5 35
138 MA477 Estadística

Grado 3 (B) 7 9 9 9 34
Grado 4 (C) 8 12 8 10 38
Grado 5 (D) 7 20 5 11 43
Total 37 46 32 35 150
Fuente: CACAO S.A.

Se selecciona al azar a un trabajador, calcule la probabilidad de que:


a. tenga un grado de iniciativa mínimo de grado 4.
b. sea mujer y no tenga un grado de iniciativa 5.
c. sea un trabajador joven o sea mujer.
d. sea mujer, si se sabe que tiene un grado de iniciativa 4.
e. tenga un grado de iniciativa máximo de grado 3. si se sabe que es un joven.
f. El jefe de RRHH en su informe indica que el porcentaje de los jóvenes que tienen un grado de
iniciativa máximo de grado 3 es menor del 65%. Si esta afirmación es cierta se propondrá cur-
sos de capacitación de motivación y liderazgo, ¿se propondrá los cursos de capacitación?
94. El jefe de recursos humanos de la empresa ha organizado un sorteo por el día del trabajador,
otorgará cinco premios de manera aleatoria entre los trabajadores de cada oficina. Si en la ofici -
na de planeamiento hay 12 trabajadores de los cuales ocho son hombres.
a. ¿Cuál es la probabilidad de que los ganadores en la oficina de planeamiento sean tres muje -
res y dos hombres?
b. Si la probabilidad de que los ganadores de los premios sea mínimo dos hombres es mayor a
0.25, el jefe de RRHH propone realizar un nuevo sorteo solamente entre los trabajadores
hombres, ¿los resultados sugieren al jefe de RRHH realizar un nuevo sorteo?

95. Objetivo específico 2. Analizar la productividad de los centros de producción para otorgar un
bono de productividad.
El gerente de Cacao S.A preocupado por la baja productividad en los centros de producción del
Callao, Los Olivos y Ate. Los resultados de los años anteriores indican que la productividad fue
efectiva para el centro de producción del Callao en un 90%, para Los Olivos en un 85%; mientras
que para Ate fue en un 70%. Si cada centro de producción trabaja de manera independiente
a. Calcule la probabilidad que la productividad fue efectiva en al menos un centro de produc -
ción.
b. Calcule la probabilidad que la productividad fue efectiva solo en dos centros de producción.
c. Calcule la probabilidad que la productividad no fue efectiva en ningún centro de producción.
d. Si la probabilidad de que la productividad sea efectiva en al menos un centro de producción
es mayor a 0.85; se otorgará un bono de productividad a los trabajadores, ¿los resultados in-
dican que debe otorgarse el bono a los trabajadores?
MA477 Estadística 139

96. Objetivo específico 3. Analizar la capacitación de los trabajadores según categoría laboral para
la implementación de un programa de capacitación.

La distribución de los trabajadores de la empresa Cacao SA según categoría laboral es el 42% son
administrativos, 12% son directivos y el resto son obreros. Además, el 60% de los empleados,
70% de los directivos y el 30% de los obreros han recibido algún curso de capacitación en el pre -
sente año. Se elige un trabajador al azar.
a. Calcule la probabilidad de que haya recibido algún curso de capacitación en el presente año.
b. Calcule la probabilidad de que un sea directivo y no haya recibido capacitación alguna.
c. Si recibió alguna capacitación en el año, calcule la probabilidad de que sea directivo.
d. Si la empresa está dispuesta a implementar un programa de capacitación para la categoría la-
boral que tenga menor probabilidad de haber recibido algún curso de capacitación, ¿a qué
categoría laboral debe orientarse este programa? Justifique sus respuestas.
140 MA477 Estadística

97. El jefe de producción de la empresa Cacao S.A. afirma que más del 50% de los trabajadores tie -
nen grado de iniciativa 5 y además de los trabajadores que tienen grado de iniciativa 5 más del
35% son del centro de producción de Ate.

Se elige un trabajador al azar:


a. ¿Cuál es la probabilidad que tenga un grado de iniciativa 5?
b. Si el trabajador tiene grado de iniciativa 5, ¿cuál es la probabilidad que sea del centro de
producción de Ate?
c. Según sus resultados, ¿la afirmación del jefe de producción es cierta?
MA477 Estadística 141

Unidad 5. Variable aleatoria y distribuciones


de probabilidad
Logro de la Unidad 4
Al finalizar la unidad, el estudiante aplica correctamente la distribución de probabili-
dad, identificando el comportamiento de la variable involucrada para la toma de deci-
siones de una situación real.

5.1. Variable aleatoria

Se denomina variable aleatoria a una descripción numérica del resultado de un experimento.


La variable aleatoria atribuye a cada evento un número que no es aleatorio o imprevisible, sino fijo y
predeterminado.
Lo que es aleatorio es el experimento sobre cuyo espacio muestral se define la variable aleatoria.

5.1.1. Rango o recorrido de una variable aleatoria

Se llama rango o recorrido de una variable aleatoria X y lo denotaremos RX, al conjunto de los valores
reales que ésta puede tomar.

5.2. Variable aleatoria discreta

Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito nu-
merable. (o sea que pueda escribir los posibles valores)
Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se denota
P(X = x).
Una variable aleatoria continua, es aquella que tiene un rango infinito – No numerable. Ejm del
tiempo en segundos

Por ejemplo: número de alumnos matriculados por curso, cantidad de preguntas correctamente con -
testadas en una evaluación de personal, cantidad de clientes que visitan un centro comercial en un
día determinado.

5.3. Distribución de probabilidad de una variable aleatoria discreta

La distribución de probabilidad de una variable aleatoria discreta X se describe como una función de
probabilidad representada por f(x) que asigna a cada valor de la variable aleatoria, la probabilidad de
que X asuma ese valor, esto es:
f(x) = P(X = x)

Toda función de probabilidad debe cumplir que:


 f(x)  0


142 MA477 Estadística

Ejemplo 23.
Calcule a para que la siguiente función sea una función de probabilidad: cumple con los requisitos

f ( x )=ax x=10 , 15 , 20 , 25
Solución
Tiene que cumplir dos condiciones:

 La primera condición, f(x) > 0, se cumple cuando a es mayor que cero, puesto que x > 0.

 La segunda condición, , se cumple si a10+15 a+20 a+25 a=1 , esto se cumple cuan-
do 70a =1, luego a =1/70

Ejercicio 9
Indique cuáles de las siguientes funciones puede ser función de probabilidad.

Ejercicio 10
Indique cuáles de las siguientes funciones puede ser función de probabilidad.

{
x
x= 2, 3 , 5
f ( x )= 10
0 en otro caso

f ( x )={C2x p x (1− p )2−x x=0 , 1 , 2


0 en otro caso
MA477 Estadística 143

5.4. Valor esperado de una variable aleatoria discreta


El valor esperado o esperanza matemática de una variable aleatoria X o media de una distribución de
probabilidad de X se denota E(X).
n
μ X =E ( X )=∑ x i f ( xi )=x 1 f ( x 1 ) + x 2 f ( x 2 ) +. ..+x n f ( x n )
i=1
5.4.1. Valor esperado de una función de variable aleatoria discreta
Sea G(X) una función de la variable aleatoria X. El valor esperado de G(X) es:

5.4.2. Propiedades del valor esperado en variables aleatorias


 Si X1 y X2 son dos variables aleatorias, y a1 y a2 son dos constantes, entonces:
E ( a 1 )=a1
1.
E ( a 1 X 1 +a 2 ) =a1 E ( X 1 ) + a2
2.
3. E ( a 1 X 1 +a 2 X 2 )=a1 E ( X 1 ) +a2 E ( X 2 )
 Si X1, X2, X3. . . .. Xn son n variables aleatorias, y a1, a2, a3, . . .. an son n constantes, entonces:
E ( a 1 X 1 +a 2 X 2 +…+ an X n ) =a1 E ( X 1 ) + a2 E ( X 2 ) +…+ an E ( X n )
 Si X1, X2,. X3, . . .. Xn son n variables aleatorias con la misma función de probabilidad. entonces se
E ( X i )=μ
cumple que y, por lo tanto:
E ( X 1 + X 2 + .. .+ X n )=nμ

Ejercicio 11
En un lote de 30 polos hay tres con fallas. Se toma una muestra aleatoria de cinco polos y se define la
variable aleatoria X como el número de polos defectuosos en la muestra.
a. Determine y grafique la función de probabilidad de la variable X.

b. Calcule la probabilidad de tener dos polos defectuosos en la muestra.

c. Calcule el valor esperado del número de polos defectuosos.


144 MA477 Estadística

Ejercicio 12
Se tiene la posibilidad de invertir en acciones o en instrumentos de renta fija. Se supone que se espe -
ran tres posibles escenarios: expansión, recesión o estabilidad de la economía en la que se negocian
los instrumentos. La siguiente tabla muestra las utilidades bajo estos tres escenarios:
Escenario
Invertir en Expansión Estabilidad Recesión
Acciones 720 550 -1050
Instrumentos de renta fija 350 120 -200
Probabilidad 0.1 0.6 0.3
Obtener la utilidad esperada para cada una de las opciones.

Ejercicio 13
La solicitud de préstamo que presentan los clientes de un banco puede ser aceptada o negada por el
gerente de préstamos. Se desea realizar un estudio sobre la distribución de la cantidad de solicitudes
aceptadas por el gerente de préstamos. La siguiente tabla muestra la distribución de probabilidad de
la variable aleatoria X:= número de solicitudes aceptadas por día por el gerente de préstamos.

X 0 1 2 3 4 5
f(x) = P(X = x) 0.05 0.15 0.05 2k 0.15 k

a. Determine el valor de k para que f(x) sea función de probabilidad.

b. Si se sabe que el gerente puede aceptar al menos una solicitud al día, ¿cuál sería la probabilidad
que tenga que aceptar a lo más cuatro solicitudes al día?

c. Determine e interprete el valor esperado de la variable X.

d. Para la revisión de cada solicitud de crédito, el gerente de préstamos demora 30 minutos. Deter -
mine el tiempo esperado que le demanda diariamente este proceso.
MA477 Estadística 145

Ejemplo 24.
Sea X una variable aleatoria con la siguiente función de probabilidad. Calcule el valor esperado de X2

Solución

Lo primero es determinar a. planteamos que , de donde a = 1/15. Nos piden

Ejercicio 14
La demanda diaria de un producto es una variable aleatoria X cuya distribución de probabilidades es
simétrica y está dada por la tabla siguiente:

x 1 2 3 4 5
f(x) a 0.20 b c 0.05
La empresa obtiene por cada unidad demandada de producto 100 soles de utilidad. Si la cantidad de -
manda en un día es mayor a dos unidades, se obtiene una utilidad adicional de 15 soles por unidad
demandada de producto.
a. Calcule el valor de a, b y c.

b. Determine la probabilidad que la demanda diaria sea de por lo menos tres productos.

c. Calcule el valor esperado de la utilidad por la demanda diaria de productos.


146 MA477 Estadística

5.5. Varianza de una variable aleatoria discreta


La varianza V(X) de una variable aleatoria discreta X con distribución de probabilidad f(x) se define
por:

 Se cumple
 La varianza de la variable aleatoria X, V(X), también se denota por , o simplemente como .
5.5.1. Propiedades de la varianza en variables aleatorias
 Si Y = aX + b. con a y b son constantes, entonces
 Si X1, X2, . . ., Xn son n variables aleatorias independientes, y a1, a2,. . .. an son n constantes, enton-
ces:

 Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma función de probabili-
dad. entonces se cumple que y, por lo tanto:
2
V ( X 1 + X 2 +. . .+ X n )=nσ

Ejemplo 25.
Sea X una variable aleatoria con la siguiente función de probabilidad. Calcule la varianza de X.

Solución

El esperado de X es

Calculando , luego se tiene que

Ejercicio 15
Un restaurante pone a la venta diariamente diversas ensaladas. El número de ensaladas demandadas
diariamente se modela con una variable aleatoria X que tiene la siguiente distribución de probabili-
dad.
X 12 15 17 18 20 25
f(x) a 0.12 0.35 2a 0.14 0.09
El costo de una ensalada es de 4 soles y las vende a 6 soles. La ensalada no vendida en el día se dese -
cha.
Calcule el valor de a.

Calcule la desviación estándar de la utilidad diaria, si el restaurante prepara 20 ensaladas por día.
x 12 15 17 18 20 25
f(x) 0.12 0.35 0.14 0.09
U(x)
MA477 Estadística 147
148 MA477 Estadística

5.6. Distribuciones de probabilidad de variables discretas

Binomial Hipergeométrica Poisson

5.6.1. Distribución binomial


Un experimento binomial consiste en una serie de n pruebas o ensayos, donde n se fija antes de rea-
lizar el experimento.
El n se establece previamente, a sea antes de realizar el experimento, el n se fija

Las pruebas son idénticas y cada una de ellos puede resultar en uno de dos posibles resultados que
denotan éxito o fracaso.
Solo tenemos 2 opciones, el de éxito o fracaso
Ojo: el éxito o fracaso depende de como defines tu variable

Las pruebas son independientes entre sí por lo que el resultado de un intento en particular no influ -
ye en el resultado de cualquier otro.
No importa que paso antes, lo que pasara después dependerá de azar, lo que ocurre prevaimente no
influye en lo que ocurrirá después

La probabilidad de éxito es constante de una prueba a otra y la denotamos como p.


Entonces para n intentos y la probabilidad p de éxito en cualquier intento, la probabilidad de tener x
éxitos en los n intentos está dada por:

x = 0. 1. 2..... n rango: finito numeral

Se dice que la variable aleatoria X sigue una distribución binomial con parámetros n y p, se denota
X~B (n, p)

Características
 Es simétrica si p = 0.5, Para valores de p < 0.5 la distribución tiene sesgo derecho y para valores
p > 0.5 tiene sesgo izquierdo, independientemente de los valores de n.
 Para valores de n suficientemente grandes (n > 50), y sólo tomando en cuenta los valores rele-
vantes de probabilidad, la distribución es prácticamente simétrica.
 Media  = E(X) = np
 Varianza 2 = V(X) = np(1 – p)
 En Excel, use la función =DISTR.BINOM.N(Núm_éxito; Ensayos; Prob_éxito; acumulado)
MA477 Estadística 149

Ejercicio 16
Juan ha decidido invertir su dinero en dólares. Cada vez que el dólar sube, él gana 1000 soles pero
cada vez que baja, pierde 600 soles. Si se sabe que la probabilidad de que el precio del dólar suba en
un día es de 0.47. Juan quiere analizar el comportamiento del precio del dólar durante los siguientes
10 días.

a. En base al contexto del enunciado indique:


La variable en estudio es: Numero de días en que el precio del dólar sube  VA Discreta
El rango o recorrido de la variable X es : Rx = { 0, 1, 2, 3, .., n}  Rango finito - Numerable
La distribución y sus parámetros es : X ~ B (n = 10, p = 0.47)
b. Calcule la probabilidad de que el precio del dólar suba cuatro veces durante los próximos 10 días.
c. Calcule la utilidad esperada durante los siguientes 10 días y su riesgo respectivo.

Ejercicio 17
A diez trabajadores de una AFP, se les preguntan si se quedan en el esquema actual de comisión por
remuneración o si migran a otra opción, en un sondeo previo el 60% de los trabajadores prefieren
este sistema porque les garantiza un mayor fondo para su jubilación. Calcule la probabilidad de que
por lo menos nueve trabajadores de los 10 opten por quedarse con el sistema actual.
Solución
La variable en estudio es………………….…………………………………………………………………………..…………………..
El rango o recorrido de la variable X es ………………………………………………………………………………..………..…
La distribución y sus parámetros es ………………….….…………………………………………………………………………

Ejercicio 18
Una compañía de comida rápida sabe que el 85% de sus tiendas por franquicia tendrán éxito comer -
cial. Si el éxito de cada tienda se puede considerar independiente de las demás tiendas.

a. Calcule la probabilidad de que 17 tiendas tengan éxito, si la compañía va a instalar 20 tiendas el


presente año.

Solución

La variable en estudio es ………………….…………………………………….………………..

Sus parámetros son: n = ………………………..………. y p = …………………….…………..

El rango o recorrido de la variable X es …………………..…………………….…………..……


150 MA477 Estadística

b. Calcule la probabilidad de que al menos 18 tiendas tengan éxito, si la compañía va a instalar 20


tiendas el presente año.

Solución
MA477 Estadística 151

5.6.2. Distribución hipergeométrica

Consideremos N elementos, de los cuales r son considerados éxitos y por lo tanto N - r como fraca-
sos. Como en el caso de la distribución binomial estamos interesados en saber la probabilidad de ob -
tener x éxitos en una muestra de n elementos.

El experimento hipergeométrico consiste en extraer al azar y sin sustitución n elementos de un con-


junto de N elementos, r de los cuales son éxitos y N - r son fracasos.

La probabilidad de obtener de x éxitos en la muestra de n elementos es:

El rango de X en la mayoría de los casos va de 0 a n, pero no siempre, por lo que se debe analizar en
cada caso.

Se dice que la variable aleatoria X sigue una distribución hipergeométrica con parámetros N, r y n y
se denota X ~ H (N, n, r)

Características

 Media

 Varianza
 En Excel. use la función =DISTR.HIPERGEOM.N(muestra_éxito; núm_de_muestra;
población_éxito; núm_de_población; acumulado)

Ejercicio 19
Un comerciante recibe un lote de 30 computadoras portátiles. Para protegerse de una mala remesa,
el comerciante revisará diez computadoras y rechazará todo el lote si encuentra una o más computa -
doras defectuosas. Si en el lote hay seis computadoras defectuosas, ¿cuál es la probabilidad de que
rechace el lote?

Solución

La variable en estudio es: X: Número computadoras defectuosas


152 MA477 Estadística

El rango o recorrido de la variable X es : N = 30 r = 6 n = 10  N – r = 24

Rx = { 0. 1. 2. … . 6 }  max { 0; n – ( N – r ) } = 0 …. Min ( n , r ) = 6

La distribución y sus parámetros es : X  H [N = 30 r = 6 n = 10 ]

Ejercicio 20
La empresa San Fernando ha lanzado una campaña para salvar sus ventas. Si de un total de 60 perso -
nas, donde 34 recuerdan la campaña, se eligen al azar a ocho personas para entrevistarlos, calcule la
probabilidad de elegir al menos a tres personas que recuerden la campaña.

Solución

La variable en estudio es ………………….…………………………………..……………………………………………………………..

El rango o recorrido de la variable X es …………………………………………………………………….…………………….……

La distribución y sus parámetros es ………………….…………………………………………………………………………………


MA477 Estadística 153

5.6.3. Distribución de Poisson

El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina
proceso de Poisson y posee las siguientes propiedades:

 El número de resultados que ocurre en un intervalo o región de espacio cualquiera es indepen -


diente del número que ocurre en cualquier otro intervalo o región del espacio disjunto.
 La probabilidad de que ocurra un solo resultado durante el intervalo muy corto o región muy pe-
queña es proporcional a la longitud del intervalo o al tamaño de la región y no depende del nú -
mero de resultados que ocurren fuera del intervalo o región.
 La probabilidad de que ocurra más de un resultado en tal intervalo corto o caiga en tal región pe -
queña es insignificante.

La probabilidad de tener x resultados en un intervalo dado o en una región específica es:


−λ x
e λ
f ( x )=P ( X =x ) =
x ! x = 0. 1. 2.... rango de la variable infinito

x = número de éxitos por unidad de tiempo o región.


 = número esperado de éxitos por unidad de tiempo o región.
e = 2.71828…

0.16

0.14

0.12

0.10

0.08
f(x)

0.06

0.04

0.02

0.00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X

Se dice que la variable aleatoria X sigue una distribución Poisson con parámetro  y se denota X ~
P().

Características

 Siempre es una distribución sesgada a la derecha. A medida que  aumenta y tomando en cuenta
sólo los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.

 Media:  = E(X) = 

 Varianza: 2 = V(X) = 

 En Excel. use la función =POISSON.DIST(x; media. acumulado)


154 MA477 Estadística

Ejercicio 21
El número promedio de clientes que llegan a un determinado cajero automático de una agencia ban -
caria es 4.2, por cada 20 minutos, según un proceso de Poisson.

a. ¿Cuál es la probabilidad de que. en un periodo de un minuto, lleguen exactamente tres clientes al


cajero?
Sean X : Numero de clientes que llegan a un cajero automatico de una agencia bancaria, por cada 20
minutos

Eventos independientes
Px = {0, 1, 2, 3, …} Rango infinito, numerable
.: X ~ P [  = 4.2 clientes / 20 min]

b. ¿Cuál es la probabilidad de que, en un periodo de dos minutos, lleguen más de un cliente al caje-
ro?

c. ¿Cuál es la probabilidad de que, en un periodo de cinco minutos, lleguen menos de dos clientes?

d. ¿Cuál es la probabilidad de que en un periodo de un minuto llegue más de un cliente, si ya llegó


un cliente dentro de ese minuto?
MA477 Estadística 155

Ejercicio 22
En una pastelería, el número demandado de un cierto tipo de torta se modela con una variable Poi-
sson con una media de tres tortas al día. La pastelería, siempre produce tres tortas diarias. Cada torta
cuesta producirla 50 soles y se vende a 80 soles. Toda torta no vendida en el día se remata en 20 so -
les y siempre las compran todas las tortas a ese precio. Calcule el valor esperado de la utilidad por di-
cho concepto.

Ejercicio 23
La llegada de reclamos a Indecopi sigue un proceso Poisson con media de cinco reclamos
cada cuatro minutos. Determine la probabilidad que en 20 minutos se presenten por lo me-
nos dos reclamos.
156 MA477 Estadística

Ejemplo 26.
Suponga que el número de llamadas que llegan a una central telefónica es 0.5 por minuto
en promedio. Calcule la probabilidad de que:

a. En un minuto no lleguen llamadas

Solución
X:= número de llamadas / minuto  = 0.5 llamadas / minuto

b. En un minuto lleguen más de tres llamadas

Solución
P(X > 3) = 1 – P(X ≤ 3) = 1 – (0.6065 + 0.3033 + 0.0758 + 0.0126) =1- 0.9982=0.0018

c. En tres minutos lleguen menos de 5 llamadas.

Solución
Y:= número de llamadas / 3 minutos  = 1.5 llamadas / 3 minutos
P(Y < 5) = 0.2231 + 0.3347 + 0.2510 + 0.1255 + 0.0471 = 0.98142

d. En cinco minutos lleguen más de dos llamadas

Solución
Se define la variable aleatoria W:= número de llamadas cada cinco minutos.
 = 2.5 llamadas / 5 minutos
P(W > 2) = 1 – P(W ≤ 2) = 1 – (0.0821 + 0.2052 + 0.2565) = 0.45652

Ejemplo 27.
El administrador de un almacén ha observado que en promedio ingresan al establecimiento
20 personas cada 30 minutos. ¿Cuál es la probabilidad de que en 6 minutos ingresen al al-
macén a lo más cinco clientes, pero más de tres?

Solución
Lo primero es definir la variable adecuada, sea X:= número de personas que entren al establecimien-
to en un periodo de seis minutos.

Como nos dicen que la variable cuenta las llegadas por unidad de tiempo, se tiene que X ~ P().

Luego, debemos determinar el valor de , para lo cual vamos a hacer una regla de tres simple, pues
es una propiedad de la distribución Poisson

Si en 30 minutos llegan en promedio 20 personas, entonces en seis minutos llegarán, en promedio.


.= 4 personas
Se tiene que X ~ P( = 4)

Nos piden
MA477 Estadística 157

Ejercicio 24
Si se sabe que en cada 100 metros de longitud de un cable hay un promedio de 80 puntos
por los cuales este puede ser seccionado. ¿Cuál es la probabilidad de que en un tramo de
13.5 metros se encuentren cinco puntos de seccionamiento?

Solución

Sea X:= número de puntos de seccionamiento.

Como nos dicen que la variable cuenta puntos por unidad de longitud, se tiene que X ~ P()

Luego, debemos determinar el valor de , para lo cual vamos a hacer una regla de tres simple, pues
es una propiedad de la distribución Poisson

Si en 100 metros hay en promedio 80 puntos de seccionamiento, entonces en 13.5 metros hay, en
promedio, .= 10.8 puntos.

Se tiene que X ~ P( = 10.8)

Nos piden

Observe que si lambda  sale un valor que no es entero. no se debe redondear a un entero.
158 MA477 Estadística

5.7. Variable aleatoria continua

Es una variable cuyo rango es un conjunto infinito no numerable de valores.


Por ejemplo: utilidad mensual, en soles, de una empresa, tiempo en recuperar el capital de un nego -
cio Patrimonio neto de una empresa. etc.

5.8. Función de densidad de una variable aleatoria continua

Se denomina función de densidad de probabilidad f(x) de una variable aleatoria continua a la fun-
ción que satisface:

 para todo x  R

Se tiene que

Ejercicio 25
Para cierto negocio por correo electrónico la proporción de los pedidos procesados en 24
horas tiene la función de densidad de probabilidad:

(x) = a(1 - x) 0<x<1


f

a. Calcule a para que f(x) sea una función de densidad.

[ ] ()
1 1 1
1 1
1=∫ a (1−x ) dx=a∫ ( 1−x ) dx=a x− x 2 =a → a=2
0 0 2 0 2

b. ¿Cuál es la probabilidad de los pedidos sean procesados dentro de 24 horas?

[ ] []
1 1 1

∫ 2 ( 1−x ) dx=2∫ ( 1−x ) dx=2 x− 12 x2 =2 12 =1


0 0 0

c. Si el porcentaje de pedidos procesados en 24 horas es mayor al 80%, calcule la probabilidad de


que sea mayor a 90%.

P [ X > 0.9 ] 0.9


∫ 2 ( 1−x ) dx
P [ X >0.9/ X > 0.8 ] = = =0.25
P [ X > 0.8 ] 1
∫ 2 ( 1−x ) dx
0.8
MA477 Estadística 159

Ejercicio 26
La duración, en minutos, de una llamada telefónica de una vendedora de una línea de crédito para
consolidar deudas en otros bancos puede modelarse por una variable aleatoria X con la siguiente
función de densidad:

a. Determine el valor de a.

b. Calcule la probabilidad de que una llamada dure más de dos minutos.

c. Si una llamada ya duró un minuto, calcule la probabilidad de que dure al menos un minuto más.

5.9. Función de distribución acumulada de probabilidad

La función de distribución acumulada (FDA) de una variable aleatoria continua X con función de den-
sidad f(x) se define por:
F(x) = P(X  x) para -  < x < + 

 P(a < X < b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b) = F(b) – F(a)


 F(x) es una función que siempre está entre 0 y 1 (0 ≤ F(x) ≤ 1). pues es igual a una probabilidad.

 F(x) es una función que nunca decrece: y


160 MA477 Estadística

Ejercicio 27
Marque la(s) gráfica(s) que pueden ser funciones de distribución acumulada.

Ejercicio 28
Para cierto negocio por correo electrónico la proporción de los pedidos procesados en 24
horas tiene la función de densidad de probabilidad.

Determine la función de distribución acumulada (FDA).

Ejercicio 29
La proporción de personas que responden a una encuesta enviada por correo electrónico por la Su-
perintendencia de Banca y Seguros para conocer sobre las opiniones de los usuarios sobre las nuevas
comisiones que cobrarán las AFP se modela con una variable aleatoria X con la siguiente función de
densidad:

a. Determine y grafique la función de distribución acumulada de la variable aleatoria X.


MA477 Estadística 161

b. Use la función de distribución acumulada para calcular la probabilidad de que respondan entre
60% y 80% de las personas a la encuesta.

c. Use la función de distribución acumulada para calcular la probabilidad de que respondan más de
la mitad de las personas a la encuesta.
162 MA477 Estadística

Ejemplo 28.

El tiempo de vida de un sistema es una variable aleatoria (en años) cuya función acumulada es:

a. Calcule el rango intercuartil

Solución

Sea X:= tiempo, en años, de vida de un sistema. Para calcular el rango intercuartil, debemos hallar el
cuartil 1 y el cuartil 3, para esto hay dos posibilidades:
 Integrar la función de densidad f(x)
 Reemplazar en la función de distribución acumulada

En este caso, es más fácil usar la función de distribución acumulada.

Por definición de cuartil 3, el 75% de los datos es menor o igual al él, es decir P(X ≤ Q3) = 0.75, o lo
que es lo mismo F(Q3) = 0.75

de donde Q3 = 10. Haciendo lo mismo para el cuartil 1.

de donde Q1 = 5.77. Luego el RIC = Q3 – Q1 = 4.23.

b. Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la


probabilidad que pertenezca al quinto superior?

Solución

Como nos dicen que “ya se sabe que está en el cuarto superior”, es una probabilidad condicional.

5.10. Valor esperado de una variable aleatoria continua

El valor esperado o esperanza matemática de una variable aleatoria X o media de una variable
aleatoria X se denota E(X).

5.10.1. Valor esperado de una función de variable aleatoria continua

Sea G(X) una función de la variable aleatoria X. El valor esperado de G(X) es:
MA477 Estadística 163

Propiedades del valor esperado en variables aleatorias


 E(b) = b

 Si X e Y son variables aleatorias, a y b son constantes, entonces:


E(aX + bY) = a E(X) + b E(Y)

 Si X1, X2, X3, . . ., Xn son n variables aleatorias, y a1, a2, a3, . . ,. an son n constantes, entonces:

 Si X1, X2, X3, . . ., Xn son n variables aleatorias con la misma función de densidad, entonces se cum-
ple que E(Xi) =  , por lo tanto:

Ejercicio 30
Una empresa sabe que el tiempo, en años, que tarda una lavadora en necesitar la primera reparación
importante puede modelarse por una variable aleatoria X con la siguiente función de densidad de
probabilidad:

Calcule el valor esperado del tiempo que tarda una lavadora en necesitar la primera reparación im-
portante.

5.11. Varianza de una variable aleatoria continua

Propiedades de la varianza en variables aleatorias


 Si Y = aX + b, con a y b son constantes, entonces:
 Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes, y a1, a2, a3, . . ,. an son n constantes,
entonces:

 Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma función de densidad,
entonces se cumple que V(Xi) = 2 y, por lo tanto:
164 MA477 Estadística

Ejercicio 31
El rendimiento promedio de una acción en el primer día que se negocia en la bolsa es una variable
aleatoria continua X tiene la siguiente función de densidad de probabilidad:

a. Determine el valor de a.

b. Calcule la probabilidad de P(X < 3.5).

c. Calcule la desviación estándar de X.


MA477 Estadística 165

5.12. Distribuciones de probabilidad de variable continuas

Uniforme Exponencial Normal

Distribución de probabilidad uniforme


Función de densidad

Se dice que X tiene una distribución uniforme y se denota X ~ U (a. b)

La función de distribución acumulada de una variable uniforme es:

Características

 Media:

 Varianza:

Ejercicio 32
La variable X se distribuye uniformemente con media igual a 24 y varianza igual a 12, calcule los pará-
metros de la función de densidad.

Solución.

Media = (a + b) / 2 = 24  a + b = 48 …. (1) b = 30  a = 18

Var = (b – a) ^2 / 12 = 12  b – a = 12 …. (2)
166 MA477 Estadística

Ejercicio 33
La función de Excel =ALEATORIO() genera un número con distribución uniforme con parámetros a
igual a cero y b igual a uno. Sea X una variable aleatoria definida como el número generado por dicha
función.

a. Calcule la probabilidad de que la función genere un número aleatorio menor a 0.20.

b. Calcule la probabilidad de que la función genere un número aleatorio mayor a 0.35.

c. Calcule la probabilidad de que la función genere un número aleatorio entre 0.30 y 0.85.

d. Use la función de distribución acumulada para calcular P(0.15 < X < 0.65).
MA477 Estadística 167

Ejemplo 29.
En ciertos experimentos, el error cometido al determinar la densidad de una sustancia es
una variable aleatoria cuya distribución es uniforme con a = -0.025 y b = 0.025.

a. ¿Cuál es la probabilidad de que tal error esté entre 0.010 y 0.015?

Solución
Sea X:= error al determinar la densidad de una sustancia
La variable X ~ U(a = -0.025. b = 0.025) tiene la siguiente función de densidad

Nos piden P(0 , 010≤ X≤0 , 015 ) . Existen dos formas de calcular esta probabilidad: integrando la
función de densidad f(x) o calculándola a partir del área del rectángulo.

b. ¿Cuál es el error esperado cometido?

Solución
La variable X ~ U(a = -0.025. b = 0.025) tiene el siguiente número esperado de errores

Ejercicio 34
La llegada de cada uno de los empleados a su centro de labores se produce independiente -
mente, de acuerdo a la distribución uniforme en el intervalo comprendido entre las 8:00 y
8:25 am. De una muestra de 10 empleados, calcule la probabilidad de que cuatro de ellos
hayan llegado entre las 8:15 y 8:20 AM.

Solución
Sea X:= tiempo. en minutos. desde las 8 AM hasta la hora de llegada de los empleados al centro de
trabajo, luego XU (0, 25)

Se define la variable Y:= número de empleados que llegan al centro de trabajo entre 8:15 y 8:20 AM
Debe calcularse la probabilidad de éxito p de que un empleado llegue al centro de trabajo entre 8:15
y 8:20 AM esto es:

Entonces Y  B(10; 0.20)

Se pide:
168 MA477 Estadística

5.12.1. Distribución de probabilidad exponencial

Una distribución continua de probabilidad que es útil para describir el tiempo necesario para realizar
alguna actividad es la distribución de probabilidad exponencial.

Función de densidad

−x
1 β
f ( x)= e para x > 0. β > 0
β

Lo anterior puede escribirse como X ~ E(β).

La siguiente figura muestra tres distribuciones exponenciales con diferentes parámetros.


2.0

1.5

Beta = 0.5
1.0 Beta = 1.0
Beta = 2.0

0.5

0.0

Esta distribución se puede usar en variable como: el tiempo que tardará una máquina de cajero auto -
mático en entregar efectivo. Esta función puede usarse para determinar la probabilidad de que el
proceso tarde como máximo un minuto.

Para calcular probabilidades acumuladas en la distribución exponencial se puede utilizar la siguiente


expresión:

P [ X < x ] = F (x)

Características

 La variable puede tomar valores de 0 a +∞, no toma valores negativos.


 La gráfica es descendente con sesgo a la derecha.
 Media: E(X) = β
 Varianza: V(X) = β2

La distribución exponencial se relaciona con la distribución de Poisson de la siguiente manera:

Si la cantidad de eventos discretos que suceden en un tiempo sigue una distribución de Poisson con
media λ entonces el tiempo entre la ocurrencia de dos eventos discretos consecutivos sigue una dis-
tribución exponencial con media β = 1 / λ.
MA477 Estadística 169

Ejercicio 35
El tiempo de duración, en horas, de un dispositivo electrónico es una variable aleatoria que tiene la
siguiente función de densidad:
x
1 −
f ( x )= e 50
50 . x≥0

a. ¿Cuál es la probabilidad que un dispositivo elegido al azar dure más de 80 horas?

b. ¿Cuántas horas como mínimo debe durar uno de estos componentes para ser considerado dentro
del 20% de los más durables?

c. ¿Cuánto debe ser la duración máxima para considerar este componente dentro del grupo del 15%
de los menos durables?

Ejercicio 36
El tiempo de respuesta de un departamento de bomberos a una llamada de emergencia es de quince
minutos en promedio y se distribuye exponencialmente.
a. ¿Cuál es la probabilidad de que el tiempo de respuesta sea menor a 12 minutos?

b. ¿Cuál es la probabilidad de que el tiempo de respuesta se encuentre entre 14 y 18 minutos?


170 MA477 Estadística

Ejercicio 37
La empresa A se dedica a la fabricación de focos. La duración, en cientos de horas, de un foco se mo -
dela con una variable aleatoria continua X con la siguiente función de densidad:

{
−x
f (x )= e para 0<x<∞
0 c.c

Supóngase que el costo de fabricación de foco es de $50. El fabricante vende el artículo a $125, pero
garantiza una devolución y reintegra si el foco dura menos de 90 horas. ¿Cuál es la utilidad esperada
por artículo?

Ejercicio 38
El número clientes que llega a Bucks Café sigue una distribución de Poisson con una media de seis
clientes cada hora.

a. Calcule la probabilidad de que el tiempo transcurrido entre la llegada de dos clientes consecutivos
sea más de 10 minutos pero menos de 20 minutos.

b. Si transcurrieran 10 minutos y no llegara ningún cliente, ¿cuál es la probabilidad de que transcu-


rran por lo menos 10 minutos más para que llegue un cliente?
MA477 Estadística 171

Ejercicio 39
La duración, en minutos, de una conversación telefónica de larga distancia nacional tiene distribución
exponencial con un promedio de ocho minutos.
a. ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos?

b. ¿Cuál es la probabilidad que una llamada dure más de 9 minutos?

c. ¿Cuánto debe durar, como mínimo, una llamada para estar en el 10% de las de mayor duración?

d. Si ya pasaron cinco minutos, calcule la probabilidad que la llamada dure al menos 4 minutos más.

Ejercicio 40
Un componente de un equipo electrónico tiene un tiempo de vida que se modela con una variable
exponencial con una media de 500 días.
a. ¿Cuál es la probabilidad de que un componente dure más de 800 días?

b. ¿Cuánto tiempo de duración tienen, como máximo, el 90% de los componentes producidos?

c. ¿Cuánto tiempo de duración tienen, como mínimo, el 15% de los componentes producidos?
172 MA477 Estadística

5.12.2. Distribución de probabilidad normal

Función de densidad

 Se dice que la variable aleatoria X sigue una distribución normal con parámetros  y .
 Se denota: X ~ N (, 2)

Características

 La función de densidad tiene forma de campana y es simétrica. por lo que las medidas de ten -
dencia central coinciden.
 El rango de la variable normal es toda la recta real. esto es. De – a + .
 En Excel, use la función =DISTR.NORM.N(x; media; desviación estándar; acumulado)
 En Excel, use la función =INV.NORM(Probabilidad; media; desviación estándar)

5.12.3. Estandarización
Se toma como referencia una distribución normal estándar (  = 0 y 2 = 1). Se trabaja con la distancia
entre x y  en función de la desviación estándar, tal como se muestra.

Ejercicio 41

Si . calcule:
a. P(Z > 1.03) = ………………………………
b. P(Z > 1.14) = ………………………………
c. P(0.15 < Z < 1.18) = ………………………………
d. Hallar c para que P(Z < c) = 0.88100 ………………………………
e. Hallar c para que P(-c <Z < c) = 0.79945 ………………………………
MA477 Estadística 173

Tabla de la distribucion normal


Área bajo la curva normal: P(Z ≤ z) = α
Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233
-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350
                     
-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
                     
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
                     
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
174 MA477 Estadística

Tabla de la distribucion normal


Área bajo la curva normal: P(Z ≤ z) = α
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
                     
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
                     
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
                     
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967

Ejercicio 42

Si , calcule:
 P(X < 11)

 P(X > 13)

 P(9 < X < 12) =


MA477 Estadística 175
176 MA477 Estadística

Ejercicio 43
El ingreso mensual de los trabajadores de Lima Metropolitana en los meses de abril a junio de 2018,
sigue una distribución normal con una media de S/. 1625 y desviación estándar de S/. 500. Informa-
ción que fue proporcionada por el INEI. En base a esto datos se pide:

a. Calcule el porcentaje de limeños que ganan menos de 1000 soles.

b. Calcule el ingreso mensual mínimo para estar en el 15% de las personas que más ganan.

c. Si los descuentos correspondientes por AFP, y otros están dados por la función Y = 0.11X + 50 so-
les, calcule el porcentaje de personas que se les descuenta más de 300 soles.

d. Si se quiere que el porcentaje de trabajadores limeños que ganan menos de 900 soles sea el 7.5%,
¿cuánto se le debe aumentar a cada trabajador?
MA477 Estadística 177

Ejercicio 44
Se tiene un portafolio diversificado, los retornos del portafolio en porcentajes es una variable aleato -
ria normal con media cinco y desviación estándar 1.25
a. Calcule la probabilidad que los retornos del portafolio se encuentren entre 4.2% y 7.1%.

b. Calcule la probabilidad que los retornos sean menores al 6.8%.

c. Determine el retorno máximo que corresponde al 8.5% de los retornos más bajos.

d. Determine el retorno mínimo que corresponde al 20% de los retornos más altos.
178 MA477 Estadística

Ejercicio 45
El tiempo de respuesta de un monitor LCD es el tiempo que tarda en mostrar las imágenes. Lo que en
realidad se mide es la rapidez en que los píxeles individuales del monitor pueden cambiar de color, lo
cual se indica en milisegundos. El tiempo de respuesta de un cierto monitor se modela por una varia -
ble aleatoria normal con una media de 12.5 milisegundos y desviación estándar dos milisegundos.

a. Calcule la probabilidad de que el tiempo de respuesta del monitor sea menor a 12 milisegundos.

b. Calcule la probabilidad de que el tiempo de respuesta del monitor sea mayor a 14.5 milisegundos.

c. Calcule la probabilidad de que el tiempo de respuesta esté entre 9.5 y 12.5 milisegundos.

Ejercicio 46
La rentabilidad porcentual de la acción A tiene distribución normal con media 12. Además se sabe
que en el 93.32% de los días, esta acción ha registrado una rentabilidad máxima del 15%.
Calcule la rentabilidad máxima que debe registrar la acción A en un día, si se sabe que en el 12 % de
los días el comportamiento del mercado bursátil es a la baja.
MA477 Estadística 179

Ejercicio 47
El promedio ponderado de los alumnos de una universidad se modela con una variable normal con
una media de 14.35 y una desviación estándar de 2.16, calcule el promedio mínimo para estar en el
quinto superior.

Ejercicio 48
Los ingresos mensuales de los empleados de una empresa se modelan con una variable normal. Se
sabe que el 2.81% de los empleados ganan menos de S/. 2 045 y que el 2.5% de los empleados ganan
más de S/. 3 980, calcule la media y la desviación estándar de los ingresos mensuales de los emplea -
dos.
180 MA477 Estadística

Ejemplo 30.
En Buck Café, la máquina surtidora de refrescos está ajustada de tal forma que sirve en pro-
medio 250 mililitros por vaso. Si la cantidad de refresco servido en los vasos sigue, aproxi -
madamente, una distribución normal con una desviación estándar de 10 mililitros. ¿Qué
proporción de los vasos servidos contendrán entre 240 y 255 mililitros de refresco?

Solución
Sea X:= cantidad de refresco servido por vaso. X ~ N(µ = 250.  2 = 102)
Se pide P(240 ≤ X ≤ 255)
Estandarizando se tiene

Ejercicio 49
Se informa que la cantidad X de azúcar de los paquetes marcados con un kilo, tiene distribu-
ción normal con media  kilos y desviación estándar 0.02 kilos. Halle el valor de  si la canti-
dad de azúcar que contiene cada paquete es menor o igual a 0.95 kilos con probabilidad
0.102.

Solución
Sea X:= pesos de los paquetes de azúcar, en kilos, X ~ N(µ ,  2 = 0.022)
Se pide

Estandarizando se tiene

Usando la tabla normal estándar para calcular el valor z correspondiente.

De donde
= 0.9754

Cálculo de probabilidad de una variable normal con una calculadora Casio

1. Ponga la calculadora en modo estadístico. Presione MODE y luego, presione SD


2. Luego presione SHIFT. DISTR (3). Aparecerá una pantalla con P(, Q(, R( y t.
3. P( calcula la probabilidad de que Z esté entre - y el valor que ingresa
4. Q( calcula la probabilidad de que Z esté entre 0 y el valor que ingresa
5. R( calcula la probabilidad de que Z esté entre el valor que ingresa y +.

Cálculo de probabilidad de una variable normal con una calculadora Casio con Natural Display

6. Ponga la calculadora en modo estadístico. Presione MODE y luego, presione STAT


7. Luego presione SHIFT. STAT (1) y luego elija la opción DISTR. Aparecerá una pantalla con
P(, Q(, R(.
8. P( calcula la probabilidad de que Z esté entre - y el valor que ingresa
9. Q( calcula la probabilidad de que Z esté entre 0 y el valor que ingresa
MA477 Estadística 181

10. R( calcula la probabilidad de que Z esté entre el valor que ingresa y +.
182 MA477 Estadística

Ejercicios propuestos
98. Indique si son verdaderas o falsas las siguientes afirmaciones.
a. El mayor valor del rango de la variable hipergeométrica es siempre menor o igual a n ( )
b. En un proceso de Poisson el número de resultados que ocurre en un intervalo es indepen -
diente del número que ocurre en cualquier otro intervalo del espacio disjunto ( )
c. La variable binomial cuenta el número de éxitos en n repeticiones independientes con la
misma probabilidad de fracaso en cada repetición ( )
d. La variable hipergeométrica cuenta el número de éxitos en una muestra de tamaño n de
una población N que tiene r éxitos y donde el muestreo es con reemplazo
( )
99. Para cierto negocio por correo electrónico la proporción de los pedidos procesados en 24 ho-
ras tiene la función de densidad de probabilidad.

Calcule el valor esperado de X.


Determine la Función Acumulada

100. Marque la opción correcta.


La mediana de una variable aleatoria normal X es:
a. Igual a cero
b. El esperado de X
c. Aquel valor para el cual f(Me) = 0.5. donde f es la función de densidad de X
d. No se puede determinar sin saber la desviación estándar.
101. Indique si son verdaderas o falsas las siguientes afirmaciones.
a. Una variable aleatoria continua es una variable cuyo rango es un conjunto infinito numera-
ble de valores.
b. La función de distribución acumulada es siempre mayor a la función de densidad para cual-
quier valor de la variable aleatoria.
c. El esperado de la suma de dos variables aleatorias es igual a la suma de los dos esperados
de las variables aleatorias.
d. La varianza de una variable aleatoria puede ser menor a cero.
e. Se denomina variable aleatoria a una descripción numérica del resultado de un experimen -
to.
f. El valor esperado es el valor más probable de ocurrencia.
g. El valor esperado es un valor que puede ser mayor que el máximo de los valores del rango
de la variable aleatoria.
h. El valor esperado es un valor que siempre es igual a uno de los valores del rango de la varia -
ble
i. La media de una variable normal puede ser negativa.
j. Si X es una variable normal estándar P(X > c) = 0.025. entonces c = -1.96
k. Si X es una variable normal se cumple que P(X < 3) = P (X ≤ 3)
l. Si X es una variable normal estándar se cumple que P(X < -3) = 1 - P (X < 3)
m. Si X es una variable normal se cumple que P(X < -3) = 1 - P (X < 3)
n. El rango de toda variable normal es igual a toda la recta real
o. La función de densidad de la distribución normal toma su mayor valor en X = µ
p. La función de densidad de la distribución normal en algunos casos no es simétrica.
q. El percentil 75 de una variable aleatoria uniforme coincide con el tercer cuartil.
CASO: Transporte
102. Objetivo específico 1: Modelar la variable número de días que un usuario utiliza el servicio por
semana. de los usuarios de las estaciones de Javier Prado y Angamos para un posible incremen-
to de tarifas.
MA477 Estadística 183

Con la finalidad de sustentar el incremento probable de tarifas, el concesionario debe justificar


su propuesta al organismo supervisor Pro Transporte, la consultora SY Data de un estudio reali-
zado el año anterior indica que la variable: Número de días que un usuario utiliza el servicio por
semana de los usuarios de Javier Prado tiene la siguiente función de probabilidad:

X: Número de días que usa el servicio por semana 1 2 3 4 5 6


f(x) = P[X = x] 0.05 k 2k 0.15 3k 0.2
a. El valor de k para que f(x) sea una función de probabilidad es:
b. Si se elige un usuario al azar de la estación Javier Prado, ¿cuál es la probabilidad de que utili-
ce el servicio al menos tres días en una semana?
c. Se puede confirmar que la variabilidad del número de días que un usuario utiliza el servicio
por semana es menor para los usuarios de Javier Prado que para los de Angamos. De un estu-
dio realizado el año anterior se tiene:
Número de días que usa el servicio por semana - Angamos
Media µ 2.5
Desviación estándar σ 1.1
d. Pro Transporte recomienda al concesionario no incrementar la tarifa porque este año el nú-
mero de días que un usuario utiliza por semana se ha incrementado en un 20% respecto al
año anterior. El concesionario aceptará la recomendación si en ambas estaciones el número
esperado de días que un usuario utiliza el servicio es mayor de 3.5. ¿Los resultados le indican
al concesionario aceptar la recomendación de Pro Transporte?
Javier Prado Angamos
  Año anterior Este año Año anterior Este año
Media µ     2.5  
Desviación estándar σ     1.1  
103. Objetivo específico 2: Analizar el comportamiento de los ganadores de un sorteo de tarjetas con
pasajes libres durante un mes, para fidelizar a los usuarios del Metropolitano.
El concesionario del Metropolitano, con la finalidad de fidelizar a los usuarios, realiza un sorteo
en la estación Canaval y Moreyra, ha decidido otorgar cuatro tarjetas con pases libres durante
un mes, para ello selecciona al azar a los ganadores de los 15 que encuentra en la estación, de
los cuales tres son mujeres, ¿cuál es la probabilidad de que reciba el premio al menos una mu -
jer?
104. Objetivo específico 3: Analizar la variable número de usuarios insatisfechos para realizar mejo-
ras en el servicio.
Para medir los niveles de insatisfacción de los usuarios por el servicio recibido, la consultora
selecciona a cinco usuarios al azar. Si de un estudio previo se sabe que el 30% está insatisfecho
por el servicio.
a. ¿Cuál es la probabilidad de que al menos un usuario esté insatisfecho en los cinco usuarios
seleccionados?
b. Si la probabilidad de que al menos un usuario esté insatisfecho es mayor a 0.75, la consulto -
ra debe sugerir al concesionario realizar mejoras en el servicio, ¿qué decisión debe tomar el
concesionario?
105. Objetivo específico 4: Identificar el comportamiento del número de usuarios que llegan a la es-
tación Javier Prado por minuto entre 18:00 y 18:30 horas para estimar el número de buses que
el concesionario debe enviar a la estación en este horario.
De registros previos se conoce que en la estación Javier Prado, el número promedio de llegadas
de usuarios por minuto entre las 18:00 y 18:30 horas es cuatro. ¿Cuál es la probabilidad de que
184 MA477 Estadística

lleguen más de tres usuarios a la estación de Javier Prado entre 18:15 y 18:17 horas?
106. El porcentaje de barras de chocolate “Choconut” defectuosas en el centro de producción del Ca-
llao es del 12%, después de haber realizado mejoras en el proceso de producción. El jefe de pro -
ducción espera que la proporción de chocolates defectuosos sea menor, para ello, selecciona al
azar cinco barras de chocolates.

a. Defina el recorrido, la función de probabilidad y los parámetros de la variable X: Número de


barras de chocolate defectuosas en las cinco seleccionadas al azar.
b. Si la probabilidad de encontrar al menos dos barras defectuosas es mayor a 0.85 en las cinco
seleccionadas, se confirma que no ha mejorado el proceso, ¿cuál es su decisión?

107. Según la última evaluación de desempeño de los 30 obreros del centro de producción de Ate,
solo cuatro tienen un grado de iniciativa 5. Se selecciona al azar un equipo de seis obreros para
la participación de un trabajo fuera de su hora de trabajo
a. Defina el recorrido, la función de probabilidad y los parámetros de la variable X: Número de
obreros que no tienen iniciativa de grado 5 en la muestra de seis obreros.
b. ¿Cuál es la probabilidad de que en el equipo se incluya por al menos un obrero que tengan
iniciativa de grado 5?
c. Uno de los puntos del pliego de reclamos del Sindicato de Trabajadores indica que la elección
de personal para cualquier trabajo adicional debe ser aleatoria. Para aceptar este punto del
pliego, el jefe producción indica que para los trabajos fuera del horario, el perfil del obrero
debe ser proactivo con alta iniciativa para cumplir los requerimientos del cliente. El jefe de
producción aceptará este punto del pliego, si la probabilidad de que al menos un obrero con
iniciativa de grado 5 sea mayor de 0.6 en la muestra seleccionada. ¿Los resultados indican la
aceptación de este punto del pliego de reclamos?

108. La función de probabilidad de la variable X:= número de capacitaciones al año de los trabajado-
res de la empresa Cacao S.A. se presenta en el siguiente gráfico:

Distribución de probabilidad del número de capacitaciones del personal

0.4 2b
0.35

0.3

0.25
0,2
0.2 b
f(x)

0,15
0.15

0.1
0,05 0,06
0.05

0
1 2 3 4 5 6
Fuente: Empresa CACAO.SA Número de capacitaciones

a. Obtenga el valor de b para que f(x) sea una función de probabilidad.


b. ¿Cuál es la probabilidad de que un trabajador seleccionado al azar tenga por lo menos 4
cursos de capacitación en el último año?, si se sabe que tiene en su file dos certificados de
capacitación.
c. El departamento de RR.HH. indica que un trabajador debe de tener en promedio tres cur -
sos de capacitación al año, ¿se puede esperar que el personal está cumpliendo con la nor -
ma?
MA477 Estadística 185

109. De los registros de la oficina de recursos humanos, el número promedio de trabajadores que lle-
gan tarde por día es 1.5
a. Identifique la variable aleatoria, el recorrido y los parámetros
b. Calcule la probabilidad de que en dos días lleguen tarde exactamente tres trabajadores.
c. Si la probabilidad de encontrar al menos un trabajador que llegue tarde en un día es mayor a
0.3, la gerencia de recursos humanos propone retirar en el mes el bono de productividad.
¿Los resultados indican a la gerencia de recursos retirar el bono de productividad?

110. El número de clientes que preguntan al día por departamentos en el nuevo edificio que está
construyendo la inmobiliaria se ajusta a una distribución de Poisson con una media de cuatro
clientes por día.
a. Calcule la probabilidad de que en medio día pregunten al menos dos clientes por departa-
mentos en el nuevo edificio.
b. Si un cierto día ya preguntaron dos clientes, calcule la probabilidad de que pregunten por lo
menos dos clientes más pregunten por departamentos en el edificio ese día.

111. La probabilidad de que una persona, que visita un departamento de un edificio en construcción,
lo compre es de 0.08. Si en una semana han visitado un departamento 20 clientes, calcule la
probabilidad de que al menos uno de ellos compre un departamento. Asuma que las visitas al
edificio son independientes. Defina la variable necesaria, indique su rango, distribución y pará-
metros.

112. La constructora tiene doce proveedores de materiales de construcción, de los cuales tres no le
envían los productos con la calidad acordada. Si se hace un control de calidad a los productos de
cinco proveedores elegidos al azar, calcule la probabilidad de que sea detectado al menos un
mal proveedor. Defina la variable necesaria, indique su rango, distribución y parámetros.

113. El gerente de Cacao S.A está preocupado por la cantidad de accidentes laborales en los centros
de producción situados en los distritos del Callao, Los Olivos y Ate. Según estimaciones de años
anteriores, la probabilidad de que haya al menos un accidente laboral por día en el centro de
producción del Callao es de 0.07, para Los Olivos es de 0.09 y para Ate es de 0.05.
a. Se define la variable aleatoria X:= número de centros de producción que no tienen accidentes
laborales en un día. Determine y grafique la función de probabilidad de la variable aleatoria
X.
b. Calcule e interprete el valor esperado de X.

Caso Metropolitano

114. Objetivo específico 1: Analizar si se requiere incrementar dos buses para el Expreso 5.
El tiempo de espera de los usuarios del Expreso 5 en la Estación Central es una variable aleato -
ria X que tiene por función de densidad:

{
−1 5
x+ …………2≤x ≤ a
f ( x)= 32 16
0 … … … en otro caso
a. Calcule el valor de a.
b. Calcule la función de densidad acumulada.
c. Pro transporte considera aceptable que un usuario espere menos de 3 minutos a la unidad
del Expreso 5 en la Estación Central, ¿qué porcentaje de usuarios espera un tiempo aceptable
el Expreso 5?
d. Si el porcentaje de usuarios que esperan al Expreso 5 más de 5 minutos es superior a 0.55, se
tendría que incrementar 2 nuevas unidades al servicio para reducir el tiempo de espera de di-
cho servicio. ¿Se incrementará las 2 nuevas unidades en el Expreso 5?
186 MA477 Estadística
MA477 Estadística 187

115. Objetivo específico 2: Determinar si se debe capacitar a los choferes de la Ruta C.


El tiempo de viaje de un ómnibus de la ruta C desde la Estación Central hasta la estación Matelli -
ni es una variable aleatoria continua que tiene la siguiente función de distribución acumulada:

{
0 si x <20
2
−x x 5
F (x)= + − si20 ≤ x ≤ 40
1200 10 3
1 si x> 40

a. El gerente de Pro Transporte dice que el tiempo de viaje de la ruta C desde la estación Cen -
tral hasta la estación Matellini tiene un tiempo promedio inferior a los 27 minutos. ¿Tiene ra-
zón el gerente de Pro Transporte? Justifique su respuesta
b. Pro transporte asegura que menos del 15% de los viajes de la Ruta C, desde la Estación Cen -
tral hasta la estación Matellini. tienen una duración mayor a 35 minutos. Explique si la afir-
mación de Pro Transporte es correcta.
c. El público usuario de la ruta C en su viaje de la estación Central a la estación Matellini consi -
dera aceptable un tiempo de duración del viaje entre 25 y 35 minutos. ¿Qué porcentaje de
usuarios consideran aceptable el servicio para la la Ruta C?
d. Si se encuentra la probabilidad que supera a 0.20 de que el tiempo de duración del viaje de la
Ruta C de la Estación Central a la Estación Matellini, es más de 35 minutos se entrenará a los
choferes de esta ruta, pues se cree que esta demora es excesiva por la falta de pericia de los
choferes en estacionarse en las diferentes estaciones para recoger y dejar pasajeros. ¿Se en-
trenará a los choferes de la Ruta C?

116. Objetivo específico 3: Evaluar el requerimiento de revisión técnica en las unidades del Metropo-
litano.
El consumo de combustible diario, en galones, de un bus del Metropolitano es una variable alea -
toria continua que tiene una distribución uniforme con un promedio de 31 galones, además se
sabe que el 25% de los buses tiene un consumo de combustible superior a 34 galones al día.
a. ¿Qué porcentaje de buses tienen un consumo mayor a 35 galones por día?
b. ¿Cuál es el consumo máximo del 20% de los buses que tienen un menor consumo diario?
c. El jefe de mantenimiento del Metropolitano informa que si un bus consume más de 35 galo-
nes por día, es porque necesita mantenimiento. Al seleccionar una muestra de 12 buses,
¿cuál es la probabilidad de que por lo menos 3 buses necesiten mantenimiento?
d. Si en una muestra de 12 buses, al menos tres consumen más de 35 galones al día, con una
probabilidad mayor a 0.50, el jefe de mantenimiento del Metropolitano ordenará una revi-
sión técnica a todas las unidades del Metropolitano. ¿Cree usted que se hará dicha revisión
técnica?

117. Objetivo específico 4: Determinar si se requiere instalar otra máquina expendedora de tarjetas.
Pro Transporte sabe que en la estación Javier Prado el tiempo que demora una máquina expen -
dedora en vender una tarjeta general es una variable aleatoria continua que sigue una distribu -
ción normal con media de 4 minutos y una desviación estándar de 1.25 minutos y el tiempo que
demora una máquina expendedora en realizar una recarga es una variable aleatoria continua
que sigue una distribución normal con media de 2 minutos y una desviación estándar de 0.75
minutos.
a. Si se elige al azar a una persona que ha realizado una recarga en la máquina expendedora de
la estación Javier Prado, ¿cuál es la probabilidad de que esta persona se demore al menos 1.5
minutos y a lo más 2.75 minutos?
b. Si se elige al azar a una persona que recién usará el Metropolitano (tiene que comprar una
tarjeta y realizar una recarga), ¿cuál es la probabilidad que esta persona se demore a lo más
6.7 minutos?
188 MA477 Estadística

c. Pro Transporte desea estimar el tiempo mínimo que demora el 20% de los usuarios del Me-
tropolitano para realizar una recarga en la máquina expendedora de la estación Javier Prado.
Ayude usted a Pro transporte a estimar ese tiempo.
d. Si el 80% de los usuarios que realizan recarga en la máquina expendedora de la estación Ja-
vier Prado demoran más de 1.5 minutos Pro transporte sugerirá al concesionario incorporar
una máquina expendedora adicional. ¿Considera usted que se debe incorporar una máquina
expendedora adicional en la estación Javier Prado? Justifique su respuesta.

118. Objetivo específico 5: Determinar la factibilidad de compra de nuevas unidades.


Si la recaudación diaria en soles por recorrido del servicio del Metropolitano es una variable
aleatoria continua que sigue una distribución Normal con los parámetros que se muestran en la
siguiente tabla:
Ruta
Parámetros A B C
Media 18300 10800 8000
Desviación estándar 1000 1200 950
a. ¿Cuál es la probabilidad que en un día cualquiera la recaudación en la Ruta A sea a lo más
20000 soles?
b. ¿Cuál es la probabilidad que en 7 días la recaudación de las 3 Rutas sea al menos 250000 so-
les?
c. Si la recaudación total de los 7 días supera a 260000 soles con una probabilidad superior a
0.30, Pro Transporte considerará factible la compra de nuevas unidades. ¿Considera usted
factible la compra de nuevas unidades? Explique su respuesta.

119. El precio de venta, en miles de dólares, de un inmueble en el distrito de:


 Pueblo Libre se ajusta a una distribución uniforme con parámetros 140 y 220.
 Surco. el precio de venta de un inmueble se modela con una variable aleatoria X con la si -
guiente función de densidad de probabilidad:

{
f ( x )= k ( 300−x )∧100≤ x ≤260
0 otros casos
 La Molina se modela con una variable con distribución normal con media 200 y desviación
estándar de 30.
a. Calcule el valor de k para que f(x) sea una función de densidad de probabilidad.
b. En cada distrito, calcule la probabilidad de que un inmueble cueste entre 180 y 200 mil dó -
lares.
c. En cada distrito, calcule el precio de venta máximo del 20% de los inmuebles más baratos.
d. Una pareja tiene 190 mil dólares para comprar un inmueble en uno de dos distritos. Pueblo
Libre o Surco. Para cada distrito. determine la función de distribución acumulada y úsela
para indicar en qué distrito es más probable que haya un departamento que la pareja pue -
da comprar al contado.
e. Calcule la probabilidad de que un inmueble cueste más de 250 mil dólares.
f. El gerente comercial ha decidido subir el precio al 10% de los inmuebles más caros. Calcule
el precio de venta mínimo de un inmueble que se ajuste a la decisión del gerente comercial.
g. Indique en cuál de los tres distritos: Pueblo Libre, Surco o La Molina, el precio de venta es
más homogéneo.

120. El tiempo, en minutos, que se tarda en resolver un examen se modela como una variable alea-
toria continua con la siguiente función de densidad de probabilidad:
MA477 Estadística 189

Determine la desviación estándar de la variable aleatoria X.

121. Sea X un v.a con N (µ.25)


Calcular P(|X-µ| > 3)

122. Sea X un v.a con N (650.625). Hallar la constante C > 0. tal que.

P(|X-650| ≤ C ) = 0.9544

123. En una distribución normal se tienen los siguientes datos:


P(X < 45) = 0.31
P(X > 64) = 0.08
Hallar µ y σ de la distribución.

124. Se sabe que la estatura de los peruanos sigue una distribución normal con media 165 cm y va -
rianza 100 cm2.

a. ¿Cuál es la probabilidad de que un peruano mida como máximo 170 cm?

b. Si dos peruanos. que no se conocen, son medidos, ¿cuál es la probabilidad de que ambos mi -
dan como máximo 170 cm?

También podría gustarte