Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cuaderno - de - Trabajo Estadistica
Cuaderno - de - Trabajo Estadistica
MA477
PREGRADO
Cuaderno de trabajo
Departamento de Ciencias
Línea de Estadística
Contenido
Estadística MA477
Logro del curso
Al finalizar el curso, el estudiante aplica los conceptos de la esta-
dística descriptiva en situaciones reales dentro de contextos re-
lacionado con su especialidad para tomar decisiones adecuadas
de manera ética.
Bibliografía básica
ANDERSON, David R (2016)
Estadística para Negocios y Economía. México, D.F.: Cengage Learning. (519.5
ANDE/E 2016)
Cuaderno de Trabajo del curso (2021-1)
Sistema de evaluación
El promedio final (PF) se obtiene con la siguiente fórmula:
Razonamiento cuantitativo
Es la capacidad para interpretar, representar, comunicar y utilizar información cuantitativa diversa en
situaciones de contexto real.
Implica calcular, razonar, emitir juicios y tomar decisiones con base en esta información cuantitativa.
¿Qué significa?
El estudiante redacta el problema, con un lenguaje sencillo, como pregunta u
Interpretación objetivo
Habilidad para elegir la herramienta, fórmula o técnica estadística que usará para re-
solver el problema.
¿Qué significa?
El estudiante indica la variable, tabla, gráfico, medida y/o herramienta estadís-
Representación tica que utilizará en la solución del problema.
¿Qué significa?
El estudiante muestra los cálculos realizados para dar respuesta al problema.
Cálculo
¿Qué significa?
El estudiante indica con qué valor(es) calculado(s) responde el problema.
Análisis
¿Qué significa?
El estudiante redacta la decisión que tomará a partir del resultado de su análi-
Argumentación sis.
6 MA477 Estadística
En Finanzas: Los analistas financieros emplean diversa información estadística como soporte para sus
recomendaciones de inversión.
En Economía: Los economistas hacen predicciones sobre el futuro de la economía, como el índice de
precios al consumidor, la tasa de desempleo o la utilización de la capacidad de producción.
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, or-
ganizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.
Recopilar datos Organizar datos Presentar datos Analizar datos Tomar decisiones
Estadística
Descriptiva Inferencial
Estadística descriptiva
Son métodos asociados a la caracterización, resumen y presentación de da-
tos, que permiten describirlos apropiadamente. Comprende el uso de gráfi-
cos, tablas e indicadores de resumen obtenidos al realizar algunos cálculos.
Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más característi-
cas de una población o tomar decisiones referentes a una población, basa-
dos en los resultados obtenidos del estudio de muestras elegidas adecua- Flash
damente. Electora
Estas conclusiones no tienen que ser totalmente válidas, pueden tener
l
cierto margen de error, por eso se dan con una medida de confiabilidad o
probabilidad.
MA477 Estadística 7
Ejercicio 1
¿Qué parte de la Estadística ha sido usada para realizar la siguiente infografía?
Descriptiva
Fuente: http://larepublica.pe/politica/1283221-encuesta-gfk-piden-martin-vizcarra-luche-corrupcion
Ejercicio 2
¿Qué parte de la Estadística ha sido usada para realizar el siguiente gráfico?
Inferencial
8 MA477 Estadística
1.3. Definiciones
Muestra
Muestra es un subconjunto de la población.
Será representativa si se parece a la población de la que proviene.
Ejemplo 1.
La Secretaría Académica de una universidad está interesada en realizar un estudio sobre los motivos
por los cuales algunos alumnos del pregrado han decidido dar exámenes de recuperación ese ciclo.
La universidad cuenta con quince facultades y un total de 7 500 alumnos, de los cuales 830 han deci -
dido rendir exámenes de recuperación ese ciclo. De la población se va a entrevistar a una muestra
aleatoria de 200 alumnos. Defina la población y la muestra.
Solución
Ejercicio 3
En Lima, se quiere estimar el porcentaje de trabajadores que están afiliados a la AFP Vida Eterna y
que han decidido cambiar a otra AFP. Indique la población y la muestra.
1.3.2. Datos
Los datos son los hechos y los números que se recogen, analizan y resumen para su presentación e
interpretación.
Elementos (unidades
Observación
elementales) Variables
es el conjunto de
son las entidades acerca son las características de
mediciones obtenido de
de las cuales se reúnen interés de los elementos
un elemento particular
los datos
Ejemplo 2.
Ejercicio 4
En el Censo Nacional de Población y Vivienda 2017 se le preguntó a los jefes o jefas de hogar:
tipo de vivienda (vivienda particular, vivienda colectiva),
condición de ocupación de la vivienda (ocupada, desocupada)
material predominante en las paredes exteriores (ladrillo, piedra, adobe, quincha, etc.).
Ejercicio 5
En el I Censo Nacional de Investigación y Desarrollo en Centros de Investigación del año 2016 se le
preguntó a los encargados de las instituciones.
sector Institucional al que pertenece la institución (Instituto público de investigación, educación
superior, institución privada sin fines de lucro, etc.).
tipo de organización jurídica de la institución (Sociedad de sociedad de responsabilidad limitada,
sociedad anónima cerrada, sociedad colectiva, etc.)
régimen de propiedad (Privada nacional, privada extranjera, estatal)
Variable Variable
cualitativa cuantitativa
Variable discreta
Tiene un número finito o infinito
numerable de posibles valores; es decir,
que en un intervalo solo puede tomar
ciertos valores.
Variable continua
Tiene un número infinito no numerable de
posibles valores; es decir, que en un
intervalo puede tomar cualquier valor.
Ejercicio 6
Se registran las siguientes variables del gerente general de una empresa. Indique el tipo de cada va-
riable:
Número de teléfono
Nacionalidad de un inversionista
MA477 Estadística 11
Ejemplo 3.
Se puede resumir lo anterior en la siguiente tabla, donde se presenta la relación entre los tipos de va -
riables y las escalas de medición:
Variable
Ejemplo 4.
Ejercicio 7
Ejemplo 5.
En un estudio entre alumnos de la UPC, se tomó una muestra aleatoria de 300 alumnos, indique dos
posibles parámetros y dos posibles estadísticos.
Ejercicio 8
Según el II Censo Nacional Económico 2008 ejecutados por el INEI, 48 mil contribuyentes pertenecen
al régimen de Sociedad Comercial Responsabilidad Limitada . Indique si este es un parámetro o un es-
timador.
Ejercicio 9
La encuesta nacional urbano-rural de El Comercio - Ipsos de abril del 2018 muestra que la corrupción
es el principal problema del país en la actualidad: un 57% de entrevistados lo considera así. La delin-
cuencia y la falta de seguridad se ubican en segundo lugar, le siguen una educación inadecuada con y
el desempleo y la falta de trabajo. Indique si este valor es un parámetro o un estimador.
14 MA477 Estadística
Ejercicio 10
Caso: Empresa DGS S.A.
Sin embargo, últimamente la empresa está presentando retrasos en la ejecución de los trabajos,
tiempo que es contabilizado desde la recepción del trabajo hasta la entrega por parte de la empresa
al cliente.
El ingeniero de planta de la empresa desea realizar un análisis de las causas que ocasionan estos re-
trasos en los trabajos, la zona donde ocurren mayormente estas incidencias, las horas de trabajo que
involucran cada una de las tareas, el costo del material, entre otras variables, para lo cual registra la
información necesaria. Se obtuvo la siguiente base de datos:
Cod Zona Tipo de Área de Forma de Demora Número de Costo Horas de Días de Costo del Costo
servicio servicio pago personal material servicio retraso servicio total
1 Norte Asesoría Mecánica Contado Falta de 2 204,3 60 49 120 324,3
personal
2 Norest Instalación Electrónica Crédito a Certificado en 1 689.2 60 41 1200 1889.2
e 90 días trámite
3 Este Asesoría Neumática Contado Reprogramaci 1 21,2 6 35 120 141,2
ón
4 Este Mantenimie Mecánica Contado Movilidad en 1 30,0 6 21 60 90,0
nto reparación
5 Este Reemplazo Mecánica Contado Falta de stock 1 57,1 12 21 240 297,1
de equipos
… …
Dos ejemplos de gráficos que muestran una serie de tiempo son los siguientes:
Fuente: http://estadisticas.bcrp.gob.pe
Los siguientes sitios web son ejemplos de instituciones donde conseguir datos de fuente secundaria:
Fuentes públicas: Bases de datos de ministerios y de oficinas gubernamentales de estadística, como
por ejemplo.
Instituto Nacional de Estadística e Informática www.inei.gob.pe
Banco Central de Reserva del Perú www.bcrp.gob.pe/
Ministerio de Salud del Perú www.minsa.gob.pe
Ministerio de Trabajo www.mintra.org.pe
Ministerio de Educación www.minedu.org.pe
FAO. ONU para la Agricultura y Alimentación www.fao.org/corp/statistics/es/
Fuentes privadas: Bases de datos de las empresas, bases de datos que se compran a empresas de es-
tudios de mercado, bases de datos en Internet, como por ejemplo.
Datum Perú www.datum.com.pe/
Ipsos Apoyo. Opinión y Mercado www.ipsos-apoyo.com.pe/
Imasen www.imasenperu.com/
CPI www.cpi.com.pe/
Gallup www.gallup.com
Ejercicios propuestos
18 MA477 Estadística
1. Se quiere estimar el porcentaje de medianas empresas. que desean invertir en la Bolsa de Valores
de Lima. Indique el elemento, la variable y una posible observación.
4. En una investigación en el Perú, defina la población, muestra, elemento y variables si se desea de-
terminar el promedio de la edad de las mujeres en edad fértil que usan métodos anticonceptivos.
El INEI considera a la edad fértil en las mujeres desde los 15 hasta los 49 años. Indique la pobla -
ción, la muestra, el elemento y una variable.
6. Según un estudio realizado por la BBVA Research en las primeras seis semanas del 2013, las inver-
siones privadas peruanas crecieron en un 12,5% respecto al año anterior, por las buenas condicio-
nes de financiamiento en el exterior y la confianza empresarial. El análisis detalla que las corpora-
ciones locales (financieras y no financieras) encontraron buenas condiciones de financiamiento en
mercados externos y ya emitieron bonos por US$ 1,300 millones, en promedio, en lo que va del
año. Indique los estadísticos nombrados y sus respectivos valores en el texto anterior. ¿Por qué
los encargados del estudio calcularon estadísticos y no parámetros?
MA477 Estadística 19
f1
f2
… … … …
fk
Total
Fuente
Se tiene que:
Frecuencia acumulada
porcentual (Pi) es el porcentaje de elementos que pertenecen hasta esa clase .
Se tiene que:
MA477 Estadística 21
22 MA477 Estadística
Categoría 1 f1
Categoría 2 f2
… … …
Categoría k fk
Total
Fuente: ………………………………………..
Ejercicio 11
Según el informe “Perfil del Turista Extranjero 2016” realizado por Turismo in, un servicio de
PromPerú, se tiene la siguiente tabla:
Solución
Ejercicio 12
En los Censos Nacionales 2007 ejecutados por el INEI se preguntó a todos los peruanos el idioma o
lengua con el que aprendió hablar, obteniéndose los siguientes resultados:
Título:
Idioma o lengua con que aprendió a hablar Frecuencia absoluta fi Frecuencia porcentual pi
Castellano 21 713 165 84,13%
Quechua 3 360 331 13,02%
Aymará 443 248 1,72%
Otra lengua nativa 174 410 0,68%
Asháninka 67 724 0,26%
Es sordomudo 30 019 0,12%
Idioma extranjero 21 434 0,07%
Total 25 810 331 100%
Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda
Ejercicio 13
Caso: Empresa DGS S.A.
Si el porcentaje de trabajos de la zona Norte supera al 40%, se contratará más personal. Organice la
siguiente información y proponga la decisión.
Norte Norte Este Este Este Este Este Norte Este Sur Sur Norte Norte Norte Este
Este Sur Sur Norte Sur Sur Este Sur Sur Norte Norte Norte Sur Norte Sur
Norte Este Sur Sur Norte Norte Norte Este Norte Sur Sur Este Sur Este Sur
Solución
Título: ………………………………………………………………………………………………………………………………………………………………….
Frecuencia absoluta fi Frecuencia relativa hi
Norte
Sur
Este
Fuente: ……………………………………………………………………..
24 MA477 Estadística
En los ejes, siempre se debe Las fuentes de donde se obtuvieron los datos
El título del gráfico indicar explícitamente las que permitieron su construcción, así como
siempre debe ser variables que se está quiénes o qué entidad elaboró el diagrama y
indicado. representando y las cualquier otra información se debe indicar
respectivas unidades. siempre que sea relevante.
Ejercicio 14
Observe el siguiente gráfico e indique un posible error:
Ejercicio 15
Observe los dos gráficos siguientes e indique la posible diferencia de interpretación entre ambos.
MA477 Estadística 25
Ejemplo 6.
Un ejemplo de gráficos de barras y circular lo tenemos en el informe de la Primera Encuesta Virtual
para Personas LGBTI (Lesbianas, Gays, Bisexuales, Transexuales e Intersexuales) del 2017 realizado
por el INEI. Cabe señalar que la encuesta tiene un “carácter exploratorio, no probabilístico”, por
cuanto no se disponía de información sobre este grupo de población para realizar un diseño muestral
probabilístico. Por ello, los resultados de este estudio no necesariamente son representativos de la
población total LGBTI.
26 MA477 Estadística
Ejemplo 7.
La universidad A realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad
de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continuación:
Derecho Periodismo Ingeniería Administración
Ingeniería Deporte Gastronomía Ingeniería
Periodismo Ingeniería Periodismo Gastronomía
Administración Gastronomía Deporte Administración
Derecho Gastronomía Ingeniería Derecho
Ingeniería Ingeniería Gastronomía Gastronomía
Administración Deporte Ingeniería Periodismo
Derecho Administración
Interpretación
Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y
solo el 10% prefiere la carrera de Deporte.
MA477 Estadística 27
Ejercicio 16
Se aplicó una encuesta a una muestra de 30 empleados de la empresa Motores A. Se preguntó por la
función que desempeñaba. Los datos se presentan a continuación:
Obrero Profesional Técnico Servicios Obrero Obrero Obrero Obrero
Profesional Producción Técnico Producción Obrero Producción Obrero Obrero
Obrero Técnico Profesional Obrero Técnico Producción Profesional
Obrero Producción Técnico Profesional Servicios Obrero Profesional
Fuente: ……………………………….………..
Interpretación
28 MA477 Estadística
Ejemplo 8.
El área de Recursos Humanos de una empresa de servicios desea analizar la relación de los trabajado-
res con la gerencia. Después de aplicar una encuesta se obtuvieron los siguientes resultados:
Distribución de trabajadores según su función y relación con la gerencia
Relación con la gerencia
Función Buena Regular Mala Total general
Apoyo/adm. 18 2 0 20
Obrero 10 29 20 59
Profesional 11 6 0 17
Técnico/ventas 19 7 0 26
Total general 58 44 20 122
Fuente: Área de Recursos Humanos.
Solución
Para interpretar los valores de una tabla absoluta cruzada hay que tener en cuenta si el valor que se
va a interpretar corresponde a un total de fila, a un total de columna o al valor de una celda.
Si deseamos interpretar el valor de una celda hay que tener presente que la celda tiene tres interpre -
taciones dado que existen tres totales, con respecto a su total de fila, con respecto a su total de co-
lumna y con respecto al gran total. Para ilustrarlo, tomaremos como ejemplo la tabla anterior.
Interpretación
• Total de fila: valor 59 → De un total de 122 trabajadores. 59 son obreros.
• Total de columna: valor 58 → De un total de 122 trabajadores. 58 manifiestan tener una buena
relación con la gerencia.
• Valor de celda: 10
Con respecto al gran total. De un total de 122 trabajadores. 10 son obreros y manifestaron tener
una buena relación con la gerencia.
Con respecto al total de su fila. De un total de 59 obreros. 10 manifestaron tener una buena rela -
ción con la gerencia.
Con respecto al total de su columna. De un total de 58 trabajadores que manifestaron tener una
buena relación con la gerencia. 10 son obreros.
MA477 Estadística 29
Interpretación
Del total de trabajadores.
- el 48.4% son obreros
- el 47.5% manifestaron tener una buena relación con la gerencia.
- el 23.8% son obreros y manifestaron tener una regular relación con la gerencia.
Interpretación
Del total de obreros. el 49.2% tiene una regular relación con la gerencia.
Distribución porcentual de trabajadores según función por tipo de relación con la gerencia
Relación con la gerencia Total
Función Buena Regular Mala general
Apoyo/adm. 31.0% 4.6% 0.0% 16.4%
Obrero 17.2% 65.9% 100.0% 48.4%
Profesional 19.0% 13.6% 0.0% 13.9%
Técnico/ventas 32.8% 15.9% 0.0% 21.3%
Total general 100.0% 100.0% 100.0% 100.0%
Fuente: Área de Recursos Humanos
Interpretación
Del total de trabajadores que tienen una relación regular con la gerencia. el 65.9% son obreros.
30 MA477 Estadística
20%
16.4%
15.6%
14.8%
15%
Buena
Regular
10%
8.2%
9.0% Mala
5.7%
4.9%
5%
1.6%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas
Fu en te: Área d e Recursos Hu m an os Función
Porcentaje de trabajadores
Distribución porcentual de trabajadores según función y relación con la gerencia
50%
45%
40% 16.4%
Mala
35%
30% Regular
25% Buena
20% 23.8% 5.7%
15% 1.6%
4.9%
10%
14.8% 15.6%
5% 8.2% 9.0%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas
90%
26.9%
80% 33.9% 35.3%
70%
60%
Mala
50%
90.0% Regular
40% 49.2% Buena
73.1%
30% 64.7%
20%
10% 16.9%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas
90%
80% 32.8%
13.6%
70%
60% Técnico/ventas
19.0%
50% 100.0% Profesional
Obrero
40% 17.2%
65.9% Apoyo/adm.
30%
20%
31.0%
10%
4.5%
0%
Buena Regular Mala
Ejercicio 17
En el II Censo Nacional Universitario del año 2010 realizado por el INEI se preguntó a los alumnos de
todo el Perú por su tipo de universidad y su género. Los datos se muestran en los siguientes cuadros.
Tabla 1. Perú. Alumnos censados en pregrado por género y tipo de universidad. 2010
Género Pública Privada Total
Mujer 135 082 247 743 382 825
Hombre 174 093 226 052 400 145
Total 309 175 473 795 782 970
Fuente: INEI. Censo Universitario. 2010
b. Elabore un gráfico comparativo que permita ver la composición porcentual por género y tipo de
universidad.
Título ……………………………………………………………………………………………….……………………..……………….
Título …………………………………………………………………………………….……………………..………………………….
c. Elabore un gráfico comparativo que permita ver la composición porcentual por género según
tipo de universidad.
Título …………………………………………………………………………………….……………………..………………………….
Género Pública Privada Total
Mujer 35.29% 64.71% 100.00%
Hombre 43.51% 56.49% 100.00%
Fuente: INEI. Censo Universitario. 2010
d. Elabore un gráfico apilado al 100% que permita ver la composición porcentual por tipo de uni-
versidad según género.
Título …………………………………………………………………………………………………………..………………………….
Género Pública Privada
Mujer 43.69% 52.29%
Hombre 56.31% 47.71%
Total 100.00% 100.00%
Fuente: INEI. Censo Universitario. 2010
Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la variable el
número de elementos (frecuencia) que la componen.
x1 f1
x2 f2
… … … … …
xk fk
Total
Fuente:
Ejercicio 18
Caso: Empresa DGS S.A.
Se afirma que el más del 60% de trabajos que realiza la empresa cuenta por lo menos con 2 trabaja -
dores. ¿Es cierto esto? Tome en cuenta los siguientes datos correspondientes al número de trabaja -
dores involucrados en los trabajos.
3 3 4 4 3 2 1 4 3 3 3 4 3 3 3
1 2 4 2 4 3 2 2 3 1 2 1 4 3 2
4 3 2 2 3 1 4 3 2 1 4 3 2 1 4
Solución
Total
Fuente: Empresa DGS S.A.
Ejercicio 19
Ejercicio 20
Los siguientes datos corresponden a una encuesta realizada por un grupo de estudiantes de la uni -
versidad A a una muestra de 40 aficionados al cine. Al formular la pregunta, ¿cuántas veces ha visto
su película preferida? las respuestas fueron las siguientes:
1 2 3 4 3 3 2 3 6 3 3 4 6 3 2 3 3 2 4 1
2 3 4 3 1 1 2 4 1 2 2 3 1 3 4 2 1 4 6 2
a. Presente la tabla de distribución de frecuencias.
Título: ………………………………………………………………..……………………………………………………………………………
fi hi Fi Hi
Fuente: …………………………………………………………………………………
MA477 Estadística 37
f3 = …………...
F2 = ………..…
h1 = …………..
H4 = …………..
Ejemplo 9.
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores (tra -
bajadores) de la empresa Creativa en lo que va del año.
1 2 2 0 1 1 3 2 1 1 2 0 2 1 1 1 2 2 1 1 1 2 2 1 5 2 1 0 3 1
c. Presente e interprete el gráfico de bastones de frecuencias absolutas para los siguientes datos.
Interpretación
De un total de treinta colaboradores, catorce de ellos han recibido una capacitación y solo un co -
laborador ha recibido cinco capacitaciones en lo que va del año
Es un resumen de un conjunto de datos que consiste en presentar para cada categoría el número de
elementos (frecuencia) que la componen.
Los tres pasos necesarios para definir en una distribución de frecuencias con datos cuantitativos son
los siguientes:
Cantidad de clases
Se recomienda usar entre 5 y 20 clases, inclusive.
La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas que
varias contendrían unos cuantos elementos.
Para determinar el número de clases se usa la regla de Sturges: k=1+3,322 log n. Si la estimación
tiene decimales, se toma el entero más próximo.
MA477 Estadística 39
Recordar lo siguiente:
La regla de Sturges no se usa para hallar la cantidad de datos. Es decir:
Ejemplo 10.
El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. La tabla muestra los pagos de impuestos, en soles, en el 2017 de 48
viviendas elegidas al azar.
145.1 216.3 252.5 303.6 196.9 234.8 265.2 317.2 206.5 242.9 289.1 331.7
151.0 225.9 257.1 305.8 202.6 238.4 271.0 320.2 208.0 244.0 291.0 344.6
159.0 227.1 259.2 315.4 204.9 239.9 286.7 324.8 208.0 247.7 291.9 346.7
195.6 231.2 262.5 315.5 206.1 241.1 288.1 331.1 209.3 249.5 294.5 351.1
Elabore la tabla de frecuencias para la variable: pago por impuestos municipales año 2012.
Solución
El rango r se calcula con:
r = valor máximo – valor mínimo = 351,1 – 145. 1 = 206
Ejercicio 21
El índice de endeudamiento mide la proporción de los activos totales que financian los acreedores de
la empresa. Cuando mayor es el índice mayor es el monto del dinero de otras personas que se usa
para generar utilidades. Con la finalidad de describir el comportamiento de este índice en un grupo
de empresas se seleccionó una muestra de 45 medianas empresas.
0.05 0.08 0.08 0.11 0.13 0.17 0.18 0.20 0.23 0.23 0.26 0.26 0.30 0.33 0.34
0.35 0.36 0.36 0.48 0.48 0.5 0.50 0.52 0.52 0.56 0.59 0.65 0.66 0.68 0.80
0.90 1.00 1.02 1.04 1.05 1.13 1.15 1.18 1.20 1.22 1.23 1.24 1.27 1.38 1.71
Fuente: ……………………………………………
f4 =
F4 =
H4 =
h2 =
MA477 Estadística 41
2.10.1. Histograma
Un histograma es una representación gráfica de una variable en forma de barras, donde la altura de
cada barra es proporcional a la frecuencia de los valores representados.
Se traza colocando la variable sobre el eje horizontal y las frecuencias sobre el eje vertical.
Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase
sobre el eje horizontal y cuya altura es proporcional a la frecuencia correspondiente (absoluta,
relativa o porcentual).
Los rectángulos adyacentes se tocan entre sí.
2.11.1. Ojiva
La ojiva es la gráfica de una distribución acumulada de frecuencias.
Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de
cada intervalo y la frecuencia acumulada respectiva.
La ojiva usa los límites de los intervalos y no las marcas de clase.
Con la ojiva se puede estimar fácilmente el número o porcentaje de observaciones que corres -
ponden a un intervalo determinado.
60%
50% 57.62%
40%
30%
20%
19.82%
10%
0%
0 4 8 12 16 20
Número de años
Fuente: Empresa A. Gerencia de RRHH
Ejemplo 11.
La gerencia de una compañía, que brinda servicios de llamadas por celulares, está preocupada por el
poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de admi-
nistración que eligiera, del mes de enero, una muestra de clientes de Lima y registró el monto que
costaron sus llamadas, en soles.
25 45 0,3750 79
23 0,8500
0,1000 0,9500
120
Total 1
Fuente: Área de Administración
MA477 Estadística 43
Interpretación
A partir del gráfico podemos observar que el 37,5% de los clientes de Lima tienen montos superiores
a 20 y como máximo de 30 soles y que solo el 5% de estos clientes tienen montos superiores a 50 y
como máximo de 60 soles.
Ejercicio 22
En economía, la prima de riesgo es el sobreprecio que paga un país para financiarse en los mercados
en comparación con otros países. De esta forma, cuanto mayor es el riesgo país, más alta será su pri -
ma de riesgo. Significa la confianza de los inversores en la solidez de una economía. La prima de ries-
go de los países de la Unión Europea se calcula respecto de Alemania porque se supone que su deu -
da pública es la que tiene menor riesgo de impago. Para el caso de España, la agencia de calificación
de riesgos A ha medido la prima de riesgo durante 50 días desde junio del 2018.
Distribución de días según prima de riesgo. España junio y julio del 2018
Prima de ries-
Marca de clase fi hi Fi Hi
go
[ 92 ; ] 1 0,0200
] ; ] 95 3 0,0600
] ; ] 0,2200 15 0,3000
] ; ] 29 0,5800
] ; ] 41 0,8200
] ; ] 0,1200 47 0,9400
] ; ] 50
Fuente: Agencia de Calificación de Riesgos A.
12
10
8
Axis Title
0
Axis Title
44 MA477 Estadística
12
10
8
Axis Title
0
Axis Title
c. Grafique la ojiva de frecuencias porcentuales y determine si el 58% de los días la prima de riesgo
llegó, como máximo, a 483.
12
10
8
Axis Title
0
Axis Title
2.11.2. Distribuciones de frecuencias de dos o más grupos de datos con intervalos comunes
La idea básica para distribuciones de frecuencias de dos o más grupos de datos es tener intervalos
comunes, es decir, que los límites de los intervalos para ambas distribuciones sean iguales. Para ello,
debemos seguir los siguientes pasos:
Hallar el mínimo de todos los datos y el máximo de todos los grupos de datos. y usarlos para cal -
cular el rango.
Calcular el número de categorías. el número de datos es el máximo número de datos de cada
grupo. Tener en cuenta que no es la suma de ambos tamaños muestrales.
Siguiendo la regla de Sturges. el número de intervalos es:
Ejemplo 12.
La empresa de investigación de mercado “Eléctrico” lleva a cabo un estudio para obtener indicadores
que le permitan inferir respecto al consumo de energía eléctrica mensual (medido en kilovatios. re -
MA477 Estadística 45
dondeado al entero más próximo) de las familias en los departamentos de Arequipa y Tacna. Dicho
estudio, sustentado en el análisis de muestras aleatorias tomadas en ambos departamentos, arrojó
los siguientes resultados:
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
Arequipa
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666
217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424 426 429
Tacna
438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636
Usando la regla de Sturges, calcule los intervalos comunes y marcas de clase de una tabla de distribu-
ción de frecuencias que permita comparar los datos.
Solución
Calculamos el mínimo de todos los datos (217) y el máximo de todos los datos (666) de ambas
ciudades. y usarlos para calcular el rango.
Calculamos el número de categorías, el número de datos es el máximo número de datos (40) en -
tre ambas ciudades. Tener en cuenta que no es la suma de ambos tamaños muestrales.
(Redondeo simple)
Tabla 2. Intervalos comunes y marcas de clase de consumo eléctrico mensual para Arequipa y Tacna
Consumo de energía Marca de clase
217 ; 292 254,5
292 ; 367 329,5
367 ; 442 404,5
442 ; 517 479,5
517 ; 592 554,5
592 ; 667 629,5
Ejercicio 23
Un grupo de alumnos del curso de Estadística seleccionó ratios de liquidez de las empresas del sector
mineras y servicios, con la finalidad de poder comparar y decidir qué sector tiene mayor liquidez en
el ejercicio 2017. Con este fin se extraen dos muestras aleatorias. La primera de 30 empresas y la se -
gunda de 25 empresas. Se muestra la liquidez del ejercicio 2017 para las empresas seleccionadas.
Ejercicios propuestos
9. El siguiente gráfico muestra la evolución de la inflación desde el año 1980 al 2013. Indique si el
índice de precios al consumidor IPC que obtiene el INEI es un parámetro o un estadístico.
10. Se tomó una muestra de 80 empresas y se registró el rubro de la empresa. Los resultados se
muestran en la siguiente tabla:
Servicios Mineras Seguros Seguros Seguros Mineras Servicios Mineras Producción Servicios
Mineras Servicios Servicios Servicios Servicios Servicios Mineras Mineras Mineras Mineras
Producción Mineras Mineras Mineras Seguros Mineras Otros Producción Producción Producción
Producción Producción Servicios Servicios Seguros Servicios Mineras Seguros Mineras Mineras
Mineras Seguros Producción Servicios Producción Mineras Producción Seguros Mineras Seguros
Servicios Mineras Mineras Mineras Servicios Servicios Servicios Mineras Mineras Servicios
Producción Producción Servicios Mineras Mineras Mineras Servicios Mineras Mineras Producción
Mineras Servicios Mineras Otros Otros Servicios Mineras Otros Seguros Mineras
11. La empresa A programa diversos cursos de capacitación a sus trabajadores. Los siguientes
datos muestran el número de capacitaciones que 48 trabajadores han recibido en el presente
año.
4 3 2 2 1 3 2 4 1 6 3 1 3 1 3 2 1 2 1 1 1 6 2 3
1 1 1 1 4 2 2 4 1 2 2 2 1 3 1 2 2 1 2 2 1 2 1 2
12. En el IV Censo Nacional Económico 2008 realizado por el INEI, se preguntó la clase de
organización jurídica de los establecimientos censados. Los resultados se muestran en la si-
guiente tabla:
Tabla 3. ………………………………………………………………………………………………
Clase de organización fi hi
Sociedades 79 833 0.0849
Individuales 853 431 0.9076
Otra clase de organización 7 072 0.0075
Total 940 336
13. Se ha tomado un examen y registrado el tiempo empleado en terminarlo. Indique si son verda-
deras o falsas las siguientes afirmaciones con respecto al gráfico siguiente:
80 80
Frecuencia acumulada
70
72
60
50
40 40
30
30
20
10
0
0 20 40 60 80 100
Tiempo (en minutos)
Fuente: Calidad Educativa Universidad A
14. La empresa auditora A está organizando la información relacionada a las empresas con las que
trabaja. El siguiente cuadro corresponde al sector al que pertenecen estás empresas:
Sector fi hi hi %
Agricultura 100
Minas 0.375
Pesca 12.5%
Servicios 80
Otros 20
Total 400 1
15. Complete la siguiente tabla de distribución de frecuencias que representa el número de fallas
en libros contables encontrados en una muestra de 100 libros de los archivos de un contador.
16. A continuación. se presenta la información del número de veces que una muestra de clientes
elegidos al azar del banco América presentaron solicitudes de préstamo.
17. Los directivos de la empresa A solicitaron a los gerentes de cada una de sus dos locales de ven -
tas. A y B. que informen sobre los sueldos de todos sus trabajadores correspondientes al mes
de marzo del año en curso. La información proporcionada (en soles) por el gerente del local A
se muestra a continuación.
i Sueldos fi
1 [ 1 000 – 2 000 2
2 2 000 – 3 000 3
3 3 000 – 4 000 14
4 4 000 – 5 000 15
5 5 000 – 6 000 5
50 MA477 Estadística
6 6 000 – 7 000] 1
a. Complete la tabla anterior con la frecuencia relativa y las frecuencias acumuladas, absolu-
tas y relativas. Ponga títulos y fuente.
b. Interprete los valores de f3 , h4 y H2.
c. Los siguientes datos corresponden a los sueldos (en soles) del local B. Construya la tabla de
distribución de frecuencias usando la regla de Sturges.
58.7 99.3 118.1 173.3 177.5 205.3 206.2 206.3 222.9 224.4 602.7 505.7
242.9 245.7 260.9 262.0 265.9 272.9 273.2 274.0 275.9 295.0 544.8 503.3
299.8 319.7 319.9 324.5 328.1 330.0 332.3 338.9 342.1 364.1 522.2 501.2
372.3 373.0 381.3 393.8 394.5 419.2 432.4 435.0 436.1 441.6 518.8 463.3
18. Los datos corresponden a los ingresos, en cientos de soles, de una muestra de 60 clientes del
banco A.
5.25 7.22 8.53 9.27 9.54 10.21 10.32 10.45 10.52 10.76
10.85 11.25 11.56 12.42 13.27 14.65 15.72 16.85 17.22 18.56
19.32 20.56 21.72 22.85 23.12 24.32 25.65 26.72 28.72 29.65
31.42 32.71 33.55 34.28 35.21 37.45 38.32 39.65 41.22 43.28
45.72 47.32 49.45 51.27 52.38 54.75 55.81 56.27 57.45 58.22
59.32 61.45 63.75 65.72 66.85 69.32 69.54 72.30 75.81 77.42
19. Sean las siguientes cantidades, las calificaciones en un curso de Estadística en el que se han
evaluado a 56 personas, siendo la escala de evaluación de 0 a 100.
58 89 73 59 87 63 43 59 64 74 63 63 82 95
73 81 44 69 30 38 75 66 76 84 72 82 59 75
63 72 52 55 75 43 48 52 77 68 47 53 36 65
67 61 87 39 62 75 69 53 79 95 50 38 70 84
20. En una tabla de distribución de frecuencias simétrica con siete intervalos de clases de igual lon-
gitud, se conocen los datos siguientes:
w = 10 f1 = 8 f2 + f5 = 62 h3 = 0.21 H6 = 0.96
21. La siguiente tabla corresponde a la distribución de frecuencias de los salarios, en soles, del últi-
mo mes de los empleados de la empresa A. Complete la tabla:
Distribución de trabajadores según salarios. en soles. del último mes
Marca de cla-
Salario fi hi Fi Hi
se
1200 1600 120
1800 300 0.42
780
150
MA477 Estadística 51
23. En los X Censos Nacionales de Población y V de Vivienda de año 2007 se preguntó por el tipo
de alumbrado de la vivienda según área (urbana o rural).
24. La siguiente tabla muestra el total de productos con quiebre de stock por sección y por motivo
del quiebre en el supermercado A.
26. La Superintendencia de Banca y Seguros SBS registra en su boletín del mes de marzo de 2017,
el número de tarjetas de crédito por tipo de crédito y entidad financiera a diciembre de 2016.
Distribución de tarjetas de crédito según empresa bancaria y tipo de crédito. Diciembre 2016
Créditos Créditos a Créditos a Créditos a Créditos a
Créditos de
Empresas corporati- grandes mediana pequeñas microem- Total
consumo
vos empresas empresas empresas presas
Banco Continental 515 879 84 625 6 992 13 075 3 555 540 210
Banco de Comercio 1 725 77 2 23 12 10 1 849
Banco de Crédito del Perú
1 020 895 1 090 2 291 11 177 73 310 34 460 1 143 223
(con sucursales en el exterior)
Banco Financiero 152 003 2 63 328 324 847 153 567
B. Interamericano de Finanzas 25 946 124 209 1 578 1 060 515 29 432
Scotiabank Perú (con sucursa-
261 345 139 426 1 947 745 840 265 442
les en el exterior)
Citibank 135 590 - 27 - - 4 135 621
Interbank (con sucursales en
1 037 099 22 53 137 35 71 1 037 417
el exterior)
Mibanco 7 187 - - - - - 7.187
HSBC Bank Perú 36 640 - - - - - 36 640
Banco Falabella Perú 1 357 665 - - 1 - - 1 357 666
Banco Ripley 1 012 328 1 - - - - 1 012 329
Banco Azteca Perú 60 376 - - - - - 60 376
Banco Cencosud 61 679 - - - - - 61 679
Total banca múltiple 5 686 357 1 539 3 696 22 183 88 561 40 302 5 842 638
Fuente: SBS http://www.sbs.gob.pe/app/stats/EstadisticaBoletinEstadistico.asp 2017
Caso: El Metropolitano
El Metropolitano es el sistema integrado de transporte público para Lima, que cuenta con buses de
gran capacidad que circulan por corredores exclusivos, bajo el esquema de autobuses de tránsito rá -
pido BRT (Bus Rapid Transit en inglés). El primer corredor del Metropolitano conecta Lima Sur con
Lima Norte, recorriendo 16 distritos desde Chorrillos hasta Independencia.
El objetivo de este sistema es elevar la calidad de vida de los ciudadanos, al ahorrarles tiempo en el
traslado diario, proteger el medio ambiente, brindarles mayor seguridad, una mejor calidad de servi-
cio y trato más humano, especialmente a las personas de la tercera edad y con discapacidad. Una en-
trevista realizada al alcalde de Lima. Luís Castañeda, reveló lo siguientes resultados de todos los re-
gistros de la base de datos:
Frente a los reclamos de los usuarios del Metropolitano. Pro Transporte, organismo regulador del sis -
tema de transportes, ha solicitado un estudio para identificar los principales problemas y actuar con
estrategias inmediatas para mejorar el servicio analizando las siguientes variables:
Estación (Angamos. Javier Prado y Canaval y Moreyra)
Tiempo de viaje (en minutos)
Tiempo de espera (en minutos)
Ruta (A. B. Expreso 2 y Expreso 5)
Llegó tarde al lugar de destino (Sí. No)
Opinión sobre el servicio (bueno. muy bueno. malo. muy malo y regular)
Principal problema que tiene al viajar en el Metropolitano (Buses muy llenos. colas muy largas en
los horarios puntas. etc.)
Número de días que usó el servicio la semana anterior.
Uno de los usuarios comentó que la ruta que utiliza es el expreso 5, lo espera ocho minutos en la es -
tación de Angamos, no llega tarde a su destino y considera que el servicio es bueno.
27. En base a la entrevista al alcalde de Lima. Luís Castañeda. complete la siguiente tabla:
La consultora SY Data, ganó la propuesta para realizar el estudio. Por ello tomó una muestra
aleatoria de 120 usuarios de las estaciones Javier Prado. Angamos y Canaval y Moreyra del Me-
tropolitano.
30. Objetivo específico: Determinar la opinión más frecuente respecto al servicio del sistema de
transporte metropolitano.
Si la consultora SY Data, llega a demostrar que el porcentaje total de los usuarios que opinan
que el sistema de transporte del Metropolitano es malo o muy malo supera al 10%, entonces
Pro Transporte deberá analizar cuáles son las principales quejas de los usuarios del Metropoli -
tano. A continuación, se muestra la opinión que tiene el usuario sobre el servicio.
Realice la tabla de frecuencia y utilice el gráfico de barra que le permita a Pro Transporte iden -
tificar si deberá realizar el análisis de las principales quejas de los usuarios del Metropolitano.
31. Objetivo específico: Determinar la ruta más frecuente que usan los usuarios del Metropoli-
tano.
Pro Transporte deberá proponer incorporar un bus cuya ruta tenga el mayor porcentaje de
clientes. Realice la tabla de frecuencia y utilice un gráfico circular que permita a Pro Transporte
realizar dicha propuesta. A continuación, se muestra una muestra de rutas.
32. Objetivo específico: Determinar el número de días a la semana más frecuente que usó un
usuario del Metropolitano en la semana anterior entre las 6:00 y 6:30 pm.
Ante la queja de los usuarios que indican buses muy llenos, el gerente de operaciones del Me -
tropolitano programará el número de buses vacíos que debe enviar a los paraderos en el hora -
rio de 6:00 y 6:30 pm para la siguiente semana, para ello evaluará el número de veces que un
usuario utilizó el servicio en este horario en la semana anterior. Si registra que más del 60% de
los usuarios usó el servicio la semana anterior mínimo cuatro veces en el horario de 6:00 y 6:30
pm, enviará a la estación tres buses vacíos entre las 6:00 y 6:30 pm. Usando el gráfico 1 que
muestra los resultados de una muestra de 40 usuarios de la estación de Javier Prado y el cua-
dro 3 con información de la estación de Angamos, ¿en qué estación el gerente debe proponer
el envío de tres buses vacíos en el horario de 6:00 y 6:30 pm?
Variable hi
1 0.01
2 0.09
3 0.35
4 0.34
5 0.21
33. Objetivo específico: Determinar el intervalo de tiempo de espera más frecuente de los usua-
rios de la ruta B del Metropolitano.
Pro Transporte ha establecido que la concesionaria para justificar un posible incremento en la
tarifa, debe implementar mejoras en el servicio para reducir el tiempo de espera de un usuario
que actualmente se sitúa entre los 15 y 20 minutos en el horario de mayor demanda, una de
56 MA477 Estadística
las medidas implementadas por el concesionario es un nuevo servicio expreso. Pro Transporte
indica que si por lo menos el 90% de los usuarios espera menos de 15.7 minutos, entonces
este será un buen indicador para una posible calificación del incremento de precios.
Tiempo de espera, en minutos, de la ruta B del Metropolitano
2.1 3.8 3.8 5.4 5.6 8.0 8.5 8.8 9.0 9.2 9.4 9.5 9.8 9.9 10.0
10.1 10.2 11.0 11.0 11.2 12.3 13.1 13.2 13.3 13.4 13.5 14.3 14.8 16.9 22.4
MA477 Estadística 57
34. Usando polígonos de frecuencias comparativos, ¿se puede sugerir que un usuario del expreso
2 de la estación Angamos espera menos tiempo que un usuario de la estación de Javier Prado?
Título: ………………………………………………………………………………………………………………………………….
Marca de clase Angamos Javier Prado
Límite inferior Límite superior ´
Xi fi pi fi pi
9.25 20% 4%
14.15 25% 21%
19.05 25% 17%
23.95 20% 50%
28.85 10% 4%
33.75 0% 4%
Total 20 100% 24 100%
Fuente: ……………………………………….…………………………….
35. El concesionario del Metropolitano después de aplicar mejoras en el servicio. como ampliar
nuevas rutas. incrementar el número de buses. desea conocer si el tiempo de espera ha mejo -
rado, a partir del gráfico 2, ¿puede sugerir los resultados que ha mejorado el tiempo de espera
del servicio?
58 MA477 Estadística
a. En la distribución del tiempo de espera antes de aplicar las mejoras, determine el porcenta-
je de usuarios que demoran más de 10.7 hasta 21.2 minutos.
b. En la distribución del tiempo de espera después de aplicar las mejoras, ¿qué porcentaje de
usuarios registran un tiempo de espera menor o igual a 21.2 minutos?
c. ¿Puede sugerir los resultados que ha mejorado el servicio? Justifique su respuesta numéri-
camente.
Cacao S.A es una empresa dedicada a la fabricación de caramelos y chocolates diversos siendo una
de sus líneas la del chocolate “Choconut”; el gerente de producción ha notado, que últimamente se
están presentando una serie de problemas en el proceso productivo por lo que encarga a un equipo
especializado realizar un estudio con la finalidad de proponer soluciones.
Se selecciona una muestra de 81 trabajadores y se registra la información con respecto a una jornada
de trabajo de las siguientes variables:
Planta: Ubicación de la planta en que opera el trabajador (Callao, Los Olivos y Ate)
Turno: Turno en que se realiza la producción (Mañana, Tarde, Noche)
Género: Género del trabajador, 1: Hombre 2: Mujer
Capacitación: Si el trabajador ha tenido capacitación previa o no.
Tiempo perdido: Tiempo perdido, en minutos, por cada trabajador debido a algún accidente den -
tro del proceso de producción.
Número de barras de chocolate producidas.
Número de defectuosos: Número de barras de chocolate defectuosas produci-
das por trabajador en la última jornada de trabajo.
Principal problema: Insatisfacción por remuneraciones, alta rotación de perso-
nal. infraestructura inadecuada, falta mantenimiento de equipos, otros
Luego de procesados los datos de los trabajadores seleccionados se obtuvieron los siguientes re-
sultados:
El número promedio defectuosos es de 25.73 artículos.
El principal problema que identifican los trabajadores es la infraestructura inadecuada que repre-
senta el 48.15%.
El 22% de los trabajadores del turno tarde recibió capacitación.
39. Con el objetivo de analizar la distribución porcentual de trabajadores por turno y capacitación
previa para determinar cuál de los grupos requiere capacitación con más urgencia.
Capacitación previa
Turno Sin capacitación Con capacitación Total
Mañana 10 7 17
Noche 19 18 37
Tarde 13 14 27
Total 42 39 81
40. Con la finalidad de estudiar la distribución porcentual de los trabajadores con y sin capacita-
ción previa según el turno en que laboran, el departamento de RR.HH. elaboró el siguiente grá-
fico:
100%
90%
31.0%
35.9%
80%
70%
60%
50% TARDE
45.2%
NOCHE
40% MAÑANA
30%
20%
23.8%
10% 17.9%
0%
Sin Capacitación Con Capacitación
41. Con el objetivo de identificar en cuál planta existe un menor porcentaje de trabajadores sin ca-
pacitación se estudiará la distribución de los trabajadores según la planta donde laboran y si
tuvieron o no capacitación previa, en tal sentido el departamento de recursos humanos elabo -
ró el siguiente gráfico:
60 MA477 Estadística
Número de trabajadores
35
30
19
25
20 13
15 7 Con capacitación
10 Sin Capacitación
17
13 12
5
0
Ate Callao Los Olivos
Indique:
a. El número de trabajadores que no tienen capacitación es: ……….
b. Del total de la muestra, el número de trabajadores que son de la planta Callao y que si re -
cibieron capacitación es …………
c. Del total de trabajadores de la planta de los Olivos, el ………% tuvo capacitación previa.
d. Del total de muestra el ……….% laboran en la planta de Ate.
e. Se debe presupuestar las capacitaciones para aquella planta que tenga el porcentaje ma-
yor de trabajadores sin capacitación. ¿Cuál planta debe de elegirse?
42. Existe el problema del excesivo número de chocolates defectuosos. razón por la cual se analiza
la distribución del número de trabajadores según el número de chocolates defectuosos que
producen. en tal sentido el departamento de producción elaboró el siguiente gráfico.
28
30
23
25
18
20
15
10 7
5
5
0
10 11 12 13 14
Número de defectos
Indique:
a. Los elementos faltantes del gráfico.
b. Del total de la muestra, 28 trabajadores producen………………chocolates defectuosos.
c. Del total de la muestra, …..….. trabajadores producen entre 10 y 11 chocolates defectuosos.
d. El número de trabajadores producen de 11 a 13 artículos defectuosos es: …………………..…
e. El departamento de control de la calidad indica que cada trabajador puede generar como
máximo 12 chocolates defectuosos, sin embargo, se admite un mayor número de chocola-
tes defectuosos en algunos trabajadores con la condición de que en conjunto no supere el
20% del total de trabajadores. En caso contrario debería detenerse la producción para eva -
luar a fondo las fallas de calidad. De acuerdo al análisis de los datos: ¿La producción de cho -
colates debería detenerse?
MA477 Estadística 61
43. Otra preocupación del departamento de producción es el excesivo tiempo perdido por acci-
dentes. en tal sentido se elaboró la siguiente gráfica para estudiar la distribución del número
de trabajadores sin capacitación según el tiempo perdido por accidentes (en minutos):
16
14 14
12
11
10
6 6
5
4
4
2 2
0
21.5 26.5 31.5 36.5 41.5 46.5 51.5 56.5
44. Los siguientes datos corresponden al tiempo perdido en minutos de los trabajadores con capa-
citación. (Observe que los datos están ordenados ascendentemente por columnas)
12.0 23.3 26.0 30.0 33.6 38.2 44.2 24.0 28.2 31.2 35.6 38.1 19.0
17.1 23.4 27.0 30.0 33.8 38.2 44.7 24.0 29.2 32.6 36.0 42.0 20.3
18.0 24.0 27.5 30.0 34.1 38.6 48.0 25.0 30.0 33.6 36.8 44.0 21.2
a. Construya la tabla de distribución de frecuencias para los datos anteriores mediante el mé-
todo de Sturges.
Título: ……………………………………………………………………………………………………………………..
62 MA477 Estadística
45. Por último, se analiza la variable tiempo de demora por accidentes de los trabajadores según
género con el objetivo de identificar cual grupo, de hombres o de mujeres requiere capacita-
ción con mayor urgencia a fin de disminuir el tiempo perdido en accidentes en la línea de pro -
ducción.
49
50 45
40
Número de trabajaodres
33
30 32
30
20 16 24 Fi Hombres
16 Fi Mujeres
8
10
2 4
0 1
12 19 26 33 40 47 54
Distribución de los trabajadores según tiempo de demora por accidentes por género
Hombres Mujeres Hombres Mujeres
Tiempo de demora Marca
fi fi Fi Fi
por accidentes de clase
[ ]
] ]
] ]
] ]
] ]
] ]
Total
Fuente: Empresa Cacao S.A.
MA477 Estadística 63
Datos simples
Se denomina datos simples (datos no agrupados) a los valores que no están agrupados en distribu-
ciones de frecuencias.
Datos agrupados
Se denomina datos agrupados a los valores que están agrupados en distribuciones de frecuencias.
Ejercicio 24
Luego de una investigación se tiene muchos datos, con ellos se puede realizar algunos gráficos y
distribuciones de frecuencias, pero ¿cómo resumir la información en un solo número?
MA477 Estadística 65
Una medida de localización o de tendencia central (MTC) se refiere al valor central que representa a
los datos de una determinada variable.
Media Media
Media Mediana Moda
ponderada geométrica
3.2.1. Media
Ejemplo 13.
Según el Censo Nacional de Población 2007, la edad promedio de los peruanos es 28.4 años.
En al año 2017, el consumo medio anual per cápita de carne de pollo en Lima fue de 58 kilos,
aproximadamente. según la Asociación Peruana de Avicultura (APA).
En su informe titulado “Situación del Mercado Laboral en Lima Metropolitana”, el INEI señaló que
el ingreso promedio mensual se situó en S/. 1674.78 en los meses de diciembre, enero y febrero
del año 2018. Asimismo, detalló, que el ingreso promedio mensual de los hombres fue de S/. 1
894 (0.8% menos), mientras que el de las mujeres alcanzó los S/. 1 395 (5.4% más).
En un informe del 23 de febrero del 2013, la consultora Arellano Marketing afirma que el gasto
diario por persona en un desayuno asciende a 1.8 soles, en promedio y que, en promedio, una fa -
milia peruana está conformada por 4.5 personas.
Ejercicio 25
Los datos siguientes corresponden al margen de utilidad bruta, en porcentaje, de una muestra
aleatoria de diez empresas comerciales. Calcule e interprete la media del margen de utilidad bruta.
78.1 65.1 63.2 65.8 90.2 67.4 74.1 76.9 54.3 1.62
Media = 63.672 %
Ejercicio 26
Los datos siguientes corresponden a la cantidad de ventas diarias de una muestra aleatoria de
empresas:
Complete la tabla de distribución de frecuencias, calcule e interprete la media del número de ventas
de la muestra usando las frecuencias absolutas.
INTERPRETACIÓN.
Calcule la media del número de ventas de la muestra usando las frecuencias relativas.
Ejercicio 27
Los datos siguientes corresponden al monto de retiro diario, en dólares, de una muestra aleatoria de
clientes de un banco. Complete la distribución de frecuencias.
Calcule e interprete la media del monto de retiro diario de la muestra. Use las frecuencias absolutas.
Calcule e interprete la media del monto de retiro diario de la muestra. Use las frecuencias relativas.
Ejercicio 28
Grupo 1
1 2 3 4 5 6 7
Grupo 2
1 2 3 4 5 6 900
Características de la media
Se puede calcular para datos medidos en escala de intervalo o razón.
El cálculo de la media es sencillo y es una medida muy conocida.
El valor de la media es sensible a los valores extremos. por lo que varía mucho con valores muy
grandes o muy pequeños con respecto a los demás.
68 MA477 Estadística
3.2.2. Mediana
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto.
Ejercicio 29
Indique que entiende en las siguientes afirmaciones:
Según los Censos Nacionales 2007, la mediana de la edad de las mujeres que viven en Lima es
28 años, mientras que la edad de las mujeres que viven en Loreto es 19 años.
Según un estudio, en mujeres, del Centro Peruano de Estudios Sociales CEPES (2000), en Lima
la mediana de la edad a la primera unión (vida conyugal) es de 23.6 años, mientras que en Lo -
reto es de 18 años.
Según los Censos Nacionales 2007, la mediana del número de hijos que las mujeres peruanas,
mayores a 12 años, han tenido nacidos vivos es dos hijos.
Cálculo de la mediana
MA477 Estadística 69
Ejercicio 30
Grupo A
1.61 1.62 1.63 1.63 1.64 1.64 1.66 1.70 1.70 1.73 1.73 1.77 1.83
INTERPRETACIÓN:
El 50% los jugadores tienen una estatura como máximo de 1,66 metros
El 50% los jugadores tienen una estatura mínima de 1,66 metros
Grupo B
1.56 1.61 1.62 1.63 1.63 1.64 1.64 1.66 1.70 1.70 1.73 1.73 1.77 1.83
Imagen tomada de http://office.microsoft.com/es-hn/images/?CTT=97
En cada grupo se muestra la estatura de cada jugador. Calcule e interprete el valor de la mediana de
la estatura en cada grupo.
Ejercicio 31
Los datos siguientes corresponden a la cantidad de ventas diarias de una muestra aleatoria de
pequeñas empresas:
Distribución de empresas según número de ventas diarias
Número de ventas diarias fi hi Fi Hi
12 50 0.2778 50 0.2778
13 78 0.4333 128 0.7111
14 28 0.1556 156 0.8667
15 14 0.0778 170 0.9444
16 10 0.0556 180 1.0000
Total 180 1
Ejercicio 32
En una ciudad, se tomó una muestra aleatoria de 1000 personas y se les preguntó por su ingreso
mensual, en dólares, obteniéndose los siguientes resultados.
Título: ………………..……………………………………………………………………………………………………………………………
Ingresos (en dólares) Marca de clase fi hi Fi Hi
300 . 700 500 104 0.104 104 0.104
700 . 1 100 900 224 0.224 328 0.328
1 100 . 1 500 1 300 437 0.437 765 0.765
1 500 . 1 900 1 700 151 0.151 916 0.916
1 900 . 2 300 2 100 84 0.084 1000 1.000
Fuente: Estudio A
Ejercicio 33
Calcule la mediana de los siguientes grupos de números.
Grupo 1
1 2 3 4 5 6 7
Grupo 2
1 2 3 4 5 6 700
Características de la mediana
Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
La mediana no se ve afectada por valores extremos, por lo que se prefiere como medida de ten -
dencia central cuando hay datos extremos o la distribución de frecuencias no es simétrica.
MA477 Estadística 71
3.2.3. Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia.
Ejercicio 34
Interprete las siguientes afirmaciones:
a. La moda de video visto en YouTube es Despacito, fue visto más de 5 mil millones de veces.
c. La moda de idioma como lengua materna en el mundo es el chino mandarín, con más de 900
millones de personas.
Cálculo de la moda
Ejercicio 35
Calcule e interprete la moda de los siguientes datos, que corresponden al número de transacciones
bancarias diarias que realiza una empresa. Para ello se tomó una muestra de 40 pequeñas empresas.
1 1 3 2 0 3 3 3 2 1 2 0 0 1 3 0 3 2 1 2
3 2 0 3 0 2 3 0 3 1 2 4 2 0 1 4 2 2 2 2
Ejercicio 36
Los datos siguientes corresponden a la cantidad de ventas diarias de una muestra aleatoria de
pequeñas empresas:
Distribución de empresas según número de ventas diarias
Número de ventas diarias fi hi Fi Hi
12 50 0.2778 50 0.2778
13 78 0.4333 128 0.7111
14 28 0.1556 156 0.8667
15 14 0.0778 170 0.9444
16 10 0.0556 180 1.0000
Total 180 1
Ejercicio 37
Calcule la moda de los siguientes grupos de números.
Grupo 1
1 2 4 4 5 5 7
Grupo 2
1 2 4 4 5 5 700
¿Qué concluye al calcular la moda?
Características de la moda
La moda se puede calcular para cualquier escala de medición.
El valor de la moda no se ve afectada por valores extremos.
La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o
más modas (multimodal). Algunas series de datos no tienen moda.
MA477 Estadística 73
∑ ( xi −x ) =0
i=1
Si se tienen n valores c = constante, entonces la media de todos los datos es la misma constante.
x i=c → x=c
Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda
multiplicada por dicho número.
y i=cxi → y=c x
Si n1 datos tienen media x 1 y n2 datos tienen media x 2, luego la media de los n1 + n2 datos es:
n1 x1 +n 2 x 2
x=
n1 +n 2
Ejercicio 38
Demuestre cada una de las propiedades anteriores.
Ejercicio 39
En una negociación por aumento de salarios, la gerencia de una empresa ofrece a sus empleados dos
alternativas. La primera consiste en un aumento general del 5%, mientras que, la segunda consiste
en un aumento general del 2% más un bono de 150 soles.
Indique la alternativa que da a los empleados el mayor promedio de sueldos, si la media de los
sueldos es actualmente de 1 800 soles.
74 MA477 Estadística
Permite calcular el valor medio considerando la importancia o peso de cada valor sobre el total.
La fórmula es:
donde:
xi: Observación individual
wi: Peso asignado a cada observación
Ejercicio 40
Las notas de un alumno de Estadística son:
DD1 (8%) DD2 (12%) Examen parcial (15%) Examen final (40%) Trabajo final (25%)
12 10 13 13 13
donde:
MG=f p =
√
n x1 x2 x x n
√
× ×… × n =n n =√ f 1 × f 2 × …× f n
x0 x1 x n−1 x0
Además, el factor de variación en un período de tiempo t determinado puede ser hallado como
el cociente del valor observado en ese período y el valor observado en el período anterior.
xt
f t=
x t−1
La tasa de variación, it, indica el crecimiento o decrecimiento porcentual de la variable de un pe-
ríodo t respecto del período anterior, it = (fi – 1) x 100
Ejemplo 14.
La siguiente tabla muestra el índice del flujo de vehículos de Lima durante el año 2017.
MG=f p =
√
11 174.3
167.2
=1.00378
Tasa promedio de crecimiento ip = (fp – 1) x 100 = (1.00378 – 1) x 100 = 0.378%
b. Asumiendo que la tasa promedio de crecimiento anterior permanece constante. ¿En cuánto se
espera el flujo vehicular en Lima para el mes de abril de presente año?
Solución
Suponemos que el crecimiento mensual es constante e igual al 0.387%.
Enero 2021 174.3 x (1.00378)1 = 174.959
Febrero 2021 174.3 x (1.00378)2 = 175.620
Marzo 2021 174.3 x (1.00378)3 = 176.284
Abril 2021 174.3 x (1.00378)4 = 176.950
76 MA477 Estadística
Ejercicio 41
El director ejecutivo de una empresa desea determinar la tasa de variación promedio de los ingresos,
en miles de dólares, a partir de la siguiente tabla. Si esta tasa de variación es inferior a la media del
sector, que es del 10%, decidirá lanzar una nueva campaña de publicidad. ¿Qué decisión tomará el
director?
Cuartiles
Se denomina así a cada uno de los tres percentiles: P25, P50, P75 y se les denota como C1, C2 y C3 respec-
tivamente.
Decil
Se denomina así a cada uno de los nueve percentiles: P10, P20, …. P90 y se les denota como D1, D2 .…. D9
respectivamente.
Quintil
Se denomina así a cada uno de los cuatro percentiles: P20, P40, P60, P80 y se les denota como Q1, Q2, Q3 y
Q4 respectivamente.
Ejemplo 15.
Farid Matuk, ex jefe del INEI afirmaba en su cuenta de Twitter en el 2017: “Como reflejo de la desi -
gualdad y la pobreza, el quintil más rico adquiere 10 veces más kilos de vacuno que el quintil más po -
bre”.
Ejemplo 16.
Ejemplo 17.
La distribución del ingreso en el Perú deja mucho que desear, Según datos de la CEPAL, en el año
2003, el 20% más pobre de la población (Quintil I) recibía apenas el 3.8% del ingreso nacional, en tan-
to que el 20% más rico (Quintil V) recibía nada menos que el 55.2% del mismo. El Quintil II recibía el
7.9%, el Quintil III el 12.6% y el Quintil IV el 20.6%.
El decil 1, conformado por el 10% más pobre de la población, recibía apenas el 1.4%, en tanto que el
decil 10, conformado por el 10% más rico, recibía nada menos que el 39.2%.
Tomado de http://desarrolloperuano.blogspot.com/2007/07/la-distribucin-del-ingreso-y-el.html
78 MA477 Estadística
3.3.1. Percentil
El percentil k-ésimo Pk es un valor tal que por lo menos k por ciento de las observaciones son meno-
res o iguales que este valor.
Ejercicio 42
Indique lo que significa las siguientes afirmaciones.
a. Según los Censos Nacionales 2007 realizados por el INEI el percentil 30 de la edad de los perua -
nos es 14 años.
b. Según el II Censo Universitario 2010 realizado por el INEI el percentil 70 de la edad de los estu -
diantes de pregrado de las universidades peruanas es 24 años.
c. Según la publicación Growth of Dutch children del Amstel Institute en el año 2001, el percentil
50 de la estatura de holandeses de 19 años es 1.84 metros.
Ejercicio 43
Dados los siguientes datos, correspondientes al número de trabajadores de 16 pequeñas empresas,
calcule e interprete el percentil 30 y el percentil 75.
14 35 40 14 48 25 8 3 1 5 3 5 6 4 3 5
Ejercicio 44
Calcule el percentil 35 de los siguientes datos.
xi fi hi
1 5 0.025
4 46 0.230
6 109 0.545
12 40 0.200
Ejercicio 45
Las notas de un curso de capacitación sobre análisis de riesgos se muestran en la siguiente distribu -
ción de frecuencias.
Ejercicio 46
Calcule el percentil 25 de los siguientes grupos de números.
80 MA477 Estadística
Grupo 1
1 2 3 4 5 6 7
Grupo 2
1 2 3 4 5 6 700
Ejemplo 18.
La siguiente tabla corresponde a la distribución de frecuencias de los 200 sueldos, en soles, del últi-
mo mes de los empleados de una empresa.
Calcule el sueldo mínimo para estar en el 15% de los trabajadores mejores pagados.
Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero
no indican qué tan cercanos o lejanos están los datos de dicho valor central.
Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los
representa y por lo tanto, permiten evaluar la confiabilidad de ese valor central.
Si la medida de dispersión:
- tiene un valor pequeño, los datos están concentrados alrededor de la medida de tendencia central.
- tiene un valor grande, los datos no están concentrados alrededor de la medida de tendencia cen-
tral.
3.4.1. Varianza
La varianza es el promedio de los cuadrados de la diferencia de cada dato con la media.
Cálculo de la varianza
Ejercicio 47
Los siguientes datos corresponden a consumos de alumnos en la cafetería de una universidad. Calcu -
le la desviación estándar y la varianza.
8.5 1.0 0.6 11.0 9.0 2.5 2.0 1.5 8.0 4.0 2.5 3.0 1.5 7.0
Ejercicio 48
Los datos corresponden a las notas de 327 participantes de un curso de capacitación del programa
SAP aplicado a las finanzas. Calcule la desviación estándar muestral.
Tabla 5. Distribución de participantes según notas del programa SAP aplicado a las Finanzas
xi fi hi Fi Hi
12 110 0.3364 110 0.3364
14 136 0.4159 246 0.7523
15 44 0.1346 290 0.8869
16 37 0.1131 327 1.0000
82 MA477 Estadística
Ejercicio 49
La siguiente tabla muestra la rentabilidad en porcentaje de una muestra de 90 acciones negociados
en una rueda de la bolsa en el último mes.
Ejercicio 50
Calcule la desviación estándar de los siguientes grupos de números.
Grupo 1
1 2 3 4 5 6 7
Grupo 2
1 2 3 4 5 6 700
Ejercicio 51
En una tienda, la desviación estándar de los precios de los jeans es de 15.4 soles.
a. Si se realiza un aumento del 7% de todos los precios, calcule la nueva desviación estándar de los
precios de los jeans.
MA477 Estadística 83
b. Si se hace una oferta y se rebaja 10 soles a todos los precios, calcule la nueva desviación estándar
de los precios de los jeans.
El coeficiente de variación (CV) de un conjunto de datos indica lo grande que es la desviación están -
dar en comparación con la media.
Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones es-
tándar no es muy útil, por ejemplo, cuando las medias están muy distantes.
σ
La fórmula para el coeficiente de variación poblacional es: CV = × 100
μ
S
La fórmula para el coeficiente de variación muestral es: CV = ×100
x
Ejemplo 19.
Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto ar-
tículo que realizaron dos grupos de técnicos.
Grupo 1: media = 3 y desviación estándar = 1.10
Grupo 2: media = 5 y desviación estándar = 1.66
¿En cuál de los grupos el número de mediciones es más disperso?
Ejercicio 52
El siguiente cuadro muestra la distribución de los sueldos mensuales, en soles, de los empleados de
las empresas A y B.
Tabla 7. Distribución de trabajadores de salario mensual por empresas A y B
Sueldos Marca de clase Empresa A. fi Sueldos Marca de clase Empresa B. fi
[1 500 – 2 500] 2 000 60 [3 000 – 3 500] 3 250 16
]2 500 – 3 500] 3 000 120 ]3 500 – 4 000] 3 750 148
]3 500 – 4 500] 4 000 76 ]4 000 – 4 500] 4 250 46
]4 500 – 5 500] 5 000 68 ]4 500 – 5 000] 4 750 59
84 MA477 Estadística
MA477 Estadística 85
Ejercicio 53
El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en la siguiente
tabla.
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60
Ejercicio 54
La siguiente tabla muestra información de los precios, en soles, del artículo A en establecimientos
elegidos al azar en el distrito de La Molina.
86 MA477 Estadística
Además de las medidas de tendencia central y dispersión, podemos estar interesados en saber la for -
ma que presenta un conjunto de datos.
Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la me -
dia. se dice que la distribución es simétrica.
Si los datos que son menores a la media son más frecuentes que aquellos por encima de la media
o viceversa. se dice que la distribución es asimétrica.
El coeficiente de asimetría para datos simples o agrupados se calcula con la siguiente fórmula:
As=3 ( x̄−Mediana
s )
MA477 Estadística 87
3.5.2.
Re-
la-
Para una distribución asimétrica negativa: media < mediana < moda
Para una distribución simétrica: media = mediana = moda
Para una distribución asimétrica positiva: media > mediana > moda
Ejercicio 55
Complete los siguientes textos:
Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una con-
centración de datos en los valores …………………………………………
Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una concen-
tración de datos en los valores …………………………………………
En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de asime-
tría …………………..……... porque ………………………………..…………………………………………
En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente tie-
nen un coeficiente de asimetría …………………………….……….. porque
…………………………………………………… ………………………………..
…………………………………………………………………………………………………………………
Ejercicio 56
El salario, en cientos de soles, de los trabajadores una empresa se presenta a continuación:
10 12 13 13 14 15 15 15 18 23 24 24 25 25 36 42 48 63
Ejercicio 57
El siguiente cuadro muestra la distribución de los sueldos mensuales de los empleados de las empre -
sas A y B.
Tabla 9. Distribución de frecuencias de sueldos mensuales de la empresa A y B
Sueldos Marca de clase Empresa A. fi Sueldos Marca de clase Empresa B. fi
[1 500 – 2 500] 2 000 45 [3 000 – 3 500] 3 250 18
]2 500 – 3 500] 3 000 148 ]3 500 – 4 000] 3 750 70
]3 500 – 4 500] 4 000 60 ]4 000 – 4 500] 4 250 70
]4 500 – 5 500] 5 000 15 ]4 500 – 5 000] 4 750 18
Calcule la asimetría de los dos grupos. Realice una conclusión.
Ejercicio 58
Si la distribución del monto de deuda de los clientes de la sucursal de una entidad financiera tiene
forma asimétrica con cola a la izquierda, el gerente financiero buscará una estrategia para revertir la
situación. ¿El gerente debe implementar alguna estrategia? Justifique su resultado numéricamente.
Si los datos corresponden a una muestra de 8 clientes.
Monto de deuda en miles de dólares de una muestra de clientes de una entidad financiera
12.3 13.6 8.2 5.6 7.2 6.8 7.2 5.6
Cuando medimos una variable aleatoria, por lo general, los resultados que tienen una mayor fre -
cuencia son los que se sitúan en torno a la media de la distribución. Imaginemos la altura de los
alumnos de una clase. Si la altura media de la clase es 1.72 mts, lo más normal es que las alturas del
resto de los alumnos estén en torno a este valor (con cierto grado de variabilidad, pero sin ser esta
demasiado grande). Si esto sucede, se considera que la distribución de la variable aleatoria se distri -
buye con normalidad. Pero dada la infinidad de variables que se pueden medir, esto no siempre su-
cede así.
La curtosis (también conocida como medida de apuntamiento) es una medida estadística que deter-
mina el grado de concentración que presentan los valores de una variable alrededor de la zona cen -
tral de la distribución de frecuencias.
Esta medida no tiene un referente natural como en el caso de la simetría, sino que se sustenta en la
comparación respecto a una distribución de referencia. en concreto, la distribución normal o campa-
na de Gauss. En consecuencia, su obtención sólo tendrá sentido en variables cuya distribución de fre-
MA477 Estadística 89
cuencias sea similar a la de la curva normal (en la práctica ello se reduce. básicamente. a que sea uni -
modal y más o menos simétrica).
3( x−M e )
Si A s= =0 entonces ladistribución es simétrica
s
Si−0.05≤ A s< 0 o 0< A s ≤ 0.05 entonces la d istribución casi simétrica
Ejercicio 59
Calcular la medida de curtosis de los siguientes datos:
Ejercicio 60
Se ha obtenido la siguiente información referente al sueldo diario de un grupo de obreros:
Marca de
Sueldo fi
clase
70 – 75 3
75 – 80 3
80 – 85 7
85 – 90 10
90 – 95 12
95 – 100 8
MA477 Estadística 91
Es un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera dato atípico
a cualquier punto que esté:
a más de 1.5(RIC) por arriba (o a la derecha) del tercer cuartil
a más de 1.5(RIC) por debajo (o a la izquierda) del primer cuartil
Ejercicio 61
Un inversionista está interesado en comprar acciones de tres empresas A, B y C, decidirá por aquella
acción que presente un mayor rendimiento y que sea más estable en los precios; es decir una menor
dispersión. Para lo cual, se tienen los siguientes resultados sobre rendimientos en soles de las tres ac-
ciones.
A 2 11 11 12 12 12 12 12 12 13 13 13 13 13 14 15 15 16 16 17 18 18 19 19 19 20
B 11 11 11 11 11 12 13 13 13 13 14 14 15 15 16 16 16 16 17 17 17 17 17 18
C 1 3 9 11 11 11 11 11 11 11 12 12 13 13 13 13 13 13 13 14 14 14 14 20
Construya un diagrama de cajas que le permita al inversionista decidir qué acción debe de comprar.
Título: …………………………………………….……………………………………………………
Fuente: …………………………………………………………………………………
Ejemplo 20.
Los registros policíacos del distrito A muestran los siguientes números de informes de delitos diarios
para una muestra de días durante los meses de invierno y una muestra de días durante los meses de
verano.
Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28
Construya un gráfico que permita comparar, entre invierno y verano, los valores medios, la variabili -
dad y encontrar los valores atípicos del número de delitos diarios.
Solución
Se debe calcular los percentiles con datos simples. No calcule la distribución de frecuencias.
Calculemos los percentiles y los rangos intercuartiles.
Para el invierno, de acuerdo con los datos, los bigotes llegan como mínimo a 5 y como máximo a 22.
Para el verano, de acuerdo con los datos, los bigotes llegan como mínimo a 5 y como máximo a 28.
Ejercicios propuestos
Caso Metropolitano
46. Objetivo específico 1: Determinar el número de días que usó el servicio la semana anterior de
los usuarios del servicio del Metropolitano.
Si el número de días promedio que usó el servicio la semana anterior supera los tres días, acu-
mulará un saldo a favor de 0.50 céntimos a su tarjeta.
Para el logro del objetivo se tuvo en cuenta la siguiente información proporcionada por el es-
tudio del perfil del usuario del Metropolitano.
Tabla 1: Distribución de los usuarios del Metropolitano según número de días que
usó el servicio la semana anterior
Número de días Número de usuarios
1 1
2 7
3 23
4 49
5 40
Fuente: Pro Transporte
Calcule e interprete el promedio de días que los usuarios usaron el servicio del metropolitano
la semana anterior.
47. Objetivo específico 2: Determinar el tiempo de espera de los usuarios del servicio del Metro-
politano.
Para el logro del objetivo se tuvo en cuenta la siguiente información proporcionada por el es-
tudio del perfil del usuario del Metropolitano.
50
50
Número de usuarios
40
33
30
30 27
23
20
14 13
10
10
0
1.7 6.6 11.5 16.4 21.3 26.2 31.1 36 40.9
Fuente: Pro Transporte Tiempo de espera
48. Objetivo específico 3: Comparar el tiempo que esperan los usuarios del Metropolitano antes y
después de haber incrementado el número de buses.
Para lograr el objetivo, se presenta gráficamente la distribución porcentual de los usuarios se-
gún tiempo de espera, antes y después de incrementar el número de buses. El concesionario
del metropolitano desea determinar el porcentaje de usuarios cuyos tiempos de espera supera
los 23 minutos. ¿Se puede concluir que se ha reducido el tiempo de espera de los usuarios del
servicio del metropolitano?
Gráfico 2: Distribución porcentual de los usuarios del metropolitano según tiempo de espe-
ra antes y después del incremento de buses
49. Objetivo específico 4: Determinar el porcentaje de usuarios del transporte público del Metro-
politano en los extremos de la distribución del tiempo de viaje.
25
21
Cantidad de usuarios
20
13
15
11 10
10
4 6
5
0 0
0
10.95 14.05 17.15 20.25 23.35 26.45 29.55 32.65 35.75 38.85
Fuente: Pro Transporte Tiempo de viaje (minutos)
a. El tiempo mínimo de viaje para que un usuario del Metropolitano sea considerado dentro
del 20% de los que llegan más tarde a su destino.
b. El tiempo máximo de viaje para que un usuario del Metropolitano sea considerado dentro
del 10% de los que llegan más temprano a su destino.
c. Determine el porcentaje de usuarios del Metropolitano cuyo tiempo de viaje es menor de
25 minutos.
96 MA477 Estadística
50. Objetivo específico 5: Comparar la variabilidad de los tiempos de viaje de los usuarios del me-
tropolitano por estación de servicio.
Para el logro de este objetivo, se trabajará con las tablas que se muestran a continuación:
Tabla 3: Distribución de los usuarios de la estación Javier Prado, según tiempo de espera
Límite inferior Límite superior Marca fi
1.7 5
13
18.5 20
20
12
3
2
Total 75
51. Objetivo específico 6: Comparar los tiempos que esperan los usuarios para tomar los expresos
del Metropolitano antes y después del incremento de unidades.
Para lograr el objetivo se tiene la siguiente información sobre los tiempos que esperan los
usuarios de las rutas de los expresos 2 y 5:
La gerencia del Metropolitano ha incorporado más unidades para las rutas de los expresos 2
y 5, con lo cual reducirán los tiempos que esperan los usuarios del metropolitano de la si-
guiente manera:
Expreso 2: Reduce el tiempo de espera en 25%
Expreso 5: Reduce el tiempo de espera en 5 minutos
a. Si un usuario puede tomar cualquiera de los dos servicios, ¿cuál es el expreso que debe-
ría elegir después del incremento de las unidades, si su objetivo es la reducción del tiem -
po promedio de espera?
b. Si un usuario puede tomar cualquiera de los dos servicios, ¿cuál es el expreso que debe-
ría elegir después del incremento de las unidades, si su objetivo es el que presenta los
tiempos de espera más homogéneos?
MA477 Estadística 97
52. Objetivo específico 7: Comparar para las cuatro rutas del Metropolitano aquellas que presen-
tan menor variabilidad para los tiempos de espera.
Para el logro del objetivo, se tuvo en cuenta la siguiente información:
53. Objetivo específico 8: Comparar por estación, la variabilidad para el número de días que los
clientes usaron el servicio del Metropolitano la semana pasada.
Para el logro de este objetivo se consideró la siguiente información:
Tabla 4: Distribución de usuarios del Metropolitano
según el número de días que usó el servicio la semana pasada según estación de servicio
Número de días Angamos Canaval y Moreyra Javier Prado
1 0 0 1
2 1 5 1
3 3 4 16
4 11 7 31
5 6 8 26
Total 21 24 75
Fuente: Pro Transporte
Determine la estación de servicio más homogénea y más heterogénea con respecto al número
de días que el usuario usó el servicio del Metropolitano la semana pasada.
54. Objetivo específico 9: Comparar los tiempos de viaje de los usuarios por estación de servicio.
Se presenta los tiempos de viaje para las estaciones de Angamos y Canaval y Moreyra:
Estación de Angamos
12.5 12.9 13.2 13.8 14.0 14.2 14.9 15.0 15.0 16.6 18.8
19.0 19.1 19.4 20.3 20.4 20.8 22.3 22.9 23.4 32.5
Estación de Canaval y Moreyra
7.2 16.1 16.4 17.4 17.8 18.4 19.3 19.4 19.9 20.4 20.7 20.7
21.3 21.7 22.1 22.1 22.4 22.7 23.5 23.6 23.7 24.8 25.1 40.5
30 Q3 = 29,4
Tiempo de viaje
25
Q2 = 26,5
Q1 = 22,3
20
15
Big inf = 13,1
10
Angamos Carnaval y Moreyra Javier Prado
Estación
98 MA477 Estadística
a. Completa para las estaciones de Angamos y Carnaval y Moreyra el cuartil 1, 2 y 3, los bigotes
y los datos atípicos si los hubiera.
b. Completa para las estaciones de Angamos y Carnaval y Moreyra el cuartil 1, 2 y 3, los bigotes
y los datos atípicos si los hubiera.
c. Responda a las siguientes interrogantes en base al gráfico.
En el 50% central de los tiempos de viaje de los usuarios del Metropolitano, indique la es -
tación que presenta mayor homogeneidad.
En el 50% central de los tiempos de viaje de los usuarios del Metropolitano, indique la es -
tación que presenta mayor concentración de usuarios en tiempos mayores de viaje.
Indique las estaciones que presentan valores atípicos.
Indique la estación que consideraría que tiene mayor tiempo de viaje.
Indique la estación que presenta menores tiempos de viaje.
55. Objetivo específico 10: Comparar para las cuatro rutas del Metropolitano el tiempo que espe-
ran los usuarios en las estaciones del metropolitano
Para desarrollar este objetivo, se tuvo en cuenta la información presentada para cada ruta del
Metropolitano, sobre el tiempo de espera de los usuarios:
Ruta Media Mediana Desviación estándar Coeficiente de asimetría
A 20.29 24.70 7.54
B 22.73 18.80 6.72
Expreso 2 18.08 18.08 7.86
Expreso 5 17.17 17.10 6.21
Complete la tabla anterior y responda lo siguiente:
a. Indique la forma de la distribución del tiempo de espera de los usuarios de la ruta A.
b. Indique la forma de la distribución del tiempo de espera de los usuarios de la ruta B.
c. Indique la forma de la distribución del tiempo de espera de los usuarios de la ruta del ex-
preso 2.
d. ¿Qué opina sobre la distribución del tiempo de espera de los usuarios del expreso 5?
56. Objetivo específico 11: Comparar para las estaciones de servicios del metropolitano, la con-
centración de los tiempos que esperan los usuarios.
Para el logro del objetivo se tuvo en cuenta la siguiente información proporcionada por el es-
tudio del perfil del usuario del Metropolitano.
Tabla 5: Distribución de usuarios del Metropolitano
según el tiempo de espera en las estaciones de Angamos y Javier Prado
Tiempo de espera (minutos) Marca clase Angamos J. Prado
1.7 6.6 4.15 0 4
6.6 11.5 9.05 1 8
11.5 16.4 13.95 2 18
16.4 21.3 18.85 5 22
21.3 26.2 23.75 6 9
26.2 31.1 28.65 6 10
31.1 36.0 33.55 1 2
36.0 40.9 38.45 0 2
Total 21 75
Fuente: Pro Transporte
Calcule la medida de asimetría para el tiempo de espera en la estación de Angamos y Javier Pra -
do e indique el sesgo de cada una de las estaciones. ¿Podría afirmar que en una de las estacio-
nes los tiempos de espera se concentran más en los tiempos menores?
MA477 Estadística 99
Caso:Cacao S.A.
57. Durante una jornada de trabajo se midió la eficiencia de las máquinas por turno teniendo en
cuenta su tiempo perdido por turno debido a algún accidente dentro del proceso de produc-
ción.
Producción durante una jornada de trabajo
Turno Eficiencia (%) Tiempo perdido (minutos)
Mañana 98 27
Tarde 96 28
Tarde 95 34
Si la eficiencia promedio de las máquinas en una jornada de trabajo es inferior a 97% minutos
se solicitará un cambio de personal. ¿Se debe o no cambiar al personal?
58. Debido a los tiempos perdidos de los trabajadores en los accidentes, se piensa realizar una ca-
pacitación, pero debido a su bajo presupuesto elegirán al turno que tenga el mayor valor mo-
dal.
100.00%
Porcentaje de trabajadores
100% 95.24%
90% 80.95%
80%
70%
60%
47.62%
50%
40%
30% 21.43%
20%
9.52%
10%
0%
24 29 34 39 44 49 54
59. Se ha capacitado a los trabajadores para reducir los tiempos perdidos por incidencia de acci -
dentes. será efectiva si al comparar el tiempo perdido antes y después de la capacitación la mi -
tad de los trabajadores presentan menos tiempos perdidos después de recibir la capacitación.
Tiempo perdido antes de la capacitación
12.0 23.3 26.0 30.0 33.6 38.2 38.3 18.0 24.0 27.5 30.0
17.1 23.4 27.0 30.0 33.6 38.2 38.5 34.1 38.2 39.1
Tiempo perdido después de capacitación
Tiempo perdido Número de trabajadores
23 - 25 2
25 - 27 1
27 - 29 8
29 - 31 6
31 - 33 5
100 MA477 Estadística
60. El departamento de control de la calidad indica que cada trabajador puede generar como má-
ximo once chocolates defectuosos, sin embargo, si el 35% de los trabajadores supera este lími -
te debería detenerse la producción para evaluar a fondo las fallas de calidad.
30 28
Número de trabajadores
25 23
20 18
15
10 7
5
5
0
10 11 12 13 14
a. Determinar el número máximo de chocolates defectuosos que produce el 35% de los traba-
jadores de la empresa Cacao S.A.
b. De acuerdo al análisis de los datos: ¿La producción de chocolates debería detenerse?
61. La empresa está dispuesta a permitir solo cuarenta minutos como tiempo máximo de demora
debido a algún accidente dentro del proceso de producción, para aquellos trabajadores que
superen este tiempo pasarán a ser removidos de su puesto.
18 17
16
Número de trabajadores
14
12 12
12
10 Hombres
8 8
8 Mujeres
6 6
6
4
4 3
2
2 2
1
0
8.5 15.5 22.5 29.5 36.5 43.5 50.5 57.5
62. Se ha tenido sospecha que los trabajadores de género masculino suelen no ser rigurosos con
los protocolos de seguridad a diferencia de los trabajadores de género femenino. Se ha previs-
to una auditoría para identificar el género que presenta una mayor heterogeneidad en sus
tiempos de demora por accidentes para luego ser capacitados sobre los protocolos de seguri-
dad.
49
50 45
Número de trabajaodres
40
33
30 32
30
20 16 24
Fi
16 Hom-
8 bres
10
Fi Mu-
2 4 jeres
0 1
12 19 26 33 40 47 54
Fuente: Cacao S.A. Tiempo de demora (minutos)
¿Qué grupo de trabajadores debe ser capacitado sobre los protocolos de seguridad?
63. A continuación, se presenta los indicadores estadísticos registrados en sus tiempos perdidos
por incidencia de accidente en el proceso productivo antes de la capacitación y los resultados
medidos por reducción del tiempo por cada trabajador después de la capacitación.
Antes de recibir la capacitación Después de la capacitación
Turno Tiempo promedio Desviación estándar Reducción del tiempo por cada trabajador
Mañana 48 minutos 18 minutos En 10%
Tarde 47 minutos 16 minutos Menos 15 minutos
Noche 52 minutos 17 minutos 12% y menos 2 minutos
¿En qué turno fue más efectiva la capacitación, si su objetivo es el que presenta los tiempos
perdidos por accidente más homogéneos?
64. Objetivo específico: Comparar el número de barras defectuosas producidas según género.
La empresa tomó un grupo de trabajadores de 20 del género femenino y 25 del género mascu -
lino con los cuales se encontraron los siguientes indicadores estadísticos del número de choco -
lates defectuosos por género, tal como se muestra en la siguiente tabla:
Género Q2 Q1 RIC Q3 LIS LSS Big inf Big Sup
Masculino 11.5 10.0 5.0
Femenino 12.0 11.0 2.5
Lamentablemente, parte de la muestra de datos de ambos géneros se perdieron tal como se
muestra en la siguiente tabla:
Masculino 2 6 8 ………………………………………. 12 16
Femenino 8 9 9 ………………………………………. 15 18
a. Encuentre los indicadores estadísticos faltantes. (Q3, LIS, LSS, bigote inferior, big superior).
b. Graficar el diagrama de cajas para ambos géneros.
c. Dar respuesta al objetivo.
MA477 Estadística 103
65. Objetivo específico: Determinar el turno que será bonificado por presentar los menores tiem-
pos de demora por accidente
La empresa cuenta con la información proporcionada sobre los tiempos de demora por acci-
dente según turno.
61
59
Tiempo en minutos
*
57
55
53
*
51
Piña Durazno Manzana
Mañana Tarde Noche
Fuente: Cocoa S.A Turnos
66. Sea x1. x2. … . xn los datos de una variable aleatoria continua de una muestra aleatoria de tama -
k
xi f i
ño n con media x=∑ donde cada intervalo se define como [xi , xi+1] y w = xi+1- xi. Si cada
i=1 n
dato original se transforma de la siguiente manera yi = a xi + b, siendo a y b constantes, de-
muestre que la media de los n valores yi es .
67. Sea x1, x2, … , xn los datos de una variable aleatoria continua de una muestra aleatoria de tama -
fine como [xi , xi+1] y w = xi+1 - xi. Si cada dato original se transforma de la siguiente manera yi = a
xi + b, siendo a y b constantes, demuestre que la mediana de los n valores yi es Me(y) = aMe(x)
+b
68. Si la producción ha experimentado un crecimiento del 30% del primer año al segundo año, un
incremento del 35% del segundo al tercer año y un decrecimiento del 15% del tercer al cuarto
año.
a. Calcule la tasa promedio de crecimiento de los últimos tres años.
b. Calcule la producción del quinto año si la del primer año ha sido 100.
104 MA477 Estadística
69. El nivel de exportación de harina de pescado durante los últimos tres años consecutivos, au -
mentó respecto al año anterior en: 70%, 50%, 10%. ¿Cuál es el aumento promedio anual del
nivel de exportación de harina de pescado para los últimos tres años?
MA477 Estadística 105
Tomado de http://www.sciencedirect.com/science/article/pii/S1575092208758455
a. ¿Qué significa que para las jóvenes de 18 años el percentil 3 del peso sea 44 kilos?
b. ¿Qué significa que para las jóvenes de 19 años el percentil 50 de la talla es 1.64 metros?
71. Indique si son verdaderas o falsas las siguientes afirmaciones.
a. El percentil 30 es siempre menor al percentil 70
b. El cuartil 2 es igual al percentil 50
c. El percentil siempre se expresa en porcentaje
d. Si todos los pesos son iguales, la media ponderada es igual a la media aritmética
e. La media ponderada no tiene unidades
72. Para un conjunto de datos x1, x2, … , xn se tiene que la media x .
2 2
a. Demostrar si los valores de xi se transforman en yi = 0.001xi + 2, entonces SY =0.01 S X
k 2
( ∑ fix )2
fi( xi− x̄ ) 1
S 2x=∑
n−1 , entonces
S 2x=
n−1
( ∑ fixi2− n
)
b. Probar que si i
74. Con la intención de conocer los hábitos y preferencias de los estudiantes acerca de los produc-
tos naturales. se contrató los servicios de la consultora Data Mining Today S.A. la cual elaboró
una encuesta para el estudio de mercado y se aplicó a 400 estudiantes de diferentes institucio-
nes educativas. Algunos resultados fueron:
El 70% de los encuestados afirma que preferiría consumir productos naturales enlatados.
La fruta más consumida por los encuestados es la manzana, seguida por el plátano y la
pera.
El gasto promedio por semana en productos naturales es de 25 soles con una desviación
estándar de 5 soles.
El 15% de los encuestados gasta más de 28 soles semanales en productos naturales.
El 50% de los encuestados tiene una edad superior a 20 años.
El número promedio de vasos de yogurt consumidos durante la semana es de 6.
Una variable
Cuantitativa conti-
Gasto promedio semanal en productos naturales
nua
Número promedio de vasos de yogurt consumidos durante la sema-
Cuantitativa discreta
na
Unidad 4. Probabilidad
Logro de la Unidad 3
Al finalizar la unidad, el estudiante aplica la teoría de la probabilidad en situaciones de
incertidumbre para la toma de decisiones en casos reales dentro del ámbito de su es -
pecialidad.
Actualmente, la teoría de la probabilidad es la base para las aplicaciones estadísticas tanto en investi -
gaciones sociales como en la toma de decisiones en la empresa. En el campo de la economía el cálcu -
lo de probabilidades es muy importante y usado pues el economista tendrá necesidad de tomar deci -
siones y más de la mitad de las veces habrá de hacerlo en condiciones de incertidumbre y con conoci-
miento bastante incompleto de las condiciones imperantes. Por ejemplo, deberán ser capaces de es -
timar la evolución del PBI de un país, la inflación, etc.
Ejemplo 21.
Indique en las situaciones en donde se tiene un componente aleatorio.
a. “Tengo un negocio y deseo estimar cuánto voy a vender hoy” SI
b. “Aplico una fuerza determinada a una cierta masa ¿cuánto se acelerará?” NO
c. “Compró diez mandarinas ¿cuántas de ellas estarán sabrosas?” SI
d. “Llego a la ventanilla de un banco ¿cuánto tiempo le tomará atenderme? SI
e. “He estudiado mucho para el examen ¿lo aprobaré?” SI
f. “Voy a patear un penal y con ello Perú irá al Mundial de Qatar, ¿lo meteré?” SI
g. “Me voy a casar con la persona indicada ¿me divorciaré algún día?” SI
h. “He tomado mucha cerveza y estoy manejando ¿chocaré?” SI
Ejercicio 62
¿De cuántas maneras ocurre el experimento de lanzar una moneda o un dado?
3 maneras (primero el dado después la moneda o luego ambas)
Ejercicio 63
Una persona puede viajar de una ciudad a otra por carretera de tres formas y por tren de dos formas.
¿De cuántas formas puede viajar la persona de una ciudad a otra?
3 formas + 2 formas = 5 formas
Ejercicio 64
Se tiene los dígitos 1, 2, 3 y 4. ¿Cuántos números de cuatro cifras menores de 2367 se pueden for-
mar, si cada dígito se usa una sola vez?
1234 2134
1243 2143
1324 2341
1342 2314
1423
1432
10 formas posibles
MA477 Estadística 109
Ejercicio 65
Una joven tiene 48 polos, 20 pantalones y 12 pares de zapatos. ¿De cuántas maneras diferentes se
puede vestir?
48 x 20 x 12 = 11520 formas diferentes para vestir
Ejercicio 66
En una cafetería universitaria se ofrece un menú que consiste en refresco, entrada o sopa, segundo y
postre. ¿De cuántas maneras diferentes puede formar su almuerzo un estudiante, si hay tres entra-
das posibles para escoger, dos sopas, cuatro segundos y tres postres?
(3 + 2) x 4 x 3 = 5 x 4 x 3 = 60 maneras diferentes de ele
Ejercicio 67
¿Cuántos números pares de tres dígitos se pueden formar con los dígitos 1, 2, 5, 6, 7, 8 y 9, si cada
dígito puede emplearse una sola vez?
Termina en 2 Termina en 6 Termina en 8
152 126
162 156
172 176
182 186
192 196
512 216
562 256
572 276
582 286
592 293
Que terminen en 2: 5 x 6 = 30
Que terminen en 2: 5 x 6 = 30
Que terminen en 2: 5 x 6 = 30
Ejercicio 68
En una empresa se van a rifar tres premios como incentivo, un viaje a Punta Cana, otro a Cancún y
otro a Punta Sal. Si hay 40 trabajadores, ¿de cuántas maneras diferentes se pueden repartir los pre -
mios?
40 40 !
P3 = =59280
( 40−3 ) !
Ejercicio 69
¿De cuántas maneras diferentes se pueden sentar ocho personas en una banca, con capacidad para
cinco personas?
8 8!
P5= =6720
( 8−5 ) !
Ejercicio 70
Los 10 obreros de una empresa (6 hombres y 4 mujeres) son evaluados. Si todos han obtenido dife -
rente puntaje:
a. ¿Cuántos listados diferentes se pueden hacer si se ordenan de mayor a menor?
Una sola forma
b. Si los hombres son ordenados entre ellos y las mujeres entre ellas mismas, ¿cuántos listados dife -
rentes se pueden hacer si se ordenan de mayor a menor?
1 1
C 1+C 1=1+1=2
Ejercicio 71
¿De cuántas maneras se pueden colocar 10 alumnos en una fila, de manera que dos de ellos, no que -
den juntos?
10 10 !
2 xC8 =2 =90
8 ! ( 10−8 ) !
4.1.4. Combinaciones
La cantidad de formas de seleccionar x objetos de un total de n objetos distinguibles sin tomar en
cuenta el orden es:
n!
C nx =
x ! ( n−x ) !
Ejercicio 72
En un hogar hay diez personas y un encuestador necesita entrevistar a dos de ellas, sin importar el
orden. ¿De cuántas maneras diferentes se puede elegir a esas dos personas?
10 10 !
C2 = =45
2 ! ( 10−2 ) !
Ejercicio 73
¿Cuántos grupos de 2 hombres y 3 mujeres se pueden formar con 5 hombres y 7 mujeres?
MA477 Estadística 111
Ejercicio 74
De 50 empresas, nueve no están al día con el pago de sus impuestos. La Sunat, con la finalidad de
identificar a las empresas evasoras, selecciona al azar a cinco empresas y las revisa.
a. ¿De cuántas maneras se pueden elegir a las nueve empresas?
50 50!
C5 = =2118760
5 ! ( 50−5 ) !
b. ¿En cuántos casos se eligen a dos empresas que no están al día con el pago de impuestos?
9 50−9 9 41 9! 41!
C 2 x C3 =C 2 x C3 = x =383760
2 ! ( 9−2 ) ! 3 ! ( 41−3 ) !
c. Calcule la probabilidad de que elija a dos empresas que no están al día con el pago de sus impues -
tos.
A: Elegir a dos empresas que no están al dia en el pago de sus impuestos (deudoras)
C29 x C 41
3 383760
P ( A )= =0.1811=18.11 %
C5 50
2118760
d. Calcule la probabilidad de que elija al menos una empresa que no está al día en el pago de sus im -
puestos.
C 91 x C 41
4 C 92 x C341 C 93 x C 41
2 C94 x C41
1 C 95 x C041
P ( X ≥1 ) = + + + +
C50
5 C50
5 C50
5 C 50
5 C 50
5
Ejercicio 75
Cuatro libros diferentes de matemática (M 1, M2, M3, M4), tres de Estadística (E1, E2 y E3) se colocan al
azar en un estante. Calcule la probabilidad que sólo los libros de Estadística estén todos juntos.
Ejercicio 76
Un grupo de ocho amigos se sientan, al azar, juntos en la misma fila en un cine. Calcule la probabili-
dad de que Diego, Claudia y Andrea se sienten juntos.
112 MA477 Estadística
MA477 Estadística 113
4.2. Definiciones
Se puede repetir indefinidamente donde los resultados dependen del azar, por lo que no se pue-
den predecir con certeza
Se puede describir el conjunto de todos los resultados posibles
Cuando se repite un gran número de veces. aparece un modelo definido de regularidad
Ejercicio 77
Indicar, para cada uno de los siguientes experimentos aleatorios, los respectivos espacios muestrales:
Ejercicio 78
Un experimento consiste en lanzar primero un dado para después lanzar una moneda, siempre y
cuando el número del dado sea par. Si el resultado del dado es impar, la moneda se lanza dos veces.
Determine el espacio muestral de este experimento.
4.3.1. Evento
Un evento es un subconjunto del espacio muestral.
114 MA477 Estadística
Una probabilidad cercana a 0 indica que es difícil que el evento ocurra, mientras que, una probabili -
dad cercana a 1 indica que es casi seguro que el evento ocurra.
Ejercicio 79
Se lanzan dos dados, calcule:
a. La probabilidad de que la suma sea cinco.
Con frecuencia se construyen eventos mediante la combinación de eventos más sencillos. Es usual
emplear la notación de conjuntos para describir los eventos construidos de esta forma.
Ejercicio 80
Complete los espacios en blanco.
a. La probabilidad de que una empresa gane una licitación es 0.80, por lo tanto, la probabilidad de
que no la gane es _____
b. La probabilidad de que una persona gane la Tinka con una jugada es del 0.0000123%, por lo tanto,
la probabilidad de que no la gane en una jugada es __ ______________%.
Ejercicio 81
Indique si los siguientes eventos son mutuamente excluyentes:
Ejercicio 82
Una inversionista compra acciones de la empresa A y de la empresa B.
Escriba los siguientes eventos en función de los eventos A y B. Además, grafique dicho evento en un
diagrama de Venn:
Axioma 3
Axioma 1 Axioma 2 Si A y B son dos eventos
mutuamente excluyentes
0 P(A) 1 P(S) = 1
entonces:
P(A B) = P(A) + P(B)
Ejercicio 83
En un lote de polos, hay 20 polos rojos, 50 blancos y 36 azules. Si extrae un polo al azar:
4.6. Teoremas
Ejercicio 84
Demuestre cada uno de los teoremas anteriores.
Ejercicio 85
Una empresa necesita aportaciones de sus socios para dos proyectos. La probabilidad de que sus so -
cios aporten para el proyecto de pago anticipado de deuda es 0.3 y la de que aporten para el proyec -
to de expansión de la capacidad productiva es de 0.6. La probabilidad de que aporten para ambos
proyectos es de 0.08 ¿Cuál es la probabilidad de que los socios solamente aporten para uno de los
proyectos?
118 MA477 Estadística
Union
P [A o B] = P [A U B] = P {A} + P[B] – P [A n B]
= 0.3 + 0.6 - 0.08
= 0.82
Probabilidad que los socios NO aporten para ambos proyectos: P [(A n B) C]
= 1 – 0.08
= 0.92
Ejercicio 86
Un fabricante de teléfonos celulares acaba de lanzar dos modelos de smartphones económicos: el
L720 y el L520. La probabilidad de que el modelo L720 tenga éxito es 0.70 y en el modelo L520 es del
0.60. La probabilidad de que tener éxito en al menos uno de ellos es del 0.90. Determine la probabili-
dad de que se tenga éxito solo en uno de los modelos.
Sean los eventos:
A: El modelo L720 tenga éxito P [A] = 0.70
B: El modelo L520 tenga éxito P [B] = 0.60
Union
P [A U B] = P {A} + P[B] – P [A n B] = 0.90
Interseccion
P [A n B] = 0.70 + 0.60
= 1.30 - 0.90
= 0.4
Diferencia simetrica:
P [A ∆ B] = 0.3 + 0.2 = 0.5
Ejercicio 87
Un inversionista desea invertir en la Bolsa de Valores de Lima, en las acciones de Aceros A y de ce-
mentos B, por eso se ha informado al respecto. La probabilidad de que las acciones de Aceros A su -
ban es 0.36, de que suban las de Cementos B es 0.45 y de que suban ambas acciones es 0.12. En base
a esta información se pide:
a. Si se selecciona una persona al azar de la muestra, calcular la probabilidad de que sea hombre.
P [H] = n(H) / n(S) = 182/318
P [H] = 0.5723
b. Si se selecciona una persona al azar de la muestra, calcular la probabilidad de que sea mujer y es-
té en planilla. (probabilidad conjunta) Con el total
P [M y P] = P [M n P] = 11/ 318
P [M n P] = 0.0346
c. Si se selecciona una persona al azar de la muestra, calcular la probabilidad de que esté en planilla
o sea mujer.
P [P U M] = (42 + 136 – 11)/318 = 0.5252
d. Dado que la persona seleccionada está en planilla, calcule la probabilidad de que sea hombre.
(Condicional)
P [H/P] = 31/42 = 0.7380
e. Si la persona seleccionada es hombre, calcule la probabilidad de que sea independiente.
P [I/H] = 110/182 = 0.6044
MA477 Estadística 121
Ejercicio 89
Según el II Censo Universitario, en el año 2010, 63 900 alumnos ingresaron a las universidades públi -
cas y 194 151 a las universidades privadas. De ellos, en las universidades públicas. 28 798 ingresantes
fueron mujeres, mientras que en las privadas lo fueron 98 942.
Distribución de …………………………………. según ……………………………………….. y ………………………………….
Condición de universidad Mujer Hombre Total
Universidad pública 28 798 35 102 63 900
Universidad privada 98 942 95 209 194 151
Total 127 740 130 311 258 051
Fuente: II Censo Universitario, en el año 2010.INEI.
a. Si se elige al azar a una ingresante, calcule la probabilidad de que estudie en una universidad pri-
vada.
P [V/T] = 194151/158051 =0.7524
b. Si se elige al azar a un ingresante de universidad privada, calcule la probabilidad de que sea mujer.
P [M/V] = 98942/194151 = 0.5096
Ejercicio 90
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a todos los peruanos por los servicios de comunicación con los que contaba su hogar y su
área de residencia, obteniéndose los siguientes resultados:
Distribución de ……………………………….………. según …………………………………….. y
………………………………….
Servicios con que los cuenta el hogar Urbano Rural Total
Hogares sin ningún tipo de servicio 1 682 454 1 468 889 3 151 343
Solo tienen teléfono fijo 480 831 6 170 487 001
Solo tienen teléfono celular 1 299 037 138 721 1 437 758
Solo tienen Internet 3 336 275 3 611
Solo tienen TV por cable 56 343 2 688 59 031
Tienen teléfono fijo y teléfono celular 506 759 2 912 509 671
Tienen teléfono fijo e Internet 15 684 31 15 715
Tienen teléfono fijo y TV por cable 117 733 186 117 919
Tienen teléfono celular e Internet 9 970 84 10 054
Tienen teléfono celular y TV por cable 204 563 1 981 206 544
Tienen Internet y TV por cable 1 288 19 1 307
Tienen teléfono fijo. teléfono celular e Internet 93 103 110 93 213
Tienen teléfono fijo. teléfono celular y TV por cable 326 181 468 326 649
Tienen teléfono fijo. Internet y TV por cable 19 732 9 19 741
Tienen teléfono celular. Internet y TV por cable 15 424 49 15 473
Los cuatro servicios 298 911 133 299 044
Total 5 131 349 1 622 725 6 754 074
Fuente: Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática
122 MA477 Estadística
a. Si se elige al azar un hogar de zona urbana, calcule la probabilidad de que no tenga servicio al-
guno.
b. Si se elige al azar un hogar sin ningún servicio, calcule la probabilidad de que sea de zona rural.
c. Si se elige al azar un hogar de zona urbana, calcule la probabilidad de que cuente con dos servi -
cios.
d. Si se selecciona un hogar al azar, ¿cuál es la probabilidad de que sea de zona urbana y tenga
como mínimo tres servicios?
e. Si se selecciona un hogar al azar, ¿cuál es la probabilidad de que sea de zona urbana o no cuente
con servicio alguno?
Ejercicio 91
La mayoría de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95 octanos y 97
octanos. Con frecuencia, alguna de cada está enriquecida con un aditivo. La tabla siguiente ilustra los
porcentajes de clientes que prefieren cada tipo. Probalidades conjuntas
90 octanos (B) 95 octanos (C) 97 octanos (D) Total
Con aditivo(A) 0.05 0.10 0.05 0.20
Sin aditivo (AC) 0.15 0.40 0.25 0.80
Total 0.20 0.50 0.30 1.00
Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina:
a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?
P ( A∪C c ) =P ( A )+ P ( C c ) −P ( A∩C c ) =0 , 20+0 , 50−( 0 , 05+0 , 05)=0 , 60
b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado ga-
solina de 97 octanos?
c
P( D∩C ) 0 , 30
P ( D/Cc )= = =0 , 60
P (C c ) 0 , 50
c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado ga-
solina sin aditivo?
P ( A c∩Bc ) 0 ,65
P ( A c / Bc ) = = =0 ,8125
P (Bc ) 0 ,80
MA477 Estadística 123
124 MA477 Estadística
P ( A∩B )=P ( A ) P ( B/ A ) =P ( B ) P ( A /B )
Ejercicio 92
Para otorgar un crédito a personas naturales, uno de los requisitos que piden los bancos es que no
debe tener deudas con entidades financieras que superen al 40% de sus ingresos. Para ello consultan
a un sistema interconectado en el que evalúa la tenencia de créditos en las diferentes instituciones
bancarias. Si una persona solicita un crédito a los bancos A y B. El banco B le aprueba el crédito si el
banco A no aprueba. Si la probabilidad de que el banco A no apruebe el crédito es 10%, y la probabili -
dad de que el banco B no aprueba si el banco A rechaza el crédito es 3%. Calcule la probabilidad de
que ambos bancos no aprueben el crédito.
Sean los eventos:
A: El banco A otorga el credito
B: El banco B otorga el credito
P [BC/AC) = 0.03
P [AC] = 0.1
Interseccion
P [BC n AC) =P [AC] * P [BC/AC) = 0.1 * 0.03 = 0.003
Ejercicio 93
Para elegir a una persona entre tres se prepara una bolsa con dos bolas negras y una bola blanca. Los
tres van sacando, por orden, una bola que no devuelven. Quien saque la bola blanca gana. ¿Quién
lleva más ventaja el primero, el segundo o el tercero?
Gana el que saca bola Blanca
2 bolas negras
1 bola blanca
P [ Gana 1] = P [B] = 1/3
P [ Gana 2] = P[N n B] =P [N] * P [B/N] =2/3 * ½ = 1/3
P [ Gana 3] = P[N n N n B] = P [N] * P[N/N] * P[B/NN] = 2/3 * ½ * 1/1 = 1/3
P(A/B) = P(A)
P[A/B]=P[AnB]/P[B] P[AnB]=P[B]P[A/B]
Ejercicio 94
Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer trabajo es del
60% y que sea aceptado en el segundo es del 40%. Si ser aceptado en dichos trabajos es indepen-
diente entre sí.
P [T1] = 0.6 P [T2] = 0.4
Ejercicio 1
Una persona postula a tres trabajos. La probabilidad de que sea aceptado en el primer trabajo es del
0.6, que sea aceptado en el segundo es del 0.4 y en el tercer trabajo es 0.5. Si ser aceptado en dichos
trabajos es independiente entre sí.
a. ¿Cuál es la probabilidad de que sea aceptado en dos trabajos?
Ejercicio 2
El pulpo Paul es un octópodo que ha sido empleado como oráculo para predecir los resultados de la
selección alemana de fútbol en el Mundial de Fútbol 2010, acertando los ocho emparejamientos que
se le propusieron, los siete partidos de Alemania en la Copa Mundial de Fútbol de 2010 y la final en -
tre España y Holanda. Antes de cada partido, a Paul se le presentaron dos contenedores idénticos
con comida: uno de ellos estaba marcado con una bandera, usualmente la de Alemania y el otro con
la bandera del equipo oponente. La elección de Paul se interpretaba como el equipo que lograría la
126 MA477 Estadística
victoria. Si el pulpo Paul, en realidad, escogió los contenedores al azar, calcule la probabilidad de
acertar en los resultados de los ocho los partidos que le propusieron. Asuma independencia.
Ejercicio 3
Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en una chi-
ca acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma independencia en -
tre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo menos con una de ellas.
MA477 Estadística 127
Árbol de probabilidades
Si los eventos Ai y Bi son independientes, el árbol de probabilidades se simplifica dado que las proba-
bilidades condicionales serían iguales a las probabilidades simples correspondientes.
Sean los k eventos A1, A2, A3, ..... , An, mutuamente excluyentes y que constituyen una partición del es-
pacio muestral S, entonces para cualquier evento B de S se cumple:
P ( B ) =P ( B∩ A 1 ) + P ( B∩ A 2 ) + P ( B∩ A3 ) +.. .+ P ( B∩ A n )
Si los k eventos A1, A2, A3, .... , An, constituyen una partición del espacio muestral S, entonces para
cualquier evento B de S tal que P(B) > 0, se cumple:
( B)
Ai P ( A i ∩B )
P =
P ( B)
El teorema de Bayes determina la probabilidad de un determinado evento se deba a una causa espe-
cífica.
128 MA477 Estadística
Ejercicio 4
Actualmente el 40% de nuestra población usa tarjeta Ripley, el 35% tarjeta CMR y 25% tarjeta Metro.
Pero lo más interesante es que el 70% de los que tienen tarjeta Ripley, el 60% de los que tienen tarje-
ta CMR y el 80% de los que tienen tarjeta Metro la usan para realizar compras a crédito.
a. Si se selecciona un cliente al azar, calcule el porcentaje de clientes que han efectuado sus com -
pras crédito.
P [ D] = 0.28 + 0.21 + 0.2 = 0.69 El porcentaje de clientes que han efectuado sus compras cre-
dito es del 69%
b. Calcule el porcentaje de clientes que hacen sus compras con tarjeta CMR y a crédito.
P [C n D] = 0.21 El porcentaje de clientes que hacen sus compras con tarjeta CMR y a credito
del 21%
c. Dado que efectuaron sus compras a crédito. calcule el porcentaje de clientes que usaron tarjeta
CMR. Ripley y Metro para pagar sus compras. Compare e interprete resultados.
P [C / D] = P [C n D] / P [ D] = 0.21 / 0.69 = 0.3043
P [R / D] = P [R n D] / P [ D] = 0.28 / 0.69 = 0.4058
P [M / D] = P [M n D] / P [ D] = 0.2 / 0.69 = 0.2899
Ejercicio 5
En una empresa el 25% de los trabajadores son mujeres y el 75% son hombres. Un día ha llegado tar-
de a trabajar el 3% de las mujeres y el 5% de los hombres.
a. Si se elige, al azar, a un trabajador calcule la probabilidad de que haya llegado tarde.
b. Si se elige, al azar, a un trabajador que ha llegado tarde, calcule la probabilidad de que sea elegida
una mujer.
Ejercicio 6
Para la elaboración de productos naturales enlatados de durazno, higo y uva de 200 gramos, se cuen -
ta con tres máquinas A, B y C las cuales producen el 25%, 45% y 30% de los productos, pero el 5%, 7%
MA477 Estadística 129
y 8% de los productos enlatados producidos por las maquinas A, B y C no cumple con las especifica-
ciones técnicas del contenido neto.
a. Calcule el porcentaje de productos enlatados que no cumplen las especificaciones técnicas.
b. Si una lata no cumple con las especificaciones técnicas, calcule la probabilidad de que haya sido
producida por la máquina A, máquina B, máquina C. Si el valor de estas probabilidades supera a
0.3 entonces, la maquina se debe ser cambiada. Será necesario cambiar alguna de las maquinas.
Ejercicio 7
La probabilidad de que un cajero terminalista muy capacitado de un banco declare que un billete de
100 dólares es falso, si lo es realmente, es de 98%, mientras que crea que es falso un billete verdade -
ro es de 0.4%. Por datos históricos se sabe que el 1.5% de los billetes de 100 dólares que llegan a ese
banco son falsos.
b. Si un cajero terminalista ha declarado un billete como falso, calcule la probabilidad de que sea
verdadero.
130 MA477 Estadística
Ejercicio 8
Una empresa tiene tres vendedores A. B y C. los cuales han realizado. durante el último mes.
el 30%. 20% y 50% de las operaciones respectivamente. Se selecciona al azar una operación
de venta.
100%
90%
90% 87%
84%
80%
70%
60%
Porcentaje
A
50%
B
40% C
30%
20% 13%
16%
10%
10%
0%
Si No
Error en la compra
b. Si se selecciona al azar una operación de venta y ésta tiene error en la orden de compra; determi-
ne la probabilidad de que la operación de venta corresponda al vendedor B.
Ejemplo 22.
El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en
efectivo, con cheque o al crédito, con probabilidades respectivas de 0.3; 0.3 y 0.4. La probabilidad de
que una venta sea por más de $50, es igual a 0.2 si ésta es en efectivo, es igual a 0.9 si ésta es con
cheque y es igual a 0.6 si ésta es al crédito.
Solución
Sean los eventos:
E: La compra se realiza con dinero en efectivo
CH: La compra se realiza con cheque
C: La compra se realiza al crédito
M: La compra es por más de $ 50
MC: La compra no es por más de $ 50
Se pide calcular:
b)
Ejercicios propuestos
77. Si usted tiene 6 libros diferentes del curso A, 2 del curso B, 4 del curso C y desea colocarlos en un
estante:
a. ¿De cuántas maneras diferentes pueden colocarse, si los libros de cada curso deben estar
juntos?
b. ¿De cuántas maneras diferentes pueden colocarse, si solo los libros del curso C deben estar
juntos?
78. Con la finalidad de realizar un focus group una empresa decide elegir aleatoriamente un grupo
de trabajadores de un total de 7 trabajadores del sexo femenino, y 12 trabajadores del sexo
masculino que consideran que hay un clima laboral inadecuado en la empresa.
Nota: Para cada una de las siguientes preguntas, desarrolle el procedimiento, justificando cada
paso que realice.
a. ¿Cuántos casos posibles existen si se eligen 8 trabajadores, al azar, sin reemplazo y sin inte-
rés en el orden?
b. Si de cada género se eligen al azar, sin reemplazo y con interés en el orden, tres trabajadores;
¿cuántos casos posibles existen?
c. Se elige al azar un género, y del género elegido se eligen al azar y con reemplazo cuatro tra -
bajadores, ¿cuántos casos posibles existen?
82. Se ha recibido dos lotes de artículos I y II. El lote I contiene 4 artículos de calidad A, 4 de calidad
B, y 2 de calidad C. El lote II contiene 5 artículos de calidad A, 3 de calidad B, y 2 de calidad C.
Para realizar un control de calidad se deberá tomar de cada lote una muestra aleatoria sin reem -
plazo.
a. Si se eligen dos artículos de cada lote, halle la probabilidad de que uno de ellos sea de calidad
C.
b. Si se eligen dos artículos de cada lote, y resulta que es de calidad A, halle la probabilidad de
que dicho artículo provenga del lote II.
134 MA477 Estadística
83. Suponga que en la empresa PUBLISA se tiene solamente los departamentos: A y B. En el depar -
tamento A laboran 20 personas, de las cuales: 10 son profesionales, 5 son técnicos, y 5 tienen
educación secundaria. En el departamento B laboran 16 personas, de las cuales: 9 son profesio -
nales, 4 son técnicos, y 3 tienen educación secundaria.
a. Si se elige al azar un departamento, y de él se eligen al azar y sin reemplazo una tras otra tres
personas, ¿cuántos casos posibles de selección existen? (Deje indicada su respuesta).
b. Si se elige al azar un departamento, y de él se eligen al azar y sin reemplazo una tras otra tres
personas. Determine la probabilidad de que solamente la última persona elegida sea profe-
sional. (Deje indicada su respuesta)
c. Si se eligen al azar y sin reemplazo dos personas de cada departamento, halle la probabilidad
de que al menos una de dichas personas sea profesional. (Deje indicada su respuesta)
d. Si se eligen al azar y con reemplazo tres personas de la empresa PUBLISA, halle la probabili-
dad de que una de ellas sea un técnico.
e. Si ambos departamentos tienen la misma probabilidad de ser elegidos, y se realiza el siguien -
te proceso de selección: primero se elige al azar un departamento y de él se eligen al azar y
sin reemplazo dos personas, una tras otra. Determine la probabilidad de que la persona ele -
gida labore en el departamento A, si se conoce que la última persona elegida fue un profesio-
nal.
84. Suponga que se tiene el siguiente cuadro en relación a cantidad de medidores de consumo de
agua, distribuidos en dos zonas (Z1 y Z2), clasificados por marca (M1, M2) y por modelo (A y B).
Nota: En cada una de las siguientes preguntas de este problema 2, debe identificar debidamen -
te a los eventos y desarrollar en forma clara el procedimiento, justificando cada paso. Se reco-
mienda trabajar con fracciones.
a. De cada zona se seleccionan, al azar y sin reemplazo, tres medidores. Establezca la cantidad
de elementos que tiene el espacio muestral. Luego, determine la probabilidad de seleccio-
nar dos medidores de la marca M1 y del modelo B de la Zona 1, si se sabe que se seleccio -
naron cinco medidores de la marca M1 y del modelo B.
b. Suponga que, primero, se selecciona al azar una zona, y que la elección de la zona 1 (Z1) es -
tá en relación 3 a 2 con la elección de la zona 2 (Z2). Luego, de la zona seleccionada, se elige
MA477 Estadística 135
Caso Metropolitano
85. El 70% de los usuarios usan el Metropolitano para dirigirse a su trabajo, el 60% lo usa para regre-
sar a su casa y el 40% lo usa para ir a su trabajo y regresar a su casa.
a. ¿Cuál es la probabilidad de que un usuario seleccionado al azar use el servicio para dirigirse a
su trabajo o para regresar a su casa?
b. ¿Cuál es la probabilidad de que un usuario seleccionado al azar use el servicio solo para diri -
girse a su trabajo o solo para regresar a su casa?
c. Si el porcentaje de trabajadores que usan el servicio solo una vez al día es menor al 80% el
concesionario implementará un servicio denominado “el súper rápido”. Según sus resultados
la decisión será:
86. Para lograr este objetivo la consultora SY DATA, ganadora para realizar el estudio, seleccionó
una muestra de 200 usuarios de las estaciones Javier Prado, Angamos y Canaval y Moreyra del
Metropolitano. La distribución de los usuarios se presenta en las siguientes tablas de doble en-
trada:
87. Objetivo específico 1: Analizar el comportamiento de los ganadores de un sorteo de tarjetas con
pasajes libres durante un mes, para fidelizar a los usuarios del Metropolitano.
El concesionario del Metropolitano, con la finalidad de fidelizar a los usuarios, realiza un sorteo
relámpago en la estación Canaval y Moreyra, ha decidido otorgar cuatro tarjetas con pases libres
durante un mes, para ello selecciona al azar a los ganadores de los 15 que encuentra en la esta -
ción, de los cuales tres son mujeres ¿cuál es la probabilidad de que reciba el premio al menos
una mujer?
136 MA477 Estadística
88. Objetivo específico 2: Comparar el principal problema por estación, para implementar mejoras
en el servicio.
Para lograr este objetivo la consultora SY DATA, ganadora para realizar el estudio, seleccionó
una muestra de 200 usuarios de las estaciones Javier Prado, Angamos y Canaval y Moreyra del
Metropolitano. La distribución de los usuarios se presenta en las siguientes tablas de doble en-
trada:
89. Objetivo específico 3: Evaluar la confianza de los usuarios del aplicativo para celulares con infor-
mación de los horarios de llegada de los buses para la implementación de otros aplicativos.
El concesionario del Metropolitano ha implementado un aplicativo para celulares, que advierte
el horario de llegada de buses. Para evaluar la confianza de los usuarios de este aplicativo. La
consultora SY DATA selecciona 200 usuarios al azar que tienen instalados este aplicativo: 70 de
la estación Javier Prado, 50 de Canaval y Moreyra y 80 de Angamos. De un sondeo previo se tie -
nen que el 80% de los usuarios de Javier Prado, 70% de los usuarios de Canaval y Moreyra y 50%
de los de Angamos, tienen confianza en el aplicativo. Si se elige un usuario al azar:
a. ¿Cuál es la probabilidad de que tenga confianza en el aplicativo?
b. Si el usuario tiene confianza en el aplicativo, ¿cuál es la probabilidad de que sea de la esta -
ción de Canaval y Moreyra?
c. Si más del 50% de los usuarios que tienen confianza con el aplicativo son de la estación de
Canaval y Moreyra, el concesionario implementará un servicio muy rápido para demostrar
que la aplicación muestra información para reducir el tiempo de espera, ¿los resultados su -
gieren al concesionario implementar el servicio en la estación Canaval y Moreyra?
90. Objetivo específico 4: Determinar la opinión del usuario acerca del servicio por estación, para
implementar mejoras en el servicio
Pro Transporte desea identificar ¿cuál es la opinión de los usuarios acerca del servicio del Metro-
politano por estación? Para ello la consultora le presenta los siguientes gráficos:
MA477 Estadística 137
Javier Prado
35%
Fuente: SY DATA
70%
60%
66% Malo
50% 68%
70% Regular
40% Bueno
30%
20%
10% 18% 22%
12%
0%
Angamos Javier Prado Canaval y Moreyra
Fuente: SY DATA Estación del Metropolitano
a. Si se selecciona un usuario al azar y este opina que el servicio es malo, ¿cuál es la probabili -
dad de que sea de la estación de Angamos?
b. Pro Transporte en las recomendaciones del estudio indica que si más del 60% de los usuarios
que opinan que el servicio es malo son de la estación de Angamos, sugiere al concesionario
ampliar una ventanilla para recargas para evitar un mayor tiempo de espera, ¿los resultados
indican que el concesionario debe ampliar una ventanilla?
91. La probabilidad que un usuario sufra un robo en la estación Canaval y Moreyra es 0.2 y que sufra
un robo en la estación Javier Prado es 0.05. Asumiendo que el sufrir robo en las estaciones es in -
dependiente y que un usuario. en determinado día acude a las dos estaciones:
a. ¿Cuál es la probabilidad que le roben en una de las estaciones?
b. ¿Cuál es la probabilidad que le roben en ambas estaciones?
c. ¿Cuál es la probabilidad que no le roben?
d. ¿Cuál es la probabilidad que le roben en al menos una estación?
92. La probabilidad que un usuario sufra un robo en la estación Canaval y Moreyra es 0.2, que sufra
un robo en la estación Javier Prado es 5% y en Angamos es 0.08. Asumiendo que el sufrir robo
en las estaciones es independiente y que un usuario, en determinado día acude a las tres esta-
ciones, ¿cuál es la probabilidad que le roben en al menos una de las estaciones?
Caso: Cacao S.A.
93. Objetivo específico 1: Analizar el grado de iniciativa por género y grupo de edad de los trabaja -
dores, para implementar un programa de capacitación
La consultora seleccionó una muestra de 150 trabajadores. Mostrando la distribución de los tra -
bajadores en la siguiente tabla:
Distribución de usuarios según grado de iniciativa, género y grupo de edad
Hombre (H) Mujer (M)
Total
Grado de iniciativa Joven (J) Adulto (G) Joven (J) Adulto (G)
Grado 2 (A) 15 5 10 5 35
138 MA477 Estadística
Grado 3 (B) 7 9 9 9 34
Grado 4 (C) 8 12 8 10 38
Grado 5 (D) 7 20 5 11 43
Total 37 46 32 35 150
Fuente: CACAO S.A.
95. Objetivo específico 2. Analizar la productividad de los centros de producción para otorgar un
bono de productividad.
El gerente de Cacao S.A preocupado por la baja productividad en los centros de producción del
Callao, Los Olivos y Ate. Los resultados de los años anteriores indican que la productividad fue
efectiva para el centro de producción del Callao en un 90%, para Los Olivos en un 85%; mientras
que para Ate fue en un 70%. Si cada centro de producción trabaja de manera independiente
a. Calcule la probabilidad que la productividad fue efectiva en al menos un centro de produc -
ción.
b. Calcule la probabilidad que la productividad fue efectiva solo en dos centros de producción.
c. Calcule la probabilidad que la productividad no fue efectiva en ningún centro de producción.
d. Si la probabilidad de que la productividad sea efectiva en al menos un centro de producción
es mayor a 0.85; se otorgará un bono de productividad a los trabajadores, ¿los resultados in-
dican que debe otorgarse el bono a los trabajadores?
MA477 Estadística 139
96. Objetivo específico 3. Analizar la capacitación de los trabajadores según categoría laboral para
la implementación de un programa de capacitación.
La distribución de los trabajadores de la empresa Cacao SA según categoría laboral es el 42% son
administrativos, 12% son directivos y el resto son obreros. Además, el 60% de los empleados,
70% de los directivos y el 30% de los obreros han recibido algún curso de capacitación en el pre -
sente año. Se elige un trabajador al azar.
a. Calcule la probabilidad de que haya recibido algún curso de capacitación en el presente año.
b. Calcule la probabilidad de que un sea directivo y no haya recibido capacitación alguna.
c. Si recibió alguna capacitación en el año, calcule la probabilidad de que sea directivo.
d. Si la empresa está dispuesta a implementar un programa de capacitación para la categoría la-
boral que tenga menor probabilidad de haber recibido algún curso de capacitación, ¿a qué
categoría laboral debe orientarse este programa? Justifique sus respuestas.
140 MA477 Estadística
97. El jefe de producción de la empresa Cacao S.A. afirma que más del 50% de los trabajadores tie -
nen grado de iniciativa 5 y además de los trabajadores que tienen grado de iniciativa 5 más del
35% son del centro de producción de Ate.
Se llama rango o recorrido de una variable aleatoria X y lo denotaremos RX, al conjunto de los valores
reales que ésta puede tomar.
Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito nu-
merable. (o sea que pueda escribir los posibles valores)
Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se denota
P(X = x).
Una variable aleatoria continua, es aquella que tiene un rango infinito – No numerable. Ejm del
tiempo en segundos
Por ejemplo: número de alumnos matriculados por curso, cantidad de preguntas correctamente con -
testadas en una evaluación de personal, cantidad de clientes que visitan un centro comercial en un
día determinado.
La distribución de probabilidad de una variable aleatoria discreta X se describe como una función de
probabilidad representada por f(x) que asigna a cada valor de la variable aleatoria, la probabilidad de
que X asuma ese valor, esto es:
f(x) = P(X = x)
142 MA477 Estadística
Ejemplo 23.
Calcule a para que la siguiente función sea una función de probabilidad: cumple con los requisitos
f ( x )=ax x=10 , 15 , 20 , 25
Solución
Tiene que cumplir dos condiciones:
La primera condición, f(x) > 0, se cumple cuando a es mayor que cero, puesto que x > 0.
La segunda condición, , se cumple si a10+15 a+20 a+25 a=1 , esto se cumple cuan-
do 70a =1, luego a =1/70
Ejercicio 9
Indique cuáles de las siguientes funciones puede ser función de probabilidad.
Ejercicio 10
Indique cuáles de las siguientes funciones puede ser función de probabilidad.
{
x
x= 2, 3 , 5
f ( x )= 10
0 en otro caso
Ejercicio 11
En un lote de 30 polos hay tres con fallas. Se toma una muestra aleatoria de cinco polos y se define la
variable aleatoria X como el número de polos defectuosos en la muestra.
a. Determine y grafique la función de probabilidad de la variable X.
Ejercicio 12
Se tiene la posibilidad de invertir en acciones o en instrumentos de renta fija. Se supone que se espe -
ran tres posibles escenarios: expansión, recesión o estabilidad de la economía en la que se negocian
los instrumentos. La siguiente tabla muestra las utilidades bajo estos tres escenarios:
Escenario
Invertir en Expansión Estabilidad Recesión
Acciones 720 550 -1050
Instrumentos de renta fija 350 120 -200
Probabilidad 0.1 0.6 0.3
Obtener la utilidad esperada para cada una de las opciones.
Ejercicio 13
La solicitud de préstamo que presentan los clientes de un banco puede ser aceptada o negada por el
gerente de préstamos. Se desea realizar un estudio sobre la distribución de la cantidad de solicitudes
aceptadas por el gerente de préstamos. La siguiente tabla muestra la distribución de probabilidad de
la variable aleatoria X:= número de solicitudes aceptadas por día por el gerente de préstamos.
X 0 1 2 3 4 5
f(x) = P(X = x) 0.05 0.15 0.05 2k 0.15 k
b. Si se sabe que el gerente puede aceptar al menos una solicitud al día, ¿cuál sería la probabilidad
que tenga que aceptar a lo más cuatro solicitudes al día?
d. Para la revisión de cada solicitud de crédito, el gerente de préstamos demora 30 minutos. Deter -
mine el tiempo esperado que le demanda diariamente este proceso.
MA477 Estadística 145
Ejemplo 24.
Sea X una variable aleatoria con la siguiente función de probabilidad. Calcule el valor esperado de X2
Solución
Ejercicio 14
La demanda diaria de un producto es una variable aleatoria X cuya distribución de probabilidades es
simétrica y está dada por la tabla siguiente:
x 1 2 3 4 5
f(x) a 0.20 b c 0.05
La empresa obtiene por cada unidad demandada de producto 100 soles de utilidad. Si la cantidad de -
manda en un día es mayor a dos unidades, se obtiene una utilidad adicional de 15 soles por unidad
demandada de producto.
a. Calcule el valor de a, b y c.
b. Determine la probabilidad que la demanda diaria sea de por lo menos tres productos.
Se cumple
La varianza de la variable aleatoria X, V(X), también se denota por , o simplemente como .
5.5.1. Propiedades de la varianza en variables aleatorias
Si Y = aX + b. con a y b son constantes, entonces
Si X1, X2, . . ., Xn son n variables aleatorias independientes, y a1, a2,. . .. an son n constantes, enton-
ces:
Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma función de probabili-
dad. entonces se cumple que y, por lo tanto:
2
V ( X 1 + X 2 +. . .+ X n )=nσ
Ejemplo 25.
Sea X una variable aleatoria con la siguiente función de probabilidad. Calcule la varianza de X.
Solución
El esperado de X es
Ejercicio 15
Un restaurante pone a la venta diariamente diversas ensaladas. El número de ensaladas demandadas
diariamente se modela con una variable aleatoria X que tiene la siguiente distribución de probabili-
dad.
X 12 15 17 18 20 25
f(x) a 0.12 0.35 2a 0.14 0.09
El costo de una ensalada es de 4 soles y las vende a 6 soles. La ensalada no vendida en el día se dese -
cha.
Calcule el valor de a.
Calcule la desviación estándar de la utilidad diaria, si el restaurante prepara 20 ensaladas por día.
x 12 15 17 18 20 25
f(x) 0.12 0.35 0.14 0.09
U(x)
MA477 Estadística 147
148 MA477 Estadística
Las pruebas son idénticas y cada una de ellos puede resultar en uno de dos posibles resultados que
denotan éxito o fracaso.
Solo tenemos 2 opciones, el de éxito o fracaso
Ojo: el éxito o fracaso depende de como defines tu variable
Las pruebas son independientes entre sí por lo que el resultado de un intento en particular no influ -
ye en el resultado de cualquier otro.
No importa que paso antes, lo que pasara después dependerá de azar, lo que ocurre prevaimente no
influye en lo que ocurrirá después
Se dice que la variable aleatoria X sigue una distribución binomial con parámetros n y p, se denota
X~B (n, p)
Características
Es simétrica si p = 0.5, Para valores de p < 0.5 la distribución tiene sesgo derecho y para valores
p > 0.5 tiene sesgo izquierdo, independientemente de los valores de n.
Para valores de n suficientemente grandes (n > 50), y sólo tomando en cuenta los valores rele-
vantes de probabilidad, la distribución es prácticamente simétrica.
Media = E(X) = np
Varianza 2 = V(X) = np(1 – p)
En Excel, use la función =DISTR.BINOM.N(Núm_éxito; Ensayos; Prob_éxito; acumulado)
MA477 Estadística 149
Ejercicio 16
Juan ha decidido invertir su dinero en dólares. Cada vez que el dólar sube, él gana 1000 soles pero
cada vez que baja, pierde 600 soles. Si se sabe que la probabilidad de que el precio del dólar suba en
un día es de 0.47. Juan quiere analizar el comportamiento del precio del dólar durante los siguientes
10 días.
Ejercicio 17
A diez trabajadores de una AFP, se les preguntan si se quedan en el esquema actual de comisión por
remuneración o si migran a otra opción, en un sondeo previo el 60% de los trabajadores prefieren
este sistema porque les garantiza un mayor fondo para su jubilación. Calcule la probabilidad de que
por lo menos nueve trabajadores de los 10 opten por quedarse con el sistema actual.
Solución
La variable en estudio es………………….…………………………………………………………………………..…………………..
El rango o recorrido de la variable X es ………………………………………………………………………………..………..…
La distribución y sus parámetros es ………………….….…………………………………………………………………………
Ejercicio 18
Una compañía de comida rápida sabe que el 85% de sus tiendas por franquicia tendrán éxito comer -
cial. Si el éxito de cada tienda se puede considerar independiente de las demás tiendas.
Solución
Solución
MA477 Estadística 151
Consideremos N elementos, de los cuales r son considerados éxitos y por lo tanto N - r como fraca-
sos. Como en el caso de la distribución binomial estamos interesados en saber la probabilidad de ob -
tener x éxitos en una muestra de n elementos.
El rango de X en la mayoría de los casos va de 0 a n, pero no siempre, por lo que se debe analizar en
cada caso.
Se dice que la variable aleatoria X sigue una distribución hipergeométrica con parámetros N, r y n y
se denota X ~ H (N, n, r)
Características
Media
Varianza
En Excel. use la función =DISTR.HIPERGEOM.N(muestra_éxito; núm_de_muestra;
población_éxito; núm_de_población; acumulado)
Ejercicio 19
Un comerciante recibe un lote de 30 computadoras portátiles. Para protegerse de una mala remesa,
el comerciante revisará diez computadoras y rechazará todo el lote si encuentra una o más computa -
doras defectuosas. Si en el lote hay seis computadoras defectuosas, ¿cuál es la probabilidad de que
rechace el lote?
Solución
Rx = { 0. 1. 2. … . 6 } max { 0; n – ( N – r ) } = 0 …. Min ( n , r ) = 6
Ejercicio 20
La empresa San Fernando ha lanzado una campaña para salvar sus ventas. Si de un total de 60 perso -
nas, donde 34 recuerdan la campaña, se eligen al azar a ocho personas para entrevistarlos, calcule la
probabilidad de elegir al menos a tres personas que recuerden la campaña.
Solución
El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina
proceso de Poisson y posee las siguientes propiedades:
0.16
0.14
0.12
0.10
0.08
f(x)
0.06
0.04
0.02
0.00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X
Se dice que la variable aleatoria X sigue una distribución Poisson con parámetro y se denota X ~
P().
Características
Siempre es una distribución sesgada a la derecha. A medida que aumenta y tomando en cuenta
sólo los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.
Media: = E(X) =
Varianza: 2 = V(X) =
Ejercicio 21
El número promedio de clientes que llegan a un determinado cajero automático de una agencia ban -
caria es 4.2, por cada 20 minutos, según un proceso de Poisson.
Eventos independientes
Px = {0, 1, 2, 3, …} Rango infinito, numerable
.: X ~ P [ = 4.2 clientes / 20 min]
b. ¿Cuál es la probabilidad de que, en un periodo de dos minutos, lleguen más de un cliente al caje-
ro?
c. ¿Cuál es la probabilidad de que, en un periodo de cinco minutos, lleguen menos de dos clientes?
Ejercicio 22
En una pastelería, el número demandado de un cierto tipo de torta se modela con una variable Poi-
sson con una media de tres tortas al día. La pastelería, siempre produce tres tortas diarias. Cada torta
cuesta producirla 50 soles y se vende a 80 soles. Toda torta no vendida en el día se remata en 20 so -
les y siempre las compran todas las tortas a ese precio. Calcule el valor esperado de la utilidad por di-
cho concepto.
Ejercicio 23
La llegada de reclamos a Indecopi sigue un proceso Poisson con media de cinco reclamos
cada cuatro minutos. Determine la probabilidad que en 20 minutos se presenten por lo me-
nos dos reclamos.
156 MA477 Estadística
Ejemplo 26.
Suponga que el número de llamadas que llegan a una central telefónica es 0.5 por minuto
en promedio. Calcule la probabilidad de que:
Solución
X:= número de llamadas / minuto = 0.5 llamadas / minuto
Solución
P(X > 3) = 1 – P(X ≤ 3) = 1 – (0.6065 + 0.3033 + 0.0758 + 0.0126) =1- 0.9982=0.0018
Solución
Y:= número de llamadas / 3 minutos = 1.5 llamadas / 3 minutos
P(Y < 5) = 0.2231 + 0.3347 + 0.2510 + 0.1255 + 0.0471 = 0.98142
Solución
Se define la variable aleatoria W:= número de llamadas cada cinco minutos.
= 2.5 llamadas / 5 minutos
P(W > 2) = 1 – P(W ≤ 2) = 1 – (0.0821 + 0.2052 + 0.2565) = 0.45652
Ejemplo 27.
El administrador de un almacén ha observado que en promedio ingresan al establecimiento
20 personas cada 30 minutos. ¿Cuál es la probabilidad de que en 6 minutos ingresen al al-
macén a lo más cinco clientes, pero más de tres?
Solución
Lo primero es definir la variable adecuada, sea X:= número de personas que entren al establecimien-
to en un periodo de seis minutos.
Como nos dicen que la variable cuenta las llegadas por unidad de tiempo, se tiene que X ~ P().
Luego, debemos determinar el valor de , para lo cual vamos a hacer una regla de tres simple, pues
es una propiedad de la distribución Poisson
Nos piden
MA477 Estadística 157
Ejercicio 24
Si se sabe que en cada 100 metros de longitud de un cable hay un promedio de 80 puntos
por los cuales este puede ser seccionado. ¿Cuál es la probabilidad de que en un tramo de
13.5 metros se encuentren cinco puntos de seccionamiento?
Solución
Como nos dicen que la variable cuenta puntos por unidad de longitud, se tiene que X ~ P()
Luego, debemos determinar el valor de , para lo cual vamos a hacer una regla de tres simple, pues
es una propiedad de la distribución Poisson
Si en 100 metros hay en promedio 80 puntos de seccionamiento, entonces en 13.5 metros hay, en
promedio, .= 10.8 puntos.
Nos piden
Observe que si lambda sale un valor que no es entero. no se debe redondear a un entero.
158 MA477 Estadística
Se denomina función de densidad de probabilidad f(x) de una variable aleatoria continua a la fun-
ción que satisface:
para todo x R
Se tiene que
Ejercicio 25
Para cierto negocio por correo electrónico la proporción de los pedidos procesados en 24
horas tiene la función de densidad de probabilidad:
[ ] ()
1 1 1
1 1
1=∫ a (1−x ) dx=a∫ ( 1−x ) dx=a x− x 2 =a → a=2
0 0 2 0 2
[ ] []
1 1 1
Ejercicio 26
La duración, en minutos, de una llamada telefónica de una vendedora de una línea de crédito para
consolidar deudas en otros bancos puede modelarse por una variable aleatoria X con la siguiente
función de densidad:
a. Determine el valor de a.
c. Si una llamada ya duró un minuto, calcule la probabilidad de que dure al menos un minuto más.
La función de distribución acumulada (FDA) de una variable aleatoria continua X con función de den-
sidad f(x) se define por:
F(x) = P(X x) para - < x < +
P(a < X < b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b) = F(b) – F(a)
F(x) es una función que siempre está entre 0 y 1 (0 ≤ F(x) ≤ 1). pues es igual a una probabilidad.
Ejercicio 27
Marque la(s) gráfica(s) que pueden ser funciones de distribución acumulada.
Ejercicio 28
Para cierto negocio por correo electrónico la proporción de los pedidos procesados en 24
horas tiene la función de densidad de probabilidad.
Ejercicio 29
La proporción de personas que responden a una encuesta enviada por correo electrónico por la Su-
perintendencia de Banca y Seguros para conocer sobre las opiniones de los usuarios sobre las nuevas
comisiones que cobrarán las AFP se modela con una variable aleatoria X con la siguiente función de
densidad:
b. Use la función de distribución acumulada para calcular la probabilidad de que respondan entre
60% y 80% de las personas a la encuesta.
c. Use la función de distribución acumulada para calcular la probabilidad de que respondan más de
la mitad de las personas a la encuesta.
162 MA477 Estadística
Ejemplo 28.
El tiempo de vida de un sistema es una variable aleatoria (en años) cuya función acumulada es:
Solución
Sea X:= tiempo, en años, de vida de un sistema. Para calcular el rango intercuartil, debemos hallar el
cuartil 1 y el cuartil 3, para esto hay dos posibilidades:
Integrar la función de densidad f(x)
Reemplazar en la función de distribución acumulada
Por definición de cuartil 3, el 75% de los datos es menor o igual al él, es decir P(X ≤ Q3) = 0.75, o lo
que es lo mismo F(Q3) = 0.75
Solución
Como nos dicen que “ya se sabe que está en el cuarto superior”, es una probabilidad condicional.
El valor esperado o esperanza matemática de una variable aleatoria X o media de una variable
aleatoria X se denota E(X).
Sea G(X) una función de la variable aleatoria X. El valor esperado de G(X) es:
MA477 Estadística 163
Si X1, X2, X3, . . ., Xn son n variables aleatorias, y a1, a2, a3, . . ,. an son n constantes, entonces:
Si X1, X2, X3, . . ., Xn son n variables aleatorias con la misma función de densidad, entonces se cum-
ple que E(Xi) = , por lo tanto:
Ejercicio 30
Una empresa sabe que el tiempo, en años, que tarda una lavadora en necesitar la primera reparación
importante puede modelarse por una variable aleatoria X con la siguiente función de densidad de
probabilidad:
Calcule el valor esperado del tiempo que tarda una lavadora en necesitar la primera reparación im-
portante.
Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma función de densidad,
entonces se cumple que V(Xi) = 2 y, por lo tanto:
164 MA477 Estadística
Ejercicio 31
El rendimiento promedio de una acción en el primer día que se negocia en la bolsa es una variable
aleatoria continua X tiene la siguiente función de densidad de probabilidad:
a. Determine el valor de a.
Características
Media:
Varianza:
Ejercicio 32
La variable X se distribuye uniformemente con media igual a 24 y varianza igual a 12, calcule los pará-
metros de la función de densidad.
Solución.
Media = (a + b) / 2 = 24 a + b = 48 …. (1) b = 30 a = 18
Var = (b – a) ^2 / 12 = 12 b – a = 12 …. (2)
166 MA477 Estadística
Ejercicio 33
La función de Excel =ALEATORIO() genera un número con distribución uniforme con parámetros a
igual a cero y b igual a uno. Sea X una variable aleatoria definida como el número generado por dicha
función.
c. Calcule la probabilidad de que la función genere un número aleatorio entre 0.30 y 0.85.
d. Use la función de distribución acumulada para calcular P(0.15 < X < 0.65).
MA477 Estadística 167
Ejemplo 29.
En ciertos experimentos, el error cometido al determinar la densidad de una sustancia es
una variable aleatoria cuya distribución es uniforme con a = -0.025 y b = 0.025.
Solución
Sea X:= error al determinar la densidad de una sustancia
La variable X ~ U(a = -0.025. b = 0.025) tiene la siguiente función de densidad
Nos piden P(0 , 010≤ X≤0 , 015 ) . Existen dos formas de calcular esta probabilidad: integrando la
función de densidad f(x) o calculándola a partir del área del rectángulo.
Solución
La variable X ~ U(a = -0.025. b = 0.025) tiene el siguiente número esperado de errores
Ejercicio 34
La llegada de cada uno de los empleados a su centro de labores se produce independiente -
mente, de acuerdo a la distribución uniforme en el intervalo comprendido entre las 8:00 y
8:25 am. De una muestra de 10 empleados, calcule la probabilidad de que cuatro de ellos
hayan llegado entre las 8:15 y 8:20 AM.
Solución
Sea X:= tiempo. en minutos. desde las 8 AM hasta la hora de llegada de los empleados al centro de
trabajo, luego XU (0, 25)
Se define la variable Y:= número de empleados que llegan al centro de trabajo entre 8:15 y 8:20 AM
Debe calcularse la probabilidad de éxito p de que un empleado llegue al centro de trabajo entre 8:15
y 8:20 AM esto es:
Se pide:
168 MA477 Estadística
Una distribución continua de probabilidad que es útil para describir el tiempo necesario para realizar
alguna actividad es la distribución de probabilidad exponencial.
Función de densidad
−x
1 β
f ( x)= e para x > 0. β > 0
β
1.5
Beta = 0.5
1.0 Beta = 1.0
Beta = 2.0
0.5
0.0
Esta distribución se puede usar en variable como: el tiempo que tardará una máquina de cajero auto -
mático en entregar efectivo. Esta función puede usarse para determinar la probabilidad de que el
proceso tarde como máximo un minuto.
P [ X < x ] = F (x)
Características
Si la cantidad de eventos discretos que suceden en un tiempo sigue una distribución de Poisson con
media λ entonces el tiempo entre la ocurrencia de dos eventos discretos consecutivos sigue una dis-
tribución exponencial con media β = 1 / λ.
MA477 Estadística 169
Ejercicio 35
El tiempo de duración, en horas, de un dispositivo electrónico es una variable aleatoria que tiene la
siguiente función de densidad:
x
1 −
f ( x )= e 50
50 . x≥0
b. ¿Cuántas horas como mínimo debe durar uno de estos componentes para ser considerado dentro
del 20% de los más durables?
c. ¿Cuánto debe ser la duración máxima para considerar este componente dentro del grupo del 15%
de los menos durables?
Ejercicio 36
El tiempo de respuesta de un departamento de bomberos a una llamada de emergencia es de quince
minutos en promedio y se distribuye exponencialmente.
a. ¿Cuál es la probabilidad de que el tiempo de respuesta sea menor a 12 minutos?
Ejercicio 37
La empresa A se dedica a la fabricación de focos. La duración, en cientos de horas, de un foco se mo -
dela con una variable aleatoria continua X con la siguiente función de densidad:
{
−x
f (x )= e para 0<x<∞
0 c.c
Supóngase que el costo de fabricación de foco es de $50. El fabricante vende el artículo a $125, pero
garantiza una devolución y reintegra si el foco dura menos de 90 horas. ¿Cuál es la utilidad esperada
por artículo?
Ejercicio 38
El número clientes que llega a Bucks Café sigue una distribución de Poisson con una media de seis
clientes cada hora.
a. Calcule la probabilidad de que el tiempo transcurrido entre la llegada de dos clientes consecutivos
sea más de 10 minutos pero menos de 20 minutos.
Ejercicio 39
La duración, en minutos, de una conversación telefónica de larga distancia nacional tiene distribución
exponencial con un promedio de ocho minutos.
a. ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos?
c. ¿Cuánto debe durar, como mínimo, una llamada para estar en el 10% de las de mayor duración?
d. Si ya pasaron cinco minutos, calcule la probabilidad que la llamada dure al menos 4 minutos más.
Ejercicio 40
Un componente de un equipo electrónico tiene un tiempo de vida que se modela con una variable
exponencial con una media de 500 días.
a. ¿Cuál es la probabilidad de que un componente dure más de 800 días?
b. ¿Cuánto tiempo de duración tienen, como máximo, el 90% de los componentes producidos?
c. ¿Cuánto tiempo de duración tienen, como mínimo, el 15% de los componentes producidos?
172 MA477 Estadística
Función de densidad
Se dice que la variable aleatoria X sigue una distribución normal con parámetros y .
Se denota: X ~ N (, 2)
Características
La función de densidad tiene forma de campana y es simétrica. por lo que las medidas de ten -
dencia central coinciden.
El rango de la variable normal es toda la recta real. esto es. De – a + .
En Excel, use la función =DISTR.NORM.N(x; media; desviación estándar; acumulado)
En Excel, use la función =INV.NORM(Probabilidad; media; desviación estándar)
5.12.3. Estandarización
Se toma como referencia una distribución normal estándar ( = 0 y 2 = 1). Se trabaja con la distancia
entre x y en función de la desviación estándar, tal como se muestra.
Ejercicio 41
Si . calcule:
a. P(Z > 1.03) = ………………………………
b. P(Z > 1.14) = ………………………………
c. P(0.15 < Z < 1.18) = ………………………………
d. Hallar c para que P(Z < c) = 0.88100 ………………………………
e. Hallar c para que P(-c <Z < c) = 0.79945 ………………………………
MA477 Estadística 173
Ejercicio 42
Si , calcule:
P(X < 11)
Ejercicio 43
El ingreso mensual de los trabajadores de Lima Metropolitana en los meses de abril a junio de 2018,
sigue una distribución normal con una media de S/. 1625 y desviación estándar de S/. 500. Informa-
ción que fue proporcionada por el INEI. En base a esto datos se pide:
b. Calcule el ingreso mensual mínimo para estar en el 15% de las personas que más ganan.
c. Si los descuentos correspondientes por AFP, y otros están dados por la función Y = 0.11X + 50 so-
les, calcule el porcentaje de personas que se les descuenta más de 300 soles.
d. Si se quiere que el porcentaje de trabajadores limeños que ganan menos de 900 soles sea el 7.5%,
¿cuánto se le debe aumentar a cada trabajador?
MA477 Estadística 177
Ejercicio 44
Se tiene un portafolio diversificado, los retornos del portafolio en porcentajes es una variable aleato -
ria normal con media cinco y desviación estándar 1.25
a. Calcule la probabilidad que los retornos del portafolio se encuentren entre 4.2% y 7.1%.
c. Determine el retorno máximo que corresponde al 8.5% de los retornos más bajos.
d. Determine el retorno mínimo que corresponde al 20% de los retornos más altos.
178 MA477 Estadística
Ejercicio 45
El tiempo de respuesta de un monitor LCD es el tiempo que tarda en mostrar las imágenes. Lo que en
realidad se mide es la rapidez en que los píxeles individuales del monitor pueden cambiar de color, lo
cual se indica en milisegundos. El tiempo de respuesta de un cierto monitor se modela por una varia -
ble aleatoria normal con una media de 12.5 milisegundos y desviación estándar dos milisegundos.
a. Calcule la probabilidad de que el tiempo de respuesta del monitor sea menor a 12 milisegundos.
b. Calcule la probabilidad de que el tiempo de respuesta del monitor sea mayor a 14.5 milisegundos.
c. Calcule la probabilidad de que el tiempo de respuesta esté entre 9.5 y 12.5 milisegundos.
Ejercicio 46
La rentabilidad porcentual de la acción A tiene distribución normal con media 12. Además se sabe
que en el 93.32% de los días, esta acción ha registrado una rentabilidad máxima del 15%.
Calcule la rentabilidad máxima que debe registrar la acción A en un día, si se sabe que en el 12 % de
los días el comportamiento del mercado bursátil es a la baja.
MA477 Estadística 179
Ejercicio 47
El promedio ponderado de los alumnos de una universidad se modela con una variable normal con
una media de 14.35 y una desviación estándar de 2.16, calcule el promedio mínimo para estar en el
quinto superior.
Ejercicio 48
Los ingresos mensuales de los empleados de una empresa se modelan con una variable normal. Se
sabe que el 2.81% de los empleados ganan menos de S/. 2 045 y que el 2.5% de los empleados ganan
más de S/. 3 980, calcule la media y la desviación estándar de los ingresos mensuales de los emplea -
dos.
180 MA477 Estadística
Ejemplo 30.
En Buck Café, la máquina surtidora de refrescos está ajustada de tal forma que sirve en pro-
medio 250 mililitros por vaso. Si la cantidad de refresco servido en los vasos sigue, aproxi -
madamente, una distribución normal con una desviación estándar de 10 mililitros. ¿Qué
proporción de los vasos servidos contendrán entre 240 y 255 mililitros de refresco?
Solución
Sea X:= cantidad de refresco servido por vaso. X ~ N(µ = 250. 2 = 102)
Se pide P(240 ≤ X ≤ 255)
Estandarizando se tiene
Ejercicio 49
Se informa que la cantidad X de azúcar de los paquetes marcados con un kilo, tiene distribu-
ción normal con media kilos y desviación estándar 0.02 kilos. Halle el valor de si la canti-
dad de azúcar que contiene cada paquete es menor o igual a 0.95 kilos con probabilidad
0.102.
Solución
Sea X:= pesos de los paquetes de azúcar, en kilos, X ~ N(µ , 2 = 0.022)
Se pide
Estandarizando se tiene
De donde
= 0.9754
Cálculo de probabilidad de una variable normal con una calculadora Casio con Natural Display
10. R( calcula la probabilidad de que Z esté entre el valor que ingresa y +.
182 MA477 Estadística
Ejercicios propuestos
98. Indique si son verdaderas o falsas las siguientes afirmaciones.
a. El mayor valor del rango de la variable hipergeométrica es siempre menor o igual a n ( )
b. En un proceso de Poisson el número de resultados que ocurre en un intervalo es indepen -
diente del número que ocurre en cualquier otro intervalo del espacio disjunto ( )
c. La variable binomial cuenta el número de éxitos en n repeticiones independientes con la
misma probabilidad de fracaso en cada repetición ( )
d. La variable hipergeométrica cuenta el número de éxitos en una muestra de tamaño n de
una población N que tiene r éxitos y donde el muestreo es con reemplazo
( )
99. Para cierto negocio por correo electrónico la proporción de los pedidos procesados en 24 ho-
ras tiene la función de densidad de probabilidad.
lleguen más de tres usuarios a la estación de Javier Prado entre 18:15 y 18:17 horas?
106. El porcentaje de barras de chocolate “Choconut” defectuosas en el centro de producción del Ca-
llao es del 12%, después de haber realizado mejoras en el proceso de producción. El jefe de pro -
ducción espera que la proporción de chocolates defectuosos sea menor, para ello, selecciona al
azar cinco barras de chocolates.
107. Según la última evaluación de desempeño de los 30 obreros del centro de producción de Ate,
solo cuatro tienen un grado de iniciativa 5. Se selecciona al azar un equipo de seis obreros para
la participación de un trabajo fuera de su hora de trabajo
a. Defina el recorrido, la función de probabilidad y los parámetros de la variable X: Número de
obreros que no tienen iniciativa de grado 5 en la muestra de seis obreros.
b. ¿Cuál es la probabilidad de que en el equipo se incluya por al menos un obrero que tengan
iniciativa de grado 5?
c. Uno de los puntos del pliego de reclamos del Sindicato de Trabajadores indica que la elección
de personal para cualquier trabajo adicional debe ser aleatoria. Para aceptar este punto del
pliego, el jefe producción indica que para los trabajos fuera del horario, el perfil del obrero
debe ser proactivo con alta iniciativa para cumplir los requerimientos del cliente. El jefe de
producción aceptará este punto del pliego, si la probabilidad de que al menos un obrero con
iniciativa de grado 5 sea mayor de 0.6 en la muestra seleccionada. ¿Los resultados indican la
aceptación de este punto del pliego de reclamos?
108. La función de probabilidad de la variable X:= número de capacitaciones al año de los trabajado-
res de la empresa Cacao S.A. se presenta en el siguiente gráfico:
0.4 2b
0.35
0.3
0.25
0,2
0.2 b
f(x)
0,15
0.15
0.1
0,05 0,06
0.05
0
1 2 3 4 5 6
Fuente: Empresa CACAO.SA Número de capacitaciones
109. De los registros de la oficina de recursos humanos, el número promedio de trabajadores que lle-
gan tarde por día es 1.5
a. Identifique la variable aleatoria, el recorrido y los parámetros
b. Calcule la probabilidad de que en dos días lleguen tarde exactamente tres trabajadores.
c. Si la probabilidad de encontrar al menos un trabajador que llegue tarde en un día es mayor a
0.3, la gerencia de recursos humanos propone retirar en el mes el bono de productividad.
¿Los resultados indican a la gerencia de recursos retirar el bono de productividad?
110. El número de clientes que preguntan al día por departamentos en el nuevo edificio que está
construyendo la inmobiliaria se ajusta a una distribución de Poisson con una media de cuatro
clientes por día.
a. Calcule la probabilidad de que en medio día pregunten al menos dos clientes por departa-
mentos en el nuevo edificio.
b. Si un cierto día ya preguntaron dos clientes, calcule la probabilidad de que pregunten por lo
menos dos clientes más pregunten por departamentos en el edificio ese día.
111. La probabilidad de que una persona, que visita un departamento de un edificio en construcción,
lo compre es de 0.08. Si en una semana han visitado un departamento 20 clientes, calcule la
probabilidad de que al menos uno de ellos compre un departamento. Asuma que las visitas al
edificio son independientes. Defina la variable necesaria, indique su rango, distribución y pará-
metros.
112. La constructora tiene doce proveedores de materiales de construcción, de los cuales tres no le
envían los productos con la calidad acordada. Si se hace un control de calidad a los productos de
cinco proveedores elegidos al azar, calcule la probabilidad de que sea detectado al menos un
mal proveedor. Defina la variable necesaria, indique su rango, distribución y parámetros.
113. El gerente de Cacao S.A está preocupado por la cantidad de accidentes laborales en los centros
de producción situados en los distritos del Callao, Los Olivos y Ate. Según estimaciones de años
anteriores, la probabilidad de que haya al menos un accidente laboral por día en el centro de
producción del Callao es de 0.07, para Los Olivos es de 0.09 y para Ate es de 0.05.
a. Se define la variable aleatoria X:= número de centros de producción que no tienen accidentes
laborales en un día. Determine y grafique la función de probabilidad de la variable aleatoria
X.
b. Calcule e interprete el valor esperado de X.
Caso Metropolitano
114. Objetivo específico 1: Analizar si se requiere incrementar dos buses para el Expreso 5.
El tiempo de espera de los usuarios del Expreso 5 en la Estación Central es una variable aleato -
ria X que tiene por función de densidad:
{
−1 5
x+ …………2≤x ≤ a
f ( x)= 32 16
0 … … … en otro caso
a. Calcule el valor de a.
b. Calcule la función de densidad acumulada.
c. Pro transporte considera aceptable que un usuario espere menos de 3 minutos a la unidad
del Expreso 5 en la Estación Central, ¿qué porcentaje de usuarios espera un tiempo aceptable
el Expreso 5?
d. Si el porcentaje de usuarios que esperan al Expreso 5 más de 5 minutos es superior a 0.55, se
tendría que incrementar 2 nuevas unidades al servicio para reducir el tiempo de espera de di-
cho servicio. ¿Se incrementará las 2 nuevas unidades en el Expreso 5?
186 MA477 Estadística
MA477 Estadística 187
{
0 si x <20
2
−x x 5
F (x)= + − si20 ≤ x ≤ 40
1200 10 3
1 si x> 40
a. El gerente de Pro Transporte dice que el tiempo de viaje de la ruta C desde la estación Cen -
tral hasta la estación Matellini tiene un tiempo promedio inferior a los 27 minutos. ¿Tiene ra-
zón el gerente de Pro Transporte? Justifique su respuesta
b. Pro transporte asegura que menos del 15% de los viajes de la Ruta C, desde la Estación Cen -
tral hasta la estación Matellini. tienen una duración mayor a 35 minutos. Explique si la afir-
mación de Pro Transporte es correcta.
c. El público usuario de la ruta C en su viaje de la estación Central a la estación Matellini consi -
dera aceptable un tiempo de duración del viaje entre 25 y 35 minutos. ¿Qué porcentaje de
usuarios consideran aceptable el servicio para la la Ruta C?
d. Si se encuentra la probabilidad que supera a 0.20 de que el tiempo de duración del viaje de la
Ruta C de la Estación Central a la Estación Matellini, es más de 35 minutos se entrenará a los
choferes de esta ruta, pues se cree que esta demora es excesiva por la falta de pericia de los
choferes en estacionarse en las diferentes estaciones para recoger y dejar pasajeros. ¿Se en-
trenará a los choferes de la Ruta C?
116. Objetivo específico 3: Evaluar el requerimiento de revisión técnica en las unidades del Metropo-
litano.
El consumo de combustible diario, en galones, de un bus del Metropolitano es una variable alea -
toria continua que tiene una distribución uniforme con un promedio de 31 galones, además se
sabe que el 25% de los buses tiene un consumo de combustible superior a 34 galones al día.
a. ¿Qué porcentaje de buses tienen un consumo mayor a 35 galones por día?
b. ¿Cuál es el consumo máximo del 20% de los buses que tienen un menor consumo diario?
c. El jefe de mantenimiento del Metropolitano informa que si un bus consume más de 35 galo-
nes por día, es porque necesita mantenimiento. Al seleccionar una muestra de 12 buses,
¿cuál es la probabilidad de que por lo menos 3 buses necesiten mantenimiento?
d. Si en una muestra de 12 buses, al menos tres consumen más de 35 galones al día, con una
probabilidad mayor a 0.50, el jefe de mantenimiento del Metropolitano ordenará una revi-
sión técnica a todas las unidades del Metropolitano. ¿Cree usted que se hará dicha revisión
técnica?
117. Objetivo específico 4: Determinar si se requiere instalar otra máquina expendedora de tarjetas.
Pro Transporte sabe que en la estación Javier Prado el tiempo que demora una máquina expen -
dedora en vender una tarjeta general es una variable aleatoria continua que sigue una distribu -
ción normal con media de 4 minutos y una desviación estándar de 1.25 minutos y el tiempo que
demora una máquina expendedora en realizar una recarga es una variable aleatoria continua
que sigue una distribución normal con media de 2 minutos y una desviación estándar de 0.75
minutos.
a. Si se elige al azar a una persona que ha realizado una recarga en la máquina expendedora de
la estación Javier Prado, ¿cuál es la probabilidad de que esta persona se demore al menos 1.5
minutos y a lo más 2.75 minutos?
b. Si se elige al azar a una persona que recién usará el Metropolitano (tiene que comprar una
tarjeta y realizar una recarga), ¿cuál es la probabilidad que esta persona se demore a lo más
6.7 minutos?
188 MA477 Estadística
c. Pro Transporte desea estimar el tiempo mínimo que demora el 20% de los usuarios del Me-
tropolitano para realizar una recarga en la máquina expendedora de la estación Javier Prado.
Ayude usted a Pro transporte a estimar ese tiempo.
d. Si el 80% de los usuarios que realizan recarga en la máquina expendedora de la estación Ja-
vier Prado demoran más de 1.5 minutos Pro transporte sugerirá al concesionario incorporar
una máquina expendedora adicional. ¿Considera usted que se debe incorporar una máquina
expendedora adicional en la estación Javier Prado? Justifique su respuesta.
{
f ( x )= k ( 300−x )∧100≤ x ≤260
0 otros casos
La Molina se modela con una variable con distribución normal con media 200 y desviación
estándar de 30.
a. Calcule el valor de k para que f(x) sea una función de densidad de probabilidad.
b. En cada distrito, calcule la probabilidad de que un inmueble cueste entre 180 y 200 mil dó -
lares.
c. En cada distrito, calcule el precio de venta máximo del 20% de los inmuebles más baratos.
d. Una pareja tiene 190 mil dólares para comprar un inmueble en uno de dos distritos. Pueblo
Libre o Surco. Para cada distrito. determine la función de distribución acumulada y úsela
para indicar en qué distrito es más probable que haya un departamento que la pareja pue -
da comprar al contado.
e. Calcule la probabilidad de que un inmueble cueste más de 250 mil dólares.
f. El gerente comercial ha decidido subir el precio al 10% de los inmuebles más caros. Calcule
el precio de venta mínimo de un inmueble que se ajuste a la decisión del gerente comercial.
g. Indique en cuál de los tres distritos: Pueblo Libre, Surco o La Molina, el precio de venta es
más homogéneo.
120. El tiempo, en minutos, que se tarda en resolver un examen se modela como una variable alea-
toria continua con la siguiente función de densidad de probabilidad:
MA477 Estadística 189
122. Sea X un v.a con N (650.625). Hallar la constante C > 0. tal que.
P(|X-650| ≤ C ) = 0.9544
124. Se sabe que la estatura de los peruanos sigue una distribución normal con media 165 cm y va -
rianza 100 cm2.
b. Si dos peruanos. que no se conocen, son medidos, ¿cuál es la probabilidad de que ambos mi -
dan como máximo 170 cm?