Está en la página 1de 322

Estadística descriptiva y probabilidades.

Aplicaciones en la ingeniería y los negocios


Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios /
Rosa Millones, Emma Barreno, Félix Vásquez, Carlos Castillo. Primera edición,
primera reimpresión. Lima: Universidad de Lima. Fondo Editorial, 2018.
332 páginas: gráficos, ilustraciones. (Textos Universitarios).
Bibliografía: página 311.
1. Estadística descriptiva.
2. Probabilidades (Estadística).
3. Variables aleatorias.
4. Ingeniería - - Estadística aplicada.
5. Negocios - - Estadística aplicada.
I. Millones-Rivalles, Rosa, autora.
II. Barreno-Vereau, Emma-Virginia, autora.
III. Vásquez-Urbano, Félix, autor.
IV. Castillo-Crespo, Carlos, autor.
V. Universidad de Lima. Fondo Editorial.
519.53
E ISBN 978-9972-45-392-2

Colección Textos Universitarios


Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios
Primera edición: junio, 2017
Primera reimpresión: abril, 2018
Tiraje: 700 ejemplares

© De esta edición:
Universidad de Lima
Fondo Editorial
Av. Javier Prado Este N.o 4600,
Urb. Fundo Monterrico Chico, Lima 33, Perú
Apartado postal 852, Lima 100
Teléfono: 437-6767, anexo 30131
fondoeditorial@ulima.edu.pe
www.ulima.edu.pe

Diseño, edición y carátula: Fondo Editorial de la Universidad de Lima

Imagen de portada: Natee K Jindakum / Shutterstock.com

Impreso en el Perú

Se prohíbe la reproducción total o parcial de este libro, por cualquier medio,


sin permiso expreso del Fondo Editorial.

ISBN 978-9972-45-392-2

Hecho el depósito legal en la Biblioteca Nacional del Perú n.o 2018- 04506
Índice

Presentación 11

Capítulo 1. Estadística descriptiva 13


1. División de la estadística 15
2. Conceptos básicos 15
3. Descripción tabular y gráfica de variables 17
3.1 Distribución de frecuencias de variable cualitativa 18
3.1.1 Gráfico de barras 18
3.1.2 Gráfico circular 19
3.2 Distribución de frecuencias de variable cuantitativa 25
3.2.1 Distribución de frecuencias de variable
cuantitativa discreta 25
3.2.2 Distribución de frecuencias de variable
cuantitativa continua 27
3.3 Diagrama de Pareto 38
4. Medidas de tendencia central 40
4.1 Media aritmética (promedio) 41
4.2 Mediana 42
4.3 Moda 42
4.4 Relaciones entre la media, la mediana y la moda 49
5. Medidas de posición 50
5.1 Cuartiles 50
5.2 Percentiles 52
6. Medidas de dispersión 54
6.1 Rango o amplitud 54
6.2 Rango intercuartílico 55
6.3 Varianza 55
6.4 Desviación estándar 56
6.5 Coeficiente de variación 57
7. Medidas de forma 63
7.1 Coeficiente de asimetría 63
7.1.1 Coeficiente de asimetría de Pearson 64
7.1.2 Coeficiente de asimetría de Fisher 64
7.2 Coeficiente de curtosis 64
8. Análisis exploratorio de datos 66

Índice 7
8.1 Gráfico de cajas 67
9. Problemas resueltos 71
10. Problemas propuestos 93

Capítulo 2. Probabilidad 107


1. Conceptos básicos 109
1.1 Experimento aleatorio o al azar 109
1.2 Espacio muestral 109
1.3 Suceso 110
1.4 Evento 110
2. Técnicas de conteo 112
2.1 Principio de adición 112
2.2 Principio de multiplicación 113
2.3 Permutaciones 114
2.3.1 Permutaciones de n elementos sin repetición 114
2.3.2 Permutaciones de n elementos sin repetición
tomados de k en k 115
2.3.3 Permutaciones con elementos iguales 116
2.4 Combinaciones 117
3. Probabilidad 119
3.1 Introducción 119
3.2 Probabilidad clásica o a priori 119
3.3 Probabilidad relativista 121
3.4 Definición axiomática 122
4. Teoremas de probabilidad 123
4.1 Probabilidad condicional 123
4.2 Teorema de la multiplicación 124
4.3 Teorema de la probabilidad total 125
4.4 Teorema de Bayes 125
4.5 Probabilidad de eventos independientes 128
5. Problemas resueltos 132
6. Problemas propuestos 151

Capítulo 3. Variable aleatoria 157

1. Definición 159
2. Tipos de variables aleatorias 161
2.1 Variable aleatoria discreta 161
2.1.1 Definición 161
2.1.2 Función de probabilidad de una variable
aleatoria discreta 161
2.1.3 Función de distribución 164
2.2 Variable aleatoria continua 167
2.2.1 Definición 167
2.2.2 Función de densidad de probabilidad de una variable
aleatoria continua 167
2.2.3 Función de probabilidad acumulativa (distribución) 170

8 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


3. Esperanza matemática y varianza de una variable aleatoria 171
3.1 Esperanza matemática 171
3.1.1 Definición 171
3.1.2 Propiedades 171
3.2 Varianza 175
3.2.1 Definición 175
3.2.2 Propiedades 175
4. Interpretación de la esperanza matemática, varianza
y coeficiente de variación de una variable aleatoria 178
5. Problemas resueltos 181
6. Problemas propuestos 199

Capítulo 4. Distribuciones de probabilidad 207

1. Distribuciones de probabilidad 209


2. Distribuciones de probabilidad de variables aleatorias discretas 209
2.1 Distribución de Bernoulli 209
2.2 Distribución binomial 210
2.3 Distribución hipergeométrica 215
2.4 Distribución de Poisson 221
3. Distribuciones de probabilidad de variables aleatorias continuas 225
3.1 Distribución uniforme continua 225
3.2 Distribución triangular 229
3.3 Distribución normal 231
3.4 Distribución exponencial 240
3.5 Distribución gamma 242
3.6 Relación entre las distribuciones de Poisson,
exponencial y gamma 245
3.6.1 Relación de la distribución de Poisson
con la distribución exponencial 245
3.6.2 Relación de la distribución de Poisson
con la distribución gamma 246
3.7 Distribución de Weibull 246
3.8 Distribución ji-cuadrado 250
3.9 Distribución t de Student 254
3.10 Distribución F de Fisher-Snedecor 256
4. Problemas resueltos 260
5. Problemas propuestos 282

Respuestas a los problemas propuestos 299

Bibliografía 311
Anexos
Anexo 1: Resumen de fórmulas de estadística descriptiva 315
Anexo 2: Resumen de fórmulas de probabilidad 316
Anexo 3: Distribuciones notables de probabilidad 317

Índice 9
Presentación

En el mundo actual es imprescindible el uso de herramientas estadísticas que


faciliten el procesamiento y comprensión de la información para así desarrollar
un pensamiento reflexivo y analítico asociado a la realidad en diversos aspectos
del ámbito profesional y social. Para ello, mediante el proceso de enseñanza-
aprendizaje, se deben aplicar estrategias que permitan al alumno desarrollar su
capacidad para enfrentar con éxito situaciones problemáticas, sintetizándolas en
un lenguaje simbólico y gráfico para su mejor resolución.
El propósito de este libro es proporcionar a los estudiantes que cursan una
primera asignatura de estadística y probabilidad los conocimientos y nociones
básicas en esta materia de una manera ágil y de fácil comprensión, a través de nu-
merosos y variados ejemplos y problemas resueltos, gran parte de ellos mediante
el uso de programas. Al final de cada capítulo se ha incluido un conjunto de pro-
blemas propuestos como una herramienta pedagógica que permita desarrollar
las habilidades del alumno afianzando los nuevos conocimientos adquiridos y
preparándolo para que pueda resolver problemas similares que se le presenten
en su vida profesional, tanto en el ámbito de la ingeniería y sus procesos, así
como en los negocios y la actividad empresarial. Entendemos que resolver pro-
blemas es una habilidad que se adquiere con la práctica, como los deportes, y
mediante la metodología propuesta en el presente libro se brinda un sustento
y ayuda para que el alumno desarrolle su razonamiento estadístico, el cual le
permitirá solucionar los retos que se le presenten en su quehacer profesional.
El desarrollo de diversos casos prácticos se puede encontrar en la siguiente
dirección electrónica:
http://downloads.ulima.edu.pe/fondoeditorial/libros/estaddescr
Los temas y la casuística expuestos están basados en los apuntes de clases, así
como en la experiencia acumulada, a través de muchos años, dictando la asigna-
tura de Estadística y Probabilidad en la Escuela de Ingeniería de la Universidad
de Lima.

Presentación 11
Todas las imágenes y tablas son materiales originales creados por los autores,
salvo indicación expresa de lo contrario; con respecto a las capturas, de no indi-
carse lo contrario, estas corresponden al software Minitab.
El capítulo 1 comprende las definiciones básicas, la organización, tabulación
y presentación de datos; las medidas estadísticas de resumen y el análisis ex-
ploratorio de datos. Las técnicas de conteo, el cálculo de probabilidades y los
teoremas de probabilidad son abordados en el capítulo 2. En el capítulo 3 se
desarrolla el tema de distribución de probabilidad de una variable aleatoria, así
como la esperanza y varianza que caracterizan a dicha distribución. Finalmente,
en el capítulo 4 se consideran las distribuciones especiales de probabilidad.
Expresamos nuestro agradecimiento a las autoridades de la Escuela de Inge-
niería que han hecho posible la publicación del presente libro que será de gran
utilidad para nuestros alumnos y el público interesado.

Los autores
Capítulo

1 Estadística descriptiva
La estadística es una ciencia necesaria Sabes
y útil en toda carrera profesional, ya que Capacidades adquiridas
las técnicas y procedimientos estadísticos
9 Comprender los conceptos básicos
son aplicables a características de diferente
de la estadística.
naturaleza, como, por ejemplo: la ocurren-
cia de fallas en un dispositivo, las ventas 9 Clasificar los tipos de variables.
diarias de una empresa, entre otras. Los 9 Organizar y representar los datos
datos estadísticos se caracterizan por ser en forma tabular y gráfica.
aleatorios, ya que el dato es inesperado y 9 Calcular las medidas resumen.
casual; inciertos, es decir, no se tiene cono- 9 Determinar la forma de distribución
cimiento del valor que puede tener; y varia- de los datos.
bles, no constantes. Para la comprensión de
los datos estadísticos se debe partir por la
organización, presentación y resumen de
los mencionados datos. Piensas
Competencias por lograr
Conocimientos previos 9 Diferenciar entre la estadística
descriptiva e inferencial.
Teoría de conjuntos, manejo de
notación matemática. 9 Utilizar las tablas y gráficas adecua-
das según el tipo de variable.
9 Reconocer las situaciones de uso de
las diferentes medidas resumen.
Secciones
1. División de la estadística
2. Conceptos básicos
3. Descripción tabular y gráfica Haces
de variables
Habilidades por desarrollar
4. Medidas de tendencia central
9 Resumir grandes volúmenes de datos.
5. Medidas de posición
9 Aplicar las propiedades de las princi-
6. Medidas de dispersión (variabilidad)
pales medidas resumen.
7. Medidas de forma
9 Interpretar las medidas resumen de
8. Análisis exploratorio de datos acuerdo al contexto de análisis
1. División de la estadística

La estadística se divide en dos grandes ramas: la estadística descriptiva y la


estadística inferencial.
a. La estadística descriptiva se encarga de la recopilación, organización y
presentación de los datos.
b. La estadística inferencial se ocupa de analizar e interpretar los resultados
de la muestra para generalizarlos a la población que generó la muestra y
así tomar decisiones al respecto. La estadística inferencial utiliza concep-
tos de probabilidad para realizar el análisis de los datos.
En este capítulo se presentan las técnicas de la estadística descriptiva, cuyo
objetivo es describir gráfica y numéricamente un conjunto de datos. La esta­
dística descriptiva aplicada a un conjunto de datos es utilizada para conocer
de manera aproximada lo que ocurre en la población, de la que se seleccionó
la muestra, en cuanto a su forma (varianza, asimetría, curtosis) y posición
(media, mediana, moda).

2. Conceptos básicos

En esta sección se plantean los conceptos que se usarán frecuentemente en el


resto del libro.
a. Unidad de análisis. Corresponde a la entidad representativa que será ob-
jeto de análisis, el “qué” o “quién” es objeto de interés en un estudio. Pre-
sentan una o más características observables de interés. Una unidad de
análisis podría ser, por ejemplo, un residente de Lima Metropolitana, una
vivienda del distrito de Lince, una microempresa del cono este de Lima
Metropolitana, entre otros.

Capítulo 1. Estadística descriptiva 15


b. Población. Se refiere al conjunto total de unidades de análisis correspon-
dientes al estudio que se desea realizar, de los cuales se desea describir su
comportamiento y/u obtener conclusiones. La cantidad total de unidades
de análisis que tiene una población es denotada por N.
c. Muestra. Una muestra es un subconjunto de la población, y debe ser re-
presentativa y aleatoria. La muestra es representativa si lo que se necesita
conocer de la población está presente en la muestra, es decir, si los datos
asociados a la muestra se asemejan a la población en estudio; y es aleatoria
porque los datos registrados fueron obtenidos de manera espontánea sin
preferencia alguna. Se trabaja a partir de muestras para:
i. Reducir el costo y el tiempo de recopilación de datos.
ii. Disminuir o eliminar los errores asociados a la manipulación
de datos, etc.
La cantidad total de observaciones que tiene una muestra es
deno­­tada por n.
d. Variable. Una variable es una característica de interés, y se denota prefe-
rentemente por cualquiera de las últimas letras del alfabeto. Las variables
se pueden clasificar como:
i. Cualitativas (Categóricas): Los valores de esta variable corresponden a
propiedades, atributos, cualidades, etc. Estas variables se determinan
por observación, y a su vez se pueden subdividir en:
• Cualitativa nominal: los valores o categorías de esta variable son
atributos que no presentan ningún tipo de ordenación o jerarquía.
• Cualitativa ordinal: los valores o categorías de esta variable son atri-
butos, pero responden a un orden o jerarquía.
ii. Cuantitativas: Los valores de esta variable corresponden a valores nu-
méricos. Estas variables se determinan por conteo o medición, y a su
vez se pueden subdividir en:
• Cuantitativa discreta. Se presenta cuando el registro de la variable
es resultado de un proceso de conteo, y se representan mediante
números naturales, los cuales forman un conjunto finito o infinito
numerable. Ejemplos de variables cuantitativas discretas son la can-
tidad de televisores que existen en una vivienda familiar, el número
de pasajeros que transporta diariamente un bus del Metropolitano.
• Cuantitativa continua. Una variable numérica es cuantitativa conti-
nua si el valor de la variable se obtiene por medición o comparación
con un patrón de medida; pueden adoptar cualquier valor dentro de
un rango y se expresa mediante números reales. Ejemplos de este
tipo de variable son el ingreso mensual de un ejecutivo, el tiempo
de atención en ventanilla de una agencia bancaria, entre otros.
e. Parámetro. Es una medida que resume y describe a una característica
de la población; su valor se calcula usando todos los datos de la pobla-

16 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


ción. Los parámetros se denotan usando letras griegas (µ, p, s, etc.). En
la mayoría de los problemas de análisis de datos, los valores de los pa-
rámetros no son conocidos. Ejemplo: media poblacional del consumo
mensual de combustible (µ), proporción poblacional de ejecutivos con
grado académico de doctor (p), entre otros.
f. Estadístico. Un estadístico es una función definida sobre la muestra; me-
diante el valor del estadístico se busca conocer el posible valor del pará-
metro. El estadístico se caracteriza porque su valor cambia de muestra a
muestra, es decir, no es constante, y se espera que su valor difiera muy
poco de su respectivo parámetro poblacional. Los estadísticos se denotan
por letras latinas: x , p, s, etc. Ejemplo: media muestral del ingreso men-
sual de los practicantes universitarios ( x ), proporción muestral de clientes
satisfechos (p), entre otros.
En la figura 1 se representa la relación entre población y muestra.

Población de tamaño N

Muestra de tamaño N

Figura 1. Relación entre


población y muestra.

Parámetros: µ : Media poblacional Estadísticos: x ,: Media muestral


s2 : Varianza poblacional s2 : Varianza muestral

3. Descripción tabular y gráfica de variables

La toma de decisiones depende del análisis de una gran cantidad de datos. Si


este conjunto de datos u observaciones no tiene un orden determinado es casi
imposible analizarlo. Esto motiva el estudio de procedimientos que resuman
la información; en la ejecución de este proceso de resumen se origina un error

Capítulo 1. Estadística descriptiva 17


(pérdida de información) que debe ser el menor posible. Por otro lado, la des-
cripción numérica y gráfica de las variables depende de su tipo; esto significa
que cada tipo de variable tiene su particular descripción numérica, así como su
propia gráfica. Esta última debe trasmitir en forma clara y precisa la informa-
ción que poseen los datos acerca de la población en estudio.

3.1 Distribución de frecuencias de variable cualitativa

La descripción numérica de una variable cualitativa, nominal u ordinal, es rea-


lizada con la denominada “tabla de distribución de frecuencias”, la cual se abre-
viará como TDF.
Sea X una variable cualitativa (nominal u ordinal) con k categorías, las
cuales son observadas a partir de una muestra de n unidades de análisis;
las diferentes categorías de esta variable pueden organizarse de la forma que se
aprecia en la tabla 1:

Categorías Conteo de
Porcentaje (%)
de la variable observaciones
(Pi)
(Ci) (Oi)
Tabla 1. Estructura
de una TDF para una C1 O1 P1
variable cualitativa. C2 O2 P2
: : :
Ck Ok Pk
Total n 100 %

Donde:
Oi: Número de datos observados en la i-ésima categoría. La suma de los
k
conteos es igual al tamaño de la muestra: ∑ Oi = n.
i =1
Pi: Porcentaje de datos observados en la i-ésima categoría, respecto al tamaño
O
de muestra: Pi = i 100 %. La suma de los porcentajes es igual a
n
k
100 % : ∑ Pi = 100 %.
i =1

La descripción gráfica de las variables cualitativas puede ser realizada


mediante barras (horizontales, verticales), gráficas circulares, entre otros, y
permitirán revelar en forma visual los patrones de comportamiento de la
variable bajo estudio.

3.1.1 Gráfico de barras

Un gráfico de barras es un conjunto de barras (horizontales o verticales) que


tienen las siguientes características:
a. La cantidad de barras debe ser igual al número de categorías de la variable,
deben ser estas categorías mutuamente excluyentes.

18 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


b. La altura de cada barra representa al conteo o porcentaje de cada categoría,
y el ancho debe ser igual para todas. Las barras deben estar igualmente
espaciadas.
c. Debe ser fundamentalmente ilustrativo, es decir, tratar de trasmitir al usua-
rio, gráficamente y de la mejor forma posible, lo que está ocurriendo en
la muestra.

3.1.2 Gráfico circular

Un gráfico circular es un círculo dividido en sectores de manera proporcional


al conteo o porcentaje de las observaciones. Las características de un gráfico
circular son:
a. La cantidad de sectores circulares debe ser igual al número de cate­gorías de
la variable, ellos deben ser mutuamente excluyentes.
b. El tamaño de cada sector circular es proporcional al total de la muestra.

CASO: Puntualidad de pago de clientes


El gerente de una tienda por departamentos ha recopilado datos correspon-
dientes a 250 clientes activos que poseen una tarjeta de crédito emitida por
la tienda; las variables consideradas para el estudio son las siguientes:
Género: Género del cliente
Edad: Edad del cliente
I. Familiar: Ingreso familiar mensual del cliente
L. Crédito: Línea de crédito del cliente
Zona: Zona de análisis donde reside el cliente: Lima o Provincias
D. Efectivo: Si el cliente ha realizado o no disposición de efectivo durante
los últimos 3 meses.
N° Visitas: N.° de visitas, en las cuales hizo uso de su tarjeta de crédito,
en los últimos 3 meses.
M. Compras: Monto de compras, en soles, del cliente durante los últimos
6 meses.
M. Ofertas: Monto de compras, en soles, correspondiente a ofertas duran-
te los últimos 6 meses.
Clasificación: Clasificación del cliente de acuerdo a su puntualidad históri-
ca de pagos de la tarjeta: Puntual Anticipado (P. A.), Puntual
(P), Impuntual (I)
Los datos recopilados se presentan en el archivo del software Minitab
Clientes.mtw, y serán de utilidad para algunos ejemplos brindados en
el presente capítulo.

Capítulo 1. Estadística descriptiva 19


Ejemplo 1
En el archivo Clientes.mtw, a partir de los datos correspondientes a la cla-
sificación de acuerdo a la puntualidad en los pagos de los 250 clientes en
análisis, realice lo siguiente según se indique:

a. Obtenga la tabla de distribución de frecuencias.


Solución
i. Ingresar a Stat> Tables> Tally Individual Variables (véase la figura 2).

Figura 2. Acceso al
comando Tally Indi-
vidual Variables.

ii. Seleccionar la variable Clasificación, y elegir las opciones Counts


y Percents (véase la figura 3).

Figura 3. Cuadro de
diálogo del coman-
do Tally Individual
Variables.

20 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


iii. Presionar el botón OK, luego de lo cual se obtendrá el siguiente reporte:

Tally for Discrete Variables: Clasificación

Clasificación Count Percent


Impuntual 55 22.00
Puntual 32 12.80
Puntual anticipado 163 65.20
N = 250

Nota: En el reporte obtenido la etiqueta Count representa a los conteos, es


decir, al número de clientes correspondientes a cada clasificación, mien-
tras que Percent representa a los porcentajes correspondientes.

Adecuando las etiquetas se podría tener la siguiente tabla:

Clasificación Conteo de clientes Porcentaje de clientes (%)


(Ci) (Oi) (Pi)

Impuntual 35 22.0 Tabla 2. TDF para la


variable Clasificación.
Puntual 32 12.8
Puntual anticipado 163 65.2
Total 250 100

Interpretación: El 22 % de los clientes presentan un pago impuntual,


12.8 % presentan un pago puntual, mientras que un 65.2 % realizan un
pago puntual anticipado.

b. Elabore el gráfico de sectores asociados a la variable de estudio.


Solución
i. Ingresar a Graph> Pie Chart…
ii. Elegir la opción Chart count of unique values y seleccionar la variable
Clasificación.
iii. Presionar el botón Labels…
iv. Pulsar sobre la pestaña Slice Labels y seleccionar Category name,
Frequency, y Percent (véase la figura 4).

Capítulo 1. Estadística descriptiva 21


Figura 4. Cuadro de
diálogo del comando
Pie Chart: Labels.
Nota: Si se desea personalizar el título de la gráfica se debe ingresar a la
pestaña Titles/Footnotes.

v. Presionar el botón OK, se obtendrá el gráfico de sectores, y luego de borrar


la leyenda, quedará como se muestra en la figura 5.

Pie Chart of Clasificación

Impuntual
55, 22.0 %
Figura 5. Gráfico de
sectores correspon-
diente a la variable
Clasificación. Puntual
32, 12.8 %
Puntual anticipado
163, 65.2 %

Ejemplo 2
En el archivo Clientes.mtw, a partir de los datos correspondientes al ingreso
familiar de los clientes en análisis, realice lo siguiente:
a. Codifique los ingresos familiares de acuerdo al siguiente criterio:
Menos de S/ 2800 : < S/ 2800
De S/ 2800 a menos de S/ 3600 : S/ 2800 – S/ 3600
De S/ 3600 a menos de S/ 4400 : S/ 3600 – S/ 4400
De S/ 4400 a menos de S/ 5200 : S/ 4400 – S/ 5200
De S/ 5200 a más: > = S/ 5200

22 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Solución
i. Ingresar a Data> Code> To Text…
ii. En Code values in the following columns, seleccionar I. Familiar
iii. En Method, seleccionar Code range of values e ingresar los valores de
referencia.
iv. En Endpoints to include, seleccionar Lower endpoint only de tal forma
que el intervalo considere solamente el límite inferior (intervalo cerrado a
la izquierda).
v. En Storage location for the coded columns, seleccionar In specified
columns of the current worksheet. En Columns, señalar la columna C12.
Todo lo señalado se puede apreciar en la figura 6.

Figura 6. Cuadro de
diálogo del comando
Code: To Text.

vi. Presionar el botón OK, luego de lo cual, en la columna C12, se alma-


cenarán los resultados de la codificación realizada. Si se desea, se
puede asignar una etiqueta a la columna C12, tal como por ejemplo
Intervalo ingresos.

Capítulo 1. Estadística descriptiva 23


b. Elabore el gráfico de barras para los resultados de la codificación
realizada.
Solución
i. Ingresar a Graph> Bar Chart…
ii. En Bars represent, seleccionar la opción Counts of unique values.
Seleccionar el gráfico Simple. Presionar el botón OK.
iii. En Categorical variables seleccionar la variable ya codificada Inter-
valo ingresos.
iv. Presionar el botón Chart Options. En Percent and Accumulate, seleccionar
la opción Show Y as Percent. Presionar OK.
v. Presionar el botón Labels...
vi. Seleccionar la pestaña Data Labels y seleccionar Use Y-value labels.
Presionar OK (Véase la figura 7).

Figura 7. Cuadro de
diálogo del comando

Bart Chart: Labels.
vii. Presionar el botón OK, luego de lo cual se obtendrá el gráfico de barras
respectivo tal como se muestra en la figura 8.

Figura 8. Gráfico de
barras correspondiente
a la variable Intervalo
ingresos.

24 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


3.2. Distribución de frecuencias de variable cuantitativa

En la sección 2 se mencionó que las variables cuantitativas pueden ser discretas


o continuas, las cuales presentan una diferente estructura en su tabla de distri-
bución de frecuencias. En la interpretación de la distribución de frecuencias de
variable cuantitativa y de su correspondiente gráfica deben tenerse presente los
siguientes aspectos:
a. Simetría de la distribución.
b. Variabilidad de los datos.
c. Presencia de valores discordantes o extremos (outliers)
Aspectos que se explicarán en los puntos posteriores del presente capítulo.

3.2.1 Distribución de frecuencias de variable cuantitativa discreta

Sea X una variable cuantitativa discreta, conformadas por k valores diferentes:


x1, x2, …, xk–1, xk ; observados a partir de una muestra de tamaño n. Los diferentes
valores de la variable pueden organizarse de la forma que se aprecia en la tabla 3:

Variable Frecuencia Frecuencia absoluta Frecuencia relativa Frecuencia relativa


(Xi) Absoluta (fi) acumulada (Fi) porcentual (hi %) porcentual acumulada (Hi %)
x1 f1 F1 = f1 h1 H1= h1
x2 f2 F2 = f 2 + F1 h2 H2 = h 2 + H1 Tabla 3. Estructura
de una TDF para
: : : : :
variable cuantitativa
x k–1 fk–1 Fk–1 = fk–1 + Fk–2 hk–1 Hk–1 = hk–1 + Hk–2 discreta.
xk fk Fk = fk + Fk–1 = n hk  Hk = hk + Hk–1 = 100 %
Total n   100 %

Donde:
fi : Conteo de datos observado por cada valor de la variable. La suma de
k
las frecuencias absolutas es igual al tamaño de la muestra (n): ∑ fi = n.
i =1
hi%: Porcentaje de datos observado por cada valor de la variable. La suma de
k
las frecuencias relativas es igual a la unidad: ∑ hi = 1. Generalmente
i =1
se expresan en porcentaje, entonces la suma es igual al 100 %.
Fi: Se obtiene sumando las frecuencias absolutas de los valores inferiores o
i
iguales al valor indicado de la variable. Entonces: Fi = ∑ f j . La última
j =1
frecuencia absoluta acumulada es igual al tamaño de la muestra (n).
Hi%: Se obtiene sumando las frecuencias relativas de los valores inferiores
i
o iguales al valor indicado de la variable. Entonces: Hi % = ∑ h j %.
j =1
La última frecuencia relativa acumulada es igual al 100 %.

Capítulo 1. Estadística descriptiva 25


3.2.1.1 Gráfico de bastones

El gráfico de bastones es similar a un gráfico de barras utilizado para repre-


sentar una variable cualitativa, pero en lugar de una barra se utiliza una línea,
también llamada bastón, con una altura que sería proporcional a la frecuencia
absoluta o relativa que se desee representar.

Ejemplo 3
En el archivo Clientes.mtw se dispone de los datos correspondientes al nú-
mero de visitas a la tienda por departamentos en las cuales los clientes hicie-
ron uso de su tarjeta de crédito, durante los últimos 3 meses. A partir de los
mencionados datos realice lo que se solicite.
a. Obtenga la tabla de distribución de frecuencias.
Solución
i. Ingresar a Stat> Tables> Tally Individual Variables…
ii. Seleccionar la variable N.° Visitas, y elegir las opciones Counts,
Percents, Cumulative counts, y Cumulative percents.
iii. Presionar el botón OK para obtener el siguiente reporte.

Tally for Discrete Variables: N° Visitas


N° Visitas Count Percent CumCnt CumPct
2 24 9.60 24 9.60
3 17 6.80 41 16.40
4 26 10.40 67 26.80
5 47 18.80 114 45.60
6 34 13.60 148 59.20
7 34 13.60 182 72.80
8 25 10.00 207 82.80
9 32 12.80 239 95.60
10 11 4.40 250 100.00
N= 250

Nota: La etiqueta CumCnt representa la frecuencia absoluta acumulada, y


CumPct a la frecuencia relativa acumulada expresada en porcentaje.
Interpretaciones:
• f 2: 17 clientes, durante los 3 últimos meses, han realizado 3 visitas
a la tienda.
• F5: 148 clientes, durante los 3 últimos meses, han realizado hasta
6 visitas a la tienda.
• h3%: 10.40 % de los clientes, durante los 3 últimos meses, ha rea­-
lizado 4 visitas a la tienda.
• H4%: 45.60 % de los clientes, durante los 3 últimos meses, ha realizado
hasta 5 visitas a la tienda.

26 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


b. Elabore el gráfico de bastones para el número de visitas.
Solución
i. Ingresar a Graph> Bar Chart…
ii. En Bars represent, seleccionar la opción Counts of unique values.
Seleccionar el gráfico Simple. Pulse el botón OK.
iii. Seleccionar la variable N.° Visitas.
iv. Presionar el botón Chart Options, en Percent and Accumulate selec-
cionar la opción Show Y as Percent. Hacer clic en OK.
v. Presionar el botón Labels…
vi. Seleccionar la pestaña Data Labels y Seleccionar Use y-value labels.
Pulsar OK.
vii. Seguidamente, Presionar el botón Data View…, desmarcar la opción
Bars y Seleccionar la opción Project lines. Pulsar OK.
viii. Presionar el botón OK, luego de lo cual se obtendrá el gráfico de bas-
tones correspondiente tal como se muestra en la figura 9.

Figura 9. Gráfico de
bastones correspon-
diente a la variable
Número de visitas.


Si la variable cuantitativa discreta a representarse en forma tabular o gráfica
posee una gran cantidad de valores distintos, entonces esta puede ser trabajada
como si fuera una variable cuantitativa continua; cuyo procedimiento se detalla
a continuación.

3.2.2 Distribución de frecuencias de variable cuantitativa continua

Los siguientes términos básicos deben tenerse presente para la descripción nu-
mérica y gráfica de una variable cuantitativa discreta con muchos valores y de
una variable cuantitativa continua (datos agrupados):

Capítulo 1. Estadística descriptiva 27


a. Clase: es el conjunto de valores agrupados de la muestra de acuerdo a
cierto criterio.
b. Intervalo de clase: es el intervalo que contiene a la clase; en el presente
texto se trabajarán con intervalos cerrados por la izquierda y abiertos por
la derecha: [… , …〉.
c. Límite superior de clase: límite superior del intervalo de clase; se denota
por LS.
d. Límite inferior de clase: límite inferior del intervalo de clase; se denota
por LI.
e. Amplitud de la clase: es el ancho del intervalo, determinado por la di-
ferencia entre el límite superior e inferior de la clase. Se trabajarán con
intervalos de igual amplitud; se denota por C.
f. Marca de clase (yi): La marca de clase es el punto medio del intervalo de
clase. Si las clases de una distribución tienen el mismo ancho o amplitud,
el intervalo de clase común, denominado intervalo de clase de la distribución;
por lo tanto, la diferencia entre dos marcas de clase consecutivas es igual
a la amplitud.
La estructura de la distribución de frecuencias para este tipo de variable se
aprecia en la tabla 4:

Marca Frecuencia Frec. Absoluta Frec. Relativa Frec. Relativa


Intervalo
de clase absoluta acumulada porcentual porcentual
(i)
(yi) (fi ) (Fi ) (hi %) acumulada (Hi %)
Tabla 4. Estructura
de una TDF para 1 y1 f1 F1 = f1 h1 H1 = h1
variable cuantitativa 2 y2 f2 F2 = f 2 + F1 h2 H2 = h2 + H1
continua.
: : : : : :

k yk fk n = fk +Fk–1 hk 100 %= hk + Hk –1

Total n 100 %

Donde:
fi, hi%, Fi y Hi% , se encuentran asociados al i-ésimo intervalo de clase en los
que se han dividido los valores de la variable, y representan lo mismo que lo
señalado en la TDF para variable cuantitativa discreta.
Las consideraciones a tomarse en cuenta en la construcción de una tabla de
frecuencias de datos agrupados son:
a. Cada observación debe ser estar contenida solo en una clase, es decir, las
clases deben ser mutuamente excluyentes.
b. En lo posible, las clases deben tener la misma amplitud.
c. Tener presente que las marcas de clase representan a todos los valores
contenidos en sus respectivas clases.

28 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


A continuación, se presenta el procedimiento para la construcción de la
distribución de frecuencias asociada a la variable cuantitativa continua:
Paso 1. Calcular el valor del rango, recorrido o amplitud de los datos con la
siguiente fórmula:

R = Valor máximo – Valor mínimo

Nótese que el rango indica la distancia numérica que separa al valor mínimo
hasta el valor máximo de las observaciones.

Amplitud

Figura 10. Rango


de un conjunto de
Valor mínimo Valor máximo datos.

Paso 2. Calcular el número de intervalos (clases) k usando la regla de Sturges, la


fórmula es:
k = 1 + 3.32 log10 (n)

El valor de k es común redondearlo al entero más cercano; por ejemplo, para


n = 60, resulta
= k 6.8678 ≈ 7. Lo que se busca en este paso es determinar la can-
tidad apropiada de clases en que se debe dividir el rango de datos R. La regla de
Sturges no es recomendable utilizarla de manera irrestricta porque proporciona
valores de k inapropiados en algunos casos. Un valor pequeño de k condensa
excesivamente los datos, perdiéndose información. Por otro lado, un valor gran-
de de k, no permite conocer el patrón de comportamiento de las observaciones.
R
Paso 3. Calcular la amplitud de la clase C usando la siguiente fórmula: C =
k
Debe tratarse de que C tenga el mismo número de posiciones decimales que
poseen los datos. Para facilitar las comparaciones, es preferible trabajar con un
valor de C constante para todos los intervalos, salvo en aquellos casos que por
la naturaleza misma de los datos no puede hacerse. Verificar que se cumple la
condición (C )( k ) ≥ R; lo cual asegura que ninguna observación quede fuera de
la distribución de frecuencias.

Paso 4. Construir la tabla de distribución de frecuencias considerando el valor


mínimo como el límite inferior de la primera clase a distribución de frecuencias.
A este límite inferior se le debe agregar el valor de C para obtener el límite su-
perior. El límite superior de la primera clase es el límite inferior de la siguiente
clase. Continuar agregando C hasta la última clase que señala k. Tenga presente
que la interpretación de las clases es cerrada a la izquierda y abierta a la derecha,
a excepción del último intervalo que puede ser cerrado por ambos extremos.

Capítulo 1. Estadística descriptiva 29


Amplitud

Clase 2 Clase 3 Clase 4


Figura 11. Clases y sus Valor mínimo Valor máximo
límites.
Límite inferior Límite superior
de la clase de la clase

La distribución de frecuencias presenta el número de observaciones de la


muestra que caen dentro de cada una de las clases. El término distribución de
frecuencias se abrevia normalmente como distribución.
¿Para qué se estudia la distribución de frecuencias? En estadística, el objeti-
vo principal es conocer la población que generó la muestra. Al construir la
distribución de frecuencias se busca conocer (estimar) el comportamiento
de los datos poblacionales de tal forma que podamos extraer (usando los
datos muestrales previamente colocados en la distribución de frecuencias)
algunas conclusiones con respecto a lo que realmente ocurre en la población.

Los tipos de gráficos más importantes de una tabla de frecuencias de datos


agrupados son:
a. Histogramas
b. Polígono de frecuencias relativas

3.2.2.1 Histograma

El histograma es un conjunto de rectángulos, todos ellos, generalmente, del mis-


mo ancho (C), y con una altura proporcional a la frecuencia absoluta o relativa.
En otras palabras, el área de cada rectángulo, en relación con todos los otros,
muestra la proporción del número total de observaciones que ocurren en esa
clase. Un histograma que usa las frecuencias relativas, recibe el nombre de
histograma de frecuencias relativas, y tiene la misma forma que el histograma de
frecuencias absolutas. El procedimiento para la construcción de un histograma es:
1. Trazar dos ejes, un eje para las marcas de clase yi (eje X) y el otro para las
frecuencias absolutas o frecuencias relativas.
2. Trazar rectángulos para cada una de las clases consideradas en la tabla
de frecuencias, con ancho igual al C y largo proporcional a la frecuencia
absoluta (fi) o relativa porcentual (hi%). Los rectángulos, a diferencia del
diagrama de barras para variables cualitativas, deben ser adyacentes, es
decir, cada barra debe estar junta a la que precede o antecede.
En la figura 12 se presentan algunos tipos de histogramas.

30 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Histogramas normales Histogramas de doble pico

10 10 10
10 0 10 10 10 0 10 10 0
10 0 10 10 10 0 10 10 10 0 10
10 0 0 0 10 0 0
0 0 0 0 0 0
0 0

Histogramas con islas aisladas Histogramas “Cliff” (Precipicio)


Figura 12. Tipos de
histogramas.
10 10
10 10 0 10
10
10 0 10 10 10 10 0 0 0
10 0 10 10 10 10 10 0
10 0 0 0 0 10 10 10 0 0
0 0 10 0 0
0 0 0 0
0

Histograma “rueda dentada”

10
10 0 10 10
10 10 0 10 10 0 10 0
10 0
0
0
0 0 10
0 0

El histograma de la muestra debe tener una distribución cuya forma


es muy similar a aquella de la población de la cual se tomó la muestra.
La principal ventaja del histograma de frecuencias relativas es que
permite comparar datos de diferentes tamaños de muestra.

3.2.2.2 Polígono de frecuencias (absolutas o relativas)

El procedimiento para la construcción de un polígono de frecuencias (absolutas


o relativas) consiste en unir mediante líneas rectas los pares de valores de mar-
cas de clase y frecuencias absolutas o relativas: (yi, fi) o (yi, hi%) respectivamente.
Luego, añadir clases, con frecuencia cero, en cada extremo de la escala de marcas
de clase para cerrar la gráfica y de esta manera obtener el polígono de frecuen-
cias. Las principales ventajas de un polígono de frecuencias son:
a. Es una representación más sencilla y clara que su histograma
correspondiente.
b. Ofrece un esquema más claro del patrón de datos.
c. El polígono se vuelve cada vez más suave y curvo a medida que crece
el número de clases y de observaciones.
d. El polígono de frecuencias relativas es utilizado para comparar la distri-
bución de frecuencias correspondientes a dos o más poblaciones.

Capítulo 1. Estadística descriptiva 31


Ejemplo 4
En el archivo Clientes.mtw se dispone de los datos correspondientes al
monto de compras de los clientes, durante los últimos 6 meses. A partir de los
mencionados datos realice lo que se solicite.
a. Obtenga la tabla de distribución de frecuencias.
Solución
Paso 1. Determinar el rango de la variable.
i. Stat> Basic Statistics> Display Descriptive…
ii. Seleccionar la variable M. Compras.
iii. Pulsar el botón Statistics, seleccionar Minimum, Maximum, Range, y N
total. Presionar el botón OK.
Se obtiene el siguiente reporte:

Descriptive Statistics: M. Compras


Total
Variable Count Minimum Maximum Range
M. Compras 250 1200.0 4530.0 3330.0

El rango de la variable monto de compras es: R = 4530 – 1200 = S/ 3330

Paso 2. Determinar el número de intervalos.


i. Cantidad de datos: n = 250
ii. k =
1 + 3.32 log10 ( 250) =
8.961 ≈ 9

Paso 3. Determinar la amplitud de la clase.


R 3330
C= = = S / 370
k 9
Paso 4. Construir los intervalos.
Se tiene en cuenta que el valor mínimo de los montos de compra, duran-
te los últimos 6 meses, es de S/ 1200 y la amplitud de los intervalos es
S/ 370 para obtener los límites superiores inferiores de cada uno de los
9 intervalos, tal como se presenta en la tabla 5.

Intervalo (Ii ) Límite inferior Límite superior


1 1200 1570
2 1570 1940
3 1940 2310
Tabla 5. Intervalos
4 2310 2680
para la variable
montos de compra. 5 2680 3050
6 3050 3420
7 3420 3790
8 3790 4160
9 4160 4530

32 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Paso 5. Obtener el histograma de la variable monto de compras de acuerdo
a los intervalos elaborados y de ahí construir la tabla de distribución de
frecuencias correspondiente.
i. Graph> Histogram…
ii. Seleccionar la opción Simple
iii. Seleccionar la variable M. Compras.
El histograma obtenido se presenta en la figura 13.

Figura 13. Histograma


correspondiente a la
variable Monto de
compras.


El presente histograma cuenta con 18 intervalos, y en el eje horizon-
tal aparecen las marcas de clase, lo que el software Minitab denomina
como “midpoints”, es decir, los puntos medios de los intervalos. Figura 14. Cuadro de
diálogo del comando
Histogram – Edit Bars.
Modificar el histograma
i. Hacer doble click sobre cualquier co-
lumna del histograma.
ii. Pulsar sobre la pestaña Binning.
iii. Seleccionar Cutpoint, y en Midpoint/
Cutpoint positions señalar el mínimo
valor (1200) y al límite superior del
primer intervalo (1570), dejando un
espacio vacío entre ambos valores,
tal como se muestra en la figura 14.
Pulsar OK.
iv. Si aparece un cuadro de diálogo con el
mensaje Bins extended to encompass
all data, pulsar sobre Aceptar.

Capítulo 1. Estadística descriptiva 33


v. En el histograma editado presionar el botón derecho del mouse y pul-
sar sobre Add, luego sobre Data Labels…, verificar que se encuentre
marcada la opción Use y-value labels. Pulsar OK.
El histograma ya editado se presenta en la figura 15.

Figura 15. Histograma


editado correspondiente
a la variable Monto de
compras.


A partir de las frecuencias absolutas representadas en el histogra-
ma elaborado se obtienen las frecuencias absolutas acumuladas, las
frecuencias relativas simples y las acumuladas, tal como se presenta
en la tabla 6.

Intervalo Límite Límite Marca de Frecuencia Frec. Relativa Frec. Absoluta Frec. Relativa
(Ii) inferior superior clase absoluta porcentual acumulada porcentual
(yi) (f i) (hi %) (Fi) acumulada
(Hi %)
1 1200 1570 1385 16 6.4 16 6.4
2 1570 1940 1755 27 10,8 43 17.2
3 1940 2310 2125 32 12.8 75 30.0
4 2310 2680 2495 38 15.2 113 45.2
5 2680 3050 2865 38 15.2 151 60.4
6 3050 3420 3235 31 12.4 182 72.8
7 3420 3790 3605 28 11.2 210 84.0
8 3790 4160 3975 26 10.4 236 94.4
9 4160 4530 4345 14 5.6 250 100.0
Total = 250 100.0 --- ---

Tabla 6. TDF para la variable


Monto de compras.

34 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Interpretaciones:
• f6: 31 clientes, durante los 6 últimos meses, han presentado un monto
de compras comprendido entre 3050 (inclusive) y 3420 soles.
• F4: 113 clientes, durante los 6 últimos meses, han presentado un monto
de compras inferior a S/ 2680.
• h2%: 10.8 % de los clientes, durante los 6 últimos meses, han presentado
un monto de compras comprendido entre 1570 (inclusive) y 1940 soles.
• H7%: 84.0 % de los clientes, durante los 6 últimos meses, han pre-
sentado un monto de compras comprendido entre 1200 (inclusive)
y 3790 soles.
Las demás frecuencias, aparte de la frecuencia absoluta obtenida
en el histograma elaborado, se pueden obtener a través de los cálculos
correspondientes, o a través de la modificación del histograma para así
visualizar los valores de las demás frecuencias necesarias para com-
pletar la tabla.

Modificación del histograma


i. Dar doble click sobre el eje vertical para que aparezca la ventana de
diálogo de edición de escala.
ii. Seleccionar la pestaña Type, en dicha pestaña se puede cambiar la es-
cala de frecuencia (Frequency) a porcentajes (Percent).
iii. Si se desea obtener la presentación de los valores acumulados se debe
seleccionar la opción Accumulate values across bins.
Por ejemplo, en la figura 16, se presenta las opciones seleccionadas
para obtener las frecuencias relativas acumuladas, mientras que en la
figura 17 se presentan los resultados obtenidos.

Figura 16. Cuadro de


diálogo del comando
Histogram – Edit Scale.

Capítulo 1. Estadística descriptiva 35


Figura 17. Histograma de
la variable Monto de com-
pras – Frecuencia relativa
porcentual acumulada.

La tabla de distribución de frecuencias de una variable cuantitativa conti-


nua es de datos agrupados porque los datos están formando clases o gru-
pos. Nótese también que las clases son igualmente espaciadas. Las marcas
de clase yi son los valores representativos de cada clase y serán utilizados
en el cálculo de las medidas de tendencia central y de dispersión.

b. Obtenga el polígono de frecuencias.


Solución
i. En el archivo Clientes.mtw, ingresar en las columnas C14 y C15, res-
pectivamente, los valores de las marcas de clase y de las frecuencias
relativas (en forma de proporción y no como porcentaje); conside-
rando unas marcas de clase ficticias antes y después de la primera y
úl­tima marca de clase respectivamente. Etiquete adecuadamente las
columnas empleadas:
C14: Marca de clase
C15: Frecuencia relativa
Nota: Considerar frecuencia relativa cero para marca de clase ficticia,
tal como se muestra en la figura 18.

36 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Figura 18. Cuadro de
diálogo del comando
Scatterplot.


ii. Graph> Scatterplot…
iii. Elegir la opción With Connect Line. Pulsar OK.
iv. Ingresar los datos tal como aparecen en la figura 19.

Figura 19. Cuadro de


diálogo del comando
Scatterplot.


v. Pulsar el botón Labels… e ingresar a la pestaña Data Labels y seleccio-
nar la opción Use y-value labels. Pulsar OK.
vi. Pulsar el botón Data View…, se observa que la opción Symbols ya se
encuentra seleccionada, en forma adicional se debe seleccionar la op-
ción Connect line, tal como se muestra en la figura 20. Pulsar OK.

Capítulo 1. Estadística descriptiva 37


Figura 20. Cuadro de
diálogo del comando
Scatterplot: Data View.


vii. Pulsar OK para obtener el polígono de frecuencias asociado a la varia-
ble monto de compras, tal como se muestra en la figura 21.

Figura 21. Polígono


de frecuencias corres-
pondiente a la variable
Monto de compras.

3.3 Diagrama de Pareto

El diagrama de Pareto es una gráfica que permite identificar las causas que afec-
tan en un porcentaje significativo a un problema. Una vez identificadas las cau-
sas se procede a resolverlas para reducir en un gran porcentaje la ocurrencia del
problema en estudio. Esto contribuye a mejorar la calidad del producto o servi-
cio que se ofrece. El diagrama de Pareto también sirve para separar y atender
(o resolver) las causas que son “vitales” de aquellas que son “triviales” lo que
permitirá una reducción significativa del problema.

38 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Ejemplo 5
En la cafetería de un Centro de Convenciones se viene presentando un alto
número de fallas en la prestación del servicio: demoras, quejas, insatisfac-
ción, etc. Para determinar las principales causas de estas fallas se realizó un
estudio donde se consultaba al personal de atención directo (meseros, super-
visores, jefe) e indirecto (personal de cocina y apoyo), así como a los propios
clientes sobre cuál era al origen de las fallas en la prestación del servicio. A
continuación, en la tabla 7, se presenta un resumen de las causas identifica-
das, y la frecuencia con que fueron mencionadas.

Cód. Descripción Frecuencia


A Alto número de clientes 28
B Cocinas domésticas, no industriales 5
C Demora del mesero en la toma del pedido 19
Tabla 7. Resumen
D Doble ingreso de pedido del cliente 1
de las opiniones
E Equipo de cómputo con deficiencias 5 recabadas sobre las
F Error de digitación de pedido del cliente 23 causas de las fallas
G Falta de orden en el ambiente de la cocina 6 en el servicio.
H No se cuenta con insumos suficientes 28
I No se verifica la boleta antes de imprimirla 3
J Pocas mesas de atención 2

a. Obtenga el diagrama de Pareto asociado a las causas de las fallas en el


servicio.
Solución
i. Ingresar los datos proporcionados en una hoja de trabajo del software
Minitab.
ii. Ingresar a Stat> Quality Tools> Pareto Chart…
iii. Completar el cuadro de diálogo tal como se presenta en la figura 22.

Figura 22. Cuadro de


diálogo del comando
Pareto Chart.

Capítulo 1. Estadística descriptiva 39


En Defects or attribute data in se puede seleccionar la columna C1
Cód., tal como se presenta en la figura 22, o se puede seleccionar la co-
lumna C2 Descripción. Lo preferible es trabajar con etiquetas cortas, tal
como aparece en la columna C1, ya que, si se utilizan etiquetas exten-
sas, como la descripción completa de las causas, estas ocupan demasia-
do espacio en la gráfica, reduciendo el espacio para el propio diagrama
de Pareto. En la figura 23 se aprecia el diagrama obtenido.

Figura 23. Diagrama


de Pareto para las
causas de las fallas en
el servicio.


b. Indique cuáles son las principales causas detectadas en las fallas del servi-
cio de la cafetería en el Centro de Convenciones.
Solución
[A] Alto número de clientes ( 23.3 %), [H] No se cuenta con insumos su-
ficientes ( 23.3 %), [F] Error de digitación de pedido del cliente (19.2 %)
y la [C] Demora del mesero en la toma del pedido (15.8 %). Causas
que en conjunto representan el 81.7 % de las causas señaladas por
los informantes.

4. Medidas de tendencia central


Las medidas de tendencia central cuantifican la forma de agrupamiento o ten-
dencia de los datos respecto a ciertos valores. Las medidas de tendencia cen-
tral pueden calcularse para la población (bajo ciertas condiciones) como para
la muestra. La relación entre las medidas de tendencia central calculadas en la
muestra (estadísticos) y sus correspondientes medidas de tendencia central a
nivel de población (parámetros) radica en que los valores de los estadísticos son
utilizados para estimar los valores de los parámetros. Las principales medidas
de tendencia central de una muestra (a nivel de población también existen y se
denominan parámetros) son:

40 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


a. Media o promedio aritmético.
b. Mediana.
c. Moda.
Para cada medida de tendencia central se tienen fórmulas para calcular sus
valores dependiendo si los datos están o no agrupados. A continuación, se pre-
sentan las medidas de tendencia central que se calculan en una muestra.

4.1 Media aritmética (promedio)

La media muestral es un punto de equilibrio entre los valores que están por
debajo y por encima de ella. La media muestral, o simplemente media, si no hay
confusión alguna, se denota por x .
Los tipos de media muestral son:
a. Media simple.
b. Media ponderada.
Las fórmulas para calcular la media son:

Datos no agrupados Datos agrupados

k
∑ yi fi k
n Media y = i =1 = ∑ yi hi
∑ xi n i =1
Media simple x = i =1
n Donde: yi son los valores de la variable o las marcas de clase
fi son las frecuencias absolutas
hi son las frecuencias relativas

k
∑ wi xi
Media ponderada x = i =1 Donde: wi son los pesos o ponderaciones.
k
∑ wi
i =1

Las propiedades de la media muestral son:


a. La media es única, puede asumir cualquier valor real y siempre existe.
b. Si y=
i xi ± a, entonces y= x ± a, para a constante.
c. Si yi = axi , entonces y = ax.
d. Si una muestra se divide en k submuestras de tamaño ni para cada
submuestra; la media de la muestra es igual a la suma de las medias pon-
deradas de las submuestras, dividido entre el tamaño de muestra total:
k
∑ xi ni x n + x n + ... + x n
i =1 k k
x =
= 1 1 2 2
. Lo señalado se conoce como media
k n
∑ ni
i =1
de medias.

Capítulo 1. Estadística descriptiva 41


n
e. ∑ ( xi − x ) =
0
i =1

f. La media es afectada por los valores extremos.

4.2 Mediana

La mediana se define como el valor que divide en dos partes iguales al conjunto
ordenado de observaciones. La mediana se denota por Me y se calcula de la si-
guiente manera:

Datos no agrupados Datos agrupados


a. Ordenar los datos de menor a mayor, x(1), x(2), …, x(n)
b. Si n es impar, entonces la mediana es: a. Calcule n/2 para ubicar la clase mediana.
Me = x n+1  b. Luego, aplique la siguiente fórmula
 
 2  n 
 2 − FMe −1 
Si n es par, entonces la mediana es: Me LI Me
= +C  
x n  + x n  f Me 
 
 
2
 +1
2 
 
Me =
2
donde:
x(i) es el valor de la i-ésima observación después de i) LIMe es el límite inferior de la clase donde se encuentra
que los datos han sido ordenados la mediana
ii) FMe-1 es la frecuencia acumulada absoluta de la clase
anterior a la clase donde se encuentra la mediana.
iii) fMe es la frecuencia absoluta de la clase donde se en-
cuentra la mediana.

Las propiedades de la mediana son:


1. La mediana es única y siempre existe.
2. Si y=
i xi ± a, entonces Me
= ( y) Me( x) ± a , para a constante.
3. Si yi = axi , entonces Me( y) = a Me( x), para a constante.
4. La mediana no es afectada por los valores extremos. Esta propiedad signi-
fica que la mediana debe ser usada en lugar de la media cuando se tengan
datos con valores extremos. Esta propiedad de la mediana es conocida
como robustez.
5. La mediana puede asumir cualquier valor real.

4.3 Moda

La moda se define como el valor de la variable que posee la mayor frecuencia;


también es conocida como el valor más común o el valor típico de las observa­
ciones. La moda se denota por Mo y se calcula de la siguiente manera:

42 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


a) Determine el valor que posee la mayor frecuencia.
Datos no
b) En caso de existir más de un valor con la mayor frecuencia, en-
agrupados
tonces, todos esos valores son considerados valores modales.

Las propiedades de la moda son:


a. A diferencia de la media y de la mediana, la moda se puede calcular
para datos cuantitativos y para datos cualitativos.
b. La moda puede o existir para un conjunto de datos, y de existir no siempre
es única.
c. La moda no es afectada por los valores extremos.
d. La moda puede asumir cualquier valor real.
e. La moda debe ser utilizada cuando se desea reportar el valor de la variable
que posee la mayor posibilidad de ocurrencia.

CASO: Financiera
En una agencia financiera se dispone de 10 cajeros destinados a la atención
al público, cuando cada uno de ellos termina sus labores realiza el cierre de
caja correspondiente. Los tiempos empleados, en minutos, por cada uno de
los cajeros al momento de realizar el cierre correspondiente al día anterior
se presentan a continuación:

25 19 25 24 27 25 22 26 20 23

La entidad financiera tiene un contrato con una institución de educación


superior, y durante la presente semana debe recabar los pagos de pensiones
de los alumnos ingresantes en el presente período académico. Los mencio-
nados pagos se presentan en 5 categorías distintas. A continuación, se pre-
senta la distribución de los pagos realizados por los primeros 81 ingresantes:

Categorías de pensiones Monto de pago (S/) N.° de ingresantes


( yi ) ( fi )
A 380 7
B 420 15
C 470 28
D 540 21
E 600 10
Total 81

Capítulo 1. Estadística descriptiva 43


Ejemplo 6
En relación al caso Financiera, se solicita lo siguiente con respecto a los tiem-
pos empleados:
a. En forma manual, calcule el tiempo promedio diario empleado en el cierre
de caja por parte de los cajeros de la entidad financiera.
Solución
Aplicando la fórmula:
n
∑ xi
25 + 19 + 25 + 24 + 27 + 25 + 22 + 26 + 20 + 23
=x i=
=1
= 23.6
n 10

Interpretación: El promedio de los tiempos empleados para el cierre de


caja por parte de los 10 cajeros es de 23.6 minutos.

b. En forma manual, determine el valor de la mediana asociada al tiempo


empleado diariamente en el cierre de caja por parte de los cajeros de la
entidad financiera.
Solución
Para calcular la mediana se aplica el siguiente procedimiento:
i. Ordenar los datos de menor a mayor:

19 20 22 23 24 25 25 25 26 27

x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) x(9) x(10)

ii. Como el número de datos (n) es par, entonces se identifican los dos
valores centrales para calcular la mediana:
x n  + x n 
x 10  + x 10 
 
2
 +1
2 
 
 2
 +1
 2 
x(5) + x( 6) 24 + 25
Me( x)
= = = = = 24.5
2 2 2 2

Interpretación: El 50 % de los cajeros presentó tiempos de cierre de a


lo más 24.5 minutos, mientras que el restante 50 % presentó tiempos
de cierre de por lo menos 24.5 minutos.

c. En forma manual, determine el valor de la moda asociada al tiempo em-


pleado diariamente en el cierre de caja por parte de los cajeros de la enti-
dad financiera.
Solución
Para determinar el valor de la moda solamente se debe identificar el valor
que más se repite en la serie de datos, de lo cual se observa que un tiempo
de 25 minutos fue el tiempo de cierre presentado por un mayor número
de cajeros ( 3 en total).

44 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Por lo tanto: Mo( x) = 25
Interpretación: El tiempo de cierre que más frecuentemente se repite
entre los cajeros fue de 25 minutos.

d. Haga uso del software Minitab para obtener los valores de la media,
mediana y moda.
Solución
Para calcular los valores de la media, la mediana y la moda mediante el
software Minitab, se deben ingresar los datos en una columna y luego apli-
car el siguiente procedimiento:
i. Digite los datos en la columna C1, y etiquételos como Tiempo cierre.
ii. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics…
iii. Seleccionar la variable Tiempo cierre
iv. Presionar el botón Statistics…
v. Seleccione las siguientes estadísticas descriptivas: mean (media),
median (mediana), y mode (moda). Pulse el botón OK
vi. Presionar el botón OK.

Figura 24. Cuadro de


diálogo del comando
Display Descriptive
Statistics: Statistics.

El reporte obtenido se presenta a continuación:

Descriptive Statistics: Tiempo cierre


N for
Variable Mean Median Mode Mode
Tiempo cierre 23.600 24.500 25 3

Capítulo 1. Estadística descriptiva 45


Ejemplo 7
En relación al caso Financiera, se solicita lo siguiente con respecto a los
montos de pago, en soles, de los 81 ingresantes a la institución de educación
superior:
a. Calcule el monto promedio, por concepto de pago de pensiones, que la
financiera recabó por cada ingresante.
Solución
Debido a que los datos se presentan en una tabla resumen, para calcular el
monto promedio se debe utilizar la fórmula de la media ponderada:
k
∑ yi fi
i =1 380(7) + 420(15) + 470( 28) + 540( 21) + 600(10)
M(Y )= y= = = 487.16
n 7 + 15 + 28 + 21 + 10
Interpretación: El promedio de los montos por concepto de pago de pen-
siones es de S/ 487.16 .
a.1 Todos los ingresantes además realizaron un pago por concepto de un
curso de informática, el cual tenía un costo único de S/ 90, ¿cuál es el
promedio del monto de pago incluyendo el pago por el mencionado
curso?, y ¿cuál sería el monto total del pago recibido por parte de los
81 ingresantes?

Solución
Y * : Monto de pago incluyendo el curso
Y * = Pago pensión + Pago curso ⇒ Y * =Y + 90
Monto promedio de pago incluyendo el pago del curso:
*
M(Y= ) M(Y + 90) = M(Y ) + 90
= 487.16 + 90
= S / 577.16

k
*
Monto total del pago recibido por los 81 ingresantes: ∑ yi fi
i =1
k
*
∑ yi fi k
*
Como: M(Y ) = i =1
⇒ ∑ yi* fi = M(Y * )(81) = 577.16(81) ≈ 46 750
81 i =1

a.2 Los montos de pago por concepto de pensiones se incrementarán


en un 5 % a partir del próximo mes, en cada una de las categorías
de pago. Si ya se hubiera efectuado el mencionado incremento,
¿cuál hubiera sido el nuevo monto promedio por concepto de pago
de pensiones?
Solución
W: Nuevo monto de pago considerando el incremento del 5 %

W
= (1 + 0.05)Y
Nuevo monto promedio:

M (W ) M
= = .05M(Y ) 1.05=
(1.05Y ) 1= ( 487.16) S/ 511.52

46 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


b. Determine e interprete los valores de la mediana y la moda correspon-
dientes a los montos por concepto de pago de pensiones.
Solución
Mediana: Para determinar el valor de la mediana se aplica el siguiente
procedimiento:
i. Determinar las posiciones que ocupan cada uno de los datos, los cuales
ya aparecen en forma ordenada en la tabla resumen, para lo cual se
obtienen las frecuencias absolutas acumuladas:

Monto de pago (S/) N.° de ingresantes N.° acumulado ingresantes


(xi) (fi) (Fi)
380 7 7
420 15 22
470 28 50
540 21 71
600 10 81
Total 81

ii. Como el número de datos (n) es impar, entonces, se identifica el valor


central:
Me=
( X ) x n=
+1 
x 81=
+1 
x=
( 41) 470
   
 2   2 

Nota: El tercer valor de los 5 distintos montos de pago ( x3 = 470)


corresponde, de acuerdo a las frecuencias acumuladas, a los valores
ordenados desde la posición 23 a la posición 50 de los 81 pagos reci-
bidos ( x( 23) a x50 ).

Interpretación: El 50 % de los ingresantes realizó pago por concepto de


pensiones fue por un monto de a lo más S/ 470, mientras que el restan-
te 50 % realizó pagos de por lo menos S/ 470.

Moda: Para determinar el valor de la moda se observa el valor que más


se repite, es decir, el que presenta mayor frecuencia, siendo dicho valor
el de S/ 470.
Por lo tanto: Mo( x) = 470
Interpretación: El monto por concepto de pago de pensiones que más
frecuentemente realizaron los ingresantes fue de S/ 470.

Capítulo 1. Estadística descriptiva 47


Escenario: Caso Financiera
La entidad financiera también realiza la compra y venta de moneda ex-
tranjera, y durante el presente día se han realizado 200 transacciones de
compra de euros. Los montos asociados a las compras de euros se resumen
en la siguiente tabla de distribución de frecuencias:

Monto de euros comprados (€)


Frecuencia
Intervalo
absoluta
(Ii) Límite Límite Marca de clase
(fi)
inferior superior (yi)
1 0 600 300 16
2 600 1200 900 32
3 1200 1800 1500 68
4 1800 2400 2100 44
5 2400 3000 2700 28
6 3000 3600 3300 12
Total 200

Ejemplo 8
En relación al escenario presentado sobre las 200 transacciones de compra
de euros, se solicita lo siguiente:
a. Calcule el monto promedio de euros comprados por cada transacción.
Solución
Debido a que los datos se presentan en una tabla resumen para datos
agrupados, se debe utilizar la fórmula correspondiente y trabajar con la
marca de clase y las frecuencias absolutas:
k
∑ yi fi
k =1 300(16) + 900(32) + 1500(68) + 2100( 44) + 2700( 28) + 3300(12)
=y = = 1716
n 16 + 32 + 68 + 44 + 28 + 12

Interpretación: El promedio de los montos de compra en cada transacción


es de 1716 euros.

b. Calcule la mediana asociada al monto de euros comprados por cada tran-


sacción.
Solución
Para determinar el valor de la mediana se aplica el siguiente proce­dimiento:
i. Obtener las frecuencias absolutas acumuladas.

48 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Monto de euros comprados (€)
Frecuencia Frec. Absoluta
Intervalo
absoluta acumulada
(Ii) Límite Límite Marca de clase
(fi) (Fi)
inferior superior (yi)

1 0 600 300 16 16
2 600 1200 900 32 48
3 1200 1800 1500 68 116
4 1800 2400 2100 44 160
5 2400 3000 2700 28 188
6 3000 3600 3300 12 200
Total 200

ii. Identificar el intervalo mediano, el cual es el intervalo cuya frecuencia


acumulada sea mayor o igual a la mitad de los datos que conforman la
muestra.
n 200
Determinar i, tal que Fi ≥ = = 100.
2 2
Se observa que F3 = 116 ≥ 100 ⇒ [1200, 1800〉 es el intervalo mediano.
iii. Aplicar la fórmula correspondiente.
n 
 2 − FMe -1   100 − 48 
Me( y ) =
LI Me + c  =1200 + 600   = 1658, 82
 f Me   68 
 
Interpretación: El 50 % de las transacciones implicó la compra de a lo
más 1656 , 8 euros, mientras que el restante 50 % implicó la compra de
por lo menos el mencionado valor.

4.4 Relaciones entre la media, la mediana y la moda

Si la variable en estudio es cuantitativa, el cálculo de x , Me y Mo se realizan de


la manera indicada en las secciones anteriores. Las relaciones entre estas medi-
das de tendencia central se presentan en la figura 25.

Media > Mediana > Moda Media = Mediana = Moda


Figura 25. Relaciones
entre la media, la me-
diana y la moda.

Media < Mediana < Moda

Capítulo 1. Estadística descriptiva 49


5. Medidas de posición

Las medidas de posición dividen al conjunto de datos, previamente ordenado,


en grupos con determinada cantidad de observaciones. Las principales medidas
de posición son:
a. Cuartiles.
b. Percentiles.

5.1 Cuartiles

Los cuartiles son valores que dividen al conjunto ordenado de observaciones en


cuatro partes iguales. Los cuartiles son denotados por Q1, Q2 y Q3. La figura 27
representa el significado de los cuartiles.

Q1 Q2 Q3

25 % 25 % 25 % 25 %
Figura 26. Cuartiles
y porcentajes de ob-
servaciones. 50 %

50 %

75 %

Obsérvese que el 25 % de las observaciones son menores que Q1 y el 75 % de


observaciones son al menos igual a Q1. También nótese que Q2 asume el mismo
valor de la mediana (Me) y su interpretación es la misma, es decir, 50 % de las
observaciones son menores que la mediana y 50 % de las observaciones son ma-
yores que la mediana. Por otro lado, el 75 % de las observaciones son menores
que Q3 y el 25 % son mayores que Q3.

50 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


CASO: Patio de juegos
El Gerente de una cadena de juegos infantiles y familiares se encuentra
analizando las actividades diarias de tres de sus principales locales ubi-
cados en modernos centros comerciales de Lima Metropolitana. Entre las
principales características en estudio se encuentran las siguientes:
– Número de niños por grupo (grupo familiar o grupo de amigos)
que ingresan simultáneamente al patio de juegos.
– Tiempo de permanencia, en minutos, del grupo de niños.
– Monto total gastado, en soles (S/), por el grupo de niños (tickets,
canjes, etc.).
– Número de juegos totales utilizados por el grupo de niños.
Se ha recabado los datos correspondientes a 220 grupos de niños, los
cuales se presentan en el archivo: Juegos.mtw.

Ejemplo 9
En el archivo Juegos.mtw, a partir de los datos correspondientes al número
de niños por grupo, así como al número de juegos totales utilizados, realice
lo solicitado:
a. En relación al número de niños por grupo, obtenga los valores correspon-
dientes al primer y al tercer cuartil, y su interpretación.
Solución
i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics…
ii. Seleccionar la variable N.° de niños
iii. Presionar el botón Statistics…
iv. Seleccione las siguientes estadísticas descriptivas: first quartile (primer
cuartil), y third quartile (tercer cuartil). Pulse el botón OK
v. Presionar el botón OK
El reporte obtenido se presenta a continuación:

Descriptive Statistics: N.° de niños


Variable Q1 Q3
N° de niños 2.250 4.750

Interpretación:
• El 25 % de los grupos familiares o grupos de amigos ingresó con me-
nos de 3 niños al patio de juegos (≤ 2.25).
• El 75 % de los grupos familiares o grupos de amigos ingresó con me-
nos de 5 niños al patio de juegos (≤ 4.75).

Capítulo 1. Estadística descriptiva 51


Nota: El cuartil 1 divide a un 25 % inferior y a un 75 % superior, asimis-
mo, el cuartil 3 divide a un 75 % inferior y a un 25 % superior; por lo
tanto, se pueden brindar las siguientes interpretaciones equivalentes:
• El 75 % de los grupos familiares o grupos de amigos ingresaron con
por lo menos 3 niños al patio de juegos (≥ 2.25).
• El 25 % de los grupos familiares o grupos de amigos ingresaron con
por lo menos 5 niños al patio de juegos (≥ 4.75).

b. Para el local de Santiago de Surco, señale el número de juegos por debajo


del cual se encuentra el 25 % de los grupos de niños con menor cantidad
de juegos utilizados.
Solución
Proceder de similar manera que el ítem anterior (a) y desagregar por la
variable Local (By variables).
El reporte obtenido se presenta a continuación:

Descriptive Statistics: Nº juegos


Variable Local Q1
Nº juegos Independencia 4.000
Santa Anita 6.000
Santiago de Surco 3.000

Conclusión: En el local de Santiago de Surco el 25 % de los grupos de


niños utilizaron a lo más 3 juegos.

5.2 Percentiles

Los percentiles xp(p = 1, 2, ..., 99) dividen al conjunto ordenado de datos en 100
partes iguales. De tal forma que p% de las observaciones son menores que el
percentil xp y (100 – p)% de observaciones son al menos iguales a xp. Los percen-
tiles son importantes en áreas como investigación de mercados pues permiten la
segmentación de estos.
En el presente texto, la obtención de los cuartiles y percentiles se trabajará a
partir de la base de datos mediante el uso del software Minitab.

Ejemplo 10
En el archivo Juegos.mtw, a partir de los datos correspondientes al tiempo de
permanencia, calcule los percentiles P35 y P65.

Solución
i. Etiquetar a la columna C8 como k y en dicha columna digitar los valores
de asociados a los percentiles solicitados: 0.35 y 0.65, para los percentiles
P35 y P65, respectivamente.

52 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


ii. Ingresar a Calc> Calculator…
iii. En Store result in variables señalar a la columna C9
iv. En Expression ingresar y editar la función del percentil (Percentile), la cual
se puede buscar en Functions. La edición de la función se puede apreciar
en la siguiente figura:

Figura 27. Cuadro de diálo-


go del comando Calculator:
Percentile.

Nota: Si solamente se deseaba obtener un percentil, entonces, se podría


omitir el trabajo con la columna k, y editar la función, por ejemplo, de la
siguiente forma: PERCENTILE(‘Tiempo’,0.35)
v. Presionar el botón OK.
El resultado aparecerá en la columna C9 que fue seleccionada, tal como
aparece en la siguiente figura:

Figura 28. Resultados


del comando Calculator:
Percentile.

Los valores de los percentiles son: P35 = 50.235 y P65 = 56.3; los cuales
indican que el 35 % y 65 % de los grupos de niños permanecieron a lo
más 50.235 y 56.3 minutos respectivamente.

Capítulo 1. Estadística descriptiva 53


6. Medidas de dispersión
Las medidas de dispersión son valores que sirven para cuantificar la homo-
geneidad (uniformidad, variabilidad) de los datos, es decir, sirven para medir
la proximidad que tienen los datos entre sí. Las medidas de dispersión
también son conocidas como medidas de variabilidad. Para el cálculo de algu-
nas de las medidas de dispersión se toma un punto de referencia que general-
mente es la media.
Las medidas de dispersión a nivel de la muestra (a nivel de la población tam-
bién existen las mismas medidas) son:
a. Medidas de dispersión absolutas:
i. Rango o Amplitud.
ii. Rango intercuartílico.
iii. Varianza
iv. Desviación estándar
Se denominan medidas de dispersión absolutas porque presentan si-
milares unidades de medida que poseen las observaciones.
b. Medidas de dispersión relativa: Coeficiente de variación.
Se denomina medida de dispersión relativa porque no tiene unidades
de medida.

Siempre debe usarse, como mínimo, una medida de ten-


dencia central y una medida de dispersión para describir
el comportamiento de un conjunto de datos.

6.1 Rango o amplitud

El rango muestral es la medida de dispersión más simple y se denota por R; el


rango es la primera medida de dispersión que debe usarse porque permite cono-
cer el intervalo de variación de los datos. Las fórmulas para calcularlo se indican
a continuación.

Datos no agrupados Datos agrupados

R = Valor máximo – valor mínimo R LSk − LI1


=

Las propiedades del rango muestral son:


a. Fácil de calcular.
b. El rango siempre asume valores positivos.
c. La principal desventaja del rango es que no describe la variabilidad
de los datos que se encuentran comprendidos entre los valores mí-
nimo y máximo.

54 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


6.2 Rango intercuartílico

La diferencia entre el tercer y el primer cuartil (Q3 – Q1 ) es conocido como el


rango (o amplitud) intercuartílico; dentro del mencionado rango se encuentra el
50 % central de las observaciones.
Las propiedades del rango intercuartílico son:
a. El rango intercuartílico siempre asume valores positivos.
b. El rango intercuartílico se utiliza cuando se presentan datos discordantes.
c. El rango intercuartílico no se ve afectado por la existencia de datos
discordantes.

6.3 Varianza

La desviación de una observación con respecto a la media se define como: xi − x,


y puede asumir valores positivos o negativos dependiendo si el valor xi se en-
cuentra por encima o por debajo de la media. La figura 29 ilustra este concepto.

xi x xk
Figura 29. Desviación
de una observación con
Xi − X Xk − X respecto a la media.
Desviación Desviación
negativa positiva

La varianza muestral ( S 2 ) cuantifica la dispersión de los valores xi con res-


pecto a x . Las fórmulas para calcular el valor de S 2 se presentan a continuación:

Datos no agrupados Datos agrupados

 n 2  k 2 
( )
n 2 2 2
∑ xi − x  ∑ xi  − nx  ∑ yi fi  − ny
 i =1  S2 =  
i =1
=S2 i =
=1
n −1 n −1 n −1

La varianza muestral asume un valor grande cuando los valores xi se alejan


del promedio y un valor pequeño cuando los valores xi se ubican alrededor del
promedio.
Las propiedades de la varianza muestral son:
a. La varianza muestral S2 es única y siempre existe.
b. La varianza muestral S2 siempre es positiva.
c. Si y=
i xi ± a, entonces Sy2 = Sx2 , para a constante.

Capítulo 1. Estadística descriptiva 55


d. Si yi = axi, entonces, Sy2 = a 2 Sx2 , para a constante.
e. La varianza muestral S2 es afectada por los valores extremos.
f. El mayor inconveniente de la varianza muestral S2 es que su unidad de
medida es el cuadrado de la unidad de medida de los datos originales.

6.4 Desviación estándar

La desviación estándar muestral, denotada por S, cuantifica la dispersión de los


datos xi con respecto a la media. La fórmula para calcular el valor de la desvia-
ción estándar muestral S es la misma para datos agrupados y no agrupados y se
define como:
S = S2

Donde: S2 es la varianza muestral calculada previamente para datos agrupa-


dos o no agrupados.
La desviación estándar muestral es la medida de dispersión más utilizada
junto con la media muestral ( x ). Estas dos medidas descriptivas poseen un con-
junto de propiedades estadísticas que las hacen de suma utilidad en el análisis
de datos.
Las propiedades de la desviación estándar muestral son:
a. La desviación estándar muestral S es única y siempre existe.
b. La desviación estándar muestral S siempre es positiva.
c. Si y=
i xi ± a , entonces, Sy = Sx para a constante.
d. Si yi = axi , entonces, S y = aSx , para a constante.
e. La desviación estándar muestral S es afectada por los valores extremos.
f. La desviación estándar muestral S tiene su unidad de medida igual a la
unidad de medida de los datos originales, esta propiedad la hace útil para
analizar la dispersión de los datos.
g. En el caso de que se desee comparar la variabilidad de dos o más con-
juntos, la desviación estándar muestral S puede usarse únicamente si se
cumplen las siguientes dos condiciones:
i. Los conjuntos de datos a comparar tienen las mismas unidades
de medida.
ii. Las medias muestrales de los conjuntos de datos tiene valores próxi-
mos entre sí.
Si no se cumplen estas condiciones, no debe usarse S como medida de
comparación.

56 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


6.5 Coeficiente de variación

El coeficiente de variación, denotado por C.V., cuantifica la dispersión relativa


que tienen los datos expresándola como el porcentaje de la desviación estándar
(S) con respecto al valor absoluto de la media ( x ), es decir, si x es el 100 %,
entonces el coeficiente de variación es el porcentaje de la desviación estándar
muestral con respecto a x. Luego,
S
C.V . = 100 %
x

La fórmula de cálculo de C.V. es la misma para datos agrupados y


no agrupados.
Las propiedades del coeficiente de variación son:
a. El coeficiente de variación no tiene unidad de medida.
b. El coeficiente de variación es útil para juzgar si un conjunto de datos
es homogéneo o heterogéneo. Para este fin, se deben utilizar valores
de referencia.
Algunos autores hacen uso de valores de referencia, que se muestran en la
tabla 8, para interpretar el valor del coeficiente de variación:

Valor del C.V. Interpretación

0 < C.V . ≤ 5 Los datos son muy homogéneos.

5 < C.V . ≤ 10 Los datos son homogéneos. Tabla 8. Valores de refe-


rencia para la interpreta-
10 < C.V . ≤ 15 Los datos son regularmente homogéneos. ción del coeficiente de
variación.
15 < C.V . ≤ 20 Los datos son regularmente heterogéneos.

20 < C.V . ≤ 25 Los datos son heterogéneos.

25 < C.V . Los datos son muy heterogéneos.

c. El coeficiente de variación es útil para comparar la dispersión de dos o


más conjuntos de datos que tienen los mismos o diferentes unidades o
promedios.
d. Si y= i xi − a, entonces, C.V .y > C.V .x , y si y=
i xi + a, entonces,
C.V .Z < C.V .X , para a constante.
e. Si yi = axi , entonces, C.V .y = C.V .x.

Capítulo 1. Estadística descriptiva 57


Ejemplo 11
El monto de consumo efectuado por los primeros 6 clientes de una heladería
ubicada dentro de un centro comercial se muestran a continuación:

33 12 24 18 35 16

a. En forma manual, calcule el rango de los montos de consumo por parte de


los primeros 6 clientes.
Solución
Max = 35, Min = 12
Rango = Max –=
Min 35
= – 12 23
Interpretación: La diferencia entre el mayor y menor monto de consumo,
de los primeros 6 clientes, fue de S/ 23.
b. En forma manual, determine el valor de la varianza y de la desviación
estándar asociados a los montos de consumo.
Solución
Realizando los cálculos previos:
6
∑ xi
i =1 33 + 12 + 24 + 18 + 35 + 16
=x = = 23
6 6
6
∑ xi = 33 + 12 + 24 + 18 + 35 + 16 = 3614
2 2 2 2 2 2 2
i =1

Aplicando la fórmula de la varianza:


 n 2
 ∑ xi  − nx
2
 i =  3614 − 6( 232 )
S2 = = 88 soles 2
1
=
n −1 6 −1
Obteniendo la respectiva desviación estándar:

=S S2
= 88 ≈ S /. 9.38

Interpretación: La dispersión de los montos de consumo, con respecto a su


valor promedio es de S/ 9.38.

c. En forma manual, determine e interprete el valor del coeficiente de varia-


ción de los montos de consumo.
Solución
A partir de los valores ya calculados, se tiene que:
S 9.38
C.V .
= = 100 % 100 % ≈ 40.78 %
x 23
Interpretación: Los montos de consumo presentan valores muy heterogé-
neos, es decir, son muy distintos entre sí.

58 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


CASO: Cable TV
Una empresa que brinda el servicio de instalación de televisión por cable
se encuentra realizando un análisis de la cantidad de cable coaxial que se
utilizó en las últimas 100 instalaciones realizadas; los datos recabados se
resumieron en la siguiente tabla de distribución de frecuencias:

Cable coaxial utilizado (metros) Frecuencia


Intervalo
Límite Límite Marca de clase absoluta
(Ii)
inferior superior (yi) (fi)

1 10 14 12 4
2 14 18 16 10
3 18 22 20 26
4 22 26 24 42
5 26 30 28 18
Total 100

Ejemplo 12
En relación a los datos de las 100 instalaciones de televisión por cable reali-
zadas por la empresa, responda según se solicite:
a. Calcule el rango de la cantidad de cable coaxial utilizado en las insta-
laciones en análisis.
Solución
Debido a que los datos se presentan en una tabla resumen para datos
agrupados, se debe utilizar la fórmula correspondiente y trabajar con los
límites extremos de los intervalos:
LS5 = 30, LI1 = 10
A = LS5 – LI1 = 30 − 10 =
20
Interpretación: La diferencia entre el mayor y menor cantidad de cable
coaxial utilizado fue de 20 metros.

b. Calcule la desviación estándar y el coeficiente de variación asociado a la


cantidad de cable coaxial utilizado en las instalaciones en análisis.
Solución
Utilizando la fórmula correspondiente a datos agrupados, en la cual
se hace uso de la marca de clase y las frecuencias absolutas, se tiene
lo siguiente.
Realizando los cálculos previos:

Capítulo 1. Estadística descriptiva 59


k
∑ yi fi
12( 4) + 16(10) + 20( 26) + 24( 42) + 28(18)
=y i=
=1
= 22.4
n 4 + 10 + 26 + 42 + 18
5
∑ yi fi =12 ( 4) + 16 (10) + 20 ( 26) + 24 ( 42) + 28 (18) =51 840
2 2 2 2 2 2
i =1

Aplicando la fórmula de la desviación estándar:

 k 2 
 ∑ yi fi  − ny
2
 i =1  51 840 − 100( 22.42 )
=S = ≈ 4.1 metros
n −1 100 − 1

Interpretación: La dispersión de cantidad de cable coaxial utilizado en las


instalaciones, con respecto a su valor promedio, es de aproximadamente
4.1 metros.

Aplicando la fórmula del coeficiente de variación:


S 4.1
C.V .
= = 100 % 100 % ≈ 18.3 %
y 22.4

Interpretación: Los montos de consumo presentan valores regularmente


heterogéneos, es decir, son regularmente distintos entre sí.

CASO: Usuarios de equipos de cómputo


Una revista tecnológica ha realizado un estudio para conocer el uso de los
equipos de cómputo en los hogares. Para el mencionado estudio se recaba-
ron datos asociados a 160 equipos de cómputo que disponen los residentes
de Santiago de Surco. Las variables de interés para el estudio fueron las
siguientes:
Equipo: Tipo de equipo de cómputo (PC Escritorio, Portátil).
N.° usuarios: Cantidad de usuarios que han configurado el sistema
operativo.
Almacenamiento: Cantidad de información digital almacenada (GB).
Los datos recabados se presentan en el archivo: Usuarios.mtw

Ejemplo 13
a. En relación a la cantidad de información digital almacenada por los usua-
rios, obtenga e interprete los valores correspondientes a rango, rango
intercuartílico, varianza, desviación estándar y coeficiente de variación.
Interprete el rango intercuartílico y la desviación estándar.

60 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Solución
i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics…
ii. Seleccionar la variable Almacenamiento
iii. Presionar el botón Statistics…
iv. Seleccione las siguientes estadísticas descriptivas: Standard deviation
(desviación estándar), Variance (varianza), Coefficient of variation
(coeficiente de variación), range (rango) e Interquartile range (rango in-
tercuartílico). Pulse el botón OK
v. Presionar el botón OK

Figura 30. Selección de


medidas de dispersión.


El reporte obtenido se presenta a continuación:

Descriptive Statistics: Almacenamiento


Variable StDev Variance CoefVar Range IQR
Almacenamiento 232.8 54206.4 38.17 982.8 388.0

Interpretaciones:
• El 50 % central de la cantidad de información digital almacenada por
los usuarios presenta un rango de 388 GB.
• La dispersión de la cantidad de información digital almacenada por los
usuarios, con respecto a su valor promedio, es de aproximadamente
232.8 GB.

b. En relación a los resultados del ítem anterior (a), responda según se solicite:
i. Si en la cantidad de información digital almacenada en todos los usua-
rios se desea considerar una cantidad reservada de 4 GB para la pape-
lera de reciclaje, ¿cuál sería el nuevo valor de la desviación estándar?

Capítulo 1. Estadística descriptiva 61


Solución
Sea Y : Cantidad de información digital almacenada y reservada consi-
derando 4 GB adicionales.
Se sabe que: S( X ) = 232.8 GB
Por lo tanto:
S(Y )= S( X + 4) = S( X )= 232.8 GB

ii. Exprese el valor de la varianza en terabytes (TB). NOTA: 1 TB = 1024 GB.


Solución
Sea Y : Cantidad de información digital almacenada expresada
en terabytes.
Se sabe que: V ( X ) = 54 206.4 GB2.
Por lo tanto:
V (Y ) V=
= (0.001X ) 0.0012 V ( X ) = 0.000001(54 206.4) 1 GB = 0.001 TB
V (Y) = 0.0542064 TB2
iii. Al expresar la cantidad de información digital almacenada en terabytes,
¿cómo se modifica el valor del coeficiente de variación?
Solución
Sx
El coeficiente de variación fue: =
C.V .( X )= 100 % 38.17 %
x
Aplicando el factor de conversión se tiene lo siguiente:
M(0.001X ) = 0.001M( X ), y S(0.001X ) = 0.001S( X )
El nuevo coeficiente de variación:
0.001Sx
C.V .(0.001X )
= = 100 % 38.17 %.
0.001 x

Nota: El valor del coeficiente de variación no ha cambiado luego de


aplicar el factor de conversión, ya que la transformación aplicada es
del tipo Y = kX, y por lo tanto la constante k se anula en el cálculo del
coeficiente de variación, ya que aparece en el numerador y en el de-
nominador. Si la transformación hubiese sido del tipo Y= X ± k, sí se
modificaría el valor del mencionado coeficiente.

c. En relación al número de usuarios que han configurado el sistema opera-


tivo, ¿en cuál tipo de equipo presenta una distribución más homogénea?
Solución
Proceder de similar manera que el ítem (a) y desagregar por la variable
“Equipo”. El reporte obtenido se presenta a continuación:

62 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Descriptive Statistics: N° Usuarios
Variable Equipo CoefVar
N° Usuarios PC Escritorio 35.84
Portátil 47.57

Conclusión: En las PC de escritorio, el número de usuarios que han con-


figurado el sistema operativo presenta una distribución más homogénea,
ya que a pesar de que ambos tipos de equipos poseen altos valores del
coeficiente de variación, en las PC de escritorio se obtiene un menor valor
en comparación al de los equipos portátiles.

7. Medidas de forma

Las medidas de forma sirven para cuantificar la desviación que tiene la distribu-
ción de los datos con respecto a la distribución simétrica y unimodal conocida
como distribución normal. Las medidas de forma son:
a. Coeficiente de asimetría.
b. Coeficiente de curtosis (apuntamiento).

7.1 Coeficiente de asimetría

Los principales coeficientes de asimetría son el de Pearson y el de Fisher, cuyas


fórmulas se presentan posteriormente.
La interpretación del coeficiente de asimetría (C.A.), ya sea el de Pearson o el
de Fisher, es la siguiente:
a. Si C.A. < 0, entonces la distribución es asimétrica a la izquierda (negativa).
b. Si C.A. = 01, entonces la distribución es simétrica.
c. Si C.A. > 0, entonces la distribución es asimétrica a la derecha (positiva).

Figura 31. Tipos de


asimetría.
CA > 0 CA = 0

CA < 0

1 En la práctica es difícil obtener un valor igual a cero, así que se trabaja con valores
aproximados a cero.

Capítulo 1. Estadística descriptiva 63


7.1.1 Coeficiente de asimetría de Pearson
Este coeficiente se utiliza para juzgar si un conjunto de datos con distribución
acampanada es simétrico o no, para lo cual se aplica la siguiente fórmula:
3 ( x − Me )
C.A.Pearson =
Sx
Recuérdese que una distribución es simétrica y unimodal cuando=
x Me
= Mo.
Nota: El coeficiente de asimetría de Pearson debe utilizarse sólo en aquellos
datos unimodales con distribución acampanada.

7.1.2 Coeficiente de asimetría de Fisher


Es la medida de asimetría más utilizada, ya que no presenta ninguna condición
previa y se aplica a cualquier tipo de distribución. A continuación, se presenta
la fórmula poblacional del coeficiente de asimetría de Fisher:
3
x −x
n
n∑  i 
i =1  Sx 
C.A. Fisher =
(n − 1)(n − 2)

La fórmula muestral del coeficiente de asimetría de Fisher hace uso de la media


y de la desviación estándar muestral, así como de un factor de corrección. En el
presente texto, se aplicará directamente el software para el cálculo correspondiente.

7.2 Coeficiente de curtosis


La curtosis cuantifica la cantidad de observaciones que se agrupan alrededor de
las medidas de tendencia central de la distribución de los datos.
La interpretación del valor del coeficiente de curtosis K es:
n
∑ ( xi − µ)
4
i =1
=K −3
s4
a. Si K > 0 la distribución es leptocúrtica (apuntalada)
b. Si K = 0 la distribución es mesocúrtica (normal)
c. Si K < 0 la distribución es platicúrtica (aplanada)

Mesocúrtica Platicúrtica

Figura 32. Tipos de


curtosis.

Leptocúrtica

64 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Nota: Los coeficientes de asimetría y de curtosis son índices, y por lo tanto no
poseen unidades de medida.

CASO: Aplicativo móvil para el monitoreo de la actividad física


Una empresa de artículos deportivos ha desarrollado un aplicativo móvil
para el monitoreo de la actividad física, y ha convocado a 240 personas
para monitorear sus caminatas y actividad física de mayor esfuerzo (trotar
y correr). Luego de una semana se recabaron las siguientes características:
Valoración: Valoración del aplicativo móvil elegido: Deficiente, Aceptable,
Excelente
Recorrido: Recorrido, medido en kilómetros (km), monitoreado durante
la semana.
Los datos recabados se presentan en el archivo: Ejercicios.mtw.

Ejemplo 14
a. En relación al recorrido monitoreado, obtenga los coeficientes de asime-
tría de Pearson y de Fisher. Brinde su interpretación.
Solución
i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics…
ii. Seleccionar la variable Recorrido
iii. Presionar el botón Statistics…
iv. Seleccione las siguientes estadísticas descriptivas: media, mediana,
desviación estándar, y coeficiente de asimetría (skewness). Pulse
el botón OK
v. Presionar el botón OK
El reporte obtenido se presenta a continuación:

Descriptive Statistics: Recorrido

Variable Mean StDev Median Skewness


Recorrido 29.972 5.033 29.000 0.76

Para el cálculo del coeficiente de asimetría de Pearson se hará uso


de la media, mediana y desviación estándar obtenidas en el reporte,
ya que en el software Minitab no se puede calcular directamente dicho
coeficiente.
3 ( x − Me ) 3( 29.972 − 29)
C.A.=
Pearson = ≈ 0.579
S 5.033
C.A. Fisher = 0.76

Capítulo 1. Estadística descriptiva 65


Interpretación: Los datos del recorrido monitoreado durante la sema-
na, mediante el aplicativo móvil, presentan una distribución asimétrica
positiva, ya que el valor del coeficiente es positivo.
b. Obtenga e interprete la curtosis asociada al recorrido monitoreado me-
diante el aplicativo móvil, según la valoración del aplicativo realizada por
el participante.
Solución
i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics…
ii. Seleccionar la variable Recorrido
iii. By variables: Valoración
iv. Presionar el botón Statistics…
v. Seleccione Kurtosis. Pulse el botón OK
vi. Presionar el botón OK
El reporte obtenido se presenta a continuación:

Descriptive Statistics: Recorrido

Variable Valoración Kurtosis


Recorrido Aceptable -0.18
Deficiente -0.43
Excelente 0.32

Interpretaciones:
• Los participantes que valoraron el aplicativo como Deficiente o Acep-
table presentaron un recorrido que se distribuye en forma platicúrtica
(aplanada).
• Los participantes que valoraron el aplicativo como Excelente presenta-
ron un recorrido que se distribuye en forma leptocúrtica (apuntalada)

8. Análisis exploratorio de datos

El análisis exploratorio de datos consiste de una serie de técnicas estadísticas,


de tipo gráfico, propuestas por Tukey (1977) con la finalidad de detectar lo si-
guiente:
i. Asimetría de la distribución.
ii. Presencia de valores extremos (outliers)
iii. Dispersión de los datos.
iv. Violación de alguna suposición.

66 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Las técnicas de análisis exploratorio de datos son:
a. Tallos y hojas (stem and leaf).
b. Gráfico de cajas (boxplot).
En el presente texto solamente se abordará al gráfico de cajas, ya que es el de
mayor aplicación y difusión.

8.1 Gráfico de cajas

Un gráfico de cajas es un rectángulo (caja) que es construido sobre los valores


del primer cuartil, de la mediana y del tercer cuartil. El gráfico de caja es una
poderosa herramienta visual que permite comparar diversos conjuntos de datos
simultáneamente respecto a simetría, variabilidad, valores extremos y violación
de suposiciones. La figura 33 describe las partes de una caja.

Primera cuartil Q1 Mediana Tercer cuartil Q3

Figura 33. Partes de


un gráfico de cajas.
*
Valor
extremo

Q1 – 1.5(Q3 – Q1 ) Q3 + 1.5(Q3 – Q1 )

Las características del gráfico de caja son:


a. La localización de la caja es dada por la línea que atraviesa la caja y que
representa la mediana.
b. La dispersión es dada por el largo de la caja, así como por la distancia en-
tre los extremos de los bigotes.
c. El sesgo (asimetría) se observa en la desviación que existe entre la línea
que representa la mediana y los extremos de los bigotes.
d. Los valores extremos (atípicos, discordantes, outliers) son representados
mediante asteriscos.

CASO: Consumo de electricidad


Un programa de apoyo social ha recabado datos asociados al con-
sumo de energía eléctrica, en kilovatios-hora al mes (kW.h /mes),
de las viviendas de las zonas de mayor densidad poblacional en
4 distritos del cono norte. Estos datos se presentan en el archivo:
C_Electricidad.mtw

Capítulo 1. Estadística descriptiva 67


Ejemplo 15
a. Obtenga el gráfico de cajas asociado al consumo de electricidad y brinde
una interpretación.
Solución
i. Ingresar a Graph> Boxplot…
ii. Seleccionar la opción One Y – Simple.

Figura 34. Selección


del gráfico de cajas
simple de una sola
variable.


iii. Pulse el botón OK
iv. Seleccionar a la variable C. Electricidad
v. Presionar el botón OK
Nota: Si se desea que el gráfico de cajas se muestre en horizontal, enton-
ces, se debería haber pulsado el botón Scale, y marcar la opción Transpose
value and category scales.
Para editar el gráfico de cajas obtenido, se debe realizar lo siguiente:
i. Presionar el click derecho del mouse con el cursor sobre la caja.
ii. Seleccionar Add> Data Labels…
iii. En la pestaña Outliers, seleccionar la opción Use y-value labels
iv. Pulsar OK.
El gráfico editado se presenta a continuación:

68 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Figura 35. Gráfico de
cajas simple de una
sola variable.

Interpretación: Se observan 3 datos atípicos o discordantes (outliers), 2


inferiores y 1 superior, los cuales indican que existen 2 viviendas con con-
sumos mensuales de electricidad muy bajos ( 12.00 y 12.68 kW.h/mes);
asimismo, existe una vivienda con un consumo muy alto ( 30 kW.h/mes)
en comparación a las demás viviendas de la muestra.

b. Obtenga gráficos de cajas del consumo de electricidad pero considerando


los diferentes distritos en análisis.
Solución
i. Ingresar a Graph> Boxplot…
ii. Seleccionar la opción One Y – With Groups

Figura 36. Selección


del gráfico de cajas sim-
ple con grupos.


iii. Pulse el botón OK
iv. Seleccionar a la variable a ser graficada C. Electricidad
v. Seleccionar a la variable cualitativa (categórica) Distrito.

Capítulo 1. Estadística descriptiva 69


Figura 37. Cuadro de
diálogo del gráfico de
cajas simple con grupos.


vi. Presionar el botón OK.
Luego de obtenido el gráfico, editar para etiquetar los datos atípicos. El
gráfico editado se presenta a continuación:

Figura 38. Gráfico


de cajas simple con
grupos.


Interpretación: Se aprecia que en las viviendas de Carabayllo y Comas
que conforman la muestra no existen datos discordantes; mientras que
en los distritos de Independencia y San Martín de Porres sí existen
datos discordantes.

70 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


9. Problemas resueltos

1. En relación a la cantidad de megabytes (MB) consumidos mensualmente por


los usuarios prepago de una empresa de telecomunicaciones que adquieren
paquetes de datos; se realizará una estimación del consumo promedio de
megabytes en base a 200 usuarios elegidos al azar. A cada una de las expre-
siones que se presentan, hágales corresponder uno de los siguientes térmi-
nos estadísticos:

A. Unidad de análisis B. Población C. Muestra D. Muestreo


E. Variable F. Dato G. Parámetro H. Estadístico

Para realizar la correspondencia entre las expresiones y los términos es-


tadísticos, coloque dentro de los paréntesis la letra correspondiente.
Expresiones en evaluación:
i. ( ) La cantidad de MB consumidos mensualmente por un usuario
prepago.
ii. ( ) Un usuario prepago consumió 124 MB en un mes.
iii. ( ) Los 200 usuarios prepago seleccionados.
iv. ( ) La cantidad promedio de MB consumidos por todos los usuarios
prepago.
v. ( ) La cantidad promedio de MB consumidos por los 200 usuarios
prepago.
vi. ( ) Un usuario prepago de la empresa de telecomunicaciones.
vii. ( ) Todos los usuarios prepago de la empresa de telecomunicaciones.
viii. ( ) El procedimiento utilizado para seleccionar a los 200 usuarios
prepago.
Solución
i. (E) ii. (F) iii. (C) iv. (G)
v. (H) vi. (A) vii. (B) viii. (D)

2. Una revista electrónica dedicada a temas tecnológicos realizó un estudio


dirigido a los jóvenes de algunos distritos de la zona residencial de Lima
Metropolitana. Para el estudio se realizó la selección al azar de 800 jóvenes
de los mencionados distritos. Los principales resultados obtenidos fueron
los siguientes:

El 42 % de los encuestados posee un smartphone de gama alta, y el 19 %


usa el sistema operativo móvil iOS; además, en promedio, acceden desde
su smartphone, 2.5 horas diariamente a las redes sociales, y se determinó
que la mayoría de los jóvenes se encuentra suscrito a 3 redes sociales.

Capítulo 1. Estadística descriptiva 71


De acuerdo al contexto presentado:
a. Identifique la unidad de análisis, población, muestra, variables y tipos
de variables.
b. Presente un ejemplo de dato y de estadístico.
Solución
a. De acuerdo al contexto se tiene lo siguiente:
Unidad de análisis: Joven residente en alguno de los distritos residencia-
les de Lima Metropolitana.
Población: Todos los jóvenes residentes en los distritos residenciales de
Lima Metropolitana.
Muestra: 800 jóvenes residentes en los distritos residenciales de Lima
Metropolitana.
Variable 1: Posesión de smartphone (cualitativo nominal).
Variable 2: Sistema operativo móvil que usa el smartphone (cualitativo
nominal).
Variable 3: Tiempo de acceso diario, desde el smartphone, a las redes so-
ciales (cuantitativo continuo).
Variable 4: Número de redes sociales a las que está suscrito (cuantitativo
discreto).
b. Se pueden brindar los siguientes ejemplos:
Dato: Un joven encuestado señaló que el sistema operativo de su smart­
phone es Android.
Estadístico: El 42 % de los encuestados posee un smartphone de gama alta.

3. Para cada uno de los siguientes estudio, indique la unidad de análisis,


la variable y el tipo de variable que debería ser utilizado para resumir la
información:
a. Conocer el número de hijos de los operarios de una empresa manu­
facturera.
b. Determinar el nivel de satisfacción de asegurados de una AFP.
c. Identificar el país de procedencia de los turistas que visitan la reserva
de Paracas.
Solución
a. Unidad de análisis: Operario de una empresa manufacturera.
Variable: Número de hijos.
Tipo de variable: Cuantitativo discreto.
b. Unidad de análisis: Asegurado de la AFP.
Variable: Nivel de satisfacción.
Tipo de variable: Cualitativa ordinal.

72 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


c. Unidad de análisis: Turista que visita la reserva de Paracas.
Variable: País de procedencia.
Tipo de variable: Cualitativa nominal.

4. En base a una muestra de 320 personas de la población económicamente


activa, se elaboró una gráfica circular asociada al nivel de satisfacción con
la oferta turística:

a. Determine el porcentaje de encuestados que señalaron un nivel de


satisfacción medio.
b. Indique el número de encuestados que señalaron un alto nivel de
satisfacción.
c. De los encuestados que señalaron un nivel de satisfacción medio con la
oferta turística, un 37.5 % laboran en el sector público. ¿Cuántas per-
sonas señalaron un nivel de satisfacción medio y laboran en el sector
privado?
Solución
a. La suma de todos los porcentajes debe ser igual al 100 %, entonces:
X + 12.5 % + 27.5=
% 100 % ⇒ = X 60.0 %

El 60.0 % de los encuestados señalaron un nivel de satisfacción medio.
b. El 12.5 % de los 320 encuestados señalaron un nivel de satisfacción
alto, entonces:

0.125(320) = 40 encuestados:
192 encuestados
c. Nivel de satisfacción Medio: 0.60 × 320 =
De los 192 encuestados, el 37.5 % labora en el sector público, entonces:

0.375(192) = 72 encuestados
La diferencia con respecto a los 192 encuestados nivel de satisfacción
medio, corresponden al sector privado: 192 − 72 =120 encuestados.

Capítulo 1. Estadística descriptiva 73


5. Se realizó una tabla cruzada asociada a las variables de rendimiento y local
asociadas a los trabajadores de una empresa del rubro tecnológico, tal como
se muestra a continuación.
Local
Rendimiento Total
L1 L2 L3 L4
Bajo 2 3 1 2 8
Medio 9 14 20 7 50
Alto 3 7 9 3 22
Total 14 24 30 12 80

Responda a las siguientes preguntas:


a. ¿Cuántos y que porcentaje de trabajadores eran del local L1 y tuvieron
un rendimiento medio?
b. De los trabajadores con un rendimiento medio, ¿qué porcentaje corres-
ponden al local L3? Justifique cuantitativamente.
c. De los trabajadores con un rendimiento alto, ¿qué porcentaje no corres-
ponden al local L4? Justifique cuantitativamente.
d. De los trabajadores del local L4, ¿es o no correcto afirmar que más de la
cuarta parte tuvo un rendimiento alto? Justifique cuantitativamente.
Solución
a. ¿Cuántos y que porcentaje de trabajadores eran del local L1 y tuvieron
un rendimiento medio? 9 de 80 trabajadores, es decir, 11.25 %.
b. De los trabajadores con un rendimiento medio, ¿qué porcentaje corres-
ponde al local L3? Justifique cuantitativamente.
De los trabajadores con un rendimiento medio, el 40 % corresponde
al local L3.
c. De los trabajadores con un rendimiento alto, ¿qué porcentaje no corres-
ponde al local L4? Justifique cuantitativamente.
De los trabajadores con un rendimiento alto, el 86.36 % ([3 + 7 + 9] / 22)
no corresponde al local L4.
d. De los trabajadores del local L4, ¿es o no correcto afirmar que más
de las tres décimas partes tuvieron un rendimiento alto? Justifique
cuantitativamente.
No es correcto afirmar que, de los trabajadores del local L4, más de las tres
décimas partes tuvieron un rendimiento alto, ya que los trabajadores con
este nivel de rendimiento representan el 25 % (3/12 ≅ 25% < 30% ≅ 3/10).

6. En una muestra de 160 personas, entre hombres y mujeres, que realizaron


compras en un centro comercial, se observó la forma de pago (efectivo, tar-
jeta de débito, tarjeta de crédito); luego de lo cual se resumió lo siguiente:

74 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


• 35 % de las personas pagaron con tarjeta de débito.
• Los hombres que pagaron con efectivo representan la décima parte del
total de personas en estudio.
• De las 64 mujeres, el 18.75 % pagó con efectivo.
• De los hombres, el 31.25 % pagó con tarjeta de débito.

a. A partir de la información brindada, obtenga y presente la tabla de con-


tingencia correspondiente.
b. De las personas que pagaron con tarjeta de crédito, ¿qué porcentaje fue-
ron hombres? Justifique cuantitativamente.
Solución
a. Tabla de contingencia:
• 56 personas pagaron con tarjeta de débito: 0.35 × 160 =
56.
• 16 hombres que pagaron con efectivo: 0.10 × 160 =
16.
• De las mujeres, 12 pagaron con efectivo: 0.1875 × 64 =
12.
• De los hombres, 30 pagaron con tarjeta de débito: 0.3125 × 96 =
30.
Los demás valores de la tabla se obtuvieron por diferencia.

Medio de pago
Sexo Total
Efectivo T. Débito T. Crédito
Hombre 16 30 50 96
Mujer 12 26 26 64
Total 28 56 76 160

7. Un investigador ha realizado un estudio sobre los grupos de personas que


asisten a funciones artísticas o de entretenimiento. En relación a la varia-
ble correspondiente al número de individuos que conforman el grupo de
personas que asisten a la función artística, se tiene, en forma incompleta,
la siguiente tabla de distribución de frecuencias asociada a una muestra de
160 grupos de personas.

N.° de Frecuencia Frecuencia absoluta Frecuencia relativa Frecuencia relativa


i personas absoluta acumulada porcentual porcentual acumulada
(yi ) (fi ) (Fi ) (hi %) (Hi %)
1 2 15
2 3 40
3 4 79
4 5 116
5 6 142
6 7

Total

Capítulo 1. Estadística descriptiva 75


Responda adecuadamente a las siguientes preguntas:
a. Complete la tabla presentada.
b. ¿Cuántos grupos de personas se encontraban conformados por más de 4
personas?
c. Calcule e interprete el valor de F5 – F3.
d. ¿Es cierto que los grupos de 4 personas representan un poco más de la
cuarta parte de los grupos en estudio?
e. ¿Qué porcentaje de grupos se encontraban conformados por hasta
6 personas?
f. ¿Qué porcentaje de participantes indicaron que su grupo lo conforma-
ban 4 o más personas?
g. Si los grupos de 2 a 3 personas son considerados como “Reducidos”; los
de 4 a 5 personas son considerados “Numerosos”, y los de 6 a más como
“Muy numerosos”; ¿cuál de dichas categorías es la de mayor porcentaje?
Solución
a. Tabla de distribución de frecuencias:

N° de personas Frecuencia Frec. Absoluta Frec. Relativa Frec. Relativa


i (yi) absoluta acumulada porcentual porcentual acumulada
(fi) (Fi) (hi %) (Hi %)

1 2 15 15 9.38 9.38
2 3 25 40 15.63 25.00
3 4 39 79 24.38 49.38
4 5 37 116 23.13 72.50
5 6 26 142 16.25 88.75
6 7 18 160 11.25 100.00
Total 160 100.00

b. f4 + f5 + f6 = 37 + 26 + 18 = 81 participantes
De forma similar: 160 – F3 = 160 − 79 =
81 participantes.
c. F5 – F3 = 142 − 79 = 63 grupos se encontraban conformados de 5 a 6
personas.
d. La cuarta parte (1/ 4) es el 25 %, y se tiene que:
h3 % 24.38 % < 25 %
=

Por lo tanto, no es cierto lo que se señala, ya que, en realidad, un poco
menos de la cuarta parte de los grupos en estudio se encontraban con-
formados por 4 personas.
e. H5 % = 88.75 % de los grupos se encontraban conformados por hasta
6 personas.

76 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


f. 100 % − H 2 % = 100 % − 25 % = 75 %
de los grupos se encontraban conformados de 4 a más personas.
g. Grupos “Reducidos”: H 2 % = 25.0 %
Grupos “Numerosos”: H 4 % − H 2 % = 72.5 % − 25.0 % = 47.5 %
Grupos “Muy numerosos”: 100 % − H 4 % = 100 % − 72.5 % = 27.5 %.
Por lo tanto, los grupos “Numerosos” ( 47.5 %) representan el mayor
porcentaje.

8. Los directivos de una empresa distribuidora de energía eléctrica se encuen-


tran realizando un estudio para analizar el monto asociado al consumo
anual de energía eléctrica. Para la realización de un estudio piloto se se-
leccionaron a 32 hogares de los distritos de Ate, Comas y Lince, los cuales
presentaron los siguientes montos de consumo:

2300 2890 2960 3100 2880 1700 1880 3200


3050 2030 2380 2140 2650 2820 1780 2340
3800 3350 1800 3050 3560 3720 2450 3010
2740 2420 2540 2300 2580 2070 2080 1850

a. Realice la siguiente codificación:


Bajo: consumos menores a S/ 2400
Estándar: consumos mayores o iguales a S/ 2400 pero menores de S/ 2800.
Elevado: consumos mayores o iguales a S/ 2800 pero menores de S/ 3200.
Muy elevado: consumos o mayores a S/ 3200
¿Cuál es el porcentaje de hogares correspondiente a cada categoría de la
presente clasificación?
b. Utilizando el criterio de Sturges, construya la tabla de distribución de
frecuencias correspondiente.
Solución
a. Luego de digitar los datos en la hoja de trabajo del software Minitab, se
realizará una codificación de numérico a texto:
0 : 2399.99 ⇒ Bajo 2400 : 2799.99 ⇒ Estándar
2800 : 3199.99 ⇒ Elevado 3200 : 99999 ⇒ Muy elevado
Luego de lo cual se obtienen los porcentajes correspondientes:

Tally for Discrete Variables: Monto consumo


Pago Count Percent
Bajo 13 40.63
Elevado 8 25.00
Estándar 6 18.75
Muy elevado 5 15.63
N= 32

Capítulo 1. Estadística descriptiva 77


b. Se obtienen las estadísticas descriptivas correspondientes

Descriptive Statistics: Monto consumo annual


Total
Variable Count Minimum Maximum Range
Pago anual 32 1700 3800 2100

Luego de obtenido el rango, se determina el número de intervalos,


aplicando la fórmula de Sturges:
k=
1 + 3.32(log10 (32)) =
5.9971 ≈ 6

2100
Por lo tanto, la amplitud del intervalo es:
= 350 .
= C
6
A continuación, se hace uso del software Minitab para obtener el
histograma correspondiente:


A partir del cual se construye la tabla de distribución de frecuencias
de los montos del consumo anual de energía eléctrica, tal como se mues-
tra a continuación:

Límite Límite Marca de Frecuencia Frecuencia relativa Frecuencia Frecuencia relativa


inferior superior clase absoluta porcentual absoluta acumulada porcentual acumulada
(yi ) (fi ) (hi %) (Fi ) (Hi %)

1700 2050 1875 6 18.750 6 18.750


2050 2400 2225 7 21.875 13 40.625
2400 2750 2575 6 18.750 19 59.375
2750 3100 2925 7 21.875 26 81.250
3100 3450 3275 3 9.375 29 90.625
3450 3800 3625 3 9.375 32 100.000

78 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


9. En un taller mecánico autorizado de una marca de automóviles, se ha reca-
bado el kilometraje recorrido por los automóviles que ingresan al taller para
una reparación en el motor. A continuación, se presenta, en forma incomple-
ta, la tabla de distribución de frecuencias asociada a 250 automóviles:
Nota: Intervalos de igual amplitud.

Intervalo de Marca de N.º Autos N.º Acum. % Autos % Acum.


i
kilómetros (S/) Clase ( yi ) (fi ) Autos (Fi ) (hi %) Autos (Hi %)

1 [ – 〉 16.00

2 [ – 〉 112

3 [ – 〉 172

4 [ – 〉 19.20

5 [ – 22 000〉 20 000

Total 250 100

Realice o responda según se solicite.


a. Complete la tabla de distribución de frecuencias.
b. ¿Cuál es la amplitud de los intervalos?
c. ¿Cuál es la marca de clase correspondiente al primer intervalo?
d. ¿Qué porcentaje de autos no se encuentran comprendidos en el primer
intervalo?
e. ¿Cuántos autos presentaron un kilometraje de por lo menos 6000 km
pero por debajo de los 18 000 km?
Solución
a. Complete la tabla de distribución de frecuencias.
Intervalo de Marca de N.º Autos N.º Acum. % Autos % Acum.
i
kilómetros (S/) Clase (yi) (fi) Autos (Fi) (hi %) Autos (Hi %)
1 [ 2000 – 6000〉 4 000 40 40 16.00 16.00

2 [6000 – 10 000〉 8 000 72 112 28.80 44.80

3 [10 000 – 14 000〉 12 000 60 172 24.00 68.80

4 [14 000 – 18 000〉 16 000 48 220 19.20 88.00

5 [18 000 – 22 000〉 20 000 30 250 12.00 100.00

Total 250 100 %

Capítulo 1. Estadística descriptiva 79


b. ¿Cuál es la amplitud de los intervalos?
40 000 km.

c. ¿Cuál es la marca de clase correspondiente al segundo intervalo?
8000 km.
d. ¿Qué porcentaje de autos no se encuentran comprendidos en el primer
intervalo?
100 % − 16 % = 84 %
e. ¿Cuántos autos presentaron un kilometraje de por lo menos 6000 km
pero por debajo de los 18 000 km?
180 automóviles.
72 + 60 + 48 =

10. En una galería comercial especializada en la venta de muebles para el hogar


se ha realizado una encuesta para determinar los motivos de insatisfacción
de los clientes, y se ha elaborado el siguiente diagrama de Pareto.

a. Si cada cliente insatisfecho emitió una opinión sobre su motivo de in-


satisfacción, ¿cuántos clientes insatisfechos fueron considerados para el
estudio?
b. Obtenga los valores faltantes correspondientes a las frecuencias absolu-
tas y relativas acumuladas.
c. ¿Cuáles motivos de insatisfacción empezaría por tratar de solucionar?,
¿por qué criterio?

80 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Solución
a. Como una frecuencia absoluta de 60 corresponde a un porcentaje (fre-
cuencia relativa) de 40 %, entonces se tiene que:
60
= 0.40, entonces, n = 150 clientes insatisfechos fueron los consi-
n
derados para el estudio.
f2 39=
b. = , f5 9=
, f6 4
= H 4 % 89=.33 %, H6 % 98.00 %

c. ¿Cuáles motivos de insatisfacción empezaría por tratar de solucionar?,
¿por qué criterio?
Se empezaría por tratar de solucionar los siguientes motivos: inade-
cuada explicación del producto, pocos modelos, y diseños antiguos, ya
que son los de mayor frecuencia, y juntos representan el 79.33 % de la
totalidad de opiniones emitidas.

11. En un hotel ubicado en Moyobamba, se ha elaborado una gráfica de basto-


nes asociada al número de noches de estadía en el hotel, por parte de 128
clientes, tal como se muestra a continuación:


Basado en el gráfico de bastones, obtenga e interprete adecuadamente las
siguientes medidas estadísticas solicitadas.
a. La media.
b. La mediana.
c. La moda.
Solución
a. Cálculo de la media.
5
∑ yi fi 1 22 + 2 50 + 3 32 + 4 18 + 5 6
=y i =1 =
( ) ( ) ( ) ( ) (=) 320 = 2.5
n 128 128

Capítulo 1. Estadística descriptiva 81


La cantidad promedio de noches de estadía en el hotel fue de
2.5 noches.
b. La mitad de 128 es 64, así que se ubican los datos que ocupan las posi-
ciones 64 y 65 el cual en ambos casos es 2 noches.
x( 64 ) + x( 65) 2 + 2
Me=
(X ) = = 2 noches, ya que n es par.
2 2
El 50 % de los clientes encuestados tuvieron a lo más una estadía de
2 noches en el hotel.
c. Mo( X ) = 2
El tiempo de estadía más frecuente es de 2 noches.

12. A un grupo de 12 jóvenes se les consultó sobre el número de tarjetas de cré-


dito que posee. Se determinó que 1 joven no poseía tarjeta de crédito, y que
6, 3, 1 y 1 jóvenes poseían 1, 2, 3 y 4 tarjetas de crédito, respectivamente.
a. Obtenga e interprete el valor de la mediana asociada al número de tarje-
tas de crédito que poseen los jóvenes en estudio.
b. ¿Cómo mínimo, cuántos jóvenes con 3 tarjetas de crédito se deberían
añadir al grupo de jóvenes en estudio, para que la mediana cambie
de valor?
c. Si se añade la mínima cantidad de jóvenes con 3 tarjetas de crédito que
se determinó en el ítem anterior (b), ¿cuál tipo de distribución presen-
taría la nueva muestra de jóvenes en relación al número de tarjetas de
crédito que poseen? Justifique.
Solución
a. Presentando los datos ordenados.

0 1 1 1 1 1 1 2 2 2 3 4

x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) x(9) x(10) x(11) x(12)

n = 12
Como n es par, entonces:
x +x
n n 
   + 1 x(6) + x(7) 1 + 1
Me(=
X) 2 2 =  = = 1
2 2 2
Interpretación: El 50 % de los jóvenes encuestados posee a lo más 1
tarjeta de crédito.
b. Si se añaden jóvenes con 3 tarjetas de crédito, estos ocuparán la posición
x( 11) en adelante, y por lo tanto el tamaño de la muestra (n) aumentaría.
Entonces, si se desea que la mediana se modifique, debería ser
mayor que 1.

82 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Si se añaden jóvenes con 3 tarjetas de crédito, entonces, la nueva me-
diana por lo menos debería encontrarse entre x y x .
(7) ( 8)
x +x
n n 
   + 1 x(7) + x(8) 1 + 2
Me=
(X ) 2 2 =  = = 1.5
2 2 2
Lo cual ocurriría si x n  = x(7 ) , es decir si n = 14.
 
2
Por lo tanto, para que la mediana cambie de valor, por lo menos
14 − 12 =2 jóvenes con 3 tarjetas de crédito se deberían añadir al grupo.
c. Añadiendo 2 jóvenes con 3 tarjetas de crédito se tiene lo siguiente:
Moda = 1 tarjeta
Mediana = 1.5 tarjetas
5
∑ yi fi
0(1) + 1(6) + 2(3) + 3(1 + 2) + 4(1) 25
y i =1 =
Media = = = ≈ 1.786
n 12 + 2 14
La nueva muestra de jóvenes, en relación al número de tarjetas de
crédito que poseen, presenta una asimetría positiva (cola derecha), ya
que moda < mediana < media

13. En un club de campo, se hizo el siguiente gráfico asociado al tiempo de uso


de los servicios libres que ofrece el club por parte de los usuarios que se han
hospedado en las cabañas durante los fines de semana.


a. Obtenga e interprete el tiempo promedio de uso de los servicios libres
que ofrece el club de campo.
b. Si el club de campo se encuentra ofreciendo ofertas y promociones para
la realización de actividades, por lo cual se espera que el tiempo de uso
de los servicios libres disminuya en un 20 %, ¿cuál será el nuevo tiempo
de uso promedio?

Capítulo 1. Estadística descriptiva 83


Solución
a. A partir de la gráfica de frecuencias absolutas acumuladas, se obtiene la
tabla de distribución de frecuencias correspondiente:

Marca de clase Frecuencia absoluta


Intervalos
(yi) (fi)
[60 − 120〉 90 10

[120 − 180〉 150 64

[180 − 240〉 210 97

[240 − 300〉 270 100

[300 − 360] 330 49

Total ----- 320

Cálculo de la media:
1 k 90 (10 ) + 150 ( 64 ) + 210 ( 97 ) + 270 (100 ) + 330 ( 49 )
=
M (Y ) =∑ yi fi
n i =1 320
74 040
=
M (Y ) = 231.375 minutos
320
Interpretación: Los usuarios del club de campo que se han hospedado
en las cabañas durante los fines de semana usan los servicios libres un
promedio de 231.4 minutos, aproximadamente.
b. Haciendo uso de las propiedades de la media:
=
M =
(0.80Y ) 0.80 M (Y ) 0.80 ( 231.375 ) 185.1 minutos.

El nuevo tiempo promedio de uso de los servicios libres del club de
campo será de 185.1 minutos.

14. Una entidad especializada en el financiamiento de pequeños negocios po-


see 2 agencias en un distrito del cono este. Las agencias A y B disponen
de 4 y 6 promotores de crédito, respectivamente, quienes visitan a los
pequeños emprendedores de la zona para ofrecerles financiamiento. La en-
tidad financiera emitió el siguiente informe relacionado a la colocación de
créditos, por parte de los promotores, durante el último mes:

Promedio de los montos de crédito por asesor


Tipo de créditos
Agencia A Agencia B

Nuevos créditos S/ 68 300 S/ 70 200


Renovación de créditos S/ 94 500 S/ 88 600

Nota: Crédito total colocado = Créditos nuevos + Créditos renovados

84 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


a. Determine el promedio del monto de los nuevos créditos colocados por
los promotores de crédito de ambas agencias en conjunto.
b. Si el monto promedio de nuevos créditos colocados por los promotores
en la Agencia A se encontraba errado (no era S/ 68 300 ); de forma tal que
el promedio del monto de nuevos créditos colocados por los promotores
de ambas agencias en conjunto es de S/ 69 500, ¿cuál era el verdadero
monto promedio de nuevos créditos colocados en la Agencia A?
c. Determine el promedio del monto de los créditos totales colocados por
los promotores de la agencia A.
d. Determine el promedio de los créditos totales colocados por los promo-
tores de crédito de ambas agencias.
Solución
a. Sea, X: Monto de los nuevos créditos.
Se tiene: x A = 68 300 , xB = 70 200 , nA = 4 , nB = 6
Se sabe que:
nA x A + nB xB 4(68 300) + 6(70 200) 694 400
=x = = = S/ 69 440
n A + nB 4+6 10

b. Se sabe que: x = nA x A + nB xB
n A + nB

4 x A + 6(70 200) 4 x A + 421 200


=x = = 69 500
4+6 10
69 500(10) − 421 200
=xA = S/ 68 450
4

c. Sea,
X: monto de los nuevos créditos,
Y : monto de renovación de créditos, y
Z: monto total de créditos.
Se tiene: M ( X A ) = 68 300 , M (YA ) = 94 500
Haciendo uso de las propiedades de la media:
M(ZA ) =
M( X A + YA ) =
=M( X A ) + M(YA ) = S / 162 800
68 300 + 94 500 =

d. zB =
M ( ZB ) =M( XB + YB ) =
=M( XB ) + M(YB ) = S / 158 800
70 200 + 88 600 =

nA z A + nB zB 4(162 800) + 6(158 800) 1 604 000
= z = = = S / 160 400
nA + nB 4+6 10

15. En una fábrica de electrodomésticos, los operarios A y B fueron evaluados


en su velocidad para ensamblar un modelo de ventilador. La evaluación se
realizó en 2 turnos: mañana y tarde. Se obtuvo los siguientes resultados:

Capítulo 1. Estadística descriptiva 85


Tiempo promedio (seg.) de ensamble
Turno
Operario A Operario B Ambos operarios

Mañana 170.0 172.0 170.96

Tarde 170.2 171.4 170.77

Los promedios fueron calculados con diferentes tamaños de muestra


(número de ventiladores) para cada turno y para cada operario.
a. Si en el turno de la mañana la muestra total de ventiladores ensambla-
dos por ambos operarios fue de 125 ventiladores, ¿cuántos ventiladores
fueron ensamblados por cada operario?
b. En el turno de la tarde, ¿qué porcentaje de la muestra corresponde a cada
operario?
Solución
a. Sea, X: tiempo de ensamblaje del operario durante el turno de la mañana.
Se tiene: x A = 170, xB = 172, nA + nB = = n=
125 , entonces B 125 − nA

n A x A + nB x B nA (170) + (125 − nA )172


=x = = 170.96
n A + nB 125
170nA − 172nA + 21 500
= 21 370 ⇒ n= 65.
A

El número de ventiladores que fueron ensamblados por cada opera-


rio en el turno de la mañana es: nA = 65 y nB = 60.

b. Sea, Y : tiempo de ensamble del operario durante el turno de la tarde.


De la fórmula del promedio general (media de medias) se deduce lo
siguiente:
n A y A + nB y B nA nB
=y = yA + p A y A + pB y B , donde p es la
yB =
n A + nB n A + nB n A + nB

proporción de la muestra que corresponde a cada operario.
Se tiene: y A = 170.2 , y = 171.4 , p A + pB =⇒
1 pB =−
1 p A . Por lo
B
tanto:
y = p A 170.2 + (1 − p A )171
= .4 170.2 p A − 171.4 p A + 171
= p A 0.525
.4 170.77 ⇒ =

Los porcentajes de la muestra que corresponden a cada operario son


de 52.5 % y 47.5 %, para los operarios A y B, respectivamente.

86 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


16. Se han recabado los datos asociados a 80 usuarios de los principales ser-
vicios de acceso a contenidos vía streaming, es decir, servicios de reproduc-
ción de contenido digital en paralelo mientras se descarga sin almacenarse.
En el archivo Streaming.mtw, se presentan los datos asociados a las
siguientes variables:
Servicio Servicio de streaming del cual es usuario activo.
Nivel manejo Nivel de manejo de las funcionalidades del servicio.
H. Conexión Horas de conexión mensual para el uso del servicio.
En relación a las horas de conexión mensual responda a las siguientes
preguntas:
a. Según el nivel de manejo de las funcionalidades del servicio, ¿en cuál
de los niveles los usuarios presentan un mayor promedio de horas de
conexión?
b. Para las horas de conexión mensual se consideró el tiempo de búsqueda
de contenidos y el tiempo de reproducción. Si se considera un tiempo
constante de 2.14 horas al mes para la búsqueda de contenidos. Para los
usuarios de Deezer, ¿cuál es el nuevo valor promedio de las horas de co-
nexión mensual sin considerar la búsqueda de contenidos?
c. ¿Cuál es el valor de las horas de conexión por debajo del cual se encuen-
tra el 50 % de usuarios de Spotify con menores tiempos de conexión?
d. Complete el siguiente párrafo: El 25 % de los usuarios encuestados con
menores tiempos de conexión, presenta como máximo horas de
conexión mensual, el mismo valor que coincide para los usuarios de
. Mientras que el 25 % de los usuarios de Netflix, con mayores tiem-
pos de conexión, presenta un tiempo de conexión de 29.6 horas.
e. Halle el tiempo máximo de horas de conexión mensual del 65 % de los
usuarios de Netflix con menores tiempos de conexión.
Solución
a. Se obtiene los promedios asociados a las horas de conexión, en forma
desagregada por nivel de manejo de las funcionalidades del servicio.

Descriptive Statistics: H. Conexión


Nivel Total
manejo Count Mean
Alto 9 30.41
Bajo 26 18.373
Medio 45 25.984

Los usuarios con un nivel de manejo alto de las funcionalida-


des del servicio presentan un mayor promedio de horas de conexión
(30.41 horas).
b. Se obtiene los promedios asociados a las horas de conexión, en forma
desagregada por el servicio de streaming.

Capítulo 1. Estadística descriptiva 87


Además, se obtienen los valores de la mediana y los cuartiles para
responder las preguntas posteriores.

Descriptive Statistics: H. Conexión


Total
Variable Servicio Count Mean Q1 Median Q3
H. Conexión Deezer 16 25.86 23.25 25.80 29.10
Netflix 32 24.27 18.50 25.15 29.60
Spotify 32 22.83 19.20 20.55 25.95

Aplicando las propiedades de la media se tiene lo siguiente:


M( XDeezer – 2.14) = M( XDeezer ) – 2.14

M( XDeezer − 2.14) = 25.86 − 2.14 = 23.72 horas

c. De acuerdo al reporte obtenido se observa que el 50 % de usuarios de
Spotify con menores tiempos de conexión presentan a lo más 20.55 ho-
ras de conexión al mes, ya que ese es el valor de la mediana.

d. Se obtienen las medidas de posición en forma general, sin considerar


ningún tipo de desagregación.

Descriptive Statistics: H. Conexión

Total
Variable Count Q1 Median Q3
H. Conexión 80 19.200 23.700 29.100

Se observa que los valores asociados a los espacios a completar se


encuentran a asociados a (en orden de aparición): [1] Cuartil 1 general:
19.2 horas, [2] Cuartil 1 asociado a Spotify: 19.2 horas, [3] Cuartil 3 aso-
ciado a Netflix.
El párrafo completado queda de la siguiente forma: El 25 % de los
usuarios encuestados con menores tiempos de conexión presenta como
máximo 19.2 horas de conexión mensual, el mismo valor que coincide
para los usuarios de Spotify. Mientras que el 25 % de los usuarios de
Netflix, con mayores tiempos de conexión, presenta un tiempo de
conexión mínimo de 29.6 horas.

e. Se tiene que dividir la hoja por la variable Servicio: Split by Servicio.


En la hoja asociada al servicio de Netflix, se ingresa a la calculadora
del software Minitab y se obtiene el percentil 65 : PERCENTILE(‘H. Co-
nexión’, 0.65)
Con lo que se concluye que el tiempo máximo de horas de conexión
mensual del 65 % de los usuarios de Netflix con menores tiempos de
conexión, es de 27.53 horas.

88 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


17. Se dispone de la siguiente información sobre las notas, en escala centesi-
mal, obtenidas por los asistentes a una capacitación, los cuales se dividie-
ron en 2 grupos:

Grupo A Grupo B

Asistentes evaluados = 30 Asistentes evaluados = 28


30 30 28 28
∑ xi = 2100 , ∑ xi2 = 158 600 ∑ xi = 2100 , ∑ xi = 174 375
2
i =1 i =1 i =1 i =1

Mediana = 75 puntos Mediana = 70 puntos

a. Determine cuál grupo obtuvo puntajes más homogéneos.


b. ¿Es cierto que la distribución de las notas del grupo B es más asimétrica
que la distribución de las notas del grupo B?
Solución
a. Se debe obtener la media y la desviación estándar para calcular el coefi-
ciente de variación correspondiente.

Grupo A Grupo B
n
∑ xi 2100 2100
M(X) i =1 = 70 = 75
30 28
n

 n 2 2

S(X)  ∑ xi  − nx 158 600 − 30(70) 2 174 375 − 28(75) 2


 i =1  = 20 = 25
30 − 1 28 − 1
n −1

S(X )  20   25 
C.V.% 100 %  100 % = 28.57 %  100 % = 33.33 %
x  70   75 

Los asistentes del Grupo A obtuvieron puntajes más homogéneos,


ya que este grupo presentó el menor coeficiente de variación ( 28.57 %).

b. En base a los promedios calculados y a los valores medianos proporcio-


nados, se procede a calcular el coeficiente de asimetría de Pearson.

Grupo A Grupo B

Coef. Asimetría 3( x − Med) 3(70 − 75) 3(75 − 70)


= − 0.75 = 0.60
Pearson S( X ) 20 25

La distribución de las notas de la sección B NO es más asimétrica que


la distribución de las notas de la sección A, ya que el valor absoluto de
su coeficiente de asimetría es menor, es decir, es más simétrica.

Capítulo 1. Estadística descriptiva 89


18. Los montos de compra, en soles, gastados por los clientes que han adquiri-
do prendas de vestir en una tienda por departamentos se han representado
en la siguiente tabla:

N.° acumulado de
Monto de compra
clientes (fi )
[0 − 80〉 12

[80 − 160〉 37

[1600 − 240〉 97

[240 − 320〉 132

[320 − 400〉 152

[400 − 480] 160

a. Considerando los datos, ¿cuál es el tipo de asimetría que presentan los


montos de compra asociados a las prendas de vestir?
b. Si se prevé que los montos de compra se incrementan en un 4 % más
un adicional de 5 soles, calcule el coeficiente de variación de los montos
de compra considerando el mencionado incremento, e indique cómo ha
variado.
Solución
a. A partir de los datos se obtiene el monto promedio y el valor mediano,
así como la desviación estándar, que sirven para calcular el coeficiente
de asimetría de Pearson.

Monto de N.° de clientes N.° acumulado


yi yifi (yi)2fi
compra (S/) (fi) de clientes (Fi)

[0 − 80〉 40 12 12 480 19 200

[80 − 160〉 120 25 37 3000 360 000

[1600 − 240〉 200 60 97 12 000 2 400 000

[240 − 320〉 280 35 132 9800 2 744 000

[320 − 400〉 360 20 152 7200 2 592 000

[400 − 480] 440 8 160 3520 1 548 800

160 36 000 9 664 000

k
∑ yi fi
36 000
M(Y ) i =
= =1
= 225
n 160
Intervalo mediano: [1600 − 240〉

90 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


1  1 
   n − FMe -1    160 − 37 
LI Me + c    160 + 80   
2 = 2 =
Me(Y ) = S / 217.333
 f Me   60 
   
   

 k 2  2
 ∑ yi fi  − nx 9 664 000 − 160( 225)2
= S(Y )  i =1
=  ≈ S/ 99.179
n −1 160 − 1

3( y − Med) 3 ( 225 − 217.333)


Coef . As
=. Pearson = ≈ 0.2319
S(Y ) 99.179

Los montos de compra asociados a las prendas de vestir presentan


asimetría positiva.

b. Se aplica las propiedades de la media y de la desviación estándar para


hallar sus nuevos valores y del correspondiente coeficiente de variación:
Cálculos:

Y 1.04(Y) + 5

Media (Y ) = 225.000 Media(1.04 (Y ) + 5) = 239.000

S (Y ) = 99.179 S(1.04 (Y ) + 5) = 103.146

C.V. (Y )% = 44.08 % C.V. (1.04 (Y ) + 5)% = 43.16 %

El coeficiente de variación ha disminuido.

19. En relación a los ingresos mensuales de una muestra de 150 ejecutivos se


determinó lo siguiente:

Me( X ) = S/ 3225.42 , C.V .%( X ) = 18 % , y Coef . As. Pearson(X ) = 0.075

De acuerdo a lo señalado, ¿cuál es el valor de la suma total de los ingre-


sos mensuales de los ejecutivos que conformaron la muestra?
Solución
S( X )
(1) C.V .%( X ) = 100 % = 18 % ⇒ S( X ) = 0.18x
x
Coef . As. 3 * ( x − Med) 3( x − 3225.42)
(2) = = 0.075 ⇒ 0.075S( X ) =
= 3x − 9676.26
Pearson S( X ) S( X )

Reemplazando (1) en (2):


0.075 ( 0.18x ) = 3x − 9676.26 ⇒ x = 3240

Capítulo 1. Estadística descriptiva 91


150
Se solicita ∑ xi :
i =1
150
∑ xi 150
i =1
x= = 3240 ⇒ ∑ xi = S/ 486 000
150 i =1

20. Sean los siguientes indicadores asociados a los tiempos de atención en las
ventanillas de una agencia bancaria:
Q1: 70 segundos
Q3: 150 segundos
Uno de los datos registrados corresponde a un tiempo de atención de
4 minutos con 55 segundos ( 4 : 55) : ¿es un dato discordante? Justifique.
Solución
Sería considerado como un dato discordante superior si se cumple que:
xi > Q3 + 1.5RIQ xi =
295 segundos ( 4=
: 55 4(60) + 55)
RIQ = 150 − 70 = 80 segundos
Se observa que: 295 < 180 + 1.5(80) =
300
Por lo tanto dicho dato NO será considerado como un dato discordante.

21. Se ha realizado un estudio sobre el tiempo de residencia en algunos


departamentos nuevos ubicados en el distrito de Santiago de Surco. Para la
realización del estudio se recopilaron los datos asociados a 40 propietarios
de los departamentos habitacionales del distrito en estudio, presentados a
continuación:

34 16 26 34 29 31 41 19
26 40 4 7 31 14 16 22
38 39 30 6 17 32 57 25
22 37 31 33 11 21 37 12
23 43 28 30 27 24 35 25

a. Elabore y presente el gráfico de cajas relacionado al número de meses de


residencia en los nuevos departamentos.
b. Considerando los valores de los cuartiles que se muestran en el gráfico de
cajas, ¿a partir de qué valor se ubican los datos discordantes superiores?
Solución
a. Se digitan los valores en una hoja de trabajo del software Minitab, y se
obtiene el gráfico solicitado.

92 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios



b. Aplicando la fórmula se tiene que:
Q3 + 1.5(Q3 – Q1 ) =
34 + 1.5(34 − 19.5) =
34 + 1.5(14.5) =
55.75

Conclusión: Considerando los valores de los cuartiles que se muestran
en el gráfico de cajas, se tiene que un tiempo de residencia de por lo me-
nos 56 meses ya sería considerado un dato discordante superior.

10. Problemas propuestos

1. En los siguientes párrafos se han dejado vacíos algunos paréntesis, donde


deberá colocar el término estadístico adecuado.

Términos recomendados: Unidad de análisis, Dato, Característica,


Población, Muestra, V. Cualitativa nominal, V. Cualitativa ordinal, V.
Cuantitativa discreta, V. Cuantitativa continua, Parámetro, Estadísti-
co, Media, Cuartil 1, Mediana, Cuartil 3, Moda, Percentil.
Nota: El término recomendado puede ser usado en singular o plural
según se requiera en el contexto.

En una investigación, sobre la ( ) en estudio “Clien-


tes del supermercado Vival que poseen tarjeta de fidelización”, se se-
leccionó una ( ) que se encontraba conformada por
480 clientes fidelizados de Vival. De cada ( ) se re-
cabaron las siguientes ( ): tiempo empleado en rea-
lizar las compras, monto de su última cuota de la tarjeta de fidelización,
número de tarjetas adicionales, si consumió o no en el área de comidas,
y distrito de residencia. Por lo tanto, no se consideró ninguna variable

Capítulo 1. Estadística descriptiva 93


( ). Como en total se analizaron 5 variables re-
lacionadas a los 480 clientes, entonces, en total se recabaron 2400
( ).
En relación a las variables ( ) se determinó el siguien-
te ( ): El 35 % de los clientes residen en los distritos del
cono este de Lima. Además, uno de los objetivos fue el de estimar el si-
guiente ( ): tiempo promedio poblacional requerido por
los clientes fidelizados de Vival al momento de realizar sus compras con un
error máximo de 12 minutos.
Otro de los resultados obtenidos, señalaba que la mayoría de los clientes
fidelizados poseía 2 tarjetas adicionales, y que el 25 % de dichos clientes
con menores valores de las cuotas a pagar presentaron un valor de a lo más
S/ 280; lo cual representa, respectivamente, a la ( )y
( ) de las características número de tarjetas adicionales
y monto de su última cuota.

2. El editor de una revista desea realizar un estudio para analizar diversos


aspectos relacionados a las presentaciones teatrales. Para el estudio, se se-
leccionará una muestra de las presentaciones teatrales que se realizan en
diversos escenarios ubicados en los principales departamentos del país; los
encargados del trabajo de campo se contactarán con los representantes de
la obra teatral y recabarán la siguiente información: número de asistentes,
monto total de ingreso en boletería, tipo de obra teatral (infantil, clásico,
comedia, etc.), número de actores, despliegue escenográfico (bajo, medio,
alto), y duración del espectáculo teatral.
En los departamentos en análisis, se estima que se presentan aproxima-
damente 60 obras teatrales, y el estudio se realizará entre todas las pre-
sentaciones realizadas durante los 3 días de fin de semana, se asume una
presentación diaria de cada obra teatral. Se ha determinado que se seleccio-
narán a 4 de cada 15 unidades de análisis disponibles durante el siguiente
fin de semana.
En cada una de las siguientes preguntas, marque con un aspa (X) la al-
ternativa correcta o responda adecuada y justificadamente.

Preguntas Seleccionar una alternativa


( ) Local donde se realiza la obra teatral
Identifique adecuadamente a la
( ) Presentación teatral
unidad de análisis.
( ) Obra teatral
( ) 60 locales
( ) 60 obras teatrales
Señale el tamaño de la población
( ) 180 obras teatrales
en estudio.
( ) 60 presentaciones teatrales
( ) 180 presentaciones teatrales

94 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


( ) 48 presentaciones teatrales
Determine el tamaño de la muestra ( ) 16 locales
empleado en el presente ( ) 48 obras teatrales
estudio ( ) 48 locales
( ) 16 presentaciones teatrales

Presente dos estimadores que se po-


drían obtener del presente estudio
(uno cualitativo y uno cuantitativo)

3. En un estudio de investigación del mercado gastronómico realizado en los


principales restaurantes ubicados en los distritos turísticos de la capital; de
una muestra de tamaño 160 se ha recabado las siguientes características
relacionada a los jefes de cocina de los mencionados restaurantes:
Escuela: Institución donde realizó su formación.
Residencia: Zona de Lima donde reside.
Experiencia: Tiempo de experiencia, en años cumplidos, en el cargo
(jefe de cocina)
G. Capacitación: Gasto (S/) en capacitación realizado en el último año
Capacidad: Nivel de capacidad de atención del restaurant donde labora.
a. Defina adecuadamente a la unidad de análisis.
b. ¿Sería conveniente considerar que la unidad de análisis sea el restauran-
te ubicado en los distritos turísticos de la capital? Justifique.
c. Defina la muestra asociada al presente estudio, clasifique cada una de
las variables e indique el parámetro y el estadístico correspondiente a
cada una de las variables.

Muestra:
Variable Clasificación
Escuela
Residencia
Variables
Experiencia
G. capacitación
Capacidad
Variable Parámetro
elegida Estadístico

4. El gerente de una microfinanciera se encuentra analizando las deudas de


clientes morosos que ya fueron canceladas en su totalidad. Para el mencio-
nado estudio se seleccionó como muestra a las últimas 120 deudas cancela-
das. A continuación se presenta el diagrama de columnas elaborado.

Capítulo 1. Estadística descriptiva 95



Si se sabe que el 65.833 % corresponde a los clientes morosos de las zo-
nas B y C en conjunto, y que los clientes morosos de la zona D fueron uno
más que los de la zona A.
a. ¿Cuántos fueron los clientes morosos de la zona A?
b. Si los clientes morosos de la zona B fueron 33, ¿cuál es el porcentaje
correspondiente a la zona C?

5. El gerente de una tienda de artículos deportivos realizó un estudio para el


que seleccionó al azar a 96 de sus clientes que realizaron excursionismo de
leve a intenso en localidades de las principales provincias del departamento
de Lima. Alguna de las características consideradas en el estudio fueron las
siguientes: sexo, provincia donde se practicó el excursionismo, y kilómetros
recorridos; esto último fue medido con una pulsera especial que comerciali-
za la tienda. Los datos recabados se presentan en el archivo Trekking.mtw.
Realice la siguiente codificación en relación a los kilómetros recorridos:
Menos de 5 km Leve
De 5 km a menos de 6 km Moderado
De 6 a más km Intenso
La mencionada clasificación almacénela en la variable Intensidad.
a. ¿Qué porcentaje de clientes realizaron un recorrido considerado como
intenso?
b. Complete la siguiente tabla.

Provincia
Intensidad Total
Canta Cañete Huarochirí Yauyos
Leve
Moderado

Intenso
Total

96 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


c. Procese adecuadamente y complete la siguiente gráfica.

6. Sobre la base de una muestra de 150 usuarios del servicio de televisión por
cable o satelital, residentes en alguno de los 3 distritos considerados para el
estudio, se ha determinado lo siguiente:
• La muestra fue recogida equitativamente en los tres distritos.
• De los usuarios que residen en Pueblo Libre, el 20 % paga tarifas men-
suales por señal de cable o satelital entre 50 y 100 soles.
• De los usuarios que residen en Magdalena, el 20 % paga entre 100 y 150
soles.
• De los que viven en Los Olivos, el 30 % paga entre 150 y 200 soles.
• De los 40 usuarios que pagan entre 50 y 100 soles, 10 residen en Los
Olivos, y de los 60 que pagan entre 100 y 150 soles, igual cantidad de
entrevistados reside en Pueblo Libre y Los Olivos.

a. Elabore y presenta la tabla de contingencia asociada las variables distrito


de residencia y la tarifa mensual por señal de cable o satelital

50 - 100 100 - 150 150 - 200 Total

Pueblo Libre

Magdalena

Los Olivos

Total

b. ¿Cuál es el porcentaje de usuarios Los Olivos y que paga entre 100 y


150 soles?

Capítulo 1. Estadística descriptiva 97


c. De los usuarios que residen en Los Olivos, ¿qué porcentaje de ellos paga
de 100 soles a más?
d. De los usuarios que pagan menos de 150 soles, ¿qué porcentaje reside en
Pueblo Libre?

7. En un estudio sobre los jóvenes universitarios que realizan prácticas prepro-


fesionales en las áreas operativas de una empresa, se recabaron datos asocia-
dos a los inconvenientes laborales, asociados a los mencionados practican-
tes, reportados por los responsables del departamento de recursos humanos
(Archivo: Practicantes.mtw). Indique cuáles fueron los principales inconve-
nientes laborales que se deberían solucionar. Justifique adecuadamente.

8. En un estudio realizado para conocer el uso de dispositivos móviles para el


acceso a contenidos multimedia por parte de los jóvenes del distrito de San
Isidro, se trabajó con una muestra de 160 jóvenes, y a partir de los datos
recabados se elaboró la siguiente gráfica:


Si se sabe que el 62.5 % de los jóvenes encuestados acceden a conteni-
dos multimedia desde, a lo más, dos dispositivos distintos, responda según
se solicite.
a. ¿Cuántos jóvenes encuestados acceden a contenidos multimedia desde 4
dispositivos?
b. ¿Cuál es el porcentaje de jóvenes encuestados que accede a contenidos
multimedia desde 2 a 3 dispositivos?
c. ¿Cuál es el porcentaje de jóvenes encuestados que accede a contenidos
multimedia desde por lo menos 2 dispositivos?

9. Se ha realizado un estudio de 200 familias del distrito de Santiago de Sur-


co que realizaron recientemente un viaje de vacaciones al interior del país.
En base al monto gastado para todo el viaje, en soles, se elaboró el siguiente

98 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


histograma de frecuencias relativas con intervalos de igual amplitud, don-
de se han representado las marcas de clase de cada intervalo:


Si se sabe que F4 − F2 =
64 familias, responda a las siguientes preguntas:
a. ¿Cuál es la amplitud de los intervalos?
b. ¿Entre cuáles valores se encuentra el último intervalo?
c. ¿Cuántas familias conforman el cuarto intervalo?
d. ¿Cuántas familias gastaron un monto comprendido entre [2700,
2800, 4500
4600〉 ?

10. El gerente general de Fruti Fresh, cadena de juguerías ubicadas en centros


comerciales, se encuentra realizando un estudio piloto en uno de sus prin-
cipales locales. Para el estudio se ha determinado que cada cierto tiempo se
seleccionará a uno de los empleados que se encuentra preparando alguno
de los productos que conforman algún pedido realizado, y se recaba los
datos asociados a las siguientes características:
Presentación: Normal o frozen
T. Atención: Tiempo de atención, en segundos, empleado en la
atención del producto
Los datos recabados en relación a 120 productos atendidos se presentan en
el archivo Fruti.mtw.
a. Al trabajarse con el criterio de Sturges para representar la variable “Tiem-
po de atención”.
a.1 ¿Cuántos intervalos se deben utilizar?
a.2 Determine los intervalos a ser considerados y elabore el histograma
de frecuencias.
b. Usando la misma cantidad de intervalos determinada en el ítem (a), ela-
bore un histograma múltiple, de frecuencias relativas, para representar la
variable “Tiempo de atención” según la variable “Presentación”.

Capítulo 1. Estadística descriptiva 99


Nota: Edite el histograma múltiple para que considere los mismos inter-
valos elaborados para el histograma original.
c. Con respecto al histograma de frecuencias relativas del tiempo de aten-
ción de los productos en presentación normal, señale el porcentaje de pro-
ductos comprendidos desde el segundo al cuarto intervalo inclusive.

11. En un restaurante se determinó lo siguiente en relación al monto de consu-


mo de las mesas durante el presente día:
n = 160 y x = S/ 95.498
Pero de dicho grupo, se retiró de los cálculos a quienes pagaron con
tarjeta de crédito o débito, de tal forma que, en relación a las 120 mesas
restantes, en donde se pagó en efectivo, el promedio del monto de consumo
fue de S/ 95.255, ¿cuál fue el monto total de consumo por parte de las mesas
que fueron retiradas de la muestra?

12. De un grupo de ejecutivos que laboran en el distrito de Miraflores se ha


determinado que el ingreso mensual presenta una media de S/ 3950 y un
valor mediano de S/ 3800. Asimismo, en el distrito de Santiago de Surco
se ha determinado que el ingreso mensual de los ejecutivos presenta una
media de S/ 3900 y un valor mediano de S/ 3750. Si la desviación estándar
de los ingresos mensuales de los ejecutivos que laboran en Miraflores es
menor con respecto a los que laboran en Santiago de Surco, de acuerdo al
coeficiente de asimetría de Pearson, ¿en cuál de los 2 distritos el ingreso
mensual de los ejecutivos presenta una mayor asimetría?

13. A partir de lo manifestado por 80 participantes en un estudio se determinó


lo siguiente, en relación a la característica [Y] “Gasto”, en soles, en artículos
de oficina:
80 80
∑ yi = 9040 , ∑ y i = 1 048 200 ; además se sabe que Me(y)=115.
2
i =1 i =1
Determine el valor del coeficiente de asimetría de Pearson correspon-
diente a la variable Y .+ 2.

14. De acuerdo a un seguimiento realizado a 200 asistentes a una feria tecno-


lógica, se obtuvo los datos asociados a su tiempo de permanencia, en horas,
con lo cual se determinó lo siguiente, luego de organizarlos en una tabla de
distribución de frecuencias:
• Los intervalos son de igual amplitud y la tabla se encuentra compuesta
por 6 intervalos.
• El primer intervalo corresponde a los tiempos de permanencia cuyo va-
lor varía de [2.0, 2.8〉 horas.

100 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


• El 6 %, 25 % y 12 % de los asistentes pertenecen al primer, cuarto y
sexto intervalo respectivamente.

• 32 asistentes presentaron un tiempo de permanencia perteneciente al


segundo intervalo.

• Hasta el cuarto intervalo hay acumulados 134 asistentes.

a. Complete la siguiente tabla de distribución de frecuencias de acuerdo a


la información brindada.

Intervalos de tiempo de Marca de Asistentes Acumulado de


i (yi )(fi ) (yi )2(fi )
permanencia (horas) clase (yi ) (fi ) asistentes (Fi )
1
2
3
4
5
6

b. Determine el valor de la desviación estándar correspondiente.


c. Obtenga el valor del coeficiente de asimetría de Pearson.

15. Un fabricante de detergentes desea adquirir una máquina empaquetadora


para el llenado de bolsas de aproximadamente 150 gramos. Se deberá esco-
ger entre dos tipos de máquinas empaquetadoras que le ofrecen en iguales
condiciones económicas. Para tomar una decisión, se realizaron 20 medi-
ciones con la máquina A y 25 con la máquina B, y se obtuvo los siguientes
resultados:
Máquina A 143 145 146 148 149 150 150 150 150 152
(Pesos en g) 150 150 150 150 153 151 152 154 155 156

Máquina B
yi fi
(Pesos en g)
[131, 139〉 135 2
[139 , 147〉 143 4
[147 , 155〉 151 13
[155, 163〉 159 4
[163, 171] 167 2
Total = 25

Capítulo 1. Estadística descriptiva 101


a. Halle los promedios de cada máquina e indique en cuál de ellas el pro-
medio difiere más del valor especificado (150 gramos).
b. ¿Hay mayor homogeneidad en la distribución en la distribución de los
pesos de la máquina B? Justifique numéricamente.
c. El inspector de la calidad informó que el equipo de medición que se
empleó para medir los pesos de bolsas producidas por la máquina A
estaba descalibrado. El verdadero peso de las bolsas en la máquina A es
un 98 % del peso anterior más una constante de 2.7 gramos, ¿cuál será
la verdadera desviación estándar del peso de las bolsas obtenido en
dicha máquina?

16. En relación a la característica “kilometraje recorrido”, durante el último fin


de semana, se elaboró el siguiente histograma de frecuencias relativas co-
rrespondiente a 40 automóviles.


a. ¿Cuál es el valor del kilometraje recorrido promedio?
b. ¿El kilometraje recorrido presenta una distribución homogénea?

17. Una entidad bancaria ha implementado en sus agencias 3 tipos de venta-


nillas de atención: [A] Usuarios no clientes, [B] Clientes, y [C] Exclusiva.
En una agencia ubicada en el distrito de Miraflores, se ha determinado lo
siguiente en relación al tiempo promedio de atención en dichas ventanillas:

Tipo ventanilla N.° personas Tiempo promedio


(ni) (seg.)
( xi )
A 33 128.16
B 60 107.92
C 67 107.56

102 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


En otra agencia, ubicada en el distrito de Jesús María, donde se recabó un
mismo tamaño de muestra distribuido de similar forma, se determinó lo
siguiente: las ventanillas de atención tipo A presentan un 20 % menos de
tiempo de atención que los de la agencia de Miraflores, mientras que en las
ventanillas tipo B y C presentan un 10 % más de tiempo de atención. En ge-
neral, ¿cuál es el tiempo de atención promedio en la agencia de Jesús María?

18. En una empresa, el ingreso mensual de sus técnicos especializados tiene


una media de USD 750 y una desviación estándar de USD 220; mientras
que al personal de servicios de mantenimiento les paga sueldos cuyo pro-
medio es S/ 900 con una desviación estándar de S/ 80.
a. Mediante un acuerdo con la gerencia, se realiza un incremento de 20 %
a los ingresos mensuales de los técnicos especializados con una bonifi-
cación adicional de USD 50 por concepto de movilidad, ¿es cierto que
con esta modificación el ingreso mensual de los técnicos especializados
se ha vuelto más heterogéneo? Justifique adecuadamente su respuesta.
b. Si a cada trabajador de los servicios de mantenimiento se le aumentará
k soles para el próximo mes, determine el valor de k para que el nuevo
valor del coeficiente de variación sea igual al 8 %.

19. En un centro de idiomas se ha recabado los datos correspondientes a los


puntajes obtenidos en la última evaluación (de 0 a 100). Los estudiantes
que conformaron parte del estudio corresponden a los 3 niveles de estu-
dios (básico, intermedio y avanzado). En base a los datos recopilados se
elaboró el siguiente diagrama de cajas, desagregado por nivel de estudios:

Boxplot of Puntaje

95.9
95

90

85
Puntaje

82.5 81.7 82.1


80

75

71.7
70
Avanzado Básico Intermedio
Nivel


De acuerdo al diagrama de cajas presentado marque con un aspa (X) la
opción correcta.

Capítulo 1. Estadística descriptiva 103


i. [ ] En el nivel avanzado, la mediana se encuentra más alejada del Cuar-
til 3, y presenta un dato discordante.
ii. [ ] En el nivel básico, la mediana se encuentra más alejada del Cuartil
3, y no presenta datos discordantes.
iii. [ ] En el nivel intermedio, la mediana se encuentra más alejada del
Cuartil 3, y presenta un dato discordante.
iv. [ ] En el nivel básico, la mediana se encuentra más alejada del Cuartil 1,
y no presenta datos discordantes.
v. [ ] En el nivel avanzado, la mediana se encuentra más alejada del Cuar-
til 1, y no presenta un dato discordante.

20. El gerente de operaciones de un parque de diversiones ha realizado un es-


tudio para determinar la acogida que ha tenido el mencionado parque de
diversiones. Para tal efecto en la entrada del recinto se solicitó la colabora-
ción de 200 asistentes, quienes se comprometieron a brindar información
de interés luego de su visita al parque de diversiones (Archivo: P_Diversio-
nes.mtw). Las características recabadas se presentan a continuación:
Ocasión: Primera visita o ya ha venido antes al parque de diversiones.
Edad: Rango de edad, en años, del asistente encuestado.
N.° juegos: Número de juegos o atracciones a las que ha accedido.
Gasto: Monto total gastado en su visita (juegos, consumo, suvenir).

a. Obtenga las medidas de tendencia central y de posición de la caracterís-


tica N.° juegos, en general y desagregado por rango de edades. Responda
a las siguientes preguntas.
i. ¿En cuál de los rangos de edades la moda es distinta a la moda gene-
ral? Justifique.
ii. De las medias obtenidas en forma general, interprete de acuerdo al
contexto el valor del tercer cuartil.
iii. A los participantes del estudio con menos de 18 años, al momento
de comprometerse a participar en el estudio, se les regaló un boleto
para una de las atracciones del parque de diversiones. Luego de re-
cabar los datos se observó que los participantes menores de 18 años
habían incluido en sus respuestas al regalo otorgado, lo cual no debió
ser, ¿cuál sería el verdadero valor promedio general relacionado a la
característica “N.° juegos”?
b. Obtenga las medidas de dispersión asociadas a la característica “Gasto”,
en forma general y desagregada por la característica “Ocasión”. Respon-
da a las siguientes preguntas.
i. ¿Cuántos de los participantes del estudio que han asistido por pri-
mera vez pertenecen al intervalo que permitió determinar al rango
intercuartílico correspondiente?

104 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


ii. El tipo de cambio es de S/ 3.1 por dólar. Si el gasto es expresado en
dólares, ¿cuál sería la desviación estándar general de la característica
“Gasto”?
iii. ¿Cuáles participantes, presentan una mayor homogeneidad con res-
pecto a la característica “Gasto”, los que han asistido por primera vez
o los que ya han asistido antes?
c. Determine el monto del gasto, en soles, por debajo del cual se encuentra
el 35 % de participantes, de 40 a más años, que presentaron los menores
gastos en su visita al parque de diversiones.
d. Obtenga el diagrama de cajas, relacionado a la característica “Gasto”,
en forma general desagregada por rango de “Edad”. Responda a las si-
guientes preguntas.
i. En el rango de edad donde se presentan datos discordantes, ¿cuál es
el rango de edad y cuáles son los valores extremos de los bigotes?
¿Cuáles son los rangos de edad que presenta un valor mediano por
debajo del presentado en el diagrama de cajas general y cuál de ellos
presenta una similar distribución al de la caja general?

Capítulo 1. Estadística descriptiva 105


Capítulo

2 Probabilidad
Sabes
En los procesos de ingeniería, así como en Capacidades adquiridas
la gestión empresarial y de negocios, sur-
9 Diferenciar las diferentes técnicas de
gen situaciones de incertidumbre sobre los
conteo.
diferentes resultados de un proyecto o de
9 Comprender los conceptos y funda-
una actividad en general para las cuales
mentos de la probabilidad.
se requiere de una medición sobre la po-
sibilidad de que ocurra uno u otro even- 9 Calcular e interpretar las probabili-
to. La teoría de la probabilidad brinda una dades de ocurrencia de un evento.
respuesta a las inquietudes planteadas, a 9 Deducir y relacionar los teoremas de
partir de lo cual se brinda un sustento for- probabilidad.
mal a la toma de decisiones, en diferentes
contextos de aplicación.

Piensas
Competencias por lograr
Conocimientos previos 9 Identificar la técnica de conteo
adecuada a cada contexto.
Estadística descriptiva, teoría de
conjuntos, manejo de notación 9 Reconocer las situaciones de uso
matemática de los diferentes teoremas de
probabilidad.

Secciones
1. C
onceptos básicos
Haces
2. Técnicas de conteo Habilidades por desarrollar

3. Probabilidad 9 Aplicar técnicas de conteo en diferen-


tes situaciones.
4. Teoremas de probabilidad
9 Plantear expresiones de probabilidad.
9 Aplicar los teoremas de probabilidad.
1. Conceptos básicos

1.1 Experimento aleatorio o al azar

Es aquella acción tal que, bajo determinado conjunto similar de condiciones ini-
ciales, no siempre da el mismo resultado. Es lo contrario a un experimento deter-
minista, donde se conoce el resultado antes de realizar la acción (conocimiento a
priori). Comúnmente se le denota a un experimento aleatorio con ε.
En consecuencia, un experimento aleatorio ε debe cumplir las siguientes
condiciones:
a) Debe tener más de un posible resultado el cual no se puede predecir con
seguridad.
b) Es posible describir el conjunto de todos los resultados posibles.
c) Puede repetirse infinitas veces.

Ejemplo 1
A continuación se presentan algunos experimentos aleatorios:
i. Lanzar un dado y observar el lado superior.
ii. Elegir 2 artículos de una línea de producción y observar si son defectuosos
o no defectuosos.
iii. Seleccionar a un elector y determinar su candidato presidencial preferido
entre dos candidatos posibles.

1.2 Espacio muestral

Un espacio muestral es el conjunto de todos los resultados posibles de un expe-


rimento aleatorio (ε). El espacio muestral es denotado por Ω (también por S).
Un espacio muestral puede ser clasificado como:

Capítulo 2. Probabilidad 109


Discreto: si contiene un número finito o infinito numerable de elementos, o
Continuo: si contiene un número infinito no numerable de elementos.
El número de elementos de un Ω es denotado por n(Ω).

Ejemplo 2
A continuación, se presentan los espacios muestrales asociados a los experi-
mentos aleatorios definidos en el ejemplo 1 :
i. Lanzar un dado y observar el lado superior.

Ω ={1, 2, 3, 4, 5, 6}
ii. Elegir dos artículos de una línea de producción y observar si son defec­tuosos
(D) o no defectuosos ( D).
Ω ={( D , D), ( D , D), ( D , D), ( D , D)}

iii. Seleccionar a un elector y determinar su candidato presidencial de preferen-
cia entre dos candidatos posibles.
Ω ={candidato A, candidato B}

1.3 Suceso

Cada elemento del espacio muestral (Ω) se denomina suceso y se designa por w.
En todo espacio muestral se observa que:
a. Cada w que pertenece a Ω es un resultado del experimento aleatorio.
b. A cada resultado del experimento aleatorio le corresponde un, y solo un,
w ∈ Ω.
Ω ={w1 , w2 , . . . , wn }

1.4 Evento

Un evento es cualquier subconjunto del espacio muestral (Ω). Un evento es


denotado por letras latinas en mayúsculas: A, B, C, etc., y la cantidad total de
elementos que conforman un evento es denotado por n(A).
Eventos especiales
i. Evento elemental
Tiene solo un resultado: E = {wi }
ii. Evento seguro
Es el que siempre ocurre. Coincide con el espacio muestral Ω
iii. Evento imposible
Es el que nunca ocurre, se denota por ∅
iv. Evento opuesto o contrario
Si no ocurre el evento E, entonces ocurre su complemento E
=

E {w i / w i ∈ Ω ∧ wi ∉ E}

110 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


v. Eventos simultáneos
Ocurren a la vez; los eventos E y F son simultáneos si E  F ≠ ∅.
vi. Eventos incompatibles o disjuntos
No ocurren a la vez (son mutuamente excluyentes), es decir: E  F = ∅.
vii. Eventos colectivamente exhaustivos
Dos o más eventos disjuntos son colectivamente exhaustivos si la unión
de todos ellos coincide con Ω; es decir:
E1  E2  ...  Ek = Ω , siempre que E1  E2 = ∅ para i ≠ j.

Ejemplo 3
En relación al experimento aleatorio de lanzar un dado y observar el lado
superior, se definen los siguientes eventos:
i. A: Sale número 6. A = {6}
ii. B: Se obtiene un número par. B = {2, 4, 6}
iii. C: Se obtiene un número impar. C = {1, 3, 5}
iv. D: Se obtiene un número mayor que 3. D = {4, 5, 6}
v. E: Se obtiene un número mayor que 7. E = ∅
vi. F: Se obtiene un número menor que 7. C = {1, 2, 3, 4, 5, 6}
Con los eventos así definidos, se procede a identificar a cada uno de los
eventos especiales señalados:
i. Evento elemental. A = {6}
ii.
Evento seguro. F = {1, 2 , 3, 4, 5, 6} = Ω
iii. Evento imposible. E= ∅
iv. Evento opuesto o contrario. C = B , ya que B = {1, 3, 5}
v. Eventos simultáneos. C y D, ya que C  D = {5} ≠ ∅
vi. Eventos incompatibles o disjuntos. A y C, ya que A  C = ∅
vii. Eventos colectivamente exhaustivos. B y C, ya que
B  C = ∅ ∧ B  C =Ω

Ejemplo 4
Una empresa constructora se encuentra evaluando si se presenta a alguna de
3 licitaciones; un evaluador brindará su recomendación sobre las licitacio-
nes a cuáles presentarse, donde la decisión por cada de ellas puede ser: Sí se
presenta a la licitación (S) o No se presenta (N), de tal forma que el espacio
muestral queda definido de la siguiente forma:
Ω ={NNN, NNS, NSN, NSS, SNN, SNS, SSN, SSS}
Se definen los siguientes eventos en relación a la recomendación sobre las
tres licitaciones a presentarse:

Capítulo 2. Probabilidad 111


i. A: No se presenta a licitación.
A = {NNN}
ii. B: Se presenta a la 2da licitación.
B = {NNN, NSS, SSN, SSS}
iii. C: Se presenta por lo menos a una.
C = {NNS, NSN, NSS, SNN, SNS, SSN, SSS}

iv. D: Se presentan a lo más a 3.
D = {NNN, NNS, NSN, NSS, SNN, SNS, SSN, SSS}
v. E: Se presentan a 4 licitaciones.
E= ∅
vi. F: Se decide lo mismo en las tres.
F = {NNN,SSS}

Con los eventos así definidos, se procede a identificar a cada uno de los
eventos especiales señalados:
i. Evento elemental. A = {NNN}
ii. Evento seguro. D = Ω
iii. Evento imposible. E= ∅
iv. Evento opuesto o contrario. A = C , ya que C ={NNN}
v. Eventos simultáneos. B y F, ya que B=
 F {SSS} ≠ ∅
vi. Eventos incompatibles o disjuntos. A y B, ya que A  B = ∅
vii. Eventos colectivamente exhaustivos. A y C, ya que
A  B =∅ ∧ A  C =Ω

2. Técnicas de conteo
Para el cálculo de probabilidades es importante cuantificar el espacio muestral
de un experimento aleatorio; sin embargo, en muchos casos, esta cuantificación
se torna difícil puesto que, por lo general, los experimentos aleatorios tienen
gran cantidad de resultados posibles. De ahí surge la necesidad de utilizar téc-
nicas que permitan determinar el número de resultados posibles de un experi-
mento aleatorio que se esté estudiando sin necesidad de hacer una lista o rela-
ción de todos los posibles resultados.

2.1 Principio de adición


Suponga que un procedimiento, designado como P1, puede realizarse de n1 ma-
neras, y que un segundo procedimiento, designado como P2, puede realizarse de
n2 maneras. Además, no es posible que ambos procedimientos, P1 y P2, se realicen
simultáneamente. Entonces, el número de maneras en que se puede hacer P1 o P2
es de: n1 + n2 maneras.

112 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Ejemplo 5
Un estudiante desea comprar una laptop, para lo cual considera que puede se-
leccionar de entre las marcas R, S y T. La laptop de la marca R se presenta con
dos tipos de procesador (core i5, core i7), mientras que la laptop de la marca S se
presenta con tres tipos de procesador (core i3, core i5 y core i7), y la laptop de la
marca T se presenta en sólo un tipo de procesador (core i5), ¿de cuántas mane-
ras puede esta persona hacer la compra de la laptop?

Solución
• Compra de una laptop de la marca R: 2 maneras
• Compra de una laptop de la marca S: 3 maneras
• Compra de una laptop de la marca T: 1 manera
Por el principio de adición, la compra de una laptop se puede realizar de
2 + 3 +1 =6 maneras.

2.2 Principio de multiplicación

Suponga que un procedimiento, designado como P1, puede hacerse de n1 ma-


neras, y que un segundo procedimiento, designado como P2, puede hacerse de
n2 maneras. Además, cada una de las maneras de efectuar el procedimiento P1
puede ser seguida por cualquiera de las maneras de efectuar el procedimiento P2.
Entonces, el número de maneras en que se puede realizar P1 seguido de P2 es de:
(n1)(n2) maneras.

Ejemplo 6
En una clínica se utilizan cinco símbolos para clasificar las historias clínicas de
sus pacientes, de manera que los dos primeros son letras y los 3 últimos son
dígitos. Suponiendo que hay 25 letras (incluyendo las cinco vocales), ¿cuántas
historias clínicas podrían identificarse si:
a. Las letras y los números se pueden repetir.
Solución
• Para el primer símbolo se podrán utilizar 25 letras disponibles.
• Para el segundo símbolo se podrán utilizar 25 letras disponibles.
• Para el tercer símbolo se podrán utilizar 10 dígitos disponibles.
• Para el cuarto símbolo se podrán utilizar 10 dígitos disponibles.
• Para el quinto símbolo se podrán utilizar 10 dígitos disponibles.
Por el principio de multiplicación, el número de posibles identifica-
ciones de historias clínicas es de: ( 25)( 25)(10=
)(10)(10) (=
252 )(103 ) 625 000
maneras distintas.

Capítulo 2. Probabilidad 113


b. Solamente una de las letras es una vocal y dos números son iguales.
Solución
• Colocar una vocal entre los 2 primeros símbolos: 2 maneras
– En la posición elegida se pueden utilizar 5 vocales disponibles.
– En la otra ubicación se pueden utilizar 20 letras (no vocales)
disponibles.
• Colocar un número que no se repita entre los 3 últimos símbolos:
3 maneras.
– En la ubicación elegida para el número que no se repite se pueden
utilizar 10 dígitos disponibles.
– En una de las 2 posiciones restantes, para los números que se van a
repetir, se podrán utilizar 9 dígitos restantes.
– En la otra de las posiciones se podrá utilizar solamente el número
que se va a repetir.
Por el principio de multiplicación, el número de identificaciones de las
historias clínicas con las condiciones señaladas es de:
( 2)(5)( 20)(3)(10)(9)(1) = 54 000 maneras distintas.

2.3 Permutaciones

2.3.1 Permutación de n elementos sin repetición

Se tiene n objetos diferentes y se desea saber de cuántas maneras pueden ser or-
denados, por ejemplo, en una línea, sin que los elementos se repitan. Aplicando
el principio de multiplicación, se observa que cualquiera de estos n objetos pue-
de ocupar la primera posición, restarán (n-1) objetos para la segunda posición,
(n − 2) para la tercera posición y así sucesivamente hasta llegar a (n − (n − 1))
para la última posición; luego, el número de posibles ordenamientos de n objetos
en una línea que consta de n posiciones es:

Pn = n (n − 1)(n − 2)(n − 3)...( 2)(1) = n !


n

Factorial
El factorial de un número se define como el producto de los n
primeros enteros positivos, es decir:
n ! = n(n − 1)(n − 2)... ( 2)(1), con 0 ! = 1.

Nota: El factorial de n representa el número de maneras diferen-


tes en las que n elementos pueden ordenarse uno detrás de otro.

114 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


2.3.2 Permutación de n elementos sin repetición tomados de k en k

Siguiendo un razonamiento similar, se determina que el número de maneras


diferentes en que k elementos pueden elegirse y ordenarse uno detrás de otro a
partir de un total de n elementos es:
n!
Pkn =
(n − k )!

Ejemplo 7
Para un examen en aula de cómputo se espera la llegada de a lo más 6 alum-
nos, quienes serán ubicados por orden de llegada, de izquierda a derecha,
en una fila donde hay 6 computadoras. Para los siguientes casos, indique el
número de maneras en que los diferentes alumnos pueden ser ubicados, en
las computadoras disponibles:
a. Llegan los 6 alumnos, uno tras otro.
Solución
• La primera computadora será ocupada por uno de 6 alumnos posibles.
• La segunda computadora será ocupada por uno de los 5 alumnos
restantes.
• Se procede de forma similar hasta que la sexta computadora será ocupa-
da por el único alumno restante.
Por el principio de multiplicación, la cantidad de maneras distintas de
ubicar a los 6 alumnos es de: (6)(5)( 4)(3)( 2)(1) = 720
En resumen, dado que interesa el orden de llegada de los alumnos, el
número de maneras de ubicarlos es: P6=
6
! 720
6=

b. Solo llegan 4 alumnos de los 6 convocados, uno tras otro.


Solución
• La primera computadora será ocupada por uno de 6 alumnos posibles.
• La segunda y la tercera computadora serán ocupadas, respectivamente,
por uno de 5 y 4 alumnos restantes.
• La cuarta computadora será ocupada por uno de los 3 alumnos restantes.
Por el principio de multiplicación, la cantidad de maneras distintas de
ubicar a los 4 alumnos es de: (6)(5)( 4)(3) = 360
En resumen, se consideran permutaciones de n elementos tomados k de
ellos; es decir:
6! 6!
P=
6
= = 360
4
(6 − 4)! 2 !

Nota: Este ejemplo (7.b) puede ser resuelto de una forma alterna, que se
detallará más adelante.

Capítulo 2. Probabilidad 115


c. Llegan los 6 alumnos, sin embargo 2 de ellos no deben sentarse uno al
lado del otro, ¿de cuántas maneras se puede ubicar a los 6 alumnos en las
computadoras disponibles?
Solución
Se definen los eventos:
A: dos alumnos deben ser ubicados uno al lado del otro, y
A : dos alumnos no se ubicarán uno al lado del otro.
Por practicidad se determinará la cantidad de maneras distintas que se
puede presentar el evento A, para luego determinar la cantidad de mane-
ras del evento contrario.
• Los dos alumnos que serán ubicados uno al lado del otro serán consi-
derados como un bloque, y con los 4 restantes se tendrán 5! maneras
de ubicarlos.
• Los dos alumnos que permanecerán juntos se podrán ubicar de 2!
maneras.
Por lo tanto, el número de casos a favor del evento A es: n=
( A) 2=
! P55 240.
Tomando en cuenta el resultado del ítem a), donde se señala que el nú-
mero de maneras de ubicar a los 6 alumnos es de P66= 6=! 720 , entonces, la
cantidad de maneras en que los 2 alumnos señalados no se sientan uno al
lado del otro será: n( A) =P66 − 2 ! P55 =720 − 240 =480

2.3.3 Permutación con elementos iguales

El número de maneras diferentes en las que se puede ordenar n elementos, de


los cuales n1, n2, ..., nk son iguales entre si para efectos del ordenamiento, con n =
n1 + n2 + ... + nk , es dado por:
n!
Pnn , n =
1 2 ,..., nk n1 ! n2 ! ... nk !

Ejemplo 8
¿Cuál es el total de posibles arreglos que se pueden hacer con las letras de la
palabra PROBABILIDAD?

Solución
• La palabra consta de 12 letras de las cuales 8 letras son distintas.
• Entre las 12 letras hay algunas que se repiten 2 veces: A, B, D, I, y las demás
son diferentes.
• Por lo tanto, el total de posibles arreglos de las letras que conforman la
palabra es:
12 ! 12 !
P212, 2 , 2 , 2 ,1=
,1,1,1 = = 29937 600
2 ! 2 ! 2 ! 2 !1!1!1!1! ( 2 !)4

116 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


2.4 Combinaciones

En las permutaciones, el objetivo es determinar el número de posibles arreglos


ordenados de objetos. Cuando el orden no importa, sino sólo el número de for-
mas distintas de extraer de n objetos k de ellos a la vez; entonces, se trata de una
combinación.
El número de grupos diferentes de k elementos que pueden formarse a partir
de un total de n elementos sin importar el orden de la selección es:
 n n!
Ckn =  =

 k  k !(n − k )!
 n
La expresión Ckn =   tiene las siguientes propiedades:
k

i. C 1n = n ii. C nn−1 = n n
iii. C n =1 n
iv. C 0 =1

Ejemplo 9
Luis tiene 10 amigos, de los cuales invitará a una reunión solamente a 7
de ellos.
a. ¿De cuántas maneras puede Luis invitar a sus amigos?
Solución
Como no interesa el orden en que elija a sus invitados, Luis tiene:
10  10 !
=  = 120 maneras distintas de hacer las invitaciones.
 7  7 ! 3!
b. ¿De cuántas maneras puede Luis invitar a sus amigos si dos de ellos están
enemistados y no pueden asistir juntos?
Solución
• Luis puede invitar a uno o ninguno de los amigos enemistados; por tanto:
• Maneras de no invitar a ninguno de los 2 amigos, e invitar a 7 de los
 2  8 
8 restantes:    = (1)( 8 ) = 8
 0  7 
  
• Maneras de invitar a uno de los 2 amigos, e invitar a 6 de los 8
 2  8 
restantes:    = ( 2 )( 28 ) = 56
 1  6 
  
Por el principio de la adición, número de maneras =

 2  8   2  8 
  +   =8 +
   
56 ==64
+ 58 64
 0  7   1  6 

Capítulo 2. Probabilidad 117


Ejemplo 10
Del ejemplo 7b, indique si sólo llegan 4 alumnos de los 6 convocados, uno
tras otro, ¿cuál será el número de maneras en que los diferentes alumnos pue-
den ser ubicados?

Solución
• Maneras en que se presentarán los 4 alumnos de 6 posibles (no interesa
6!
el orden):
= C 4 = 15
6
4 !(6 − 4)!
• Maneras distintas de ubicar a los 4 alumnos que llegan es de: P4=
4
4=! 24
(ver ejemplo 7a)
En resumen, se ubicarán de= C46 P44 (15
= )( 24) 360, maneras distintas, re-
sultado que coincide con lo presentado en el ejemplo 7b.

Ejemplo 11
Para hacer visitas de trabajo a 3 sucursales de provincias en grupos de 5, se
dispone de 6 mujeres y 9 hombres.
a. ¿Cuántos grupos distintos se pueden formar?
Solución
Como no interesa el orden para formar los 3 grupos, entonces:
• Maneras de seleccionar a 5 de 15 personas posibles:
15  15 !
=
  = 3003
 5  5 !(15 − 5)!
 
• Maneras de seleccionar a 5 de 10 personas restantes:
10  10 !
=
  = 252
 5  5 !(10 − 5)!
 
 5 5!
=
• Maneras de seleccionar a 5 de 5 personas restantes:   = 1
 5 5 !( 5 − 5)!
Por el principio de la multiplicación, número de maneras de formar los
15 10  5  15 !
3 grupos de 5 personas en cada grupo =   =   = 756 756
 5  5  5  5 ! 5 ! 5 !
   

b. ¿De cuántas maneras pueden formarse tales grupos de modo que en cada
uno de ellos estén siempre dos mujeres?
Solución
Cada grupo de 5 personas estará integrado por 3 hombres y 2 mujeres;
es decir:
• Primer grupo: 3 hombres de 9 posibles y 2 mujeres de 6 posibles.
• Segundo grupo: 3 hombres de 6 posibles y 2 mujeres de 4 posibles.
• Tercer grupo: 3 hombres de 3 posibles y 2 mujeres de 2 posibles.

118 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Por el principio de la multiplicación, número de maneras de formar los 3
grupos con las condiciones señaladas =
 9  6    6  4    3  2  
            = (1260)(120) = 151 200
 3     
 2    3  2    3  
 2  

3. Probabilidad

3.1 Introducción

La probabilidad es una rama de las matemáticas que estudia a los experimentos


aleatorios y permite tener una medida de la incertidumbre, de tal forma que se
pueda dar un soporte adecuado a la toma de decisiones.

3.2 Probabilidad clásica o a priori

Si un experimento aleatorio tiene n(Ω) posibles resultados, todos ellos igualmen-


te probables, y si n(E) de estos resultados pertenecen a un evento E, entonces la
probabilidad de ocurrencia del evento E es:
n( E) número de casos a favor de E
P=
( E) =
n(Ω) número de casos posibles

El nombre a priori se debe a que no es necesario realizar el experimento para cal-


cular la probabilidad, sino que este cálculo ha sido hecho sólo en base al empleo del
razonamiento lógico. Por ejemplo, en un mazo de 52 cartas bien barajadas se saca
una de ellas, la probabilidad de sacar una carta de espadas es 13/ 52 = 0.25, porque
se sabe que dentro del mazo hay 13 cartas que son espadas.

Ejemplo 12
Cinco fabricantes producen un determinado dispositivo electrónico cuya ca-
lidad varía de un fabricante a otro. Si usted eligiera tres fabricantes al azar,
¿cuál es la probabilidad de que la selección contenga exactamente dos de los
tres mejores?

Solución
Puesto que en la elección no interesa el orden, el número de maneras de elegir
a los 3 fabricantes es:
 5
n(Ω=
)  =
 3 
10
 
Se define E: la selección contiene a dos de los 3 mejores.
• Seleccionar a 2 de 3 mejores fabricantes, y
• Seleccionar a 1 de los 2 no mejores

Capítulo 2. Probabilidad 119


Por el principio de la multiplicación, el número de maneras en que puede
ocurrir E es:
 3  2 
n( E)  
= =  (=
3)( 2) 6
 2  1 
n( E) 6
La probabilidad solicitada es: P( E=
) = = 0.6
n(Ω) 10

Ejemplo 13
La Municipalidad de Lima ha convocado a 3 licitaciones para construir in-
tercambios viales. A la licitación 1 (L1) se han presentado las empresas A, B
y D; a la licitación 2 (L2) se han presentado las empresas A, B, C y E y a la
licitación 3 (L3) se han presentado las empresas A, B, C, D y E. Todas tienen
la misma probabilidad de ser elegidas.
a. ¿De cuantas maneras se puede elegir a los ganadores de las 3 licitaciones?
Solución
n(Ω) (3)(
= = 4)(5) 60 maneras

b. ¿Cuál es la probabilidad de que la empresa B gane solo una de las


licitaciones?
Solución
Sea E: empresa B gana solo una licitación
• La licitación 1 se puede otorgar a una de 3 empresas posibles, la licita-
ción 2 se puede otorgar a una de 4 empresas posibles, y la licitación 3
se puede otorgar a una de 5 empresas posibles. En todas las licitacio-
nes participa la empresa B.
• La empresa B gana solamente la licitación 1, y las otras licitaciones
alguna de las empresas restantes: (1)(3)( 4) = 12, o
• La empresa B gana solamente la licitación 2, y las otras licitaciones
alguna de las empresas restantes: ( 2)(1)( 4) = 8, o
• La empresa B gana solamente la licitación 3, y las otras licitaciones
alguna de las empresas restantes: ( 2)(3)(1) = 6.
Por el principio de la adición, el número de maneras en que la empresa
B gana solo una licitación:
n( E) = (1)(3)( 4) + ( 2)(1)( 4) + ( 2)(3)(1) = 12 + 8 + 6 = 26
n( E) 26
P( E
=) = = 0.4333
n(Ω) 60

120 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


c. ¿Cuál es la probabilidad de que la empresa A no gane ninguna de
las licitaciones?
Solución
Sea F: empresa A no gana ninguna licitación
n( F ) (=
= 2)(3)( 4) 24

24
P( F
= ) = 0.40
60

Ejemplo 14
Una compañía ha decidido comprar 6 computadoras de las cuales 3 deben
ser portátiles y 3 fijas, y para realizar la compra se han presentado varias
propuestas. De la empresa Teledata se ha evaluado 3 modelos portátiles
y 3 fijos, de la empresa Dataservice se ha evaluado 4 modelos portátiles y
5 fijos. Si todas las computadoras tienen la misma probabilidad de ser
elegidas, responda.
a. ¿De cuantas maneras diferentes se puede hacer la compra?
Solución
• En total se ha evaluado 7 modelos portátiles y 8 modelos fijos.
• Adquirir 3 computadoras portátiles de 7 posibles, y 3 fijas de 8 posibles:


n(Ω)
= (C =
7
3)(C )8
3 (35
=)(56) 1960

b. ¿Cuál es la probabilidad de que todas las computadoras compradas sean


de la misma empresa?
Solución
Sea A: Todas las computadoras compradas son de la misma empresa.
• Teledata: Adquirir 3 portátiles de 3 evaluadas, y 3 fijas de 3 evalua-
das: C33C33 , o
• Dataservice: Adquirir 3 portátiles de 4 evaluadas, y 3 fijas de 5 eva-
luadas: C34C35

= P( A)
(C )(C =
3
3 ) + (C )(C )
3
3
4
3
5
3 (1)(1) + ( 4)(10)
= 0.0209
n(Ω) 1960

3.3 Probabilidad relativista

Al igual que la probabilidad a priori, se basa en el cociente entre resultados fa-


vorables observados sobre resultados totales del experimento en estudio. Su di-
ferencia con la probabilidad clásica radica en que se calcula a través de datos
experimentales.

Capítulo 2. Probabilidad 121


Si un experimento aleatorio se repite n veces bajo las mismas condiciones
n
y nE es el número de resultados favorables a un evento E, entonces: P( E) = E
n
Ejemplo 15
De la producción de una máquina se ha observado que pueden ocurrir dos
tipos de defectos. El defecto del tipo A ocurre un 7 % de las veces, el defecto
del tipo B un 5 % de las veces, y en el 90 % de las veces no ocurre ninguno de
los dos. Hallar la probabilidad de que al elegir un producto al azar tenga solo
uno de estos defectos.

Solución

w = 0.90
A B
Haciendo uso del diagrama
de Venn, se tiene: x y z

P( A) = x + y = 0.07
P( B) = y + z = 0.05
w = 0.90
P ( A  B) =
w=
0.90 ⇒ P( A  B) =
0.10 A B

Se sabe que:
P( A  B) = P( A) + P( B) − P( A  B) = 0.10 y = 0.02
x = 0.05 z = 0.03
Entonces:
( x + y) + ( y + z) − ( y)= 0.07 + 0.05 − y= 0.10
∴y =0.02

defecto) P( A  B) –=
P(Solo un= P( A  B) 0=
.10 – 0.02 0.08

3.4 Definición axiomática


Sea e un experimento aleatorio y Ω su espacio muestral. Una función P que
asigna un número real a cada evento A de Ω , denotada por P(A), es denominada
probabilidad si satisface los siguientes axiomas:
(i) P( A) ≥ 0
(ii) P(Ω) =1
(iii) Si A1, A2, ... son eventos mutuamente excluyentes dos a dos, entonces:
∞  ∞
P   Ai  = ∑ P( Ai )
 i =1  i =1

122 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


De los axiomas anteriores se deducen otras proposiciones de la probabilidad:
P(∅) =0
P( A)= 1 − P( A)
P( A  B) = P( A) + P( B) − P( A  B)
P( A=
− B) P( A =
 B) P( A) − P( A  B)

4. Teoremas de probabilidad

4.1 Probabilidad condicional

Sean A y B dos eventos de un espacio muestral Ω , tal que P( B) > 0; luego, la


probabilidad condicional de ocurrencia del evento A dado que (sabiendo que)
ocurrió el evento B, está definida por:
P( A  B)
P( A | B)
= ; P( B) > 0
P( B)

De manera similar, la probabilidad de que ocurra el evento B sabiendo que


ocurrió el evento A es:
P( A  B)
P( B| A)
= ; P( A) > 0
P( A)

La definición de probabilidad condicional satisface los axiomas de probabili-


dad, es decir:
a. P( B| A) ≥ 0
b. P(Ω | A) =
1
c. Si B1, B2, B3, ... son eventos mutuamente excluyentes dos a dos, entonces
∞  n
P   Bi | A  = ∑ P ( Bi | A )
 i =1  i =1

Ejemplo 16
Con el propósito de conocer las causas por las que los estudiantes no consu-
men productos naturales enlatados, la consultora Data Mining Today aplicó
una encuesta a 400 estudiantes de diferentes instituciones educativas de
Lima. Los resultados obtenidos en relación al género se muestran en la si-
guiente tabla de contingencia.

Género Calidad (C) Difusión (D) Frescura (F) Precio (P) Variedad (V) Otros (O) Total

Hombre (H) 4 25 73 76 38 7 223

Mujer (M) 5 8 67 61 27 9 177

Total 9 33 140 137 65 16 400

Capítulo 2. Probabilidad 123


Si se selecciona un estudiante al azar, ¿cuál es la probabilidad de los
siguientes casos?
a. Que sea hombre o afirme que el motivo del no consumo de productos
naturales sea la frescura.
Solución
223 + 140 − 73
P( H  F )
= = 0.7250
400

b. Que afirme que la causa es la variedad si se eligió a una mujer.


Solución
P ( V  M ) 27
P(V | M
= ) = = 0.1525
P(M) 177

c. Que no haya sido elegido un hombre si afirma que el motivo es la calidad
o el precio.
Solución
5 + 61
P[ M |(C
=  P )] = 0.45205
9 + 137

4.2 Teorema de la multiplicación

El teorema de la multiplicación (regla de multiplicación) de probabilidades es


muy útil para aquellos experimentos que son ejecutados en etapas sucesivas.
Supóngase que un experimento tiene n etapas y sea Aj un evento definido en
términos de la etapa j del experimento; entonces:
P[ A j | A1  A2  ...  A j −1 ] es la probabilidad condicional de un evento en la
etapa j condicionado a lo que sucede en las etapas 1, 2, ..., j − 1.

Teorema.- Sean ε un experimento aleatorio y Ω su espacio muestral co-


rrespondiente. Sean los eventos A1, A2, ..., An para los cuales se tiene que
P[ A1  A2  ...  An−1 ] > 0 entonces:

P[ A1  A2  ...  An ] = P[ A1 ] P[ A2|A1 ] P[ A3|A1  A2 ]... P[ An|A1  A2  ...  An−1 ]

En forma particular, sean los eventos A1 y A2, tal que P( A1  A2 ) > 0 ,


entonces:
P( A1  A2 ) = P( A1 ) P( A2 |A1 )

Lo señalado es una consecuencia directa de la probabilidad condicional,


ya que:
P( A  B)
P( A | B)
= ; P( B) > 0 ⇒ P( A  B) = P( B) P( A | B)
P( B)

124 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


P( A  B)
P( B| A)
= ; P( A) > 0 ⇒ P( A  B) = P( A) P( B| A)
P( A)

Donde la P( A  B) es denominada probabilidad conjunta, mientras que P( A )


y P( B ) se denomina probabilidades marginales.

4.3 Teorema de la probabilidad total

Si {A1, A2, ..., AK} es una partición del espacio muestral (Ω) y B es un evento con-
tenido en el mismo espacio muestral; entonces, la probabilidad de ocurrencia de
B se puede obtener mediante la siguiente expresión:
P( B) =
P ( A1  B)  ( A2  B)  ...  ( AK  B)
K K
= ∑ P( Ai  B) ∑ P( Ai )P( B| Ai )
=
=i 1 =i 1

4.4 Teorema de Bayes

Si {A1,A2,...,AK} es una partición de Ω , y B es cualquier otro evento no vacío del


mismo espacio muestral Ω; entonces, la probabilidad de ocurrencia de un even-
to Ai dado que ocurrió el evento B se define mediante:
P( Ai ∩ B) P( Ai ) P( B| Ai )
P( Ai | B)
= =
P( B) K
∑ P( Ai ) P( B| Ai )
i =1

Estas probabilidades P( Ai | B) , son denominadas probabilidades a posteriori


y son útiles porque permiten comparar las probabilidades obtenidas después de
la ocurrencia del evento B de interés.

Ejemplo 17
De los reportes sobre una operación financiera, se tiene la siguiente información:
• La probabilidad de ganar menos de 20 000 soles es de 0.35;
• El 40 % de las veces se gana entre 20 000 y 40 000 soles;
• Cuando se gana menos de 20 000 soles, la probabilidad de no lograr la
meta es de 0.2; ;
• Si se gana entre 20 000 y 40 000 soles, la probabilidad de que se logre la
meta es de 0.6;
• Cuando se gana más de 40 000 soles, la probabilidad de no lograr la meta
es de 0.01.

Capítulo 2. Probabilidad 125


a. Halle la probabilidad de que se logre la meta.
Solución
Sean los eventos:
Gi: ganancia se encuentra en un intervalo i, y
M: lograr la meta.
Se tiene que:

P(G1 ) 0=
= .35, P(G2 ) 0.40, y por diferencia se tiene que P(G3 ) = 0.25

P( M|G1 ) 0=
= .80, P( M|G2 ) 0.60
= , y P( M|G3 ) 0.99
P( M ) = P(G1 ) P( M |G1 ) + P(G2 ) P( M |G2 ) + P(G3 ) P( M |G3 ) =,
= (0.35)(0.80) + (0.40)(0.60) + (0.25)(0.99) = 0.7675

Forma alterna de solución:


Las probabilidades conjuntas [ P(Gi  M )] se obtienen al multiplicar las
probabilidades marginales [ P(Gi )] con las probabilidades condiciona-
les [ P( M |Gi )]. Luego de los cálculos se elabora la siguiente tabla:

Ganancia M M Total

G1: < 20 P(Gi  M) = (0.35)(0.80) 0.0700 0.35


0.2800
G2: 20 – 40 0.2400 0.1600 0.40
G3: > 40 0.2475 0.0025 0.25
Total 0.7675 0.2325 1.00

b. Si se logró la meta, ¿en cuál de los tres intervalos mencionados es más


probable que se encuentre la ganancia en la operación?
Solución
P(G1  M ) P(G1 )P( M |G1 ) (0.35)(0.80) 0.28
P(G
=1|M ) = = = = 0.3645
P( M ) P( M ) 0.7675 0.7675
P(G2|M ) 0=
= .24 / 0.7675 0.3127
= P(G3|M ) 0=
.2475/ 0.7675 03224

Es más probable que la ganancia se encuentre en el primer intervalo, es


decir, que sea inferior a 20 mil soles.

Ejemplo 18
Del análisis de los registros (“log”) se concluye que las fallas habituales en
una máquina que viene dando problemas están relacionadas con tres pro-
cesos del sistema, P1, P2 y P3. Las fallas relacionadas con cada proceso son
el 20 %, 45 % y 35 % respectivamente. Sólo alguna de estas fallas conlleva
un apagado repentino de la máquina. De las fallas causadas por el primer

126 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


proceso, el 30 % conlleva un apagado de la máquina, de las del segundo
proceso un 55 % y de las del tercer proceso un 10 %.

a. Muestre la información proporcionada en un diagrama de árbol


Solución

P( A|P1 ) = 0.30 A
P1
P( P1 ) = 0.20 P( A|P1 ) = 0.70 A

P( A|P2 ) = 0.55 A
P( P2 ) = 0.45
P2
P( A|P2 ) = 0.45
A

P( A|P3 ) = 0.10
P( P3 ) = 0.35 A
P3
P( A|P3 ) = 0.90 A

b. ¿Cuál es la probabilidad de que la próxima falla produzca un apagado


repentino de la máquina?
Solución
P( A) =P( P1 )P( A | P1 ) + P( P2 )P( A | P2 ) + P( P3 )P( A | P3 )
P( A) =
(0.2)(0.3) + (0.45)(0.55) + (0.35)(0.10)
P( A) =0.06 + 0.2475 + 0.035 =0.3425

c. Si la siguiente falla produce un apagado repentino de la máquina, ¿cuál de


los procesos es más probable que haya fallado?
Solución
P( P1  A) (0.2)(0.3)
P( P1 |A)
= = = 0.1752
P( A) 0.3425

P( P2  A) (0.45)(0.55)
P( P2 |A)
= = = 0.7226
P( A) 0.3425

P( P3  A) (0.35)(0.01)
P( P3 |A)
= = = 0.1021
P( A) 0.3425

El proceso 2 tiene mayor probabilidad de falla.

Capítulo 2. Probabilidad 127


Ejemplo 19
Una empresa tiene 3 vendedores: A, B y C. Durante el último mes, estos
vendedores han realizado, respectivamente, el 30 %, 20 % y 50 % de las ope-
raciones de venta de la empresa. Del total de operaciones de venta realizadas
por el vendedor A, el 1 % tiene error en la orden de compra. Del total de ope-
raciones de venta realizadas por el vendedor B, el 3 % tiene error en la orden
de compra. Del total de operaciones de venta realizadas por el vendedor C, el
90 % no tiene error en la orden de compra.
a. Si se selecciona al azar una operación de venta, halle la probabilidad de
que ésta tenga error en la orden de compra.
Solución
P( E|A) = 0.01 E
A
P( A) = 0.30 E
P( E|A) = 0.99

P( E|B) = 0.03 E
P( B) = 0.20
B
P( E|B) = 0.97 E

P(C ) = 0.50 P( E|C ) = 0.10


E
C
P( E|C ) = 0.90 E

P( E) = P( A)P( E| A) + P( B)P( E| B) + P(C )P( E|C )


P( E) = (0.30)(0.01) + (0.20)(0.03) + (0.50)(0.10)
P( E) = 0.003 + 0.006 + 0.050 = 0.059

b. Si se selecciona al azar una operación de venta y ésta tiene error en la or-


den de compra; determine la probabilidad de que la operación de venta
corresponda al vendedor B.
Solución
P( B  E) 0.006
P(=
B|E) = = 0.1017
P( E) 0.059

4.5 Probabilidad de eventos independientes

La independencia de eventos es la propiedad necesaria para que la probabilidad de


la intersección se obtenga al multiplicar las probabilidades individuales. En el
ejemplo A, la multiplicación brindó la probabilidad correcta porque los eventos
eran independientes. En el ejemplo B, los eventos no son independientes y la
multiplicación brinda una respuesta distinta.

128 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Definición
Se dice que dos eventos son independientes si, y sólo si, cualquiera de las siguien-
tes proposiciones es verdadera:
• P( A | B) = P( A)
• P( B| A) = P( B)
• P( A  B) = P( A) P( B)
Lo anterior significa que dos eventos son independientes si la ocurrencia (o
no ocurrencia) de uno no afecta la probabilidad de ocurrencia del otro.
Algunas veces es sencillo determinar la independencia de eventos, pero en
otros casos es difícil, especialmente cuando los eventos que se desean analizar
son combinaciones de otros eventos. Por ejemplo:
a. La compra de un producto por un cliente A no tiene ningún efecto sobre
la decisión de compra o no de otro cliente B, es decir, son independientes.
b. Sean los eventos:
A: tener una cuenta de ahorros en el Banco GGG, y
B: recibir un préstamo en el Banco GGG
El hecho de que una persona tenga una cuenta de ahorros en el Banco
GGG puede aumentar la probabilidad de que la persona reciba un présta-
mo del Banco GGG, lo cual ocurre en la práctica, por lo tanto los eventos
A y B no son independientes.
Para una mejor comprensión del concepto de independencia, se menciona el
siguiente caso:

Caso de análisis:
Sean:
A: aparece el número 4 en un dado rojo, y
B: aparece el número 4 en un dado azul.
Si ambos dados se lanzan una vez, ¿cuál es la probabilidad de que ocurran
dos números 4 ?
P( A) = 1/ 6 , P( B) = 1/ 6 y P( A  B) = 1/ 36.

Nótese que el producto (1/ 6)(1/ 6) = 1/ 36 permite obtener la respuesta correcta.


Pero no siempre es así.
Si se lanzan los dos dados, se tiene que:
P(suma de ambos dados sea 8 y los dos números sean iguales) = 1/ 36.
Sin embargo:
P(suma de ambos dados sea 8 ) = 5/ 36
P(dos números iguales) = 6/ 36
Si se multiplican dichas probabilidades se obtiene: (5/ 36)(6/ 36) = 5/ 216.
Luego, las probabilidades halladas no coinciden.

Capítulo 2. Probabilidad 129


Ejemplo 20
Los alumnos A y B han sido designados para resolver un problema de ele-
vada dificultad, y trabajarán en forma separada. Se estima que A tiene una
probabilidad de 0.85 de resolverlo correctamente, ymientras que B tiene una
probabilidad de 0.75. Hallar la probabilidad de que:

a) El problema quede resuelto correctamente.


Solución
El problema quedará resuelto cuando al menos uno de ellos lo puede
resolver; es decir:
P( A  B) P( A) + P( B) – P( A)( A  B)

Por independencia

P( A  B) =
P( A) + P( B) – P( A)P( B) =
0.85 + 0.75 – (0.85)(0.75) =
0.9625

b) Solo uno de ellos lo resuelva.


Solución
Se define el evento S: sólo un alumno resuelve el problema
P(S) = P( A  B) + P( A  B) = (0.85)(0.25) + (0.15)(0.75) = 0.325

Ejemplo 21
Un empresario invierte en 3 proyectos diferentes: P1, P2 y P3. Por informa-
ción anterior, el empresario sabe que las probabilidades de éxito en estos pro-
yectos son de 0.6 , 0.7 y 0.9 , respectivamente, y, además, que los resultados
de estos proyectos son independientes.

a. Calcule la probabilidad de que este empresario tenga éxito en solo uno de


estos proyectos.
Solución
Sean:
P1: Éxito en el proyecto 1. P( P1 ) = 0.60, P( P1 ) = 0.40
P2: Éxito en el proyecto 2. P( P2 ) = 0.70, P( P2 ) = 0.30
P3: Éxito en el proyecto 3. P( P3 ) = 0.90, P( P3 ) = 0.10 ,

P(Solo uno) = P( P1  P2  P3 ) + P( P1  P2  P3 ) + P( P1  P2  P3 )
= (0.6)(0.3)(0.1) + (0.4)(0.7)(0.1) + (0.4)(0.3)(0.9) = 0.154

b. Halle la probabilidad de que el empresario tenga éxito en, a lo más, dos de


estos proyectos.
Solución
Se definen los eventos

130 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


T : tiene éxito en a lo más dos proyectos, y
T : tiene éxito en los tres proyectos,
=P(T ) P=
( P1  P2  P3 ) (=
0.6)(0.7)(0.9) 0.378, luego :
P(T ) =
1 − 0.378 =
0.622
P(T ) =
1 − 0.378 =
0.622

Ejemplo 22
El gerente de logística de una empresa afirma que el desabastecimiento del
insumo A ocurre con probabilidad 0.1, el del insumo B ocurre con probabi-
lidad 0.08 y el del insumo C ocurre con probabilidad 0.05. Considerando
independencia para el abastecimiento de estos insumos en un momento de
operación elegido al azar, halle las probabilidades para los siguientes eventos:

a. E1: que los tres insumos registren abastecimiento.


Solución
Sean:
A: Desabastecimiento del insumo A. P(A) = 0.10, P( A) = 0.90
B: Desabastecimiento del insumo B. P(B) = 0.08, P( B) = 0.92
C: Desabastecimiento del insumo C. P(C) = 0.05, P( B) = 0.95
=
P ( E1 ) P= = 0.7866
( A  B  C ) (0.90)(0.92)(0.95)

b. E2: que solo el insumo B registre desabastecimiento.


Solución
=
P ( E2 ) P= = 0.0684
( A  B  C ) (0.9)(0.08)(0.95)

c. E3: Que el desabastecimiento se produzca solo para los insumos A y C.


Solución
P( E3 ) P=
= ( A  B  C ) (0.10)(=
0.92)(0.05) 0.0046

d. E4: Que el insumo A o el B estén desabastecidos, pero no el insumo C.


Solución
=P( E4 ) P=
[( A  B)  C ] P( A  B)P(C )
P ( E4 ) = [ 0.10 + 0.08 − (0.10)(0.08) ] (0.95) = 0.1634

Ejemplo 23
En una empresa de estudios de mercado se forman dos grupos de encues-
tadores. El primer grupo está compuesto por 15 hombres y 5 mujeres, y el
segundo grupo por 16 hombres y 6 mujeres.
a) Si se selecciona al azar una persona de cada grupo, ¿cuál es la probabili-
dad de que al menos una sea mujer?

Capítulo 2. Probabilidad 131


Solución
15 16
P( H1 ) = P( H 2 ) =
20 H 22 H
Grupo 1 Grupo 2
5 M 6 M
P( M1 ) = P( M 2 ) =
20 22

E: elegir al menos a una mujer.


E : ninguna mujer es elegida
 15  16 
P( E) P=
= ( H1  H 2 ) P( H
=1 ) P( H 2 ) =   0.5454
 20  22 

P(E) = 1 – P( E ) = 1 – 0.5454 = 0.4546

5. Problemas resueltos

1. Una caja contiene 20 fichas blancas numeradas de 1 a 20, 10 fichas rojas


numeradas de 1 a 10, 40 fichas amarillas numeradas de 1 a 40, y 10 fichas
azules numeradas de 1 a 10. Suponga que todas las fichas tienen igual pro-
babilidad de ser elegidas y que se extrae una ficha al azar.
a. ¿Cuál es la probabilidad de que la ficha sea azul o blanca?
Solución
Ω ={B1, …, B20, R1, …, R10, Am1, …, Am40, Az1, …, Az10};
n(Ω) =80
Blancas = {B1, …, B20} n(B) = 20
Rojas = {R1, …, R10} n(R) = 10
Amarillas = {Am1, …, Am40} n(Am) = 40
Azules = {Az1, …, Az10} n(Az) = 10
En este caso, no interesa el número de la ficha sino el color
 B) P( A) + P( B) ya que son mutuamente excluyentes (o se da
P( A =
uno o se da el otro, pero no ambos simultáneamente)
El total de fichas en la caja es 80: n(Ω) = 80
El total de total de fichas azules: n(Az) = 10 y de fichas blancas:
n(B) = 20; luego,
20 10 30
P( A  B) = + = = 0.375
80 80 80
b. ¿Cuál es la probabilidad de que la ficha tenga el número 10, 11, 12 o 25?
Solución
Ahora no interesa el color sino el número. Con el número 10 hay 4 fichas,
con el 11 y 12 hay 2, y con el 20 sólo 1. Entonces

132 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


4 2 2 1 9
P(10  11  12  25) = P(10) + P(11) + P(12) + P( 25) = + + + = = 0.1125
80 80 80 80 80

c. ¿Cuál es la probabilidad que la ficha sea roja o amarilla y que tenga el


número 3, 4, o 5?
Solución
1
Para cada Colori se tiene que P(Color=
i) = 0.0125
80
6
P( R3 ) + P( R4 ) + P( R5 ) + P( A3 ) + P( A4 ) + P( A5 ) = = 0.075
80
d. ¿Cuál es la probabilidad de que el número sea divisible por 3?
Solución
Las fichas blancas contienen a 6 divisibles por 3.

B 3 = {B3, B6, B9, B12, B15, B18}

Las fichas rojas contienen a 3 divisibles por 3. R 3 = {R3, R6, R9}
Las fichas amarillas contienen a 13 divisibles por 3.

Am 3 = {Am3, Am6 , …, Am36 , Am39}

Las fichas azules contienen a 3 divisibles por 3. Az 3 = {Az3, Az6, Az9}
La probabilidad de escoger un número que sea divisible por 3 se
reduce a:
 6 + 3 + 13 + 3 25
P(3) = = = 0.3125
80 80

2. En una empresa se han elaborado tarjetas con el nombre de cada colaborador,


así como un código para un sorteo; el mencionado código se encontraba con-
formado por 5 posiciones: las 2 primeras posiciones eran figuras de la baraja
(♦ ♣ ♥ ♠), y las 3 últimas eran valores numéricos (dígitos del 1 al 3). Cada figu-
ra, así como los números, podía repetirse en el código.
a. Hallar la probabilidad de que el código para el sorteo se encuentre con-
formado por figuras y dígitos distintos.
Solución
El código se puede conformar de (42)(33) = (16)(27) = 432 códigos distintos
A: el código tiene figuras y dígitos distintos.
• Ordenar 2 figuras, sin repetición, de 4 posibles:
4! ( 4)(3)( 2 !)
P24 = = = 12, y
( 4 − 2)! 2!
• Ordenar 3 dígitos, sin repetición, de 3 posibles: P3 = 3! = (3)(2)(1) = 6
• Número de casos a favor del evento A: n(A) = P24 P3 = (12)(6) = 72

Capítulo 2. Probabilidad 133


Por lo tanto, la probabilidad de que ocurra A es:
P24 P3 (12)(6)
P( A)
= = ≈ 0.16667
( 4 )(3 )
2 3 432

b. ¿Cuál es la probabilidad de que el dígito central no se repita?
Solución
B: el dígito central no se repite.
• Ordenar 2 figuras, con repetición, de 4 posibles: 42
• Elegir al dígito que no se repite: C13 = 3
• Ordenar 2 dígitos, con repetición, de 2 posibles: 42 = 4
Por lo tanto, la probabilidad de que ocurra B es:
2
(4 )(3)(4) 12
P ( B=
) 2 3
= ≈ 0.44444
(4 )(3 ) 27

3. Un ingeniero de sistemas que trabaja para una compañía de computación de-


dicada al desarrollo de software está diseñando la clave de acceso a su progra-
ma aplicativo. La clave debe estar formada por una palabra de cinco letras,
elegidas entre cuatro vocales y ocho consonantes disponibles.
a. Hallar la probabilidad de que la clave esté formada por 2 vocales al
inicio y 3 consonantes al final, tal que las vocales y consonantes no se
repitan.
Solución
• El total de posibles claves que puede formar el ingeniero con las 12
letras disponibles es: n(Ω) =125.
• Se define el evento D: la clave tiene 2 vocales distintas al inicio y 3
consonantes distintas al final. El número de casos a favor de D es:
n=( D) P= = 4032 .
4 8
2 P3 (12)(336)
4032
Por lo tanto, la probabilidad de que ocurra D es: P=
( D) = 0.0162
125
b. ¿Cuál es la probabilidad de que el ingeniero forme una clave que contenga
dos vocales iguales y tres consonantes iguales?
Solución
Se define el evento E: la clave tiene dos vocales iguales y tres consonan-
tes iguales.
Como para formar la clave interesa el orden, hay 4 maneras de elegir
una vocal y 8 maneras de elegir una consonante, la vocal y la consonante
elegidas se repetirán 2 y 3 veces respectivamente. Los casos a favor de
E son:
 
n( E) ( 4)(8=
= ( )
) P25, 3 (32) 
5!
=
 ( 2 !)(3!) ( 3!) 
 (5)( 4)(3!) 
 (32)  =
 ( 2 !)(3!) 
 (32
= )(10) 320.
 

134 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


320
La probabilidad de que ocurra E es: P=
( E) = 0.001286
125

4. En una empresa hay 3 subgerencias vacantes. Para cubrir estas vacantes,


la empresa decide elegir al azar a tres de sus ejecutivos aptos para asumir
cada uno de estos cargos. La empresa tiene cuatro sucursales: San Isidro,
con 5 ejecutivos, Miraflores, con 8 ejecutivos; San Miguel, con 4 ejecutivos;
y La Molina: con 3 ejecutivos.

a. ¿Cuál es la probabilidad de que los 3 subgerentes elegidos sean de la


misma sucursal?
Solución

n(Ω= ) C320= 1140



E: los 3 ejecutivos elegidos son de la misma sucursal
C35 + C38 + C34 + C33 10 + 56 + 4 + 1 71
P=
( E) = = = 0.0622
C320 1140 1140

b. ¿Cuál es la probabilidad de que ninguno de los elegidos sea de la sucur-
sal de Miraflores?
Solución
F: Ningún ejecutivo de Miraflores es elegido
C08 C12
P( F )
= = 3
0.19298
C320

C08C12 (1)( 220)
P( F )
= = 3
= 0.19298
C320 1140

c. Hallar la probabilidad de que más de uno de los elegidos sea de la sucur-
sal de San Isidro.
Solución
M: elegir a más de un ejecutivo de San Isidro
C25C115 + C35C15 (10)(15) + (10)(1) 160
P(=
M) =0
= = 0.14035
C320 1140 1140

5. En una reunión de trabajadores con sus directivos (gerente y subgerente) se


han ocupado totalmente 4 mesas con capacidad para 10 personas; además,
se sabe que en la mesa 1 no se ha ubicado ni al gerente ni al subgerente,
quienes se han ubicado en mesas diferentes. Se selecciona 3 trabajadores.

Capítulo 2. Probabilidad 135


a. ¿Cuál es la probabilidad de que a lo más se seleccione a un trabajador de
la mesa 1?
Solución
• Seleccionar a 3 de los 38 trabajadores: C338 = 8436
Luego:

Seleccionar a 0 trabajadores de la mesa


1 (10 trabajadores), y a 3 de las mesas =
C 0 C 3 (1=
10 28
)(3276) 3276
restantes (28 trabajadores).

Seleccionar a 1 trabajador de la mesa


1 (10 trabajadores), y a 2 de las mesas =
C1 C 2 (10
10 28
= )(378) 3780
restantes (28 trabajadores).

3 + C1 C 2
C 0 C= 3276 + 3780
10 28 10 28
• Probabilidad solicitada: ≈ 0.8364
C3
38 8436

b. En la mesa 2 tampoco se ha ubicado ni al gerente ni al subgerente, ¿cuál


es la probabilidad de que por lo menos se seleccione a 2 trabajadores de
la mesa 1 o de la mesa 2, pero no a trabajadores de ambas mesas a la vez?
Solución
Del procedimiento anterior:
• Seleccionar a 3 de las 38 trabajadores: C 38
3 = 8436

Luego:

Seleccionar a 1 de las 2 mesas (mesa


C1 = 2
2
1 o mesa 2)

De la mesa elegida previamente, se-


leccionar a 2 trabajadores de la mesa
C 2 C1 (=
= 45)(18) 810
10 18
(10 trabajadores), y a 1 de las mesas 3
o 4 (18 trabajadores), o

De la mesa elegida previamente, se-


leccionar a 3 trabajadores de la mesa
=
C 3 C0
10 18
(120
= )(1) 120
(10 trabajadores), y a 0 de las mesas 3
o 4 (18 personas)

• Probabilidad solicitada:
C1 C 2 C1 + C 3 C 0
=
2
( 10 18
2(810 + 120)
10 18
≈ 0.2205
)
C3
38 8436

136 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


6. Una empresa transnacional requiere seleccionar practicantes de ingenie-
ría para el verano del año siguiente. El perfil solicitado indica tener tres
características: pertenecer al tercio superior, dominar el idioma inglés, y
dominar Excel. Se presentaron al proceso de selección 500 estudiantes de
diferentes universidades, y luego de la primera revisión de los currículos,
se observó que:
Pertenecen al tercio superior 186
Son del tercio superior y dominan inglés: 83
Dominan inglés 329
Dominan inglés y Excel: 217
Dominan Excel 295
Son del tercio superior y dominan Excel: 63
Todos los postulantes tienen al menos una de las tres características.
Si se elige al azar a un postulante, determine la probabilidad de que:

a. Tenga el perfil solicitado.


Solución
Tercio superior: n(T) = 186 Tercio superior y domina inglés: n(T  I )=83
Domina inglés: n(T) = 329 Dominan inglés y Excel: n( I  E) = 217
Domina Excel: n(E) = 295 Tercio superior y domina Excel: n(T  E)=63

n(Ω) =500
n(T  I  E) = n(T ) + n( I ) + n( E) – n(T  I ) – n( I  E) – n(T  E) + n(T  I  E)

500 = 186 + 329 + 295 – (83 + 217 + 63) + n(T  I  E)

Entonces, n(T  I  E) = 53

Diagrama de Venn:

n(Ω) =500
T I
30
93 82
53
10 164

68

53
P(Perfil) = P(T  I =
E) = 0.106
500

Capítulo 2. Probabilidad 137


b. Tenga solo una de las tres características.
Solución
S: el estudiante tiene solo una de las 3 características.
     
P(S) = P[(T  I  E)  (T  I  E)  (T  I  E)]

93 + 82 + 68 243
= = = 0.486
500 500
c. Domine el idioma inglés y Excel, pero no pertenezca al tercio superior.
Solución
 164
P[( I  E) − T ]= P( I  E  T )= = 0.328
500

7. Se han encuestado a 160 profesionales de la construcción y acabados, y se


ha recabado información sobre su edad, la tienda de su preferencia, así co-
mo el motivo de dicha preferencia (Servicio o Variedad). A partir de los
datos recabados se elaboró la siguiente tabla resumen:

Servicio Variedad
Edad Total
Maestro Promart Sodimac Maestro Promart Sodimac
De 40 a más 5 5 4 8 15 12 49
Menos de 40 21 18 15 6 26 25 111
Total 26 23 19 14 41 37 160

a. Si se selecciona un encuestado al azar para una verificación telefónica,


obtenga las siguientes probabilidades.
a.1) ¿Cuál es la probabilidad de que el encuestado prefiera la tienda
Sodimac?
Solución
19 + 37 56
P(Sodimac
= ) = = 0.35
160 160

a.2) ¿Cuál es la probabilidad de que el encuestado no prefiera la tienda


Promart?
Solución
23 + 41 64
P( Promart ) =
1 − P( Promart ) =
1− =
1− 0.40
=
160 160
a.3) ¿Cuál es la probabilidad de que el encuestado tenga de 40 a más años
o que valore la Variedad?
Solución
P(De 40 a más  Variedad) = P(De 40 a más) + P(Variedad) –
P(De 40 a más  Variedad)

138 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


49 14 + 41 + 37 8 + 15 + 12 106
P(De 40 a más  Variedad) = + − = 0.6625
=
160 160 160 160

b. Si se elige al azar a 4 profesionales de 40 a más años, ¿cuál es la probabi-


lidad de que exactamente 2 hayan valorado el Servicio?
Solución
• Seleccionar a 6 de los 49 profesionales de 40 a más años:
49 ! 49 !
= C449 = = 211 876
4 !( 49 − 4 )! ( 4 !)( 45 !)

De los 49 profesionales de 40 a más años, hay 14 profesionales que


valoraron el Servicio y 35 profesionales que valoraron la Variedad.
• Seleccionar 2 de los 14 profesionales que valoraron el Servicio y 2 de
los 35 profesionales que valoraron la Variedad:
 14 !  35 ! 
C14
=2 C2
35
  =  (9=
1)(595) 54 145
 ( 2 !)(12 !)  ( 2 !)(33!) 

C14
2 C2
35
54 145
• Probabilidad solicitada: = ≈ 0.25555
C4 49 211 876

c. Si se elige al azar a 3 profesionales que prefieren la tienda Maestro, ¿cuál


es la probabilidad de que por lo menos uno haya valorado la Variedad?
Solución
• Seleccionar a 3 de los 26 + 14 = 40 profesionales que prefieren la tienda
Maestro:
C 40 = 9880
3

• De los 40 profesionales que prefieren la tienda Maestro, hay 26 profe-


sionales que valoraron al Servicio y 14 profesionales que valoraron la
Variedad.
• Seleccionar 2 de los 26 profesionales que valoraron al Servicio y 1 de
los 14 profesionales que valoraron la Variedad:
C 26C14 = (325)(14) = 4550
2 1

• Seleccionar 1 de los 26 profesionales que valoraron al Servicio y 2 de


los 14 profesionales que valoraron la Variedad:
C126C14
2 = ( 26)(91) = 2366

• Seleccionar 0 de los 26 profesionales que valoraron al Servicio y 3 de
los 14 profesionales que valoraron la Variedad:
C026C14
3 = (1)(364) = 364

C 26C14 + C126C142 + C 0 C3
26 14
7280
• Probabilidad solicitada: 2 1 = ≈ 0.7368
C3
40 9880

Capítulo 2. Probabilidad 139


8. Se compran 20 computadoras de una marca A y 30 de una marca B. De la
marca A hay 2 que no funcionan; y de la marca B hay 3 que no funcionan.

a. Si se elige al azar una de las computadoras, ¿cuál es la probabilidad de


que no funcione?
Solución
5
P(computadora no funciona)
= = 0.10
50

b. Si para una inspección se elige al azar y sin reposición 5 computadoras,


¿Cuál es la probabilidad de que:
b.1) Solo una de ellas sea de la marca A.
Solución
 50 
n(=
Ω)  =  2 118 760
5

S: solo una computadora elegida es de la marca A


 20 
• Seleccionar una computadora de la marca A de 20 disponibles:  
1
 30 
• Seleccionar 4 computadoras de la marca B de 30 disponibles:  
4
 20  30 
  
P(S) =
1  4 
= 0.2587
2118760
b.2) A lo más una de ellas sea defectuosa.
Solución
A: a lo más una computadora elegida es defectuosa.
• Seleccionar ninguna computadora defectuosa, y 5 no defectuosas:
 5  45 
   , o
 0  5 

• Seleccionar una computadora defectuosa, y 4 no defectuosas:


 5  45 
  
  
1 4

 5  45   5  45 
   +   
P( A) =
0  5   1  4 
= 0.9282
2118760

9. Suponga que por la aduana de un aeropuerto deben pasar 20 embarques. Para


cada uno de ellos, el responsable del embarque debe presionar un botón que
emitirá una luz de color rojo (R), una luz de color ámbar (A) o una luz de co-

140 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


lor verde (V). Si se emite luz roja, el embarque será revisado totalmente. Si se
emite luz ámbar, el embarque se revisará parcialmente. Si se emite luz verde,
el embarque no será revisado.

a. Si se desea identificar la luz emitida para cada uno de los 20 embarques,


determine el número de elementos que tiene el espacio muestral.
Solución
Con cada uno de los 20 embarques se tiene 3 opciones al presionar un
botón, por lo tanto el total de posibles resultados es:

N(Ω) =3
20

b. Halle la probabilidad de que la mitad de los embarques sean revisados


totalmente y que cinco de los embarques sean revisados parcialmente.
Solución
M: la mtad de los embarques son revisados totalmente (R), y cinco de los
embarques sean revisados parcialmente (A)
Aplicando permutaciones con elementos iguales, se tiene que:
20 !
n( M ) P=
= 20
10 , 5 , 5 = 46 558 512
10 ! 5 ! 5 !

Por lo tanto, la probabilidad de que ocurra el evento M es:
46 558 512
= P( M ) = 0.01335
320

10. En el depósito de la empresa Fabritext S.A hay dos lotes de cierto producto:
• El lote 1 contiene 5 unidades de buena calidad, 4 de regular calidad y 3 de
mala calidad.
• El lote 2 contiene: 8 unidades de buena calidad, 6 de calidad regular y 4 de
mala calidad.
Un comprador debe elegir al azar 4 unidades, y si elige al menos 2 unida-
des de buena calidad, compra los dos lotes. Sean las siguientes estrategias:
i. Estrategia 1: de cada lote se eligen, al azar, sin reemplazo y sin considerar
el orden, dos unidades.
ii. Estrategia 2: se juntan los dos lotes; luego, se seleccionan, al azar y sin
reemplazo, cuatro unidades.
iii. Estrategia 3: de cada lote se eligen, al azar y con reemplazo, dos unidades.
¿Con cuál de las estrategias se tiene una mayor probabilidad de que se com-
pre los dos lotes?

Capítulo 2. Probabilidad 141


Solución
Para la estrategia 1
La cantidad de sucesos del espacio muestral viene dada por:
12 18 
n(Ω)  =
=   10 098
 2  2 

Lote 1: 5 unidades de buena calidad, y 7 de otras calidades


Lote 2: 8 unidades de buena calidad, y 10 de otras calidades
Sean A: elegir al menos dos unidades de buena calidad
A: elegir a lo más una unidad de buena calidad
 5   7   8   10   5   7   8   10   5   7   8   10 
n( A) =         +         +         = 4200
 0 2 0 2   0 21 1  1 1  0 2 

4200
P( A) =
1 − P( A) =
1− 0.58407
=
10098
Para la estrategia 2
El espacio muestral viene dado por:
 30 
n( Ω
= )  =  27 405
 4

13  17  13  17 


n( A) =     +     = 11 220
 0  4   1  3 

11220
P( A) =
1 − P( A) =
1− 0.59058
=
27405
Para la estrategia 3
El espacio muestral viene dado por:
n(Ω) (12=
= 2
)(182 ) 46 656

n(A ) = (7)(7)(10)(10) + ( 2)(5)(7)(10)(10) + ( 2)(7)(7)(8)(10) =


19 740

19740
P( A) =
1 − P( A) =
1− 0.57690
=
46656
Hay mayor probabilidad de concretar la compra usando la estrategia 2.

11. En una fábrica de pantalones, se trabaja con 3 máquinas (M1, M2, M3). La
producción de la máquina M1 equivale a la producción de M2 y M3 juntas
y además la producción de M2 es la quinta parte del total. El 60 % de la
producción de cada máquina corresponde a operarios antiguos y el resto a
operarios nuevos.
Si de la producción de la semana anterior (con las condiciones dadas), se
selecciona un pantalón al azar, halle la probabilidad de que:

142 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


a. Haya sido confeccionado en la máquina M3.
Solución
Se sabe que:

1
P=
( M1 ) P( M 2 ) + P( M3 ) P ( M 2 )= = 0.20
(1), y
5
(2)

De (1) se deduce que:


P( M1 ) = 0.50 (3) y P( M 2 ) + P( M3 ) =
0.5 (4)

De (2) y (4) se deduce que:
P( M3 ) = 0.3 (5)

b. Haya sido confeccionado en la máquina M2 y por un operario antiguo.
Solución
Sea:
A: Es un operario antiguo
Se sabe que:
P( A | Mi ) 0=
= .60, i 1, 2, 3 (6)

De (2) y (6) se tiene que:
P( M 2  A) = P( M 2 =
)P( A | M 2 ) (=
0.20)(0.60) 0.12

Siguiendo un similar procedimiento se puede completar la siguiente
tabla:

Antiguos (A) Nuevos (N) Total


Máquina 1 (M1) 0.30 0.20 0.50
Máquina 2 (M2) 0.12 0.08 0.20
Máquina 3 (M3) 0.18 0.12 0.30
Total 0.60 0.40 1.00

c. Haya sido confeccionado por un operario nuevo o en la máquina M1.


Solución
Sea:
N: Es un operario nuevo
Entonces:
P( N  M1 ) =+
P( N ) P( M1 ) – P( N  M1 ) =
0.40 + 0.50 – 0.20 =
0.70

12. En un examen de Matemáticas solo 75 % de los alumnos respondió todas


las preguntas. De aquellos que lo hicieron, 80 % aprobó, pero de los que no
lo respondieron en su totalidad, solo aprobó 50 %.
a. Si se elige al azar a un estudiante que aprobó, ¿cuál es la probabilidad de
que haya respondido todas las preguntas?

Capítulo 2. Probabilidad 143


Solución
Se definen los eventos:
R: responder todas las preguntas.
A: aprobar el examen
Se sabe que:
= P( R) 0= .75, P( R) 0.25=
, P( A | R) 0.80=
, P( A | R) 0.50

Se registra la información proporcionada en la siguiente tabla:

A A Total

P( R  A) = P( R)P( A|R)
R 0.150 0.75
(0.75)(0.80) = 0.600

R 0.125 0.125 0.25

Total 0.725 0.275 1.00

Se solicita: P( R|A)
P ( R  A) 0.60
De la tabla se tiene que: P ( R
= | A) = = 0.8276
P ( A) 0.725

b. Si el estudiante elegido no aprobó, ¿cuál es la probabilidad de que no


haya respondido todas las preguntas?
Solución
Se solicita: P ( R | A) De la tabla anterior, se tiene:

P( R  A) 0.125
P( R=
| A) = = 0.4545
P( A) 0.275

13. En una empresa se realizó una capacitación a los operarios de la Planta A


y de la Planta B, y se tiene conocimiento de que los operarios capacitados
provenientes de la Planta A son el doble que los provenientes de la Planta
B. Se sabe que el 5 % de los operarios de la Planta A y el 10 % de los opera-
rios de la Planta B obtuvieron una clasificación deficiente en la evaluación
realizada luego de la capacitación. Si de una de las plantas se selecciona al
azar 2 operarios, responda a las siguientes preguntas.
Nota: Los resultados de la evaluación son independientes.

a. Hallar la probabilidad de que los 2 operarios hayan obtenido una clasi-


ficación aceptable (no deficiente).
Solución
Pi: Los 2 operarios son de la Planta i. i = A, B
C: Los 2 operarios seleccionados obtuvieron una clasificación aceptable.

144 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Nota: Como los operarios capacitados de la Planta A son el doble que la
Planta B:
2 1
= P( PA ) = , y P( PB )
3 3

Planta Clasificación

P ( PA = =
| PA ) 0.95 2
0.9025
C
2 PA
P( PA ) =
3 C

P ( PA = =
| PA ) 0.90 2
0.81
P( PB ) =
1 C
3 PB
C

2 1
P(C =
)   (0.9025) +   (0.81=
) 0.871667
3  3

b. Si los 2 operarios seleccionados obtuvieron una clasificación aceptable,


¿cuál es la probabilidad de que sean de la Planta B?
Solución
1
(0.81)
P( PB  C B )  3 
P( PB |C )
= = = 0.30975
P(C ) 0.871667

14. Suponga que la SUNAT ha clasificado a las empresas por sectores (S1, S2 y
S3), y también según el índice del pago del impuesto a la renta del 2014 en
tres categorías (A1, A2 y A3).
Considerando las clasificaciones antes mencionadas el 30 % de las em-
presas son del sector S1 y de la categoría A1, el 10 % son del sector S1 y de
la categoría A2, el 60 % de las empresas son del sector S1, el 20 % de las
empresas son del sector S2 y de la categoría A1, el 5% de las empresas son
del sector S2 y de la categoría A3, y el 35 % de las empresas son del sector
S2. Además, se conoce que de las empresas que son del sector S3, el 60 %
pertenecen a la categoría A1; y de las que son de la categoría S3, el 20 % son
de la categoría A2. Se selecciona al azar una empresa.

Capítulo 2. Probabilidad 145


a. Determine la probabilidad de que pertenezca a la categoría A2 o perte-
nezca a S3.
Solución
A continuación se resume la información proporcionada:

P(S1  A1) 0.30 , P=


= .10 , P(S1) 0.60
(S1  A2) 0= (Grupo 1)
P(S2  A1) 0.20 , P
= = .05, P(S2) 0.35
(S2  A3) 0= (Grupo 2)
= P( A1|S3) 0= .60, P( A2 |S3) 0.20 (Grupo 3)

Del (Grupo 1) y del (Grupo 2) se deduce que: P(S3) = 0.05 (1)
De (1) y del (Grupo 3) se deduce que:
P( A1  S3) P( A1  S3)
P( A1|S3)= = = 0.60 ⇒ ( A1  S3)= 0.03
P(S3) 0.05

De igual forma: P( A2  S3) = 0.01


A partir de lo señalado se completa la siguiente tabla:

A1 A2 A3 Total
S1 0.30 0.10 0.20 0.60
S2 0.20 0.10 0.05 0.35
S3 0.03 0.01 0.01 0.05
Total 0.53 0.21 0.26 1.00

Se solicita: P( A2  S3)
De la tabla elaborada se tiene:

P( A2  S3) =
P( A2) + P(S3) – P( A2  S3) =
0.21 + 0.05 – 0.01 =
0.25

b. Si se sabe que es de la categoría A2, halle la probabilidad de que no per-


tenezca al sector S1.
Solución
De la tabla anterior, se tiene:
0.11
(
P S1 | A
=2 ) = 0.5238
0.21
c. Si la empresa elegida no pertenece al sector S2, ¿cuál es la probabilidad
de que tampoco pertenezca a la categoría A3?
Solución
De la tabla anterior, se tiene:
0.44
(
P A3 |=
S2 ) = 0.5238
0.65

146 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


15. En un supermercado se viene analizando la compra de los clientes, y se
recabó la siguiente información.
• Todos los clientes adquirieron por lo menos un producto de la sección de
artículos de limpieza.
• 70 % de los clientes adquirieron más de un producto de la sección de
artículos de limpieza.
• 20 % de los clientes adquirieron el producto de limpieza en oferta.
• De aquellos clientes que compraron más de un producto de la sección
de artículos de limpieza, 15 % adquirieron el producto de limpieza en
oferta.
Calcule la probabilidad de que un cliente seleccionado al azar adquirie-
ra exactamente un producto de la sección de artículos de limpieza y que
dicho producto no sea el que se encontraba en oferta.
Solución
L: Adquiere solamente un producto de la sección de artículos de limpieza
(caso contrario adquiere más de 1 producto, ya que todos adquirieron por
lo menos 1).
O: Se adquiere el producto en oferta.

Cantidad artículos de limpieza Prod. Oferta

P(O|L) = k O
P( L) = 0.30 L
O

P(O|L) = 0.15
O
P( L ) = 0.70 L
O

P(O=
) 0.30( k ) + (0.70)(0.15=
) 0.20 ⇒ k= 0.31667

Por lo tanto: P(O|L


= – k 1 – 0.31667
) 1= = 0.68333

Se solicita:
= P( L  O) P=
( L)P(O | L) (0.30
= )(0.68333) 0.205

16. En un municipio, un regidor tiene en pendiente la aprobación de 2 pro-


yectos que ha presentado: A y B. Se estima que el proyecto A tiene una
probabilidad de 0.7 de ser aprobado antes de la próxima sesión de Concejo,
mientras que el proyecto B tiene una probabilidad de 0.9 de ser aprobado en
el mismo plazo. Si la aprobación de un proyecto no influye en el otro, ¿cuál
es la probabilidad de que...

Capítulo 2. Probabilidad 147


a. Se aprueben los 2 proyectos antes de la próxima sesión de Concejo?
Solución
Se tiene que:

P( A) = 0.7 y P( B) = 0.90

=P( A  B) P=
( A)P( B) (0.70
= )(0.90) 0.63
b. Se apruebe solamente el proyecto A antes de la próxima sesión de
Concejo?
Solución

= P( A  B) P=( A)P( B) (0.=


70)(0.10) 0.07
c. Se apruebe al menos uno de los dos proyectos antes de la próxima sesión
de Concejo?
Solución
Sea:
N: No aprobar ninguno de los 2 proyectos
P( N ) = P( A  B)
P( A  B) P=
= ( A)P( B) (0.=
30)(0.10) 0.03
Luego por la probabilidad de evento contrario
1 − P( A  B) =
P(Aprobar al menos 1) = 1 − 0.03 =
0.97

17. En una tienda de calzado, el 40 % de las personas que ingresan al local rea-
liza una compra, y se sabe que la decisión de compra es independiente de
una persona a otra. Sobre los próximos 3 clientes que ingresarán a la tienda,
responda las siguientes preguntas:
a. ¿Cuál es la probabilidad de que los 3 clientes efectúen una compra?
Solución
Ci: Cliente i realiza una compra. i = 1, 2, 3
P(C1  C2  C3 ) P=
= (C1 )P(C2 )P(C3 ) 0.43 = 0.064

b. ¿Cuál es la probabilidad de que por lo menos 2 de las personas realicen


una compra?
Solución
P(≥ 2) = P(C1  C2  C3 ) + P(C1  C2  C3 ) + P(C1  C2  C3 ) + P(C1  C2  C3 )

P(≥ 2=
) (3)(0.42 )(0.6) + 0.4=
3
0.288 + 0.064
= 0.352

c. ¿Cuál es la probabilidad de que se realice por lo menos una venta?


Solución
1 − P(0) =
1 − P(C1  C2  C3 ) =
1 − 0.63 =
1 − 0.216 =
0.784

148 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


18. Según su gravedad, los accidentes de trabajo están clasificados en tres gru-
pos: leves, moderados y severos. La probabilidad de que ocurra un acciden-
te leve es 0.5, de que ocurra un accidente moderado, 0.4; y de que ocurra un
accidente severo, 0.1.
a. Cinco accidentes ocurrieron independientemente en un mes:
a.1) Calcule la probabilidad de que ninguno sea severo
Solución
Sean:
L: Ocurre un accidente de trabajo de gravedad leve. P( L) = 0.50
M: Ocurre un accidente de trabajo de gravedad moderado.
P( M ) = 0.40
M: Ocurre un accidente de trabajo de gravedad severo.
P(S) = 0.10
Se solicita: P(Ninguno severo)
= P(S1  S2  S3  S4 =
P(Ninguno severo)  S5 ) ( =
0.9)5 0.5905

a.2) Halle la probabilidad de que a lo más uno sea moderado


Solución
A: a lo más un accidente moderado
P( A) = P(ninguno moderado) + P(solo uno moderado)
P( A) = P( M1  M 2  M3  M 4  M5 ) + C15 P( M1  M 2  M3  M 4  M5 )

= (0=
.6)5 + 5(0.6)(0.4)4 0.15456

a.3) ¿Cuál es la probabilidad de que todos tengan la misma gravedad?


Solución
T: Todos los accidentes de la misma gravedad
P(T ) =
P( L1  L2  L3  L4  L5 ) + P( M1  M 2  M3  M 4  M5 ) + P(S1  S2  S3  S4  S5 )

P(T ) = (0.5)5 + (0.4)5 + (0.1)5 = 0.0415

b. Halle la probabilidad de que el cuarto accidente que ocurre sea el prime-


ro de severa gravedad
Solución
E: El cuarto accidente es el primero severo
P( E) P(S1  S2  S
= =3  S4 ) ( =
0.9)3 0.1 0.0729

19. Un grupo empresarial decide ejecutar tres planes de inversión: 1, 2 y 3.


Los tres planes serán tratados en forma independiente. Para cada plan de
inversión se ha considerado tres posibilidades: Fracaso (F), Recuperación
de la inversión en tres años o menos (RT) y Recuperación de la inversión en
más de tres años pero en cinco años o menos (RC). Para el plan de inversión

Capítulo 2. Probabilidad 149


1 se consideran las siguientes probabilidades: P( F1 ) = 0.10, P( RT1 ) = 0.35
y P( RC1 ) = 0.55. Para el plan de inversión 2 se consideran las siguientes
probabilidades: P( F2 ) = 0.15, P( RT2 ) = 0.50 y P( RC2 ) = 0.35. Para el plan
de inversión 3 se consideran las probabilidades siguientes: P( F3 ) = 0.05,
P( RT3 ) = 0.065 y P( RC3 ) = 0.30.
a. ¿Cuál es la probabilidad de que sólo en uno de los planes se recupere la
inversión?
Solución
Se define:
Ri: Recuperar la inversión sólo en el plan i, i = 1, 2, 3
De lo señalado se deduce:
P(R1) = P(RT1) + P(RC1) = 0.35 + 0.55 = 0.90, P( R1 ) = 0.10
P(R2) = P(RT2) + P(RC2) = 0.50 + 0.35 = 0.85, P( R2 ) = 0.15
P(R3) = P(RT3) + P(RC3) = 0.65 + 0.30 = 0.95, P( R3 ) = 0.05
Sea:
A: solo en un plan de inversión se recupera la inversión
P( A) = P( R1  R2  R3 ) + P( R1  R2  R3 ) + P( R1  R2  R3 )
P( A) = P( R1  R2  R3 )
= (0.9)(0.15)(0.05) + (0.1)(0.85)(0.05) + (0.10)(0.15)(0.95) = 0.02525

b. Sabiendo que en solo uno de los planes se recuperó la inversión, ¿cuál


es la probabilidad de que haya sido el segundo?
Solución
(0.1)(0.85)(0.05)
P( R
=1  R2  R3 |A) = 0.1683
0.02525
c. Determine la probabilidad de que no fracase el plan de inversión 1 o no
fracase el plan de inversión 2.
Solución
P( F1  F2 ) = P( F1 ) + P( F2 ) − P( F1  F2 )
0.90 + 0.85 – (0.90)(0.85) =
= 0.985

20. Tres equipos de futbol compiten en un triangular. El campeón será aquel


equipo que logre ganar sus dos partidos. Si los equipos son A, B, C y no
existen los empates, se tiene que:
P(A gane a B) = 0.70; P(B gane a C) = 0.80; P(C gane a A) = 0.90
a. ¿Cuál es la probabilidad de que A sea el campeón?
Solución
De los datos proporcionados se tiene que:

150 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


P(A gane a C) = 1 – P(C gane a A) = 1 – 0.90 = 0.10
Para que A sea el campeón tiene que ganar a B y a C; es decir:
P(A es el campeón) = P(A gane a B)P(A gane a C) = (0.70)(0.10) = 0.07
b. ¿Cuál es la probabilidad de que B sea el campeón?
Solución
Procediendo de manera similar al inciso a), se tiene:
P(B gane a A) = 1 – P(A gane a B) = 1 – 0.70 = 0.30
P(B es el campeón) = P(B gane a A)P(B gane a C) = (0.30)(0.80) = 0.24

6. Problemas propuestos

1. El testigo de un accidente de tránsito le indica al policía que la placa de


circulación del automóvil tenía las letras DUH seguidas por tres dígitos, el
primero de los cuales era un cinco. Si el testigo no puede recordar los otros
dos dígitos, pero asegura que los tres eran diferentes, encuentre el número
máximo de placas que debe verificar la policía.

2. Se dispone de los siguientes dígitos 0, 1, 2, 3, 4, 5, y 6; para conformar núme-


ros de 3 dígitos, tal que cada dígito solo puede usarse una vez:
a. ¿Cuántos números distintos pueden formarse?
b. ¿Cuántos números pares distintos pueden formarse?
c. ¿Cuántos números distintos mayores que 330 pueden formarse?

3. Ocho personas, cuatro mujeres y cuatro hombres, compraron 8 lugares pa-


ra un concierto. Considerando cada uno de los siguientes casos, ¿en cuántas
formas diferentes pueden ubicarse en los lugares disponibles?
a. Sin restricciones.
b. Si se sientan por parejas (hombre y mujer).
c. Si todos los hombres se sientan juntos a la izquierda de todas las mujeres.

4. Una caja de 12 baterías recargables contiene una defectuosa, ¿de cuántas


maneras un inspector puede seleccionar tres de las baterías y
a. obtener la defectuosa.
b. no obtener la defectuosa?

5. El gerente de una fábrica desea determinar el número de maneras en que


puede asignar trabajadores al primer turno. Cuenta con 12 hombres que
pueden servir como operadores, 8 que pueden desempeñarse en manteni-
miento y 4 que pueden ser supervisores. Si el turno requiere 6 operadores, 2

Capítulo 2. Probabilidad 151


trabajadores de mantenimiento y 1 supervisor, ¿de cuántas maneras puede
integrarse el primer turno?

6. Un equipo de fútbol tiene 3 arqueros y 15 jugadores de campo.


a. ¿Cuántas alineaciones distintas se pueden formar?
b. Manuel y Jorge son amigos y jugadores de campo. ¿En cuántos casos se
podrá formar el equipo, si al menos uno de los amigos debe jugar?

7. Con la intención de difundir temas relacionados a la protección y uso ra-


cional del medio, el Ministerio del Ambiente tiene previsto difundir 5 spots
(rotulados con las letras A, B, C, D y E) con información alusiva al tema
durante los tres intermedios de un sintonizado programa informativo este
domingo. ¿De cuántas maneras puede programarse la transmisión de los
spots durante los tres intermedios si solo se puede programar un spot en
cada intermedio y si:
a. En los tres intermedios se puede difundir el mismo spot.
b. Los tres spots difundidos son distintos.
c. Un spot es difundido en dos intermedios.
d. De los tres spots diferentes por difundir, uno de ellos es el spot B?

8. Una tienda tiene 3 vitrinas para mostrar sus productos, se puede colocar
1 o más artículos en una vitrina cualquiera. Si en cierto momento hay 4
artículos para exhibición. ¿Cuál es la probabilidad de que se utilicen solo 2
de las 3 vitrinas para los 4 artículos?

9. Los resultados de las prácticas I y II de un curso indican lo siguiente: el


70 % aprobó la práctica I, el 60 % aprobó la práctica II y el 10 % no aprobó
ninguna de las 2 prácticas.
a. ¿Qué porcentaje aprobó solo una de las 2 prácticas?
b. Si un alumno aprobó la práctica I, ¿cuál es la probabilidad de que no
haya aprobado la práctica II?
c. ¿Son independientes los eventos: A1: aprobar la práctica I, A2: aprobar la
práctica II?

10. Un lote de producción tiene 100 unidades, de las cuales se sabe que 20 están
defectuosas. Una muestra aleatoria de 4 unidades se selecciona sin reem-
plazo. ¿Cuál es la probabilidad de que la muestra contenga a lo más dos
unidades defectuosas?

11. Suponga que usted rinde un examen de 10 preguntas de selección múltiple


sobre una materia de la cual usted no sabe absolutamente nada. 5 de las 10
preguntas tienen 4 respuestas posibles (a, b, c y d), de las cuales solo una es

152 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


la correcta. Las restantes 5 preguntas son del tipo verdadero - falso, por lo
que tienen solo dos alternativas. Si usted contesta el examen completamen-
te al azar, y cada pregunta bien contestada tiene un valor de 2 puntos, ¿cuál
es la probabilidad de obtener la nota 18?

12. En unos grandes almacenes se tomó una muestra aleatoria de 10.000 com-
pras a lo largo de un año. Esas compras se clasificaron según la forma de
pago y el importe de las mismas. Se diferenciaron dos formas de pago: Con-
tado (B1) y Crédito (B2). Los importes se agruparon en tres categorías: me-
nos de 50 soles (A1), entre 50 y 500 soles (A2) y más de 500 soles (A3). Para
estos eventos se sabe que:
P(A1) = 0.3, P(A3) = 0.32, P(B1|A1) = 2/3, P(B1|A2) = 2/19, P(B1|A3) = 1/32

a. Si se elige una compra al azar y su importe se ha abonado al contado,


¿cuál es la probabilidad de que su valor sea inferior a 50 soles?
b. ¿Los eventos forma de pago e importe de la compra son independientes?
Compruebe.

13. Un cierto tipo de pólizas incluyen pagos hospitalarios. El 85 % de las póli-


zas incluyen pagos de consultas externas o pagos de operaciones quirúrgi-
cas. El 25 % de las pólizas no incluyen pagos de operaciones quirúrgicas.
Considere la independencia entre estos dos eventos. Si se elige una póliza
al azar:
a. Calcule la probabilidad de que incluya pagos en consultas externas.
b. Halle la probabilidad de que incluya sólo uno de estos tipos de pólizas.
c. Si una póliza no incluye pagos de operaciones quirúrgicas, halle la pro-
babilidad de que incluya pagos por consultas externas .

14. El gerente de un restaurante sabe que el porcentaje de clientes que pide


aperitivo es 30 %.
Por otro lado, la tercera parte de los clientes que piden aperitivo consume
carne. De aquellos que no piden aperitivo, el 60 % consume carne. Si un
cliente pide aperitivo y carne, la probabilidad de que pida postre es 0.80.
Si pide aperitivo, pero no pide carne, entonces la probabilidad de que pida
postre es 0.60. Si no pide aperitivo, pero sí carne, la probabilidad de que pi-
da postre es 0.50. Por último, la probabilidad de que un cliente que no pide
ni aperitivo ni carne pida postre es 0.25.
a. ¿Cuál es la probabilidad de que un cliente elegido al azar pida postre?
b. ¿Cuál es la probabilidad de que un cliente que pide postre pida también
aperitivo?
c. ¿Cuál es la probabilidad de que un cliente que no pide postre no pida
tampoco aperitivo?

Capítulo 2. Probabilidad 153


15. Estudios sobre posibles pérdidas o utilidades con dos proyectos de inver-
sión efectuados por un analista financiero indicaron que invirtiendo en el
proyecto A se pueden obtener los siguientes resultados, en miles de soles,
–20, 0, 40 con probabilidades respectivas 0,1; 0,30; 0,60. Invirtiendo en el
proyecto B las probabilidades para los resultados –20, 0, 40 son 0,30; 0,40;
0,30 respectivamente. Considere independientes los resultados de los dos
proyectos. ¿Cuál es la probabilidad de lo siguiente?:
a. ¿Solo en uno de los dos proyectos se obtenga pérdidas?
b. ¿En ambos proyectos se obtenga el mismo resultado económico?

16. Una cervecería utiliza dos máquinas embotelladoras, pero no operan si-
multáneamente. La segunda máquina opera como sistema de respaldo de
la primera y opera sólo cuando la primera se descompone durante las horas
de trabajo. La probabilidad de que la primera máquina se descomponga en
horas de trabajo es 0.20. Si, efectivamente, la primera máquina se descom-
pone, se enciende la segunda máquina y tiene la probabilidad de descom-
ponerse de 0.30.
a. ¿Qué probabilidad hay de que el sistema embotellador de la cervecería
no esté funcionando en horas de trabajo?
b. La confiabilidad del proceso de embotellado es la probabilidad de que el
sistema esté operando en horas de trabajo. Calcule la confiabilidad del
proceso.

17. De tres eventos A, B y C, se sabe que:


• A y C son independientes
• B y C son independientes
• A y B son disjuntos
• P(A  C) = 2/3; P(B  C) = 3/4; P(A  B  C) = 11/12.
Hallar P(A), P(B) y P(C).

18. A altas horas de la madrugada, un individuo regresa a su casa ebrio. Solo


puede abrir la puerta con una determinada llave de entre las cinco que tie-
ne en su llavero. El portal de la casa está oscuro y no puede distinguir las
llaves entre sí. El mejor método para abrir la puerta sería ir probando las
llaves de una en una, eliminando las que no abran. Pero esta feliz idea se le
ocurre solo con probabilidad 0.1 debido al lamentable estado en que regre-
sa. El otro método consiste en probar llaves al azar hasta abrir la puerta, sin
eliminarlas.
a. ¿Cuál es la probabilidad de que abra la puerta al tercer intento?
b. Si abre la puerta al tercer intento, ¿qué método es el más probable que
haya utilizado?

154 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


19. Un sistema está compuesto por 3 componentes que operan de manera inde-
pendiente. Para que el sistema funcione, al menos dos de los componentes
deben funcionar. Suponiendo que la confiabilidad del componente 1 es 0.95,
la del componente 2 es 0.9 y la del componente 3 es 0.8
a. ¿Cuál es la probabilidad de que el sistema funcione?
b. Sabiendo que el sistema funciona, ¿cuál es la probabilidad de que exac-
tamente dos componentes funcionen?
c. Dado que el componente 1 funciona, ¿cuál es la probabilidad de que el
sistema funcione?

20. En el sistema de cómputo de una gran empresa pueden ocurrir fallas de


tres tipos: de hardware, de software o eléctricas (alimentación). Nunca se
presenta más de una falla en un día. Cuando se presentan problemas de
hardware, se debe suspender el servicio con probabilidad de 0.73. Cuando
ocurren problemas con el software, se suspende el servicio con probabilidad
de 0.12. Cuando se presentan fallas eléctricas, la probabilidad de suspender
el servicio es de 0.8. Históricamente, los ingenieros de mantenimiento han
observado que una falla de software es cinco veces más probable que un
problema de hardware y 2.5 veces más frecuente que una falla eléctrica.
a. ¿Cuál es la probabilidad de que el sistema no suspenda su servicio
en un día?
b. Si el sistema ha dejado de prestar su servicio, ¿cuál es la causa más pro-
bable de suspensión?

21. Al poner a la venta un producto, el administrador responsable ha determi-


nado que solo puede presentarse una de las siguientes cuatro situaciones
de la demanda: muy desfavorable, desfavorable, favorable y óptima. Tam-
bién ha calculado las probabilidades siguientes:
• 1/8 de que la demanda sea muy desfavorable.
• 1/9 de que la demanda sea muy desfavorable y no se logre los resultados
deseados.
• 1/4 de que la demanda sea desfavorable.
• 0,15 de que la demanda sea desfavorable y se logre los resultados deseados.
• 1/4 de que la demanda sea favorable.
• 0,18 de que la demanda sea favorable y se logre los resultados deseados.
• 0,1 de que la demanda sea óptima y no se logre los resultados deseados.
a. Halle la probabilidad de que se logre los resultados deseados sabiendo
que la demanda fue óptima.
b. Si no se logró los resultados deseados, ¿cuál es la probabilidad de que la
demanda sea desfavorable o muy desfavorable?

Capítulo 2. Probabilidad 155


Capítulo

3 Variable aleatoria
Sabes
La variable aleatoria resume en un núme- Capacidades adquiridas
ro la información que contiene el resultado 9 Calcular medidas de posición y de
de un experimento aleatorio, lo que permi- dispersión.
te su análisis y posterior modelamiento. 9 Conocer las propiedades y los teore-
En la práctica, las variables aleatorias se mas acerca de las probabilidades.
ajustan a ciertos modelos probabilísticos
9 Graficar una función matemática.
en los cuales nos basamos para realizar
inferencias estadísticas que utilizan datos 9 Calcular la derivada y la integral de
obtenidos de una muestra aleatoria y es una función.
necesario aproximar una distribución de
probabilidad.
Piensas
Competencias por lograr
9 Definir una variable aleatoria y cons-
truir su función de probabilidad.
Conocimientos previos 9 Verificar las propiedades que debe
Estadística básica, teoría de conjuntos, tener una función de probabilidad de
funciones matemáticas, probabilidades. una variable aleatoria.
9 Construir la función de probabilidad
acumulativa.
9 Calcular la esperanza matemática y
la varianza de una variable aleatoria.
9 Interpretar apropiadamente la E(X),
Secciones V(X) y CV(X) de una variable aleatoria.

1. Definición.
2. Tipos de variables aleatorias Haces
3. Esperanza matemática y varianza
Habilidades por desarrollar
de una variable aleatoria
9 Identificar las características de un
4. Interpretación de la E(X), V(X) y
experimento aleatorio.
CV(X)
9 Escoger el modelo probabilístico
adecuado para resolver un problema
real.
1. Definición

Una variable aleatoria es una función cuyo dominio es el espacio muestral Ω


asociado a un experimento aleatorio ε , y su rango pertenece a los números rea-
les. Se denota comúnmente por las letras X, Y, W, etc. La variable aleatoria tiene
como objetivo transformar un conjunto no siempre numérico (Ω), en un con-
junto siempre numérico; es decir, asigna un número real a cada elemento del
espacio muestral. Esquemáticamente se representa en la figura 1.

Ω Rx ∈ �

w1 X(w1) = x1
w2 X(w2) = x2

Figura 1. Represen-
tación gráfica de una
wn X(wn) = xn
variable aleatoria.

Ejemplo 1
Supóngase que el experimento (ε), consiste en escoger tres artículos al azar
de un proceso de producción y se analiza la calidad de cada uno de ellos,
donde b: bueno y d: defectuoso.

a. Determine el espacio muestral.


Solución
El espacio muestral es:
Ω ={bbb, bbd, bdb, dbb, bdd, dbd, ddb, ddd}

Capítulo 3. Variable aleatoria 159


b. Sea la variable aleatoria X: número de artículos defectuosos. Determine
el rango (valores) de X.
Solución
Los valores que toma X son:
X = {0, 1, 2, 3}. En efecto:
X(bbb) = 0; X(bdb) = X(dbb) = X (bbd) = 1; X (bdd) = X (dbd) = X (ddb) = 2;
X (ddd) = 3

Ejemplo 2
ABC es una empresa importadora de laptops de última generación. Para su
campaña universitaria compra 10 laptops exclusivas en tamaño y presenta-
ción. Después de 3 meses de exposición, la laptop queda desactualizada. Sea
la variable aleatoria X: número de laptops vendidas en el trimestre. Determine
el rango de X.
Solución
Los valores de la variable aleatoria X son:
X = {0, 1, 2, 3, 3, 4, 5, 6, 7 , 8, 9, 10}.

Ejemplo 3
Una empresa textil dispone de seis máquinas bordadoras computarizadas.
Sea X la variable aleatoria que representa al número de máquinas bordadoras
en uso en un momento específico de la jornada productiva. Determine los
valores (rango) de la variable X.
Solución
Los valores de la variable aleatoria X son:
X = {0, 1, 2, 3, 3, 4, 5, 6}.

Ejemplo 4
Suponga que la variable aleatoria X es el tiempo que demora un alumno en
responder un examen que tiene un tiempo máximo de 90 minutos de dura-
ción. Determine el rango de X.
Solución
Los valores que toma X son:
RX = {x / 0 < x ≤ 90} minutos.

160 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


2. Tipos de variables aleatorias

Una variable aleatoria puede ser discreta o continua.

2.1 Variable aleatoria discreta

2.1.1 Definición

Una variable aleatoria X es discreta si sus valores constituyen un conjunto conta-


ble o numerable; tales como los presentados en los ejemplos 1, 2 y 3. El conjunto
contable puede ser finito o infinito.

2.1.2 Función de probabilidad de una variable aleatoria discreta

Sea ε un experimento aleatorio y Ω su espacio muestral. Sea X una variable


aleatoria discreta definida en Ω y Rx su rango. Se denominará “función de pro-
babilidad” a la función P definida en el rango de X, tal que:
P : Rx → [0, 1] y que satisface las siguientes condiciones:
i) 0 ≤ p(xi) ≤ 1 ∀ xi ∈ RX.

ii) ∑ p( xi ) = 1
∀ xi ∈ RX

Nota.
1. p(xi) representa la probabilidad de que la variable aleatoria X tome el valor
de xi; es decir:
p(xi) = P(X = xi).

2. La función de probabilidad de una variable aleatoria discreta también es


llamada “función de cuantía de la variable aleatoria X”.
3. En la práctica, una función de probabilidad de una variable aleatoria
discreta se puede representar de dos maneras:
a. Utilizando una tabla cuyo formato se puede representar de la siguiente
manera:
xi x1 x2 x3 … xn …. Total

P(X = xi) p(x1) p(x2) p(x3) … p(xn) …. 1

b. Utilizando una fórmula matemática que toma la siguiente forma:


Dominio: Se especifican los valo-
P(X = xi) = p(xi) = Expresión matemática; res de X para los cuales es válida la
expresión matemática.

Capítulo 3. Variable aleatoria 161


Ejemplo 5
Una variable X tiene la siguiente función de probabilidad:

x 1 2 3 4 Total

P(X = x) 0.30 C C/2 C/4 1

a. Hallar el valor de la constante C


Solución
Para hallar el valor de la constante C se usa la segunda condición de la
definición. En efecto: ∑ p( xi ) = 1
∀X ∈R i X

Por lo tanto: p(1) + p( 2) + p(3) + p( 4) = 1 ⇒ 0.3 + C + C/ 2 + C/ 4 = 1, de


donde: C = 0.4.

b. Calcular:
i. P( X < 2), ii. P( 2 < X ≤ 4), iii. P( X ≤ 3 / X > 1)
Solución
i. P( X < 2) = P( X =1) = 0.30.
ii. P( 2 < X ≤ 4) = P( X = 3) + P( X = 4) = 0.20 + 0.10 = 0.30
P(1 < X ≤ 3) 0.60
iii. P( X ≤ 3 / X > 1=
) = = 0.857143.
P( X > 1) 0.70

Ejemplo 6
Una pizzería tiene cinco líneas telefónicas. Sea X la variable aleatoria que
representa al número de líneas en uso en un momento específico.
Supóngase que la función de probabilidad de X está dada en la
siguiente tabla:

x 0 1 2 3 4 5 Total
p(x) 0.05 0.15 0.20 0.15 0.25 0.20 1

Calcule la probabilidad de cada uno de los siguientes eventos:


a. A = “a lo sumo 2 líneas están en uso”
b. B = “menos de 4 líneas están en uso”
c. C = “por lo menos 3 líneas están en uso”
d. D = “entre 2 y 4 (inclusive) líneas están en uso”
e. E = “entre 2 y 5 (inclusive) líneas no están en uso”
f. F = “por lo menos 3 líneas no están en uso”

162 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Solución
Sea la variable aleatoria X: número de líneas en uso en un momento es­pecífico,
entonces:
a. P( A) =
P( X ≤ 2) =
P( X =+
0) P( X =+
1) P( X =
2) =
0.05 + 0.15 + 0.20 =
0.40.
b. P( B) = P( X < 4) = P( X ≤ 3) = P( X = 0) + P( X = 1) + P( X = 2) + P( X = 3) = 0.55.
c. P(C ) =P( X ≥ 3) =P( X =
3) + P( X =4) + P( X =
5) =
0.60.
d. P( D) =P( 2 ≤ X ≤ 4) =P( X =2) + P( X =
3) + P( X =4) =
0.60.
e. Sea Y : número de líneas que no están en uso; entonces:
P( E)= P( 2 ≤ Y ≤ 5)= P(0 ≤ X ≤ 3)= 0.55.
f. P( E)= P(Y ≥ 3)= P( X ≤ 2)= 0.40.

Nota. Para responder a los incisos e) y f) se usó el criterio del evento comple-
mentario. Otra manera de responder a las preguntas sería construyendo la
función de probabilidad de Y , para luego en base a ella calcular las probabi-
lidades pedidas.

Ejemplo 7
La Facultad de Ingeniería acaba de recibir 5 módulos tecnológicos para fines
de enseñanza. Se dispone de 3 ambientes para colocarlos (hay la posibilidad de
que más de 1 módulo se coloque en un mismo ambiente). Construir la función
de probabilidad de la variable aleatoria, X: Número de ambientes elegidos para
colocar los 5 módulos.

Solución
Como se define X: número de ambientes elegidos para colocar los 5 módulos,
los valores que toma X son: 1, 2 y 3.
Se determina el número de casos posibles: n(Ω) =3 × 3 × 3 × 3 × 3 = 243
Luego, se calcula la probabilidad para cada valor que toma X:
i. Seleccionar a 1 de 3 ambientes, y luego seleccionar a 5 de los 5 módulos.
 3  5 
  
= 1)=   =
1 5 3
P( X
243 243
ii. Seleccionar a 2 de 3 ambientes, y luego seleccionar a:
– 1 de los 5 módulos para el primer ambiente y a 4 de los 4 módulos
restantes para el segundo ambiente, o
– 2 de los 5 módulos para el primer ambiente y a 3 de los 3 módulos
restantes para el segundo ambiente, o así sucesivamente.
 3  5  4   5  3   5  2   5  1 
    +  
    +  
  +  
  
P( X= 2=)
 2  1  4   2  3   3  2   4 1  = 3(5 + 10 + 10 + 5) = 90
243 243 243

Capítulo 3. Variable aleatoria 163


iii. Seleccionar a 3 de 3 ambientes, y luego seleccionar a:
– 1 de los 5 módulos para el primer ambiente y a 1 de los 4 módulos res-
tantes para el segundo ambiente, y a 3 de los 3 módulos restantes para
el tercer ambiente, o
– 1 de los 5 módulos para el primer ambiente y a 2 de los 4 módulos res-
tantes para el segundo ambiente, y a 2 de los 2 módulos restantes para
el tercer ambiente, o así sucesivamente.

 3   5  4  3   5  4  2   5  4  1  5  3  2   5  3  1  5  2  1 
      +     +     +     +     +     
 3   1  1  3   1  2  2   1  3  1  2  1  2   2  2 1  3  1  1 
P( X= 3=
)
243

1 (5)( 4)(1) + (5)(6)(1) + (5)( 4)(1) + (10)(3)(1) + (10)(3)(1) + (10)( 2)(1) 


P( X= 3=
)
243
20 + 30 + 20 + 30 + 30 + 20 150
P( X= 3=) =
243 243

Por lo tanto, la función de probabilidad de X es:

x 1 2 3 Total
3 90 150
P( X = x) 1
243 243 243

2.1.3 Función de distribución

Es la función de probabilidad acumulada (menor o igual que).


Sea X una variable aleatoria discreta con función de probabilidad p(x), se de-
fine a la función de distribución F, como:
F : � → � tal que:

F( x)= P (X ≤ x)= ∑ p( x)
X≤x

Ejemplo 8
Sea X una variable aleatoria cuya función de probabilidad es:

x 1 2 3 4 5 Total
p(x) 0.05 0.25 0.30 0.25 0.15 1

164 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


a. Grafique la función de probabilidad
Solución
La gráfica de la función de cuantía es un diagrama de bastones, que se
presenta en la figura 2.

Figura 2. Función de
probabilidad (cuantía).

b. Construya la función de distribución


Solución
Para calcular la función de distribución se usa la definición, es decir:

F( x)= P ( X ≤ x)= ∑ p( x).


X ≤x

Por ejemplo:
F( −=
1) P( X ≤ −1) = 0; F=
(0) P( X ≤=
0) 0; F(0.9999) = P( X ≤ 0.9999) = 0; lo
que se puede sintetizar y decir que F(X) = 0, si X < 1. Análogamente: F(1) =
F(1=
) P( X ≤ 1=
) 0.05; F(1.5=
) P( X ≤ 1.5=
) P( X ≤ 1=
) 0.05; F(1.99) = P( X ≤ 1.99) =
0.05; de lo cual se tiene que: F( x) = 0.05, si 1 ≤ X < 2.
P( X ≤ 1) =
P( X ≤ 1.99) =
Finalmente, la función de distribución es:

0.00, x <1
0.05, 1 ≤ x < 2

0.30, 2 ≤ x < 3
F ( x=) P ( X ≤ x=) 
0.60, 3 ≤ x < 4
0.85, 4 ≤ x < 5

1.00, x≥5

c. Grafique la función de distribución


Solución
La gráfica de la función de distribución se presenta en la figura 3.

Capítulo 3. Variable aleatoria 165


Figura 3. Función
de distribución.

Ejemplo 9
Una tienda de electrodomésticos ofrece a sus clientes diferentes opciones pa-
ra el pago de sus cuotas. Para un cliente seleccionado al azar, sea X, la varia-
ble aleatoria que representa al número de meses para el pago de las cuotas. Si
la función de probabilidad acumulada (distribución) está dada por:

0.00, x <1
0.39, 1 ≤ x < 4

0.53, 4 ≤ x < 6
F ( x)= P ( X ≤ x)= 
0.69, 6 ≤ x < 8
0.80, 8 ≤ x <12

1.00, x ≥ 12

a. Construir la función de cuantía (probabilidad) de X.


Solución
Considerando que: P(X = x) = F(x) – F(x – 1), la función de probabilidad es:

x 1 4 6 8 12 Total
p(x) 0.39 0.14 0.16 0.11 0.20 1

b. Calcule la probabilidad de que el número de meses elegidos para el pago


de las cuotas sea estrictamente mayor que 4, pero menor o igual que 12.
Solución
P( 4 < X ≤ 12)= P( X= 6) + P( X =
8) + P( X =
12) =
0.16 + 0.11 + 0.20 =
0.47.
c. Calcule la probabilidad de que el número de meses elegidos para el pago
de las cuotas sea estrictamente menor que 4 o mayor o igual que 8.
Solución
P( X < 4) + P( X ≥ 8) =
P( X =+
1) P( X =+
8) P( X =
12) =
0.39 + 0.11 + 0.20 =
0.70.

166 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


d. Utilice valores F(x) para calcular la probabilidad de que el número de me-
ses elegidos para el pago de las cuotas se encuentre entre 4 y 8 meses (am-
bos inclusive).
Solución
P( 4 ≤=
X ≤ 8) F(8)=
– F(1) 0.80=
– 0.39 0.41.

2.2 Variable aleatoria continua

2.2.1 Definición

Una variable aleatoria X es continua si sus valores pertenecen a los números


reales. Puede ser un intervalo, una unión de intervalos o todos los reales; tal
es el caso del ejemplo 4 (tiempo de demora en responder un examen), donde
RX ={ x / 0 < x ≤ 90} minutos.

2.2.2 Función de densidad de probabilidad de una variable aleatoria continua

Sea X una variable aleatoria continua. Se llama función de densidad de pro­


babilidad a la función:
f : � → � y satisface las siguientes condiciones:
i) f ( x) ≥ 0 , ∀x ∈ � .

ii) ∫ f ( x) dx = 1
−∞

Nota
1. f ( x) no representa un valor de probabilidad, es la ordenada para un valor
de x, y puede tomar un valor mayor a la unidad.
2. La gráfica de la función f ( x) siempre debe estar encima del eje X.
3. A diferencia del caso discreto, donde un evento puede ser un valor parti-
cular que tome X, en el caso continuo, un evento debe ser necesariamente
un intervalo.
4. Sea el evento A, tal que ocurre cuando la variable X ∈ 〈 a , b〉 , entonces:
b
P( A)
= f ( x) dx
∫= ∫ f ( x) dx. La probabilidad de un evento, en este caso,
A a
constituye el área bajo la curva de la función f ( x), su representación
gráfica se muestra en la figura 4.

Capítulo 3. Variable aleatoria 167


Figura 4. Representación
gráfica de la probabilidad
del evento A.

Ejemplo 10

Según el RENIEC, una persona debe esperar como máximo una hora para
obtener el duplicado de su documento nacional de identidad (DNI), siendo
este tiempo una variable continua con la siguiente función de densidad:

c(1 − x ), 0 ≤ x ≤ 1
3
f ( x) = 
 0,
 otro caso

a. Hallar el valor de la constante c


Solución
Para hallar el valor de la constante c, se utilizará la segunda condición de
la definición, es decir:

∫ f ( x)dx = 1. En efecto:
−∞
1
1  x4  4
1; de donde: c  x −
∫ c(1 − x )dx =
3
 = 1 ⇒ c= .
0  4 
0
3

b. Si un ciudadano ingresó a pedir su DNI a las 11 a.m., ¿cuál es la probabi-


lidad de que aún esté allí a las 11 y 45?
Solución
De 11:00 a.m. a 11:45 a.m. han transcurrido 45 minutos, es decir, tres cuar-
tos de hora (0.75 horas).
1
4 1
4 x4 
P( x ³ 0.75) = ∫ (1 − x3 )dx =  x −  = 0.105469.
0.75 3 3  4 
0.75

168 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Ejemplo 11
El ingreso diario que tienen las tiendas que comercializan juguetes en las ga-
lerías del centro de la ciudad, en el mes de diciembre, es una variable aleatoria,
expresada en miles de soles, cuya función de densidad de probabilidad es la
siguiente:
 3x 3x 2
 − , 0<x<2
f ( x) =  2 4
 0, otro caso

a. Hallar la probabilidad de que en un día las tiendas tengan ingresos supe-


riores a 1000 soles
Solución
2
 3x 3x 2 
2  3x 2 x3 
P(1 < x ≤ 2 ) = ∫  −  dx =  −  = 0.50.

1  2 4   4 4 
1

b. Si el ingreso de una de las tiendas en un día es superior a 900 soles, ¿cuál es


la probabilidad de que no sobrepase los 1500 soles?
Solución
1.5 
3x 3x 2 
∫  −  dx
P(0.9 < X ≤ 1.5) 0.9  2 4  0.41850
P( X ≤ 1.5 / X > 0.=
9) = = = 0.7281.
P( X > 0.9) 2 
3x 3x 2  0.57475
∫  −  dx
0.9  2 4 

c. Si se sabe que hay 100 tiendas con ingresos inferiores a 800 soles. Determine
cuántas tiendas que comercializan juguetes tienen ingresos superiores a
800 nuevos soles.
Solución
Para calcular el número de tiendas que tienen ingresos mayores de 800
nuevos soles, se calcula primero el total de tiendas. Para ello, se usa la si-
guiente identidad:

100 → P(X < 0.8)


n → 1

0.8
0.8
 3x 3x 2   3x 2 x3 
Dónde: P( x < 0.8 ) = 
∫  −  dx =  −  = 0.352. Luego, se
0  2 4   4 4 
tiene: 0

100 → 0.352
n → 1
Entonces: n = 284 tiendas en total, por lo tanto, el número de tiendas que
tienen ingresos superiores a 800 soles es de 184.

Capítulo 3. Variable aleatoria 169


2.2.3 Función de probabilidad acumulativa (distribución)

Sea X una variable aleatoria continua con función de densidad de probabilidad


f ( x), se define a la función de distribución F como:
F : � → � tal que:
x
F( x)= P( X ≤ x)= ∫ f (t )dt
−∞

Nota.
Para calcular la probabilidad de un evento en el caso continuo (debe ser un inter-
valo) se pueden utilizar dos procedimientos:
1. Integrando la función de densidad de probabilidad en el intervalo donde
está definido el evento.
2. Utilizando la función de distribución en base a las siguientes identidades:
2.1 P( x < a) =
F ( a)
2.2 P( x > a) =
1 – F ( a)
2.3 P( a < x < b) =F ( b) – F ( a )

Figura 5. Relación gráfica


entre la función de densi-
dad de probabilidad y de
distribución.

Ejemplo 12
El departamento de marketing de una firma distribuidora de automóviles
considera que el tiempo, en años, que transcurre para la renovación de un
automóvil por parte de un cliente típico es una variable aleatoria que puede
representarse por la función:
 x2
 , 0<x<6
f ( x) =  72
 0, otro caso

a. Construya la función de distribución de X


Solución
Usando la definición de función de distribución se tiene:

170 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


x
x t2 t3 x3
F( x)= P( X ≤ x)= ∫ = dt = , de donde:
0 72 216 216
0

 0, x≤0
 3
 x
F( x)= P( X ≤ x)=  , 0<x<6
 216
 1, x≥6

b. ¿Cuál es la probabilidad de que un vehículo se renueve después de 4 años?
Solución
43
P( x < 4) =−
1 F ( 4) =1− =0.7037.
216
c. Suponiendo que han pasado más de tres años desde la compra del vehícu-
lo, ¿cuál es la probabilidad de tardar más de cinco años en renovarlo?
Solución
P( X > 5) 1 − F (5) 0.4213
Se solicita: P( X > 5 | X >=
3) = = = 0.4815
P( X > 3) 1 − F (3) 0.875

3. Esperanza matemática y varianza de una variable aleatoria

3.1 Esperanza matemática

3.1.1 Definición

Sea X una variable aleatoria con función de probabilidad p( x) o f ( x). A la espe-


ranza matemática de X denotada por E(X) o µ x se define por:


 ∀x ∑ xi p( xi ), si X es discreta
 i ∈ RX
E( X ) = µ = 

 x f ( x)dx , si X es continua
 ∫
 −∞

3.1.2 Propiedades
1. La esperanza matemática de una constante es la misma constante, es decir:
E(C ) = C.
E(C X ) C E( X ); C ≠ 0
2. =
3. E( X ± Y )= E( X ) ± E(Y )
4. Sea X una variable aleatoria discreta con función de cuantía p(x) y Y = G( X )
una función de X; entonces: E [G( X )] = ∑ G ( xi ) p( xi )
∀ xi ∈RX

Capítulo 3. Variable aleatoria 171


5. Sea X una variable aleatoria continua con función de densidad de probabi-

lidad f ( x) y Y = G( X ) una función de X; entonces: E [G( x)] = ∫ G( x) f ( x)dx
−∞

Ejemplo 13
La variable aleatoria X, definida como el número de refrigeradoras vendidas
por día en cierta casa comercial, tiene la siguiente función de probabilidad:

x 1 2 3 4 5 6
p(x) c c 1/8 1/8 2c 2c

a. Determine el valor de la constante c.


Solución
Usando la segunda condición de la definición se tiene:
6 2
∑ p( x) = 1.0 ⇒ 6c + = 1 de donde: c = .
1
x =1 8 8

b. Si se vendieron más de 2 refrigeradoras en un día, ¿cuál es la probabilidad


de que se hayan vendido menos de 5?
Solución
P(3 ≤ X ≤ 4) 2 / 8 1
P( X < 5|X > 2)= = =
P( X > 2) 6/8 3

c. Si la ganancia diaria de la casa comercial se encuentra representada por:


= Y 100X − 150 (en soles), hallar la ganancia esperada diaria de la casa
comercial.
Solución
Se halla primero la esperanza de X:
1 1 1
E( X )= 1  + 2   + . . . + 6  = 4
 
8 8 8

Como
= Y 100X − 150, entonces,
= E [Y ] 100=
E [ X ] – 150 100
= ( 4) – 150 250.
La casa comercial espera tener una ganancia diaria de 250 soles.

d. ¿Cuál es la probabilidad de que la ganancia de la casa comercial sea menor


que 250 soles?
Solución
3
P(Y < 250)= P(100X −150 < 250)= P( X < 4)= P( X ≤ 3)= = 0.375
8

172 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Ejemplo 14
Un inversionista está considerando tres estrategias para una inversión de
4000 dólares. Se estima que los posibles rendimientos son los siguientes:
• ESTRATEGIA 1: Una utilidad de 9000 dólares con probabilidad 0.35 y una
pérdida de 2000 dólares con probabilidad 0.65.
• ESTRATEGIA 2: Una utilidad de 5000 dólares con probabilidad de 0.60 y
una pérdida de 3000 dólares con probabilidad de 0.40.
• ESTRATEGIA 3: Una utilidad segura de 1800 dólares.
¿Cuál de las tres estrategias aconsejaría usted al inversionista?

Solución
Se debe calcular la ganancia esperada para cada estrategia para determinar
cuál estrategia es la mejor para invertir. En efecto, se define la variable G =
ganancia de la inversión, entonces:
la estrategia 1: E(G) 9000
• Para= = (0.35) – 2000(0.65) 1850 dólares
la estrategia 2: E(G) 50008
• Para = = (0.6) – 3000(0.4) 1800 dólares
• Para la estrategia 3 como la utilidad es segura, su ganancia esperada es de
1800 dólares.
Si solamente se considera el criterio de la mayor ganancia esperada,
entonces, el inversionista debería escoger la estrategia 1, pues su ganancia
esperada es mayor.

Ejemplo 15
C 3X + 5X 2 , sien-
El costo de un proyecto en miles de dólares está dado por =
do X el tiempo empleado en meses, que es una variable aleatoria que verifica:
E[( X – ½)2 ] 13
= =/ 4 , y E[( X – 1)2 ] 2

a. Determinar la media y la desviación estándar de X.


Solución
Utilizando los datos se tiene:
E[( X – 1/ 2)2 ] = 13/ 4, entonces:

  1  1 1 13
E[( x − 1/ 2)2 ] E X 2 – 2X =
=  2  + 4 E( X ) −=
2
E( X ) + (1)
    4 4

Por otro lado, de:


E[( X – 1)2 ] = 2, se tiene:
E[( X − 1)=
2
] E[X 2 − 2X +=
1] E( X 2 ) − 2 E( X ) +
= 1 2 (2)
Operando se tiene:
E( X 2 ) − E( X ) =
3 (1)
E( X ) − 2E( X ) =
2
1 (2); de donde:
E( X 2 ) 5=
= y E( X ) 2.

Capítulo 3. Variable aleatoria 173


De lo cual se tiene que V=
( X ) E( X 2 ) – ( E(=
X ))2 5=
– 22 1, y por lo tanto
S( X ) = 1.
En conclusión, E( X ) = 2; y S( X ) = 1.

b. Calcular el costo esperado del proyecto.


Solución
E(C ) = E(3X + 5X 2 ) = 3E( X ) + 5E( X 2 ) = 3( 2) + 5(5) = 31.
Por lo tanto, el costo esperado del proyecto es de 31 000 dólares.

Ejemplo 16
Las pérdidas (en millones de soles) debido a incendios en una galería
comercial se pueden considerar una variable aleatoria X con función
de probabilidad:
c( 20 − x), 0 < x ≤ 20
f ( x) = 
 0, en otro caso

a. Determine el valor de la constante c y construya la función de distribución


de X.
Solución
Usando la segunda condición de la definición se tiene:
 20 
20
 20 x2 = 1
∫ c( 20 − x ) dx =
1 ⇒ c 20 x − 1 ⇒ c( 400 − 200) =
1 ⇒ c= .
0  0 2  200
 0 
Basándonos en la definición de la función de distribución:
x 1 x2
F ( x)
= ∫ − t ) dt 0.1x −
( 20= ; 0 < x ≤ 20
o 200 400

 0 , x≤0

 x2
De donde: F ( x=) P( X ≤ x )
=  0. 1 x − , 0 < x < 20
 200
 1 , x ≥ 20

b. Al producirse un incendio, ¿cuál es la probabilidad de que las pérdidas


superen los 8 millones de soles?
Solución

P( X >=
8) 1 – P( X ≤=
8) 1 – F=
(8) 1 – (0.80 – 0.=
32) 0.52

c. El administrador de una galería afirma que al producirse un incendio se


espera una pérdida de 10 millones de soles. ¿Encuentra usted exagerada
la afirmación del administrador de la galería? Justifique.

174 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Solución
Se calcula la esperanza de la pérdida:
 20 
201 1  20 x3  = 6.667
E( X ) = µ = ∫ x ( 20 − x) dx = 10 x 2 −
0 200 200  0 3 
 0 
La afirmación del administrador es exagerada, pues se espera una
pérdida de 6.667 millones de soles.

3.2 Varianza

3.2.1 Definición

Sea X una variable aleatoria con función de probabilidad p(x) o f ( x) y esperanza


matemática E(X) o µ x . Se define a la varianza por:


 ∑ ( xi − µ)2 p( xi ), Si X es discreta
 i
∀ x ∈ R X
V ( X ) =s2x = ∞
 ( x − µ)2 f ( x)dx , Si X es continua
 −∫∞

3.2.2 Propiedades

i. La varianza de una constante es cero, es decir: V(C) = 0.


ii. V ( X ) ≥ 0.
iii.
= V (CX ) C 2 V ( X ); C ≠ 0.
iv. V ( X ± Y=
) V ( X ) + V (Y ); (si X e Y son variables aleatorias independientes)
v. V ( X ) = E( X 2 ) – [ E( X )]2 , donde

 ∀x ∑ x 2 p( xi ), Si X es discreta
i
 i ∈RX
E( x 2 ) =  ∞
 x 2 f ( x)dx , Si X es continua
 −∫∞

Nota. En la práctica, se utiliza esta propiedad para calcular la varianza de una
variable aleatoria.

Ejemplo 17
Un concesionario compra 5 motos de alta cilindrada a un precio al por mayor
de 2.5 miles de soles cada moto, y las vende a 4.0 miles de soles. Después de

Capítulo 3. Variable aleatoria 175


un trimestre, debido al lanzamiento de otros modelos, las motos que no se
vendieron se devuelven al distribuidor recibiendo de éste las 4/5 partes del
precio de compra. Si la distribución de probabilidad de la variable aleatoria
X= número de motos que no se vendieron en el trimestre es:

x 0 1 2 3 4 5 Total

1 2 2 3 4 3
P(X = x) 1
15 15 15 15 15 15

a. Hallar la probabilidad de que se vendan menos de 3 motos.


Solución
X: número de motos que no se vendieron en el trimestre.
Se define la variable:
Y : número de motos vendidas en el trimestre, entonces: Y = 5 – X
Luego:
P(Y < 3) = P(5 – X < 3) = P( X > 2) = 10/15 = 2/ 3 = 0.667

b. Calcule la ganancia trimestral esperada y la desviación estándar del


número de motos vendidas.
Solución
Se calcula primero la esperanza y varianza de las motos que no se vendie-
ron en el trimestre:
E( X ) = 3.0667; V ( X ) = 2.3289 ⇒ sX = 1.526.
Ganancia esperada:
Se define la variable G: ganancia del concesionario, entonces:
G=
( 4 – 2.5)(5 – X ) + (( 4 / 5)( 2.5) – 2.5)X =
1.5(5 − X ) – 0.5X =
7.5 – 2X
Luego:
E
=(G) 7.5 – 2E
=( X ) 7.5 – 2(3.0667) ⇒ E
=(G) 1.367 miles de soles.

V
= (G) V (7.5 –=
2X ) 2 2 V
= ( X ) 4( 2.3289
= ) 9.3155 ⇒
= sG 3.052 miles de
soles.

c. ¿Cuál es la probabilidad de que la ganancia trimestral sea de, al menos,


3500 de soles?
Solución
5
P(G ≥ 3.5) = P(7.5 − 2X ≥ 3.5) = P( X ≤ 2) = = 0.333
15

Ejemplo 18
El pago, en miles de soles, que debe realizar una aseguradora por gastos mé-
dicos ambulatorios de un asegurado a una clínica es una variable aleatoria

176 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


con función de densidad de probabilidad:
 x( 4 − x)
 , 0<x<3
f ( x) =  9
 0 , otro caso

a. Construya la función de distribución acumulada de X.


Solución
Basándonos en la definición de la función de distribución se tiene:
x
1x 1  4t 2 t 3  2 x 2 x3
F( x) = ∫ t( 4 − t ) dt =  −  = − . Luego:
90 9  2 3  9 27
0

 0 , x≤0
 2
 2x x3
F( x) = P( X ≤ x ) =  − , 0<x<3
 9 27
 1 , x≥3

b. El gerente financiero de la aseguradora afirma que los pagos por este con-
cepto son muy heterogéneos, puesto que el coeficiente de variación supera
el 30 %. Verifique esta afirmación.
Solución
3
13 2 1 4 3 1 4
E( X )= ∫ x ( 4 − x) dx= x − x  = 1.75
90 9  3 4 0
3
13 1 1 
E( X ) = ∫ x3 ( 4 − x) dx =  x 4 − x5  = 3.6
2
90 9 5 0
0.5375
V ( X ) = 3.6 −1.752 = 0.5375 ⇒ C.V = ×100 = 41.89 %
1.75
Se verifica la afirmación dada por el gerente financiero.

c. Si 81 asegurados son atendidos de manera ambulatoria en la clínica, ¿en


cuántos casos se espera que el gasto no sea superior a 1000 soles?
Solución
Se calcula primero la probabilidad de que un asegurado atendido de ma-
nera ambulatoria tenga un gasto que no supere los 1000 soles:
2 ×12 13 5
P( X ≤ 1) = F(1) = − = = 0.1852
9 27 27
Por lo tanto, de 81 asegurados, se espera que en 81(0.1852) = 15 de ellos
el gasto no supere los 1000 soles.

Capítulo 3. Variable aleatoria 177


4. Interpretación de la esperanza matemática, varianza y coeficiente
de variación de una variable aleatoria

Los valores de esperanza matemática y la varianza de la variable aleatoria X son


las medidas de tendencia central y de dispersión de X, respectivamente. A la E(X)
y V(X) generalmente se les conoce como los parámetros de la distribución de pro-
babilidades de la variable aleatoria X; por lo tanto, E(X) y V(X) representan los va-
lores constantes que caracterizan a la población de los valores de X. Una segunda
interpretación es de tipo frecuentista que se aprecia, en el siguiente ejemplo.

Ejemplo 19
Tomando como base datos históricos, la distribución de las ventas diarias de
paquetes de un producto en una tienda es como sigue:

Número de paquetes vendidos (x) 10 11 12 13 14 Total


p(x) 0.2 0.4 0.2 0.1 0.1 1.0

Calcule e interprete el número esperado, la varianza y el coeficiente de


variación del número de paquetes vendidos.

Solución
Utilizando las fórmulas definidas anteriormente para su cálculo obtenemos:
1.45
E( X )= 11.5; V ( X )= 133.7 − 11.52 = 1.45; C.V = × 100= 10.471 %
11.5
El valor de E(X) = 11.5 se interpreta como sigue: si la tienda registrara las
ventas de los paquetes de un gran número de días, el promedio de estos valo-
res será un valor cercano a 11.5, es decir, E(X) = 11.5 es un valor de convergen-
cia si se registran las ventas de un número muy grande de días, dicho de otro
modo, en un grupo de días (muestra) el promedio puede ser mayor, mientras
que en otra muestra podrá ser menor, pero en general convergerán hacia 11.5.
Aunque E(X) recibe también el nombre de valor esperado, de ninguna ma-
nera debe entenderse como el valor esperado de las ventas que ocurren en
un día cualquiera. Nótese que esto es imposible desde que las ventas diarias
asumen valores diferentes de 11.5.
La V(X) = 1.45 no tiene una interpretación directa. En cambio, la desviación
estándar igual a 1.204 sí la tiene. El valor de la desviación estándar se puede
interpretar como la desviación promedio de los datos con respecto al valor
medio (11.5 paquetes).
Finalmente, el valor del coeficiente de variación: CV(X) = 10.471 %, indica
que las ventas diarias son moderadamente homogéneas. Por lo tanto, se pue-
de decir que existe regularidad en las ventas diarias.

178 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Ejemplo 20
Sea X una variable aleatoria que representa el peso de un líquido y su función
de densidad de probabilidad está dada por:
 x
 , 0 < x <5
f ( x ) =  25
 x - 5 , 5 < x <10
 25

Nota: f(x) representa una distribución triangular.


a. Construir la función de distribución de X.
Solución
Basándonos en la definición de la función de distribución:
x t x2
F ( x) = ∫ dt
= ; 0< x ≤ 5
o 25 50
5 t x t − 5 x2 x
F ( x) = ∫ dt + ∫ dt =1 + − ; 5 < x ≤ 10
o 25 5 25 50 5
5 t x t − 5 x2 x
F ( x) = ∫ dt + ∫ dt =1 + − ; 5 < x ≤10
o 25 5 25 50 5

 0 , x≤0

 x
2
, 0< x ≤ 5
 50
De donde: F ( x )= P ( X ≤ x ) = 
1 + x − x , 5 < x < 10
2

 50 5

 1 , x ≥ 10

b. Al pesar el líquido se comete un error a causa de ciertas inexactitudes en


el instrumento de medida. Hallar la probabilidad de que, para cualquier
medida en particular, el error sea superior al 1 % respecto al valor verda-
dero si el peso correcto es 5.
Solución
P( X ­ 5 > 0.01(5=
)) P( X < 4.95) + P( X > 5.05
=) F( 4.95) +1 − F(5.05)

4.952  
1 + 5.05 − 5.05  =
2
= +1− 0.9801
50  50 5 
 

Ejemplo 21
Sea la demanda anual de aceite lubricante (en miles de galones) una variable
aleatoria continua X con función de densidad dada por:
1
 , 2≤x≤4
f ( x) =  2
0 , otro caso

Capítulo 3. Variable aleatoria 179


a. ¿Cuál es la probabilidad que la demanda no sobrepase los 2750 galones?
Solución
2.75
2.75 1 x
P( X
= ≤ 2.75 ) ∫ dx=
=  0.375.
2 2  2 2

b. Calcule la demanda esperada y la desviación estándar


Solución
Usando la definición se tiene:
4 4
1  x2 
4 2 1  x3 
E( X ) =µ = ∫ x dx =   = 3 y=
E( X 2 ) ∫=x dx   = 9.333
2
2 2   2
4 o 2  6  2
V ( X ) = s2 = 9.333 − 32 = 0.3333 ⇒ s = 0.5773

c. Hallar: P(µ x − s x ≤ X ≤ µ x + s x )
Solución
Reemplazando los valores de la media y la desviación estándar se tiene:
3.5772
3.5772 1 x
P( µ − s ≤ X ≤=
µ − s) P( 2.4227 ≤ X ≤=
3.5772 ) = ∫ dx =
2 0.57725.
2.4227 2   2.4227

d. Por cada millar de galones vendidos se obtiene una utilidad de 300 dó-
lares, mientras que cada millar no vendido produce una pérdida de 100
dólares. Un fabricante decide producir este tipo de aceite para todo un
año, ¿cuál debe ser la producción óptima que logre maximizar su utilidad
esperada?
Solución
X: demanda anual de aceite lubricante (en miles de galones) y tiene por
función de densidad de probabilidad:
1
 2≤x≤4
f ( x) =  2
0 otro caso

Se define:
k = la cantidad a producir en el año (en miles de galones)
La variable aleatoria:
U = Utilidad del fabricante
La utilidad depende de la cantidad vendida, de acuerdo a la demanda,
y se define como:
300 x −100 ( k − x ) , x ≤ k
U ( x) =  , de donde:
 300 k , x>k

180 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


 400 x − 100 k x≤k
U ( x) = 
300k x>k

El valor de k que maximiza la utilidad esperada se obtiene de:


d( E [ U ( x)])
= 0
dk
Se halla primero la esperanza de la utilidad, en efecto:
k 1 4 1
E(U ) = ∫ u( x) f ( x) dx =
∫ ( 400 x − 100 k )   dx + ∫ 300 k   dx =
∀∈ Rx 2 2 k 2
k
= 100x 2 − 50kx  + 150kx  k = − 100k 2 + 700k − 400
4
 2

Por lo tanto: E(U ) =


−100 k 2 + 700 k − 400
Ahora:
d( E [ U ( x)]) d( − 100k 2 + 700k − 400 )
=
0⇒ 0; de donde:
=
dk dk
−200k + 700 = 0 ⇒ k = 3.5
Por lo tanto, deberían producirse 3500 galones para maximizar la uti-
lidad esperada.

1. Problemas resueltos

1. Identifique las siguientes variables como discretas o continuas:


a. El valor estimado (en dólares) de un departamento para vivienda.
b. El número de practicantes en los estudios contables.
c. El tiempo que se necesita para realizar un trabajo de auditoría.
d. El número de clientes que entran a un restaurante en un día.
e. La vida útil de una computadora.
Solución
a. Continua b. Discreta c. Continua d. Discreta e. Continua

2. Determine el valor de la constante c de modo que cada una de las siguientes


funciones represente una función de probabilidad de una variable aleatoria
discreta X.
a. p=
( x) c( x 2 + 4) , para x = 0, 2, 3.
Solución
Para hallar el valor de la constante c se usa la segunda condición de la
definición, es decir:

Capítulo 3. Variable aleatoria 181


3 1
∑ p ( x ) = 1.0 ⇒ 4c + 8c + 13c = 1 de donde : c = y la función de
i =1 i 25
probabilidad es:

X 0 2 3 Total
P(x) 0.16 0.32 0.52 1

Nota. Se usó la definición de la función:


p(0) = P( X = 0) = c(02 + 4) = 4c
p( 2) = P( X = 2) = c( 22 + 4) = 8c
p(3) = P( X = 3) = c(32 + 4) = 13c

 3  4 
=b. P ( x) c=
   ; para x 0 , 1, 2
 x  4 − x 
Solución
Usando la segunda condición de la definición se tiene:
3 1
∑ p ( x)= 1.0 ⇒ c + 12c + 18c= 1 de donde : c= y la función de pro-
x =1 31
babilidad es:

X 0 1 2 Total
P(x) 0.0323 0.3871 0.5806 1

Nota. Se usó la definición de la función:


 3  4   3  4   3  4 
P (0) c=
=    = c ; P (1) c=
   12= c; P ( 2) c=
   18c
 0  4   1  3   2  2 

3. Una caja contiene 7 fichas, de las cuales 3 son rojas y 4 son azules. Se selec-
cionan al azar y sin reemplazo 2 fichas. Si las fichas son del mismo color se
obtiene una utilidad de $ 2, en caso contrario, se pierde $ 1.

a. Construir la función de probabilidad de la variable aleatoria X: Ganan-


cia en el juego
Solución
La variable es X: ganancia en el juego y los valores que toma son –1 y 2.
3 2 4 3 3
P( X = 2) = P( R  R ) + P( A  A ) = × + × =
1 2 1 2 7 6 7 6 7
3 4
P( X = −1) =−1 =
7 7

182 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


La función de probabilidad de X es:
X –1 2 Total
P(X = x) 4/7 3/7 1

b. ¿Cuál es la ganancia esperada?


Solución
4 3 2
E( X ) =
− 1  + 2  =
7 7 7

4. Un embarque de 8 computadoras contiene 3 defectuosas. Aleatoriamente,


4 de estas computadoras son colocadas en una oficina. Si X es el número de
computadoras defectuosas que se coloca en la oficina:
a. Construya la función de probabilidad de X.
Solución
Como se define X: número de computadoras defectuosas colocadas; los
valores que toma son: 0, 1, 2 y 3.
8
Se determina el número de casos posibles: n(Ω= )  =  70
 4
Luego, se calcula la probabilidad para cada valor que toma X:
 3  5 
  
 0 
 4  5
P( x= 0=
) = ;
70 70
 3  5 
  
1  3  30
)    =
P( x= 1=
70 70
 3  5 
  
)   =
2 2 30
P( =
x 2= ;
70 70
 3  5 
  
)   =
3 1 5
P( x= 3=
70 70
Por lo tanto, la función de probabilidad de X es:
x 0 1 2 3 Total
P(X = x) 5/70 30/70 30/70 5/70 1

b. Hallar la probabilidad de que se haya colocado una computadora defec-


tuosa sabiendo que se colocó a lo más una con defectos.
Solución
P( X =1) 30 / 70 6
P( X= 1 / X ≤1)= = =
P( X ≤1) 35 / 70 7

Capítulo 3. Variable aleatoria 183


c. El tiempo T que toma realizar un trabajo es una variable que viene expre-
sada por T= 8 + 0.5X , calcular la desviación estándar de la variable T
Solución
Primero, se calcula las características de la variable aleatoria X:
E( X ) 105
= = / 70 1.5
E( X 2 ) = 195 / 70 = 2.7857
V ( X ) = 0.5357

Luego: V (T ) =V (8 + 0.5X ) =0.52 V ( X ) =0.52 (0.5357) =0.1339


La desviación estándar de T es: 0.3659

5. Para la señalización de emergencia de un hospital se ha instalado dos in-


dicadores que funcionan independientemente. La probabilidad de que el
indicador A se accione durante la avería es de 0.90, mientras que para el
indicador B, la probabilidad es de 0.88.

a. Determinar la probabilidad de que durante una avería se accione solo


un indicador.
Solución
P(Acciona sólo un indicador) =
P( A  B) + P( A  B) = 0.90 × 0.12 + 0.10 × 0.88 = 0.196

b. Si se sabe que durante una avería no se accionó el indicador A, ¿cuál es


la probabilidad de que tampoco se haya accionado el indicador B?
Solución
Nos piden: ( B /= ( B) 0.12 , debido a que los eventos son inde-
A) P=
pendientes.

c. Un experto en seguridad afirma que cuando un indicador no se acciona


es porque está fallado y por lo tanto el costo de su reparación es de $ 85.
Si C denota el costo de reparación cuando se han instalado los dos indi-
cadores, halle el costo esperado.
Solución
Sea Y : el número de indicadores defectuosos
Los valores que toma Y = {0, 1, 2}
P(Y =0 ) =P( A  B) =0.90 × 0.88 =0.792
P(Y = P( A  B) + P( A  B) =
1) = 0.196
P(Y =2) =P( A  B) =0.10 × 0.12 =0.012

184 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


La función de probabilidad de Y es:
Y 0 1 2
P(Y = y) 0.792 0.196 0.012

Como se define C: Costo de reparación cuando se han instalado los


dos indicadores,
Entonces: C = 85Y y aplicando propiedades de valor esperado:
E(C ) 85
= = E(Y ) 85=
(0.22) 18.7 dólares

6. El gerente de COMPUDATA indica que el número de computadoras portá-


tiles (notebooks) que vende por día es una variable aleatoria X con función
de distribución acumulada dada por:
 0 , x<2

0.05 , 2 ≤ x<3
0.20 , 3≤ x < 4

F( x) = 0.48 , 4≤ x<5
0.72 , 5 ≤x<6

0.92 , 6≤ x<7

1 , x≥7

a. Construya la función de cuantía (probabilidad) de X.


Solución
Usando que: P( X
= x=
) F( x) – F( x ­ 1), se tiene:

x 2 3 4 5 6 7 Total

p(x) 0.05 0.15 0.28 0.24 0.20 0.08 1

b. Si en un día vende más de 2 notebooks, ¿cuál es la probabilidad de que


venda menos de 7?
Solución
P(3 ≤ X ≤ 6) 0.87
P( X < 7 / X > 2=
) = = 0.9157
P( X > 2) 0.95

c. Si por cada notebook vendida, COMPUDATA gana 300 soles, hallar el


valor esperado y la desviación estándar de la ganancia.
Solución
Se define la variable, G = ganancia de la empresa; entonces: G = 300X
=E( X ) 4=
.63, E( X 2 ) 23.15
V ( X ) =23.15 − ( 4.63)2 =1.7131,
s = 1.3088

Capítulo 3. Variable aleatoria 185


Luego:
E(G) 300
= = E( X ) 300
= ( 4.63) 1389
= (1.3088) 392.64
sY 300=

d. Si se observan las ventas de 3 días considerándolas como eventos inde-


pendientes, hallar la probabilidad de que en sólo uno de ellos se haya
vendido menos de 4 notebooks.
Solución
Se define los eventos Ai = {en el día i se vendieron menos de 4 notebook},
P( Ai ) = 0.20.
B = {solo en un día se vendieron menos de 4 notebook}
Nos piden:
= P ( B) 3 P=
( A A A ) 3=
(0.20)(0.80)2 0.384
i i i

7. Una fábrica tiene dos líneas de producción que trabajan en forma inde-
pendiente. Según estudios realizados, la probabilidad de que, en un día, la
línea de producción 1 tenga problemas en su funcionamiento es de 0.1;
mientras que, para la línea de producción 2, la probabilidad correspon­
diente es de 0.05.
a. Si se selecciona al azar un día, construya la función de probabilidad y la
función de distribución de la variable aleatoria X: Número de líneas de
producción que tuvieron problemas en su funcionamiento en dicho día.
Solución
Como la variable aleatoria se define por:
X = Número de líneas de producción que tuvieron problemas en su fun-
cionamiento en dicho día; entonces, los valores que toma la variable X
son: 0, 1 y 2. Se conoce que:

.10, P( F2 ) 0.05 , entonces:


P( F1 ) 0=
=
P( X =0) =P( F1  F2 ) =0.9 × 0.95 =0.855

P( X =1) =P( F1  F2 ) + P( F1  F2 ) =0.1 × 0.95 + 0.9 × 0.05 =0.14

P( X =2) =P( F1  F2 ) =0.1 × 0.05 =0.005

Por lo tanto, la función de probabilidad es:


x 0 1 2 Total
p(x) 0.855 0.14 0.005 1.00

La función de distribución es:


 0.0 x<0

 0.855 0 ≤ x < 1
F ( x) = 
 0.995 1 ≤ x < 2
 1.0 x≥ 2

186 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


b. Suponga que la pérdida económica, en un día, por problemas en las
líneas de producción (en miles de soles), está definida por = Y 5X + 2 .
Determine los valores de la media y el coeficiente de variación de la dis-
tribución de Y. Interprete sus resultados.
Solución
Se calcula primero, la esperanza y varianza de X.
E( X ) = 0 × 0.855 + 1 × 0.14 + 2 × 0.005 = 0.15
E( X 2 ) = 02 × 0.855 + 12 × 0.14 + 22 × 0.005 = 0.16

V ( X ) =0.16 − 0.152 =0.1375.

Y 5X + 2; entonces:
Luego, como =
E(Y ) = 5E[X ] + 2 = 5 × 0.15 + 2 = 2.75

V (Y ) = 52 V [X ] = 52 × 0.1375 = 3.4375; sY = 1.854

1.854
Luego: C.V (Y )= × 100= 67.418 %
2.75

8. Computadoras América S. A. es una empresa importadora de laptops de


última generación. Para su campaña universitaria, compra 5 laptops al pre-
cio unitario de 1200 dólares y las vende a 1700 dólares la unidad. Después
de 1 mes de exposición, las laptops que no se hayan vendido tienen que ser
retiradas del mercado y devueltas al distribuidor, quien entrega a Compu-
tadoras América S.A. una cantidad igual a 80 % del precio unitario al que
se le vendió. Se ha demostrado mediante una investigación de mercado que
la tabla de la función de probabilidad de X: número de laptops vendidas es
la siguiente:
X 0 1 2 3 4 5
P(X = x) 0.05 0.15 0.05 0.20 0.30 0.25

Calcular e interpretar el valor esperado y el coeficiente de variabilidad


para la utilidad neta de la empresa por la venta de las laptops.
Solución
Se define la variable Y = utilidad por la venta, entonces:
Y= 500 X − 240(5 − X ) ⇒ Y= 740X − 1200
Se calcula primero la esperanza y varianza de X. En efecto:
E( X ) =
0 × 0.05 + 1 × 0.15 + (...) + 5 × 0.25 =
3.3
E( X 2 ) = 13.2
V ( X ) = 13.2 − 3.32 = 2.31. Luego:
E(Y ) =
740E( X ) – 1200 =
740 × 3.3 – 1200 =
1242 dólares
V=
(Y ) V (740X − 1200
= ) 7402 × 2=
.31 1 264 956 =s 1 124.7

Capítulo 3. Variable aleatoria 187


Por lo tanto:
1124.7
C.V (Y=
) × 100= 90.56 %
1242

9. Una persona desea invertir en una de dos carteras de inversión: A o B. Ella


estima que las probabilidades y los rendimientos monetarios para un año
de cada cartera, considerando las condiciones económicas del país, serían
como se muestran en las siguientes tablas.

Cartera A Cartera B
Condición
Rendimiento Rendimiento
económica Probabilidad Probabilidad
monetario monetario
Recesión –300 0.2 –500 0.1
Estabilidad 500 0.3 400 0.4
Crecimiento
1000 0.4 1200 0.3
moderado
Auge repentino 2000 0.1 2800 0.2

a. ¿En cuál de las dos carteras esperaría un mejor rendimiento monetario?


Solución
Se debe calcular el valor esperado en caso. En efecto:
E(Rendimiento A) = 690
E(Rendimiento B) = 1030
En la cartera B se espera mejor rendimiento.

b. En términos relativos, ¿cuál de las dos carteras ofrece rendimientos más


heterogéneos?
Solución
Se debe calcular el coeficiente de variación para cada cartera. En efecto:
V(rendimiento A) = s2A = 416 900
V(rendimiento B) = s2B = 1 028 100
s A = 645.678, CV (A) = 93.57 %
s B = 1013.952, CV (B) = 98.44 %
La cartera B tiene rendimientos más heterogéneos.

c. Si esta persona decidiera invertir en las dos carteras, considerando inde-


pendientes los rendimientos monetarios de cada una de ellas, hallar la
probabilidad de que en al menos una de ellas el rendimiento monetario
sea negativo.
Solución
Usando el criterio del evento complementario se tiene:

188 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


P(al menos una tenga un rendimiento es negativo) = 1 – P (ninguna ten-
ga un rendimiento negativo)
P( A  B) =−
1 P( A  B) =−
1 P( A) × P( B) =−
1 0.8 × 0.9 =0.28

10. Un inversionista tiene la posibilidad de colocar sus activos en dos títulos


financieros distintos. Si compra acciones de “A”, la ganancia será de US$ 420
o la pérdida de US$ 110, en el lapso de una semana. Si compra acciones de
“B”, la ganancia será de US$ 650 o la pérdida de US$ 300, en el lapso de una
semana.
Si existe la misma posibilidad de obtener ganancia para ambas acciones,
¿cuál debería ser el valor de probabilidad para que el inversionista se en-
cuentre indiferente entre una u otra acción?
Solución
Sea p = P(obtener ganancias), entonces la probabilidad de obtener ganancias
en ambos tipos de acciones es p. Sea X: Ganancia por la inversión, la distri-
bución de probabilidades es:

Acciones A Acciones B
x p(x) x × p(x) x p(x) x × p(x)
–110 1–p –110(1 – p) –300 1–p –300(1 – p)
420 P 420p 650 p 650p
Total 1 –110 + 530p Total 1 –300 + 950p

Para que el inversionista encuentre indiferente invertir en cualquiera


de las dos acciones su ganancia esperada deber ser la misma, por lo tanto:
E( X A ) = E( XB ) ; entonces: –110 + 530p = –300 + 950p, de donde: P = 0.4524

11. El señor Arias quiere asegurar su casa por US$ 80 000. La compañía de se-
guros estima en 0.004 la probabilidad de que ocurra una pérdida total; en
0.01 la de que sufra una pérdida de US$ 40 000 y en 0.03 de que la pérdida
sea del US$ 20 000. Si la aseguradora no pagará indemnización por otras
pérdidas parciales; ¿cuál sería la ganancia esperada de la compañía en pó-
lizas de este tipo si el cliente paga US$ 1500 por dicha póliza?
Solución
Se define la variable aleatoria:
X: ganancia por póliza (dólares), los valores que toma X y su función de
probabilidad son:

X –78 500 –38 500 –18 500 1500

p(x) 0.004 0.01 0.03 0.956

Por lo tanto: E(X) = 246 dólares

Capítulo 3. Variable aleatoria 189


12. Los accidentes registrados por una compañía de seguros de automóviles
aportan la siguiente información. La probabilidad de que un asegurado tenga
un accidente es de 0.15. Si un accidente ocurre, el daño del vehículo representa
el 20 % de su valor en el mercado con una probabilidad de 0.80, un 60 % de su
valor en el mercado con una probabilidad de 0.12 y representa una pérdida
total con probabilidad de 0.08. ¿Cuál tendría que ser el valor de la prima que
deberá cobrar la compañía para un automóvil cuyo valor es de 12 000 dólares
para que su ganancia esperada sea de 50 dólares?
Solución
Se define la variable X = ganancia de la compañía por un seguro anual
P = prima a cobrar por un seguro
Entonces, la distribución de probabilidad de la variable X es:

X p(x) x × p(x)
P – 12 000 0.012 0.012P – 144
P – 7200 0.018 0.018P – 129.6
P – 2400 0.120 0.12P – 288
P 0.850 0.85P
Total 1 P – 561.6

Se debe obtener un valor de P tal que: E(X) = 50, de donde: P – 561.6 = 50,
entonces: P = 611.6
La prima a cobrar debe ser de 611.6 dólares.
Nota. Para calcular las probabilidades p(x) se usó:
P(X = P – 12000) = P(tenga un accidente y una pérdida total) =
= P(tenga un accidente) × P(pérdida total/tenga un accidente)
= 0.15 × 0.08 = 0.012

13. Los impulsos provenientes de una fuente emisora tienen una intensidad
(en kg.m2/s) que es considerada una variable aleatoria X cuya función de
distribución acumulada es:
0 , x≤0
 4
x
F( x )  , 0 < x < 3
=
 81
1, x ≥3

a. Calcular la probabilidad de que la fuente emisora tenga un impulso con
intensidad entre 1 y 2
Solución
24 14 15
P(1 <=
x < 2) F( 2=
) – F(1) − = = 0.1851
81 81 81

190 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


b. Si se observan 5 de estos impulsos cuyas intensidades se consideran in-
dependientes, ¿cuál es la probabilidad de que a lo más uno de ellos tenga
una intensidad superior a 2?
Solución
Se define los eventos:
Ai = {El impulso i tiene una intensidad superior a 2}
B = {A lo más un impulso tiene una intensidad superior a 2}
P( Ai ) =P( X > 2) =1 − F( 2) =1 − 0.1975 =0.8025. P( A i ) = 0.1975
Nos piden:
P ( B) =P( A i A i A i Ai A i ) + 5 P( Ai A i A i A i A i ) =

(0.1975)5 + 5(0.8025)(0.1975)4 =
= 0.006405

c. ¿Cuál es la desviación estándar de la intensidad de un impulso?


Solución
Primero se halla la función de densidad de probabilidad:
d  x4  4 x
3
f ( x)
= =
  ; 0 < x < 3. Entonces,
dx  81  81
3
4 x3
3 4 x5
E( X ) =
∫x × dx = 2.4
=
0 81 405
0

3
4 x33 4 x6
E( X ) =
2
∫ x × dx =
2
=
6
0 81 486
0

V (X) = 0.24; luego: s =0.4898.


6 − ( 2.4) = 2

14. En un laboratorio de pruebas, el error al medir la temperatura (en oC) es


una variable aleatoria X con función de densidad de probabilidad:

f ( x) kx 2
= −1 < x ≤ 2
a. Halle el valor de k y construya la función de distribución acumulada
de X.
Solución
Usando la segunda condición de la definición para hallar k se tiene:
2
2 x3 1
∫ k x dx = 1, ⇒ k = 1, ⇒ k =
2
−1 3 3
−1

Basándonos en la definición de la función de distribución tenemos:


x
x 1 2 t3 x3 + 1
F=
( x) ∫ t
= dt = , luego:
−1 3 9 3
−1

Capítulo 3. Variable aleatoria 191


 0 , x ≤ -1
 3
 x +1
=F( x)  , ­1 < x < 2
 9
 1 , x ≥2

b. Si se hacen 50 mediciones independientes de la temperatura, ¿en cuán-


tas de ellas se espera un error de medición no mayor a 1.25?
Solución
Se calcula primero la probabilidad de que una medición tenga un
error de medición no mayor a 1.25; p =P( x ≤ 1.25) =0.3281.
Por lo tanto, de las 50 mediciones, se espera que en 50(0.3281) ≈ 16 de
ellas tenga un error de medición no mayor a 1.25

15. El recorrido (en kilómetros) que los automovilistas logran con cierto tipo de
neumáticos es una variable aleatoria con función de distribución acumula-
da dada por:
F( x) =P( X ≤ x) =1 − e - x / 20000 ; x > 0

a. ¿Qué porcentaje de neumáticos duran más de 10 000 kilómetros?


Solución
P( X > 10 000) = e − 0.5 =
1 – F(10 000) = 0.6065
b. En términos del enunciado, ¿cómo interpreta el valor del primer
cuartil?
Solución
P( X ≤ a)= F( a)= 0.25, donde a = Q1
Usando la función de distribución:
F( a) =1 − e − a / 20000 =0.25 ⇒ a =Q1 =5754 km
Hay un 25% de neumáticos (los de menor duración) con un recorrido
inferior a 5754 km.
c. El costo unitario de producción es de 50 dólares, pero si con el neumáti-
co se logra recorrer menos de 1500 kilómetros el costo es de 80 dólares.
Halle el costo unitario esperado.
Solución
Se define la variable: Y = costo unitario (US$)

Y Condición Probabilidad

50 X ≥ 1500 0.92774

80 X < 1500 0.07226

Luego, E(Y ) = 52.1678 dólares

192 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


16. En un estudio realizado sobre el tiempo de duración (en años) de ciertos
equipos, se determinó que el tiempo de vida de estos equipos es una varia-
ble aleatoria X que tiene una función de densidad de probabilidad dada por:
 2x
 , 0≤x≤7
f ( x) =  49
 0, en otro caso

a. Si de estos equipos se elige al azar a 4 de ellos, hallar la probabilidad


de que dos de los equipos elegidos tengan un tiempo de vida de entre
5 y 5.9 años.
Solución
Se define los eventos:
Ai = {El equipo i tiene una vida entre 5 y 5.9 años}
B = {Dos de los equipos tienen una vida entre 5 y 5.9 años}
5.9
5.9 2 x x2
P(Ai) = P(5 < X < 5.9) = ∫ = dx = 0.2002; P( A ) = 0.7998.
5 49 49 i
5
Nos piden:
=P ( B) 6=
P( Ai Ai Ai Ai ) 6 (0.2002
= )2 (0.7998)2 0.23952

b. Si se elige al azar un equipo, del cual se conoce que tiene un tiempo de


duración superior a 2.8 años, ¿cuál es la probabilidad de que su tiempo
de duración no supere los 5 años?
Solución
X≤ 5  P( 2.8 < X ≤ 5) 0.6390
P =  = = 0.7595
 X > 2. 8  P( X > 2.8) 0.8413

17. La empresa INNOVA LIGHT S. A. fabrica bombillas LED y acaba de recibir


un pedido con 320 semiconductores. Un semiconductor es adecuado si su
longitud es superior a 1 mm. Si esta longitud es inferior, se desecha. Sabien-
do, además, que la longitud del semiconductor tiene un comportamiento
aleatorio cuya función de densidad de probabilidad es:
x
 , 0 <x ≤ 4
f (x ) =  8
0 , otro caso

a. Determine el número de semiconductores correctos que se espera tenga
el pedido
Solución
Se calcula la probabilidad de que un semiconductor sea correcto:
4
x
4 x2
P( X >1=
) ∫ dx
= = 0.9375
18 16
1

Capítulo 3. Variable aleatoria 193


Por lo tanto, el número de semiconductores correctos que se espera tenga
el pedido es: 320(0.9375) = 300.

b. ¿Cuál es la longitud mínima del 20 % de semiconductores considerados


los de mayor longitud?
Solución
Se debe hallar un valor a tal que:
4
x 4x2
P( X > a) = 0.2, ⇒ ∫ dx= 0.2 ⇒ = 0.2 ⇒ a = 3.2
a8 16
a

Por lo tanto, la longitud mínima del 20 % que duran más es de 3.2 mm.

18. Un consultor financiero cobra mensualmente honorarios fijos de 100 dóla-


res más una comisión del 5 % sobre el beneficio que su empresa obtiene por
las gestiones de consultoría que realiza. El beneficio que la empresa recibe
mensualmente (en miles de dólares) es una variable aleatoria X con función
de probabilidad:
x − 2 2 < x ≤ 3

f ( x) =  4 − x 3 < x ≤ 4
 0 otro caso

a. ¿Cuál es el ingreso esperado del consultor?


Solución
Se define la variable, Y = Ingreso del consultor, entonces:=
Y 100 + 0.05X
3 4
3 4 x3 3 4 x3
E( X ) = ∫ x( x − 2) dx + ∫ x( 4 − x) dx = −x 2
+ 2x 2
− = 3.
2 3 3 2 3 3
2 3

E(Y ) =
100 + 0.05(3000) =
250 dólares.

b. Hallar la probabilidad de que el consultor obtenga un ingreso inferior a


240 dólares.
Solución
2.8
P(Y < 240) =P (100 + 0.05X < 240) =P( X < 2.8) = ∫ ( x − 2) dx = 0.32
2

194 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


19. Los gastos médicos anuales (en miles de dólares) en que incurren los em-
pleados de una empresa son una variable aleatoria X con función de densi-
dad de probabilidad:
x
 ( 4 ­ x) 0< x<3
f ( x) =  9
0 otro caso

a. Construya la función de distribución de X.
Solución
Usando la definición de la función de distribución se tiene:
x x
xt 2t 2 t3
F( x) = ∫ ( 4 − t ) dt = − , luego:
09 9 0 27 0
 0 , x≤0
 2
 2x x3
F( x=
)  − , 0<x<3
 9 27
 1 , x≥3

b. Si la compañía de seguros cubre los gastos hasta un máximo de 1000
dólares, ¿cuál es la probabilidad de que el seguro cubra estos gastos?
Solución
P( X ≤ 1)= F(1)= 0.1852
c. Determine el porcentaje de empleados cuyos gastos médicos superan al
promedio en más de 500 dólares.
Solución
Se calcula primero el valor esperado de X, en efecto:
3 x 
E( x)= ∫ x  ( 4 − x) dx= 1.75
0  9 

Luego, P( X > 1.75 + 0.5) = P( X > 2.25) = 1 – F( 2.25) = 1 – 0.7032 = 0.2968.


Por lo tanto, el porcentaje de empleados cuyos gastos médicos supe-
ran al promedio en más de 500 dólares es del 29.68%.

20. El retraso o adelanto (en minutos) de un vuelo de Lima a Trujillo es una


variable aleatoria cuya función de densidad de probabilidad se encuentra
dada por:
 1
 (36 − x 2 ) −6 < x < 6
f ( x) =  288
 0 otro caso

Donde los valores negativos son indicativos de que el vuelo llega adelan-
tado y los valores positivos señalan que el vuelo llega retrasado. Determine:

Capítulo 3. Variable aleatoria 195


a. La probabilidad de que uno de los vuelos llegará cuando menos dos
minutos antes.
Solución
0 0
1 0 36x x3
P( −2 ≤ X ≤ =
0) ∫ (36 − x 2 ) =
dx − = 0.259
−2 288 288 2 864
−2

b. La probabilidad de que uno de los vuelos llegará entre uno y tres minu-
tos retrasado, dado que se sabe llegó retrasado.
Solución
3 1
∫ (36 − x 2 ) dx
1 ≤ X ≤ 3  P(1 ≤ X ≤ 3) 288 0.2199
P  = P( X =
1 = = 0.4398
 X > 0  > 0) 6 0.5000
1
∫ (36 − x 2 ) dx
0 288

c. Suponga que por cada vuelo que llega retrasado, se multa a la aerolínea
con US$ 150, ¿cuál es la probabilidad de que en 5 vuelos que realice el
avión, la multa sea de US$ 300?
Solución
Se define los eventos:
Ai = {El vuelo i llega retrasado}
B = {La multa por retrasos es de US$ 300}
6 1
P( Ai ) = P ( x =
> 0) ∫ (36 − x 2=
) dx 0.5 P(=
Ai ) 0.5
0 288

Nos piden:
=P ( B) 10 P( Ai=
Ai Ai Ai Ai ) 10
=(0.5)2 (0.5)3 0. 3125

21. Los pesos de un artículo (kg) se consideran una variable aleatoria con fun-
ción de densidad:
 3x 2
 0< x< 2
 20
 x
=f ( x)  2 ≤ x<4
 10
 0 en otro caso


a. Construir la función de distribución de X
Solución
Basándonos en la definición de la función de distribución:

196 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


x 3t 2 x3
F=
( x) ∫ = dt ; 1< x < 2
0 20 20
2 3t 2 x t x2 1
F ( x)
= ∫ dt + ∫ = dt + ; 2≤x<4
1 20 2 10 20 5

 0 , x≤0
 3
x , 0≤x<2

De donde: F( x)= P( X ≤ x) =  20
x + 1 , 2≤x<4
2

 20 5

1 , x≥ 4

b. Hallar P( X < 3 / X > 1)


Solución
X< 3  P(1< X < 3) 0.60
P =  = = 0.6316
 X > 1  P( X > 1) 0.95

c. Hallar e interpretar: µ x , s x , CV ( X ).
Solución
2 3x 2 4 x
=E( X ) =
∫x dx + ∫ x dx 2.467
o 20 2 10

2 3x 2 4 x
=E( X 2 ) ∫=
x2 dx + ∫ x 2 dx 6.96
o 20 2 10

0.8729
V ( X ) = 6.96 − 2.467 2 = 0.8739 → C.V = × 100 = 37.89 %
2.467
Los pesos de los artículos presentan una alta variabilidad.
C 4X + 3 soles, hallar µC , sC .
d. Si el costo por artículo es =
Solución
µC =E( 4X + 3) = 4E( X ) + 3 = 4 × 2.467 + 3 = 12.904
V (C ) = V ( 4X + 3) = 42 V ( X ) = 16 × 0.8729; por la tanto: sC =3.7393.

e. Si la utilidad neta por artículo (en soles) es una función tal que:
−1, si 0 < x < 1

 4, si 1 ≤ x ≤ 3
Y g=
= ( x) 
−2, si 3 < x < 4
 0, en otro caso

Halle e interprete los valores de µY y CV (Y ).

Capítulo 3. Variable aleatoria 197


Solución
La distribución de probabilidad de Y es:
y p(y) y × p(y) y2 × p(y)

–2 0.35 –0.70 1.40

–1 0.05 –0.05 0.05

4 0.60 2.40 6.40

Total 1.00 1.65 7.85

Por lo tanto:
1.65
µY =

5.1275
V (Y ) = 7.85 − 1.652 = 5.1275 → C.V = ×100 = 137.24 %
1.65
Nota. En este caso el valor del coeficiente de variación es superior al
100 %. Esto se debe a que los valores de la variable aleatoria Y son nega-
tivos y positivos.

22. La cantidad de harina (en toneladas) que se utiliza diariamente en una


panadería es una variable aleatoria X con función de densidad de la forma:

0.25e
−0.25 x
x≥0
f ( x) = 
 0 otro caso

a. ¿En qué porcentaje de días la cantidad utilizada no sobrepasa las tres


toneladas?
Solución
Hay que calcular la probabilidad de que la cantidad de harina utilizada
no sea mayor de 3 toneladas:
3 3
− 0.75
P( X ≤ 3 )
= ∫ 0.25
= e −0.25 x dx  − e −0.25 x  =
− e= + e − 0 0.5276.
o
  0

El porcentaje de días en los cuales la cantidad de harina que se utiliza


no sobrepasa las tres toneladas es del 52.76 %.

b. ¿Qué cantidad se debe tener en stock para cubrir la demanda con una
probabilidad de 0,9?
Solución
Hay que hallar un valor k tal que:
P( X ≤ k ) =
0.9; entonces:
k k
P( X ≤ k ) = 0.9 , ⇒ ∫ 0.25 e −0.25 x dx =  − e −0.25 x  = − e − 0.25 k + e − 0 = 0.9
o
  0

ln(0.1)
K
⇒= = 9.21034. De donde
= k 9.21034
− 0.25

198 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


1. Problemas propuestos

1. Identifique las siguientes variables como discretas o continuas:


a. El número de pacientes que llegan en un día a un hospital.
b. La estatura de una persona.
c. El contenido de glucosa de una solución.
d. El porcentaje de hierro de un material.
e. El tiempo de duración de una bombilla de luz.

2. Suponga que un experimento (ε) consiste en lanzar un tetraedro que tiene


las caras marcadas por las letras A, B, C y D, hasta que aparezca en la cara
superior la cara C.
a. Determine el espacio muestral.
b. Sea la variable aleatoria X: número de lanzamientos necesarios para que
aparezca la cara C en la parte superior. Determine el rango (valores) de X.

3. Un comerciante tiene 20 unidades de cierto artículo, de los cuales 14 están


aptos para su venta y otros 6, no. Al llegar un cliente para comprar cuatro
de tales artículos el comerciante escoge al azar sin reposición 5 de los 20
artículos, se define, entonces la variable aleatoria X: número de artículos
buenos escogidos. Determine la función de probabilidad de X.

4. Se tiene 3 depósitos: en el depósito 1, todos los artículos son de la marca A;


en depósito 2, de 500 artículos, 300 son de la marca A y el resto de la marca
B; y en el depósito 3 hay la misma proporción de artículos de cada una de
las dos marcas.
Para inspección, se escoge al azar un artículo de cada depósito. Se define
la variable X: número de artículos de la marca A escogidos. Construir la
función de probabilidad de X.

5. Para integrar un proyecto se requiere de los servicios de 2 administradores


y 3 ingenieros. En la revisión de expedientes presentados por 5 administra-
dores y 7 ingenieros, se comprobó que todos ellos tienen la misma capaci-
dad profesional para formar parte del proyecto por lo que la elección de los
integrantes se hará al azar. El hermano de uno de los ingenieros es admi-
nistrador. Sea X la variable que indica el número de hermanos elegidos para
integrar el proyecto. Construir la función de probabilidad de X.

6. Se sabe que un grupo de 5 componentes contiene dos defectuosos. Un inspec-


tor prueba los componentes uno por uno hasta encontrar los dos defectuosos.
Una vez encontrado el segundo, concluye la prueba. Se defina a X, como el

Capítulo 3. Variable aleatoria 199


número de pruebas necesarias hasta encontrar el segundo defectuoso. Cons-
truya la función de probabilidad de X.

7. La probabilidad de que el pedido de un cliente no se despache a tiempo es


de 0.10. Un cliente realiza 3 pedidos, que pueden considerarse como even-
tos independientes. Si X es el número de pedidos que se envían a tiempo.
a. Determine la función de probabilidad de X.
b. ¿Cuál es la probabilidad de que todos los pedidos se envíen a tiempo?
c. ¿Cuál es la probabilidad de que exactamente uno de ellos no se envíe
a tiempo?
d. ¿Cuál es la probabilidad de que dos o más pedidos no se envíen
a tiempo?

8. Una compañía de seguros ofrece a una persona de 50 años una póliza por
un año de US$ 150 000 por una prima anual de US$ 1500. Asuma que el
número de muertes en este grupo de edad es de 8 por cada 1000. ¿Cuál es
la ganancia esperada para la compañía de seguros con una póliza de estas
condiciones?

9. La publicidad de ciertos fondos de inversión de alto riesgo afirma que la


probabilidad de doblar la cantidad invertida es de 40 %, la probabilidad de
triplicarla es de 10 %, la de perder la mitad es de 35 % mientras que sólo
un 15 % de los clientes han perdido todo lo invertido. ¿Cuál es la ganancia
esperada si decido invertir 10 000 soles?

10. El gerente financiero de una compañía está considerando dos propuestas


de inversión. La propuesta A señala ganancias netas de S/ 20 000, S/ 30 000
y S/ 50 000 con probabilidades respectivas de 0.2, 0.4 y 0.4. En el caso de
la propuesta B, el gerente piensa que existe un 50 % de oportunidades de
una inversión exitosa, que podría producir ganancias netas de S/ 100 000
y que, si resultara mala, se podría alcanzar el punto de equilibrio, sin ga-
nar o perder dinero. Asumiendo que cada propuesta requiere la misma
cantidad de inversión, ¿cuál sería preferible, considerando el retorno
monetario esperado?

11. La gerencia de una compañía minera debe decidir si continuar una ope-
ración en cierto lugar. Si la continúa y tiene éxito ganará S/ 1 000 000 y si
fracasa perderá S/ 600 000; si abandona un lugar que les habría dado éxito,
esto supondrá una pérdida de S/ 400 000 (por razones competitivas); y si
no continúa en un lugar donde de todas maneras hubiese fracasado, esto
representa S/ 100 000 para la compañía (debido a que los fondos destinados
para la operación permanecen intactos). ¿Qué decisión maximizaría las uti-

200 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


lidades esperadas de la compañía, si las probabilidades a favor y en contra
del éxito son, respectivamente, 0.40 y 0.60?

12. El señor Arias quiere asegurar su casa por US$ 80 000. La compañía de se-
guros estima en 0.004 la probabilidad de que ocurra una pérdida total; en
0.02 la de que sufra una pérdida del 50 %, y en 0.08 que la pérdida sea del
25 %. Si la aseguradora no pagará indemnización por otras pérdidas parcia-
les; ¿qué prima debe pagar el señor Arias cada año si la empresa de segu-
ros quiere lograr una ganancia promedio de US$ 500 anuales en todas las
pólizas de ese tipo?

13. En cierto juego de dados se lanza 4 de ellos, y un jugador apuesta sobre


la salida de un número que el elige; gana 1 sol cuando el número aparece
en un dado, 2 soles cuando el número aparece en dos dados; 3 soles si sale
el número en tres dados; 5 soles si sale el número en los cuatro dados y
pierde 1 sol cuando el número no coincide en ninguno de los dados. ¿Le
conviene jugar?

14. Un contratista estima las probabilidades del número de días necesarios pa-
ra concluir un proyecto como sigue:

X 27 28 29 30 31 32 Total
P(x) 0.05 0.15 0.25 0.40 0.10 0.05 1.0

El proyecto tiene un costo fijo de US$ 2 000 y debe concluirse en 30 días. Si


termina en menos de 30 días habrá un ahorro de US$ 200 por cada día por
debajo de 30; pero si se termina en más de 30 días habrá un sobrecosto de
US$ 300 por cada día por encima de 30. Calcule el costo esperado del pro-
yecto y su desviación estándar.

15. Una caja contiene 4 caramelos de sabor fresa y 6 de sabor naranja. Se ex-
traen 3 caramelos sucesivamente con reemplazo. Si se gana US$ 5.0 por
cada caramelo de sabor fresa y US$ 3.0 por cada caramelo de sabor naranja
extraído ¿cuánto se debería pagar por el derecho de jugar para que el juego
sea equitativo?

16. Un anuncio luminoso consta de 100 bombillas iguales. Se sabe que la fun-
ción de probabilidad de la variable aleatoria X: número de bombillas que se
queman en un día es:
x
P( X
= x=
) x= 0 ,1 , 2 , . . . , 100
5050

Capítulo 3. Variable aleatoria 201


a. Determinar la probabilidad de que el número de bombillas inutilizadas
en un día se encuentre entre 50 y 75 (ambos inclusive).
b. Calcule e interprete el valor esperado de X.

17. El contenido de magnesio de una determinada aleación es una variable


aleatoria X dada por la siguiente función de densidad de probabilidad:
x
 0< x ≤ 6
f ( x) = 18
 0 otro caso

a. ¿Cuál es la probabilidad de que una aleación tenga un contenido de
magnesio entre 2.2 y 4.8?
b. ¿Cuál es el contenido máximo de magnesio que se observará en una
aleación con una probabilidad de 0.90?
c. Calcular e interpretar la mediana de la variable X.
d. La utilidad (en soles) que se obtiene de esta aleación es U = 10 + 2X.
Se pide:
b.1 Calcular el valor esperado, la desviación estándar y el coeficiente de
variación de la variable U.
b.2 ¿Cuál es la probabilidad de que la utilidad sea superior a 20 soles?

18. Sondeos de mercado realizados por un fabricante para uno de sus produc-
tos indican que la demanda proyectada debe considerarse una variable
aleatoria X con valores entre 0 y 25 toneladas. La función de probabilidad
de X es.
3x 2
f=
( x) 0 ≤ x ≤ 25
253
a. Construir la función de distribución de X.
b. ¿Cuál es la probabilidad de tener una demanda entre 10 y 20 toneladas?
c. Hallar la demanda esperada y su variación relativa.

19. La temperatura, en grados centígrados con la que se produce la reacción en


un experimento químico es una variable aleatoria con la siguiente función
de densidad:
x2
f ( x)
= si − 1 < x < 2
3
a. Construir la función de distribución de X.
b. Calcular la probabilidad de que la temperatura sea negativa.
c. Calcular e interprete el valor esperado y el coeficiente de variación de X.

202 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


20. Para una investigación se ha considerado a todas las pequeñas empresas
con capital X inferior a 10 000 dólares. Se supone que X, expresada en miles
de dólares es una variable aleatoria con función de densidad:
k
f (=
x) ; 0 < x ≤ 10
x
a. Calcular el porcentaje de empresa con capital inferior a 6000 dólares
b. Si el capital de una empresa es superior a 3000 dólares, ¿cuál es la proba-
bilidad que no sobrepase los 7000 dólares?
c. Calcule e intérprete: E(X), s x y el C.V. de X
d. ¿Qué porcentaje de empresas tienen capitales superiores a la media?

21. El porcentaje de contaminante presente en una muestra de aire es una va-


riable aleatoria con función de densidad dada por: f ( x) = a + bx 2 0 < x < 1
a. Si E(X) = 3/5. Calcular el valor de a y b para que f sea función de densidad.
b. Hallar la probabilidad de que el porcentaje de contaminante en una
muestra sea mayor a 0.6.

22. Cierto aparato registra el nivel de saturación de la red eléctrica en una co-
marca. El error relativo porcentual de la medida dada por el aparato es una
variable aleatoria continua X con función de distribución
0 , si x ≤ 0

F( x) = 1 − (1 − x)2 , si 0 < x < 1
1 , si x ≥ 1


Determinar:
a. La función de densidad de probabilidad de la variable X.
b. La probabilidad de que una medida tenga un error entre el 0.1 %
y el 0.2 %.
c. El error relativo esperado.

23. La función de distribución de una variable aleatoria X está dada por:


 0 , x≤- 4
 3
x 1
F( x=
) P( X ≤ x=
)  + , −4< x< 4
128 2
 1 , x≥4

a. Calcular el valor del cuartil superior
b. Si se realizan 5 observaciones de X, hallar la probabilidad de que solo
una de ellas sea negativa.

Capítulo 3. Variable aleatoria 203


24. Suponiendo que la duración en horas de cierto tipo de componente es una
variable aleatoria T, con función de densidad de dada por:
c
 , t > 200
f ( t ) = t2
0 , t ≤ 200

Hallar:
a. El valor de c y P(t < 400/t > 300)
b. Si se instalan 5 focos, ¿cuál es la probabilidad de que después de 300 ho-
ras tenga que reemplazarse uno de ellos?

25. El peso de un artículo (en kg) tiene una distribución con función de densidad:
 3x 2
 , 1< x < 2
 20
f ( x) =  13x
 50 , 2 ≤x<3

 0 , otro caso

a. Construir la función de distribución de X.


b. Hallar P(X < 2/ X > 1.5).

26. Una empresa que se dedica a la fabricación de cierto componente, ha deter-


minado que la vida útil en años del componente es una variable aleatoria
con función de densidad:
 1 − x /10
 e , x>0
f ( x) = 10
 0, otro caso

a. Hallar la función de distribución.


b. Si se elige al azar un componente, ¿cuál es la probabilidad de que dure
por lo menos 6, pero a lo más 18 años?
c. Si se eligen 100 componentes, ¿cuántos de estos componentes se espera
que tengan una duración superior a 5 años?

27. El tiempo medido en horas que un telar automático está en funcionamiento


antes de que se le acabe el hilo y pare es una variable aleatoria cuya función
de densidad de probabilidad es:
1
 , 90 ≤ x ≤ 120
f ( x) =  30
 0,
 otro caso

204 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Al poner el telar en funcionamiento, el encargado debe decidir cuándo
volverá a inspeccionarlo. Si vuelve antes de que se acabe el hilo incurre en
un costo de 3 soles por cada hora que pierde hasta que se pare el telar; sin
embargo, si cuando llega ya se ha acabado el hilo, el costo es de 9 soles por
cada hora que el telar esté parado. ¿Al cabo de cuántas horas le aconsejarías
que volviese a revisar el telar?

28. En una empresa fabricante de artefactos, para cierto modelo, se tiene la si-
guiente función de probabilidad, para la cantidad de unidades fabricadas
en una semana (X).

x 100 120 150 180 200


p(x) 1/10 1/10 2/10 3/10 3/10

Si la utilidad neta semanal (en soles) para el modelo antes mencionado


está determinada por: = Y 2850 − 10X; determine los valores de la media y
el coeficiente de variabilidad de la utilidad neta semanal. ¿Qué nos indican
los valores hallados?

29. Se hace un orificio en una lámina de metal y luego se inserta un eje. La di-
ferencia entre el radio del orificio y el radio del eje es una variable aleatoria
X (en mm) cuya función de probabilidad es f ( x)= k(1 − x 4 ) 0 < x ≤ 1
a. Hallar el valor de k y luego construir la función de distribución
acumulada.
b. Calcular que la diferencia este entre 0.3 y 0.6.
c. Hallar la diferencia promedio y la desviación estándar.

30. El tiempo (en minutos) que necesita un vendedor para atender a un cliente
es una variable aleatoria, T. Su función de distribución acumulada es:
F=
(t ) 0.01(t − 5)2 , para 5 < t < 15

a. ¿Cuál es la probabilidad de que el vendedor requiera más de 10 minutos


para atender a un cliente?
b. En promedio, ¿cuantos minutos necesita el vendedor para atender a un
cliente?
c. El vendedor ha estado atendiendo a un cliente durante 10 minutos y aún
no ha terminado, ¿cuál es la probabilidad de que termine dentro de los
próximos 2 minutos?
d. El costo C, de atender a un cliente se encuentra en función al tiempo
T como sigue: C = 5 + 0.5T2. ¿Cuál es el costo promedio de atención
a un cliente?

Capítulo 3. Variable aleatoria 205


31. Ricardo vende equipos médicos cuyo precio mínimo es de US$ 200 000. Él
tiene un salario de US$ 6000 dólares anuales. Si vende 5 o menos de estos
equipos en un año, no obtiene comisión (gana sólo US$ 6000). Cuando Ri-
cardo vende 6 o más equipos en un año, su ingreso total está dado por la
siguiente fórmula:
Y = US$ 6000 + US$ 5000(X – 5)2 para X ≥ 6

Donde X es la variable aleatoria que indica el número de equipos que


puede vender en un año.
Por ejemplo, si Ricardo vende 7 equipos en un año, su ingreso será de
US$ 26 000.
La distribución de probabilidad de X es:
x 3 4 5 6 7 8
P(x) 0.10 0.20 0.30 0.20 0.15 0.05

a. ¿Cuál es la probabilidad que Ricardo tenga un ingreso anual superior


a US$ 11 000?
b. Halle el valor esperado y la desviación estándar del ingreso anual
de Ricardo.

32. La función de probabilidad del tiempo en horas para terminar una tarea es
=f (t ) 3t 2 / 117 , 2<t<5

a. Hallar la función de distribución acumulada.


b. El costo en dólares C para terminar esta tarea esC
=C= 5050+ +3030t.t. Hallar
P(C < 140).
c. Si al término de 4 horas un operario A no es capaz de terminar la tarea,
se llama a otro operario B para que la termine. ¿Cuál es la probabilidad
de que se tenga que llamar al operario B?
d. ¿Cuál es el tiempo promedio que necesita el operario A para ter-
minar la tarea?

206 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Capítulo Distribuciones
4 de probabilidad
El objetivo de este capítulo es conocer las
Sabes
características de las distribuciones de pro- Capacidades adquiridas
babilidad de variables aleatorias discretas 9 Identificar una variable aleatoria como
y continuas; así como aprender a calcular discreta o continua.
las probabilidades de las más importantes 9 Calcular la esperanza y la varianza de
distribuciones de probabilidad de varia- una variable aleatoria y aplicar sus pro-
bles aleatorias discretas y continuas. piedades.
La utilidad de los modelos de probabilidad 9 Calcular las probabilidades asociadas
más empleados radica en que de ellos se a las variables aleatorias discretas y
puede determinar y evaluar las propieda- continuas.
des de la distribución de probabilidad de
una estadística que se utiliza en la estadís- Piensas
tica inferencial.
Competencias por lograr
9 Identificar las características para la uti-
lización de los modelos de distribución
de probabilidad como el binomial, de
Conocimientos previos Poisson, hipergeométrica, el exponen-
cial, el normal etc.
Probabilidades básicas, variables alea-
9 Calcular probabilidades de las distribu-
toria discreta y continua, función de
ciones de probabilidad.
probabilidad matemática.
9 Interpretar los valores de probabilidad.
9 Calcular la esperanza matemática y la
varianza de una distribución de proba-
bilidad.

Secciones 9 Utilización de software para el cálculo de


probabilidades.
1. Distribuciones de probabilidad.
2. D
istribuciones de probabilidad dis- Haces
creta.
Habilidades por desarrollar
3. Distribuciones continuas.
9 Escoger el modelo probabilístico ade-
4. Problemas resueltos. cuado para resolver un problema real.
5. Problemas propuestos. 9 Aprender a simplificar el tratamiento es-
tadístico de fenómenos reales utilizando
estas distribuciones de probabilidad.
1. Distribuciones de probabilidad

La importancia de las distribuciones de probabilidad radica principalmente en


su aplicabilidad en la ingeniería, en física, etc., así como en el diagnóstico por
imágenes y el procesamiento de señales entre otros. Estas distribuciones son de
dos tipos: discretas y continuas.

2. Distribuciones de probabilidad de variables aleatorias discretas

2.1 Distribución de Bernoulli

Jacob Bernoulli, (Suiza, 1654 - 1705) fue un matemático de renombre, estudió


las pruebas independientes con probabilidades iguales de éxito, perteneció a la
primera generación de la familia Bernoulli, quienes realizaron grandes aportes
a la teoría de probabilidad.

Un experimento de Bernoulli es aquel que tiene dos resultados mutuamente ex-


cluyentes que se denotan por éxito y fracaso con probabilidades p y q = 1 – p ,
respectivamente.

Función de probabilidad de Bernoulli

Si X es una variable aleatoria con una distribución de Bernoulli; entonces, su


distribución de probabilidad está dada por:

 x 1− x
 p (1 − p) , x = 0 ,1
P( X
= x=
)  Donde, 0 < p < 1
0 ,
 otro caso

Capítulo 4. Distribuciones de probabilidad 209


Esperanza y varianza de una distribución de Bernoulli
E( X ) = µ = p
V ( X ) =s2 =p(1 − p)

Gráfica de una distribución de Bernoulli:

Figura 1. Gráfico de
la distribución de
Bernoulli.

0 1

Características para definir una distribución Bernoulli


• El experimento se ejecuta una sola vez
• El experimento tiene dos resultados posibles; éxito y fracaso.

Ejemplo 1
Se sabe que un software que procesa datos produce un error en el 0.1 % de los
procesamientos realizados. Se elige al azar un proceso de datos para compro-
bar si no existe error.
¿Cómo se distribuye la variable X?, ¿cuáles son la media y la varianza?

Solución
1 si el proceso no tiene error

X=
0 si el proceso tiene error

La función de probabilidad es:


 x 1− x
0.999 (1 − 0.999) , x = 0 ,1
P( X
= x=
) 
0 ,
 en otro caso

Dónde:
= E( X ) 0.999=
y V ( X ) 0=
.999(0.001) 0.000999

2.2 Distribución binomial


La distribución binomial es una de las distribuciones discretas más importantes:
se utiliza en producción, control de calidad, en investigación de mercados, etc.
Está asociada a un experimento aleatorio de Bernoulli cuyos resultados en cada
prueba son dos: éxito y fracaso.
Un experimento binomial se puede caracterizar como la extracción de n ele-
mentos uno a uno con reposición, de una población finita (N) o infinita dividida
en dos categorías.

210 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Características de una distribución binomial

• El experimento aleatorio se repite n veces con idénticas condiciones.


• El resultado de cada prueba es independiente de las demás.
• Cada una de las pruebas es un experimento de Bernoulli.
• La probabilidad (p) de éxito permanece constante en cada prueba.
• La variable X de interés es el número de éxitos en los n ensayos de
Bernoulli.

Función de probabilidad binomial

La distribución binomial se denota por: B (n, p). Tiene dos parámetros, n y p,


donde n representa el número de veces que se repite el experimento (tamaño de
la muestra) y p, la probabilidad de que se produzca un éxito y se mantiene cons-
tante en cada ensayo. Su función de probabilidad está dada por:
 n  x n− x
  p q , x = 0 , 1, 2 , ..., n
P( X )  x 
= x= Donde, 0 < p < 1; q =1 − p

0 , en otro caso

Esperanza y varianza de una distribución binomial

La esperanza viene dada por la siguiente expresión:

E(X) = np

La varianza viene dada por la siguiente expresión:

V(X) = npq

Gráfica de una distribución binomial

Figura 2: Gráfico de la
distribución binomial
con n = 12 y p = 0.4.

Capítulo 4. Distribuciones de probabilidad 211


Ejemplo 2
Los operarios de un taller descansan un 10 % del tiempo de trabajo. Si en el ta-
ller trabajan 10 operarios, calcular la probabilidad de que en un momento dado:

a. Estén descansando la mitad de los operarios.


Solución
Se define la variable aleatoria:
X = Número de operarios que descansan.
n = número de operarios = 10
p = probabilidad de que un operario descanse = 0.1
Para este caso el valor de X = 5; n = 10, p = 0.1.
Se reemplaza en la fórmula y se tiene lo siguiente:
10 
P( X= 5=
)   0.15 (0.9)=
5
0.001488
5 
 
Utilizando el Minitab se realiza de la siguiente manera:
Ingresar a la opción Calc> Probability Distributions> Binomial…

Figura 3: Secuencia para


calcular la probabilidad de
una distribución binomial.

Aparece la siguiente ventana, marcar Probability, en el ítem Number


of trials colocar el número 10; en el ítem Event probability colocar 0.1,
marcar la opción Input constant y en el recuadro respectivo colocar el
número 5 y luego dar clic en OK.

212 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Figura 4. Ingreso de
datos de la distribución
binomial.


El resultado que nos proporciona la salida del software es el siguiente:
Probability Density Function
Binomial with n = 10 and p = 0.1
x P(X = x)
5 0.0014880
b. Estén descansando menos de 4 operarios.
Solución
3  10 
x 10 − x
P( X < 4)= P( X ≤ 3)= ∑  0.1 (0.9) = 0.9872
x =0  x 

c. Estén descansando más de 4 operarios


Solución
10 10  x 10 − x
P( X > 4)
= ∑ = 0.1 (0.9) 0.001635
x =5  x 

d. ¿Cuál es el número de operarios descansando más probable?
Solución
X P(X)
0 0.348678
1 0.387420
2 0.193710
3 0.057396
4 0.011160
5 0.001488
6 0.000138
7 0.000009
8 0.000000
9 0.000000
10 0.000000

El más probable es X = 1

Capítulo 4. Distribuciones de probabilidad 213


Ejemplo 3
Un estudiante se ha preparado para un examen de forma que tiene una pro-
babilidad 0.7 de hacer bien cualquier problema. Si para aprobar el examen
debe resolver correctamente al menos la mitad de los problemas, ¿qué tipo de
examen le sería más favorable: uno de 4 problemas o uno de 6?
Solución
Se define la variable aleatoria:
X: Número de problemas resueltos correctamente.
Probabilidad de resolver correctamente un problema (p) = 0.7
Número de problemas del examen (n) = 4 problemas.
4 4
x 4− x
P( X ≥ 2)
= ∑ =  0.7 (0.3) 0.9163
x=2  x 

Haciendo uso del software Minitab se procede de la siguiente manera:


En el menú principal, hacer clic en Graph> Probability Distribution Plot>
View Probability como se indica en la siguiente figura:

Figura 5. Secuencia
de comandos.

Luego elegir Binomial en el ítem Distribution. - En la ventana Number of


trials, digitar 4 y en la ventana de Event probability digitar 0.7> En la pestaña
Shaded Area, dar clic en X Value> en la ventana de X Value digitar 2> OK.

Figura 6. Secuencia
de comandos.

214 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Luego de dar clic en OK, se obtiene el siguiente gráfico con la probabilidad
solicitada.

Figura 7. Resultado de
la probabilidad en una
distribución binomial
con n = 4, p = 0.7.


Para el caso donde n = 6
6 6
x 6− x
P( X ≥ 3)
= ∑ =  0.7 (0.3) 0.9295
x
x =3  

Conclusión: El examen más favorable es de 6 problemas, la probabilidad de


aprobar es mayor.

2.3 Distribución hipergeométrica

La distribución hipergeométrica es una distribución de probabilidad de una va-


riable aleatoria discreta y es útil donde las extracciones se realizan sin reposi-
ción, en cuyo caso las pruebas no son independientes.

Características de una distribución hipergeométrica

• El tamaño de la población es finito (N).


• La población se divide en dos características mutuamente excluyentes.
• Cada elemento pertenece a una de estas características.
• Se obtiene una muestra aleatoria de tamaño n sin reemplazamiento.

Función de probabilidad hipergeométrica

Una variable aleatoria hipergeométrica depende de tres parámetros:


N: Tamaño de la población
M: Número de elementos que pertenecen a la categoría de éxito en la población
n: Tamaño de la muestra

Capítulo 4. Distribuciones de probabilidad 215


Su función de probabilidad es:
  M  N − M 
  
  x  n − x 
 = , x 0,1, 2,...min( M > 0, n)
P( X
= x=
)  N
  
 n 
 0, otros casos

Esperanza y varianza de una distribución hipergeométrica

La esperanza viene dada por la siguiente expresión:


nM
E( X ) =
N
La varianza viene dada por la siguiente expresión:
M  M  N − n 
V (X) n
= 1 −  
N N  N − 1 

Gráfica de una distribución hipergeométrica:

Figura 8. Gráfica de
la distribución hiper-
geométrica con
N = 20; M = 8; n = 6.

Ejemplo 4
Un distribuidor mayorista recibe diariamente un lote de 20 refrigeradoras, de
las cuales ocho son de color blanco y las restantes de color plata. Un comer-
ciante minorista le solicita, también diariamente, seis refrigeradoras. Supo-
niendo que las refrigeradoras son seleccionadas al azar.
a. ¿Cuál es la probabilidad de que, en un día cualquiera, el número de refri-
geradoras seleccionadas de color blanco sea mayor a tres?

216 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


b. ¿Cuál es la probabilidad que, para los siguientes cinco días, como máximo
en dos días, el minorista reciba exactamente tres refrigeradoras de color
plata? Suponer independencia.

Solución
N = 20 refrigeradoras
M = 8 refrigeradoras de color blanco
N – M = 12 refrigeradoras de color plata
n = 6 refrigeradoras seleccionadas como muestra

a. X = número de refrigeradoras de color blanco seleccionadas aleatoriamente.


X → H( 20, 8, 6)

6  8  12 
∑   
x = 4  x 
 6 − x 
P( X > 3)
= = 0.1373
 20 
 
6 
b. X: número de refrigeradoras de color plata seleccionadas aleatoriamente.
X → H( 20 , 12 , 6)

12  8 
  
 3 
 3 
P( X= 3=
) = 0.3178
 20 
 
6 

Y = número de días donde el minorista recibe exactamente tres refrigera-


doras de color plata.
Y → B(n = 5; p = 0.3178)

2 5 
=P (Y ≤ 2) 0.3178)5− y 0.8126
∑  0.317 (1 −=
y
y =0  y 

Ejemplo 5
En un almacén de aparatos electrónicos se almacenan 10 tostadoras para su
distribución, 4 de la marca A y el resto de marcas menos conocidas. Si un em-
pleado selecciona al azar 5 tostadoras para llevarlas por encargo a una tienda
para su comercialización, calcular la probabilidad de que en las 5 tostadoras
seleccionadas:
a. Haya exactamente 2 de la marca A.
Solución
N = Total de tostadoras = 10
M = Marca A = 4

Capítulo 4. Distribuciones de probabilidad 217


N – M = tostadoras de marcas menos conocidas =6
n = Tamaño de la muestra = 5
X = Número de tostadoras de la marca A
 4  6 
  
 2 
 3 
P( X= 2=
) = 0.4762
10 
 
5 
Usando el software Minitab se procede de la siguiente manera.
En el menú principal: Calc> Probability Distributions> Hypergeometric…

Figura 9. Secuencia
para calcular la proba-
bilidad de una distribu-
ción hipergeométrica.

Activar la opción Probability e ingresar la siguiente información:


N = 10; M = 4; n = 5; activar la opción Input constant e ingresar el valor de
X = 2 como se muestra en la siguiente figura:

Figura 10. Ingreso de


datos en una distribu-
ción hipergeométrica.

218 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Dar clic en OK, siendo el resultado del Minitab lo siguiente:
Probability Density Function
Hypergeometric with N = 10, M = 4, and n = 5
x P(X = x)
2 0.476190
b. A lo sumo haya una tostadora de las marcas menos conocidas.
X: Número de tostadoras de marcas menos conocida
N = 10 tostadoras en total
M = 6 tostadoras de la marca menos conocida
N – M = 4 tostadoras de marca A
n = 5 tostadoras seleccionadas como muestra
x =1  6  4 
∑   
x = 0  x 
 5 − x 
P( X ≤ 1)
= = 0.02381
10 
 
5 
Una de las formas para calcular las probabilidades usando el software
Minitab es de la siguiente manera:
En el menú principal: Graph> Probability Distribution Plot…, seleccio-
nar la ventana de View Probability> OK.

Figura 11: Secuencia


para calcular una proba-
bilidad de una distribu-
ción hipergeométrica.

En la siguiente ventana, en la pestaña Distribution seleccionar


Hipergeometric y digitar valores en los recuadros como se presenta en la
siguiente figura:

Capítulo 4. Distribuciones de probabilidad 219


Figura 12. Ingreso de
datos para calcular la
probabilidad de una
distribución hiper-
geométrica.


En el botón superior del cuadro, activar Shaded Area> X
value>seleccionar Left Tail y en la caja de X value colocar el número 1 y
dar OK de acuerdo a la siguiente gráfica:

Figura 13: Selección del


área de probabilidad.


El resultado de Minitab se presenta a continuación:

220 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Figura 14. Resultado de la
probabilidad en una dis-
tribución hipergeométrica
con N = 10, M = 6, n = 5.

2.4 Distribución de Poisson

Siméon Denis Poisson (Francia, 1781-1840) fue un matemático, astrónomo y


físico. Perteneció a la Academia de Ciencias y fue presidente de la Agencia
de longitudes, tiene más de 300 obras con aportaciones importantes en física
(elasticidad, magnetismo, calor, mecánica celeste, etc.) y matemática (teoría de
números, probabilidad, series de Fourier, etc.).

La distribución de Poisson es una distribución de probabilidad de una varia-


ble aleatoria discreta y hace referencia a una modelización en la que nos interesa
la ocurrencia de un número de eventos finitos de eventos discretos en un inter-
valo de tiempo o de espacio.
La distribución de Poisson se utiliza para describir procesos, como, por
ejemplo:
• El número de clientes que llegan a un supermercado en un tiempo de
10 minutos.
• Número de faltas ortográficas cometidos en una página.
• Número de accesos al servidor web de una empresa en un minuto.

Características de una distribución de Poisson

• Los sucesos o eventos son independientes entre sí.


• El promedio de ocurrencias de un evento en un intervalo de longitud t es
la misma que en otro intervalo de la misma longitud y es proporcional a
su longitud (λt ) .
• La probabilidad de ocurrencia de un evento en un intervalo de tiempo
depende de la longitud del intervalo.

Capítulo 4. Distribuciones de probabilidad 221


• El interés es analizar el número de ocurrencias en un intervalo.
• La distribución de Poisson tiene un parámetro que se denota con λ y se
define como el número promedio de ocurrencias en la unidad especificada.

Función de probabilidad de Poisson

 e −λ λ x
 , x = 0 , 1, 2 , ...
P( X
= x=
)  x!
 0, en otro caso

Donde el valor de e = 2.71828 es conocido como el número de Euler o constante


de Napier, y λ representa el promedio de ocurrencias en la unidad especificada.

Esperanza y varianza de una distribución de Poisson

La esperanza viene dada por la siguiente expresión:


E( X ) = λ

La varianza viene dada por la siguiente expresión:


V (X) = λ

Gráfica de una distribución de Poisson:

Figura 15. Gráfica


de la distribución de
Poisson con promedio
(λ) =3.

222 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Ejemplo 6
Suponga que en un establecimiento de comida rápida se atiende a 50 clientes
por hora siguiendo una distribución de Poisson.
a. ¿Cuál es la probabilidad que se tenga que atender a menos de ocho clien-
tes entre las 5:00 p.m. y las 5:15 p. m.?
Solución
X: Número de clientes atendidos en una hora.
E( X ) = 50 clientes ⇒ X → Poisson (λ =50) por cada hora.
Y: Número de clientes atendidos en un cuarto de hora (15 minutos).
Y → Poisson (λ =12.5) por cada cuarto de hora.
7 e −12.512.5 y
P(Y < 8)
= ∑ = 0.06983
y =0 y!

b. Hallar la probabilidad de que entre las 4:00 p.m. y 4:30 p.m. se atienda a
más de 20 clientes.
Solución
W → Poisson (λ =25) por cada media hora.
∞ e −25 25w
P(W
= > 20) ∑ = 0.8145
w = 21 w!

Ejemplo 7
El promedio de ventas de televisores en las tiendas de Centro Plaza es de 6
cada dos horas. Si se supone que la venta de cada una de las tiendas es inde-
pendiente una de otra.
a. Si X representa el número de ventas cada 40 minutos, ¿cuál es la proba­
bilidad de que en un intervalo de 40 minutos no se realice venta alguna?
Solución
Cada 2 horas (120 minutos) se venden en promedio 6 televisores, enton-
ces, cada 40 minutos se venderán en promedio 2 televisores.
X: Número de ventas de televisores cada 40 minutos.
X → Poisson (λ =2) cada 40 minutos.
e −2 20
P( X= 0=
) = 0.135335
0!
Haciendo uso del software Minitab se procede de la siguiente manera:
En el menú principal, abrir la opción Calc> Probability Distributions>
Poisson> OK> en la ventana Poisson distribution marcar Probability> en
Mean=2 y en Input Constant=0> OK como se detalla en la figura 16.
.

Capítulo 4. Distribuciones de probabilidad 223


Figura 16. Secuencias
para determinar proba-
bilidad de la distribución
de Poisson.

Los resultados se presentan a continuación:


Probability Density Function
Poisson with mean = 2
x P(X = x)
1 0.135335

b. ¿Cuál es la probabilidad de que se realice al menos 4 ventas en el intervalo


de 60 minutos?
Solución
Cada 2 horas (120 minutos) se venden en promedio 6 televisores, enton-
ces, cada 60 minutos se venderán en promedio 3 televisores.
Y : Número de ventas de televisores cada 60 minutos.
Y → Poisson (λ =3) cada 60 minutos.
∞ e −3 3y
P(Y=
≥ 4) ∑ = 0.3528
y=4 y !

El procedimiento para calcular las probabilidades usando el software


Minitab es de la siguiente manera:
En el menú principal: Graph> Probability Distribution Plot. Seleccionar
la ventana View Probability> OK.
En la siguiente ventana en la pestaña: Distribution seleccionar Poisson
y digitar en Mean=3>, en el botón superior activar Shaded Area> X value>
Right Tail y en la ventana de X value digitar el número 4 y dar OK como
se muestra en la siguiente figura:

224 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Figura 17. Secuencia
para el cálculo de pro-
babilidad de una dis-
tribución de Poisson.

3. Distribuciones de probabilidad de variables aleatorias continuas

3.1 Distribución uniforme continua

La distribución uniforme continua es la más simple de las distribuciones con-


tinuas, cuya variable puede tomar valores comprendidos en el intervalo [a , b] .

Función de densidad de probabilidad uniforme

Se dice que una variable aleatoria X tiene una distribución uniforme si su fun-
ción de densidad de probabilidad está dada por:

 1
 , a< x<b;−∞<a<b<∞
f ( x) =  b − a
 0, otro caso

Capítulo 4. Distribuciones de probabilidad 225


Características de la distribución uniforme

• No tiene moda.
• Se distribuye uniformemente en el intervalo donde está definida.
• Las probabilidades son iguales en todo el rango de la variable.
• También se le conoce como distribución rectangular.

Función de distribución acumulada

0 , si x<a

x − a
=F ( x)  , si a ≤ x ≤ b
b − a
1 , si x>b

Esperanza y varianza de una distribución uniforme

La esperanza viene dada por la siguiente expresión:


a+b
E( X ) =
2

La varianza viene dada por la siguiente expresión:


(b − a)2
V (X) =
12

Gráfica de una distribución uniforme

Figura 18. Gráfica 1/ b − a


de una distribución
uniforme.

a
b

Ejemplo 8
Un servicio de llamadas telefónicas se ha diseñado de forma tal que el tiem-
po mínimo de espera de quien llame sea de 20 segundos y el máximo de 50
(tiempo de respuesta). Si los tiempos de respuesta se distribuyen uniforme-
mente, encuentre la probabilidad de que, al llamar una persona, tenga un
tiempo de respuesta.

226 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


a. Entre 25 y 45 segundos.
Solución
X = Tiempo de espera para que ingrese una llamada sigue una distribu-
ción Uniforme → U(20,50)
45 1
P( 25 ≤ X ≤=
45) ∫25 = dx 0.6667
30
b. Menor que 30 segundos o mayor que 40.
Solución
1 50 1
P( X < 30) + P( X > 40)= ∫20
30
dx + ∫40 dx= 0.333 + 0.333= 0.666
50 50

Ejemplo 9
Un corredor de inmuebles cobra honorarios fijos de 50 dólares más una co-
misión del 6 % sobre el beneficio obtenido por el propietario. Si este beneficio
es una variable aleatoria con distribución uniforme en el intervalo [0 , 12 000]
dólares.

a. ¿Cuánto espera obtener de utilidad (honorario fijo + comisión) el agente?


Solución
(a + b)
X: Beneficio → U [0,12000] ;=
E( X ) = 6000
2
Y: Utilidad = 50 + 0.06X
E(Y) = 50 + 0.06E(X) = 50 + 0.06 × 6000 = 410
b. ¿Cuál es la probabilidad de que su utilidad supere los US$ 600?
Solución
P(Y > 600) = P(50 + 0.06 × X > 600) = P( X > 9166.67) = 0.2361

Capítulo 4. Distribuciones de probabilidad 227


Figura 19. Secuencia
para el cálculo de pro-
babilidad de la distri-
bución uniforme.

Figura 20. Resultado


de probabilidad de la
distribución uniforme.

c. ¿Qué utilidad máxima podrá obtener el agente con probabilidad 0,90?


k − 50
P(Y=
≤ K ) 0.9; P(50 + 0.06X
= ≤ k ) 0.9; P( X ≤ = ) 0.9
0.06

Figura 21. Resultado


del valor de k de la
distribución uniforme.

 k − 50 
PX ≤ =0.9
 0.06 

k − 50
= 10800 , entonces, k = US$ 698
0.06

228 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


3.2 Distribución triangular

Es una distribución de probabilidad de una variable aleatoria continua y se uti-


liza para describir una población de la cual se dispone pocos datos, por ejemplo,
en la industria petrolera es costoso tomar datos y por lo tanto no es posible en la
mayoría de las situaciones modelar la población.

Función de densidad de probabilidad triangular

0 , x<a

 2( x − a) , a≤x≤c
 (b − a)(c − a)
f (X) 
 2(b − x) , c<x≤b
 (b − a)(b − c )

0 , x≥b

Características
Tiene tres parámetros.
El valor mínimo (a)
El valor máximo (b)
El valor modal (c)

Función de distribución acumulada

0 , x<a

 ( x − a) , a≤x≤c
 (b − a)(c − a)
F( x)= P( X ≤ x)= 
1 − (b − x) , c<x≤b
 (b − a)(b − c )

1 , x>b

Esperanza y varianza de la distribución triangular

a+b+c
E( X ) =
3

a2 + b2 + c 2 − bc − ac − ab
V (X) =
18

Capítulo 4. Distribuciones de probabilidad 229


Gráfica de una distribución triangular
f(x)

Figura 22. Función de


densidad de una distri-
bución triangular. 2/b–a

X
0 a c b

Ejemplo 10
Considere que el precio de un kilo de carne sigue una distribución triangu-
lar, donde el precio mínimo es de 10 dólares, el precio máximo 40 dólares y
el precio más común es el de 20 dólares.
Determine la probabilidad de que el precio de un kilo de carne sea a lo
más de 25 dólares.

Solución
X: precio de un kilo de carne sigue una distribución triangular.
P( X < 25) =
0.625
Utilizando el software Minitab se procede de la siguiente manera:

Figura 23. Secuencia


para el cálculo de pro-
babilidad de una dis-
tribución triangular.

230 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Figura 24. Resultado de
la probabilidad de una
distribución triangular.

3.3 Distribución normal

Abraham de Moivre (Francia, 1667-1754) fue elegido miembro de la Royal Socie-


ty de Londres en 1697, siendo muy reconocido por su trabajo en el campo de la
probabilidad y de la distribución normal.

Johann Carl Friedrich Gauss (1777-1855), alrededor de 1820 desarrolló nume-


rosas herramientas para el tratamiento de los datos observacionales, entre las
cuales destaca la curva de distribución de errores que lleva su nombre, conoci-
da también como la distribución normal y que constituye uno de los pilares de
la estadística, ya que es considerada la más importante de las distribuciones por
sus múltiples aplicaciones.

Características de la distribución normal

• Tiene forma de una campana.


• Es simétrica respecto a la media.
• La media, mediana y moda coinciden.
• Los puntos de inflexión de la curva se dan en x = µ − s; x = µ + s
• En el intervalo [µ − s , µ + s] incluye el 68.26 % de las observaciones.
• En el intervalo [µ − 2s , µ + 2s] , incluye el 95.45 % de las observaciones.
• En el intervalo [µ − 3s , µ + 3s] , incluye el 99.73 % de las observaciones.

Función de densidad de probabilidad normal

Una variable continua tiene una distribución normal, si su función de densidad


de probabilidad es:
( x −µ )2

1
=f ( x) e 2 s2 − ∞ < x < ∞; −∞ < µ < ∞; s > 0
2ps

Capítulo 4. Distribuciones de probabilidad 231


Esperanza y varianza de una distribución normal

La esperanza viene dada por la siguiente expresión:


E( X ) = µ

La varianza viene dada por la siguiente expresión:


V ( X ) = s2

Grafica de una distribución normal

Figura 25. Gráfica de


la distribución normal
con promedio 14, des-
viación estándar de 1.5.

Distribución normal estándar

Toda distribución normal puede ser estandarizada mediante la siguiente


transformación:
x−µ
z=
s

donde a la variable z se le llama normal estándar y tiene media 0 y varianza


unitaria.

Función de densidad de probabilidad normal estándar

La función de densidad de probabilidad de la variable aleatoria Z es


Z2
1 −
f (Z)
= e 2 −∞<Z<∞
2p

Esperanza y varianza de una distribución normal estándar

La esperanza viene dada por la siguiente expresión:


E(Z) = µ = 0

232 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


La varianza viene dada por la siguiente expresión:
V (Z) =s2 =1

Gráfica de una distribución normal estándar

Figura 26. Gráfica de


la distribución normal
estándar.

Ejemplo 11
Un constructor afirma que el tiempo necesario para completar un proyecto
de construcción se puede representar mediante una variable aleatoria normal
con una media de 60 semanas y desviación estándar de 8 semanas.
a. Calcular la probabilidad de que el tiempo necesario para terminar un pro-
yecto de construcción supere las 70 semanas.
Solución

P( X > 70) =
0.1056
Haciendo uso del software Minitab se procede de la siguiente manera: en el
menú principal clicar la opción Graph> Normal> View Probability> OK en
Distribution elegir Normal> en Mean digitar 60 y en Standard Deviation
digitar 8> en la ventana Shaded Area> marcar X value> ventana X value>
seleccionar Right tail/ digitar en la ventana X value digitar 70> OK.

Capítulo 4. Distribuciones de probabilidad 233


Figura 27. Pasos para
hallar una distribución
normal.

En la siguiente gráfica se encuentra el valor de la probabilidad que es 0.1056

Figura 28. Resultado


de probabilidad de una
distribución normal.

234 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


b. Calcular la probabilidad de que la duración del proyecto sea inferior a 52
semanas.
Solución
De igual forma, se calcula la siguiente probabilidad
P( X < 52) =0.1587

Figura 29. Resultado de


probabilidad de la distri-
bución normal.

c. Calcular la probabilidad de que la duración del proyecto esté comprendi-


da entre 56 y 64 semanas
Solución
Haciendo uso del software Minitab y siguiendo las instrucciones del ejerci-
cio anterior se obtiene lo siguiente:
P(56 < X < 64) = 0.3829

Figura 30. Resultado


de probabilidad de una
distribución normal.

Capítulo 4. Distribuciones de probabilidad 235


Ejemplo 12
En una pizzería se ha determinado que el tiempo que se demora en entregar
una pizza al cliente, desde que el cliente realiza el pedido hasta que lo reci-
be, se distribuye normalmente con una de media de 12.3 y una desviación
estándar de 1.7 minutos. Para atraer clientes se ha diseñado una campaña
publicitaria en la que la pizza será gratis si se demoran más de 15 minutos
para su entrega. ¿Qué proporción de pizzas no se cobrarían por ese motivo?

Solución
X: Tiempo que se demora la pizzería en entregar la pizza solicitada.
X → N(
= µ 12.3=
; s 1.7)
P( X > 15) =
0.05612
Haciendo uso del software Minitab se procede como en el ejercicio anterior
de la siguiente manera:

Figura 31. Secuencia


de una distribución
normal.

236 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Figura 32. Resultado
de probabilidad de una
distribución normal.

Ejemplo 13
Los paquetes grandes de café MÓNACO señalan en la etiqueta un contenido
neto que debería ser de 4 kg. En el departamento de empaque saben que el
contenido neto en peso es ligeramente variable y han estimado que la des-
viación estándar es de s =0.04 kg. Además, aseguran que sólo 2 % de los
paquetes contiene menos de 4 kg. Si se supone una distribución normal.

a. Determine el peso promedio y luego calcule el porcentaje de paquetes con


un peso superior a 4.13 kg.
Solución
X : Peso de los paquetes de café MÓNACO
X → N (µ; s =0.04)
Para calcular el promedio se hace uso de la normal estándar de la si-
guiente manera:
X −µ 4−µ  4−µ
P( X < 4) =P  <  =P  Z <  =0.02
 s 0.04   0.04 

Utilizando el software Minitab de la siguiente manera: ingresar al me-


nú principal, en la opción Graph> seleccionar View Probability> OK> en
Distribution, seleccionar Normal> en Mean, digitar 0 y en Standard devia-
tion, digitar 1> seleccionar Shaded Area>dar clic en Probability>seleccionar
Left Tail>en la ventana de Probability digitar 0.02> OK

Capítulo 4. Distribuciones de probabilidad 237



El resultado del valor de Z 0 se presenta en la siguiente gráfica.

4−µ
Z0 = = −2.054; µ = 4.08
0.04
Por lo tanto: X → N
= (µ 4.08=
; s 0.04)
Para calcular el porcentaje de paquetes con un peso superior a 4.13 ha-
ciendo uso de la normal con los parámetros señalados.
P( X > 4.13)
Haciendo uso del software Minitab y siguiendo el procedimiento del
ejemplo 11 se obtiene lo siguiente:

238 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


P( X > 4.13) =
0.1056

b. De acuerdo con su peso, los paquetes se clasifican en 3 categorías, como


sigue:
Categoría A (los más livianos) son el 10 %, Categoría B (los de peso
intermedio) son el 85 % y el 5 % restante (los más pesados) están en la ca-
tegoría C. Calcule los valores límite del peso en cada categoría.

Capítulo 4. Distribuciones de probabilidad 239


Solución
Haciendo uso del Minitab y siguiendo el procedimiento del ejemplo
an­te­rior se obtiene lo siguiente:

Para la categoría A: Peso máximo es de 4.029 kg.


Para la categoría B: Los pesos están entre 4.029 y 4.146 kg.
Para la categoría C: Desde 4.146 kg a más.

3.4 Distribución exponencial

Se utiliza en casos referentes a tiempo de funcionamiento, vida útil, duración del


tiempo de trabajo sin fallas de un componente, etc.

Función de densidad de probabilidad exponencial

Una variable aleatoria continua tiene una distribución exponencial si su función


de densidad es:
1 −x
 e b , x > 0, b > 0
f ( x) =  b

0 , en otro caso

Características de la distribución exponencial

• Solo está definida para valores positivos.


• Es asintótica al eje horizontal.
• Es monótona decreciente.

Función de distribución acumulada


0 ,x < 0
F ( x) =  −( x / b )
1 − e
 ,x≥0
Donde e = 2.71828

240 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Esperanza y varianza de una distribución exponencial

La esperanza viene dada por la siguiente expresión:


E( X ) = b

La varianza viene dada por la siguiente expresión:


V ( X ) = b2

Gráfica de una distribución exponencial

Figura 33. Gráficas


de la distribución
exponencial con
b 1 y=
= b 2.

Ejemplo 14
Suponga que un diseñador debe decidir entre dos procesos de manufactura
para la fabricación de cierto componente. Empleando el proceso A, cuesta
S/ 2.50 fabricar un componente. Empleando el proceso B, cuesta S/ 3.00 fabri-
car un componente. Los componentes tienen una distribución exponencial
de tiempo transcurrido hasta la falla con medias de 200 y 350 horas, respec-
tivamente, para los dos procesos. Debido a una cláusula de garantía, si un
componente dura menos de 400 horas, el fabricante debe pagar una pena de
S/ 1.20. ¿Cuál proceso debe adoptar el diseñador?

Solución
Si analizamos el problema vemos que el costo de producción del proceso A
es menor, pero, por otro lado, si analizamos el tiempo de duración vemos que
el tiempo de vida promedio del proceso B es mayor. Se tiene incertidumbre
en la decisión, y debemos usar un procedimiento estadístico que involucre
ambos factores, en este caso es el valor esperado
Wi: Tiempo transcurrido hasta que se presente la falla en el componente pro-
ducido con el proceso i.
i = A, B

Capítulo 4. Distribuciones de probabilidad 241


Costo adicional si
Proceso Costo
Wi < 400 horas
A 2.5 1.2
B 3.0 1.2

Tabla de probabilidades:
Proceso P(Wi ≥ 400 h) P(Wi < 400 h)
A 0.1353 0.8647
B 0.3189 0.6811
Sea:
Xi: Costo por cada componente producido con el proceso i.
E(X A): 2.5(0.1353) + (2.5 + 1.2)(0.8647) = S/ 3.53764
E(XB): 3.0(0.3189) + (3.0 + 1.2)(0.68117) = S/ 3.81732
Se debe adoptar el proceso A, ya que presenta el menor costo esperado de
producción.

Ejemplo 15
El tiempo de vida de un determinado producto es una variable que tiene
una distribución exponencial, con una desviación estándar de 6 horas. Si el
tiempo de vida es mayor que 6 horas, la utilidad por producto es el 20 % de
su costo de fabricación C en soles; mientras que, si dura menos de 6 horas, se
pierde el 10 % de su costo C. ¿Para qué valor de C se tiene una utilidad espe-
rada mayor que 0? por producto?

Solución
X: tiempo de vida del producto.
X → Exponencial (b =6)
U: utilidad asociada por cada producto.
X → Exponencial (b =6)

Tiempo de vida X Probabilidad Utilidad U


X>6 P(X > 6) = 0.3679 0.2C

X≤ 6 P(X ≤ 6) = 0.6321 –0.1C

Hallar C, tal que: E(U) > 0.1


E(U) = 0.2C(0.3679) + (–0.1C)(0.6321) > 0.1
E(U) = 0.07358C – 0.06321C = 0.01037C > 0.1
Entonces: C > S/ 9.6432

3.5 Distribución gamma

La distribución gamma es una generalización del modelo exponencial, y se uti-


liza para modelar las variables asociadas al tiempo que transcurre hasta que se
produce una determinada cantidad de veces un suceso de interés.

242 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Función de densidad de probabilidad gamma

Una variable continua tiene una distribución gamma si su función de


densidad es:
 −
x
 1 xa−1e b , x > 0, a > 0, b > 0
f ( x) =  Γ(a)ba

 0 , x≤0

Donde e = 2.71828

Características de la distribución gamma

• Γ(a) es la función gamma y se define como:



Γ(a) =∫ X a−1e − x dx , con las siguientes propiedades:
a
Para cualquier entero positivo: Γ(a) = (a − 1)!
Para cualquier a > 1; Γ(a) = (a ­ 1)! Γ(a ­ 1)
1
Γ   =p
2
• Si a =1, entonces, f ( x) es la función de densidad de la distribución expo-
nencial con parámetro b.
• Si a n/
= =2 y b 2 , entonces, f ( x) es la llamada función de densidad de
la distribución ji-cuadrado con n grados de libertad.

Gráfica de una distribución gamma

Capítulo 4. Distribuciones de probabilidad 243


Ejemplo 16
Supongamos que el tiempo que transcurre entre la entrada y la salida de un
cliente a un supermercado sigue una distribución gamma con parámetros
a 4 y=
= b 1/ 2.
Si un cliente cualquiera entró a las 11:00 horas, ¿cuál es la probabilidad de
que salga del supermercado entre las 12:00 y las 13:00 horas?

Solución
X: tiempo que transcurre entre la entrada y la salida de un cliente a un su-
permercado.
X → Gamma=
(a 4 y=b 0.5)
P(1 ≤ X ≤ 2) =
0.423
Haciendo uso del software Minitab el procedimiento se presenta
a continuación:

Figura 34. Gráficas de la


distribución gamma con
a= 1, b= 1 y a= 2, b= 1.

244 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Figura 35. Secuencia
para calcular la probabi-
lidad de una distribución
gamma.

3.6 Relación entre las distribuciones de Poisson, exponencial y gamma

3.6.1 Relación de la distribución de Poisson con la distribución exponencial

Una de las aplicaciones más importantes de la distribución exponencial es aque-


lla en las que se encuentran asociadas al proceso de Poisson y su correspondien-
te distribución.
Sea X una variable aleatoria de Poisson que representa el número de eventos
que ocurren en un intervalo de tiempo con un parámetro λ , donde λ puede
interpretarse como el número promedio de eventos por unidad de tiempo. Con-
sideremos ahora la variable aleatoria Y como el tiempo que se requiere para que
ocurra el primer evento, entonces se puede demostrar que Y es una variable
1
aleatoria con una distribución exponencial y con parámetro b = del intervalo
λ
de medición considerado.

Ejemplo 17
El número promedio de robos que ocurre en una capital de un país es de 5
en 60 minutos. Suponiendo que el número de robos siga una distribución de
Poisson.
a. Determine la probabilidad de que en 1 hora ocurra exactamente 3 robos.
Solución
X: número de robos en 60 minutos.
X → Poisson (λ =5) cada 60 minutos.
e −5 × 53
P( X= 3=
) = 0.140374
5!

b. ¡Acaba de ocurrir un robo! Determine la probabilidad de que transcurra


menos de 20 minutos para que ocurra el siguiente robo.
Solución
1 1
b= = = 0.2 de cada 60 minutos, es decir, b =12 minutos.
λ 5

Capítulo 4. Distribuciones de probabilidad 245


Y : Tiempo transcurrido entre un robo y otro.
Y → Exp( b =12 minutos)
y
1 −12 20
P(Y <=
20) ∫ e= 0.811
0 12

3.6.2 Relación de la distribución de Poisson con la distribución gamma

Sea una variable aleatoria X que se distribuye como una de Poisson, donde X
representa el número de eventos en un determinado intervalo de tiempo. Esta
variable aleatoria X se relaciona con la variable aleatoria Y, que representa el
tiempo entre un evento hasta la presencia del siguiente evento, esta variable Y
se distribuye como una exponencial. Se define la variable aleatoria W que repre-
senta el tiempo hasta que transcurra el k-ésimo evento, entonces W se distribuye
1
como una gamma con parámetro (a , b) donde a es entero y b = .
λ

Ejemplo 18
A un servidor web llegan en promedio 3 requerimientos cada 30 segundos.
Calcule lo siguiente:
a. Probabilidad de esperar más de un cuarto de hora para que lleguen 80
requerimientos.
b. Probabilidad de esperar menos de 10 minutos para que lleguen 50
requerimientos.

Solución
X: Número de requerimientos que llegan al servidor cada 30 segundos.
X → Poisson (λ =3) cada 30 segundos.
1 1  1  1  1
b= = de cada 30 segundos (1/2 minuto), es decir,
= b =   minuto
λ 3  3  2  6
a. Y: tiempo de espera, en minutos, hasta que lleguen 80 requerimientos
Y → Gamma =
( a 80, =
b 1=
/ 6 0.16667)
P(Y > 15) =
0.1332
b. W: tiempo de espera, en minutos, hasta que lleguen 50 requerimientos
W → Gamma =
(a 50 , =
b 0.16667)
P(W < 10) = 0.9156

3.7 Distribución de Weibull

La distribución de Weibull fue establecida por el físico suizo del mismo nombre
quien demostró, con base a una evidencia empírica, que el esfuerzo al que se
someten los materiales se puede modelar apropiadamente mediante el empleo

246 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


de esta distribución. En los últimos años, esta distribución se utiliza como mo-
delo para situaciones del tipo tiempo-falla con el objetivo de evaluar una amplia
variedad de componentes mecánicos y eléctricos.

Función de densidad de probabilidad de Weibull

Una variable continua X tiene una distribución de Weibull si su función


de densidad es:
 x
−( )a
 a xa−1e b , x > 0 , a > 0 , b > 0
f ( x ) =  ba

 0 , x≤0

Donde a es conocida como el parámetro de forma, y b como el parámetro de


escala, además el valor de e = 2.71828.

Características de la distribución de Weibull

• El parámetro a indica el comportamiento de la tasa de fallos con el trans-


curso del tiempo, tal que:
– a < 1 indica que la tasa de fallos decrece con el tiempo
– a =1, indica que la tasa de fallos es constante en el tiempo
– a > 1, indica que la tasa de fallos crece con el tiempo.
• Si a =1, entonces, f ( x) corresponde a una función de densidad de la dis-
tribución exponencial con parámetro b.

Función de distribución acumulada

Sea x una variable aleatoria continua de Weibull con parámetros a y b , enton-


ces su función de distribución es:
0 ,x < 0
F ( x) = 
−( x / b)a
1 − e ,x≥0

Esperanza y varianza de una distribución de Weibull

La esperanza viene dada por la siguiente expresión:


 1
E( X ) = bΓ 1 + 
 a

Capítulo 4. Distribuciones de probabilidad 247


La varianza viene dada por la siguiente expresión:

  1   1   
2

V (X) =
b Γ  1 +  −  Γ  1 +   
2
a    a  
  

Gráfica de una distribución de Weibull

Figura 36. Gráficas


de la distribución
de Weibull con
a= 2, b= 5 y a= 2 , b= 1.

Ejemplo 19
La duración X, en cientos de horas, de cierto tipo de tubo al vacío tiene una
distribución de Weibull con parámetros= a 2 y= b 3. Calcule:
a. El valor esperado y la desviación estándar de X.
b. El porcentaje de tubos con duraciones inferiores a 600 horas.
c. El porcentaje de tubos con duraciones entre 150 y 500 horas.

Solución
X: duración, en cientos de horas, del tubo al vacío.
X Weibull(a = 2, b = 3)
 1
a. E( X ) == (0.886227) 2.658681
3Γ 1 +  3=
 2
  1    1  2 
 
V ( X ) = 32 Γ 1 +  − Γ 1 +    = 9(0.886227 − 0.886227 2 ) = 0.907458
  2    2   

b. P( X < 6) =
0.981
NOTA: 600 horas se representa como 6 cientos de horas
Haciendo uso del software Minitab, el procedimiento se muestra a
continuación:

248 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Figura 37. Secuencia para
calcular la probabilidad de
una distribución de Weibull.

Figura 38. Resultado


de la probabilidad de
una distribución de
Weibull.

c. P(1.5 < X < 5) = 0.7166

Capítulo 4. Distribuciones de probabilidad 249


Ejemplo 20
El tiempo en horas para la falla de un material aislante sólido sometido a
voltaje de corriente alterna tiene distribución de Weibull con a = 2.5 y b = 200
a. Calcule la probabilidad de que la duración de un material sea de a lo más
200 horas.
b. ¿Qué valor es tal que exactamente 50 % de todos los especímenes tengan
duraciones que excedan dicho valor?

Solución
a. X: Tiempo de duración de material aislante → Weibull=
(a 2.5;=
b 200)

P ( X ≤ 200) = 0.6321
b. P ( X > k=
) 0.5; =
k 172.7

3.8 Distribución ji-cuadrado

La distribución ji-cuadrado es muy importante en las aplicaciones de inferencia


estadística como las pruebas de independencia y de bondad de ajuste, entre otras.
Se dice que una variable aleatoria continua sigue una distribución ji-cuadrado
) con v grados de libertad si su función de densidad es:
( χ 2v
 1 v −1 − x
 x 2 e 2 , si x > 0 , v > o
 v
f ( x) =  2 v / 2 Γ  
 2
0 , si x ≤ 0

Donde v es un parámetro cuyo nombre es “grados de libertad” y es el tamaño
v
de la muestra, y Γ   representa la función gamma evaluada en v/2. Además,
2
el valor de e = 2.71828.

Características:

• Es una distribución asimétrica positiva


• Las puntuaciones de la ji-cuadrado no pueden ser negativas.
• Se aproxima a la distribución normal cuando el tamaño de la muestra es
grande.
• Si el valor de v = 2, la variable aleatoria ji-cuadrado es igual a una variable
aleatoria exponencial con b =2 .
• Si el valor de v =2, la variable aleatoria ji-cuadrado es igual a una variable
aleatoria gamma con = a v / 2=; b 2.

250 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


• La distribución ji-cuadrado posee la propiedad reproductiva es decir si:
X1, X2 , X3 ..., Xv son variables aleatorias mutuamente independientes con

distribución ji-cuadrado respectivamente, con v1 , v2 ,..., vn grados de liber-
tad, entonces la variable aleatoria Y = X1 + X2 + ... + Xn tiene una distribu-
ción ji-cuadrado con v = v1 + v2 + ... + vn .
• La distribución ji-cuadrado está relacionada con la distribución normal,
respecto a lo siguiente: al extraer una muestra aleatoria de una población
N(µ; s2 ) , y estandarizar las variables se tiene lo siguiente:
x1 − µ x2 − µ xv − µ
; ;... , al elevar al cuadrado cada una de ellas y sumarlas
s s s
2
v  x −µ
∑ i  → χ v , este resultado es una variable aleatoria ji-cuadrado
2
s 
i =1 
con v grados de libertad.

Esperanza y varianza de una distribución ji-cuadrado

E( x) = v
V ( x) = 2v

Gráfica de una distribución ji-cuadrado

Figura 39. Gráfica de


la distribución de pro-
babilidad ji-cuadrado
con diversos grados de
libertad.

Ejemplo 21
Considere a X como una variable aleatoria con distribución ji-cuadrado con
18 grados de libertad.
a. Determine la probabilidad de que X sea a lo más de 12.
b. ¿Cuál es el valor de k, si X sobrepasa a este valor con una probabilidad
de 0.95?

Capítulo 4. Distribuciones de probabilidad 251


Solución
a. Haciendo uso de Minitab el procedimiento se presenta a continuación:

Figura 40. Uso del co-


mando Chi-Square del
software Minitab.

Resultado: P( X < 12) =


0.1528

252 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


b. P( X > K ) =
0.95
Haciendo uso del software Minitab, el procedimiento se presenta a conti-
nuación:

Figura 41. Uso del


comando Chi-Square
del software Minitab.

0.95; el valor de k = 9.39


P( X > K ) =

Ejemplo 22
Sea X una variable aleatoria con distribución Ji-cuadrado con 20 grados de
libertad.
a. Determine la probabilidad de que X sea por lo menos 15.35
b. Determine la esperanza y la varianza de X.

Capítulo 4. Distribuciones de probabilidad 253


Solución
a. Para calcular P ( X > 15.35) =
0.7560
b. E( X ) 20
= =; V (X) 4

3.9 Distribución t de Student

La distribución t de Student fue creada por William Sealy Gosset, más conocido
por su pseudónimo literario Student. Esta distribución de probabilidad es muy
importante cuando se desea realizar una inferencia para la media poblacional y
no se conoce la desviación estándar poblacional con la condición de que la dis-
tribución original es aproximadamente normal.
Se dice que una variable aleatoria continua sigue una distribución t con v
grados de libertad si su función de densidad es:

Función de densidad de probabilidad t de Student

  v +1
 Γ
 2 
f ( x)  
1
= v +1
, − ∞ < x < ∞; v > 0
 Γ  v  vp  2  2
  2  x
1 + 
 v 

Donde v son los grados de libertad


Γ( ) = es la función gamma

Características

• Es una distribución simétrica.


• La distribución t es parecida a una distribución normal estándar.
• En una distribución t las colas son más “pesadas” que una distribución
norma estándar (Z), es decir, que en la distribución t es más probable en-
contrar valores alejados de la media, en comparación a la distribución Z.
• La distribución t está relacionada con la distribución normal y la ji-cuadrado
de la siguiente manera:
Z
T
= → t( v )
Y
v

Z → N (0,1); Y → χv2

254 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Esperanza y varianza de una distribución t de Student

E( X ) = 0
v
=V (X) , v>2
v−2

Gráfica de una distribución t de Student

Figura 42. Gráfica de la


distribución de probabi-
lidad de la t de Student
con 5 y 30 grados de
libertad.

Ejemplo 23
Sea X → t(18) , determine las siguientes probabilidades:
a. P( X > 2)
b. P( x ≤ 2.5)

Solución
a. Haciendo uso del software Minitab se procede de la siguiente forma:

Capítulo 4. Distribuciones de probabilidad 255


P ( X > 2) = 0.03041

b. Haciendo uso del software Minitab se procede de la siguiente manera:

P ( x ≤ 2.5) = 0.9777

3.10 Distribución F de Fisher-Snedecor

La distribución F es muy importante en las aplicaciones de inferencia estadística


como en el análisis de varianzas, también se le conoce como la distribución F de
Fisher-Snedecor.

256 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Función de densidad de probabilidad F (Fisher)

Se dice que una variable aleatoria continua sigue una distribución F con m y n
grados de libertad si su función de densidad es:
 m+n m m−2
 Γ 
  2   m  2 x 2
  , si x > 0, m > 0, n > 0

f ( x) =  Γ  m  Γ  n   n 
m+n
 m  2
  2  2 1 +   x 
  n 
0 , si x ≤ 0

Donde m representa los grados de libertad del numerador, y n a los grados de


libertad del denominador, y Γ( ) es la función gamma.

Características

• Notación: X tiene una distribución F con m y n grados de libertad se deno-


ta como F( m ,n)
• Es una distribución asimétrica a la derecha.
• La distribución F es muy parecida a la distribución ji-cuadrado, pero se
encuentra centrada respecto a uno.
• La distribución F es el resultado de dividir 2 variables aleatorias del tipo
ji-cuadrado divididas entre sus grados de libertad mediante el siguiente
esquema: X
m nX
Sean X → χ( m) y Y → χ( n) , la variable W
2 2
= = tiene una distri-
Y mY
n
bución F con m y n grados de libertad.

Esperanza y varianza de una distribución F

n
E( X ) =
n−2

2n2 ( m + n − 2)
V (X) = con n > 4
m(n − 2)2 (n − 4)

Capítulo 4. Distribuciones de probabilidad 257


Gráfica de una distribución F

Figura 43. Gráfica de la


distribución F con diver-
sos grados de libertad.

Ejemplo 24
Sea X una distribución F con 16 y 20 grados de libertad, calcular las siguien-
tes probabilidades:
a. P(X< 2.4)
b. P(1.2< X <2.2)

Solución
a. Haciendo uso del software Minitab se procede de la siguiente manera:

Figura 44.
Secuencia del
comando F.

258 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Figura 45. Resultado
de la probabilidad.

P( X < 2.4) =
0.9670

b. Haciendo uso del software Minitab se procede de la siguiente manera:

Figura 46. Secuencia


del comando F.

P(1.2 < X < 2.2) =


0.2969

Capítulo 4. Distribuciones de probabilidad 259


4. Problemas resueltos

1. Un informe del diario Gestión indica que el 58 % de los trabajadores de


Lima tienen sueldos superiores al mínimo vital. Si usted entrevista a 50
trabajadores elegidos al azar, hallar la probabilidad de que:

a. Más de 36 de ellos tengan sueldos superiores al mínimo vital.


Solución
X: número de trabajadores son sueldos superiores al mínimo vital
X → B (n = 50; p = 0.58)
36  50 
( X > 36=) 1 – P( X ≤ 36
=) 1 − ∑  0.58x (0.42)50− x =
1 – 0.9858 =
0.0142
x =0 
x 

Usando el software Minitab se obtiene lo siguiente:

b. Se observe que a lo más 20 de ellos tengan sueldos inferiores al mínimo


vital.
Solución
X → B(n = 50; p = 0.42)
20  50 
x 50 − x
P( X ≤ 20) =
∑  0.42 (0.58) = 0.4461
0 x 

c. Más de 30 pero menos de 40 tengan sueldos superiores al mínimo vital
Solución
X → B(n = 50; p = 0.58)

260 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


P(30 < X < 40)= P(31 ≤ X ≤ 39)= P( X ≤ 39) – P( X ≤ 30)=

0.9991 − 0.6638 =
0.3353

2. Un comerciante ha comprado en un remate de aduanas un lote de 10 tele-


visores full HD de 42’’ y pagó USD 3500 por todo el lote. Cada televisor en
buenas condiciones lo puede vender a USD 600, pero si el televisor necesita
alguna reparación lo vende a USD 250. En remates similares se sabe que el
80 % de los televisores adquiridos están en buenas condiciones.

a. ¿Cuál es la probabilidad de que más de la mitad de televisores compra-


dos estén en buenas condiciones
Solución
X: número de televisores buenos RX = 0, 1, 2, …, n
X → b(n = 10; p = 0.80)
10  10 
P( X > 5)= P ( X ≥ 6 )= ∑  0.8x (0.2)10− x =
0.9672
6 
x 

b. ¿Cuál es la ganancia neta esperada del comerciante por la compra de los


10 televisores?
Solución
Y: ganancia neta con los 10 televisores.
600X + 250(10 – X ) – 3500 =
Y= 350X – 1000
E(Y ) =×
350 8 – 1000 =
USD 1800

c. ¿Cuál es la probabilidad de que su ganancia neta sea inferior a USD 750?


P(Y < 750) = P(350X – 1000 < 750) = P( X < 5) = P( X ≤ 4) = 0.00637

3. Los impulsos provenientes de una fuente emisora tienen una intensidad


(en kg.m2/s) que es considerada una variable aleatoria X cuya función de
distribución es:
0 , x≤0
 4
x
F ( x) 
= , 0<x<3
 81
1 , x≥3

Si se observan 10 de estos impulsos cuyas intensidades se consideran
independientes, ¿cuál es la probabilidad de que a lo más 3 de ellos tengan
una intensidad superior a 2?

Capítulo 4. Distribuciones de probabilidad 261


Solución
Y: número de impulsos con intensidad X > 2
n = 10; p = P(X > 2) = 1 – 16/81 = 0.1975
Y → B(n = 10; p = 0.1975)
3  10 
P(Y ≤ 3) = ∑  0.1975x (0.8025)10− x = 0.8835
0 
x 

4. Ciertas piezas deben estar pintadas y para que estén aptas para la venta
deben tener la pintura en buenas condiciones. El 4 % de dichas piezas tiene
poca pintura y el 5 % tienen en exceso. El 99 % de las que tienen exceso no
están aptas para la venta, lo mismo ocurre con el 90 % de las que tienen
poca pintura.
Calcular:
a. La probabilidad de que una pieza esté apta para la venta.
b. Si de una producción de 200 piezas se eligen, al azar y sin reposición, 12,
¿cuál es la probabilidad de que a lo más una de ellas esté mal pintada?
Solución
P: poca pintura, E: exceso de pintura, N: pintura normal
A: pieza apta para la venta

A A Total

P 0.0040 0.0360 0.04

N 0.9100 0.0000 0.91

E 0.0005 0.0495 0.05

Total 0.9145 0.0855 1.00

a. P(A) = 0.9145

b. N = 200, M = (0.04 + 0.05)(200) = 18, n = 12


Y: número de piezas mal pintadas
Y → H(N = 200; M = 18; n = 12)
1  18  182 
∑   
y = 0  y  12 − y 

 0.7054
P(Y ≤ 1)
= =
 200 
 
12 

262 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


5. Un mayorista que vende focos de 30 vatios aceptará un lote de 120 piezas
a un fabricante si no encuentra más de 4 focos defectuosos en una
muestra de 20.
a. ¿Cuál es la probabilidad de encontrar 3 defectuosos en una muestra de
20, si se sabe que en el lote hay 4 defectuosos?
b. ¿Cuál es la probabilidad de aceptar el lote si se sabe que en el lote hay 6
defectuosos?
Solución
a. X: número de focos defectuosos seleccionados.
X → H ( N =120; M =4; n =20 )

 4 116 
  
 3 17 
P( X= 3=
)   = 0.0138778
120 
 
 20 
 
Usando el software Minitab se obtiene lo siguiente:

Probability Density Function


Hypergeometric with N = 120, M = 4, and n = 20
x P(X = x)
2 0.0138778
b. Y: número de focos defectuosos seleccionados.
Y → H (N =120; M =6; n =20)

4  6  114 
∑   
y = 0  y  20 − y 
P(Y ≤ 4)
= =   0.9996
120 
 
 20 
 

6. Un lote contiene 80 artículos del proveedor A y 100 del proveedor B. Se elige


una muestra aleatoria de tamaño 5 sin reemplazo.
a. Determine la probabilidad de que en la muestra se elija 2 artículos sean
del proveedor A y 3 del proveedor B.
b. Cuál es la probabilidad de que en la muestra no haya ninguno del pro-
veedor A.

Capítulo 4. Distribuciones de probabilidad 263


Solución
a. Determine la probabilidad de que en la muestra se elija 2 artículos sean
del proveedor A y 3 del proveedor B.
X: número de artículos del proveedor A.
X → H (N = 180; M = 80; n = 5)

 80 100 
  
 2  3 
P( X= 2=
)   = 0.3432
180 
 
5 
 

b. ¿Cuál es la probabilidad de que en la muestra no haya ninguno del pro-


veedor A?
 80 100 
  
 0  5 
P( X= 0=
)    0.0505676
=
180 
 
5 
 

7. A una garita de peaje, en promedio, llegan 240 autos por hora. El adminis-
trador de la garita ordena atender inicialmente solamente una caseta, pero
si en el lapso de 2 minutos llegan por lo menos 10 autos, entonces ordena
atender en una caseta más hasta que se produzca el descongestionamiento.
¿Cuál es la probabilidad de que el administrador tenga que ordenar atender
en otra caseta?
Solución
X = Número de autos que llegan a la garita de peaje en 2 minutos.
X ~ P ( λ =8 ) cada 2 minutos
e -8 8x
P[X= x= ]
x!
P[X ≥ 10] =−
1 P[X < 10] =−
1 P[X ≤ 9] =−
1 0.716624 =0.283376

8. Los accidentes laborales diarios de una empresa siguen una distribución de


Poisson con promedio de 0.4. Calcular lo siguiente:
a. La probabilidad de que en un día se produzcan por lo menos dos accidentes.
b. La probabilidad de que se produzcan 4 accidentes en 6 días.
c. La probabilidad de que haya un accidente hoy y ninguno mañana.

264 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Solución
a. La probabilidad de que en un día se produzcan por lo menos dos accidentes
X: número de accidentes diarios.
X → Poisson (λ = 0.4) cada día
∞ e −0.4 × 0.4 x
=
P ( X ≥ 2) ∑ = 0.06155
2 X!
Usando el software Minitab: Graph> Probability Distribution Plot> View
Probability> OK> Distribution> Poisson> Mean=0.4> Shaded Area> X
value> Right Tail> X value=2> OK, y se obtiene el siguiente valor:

b. La probabilidad de que se produzcan 4 accidentes en 6 días.


Como en promedio ocurren 0.4 accidentes cada día, entonces, cada se-
mana de 6 días ocurrirán 0.4(6) = 2.4 accidentes.
Y → Poisson (λ = 2.4) cada semana
e −2.4 × 2.44
P(Y= 4)= = 0.125408
4!
Haciendo uso del software Minitab mediante la opción: Calc> Probability
Distribution > Poisson >Probability > Mean=2.4 > Input constante=4, se
obtiene:
Probability Density Function
Poisson with mean = 2.4
x P(X = x)
4 0.125408

Capítulo 4. Distribuciones de probabilidad 265


c. La probabilidad de que haya un accidente hoy y ninguno mañana.
X: número de accidentes diarios.

X → Poisson (λ = 0.4) cada día

 e −0.4 × 0.4  e −0.4 × 0.40 


P ( X= 1) P ( X= 0)=  
 =
 0.9384
 1!  0! 

9. Para la fabricación de hojalata mediante el método Bessemer se producen


0.3 imperfecciones por minuto.
a. Determinar la probabilidad de no encontrar imperfecciones en un minuto.
b. Determinar la probabilidad de encontrar a lo más dos imperfecciones en
dos minutos.
c. El jefe de planta indica que, si encontraran por lo menos 2 imperfeccio-
nes en dos minutos, se tomaría la decisión de cambiar el método. ¿El jefe
de planta cambiaría de método?
Solución
X: número de imperfecciones que se presentan cada minuto.
X → Poisson (λ = 0.3) cada minuto.
a. Determinar la probabilidad de no encontrar imperfecciones en un minuto.
e −0.3 × 0.30
P ( X= 0)
= = 0.740818
0!
b. Determinar la probabilidad de encontrar a lo más dos imperfecciones en
dos minutos.
Y: Número de imperfecciones que se presentan cada 2 minutos.
Y → Poisson (λ = 0.6) cada 2 minutos.

2 e −0.6 × 0.6 y
=
P (Y ≤ 2) ∑ = 0.9769
y =0 y!

c. El jefe de planta indica que, si encontraran por lo menos 2 imperfeccio-


nes en dos minutos, se tomaría la decisión de cambiar el método. ¿El jefe
de planta cambiaría de método?
Y → Poisson (λ = 0.6) cada 2 minutos.
∞ e −0.6 × 0.6 y
=
P (Y ≥ 2) ∑ = 0.1219
y =2 y!

266 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


10. Por la venta de un producto, una empresa obtiene ingresos diarios que se
pueden representar mediante una variable aleatoria X con distribución
uniforme. Si se sabe que el ingreso mínimo es de 180 soles y que en 1 de
cada 10 días los ingresos superen los 378 soles, calcule el coeficiente de va-
riación de X.
Solución
X: ingreso diario.
X → U=
(a , b ?)
180=
1 b − 378
P( X > 378=
) ⇒ = 0.1; b= 400
10 b − 180

180 + 400 (400 − 180) 2


=
F(X ) = 290; = V (X ) = 4 033.33
2 12
s =63.51
63.51
C.V .( X )= × 100= 21.89%
290

11. En una determinada zona de la ciudad existen dos bancos comerciales: A


y B. A cuenta con el 70 % de los clientes y B con el resto. Los depósitos ban-
carios semanales, en dólares, en A tienen distribución uniforme entre 3500
y 18 500 dólares inclusive y los depósitos bancarios semanales en B tienen
distribución normal con un promedio 10 000 dólares y una desviación es-
tándar de 2500 dólares.
a. En el banco A; si se elige al azar un depósito, ¿cuál es la probabilidad de
que el valor de dicho depósito sea mayor a 15 500 dólares?
Solución
En el banco A; si se elige al azar un depósito, ¿cuál es la probabilidad de
que el valor de dicho depósito sea mayor a 15 500 dólares?
X: Depósitos bancarios semanales en el banco comercial
A → U[3500; 18500]
P( X > 15 500) =
0.2
Usando el software Minitab, se procede de la siguiente manera:

Capítulo 4. Distribuciones de probabilidad 267


b. La semana pasada se realizaron 60 depósitos en el banco A. Si se eligen
al azar y sin reposición 10 de dichos depósitos, ¿cuál es la probabilidad
de que por lo menos tres de ellos tengan un valor no mayor a US$ 5000?
Solución
X: Depósitos bancarios → U(3500; 18 500)
P( X < 5000) =
0.1

268 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Y: Número de depósitos → H(N = 60; M = 6; n = 10)
M = 0.1(60) = 6
P(Y ≥ 3) =
0.05237
c. Si se elige al azar un depósito entre todos los depósitos de los dos ban-
cos, halle la probabilidad de que dicho depósito sea mayor a US$ 14 000.
Solución
P( X A > 14 000) =
0.3
P( XB > 14 000) =
0.05480

A: Depósito mayor a 14 000


B1: Clientes del banco comercial A
B2: Clientes del banco comercial B
P(A) = 0.7 × 0.3 + 0.3 × 0.0548 = 0.22644

12. Se cree que el tiempo X (en minutos) para que un profesor universitario
prepare una práctica dirigida para el curso de Estadística, tiene una distri-
bución uniforme. En promedio se demora una hora, y como mínimo em-
plea 55 minutos para la preparación de la práctica.
a. ¿Cuál es la probabilidad de que el tiempo de preparación exceda a 58
minutos?
b. Determine el tiempo máximo de preparación, tal que sólo el 10 % de las
prácticas excedan este tiempo máximo.
Solución
a. ¿Cuál es la probabilidad de que el tiempo de preparación exceda a 58
minutos?
55 + b
E( X=
) = 60; =
b 65
2
X → U(55; 65)
P( X > 58) =
0.7

b. Determine el tiempo máximo de preparación, tal que sólo el 10 % de las


prácticas exceda este tiempo máximo.
P( X < K= k 56
) 0.1; =

13. Sea X una variable aleatoria con distribución triangular, su valor mínimo
es 1, el valor máximo es 6 y el valor modal es 3.
a. Determine la función de densidad.
b. Determine la función de distribución acumulada.

Capítulo 4. Distribuciones de probabilidad 269


Solución
a. La función de densidad es:
x −1
 5 , 1≤ x ≤ 3

 2(6 − x)
=f (x)  , 3< x≤6
 15
0 , en otro caso


b. La distribución de probabilidad acumulada es:
0 , x <1

 x −1
 10 , 1≤ x ≤ 3
Fx ( x) = 
1 − (6 − x) , 3< x≤6
 15

1 , x>6

14. Los sueldos de los trabajadores de una determinada fabrica sigue una dis-
tribución triangular con mínimo de 800 soles, el sueldo máximo es de 2200
y la gran mayoría tiene sueldos de 1000 soles. Determine la probabilidad
que, al elegir un trabajador, el sueldo sea menor a 1300 soles.
Solución
Haciendo uso del software Minitab, el procedimiento se presenta a continuación:

270 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


P( X < 1300) =
0.5179

15. Una máquina que despacha café está programada de forma que descarga
una media de 250 cm3 por vaso. Si la cantidad de líquido despachada está
distribuida normalmente y se sabe que en el 4.78 % de los vasos la cantidad
de líquido descargada es inferior a 225 cm3
a. Halle la desviación estándar y luego calcule el mínimo de líquido despa-
chado en el 15 % de los vasos más llenos.
b. Si se utilizan 12 vasos de 270 cm3 cada uno, ¿cuál es la probabilidad de
que se derrame líquido en exactamente dos de ellos?
Solución
X: Contenido de café → N(
= µ 250; s)
P( X < 225) =
0.0478
a. Halle la desviación estándar y luego calcule el mínimo de líquido despa-
chado en el 15 % de los vasos más llenos.

Capítulo 4. Distribuciones de probabilidad 271


225 − 250 225 − 250
P(Z < )=
0.0478; = −1.667; s = 14.99; s = 15
s s
k − 250 k − 250
P(Z > ) =0.15; =1.036; k =265.54
15 15
Los resultados previos, obtenidos haciendo uso del software Mini-
tab, son: Graph> Probability> Distribution Plot> view Probability> OK>
Distribution Normal> Mean=0> Sdev=1> Shaded Area> X value> Left
Tail =-1.667> OK

b. Si usamos 12 vasos de 270 cm3 cada uno, ¿cuál es la probabilidad de que


se derrame líquido en exactamente dos de ellos?
P( X > 270) =0.09121

Haciendo uso del software Minitab, el procedimiento es el siguiente:


Graph> Probability> Distribution Plot> view Probability> OK> Distri-
bution Normal> Mean=250> Sdev=15> Shaded Area> X value> Right
Tail=270> OK

272 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


X: Número de vasos que se derrame → B(n = 12; p = 0.09121)
12 
P( X= 2=
)   0.091212 (0.90879)10= 0.210991
2 
 

16. Los sueldos de los empleados de una empresa se consideran una variable
aleatoria X que sigue una distribución normal con media igual a 2400 soles.
El 97.72 % de empleados tiene sueldos inferiores a 3360 soles. De acuerdo
con los sueldos hay tres categorías: alta, intermedia y baja. Se sabe que los
porcentajes de empleados en las categorías alta y baja son iguales y que el
82 % del personal pertenece a la categoría intermedia.
a. Hallar el sueldo mínimo y el sueldo máximo de los empleados de la ca-
tegoría intermedia
b. ¿Qué porcentaje de empleados tienen sueldos que se diferencian del pro-
medio en a lo más 250 soles?
Solución
a. Hallar el sueldo mínimo y el sueldo máximo de los empleados de la ca-
tegoría intermedia.
X: sueldos del personal (soles) X → N=
(µ =
2400 ; s ?)
P( X < 3360) =0.9772 Empleando la distribución normal estándar
se tiene que:
3360 − 2400
=2.00 = ⇒ s 480
s
Los porcentajes de empleados en las categorías alta y baja son iguales
y deben de sumar 18 %, ya que complementan al 82 % del personal per-
tenece a la categoría intermedia. Como son porcentajes iguales, entonces
cada categoría corresponde al 9 %.
Se hallan los límites de sueldos en la categoría intermedia como sigue:
Límite inferior: P( X < x1 ) = 0.09 , de donde resulta que: x1 = 1756.44
Límite superior: P( X < x2 ) = 0.91 , de donde resulta que: x2 = 3043.56

b. ¿Qué porcentaje de empleados tienen sueldos que se diferencian del pro-


medio en a lo más 250 soles?
Se pide: P( X − µ ≤=
250) P( 2150 ≤ X ≤ =
2650) 0.698758 − 0.301241
Por lo tanto, la probabilidad solicitada es: 0.397517

17. Una máquina produce rodamientos con un diámetro que es una variable
normal de media 3.00 pulgadas y desviación estándar 0.01 pulgadas. Los
rodamientos con diámetros mayores que 3.02 pulgadas o menores que 2.98
pulgadas no satisfacen las especificaciones de calidad.

Capítulo 4. Distribuciones de probabilidad 273


a. En cierto momento, la máquina produjo 38 rodamientos que no cumplían
con las especificaciones. Determine el total de rodamientos producidos.
b. Si de 10 000 rodamientos producidos por la máquina se escogen al azar y
sin reposición 25 de ellos, ¿cuál es la probabilidad de que sólo 2 de ellos
no cumplan con las especificaciones?
Solución
a. En cierto momento, la máquina produjo 38 rodamientos que no cumplían
con las especificaciones. Determine el total de rodamientos producidos
X: diámetro de rodamiento (en pulgadas).
X → N (µ= 3; s= 0.01)
Los diámetros que cumplen con las especificaciones presentan un diá-
metro comprendido entre 2.98 y 3.02
Haciendo uso del software Minitab, el procedimiento es el siguiente: Gra-
ph> Probability> Distribution Plot> view Probability> OK> Distribution
Normal> Mean=250> Sdev=15> Shaded Area> X value> Middle=2.98,
3.02> OK P( 2.98 ≤ X ≤ 3.02) =
0.9545

Los que no cumplen se encuentran comprendidos en 1 – 0.9545 = 0.0455


y representan los 38 rodamientos; el total de rodamientos es de:
0.0455x = 38; x = 835.16, es decir, equivalente a 836.

b. Si de 10 000 rodamientos producidos por la máquina se escogen al azar y


sin reposición 25 de ellos, ¿cuál es la probabilidad de que solo 2 de ellos
no cumplan con las especificaciones?
La probabilidad de que no cumplan es de 0.0455
X. Número de rodamientos → H ( N = 10 000
= ; M 455
= ; n 25)

274 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


 455  9545 
  
 2  23 
P( X= 2=
)   = 0.213086
10 000 
 
 25 
 

18. La vida útil de dos tipos de máquinas industriales M y N se distribuyen


en forma exponencial con media 9 años y de forma normal con media 8 y
desviación estándar 1, respectivamente.
a. ¿Cuál de las dos máquinas tiene mayor probabilidad de durar menos de
10 años? Sustente su respuesta.
b. Si se selecciona 5 máquinas de tipo M solamente. ¿cuál es la probabili-
dad de que la quinta máquina seleccionada sea la primera que tenga una
duración superior a 10 años?
Solución
X: vida útil de las máquinas; X M → Exp(b= 9); XN → N (µ= 8; s2= 1)
a. ¿Cuál de las dos máquinas tiene mayor probabilidad de durar menos de
10 años?
P=
( X M < 10) 0.6708; P=
( XN < 10) 0.9772
La máquina N tiene mayor probabilidad de durar menos de 10 años.
b. Si se selecciona 5 máquinas de tipo M solamente, ¿cuál es la probabili-
dad de que la quinta máquina seleccionada sea la primera que tenga una
duración superior a 10 años?
F: Máquina funciona más de 10 años
P( F=
) P( X M > 10=
) 0.3292
P( F1  =
F2  F3  F4  F5 ) (=
0.6708)4 (0.3292) 0.06665

19. Un sistema de producción opera con tres máquinas (A, B, C) que funcionan
de manera independiente. El tiempo que tarda en fallar cada una de ellas
es una variable aleatoria X con distribución exponencial con una media de
100 horas.
a. ¿La mediana del tiempo de funcionamiento de la máquina A es superior
a su promedio?
b. ¿Cuál es la probabilidad de que falle al menos una de las tres máquinas
en las primeras 120 horas de operación?
Solución
a. ¿La mediana del tiempo de funcionamiento de la máquina A es superior
a su promedio?
Sea X: tiempo para la falla (horas) X → Exp(b = 100)
E( X ) = 100

Capítulo 4. Distribuciones de probabilidad 275


0.50, de donde: me = 69.3
P( X ≤ me ) =
FALSO: ME < E( X ), distribución asimétrica sesgada a la derecha.

b. ¿Cuál es la probabilidad de que falle al menos una de las tres máquinas


en las primeras 120 horas de operación?
0.699; P(no falla) = 0.301
Hallamos: p = P(falla) = P( X < 120) =
P(al menos una máquina falle) = 1 – P(ninguna)
= 1= – (0.301)3 0.9727

20. El tiempo que transcurre antes que una persona sea atendida en una ven-
tanilla de un banco es una variable aleatoria que tiene una distribución
exponencial con media de 5 minutos. ¿cuál es la probabilidad de que una
persona sea atendida a lo más en dos minutos?
Solución
P( X ≤ 2) =
0.3297

21. Dos variables aleatorias independientes X e Y tienen distribución gamma


con parámetros:
X → Γ=
(a 100,=
b 2); Y → Γ=
(a 400,=
b 2) ¿Cuál de ellas es más
asimétrica?
Solución
E( X ) = 100 × 2 =200 E(Y ) = 400 × 2 =800

V ( X=
) 100 × 2=
2
s 20; V (Y=
400 ⇒ = ) 400 × 2=
2
1600 ⇒ =
s 40
Me( X ) = P( X ≤ x0 ) = 0.5 ⇒ Me( X ) =199.334
Me(Y ) = P(Y ≤ y0 ) = 0.5 ⇒ Me(Y ) = 799.333

3( 200 − 199.334) 3(800 − 799.333)


C.A.( X )
= = 0= .0999 C.A.(Y ) = 0.05
20 40
La distribución de X es más asimétrica que la de Y

22. El tiempo semanal X (en horas) durante el cual cierta máquina industrial no
funciona tiene una distribución gamma con a =3 y b =2.
a. Si una máquina no ha estado funcionando más de 5 horas, hallar
la probabilidad de que su tiempo de no funcionamiento sea de a lo
más 9 horas.
Solución
Si una máquina no ha estado funcionando más de 5 horas, hallar
la probabilidad de que su tiempo de no funcionamiento sea de a lo más
9 horas.

276 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


X: tiempo que la máquina no funciona (está parada).
X → Γ(a= 3; b= 2)

P(5 < X ≤ 9) 0.370


P( X ≤ 9 / X > 5) = = = 0.680147
P( X > 5) 0.544

b. La pérdida, en dólares, para la operación industrial debido al no funcio-


namiento de la máquina, está dada por:= L 30X + 2X 2 . Calcule el valor
esperado de L.
Solución
Paso previo:
E( X )= 6, V ( X )= 3 × 22 = 12 , luego: E( X 2=
) 12 + 62 = 48
De ahí que:
E( L) E(30X + 2X 2 ) = 30 × E( X ) + 2 × E( X 2 ) =30 × 6 + 2 × 48 =
= 276 dólares

23. Considere que el tiempo de supervivencia de un animal expuesto a una


droga sigue una distribución gamma con a= 5 : b= 10 (horas). Determine
la probabilidad de que el animal sobreviva a lo más 20 horas:
Solución
P ( X ≤ 20) =
0.05265

24. Suponga que la vida útil de cierto producto es una variable aleatoria que
tiene distribución de Weibull con
= y b 4 (cientos de horas):
a 0.6 =
a. La vida media útil de ese artículo.
Solución
La vida media útil de ese producto:
 1
E( X ) = b Γ 1 +  = 4Γ( 2.67) = 4 × 1.50851 = 6.03
 a

b. La variación de la vida útil.


Solución
  2    1   
2

V ( X ) =b2 Γ 1 +  −  Γ 1 +    =16[Γ( 4.33) − (Γ( 2.67))2 ] =16 × 6.94347 =111.095
  a    a  

c. La probabilidad de que el elemento dure más de 500 horas.
Solución
P( X > 500) =
0.3188
Haciendo uso del software Minitab, el procedimiento es el siguiente: Gra-
ph> Probability> Distribution Plot> view Probability> OK> Distribution
Weibull> Shape=0.6> Scale=4> Shaded Area> X value> Right Tail=5> OK

Capítulo 4. Distribuciones de probabilidad 277


25. La duración de un radio eléctrico tiene una distribución de Weibull con
a =2 y b =4 (miles de horas).
a. ¿Cuál es la probabilidad de que un radio dure más 9000 horas?
b. ¿Cuál es la probabilidad de que un radio dure menos de 4500 horas?
c. ¿Cuál es la probabilidad de que un radio dure entre 3500 y 8000 horas?
Solución
a. ¿Cuál es la probabilidad de que un radio dure más 9000 horas?
P( X > 9) =0.006330

b. ¿Cuál es la probabilidad de que un radio dure menos de 4500 horas?


P( X < 4.5) =0.7179

c. ¿Cuál es la probabilidad de que un radio dure entre 3500 y 8000 horas?


P(3.5 < X < 8.) =
0.4467

26. El tiempo de falla de un producto electrónico sigue una distribución de


Weibull con= b 5 (en miles de horas).
a 0.6;=
Determine la probabilidad de que el tiempo de falla del producto electróni-
co sea como mínimo de 3000 horas.
Solución
P( X ≥ 3) =
0.4790

27. Si las variables X e Y son independientes con distribuciones ji-cuadrado de


12 y 8 grados de libertad respectivamente, se pide:

a. Hallar el valor de k tal que: P[18.5 < ( X + Y ) < k ] = 0.355


Solución
Por propiedad, se tiene que: ( X + Y ) → χ(220) ; luego:
P[18.5 < χ(220) < k ] =0.355

278 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Haciendo uso del software Minitab, el procedimiento es el siguiente: Gra-
ph> Probability Distribution Plot> view Probability> OK> Distribution>
Chi-cuadrada> Degrees of freedom=20> Shaded Area> Left Right => X
value=18.5> OK

0.4455 + 0.355 =
0.8.

Hay que calcular P(χ 220 > K ) =


0.2

K= 25.0
χ(220;8) =

Y 
b. Calcular: P  < 0.8
X 
Y   Y /8  12Y 12 
P  < 0.8= P  < 0.8 = P  < (0.8)  = P  F(8 ;12) < 1.2 = 0.626
 X   X / 12   8 X 8   

28. Las variables aleatorias X, Y y Z son independientes con distribuciones:


X → χ(230) , Y → χ(220) , Z → N (0 ,1) . Calcular lo siguiente:

a. Los límites del 90 % central de la distribución de X

Capítulo 4. Distribuciones de probabilidad 279


Solución
Haciendo uso del software Minitab, el procedimiento es el siguiente: Gra-
ph> Probability> Distribution Plot> view Probability> OK> Distribution
Chi-cuadrada> Degrees of freedom =30> Shaded Area> Middle > Proba-
bility 1 =0.05> Probability 2=0.05> OK

0.9; a = límite inferior; b = límite superior; a = 18.49;


P( a < X < b) =
b = 43.77

b. El valor de k tal que P(| Z | > k ) =


0.08
Solución
Haciendo uso del software Minitab, el procedimiento es el siguiente:
Graph> Probability> Distribution Plot> view Probability> OK> Distribu-
tion Normal> Media=0> Desv Est =1> Shaded Area> Both Tail> Probabi-
lity=0.08> OK
El valor de K es 1.751

280 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


 Y / 20 
c. P  0.45 < < 2.1
 X / 30 
Solución
Haciendo uso del software Minitab, el procedimiento es el siguiente:
Graph> Probability> Distribution Plot> view Probability> OK> Distribu-
tion F> Numerator df=20> Denominator df=30> Shaded Area> Middle>
X value 1=0.45> X value 2= 2.1> OK.
La probabilidad es de 0.9348

d. El valor de c tal que: P(c < X + Y < 65) = 0.8715


Solución
Haciendo uso del software Minitab, el procedimiento es el siguiente:
Graph> Probability> Distribution Plot> view Probability> OK> Dis-
tribution Chi-cuadrada> Degrees df=50> Shaded Area> Right Tail>
X value=65> OK

0.07536 + 0.8715 =
0.94686
P( X + Y > C ) =0.94686

Capítulo 4. Distribuciones de probabilidad 281


Para calcular el valor de C se utiliza el software Minitab con el siguiente
procedimiento: Graph> Probability> Distribution Plot> view Probabi-
lity> OK> Distribution Chi-cuadrada> Degrees df =50> Shaded Area>
Right Tail> Probability=0.94686> OK

El valor de c = 35

5. Problemas propuestos

1. Para cierto negocio por correo electrónico, la proporción de los pedidos


procesados por día tiene la siguiente función de densidad de probabilidad.
2(1 − x) , 0 ≤ x ≤ 1
f ( x) = 
 0 , c.c.
¿Cuál es la probabilidad de observar, en una semana de seis días labo-
rables, más de dos días en los que la proporción de pedidos procesados sea
menor al 80 %? Asumir independencia de ser necesario.

2 La empresa National Oil Company se dedica a operaciones de perforación


exploratoria en el sureste de los Estados Unidos. Para financiar su funcio-
namiento, los inversionistas forman sociedades que proporcionan financia-
miento para perforar una cantidad fija de pozos petroleros. La experiencia
en este tipo de exploraciones indica que el 15 % de los pozos perforados
fueron productivos. Una sociedad recién formada proporciona el financia-
miento para realizar perforaciones exploratorias en 12 lugares. Para hacer
rentable la sociedad, por lo menos tres de los pozos de exploración deben
ser productivos. ¿Cuál es la probabilidad que el negocio sea rentable?

282 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


3. La función de distribución acumulativa de una variable aleatoria X está
dada por:
0 , x<− 4
 3
 x 1
F( x=
) P( X ≤ x=
)  + , −4 < x < 4
 128 2
1 , x>4

Si se realizan 6 observaciones independientes de la variable X, hallar la
probabilidad de que en sólo una de ellas X tome valores negativos.

4. La producción de artículos de una empresa, presenta las siguientes carac­


terísticas:
• El 85 % de los artículos son buenos.
• El 10 % de los artículos son para reprocesar.
• El 5 % de los artículos son para desechar.
La empresa realiza el control de calidad de la producción en forma periódi-
ca, seleccionando un grupo de artículos cada vez.
a. ¿Cuál es la probabilidad de encontrar 3 artículos para desechar cuando
se inspeccionan 5 artículos en forma independiente?
b. ¿Cuál es la probabilidad de encontrar menos de 2 artículos calificados
como no buenos cuando se inspeccionan 10 artículos de manera inde-
pendiente?
c. El costo de producción de cada artículo bueno es de 1.5 soles y de cada
artículo no bueno es de 2.10 soles. Determine el costo esperado si la pro-
ducción es de 3000 artículos.

5. Una compañía alquila equipos de sonido. Un equipo de este tipo se puede


descomponer durante un mes independientemente de otros meses y con
probabilidad 0.2. La compañía alquilará un equipo para ser usado durante
20 meses. Cada mes le generará una utilidad de 1000 soles (así se descom-
ponga el equipo); además, cada mes en donde se descomponga el equipo le
significará un gasto de 500 soles por reparación.
a. Identifique el modelo probabilístico que describe a la variable, X, de-
finida como el número de meses (entre los 20) en los que el equipo se
descompondrá. Incluya los valores de los parámetros.
b. Calcule la probabilidad de que el equipo se descomponga en más de dos,
pero menos de 6 meses.
c. Determine la utilidad esperada de la compañía.
d. La compañía desea ganar, por lo menos, 18 500 soles. ¿Cuál es la proba-
bilidad de que esto ocurra?

Capítulo 4. Distribuciones de probabilidad 283


6. El gerente de Recursos Humanos de Perú Data S. A afirma que la planilla
del área de sistemas la constituyen 200 trabajadores de los cuales el 60 %
son titulados y el resto son bachilleres. De los titulados, el 65 % es especia-
lista en software y de los bachilleres, el 25 % es especialista en hardware.

Software (S) Hardware (H) Total

Titulado (T) 78 42 120

Bachiller (B) 60 20 80

Total 138 62 200

Si el jefe del área decide elegir al azar cinco personas del total de trabaja-
dores para encargarles una tarea dada la complejidad de esta, y define la
variable aleatoria X “número de trabajadores titulados en la muestra”, ¿cuál
es la probabilidad de que por lo menos 3 sean titulados?

7. Un profesor ha elaborado 30 exámenes, de los cuales 8 tienen preguntas


“difíciles”, 12 tienen preguntas “moderadas” y 10 tienen preguntas “fáci-
les”. Los exámenes se mezclan y el profesor elige al azar 4 de ellos y los
toma en 4 secciones de un curso que está enseñando.
a. Hallar la probabilidad de que ninguna sección reciba un examen difícil.
b. ¿Cuál es la probabilidad de que exactamente una sección reciba un
examen fácil?
c. Sea X el número de secciones que no reciben un examen difícil,
calcule E(X)

8. Una persona que viaja de Bolivia a EE UU con la finalidad de llevar droga


y para que en la aduana no lo descubran, considera llevar bolsitas de té.
Ha colocado en 8 de ellas la droga de un total de 50 sobres. El oficial de la
aduana selecciona 3 sobres de té aleatoriamente para analizarlas.
a. ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de
narcóticos?
b. ¿Cuál es la probabilidad de que no sea arrestado?

9. Un hostal alberga personas con distintas nacionalidades: 5 de Japón, 8 de


EE UU, 6 de Reino Unido y 2 de Alemania.
Al elegir a 3 turistas sin reemplazo determine la probabilidad de que:
a. Un turista sea de Alemania.
b. Por lo menos un turista sea de Japón.
c. A lo más uno de ellos sea de EE UU.

10. De un grupo de obreros, 15 se clasifican con conocimientos excelentes, 10


con conocimientos regulares y 35 con conocimientos básicos. Se elige una
muestra de 4 obreros.

284 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


a. Determine la probabilidad de que a lo más 2 de ellos tengan conocimien-
tos básicos.
b. Cuál es la probabilidad que por lo menos uno de ellos tenga conocimien-
tos excelentes.

11. En un salón de clase de ingeniería se tienen 20 hombres y 13 mujeres. Se


elige al azar y sin reposición una muestra de 4 alumnos para que formen
una comisión. Determine la probabilidad de que ocurra lo siguiente.
a. En la comisión se incluya 2 hombres.
b. En la comisión se incluya por lo menos 2 mujeres.

12. En una clínica atienden en promedio a 6 personas en treinta minutos.


a. Hallar la probabilidad de que en 10 minutos atiendan a 4 personas.
b. Hallar la probabilidad de que en un cuarto de hora atiendan a más de 2
personas, pero no menos de 4 personas.

13. En una caja rápida de un supermercado llegan 3 personas en 30 segundos


para ser atendidas.
a. En un minuto dado, ¿cuál es la probabilidad de que lleguen exactamente
5 personas?
b. Determine la probabilidad de que por lo menos lleguen 10 personas en
un minuto.

14. Uno de los procesos de las lunas de los lentes de medida es el pulido. Una
óptica indica que, si encontrara más de 3 defectos por cm2, los considera
defectuosos y rechazará la entrega. Además, se sabe que el promedio del
número defectos es de un defecto por cm2. Hallar la probabilidad de que un
lente de 3 cm2 que ha sido revisado no se catalogue como defectuoso.

15. La tasa de muertes por accidente de tránsito es de 3.6 por cada 10 000 per-
sonas. Suponga que la distribución de muertes sigue una distribución de
Poisson.
a. Determine la probabilidad de que ocurran dos accidentes en 12 000
personas.
b. Determine la probabilidad de que ocurran a lo más 3 accidentes en una
población de 10 000 personas.

16. Una institución financiera está realizando una investigación acerca del nú-
mero de cheques sin fondos. Se sabe que diariamente se presentan 5 che-
ques sin fondos.

Capítulo 4. Distribuciones de probabilidad 285


a. Determinar la probabilidad de que se reciba 4 cheques sin fondos en
un día.
b. Determinar la probabilidad de que a lo más se reciba 3 cheques sin fon-
dos en un día.

17. El número de defectos superficiales en paneles de plástico utilizados en el


interior de automóviles se considera una variable aleatoria con distribución
de Poisson con un promedio de 0.5 defectos por pie cuadrado. Suponga que
el interior de un automóvil tiene 8 pies cuadrados de este material.
a. Hallar la probabilidad de que no haya defectos en el interior de un
automóvil.
b. Si en un automóvil se ha encontrado más de dos defectos, ¿cuál es la pro-
babilidad de que se haya encontrado exactamente 4 defectos?

18. Una planta produce tornillos cuyo diámetro se distribuye uniformemente


con media de 0.498 cm y desviación estándar de 0.002 cm. Se consideran
aceptables los tornillos con diámetros en el intervalo 0.498 cm ± 0.003 cm.
a. ¿Qué porcentaje de la producción resulta inaceptable?
b. Considerando independientemente la calidad de cada tornillo, hallar la
pro­babilidad de que el quinto tornillo producido sea el primero inaceptable.

19. Una empresa tiene 2 tiendas en diferentes zonas de Lima. En la tienda 1, las
ventas diarias siguen una distribución uniforme siendo el monto mínimo
300 soles y el máximo 900 soles; en la tienda 2, las ventas se distribuyen en
forma normal de valor medio 620 soles y en el 97.72 % de los días las ventas
no superan los 980 soles.
a. En la tienda 1, hallar el monto mínimo observado en el 25 % de los días
considerados los de mayor venta.
b. En la tienda 2, ¿cuál es la probabilidad de que el monto de la venta de un
día se diferencie del promedio en a lo más 80 soles?
c. ¿En cuál de las dos tiendas las ventas diarias presentan mayor homo­
geneidad?

20. La venta promedio de carne de res en un supermercado es de 300 soles y la


venta mínima es de 200.
a. Determine la venta máxima.
b. Halle el porcentaje de días en los que las ventas exceden los 250 soles.

21. Suponga que la cantidad de líquido que expenden las máquinas de café en
vasitos sigue una distribución uniforme en el intervalo de [125, b ].

286 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


a. Obtener el valor de b si se sabe P( X ≤ 129 =
0.1)
b. ¿Cuál es el promedio de líquido que despacha la maquina por vasito
(mm)?
c. ¿Cuál es la probabilidad de que la máquina despache más de 140 (mm) si
se sabe que hay más de 135 (mm) de café?

22. En un centro de investigación sobre el tiempo, considere que las mediciones


se distribuyen en forma uniforme en el siguiente intervalo [1, 5 ]
a. Determine la probabilidad de que la medición se encuentre 1.5 ≤ X ≤ 3.
b. Determine la varianza de X.
c. Un investigador del centro ha realizado 7 mediciones independientes,
determine la probabilidad de que a lo más 2 de ellas estén entre 2.5 y 3.5.

23. Una empresa cuenta con una máquina y se define como X la variable alea-
toria consistente en el número de horas que la máquina esta parada debido
a una avería. X sigue una distribución triangular, y por experiencias se
sabe que el mínimo es de 1 hora, el máximo es de 4 horas y en la mayoría de
casos es de hora y media:
a. Determine la función de densidad.
b. Determine la función de probabilidad acumulada.

24. Se sabe que la duración de los proyectos en una empresa sigue una distri-
bución triangular con una duración optimista de 24 horas, una duración
pesimista de 120 horas y una habitual de 32 horas.
a. Determine la probabilidad de que un nuevo proyecto dure por lo menos
35 horas.
b. Calcule la esperanza de finalizar de un proyecto.

25. Un informe de una compañía de mantenimiento de equipos de aire acondi-


cionado señala que el tiempo de duración de un servicio sigue una distri-
bución normal con media 60 minutos y el 10.6 % de los servicios tiene una
duración superior a 75 minutos.
a. Hallar la desviación estándar y luego calcular la probabilidad de que la
duración de un servicio se diferencie de la media en más de 20 minutos.
b. Un operario de la compañía está programado para atender tres servicios
en una mañana. Se supone que los tiempos incurridos en cada uno de
estos servicios son independientes. Calcular la probabilidad de que al
menos uno de ellos dure más de 70 minutos.

26. La duración de un proceso textil de fabricación de prendas es una variable


aleatoria con distribución normal. El jefe de planta indica que en el 56.6 %

Capítulo 4. Distribuciones de probabilidad 287


de las veces, la duración es menor a 50 minutos y el 74.8 % de las veces dura
más de 40 minutos.
a. Halle la duración promedio y su desviación estándar.
b. Si en un proceso alterno la duración es una variable con distribución
uniforme de valor mínimo 40 minutos y promedio 55 minutos, ¿cuál de
los dos procesos es más homogéneo en su duración?

27. En una tienda comercial las ventas diarias de dispositivos externos para
computadores tienen una distribución normal con una media de 190 miles
de soles y una desviación estándar de 20 miles de soles.
Si se eligen al azar 10 días, halle la probabilidad que en exactamente
cinco de ellos se registre una venta que sea inferior a 210 mil soles.

28. Los puntajes obtenidos por los empleadores de una empresa en una prueba
de aptitudes tienen una distribución normal con media de 75 y desviación
estándar de 10, respectivamente. Se desea hacer una modificación de modo
que los nuevos puntajes (Y ) se expresan mediante Y= A + BX. Hallar A y
B de modo que, con la modificación, la media y desviación estándar sean 80
y 8, respectivamente.

29. Los pesos de bolsas de detergente producidos por una fábrica se distribu-
yen en forma normal con media de 500 gramos y solo el 15.87 % de bolsas
tienen pesos superiores a 525 gramos.
a. Si se desechan un 4 % de bolsas (las de menor peso), ¿cuál es el peso
mínimo de una bolsa no desechable?
b. Una bolsa de detergente se considera aceptada si su peso se diferencia
de la media en a lo más 30 gramos. Si un paquete de 6 bolsas contiene
por lo menos 4 bolsas aceptables, se vende con una utilidad de 30 soles;
si no contiene bolsas aceptables, entonces se pierde 8 soles y en otros
casos la utilidad es de 25 soles. Calcule la utilidad esperada por paquete.

30. El precio de venta, en soles, de un producto en la zona A es una variable


aleatoria con distribución normal con media 30 y la probabilidad de que sea
inferior a 25 soles es 0.1056. En la zona B, el precio de venta tiene distribu-
ción uniforme siendo el valor mínimo 20 soles y el máximo 40 soles.
a. ¿En cuál de las dos zonas los precios son más homogéneos?
b. ¿Cuál es la probabilidad de que sólo en una de las dos zonas el precio
se diferencie de su promedio en a lo más 5 soles? Considerar indepen-
dencia entre zonas.

31. El tiempo que necesita una persona que está en ventanilla de un banco para
atender a un cliente tiene una distribución exponencial con promedio de 50
segundos.

288 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


a. ¿Cuál es la probabilidad de que el tiempo necesario para atender un
cliente dado sea mayor que un minuto?
b. ¿Cuál es la probabilidad de que el tiempo necesario para atender a un
cliente esté comprendido entre 1 y 3 minutos?

32. En una institución financiera, el tiempo de espera de sus clientes para ser
atendido sigue una distribución exponencial y que en promedio es de 12
minutos. Calcular la probabilidad de que el tiempo de espera sea:
a. A lo más 8 minutos.
b. Entre 6 y 9 minutos.

33. El componente de un aparato de televisión dura en promedio 1200 horas. Si


la duración de la vida del componente sigue una distribución exponencial.
a. Determine la probabilidad de que su vida sea superior a 800 horas.
b. Determine la probabilidad a lo más de 1000 horas.
c. ¿Cuál es la desviación estándar de su vida útil?

34. Se sabe que el número de vehículos que entran en una autopista es regis-
trado por un contador electrónico y sigue una distribución de Poisson de
promedio de 10 vehículos cada 5 minutos.
a. ¿Cuál es la probabilidad de que en una hora entren a la autopista entre
100 y 120 vehículos, ambos inclusive?
b. ¿Cuál es la probabilidad de que transcurran más de 25 segundos entre 2
llegadas sucesivas de vehículos a la autopista?
c. En una autopista hay una garita de peaje y cada vehículo debe pagar 4
soles. Un empleado de la garita empezó su turno a las 9 am ¿a qué hora
(cómo máximo) habrá recolectado 200 soles con probabilidad de 0.99?

35. La central telefónica de un hotel recibe un promedio de 8 llamadas en


5 minutos. Si el número de llamadas sigue una distribución de Poisson,
responda:
a. La dirección del hotel desea modernizar su central. Para que sea renta-
ble, el gerente considera que la probabilidad de recibir al menos 100 lla-
madas en una hora debe ser superior a 0.25. ¿Deberá el gerente ordenar
la modernización de la central? Justifique.
b. Si el hotel acaba de recibir una llamada, hallar la probabilidad de que
transcurran menos de 2 minutos para recibir la siguiente.

36. Si se sabe que el tiempo de sobrevivencias de las palomas que ingieren un


tóxico es una variable aleatoria G(a= 4; b= 10 horas)
¿Cuál es la probabilidad de que una paloma no sobreviva más de 11 horas?

Capítulo 4. Distribuciones de probabilidad 289


37. Considere que cierta pieza se romperá después de sufrir dos ciclos de es-
fuerzo. Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de tres por cada 150 horas, obtenga la probabilidad de que el
tiempo sea a lo más 120 horas que ocurre el segundo ciclo.

38. Considere que el tiempo de supervivencia, en años, de pacientes con diabe-


tes y que son sometidos a una determinada intervención quirúrgica sigue
una distribución gamma con parámetros a =0 , 85 y b =6, calcúlese:
a. El tiempo promedio de supervivencia.
b. Cuántos años sobrevivirá a partir de los cuales la probabilidad de super-
vivencia es mayor que 0.20.

39. Un componente digital falla 1 vez cada 6 horas.


a. ¿Cuál es el tiempo medio que transcurre para que fallen dos componentes?
b. ¿Cuál es la probabilidad de que transcurra por lo menos 5 horas antes
que fallen los dos componentes?

40. Considere el tiempo de supervivencia de pacientes que son sometidos


a quimioterapia (años) sigue una distribución gamma con parámetros
=a 0.9 =y b 7.5
a. Determine el tiempo promedio de supervivencia de un paciente con
quimioterapia.
b. Determine la cantidad de años a partir de los cuales la probabilidad de
supervivencia sea menor a 0.08

41. El tiempo (en horas) que una máquina trabaja sin fallas es una variable
a 2 y=
aleatoria con distribución de Weibull de parámetros= b 400.
a. ¿Cuál es el tiempo máximo de trabajo sin fallas de la máquina observado
con una probabilidad de 0.975?
b. ¿Cuál es la probabilidad de que el tiempo de trabajo sin fallas de la má-
quina supere a su valor medio?

42. Un componente electrónico tiene un tiempo de vida (en horas) que se puede
representar con una distribución de Weibull con a =1. Además, se conoce
que el 10 % de los componentes producidos tiene una duración superior a
230.26 horas. ¿Cuál es la duración mínima del 5 % de componentes conside-
rados los de mayor duración?

43. Las variables X, Y, V, W son independientes con distribuciones:


X → N (= s 8); Y → χ(220) ; V → t(12) , W → χ(210) Hallar:
µ 25; =

290 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


a. El valor de k, tal que: P(18.5 < W + Y < K ) =
0.85
 W / 10 
b. P  0.85 < < 3.10 
 Y / 20 

 X − 25 
 
c. P  8 ≤ 1.90 
 Y / 20 
d. Los valores de a y b tal que:
e. a y b son limites centrados

Miscelánea de problemas

44. En una computadora con arquitectura en paralelo, los mensajes que llegan
a un nodo son almacenados en un buffer antes de ser transmitidos por red,
hasta que se dispone de un paquete de cinco. Supongamos que los mensajes
llegan al nodo de acuerdo con un proceso de Poisson de media 25 mensajes
por segundo.
a. Hallar la probabilidad de que en 0.5 segundos lleguen menos de 12
mensajes.
b. Calcular la probabilidad de formar un paquete en menos de 0.1 segundos.
c. ¿En cuántos segundos como máximo se formará un paquete con una
probabilidad de 0.96?
d. Calcular el tiempo medio para formar un paquete.

45. En un banco entran 90 clientes por hora, se supone que el número de clien-
tes que llega al banco sigue una distribución de Poisson.
a. ¿Cuál es la probabilidad de que en un intervalo de dos minutos lleguen
al banco por lo menos 2 clientes?
b. Hallar la probabilidad de que en diez minutos determinado lleguen me-
nos de 18 clientes.
c. ¿Cuántos minutos transcurrirán como máximo para observar la llegada
de 25 clientes con una probabilidad de 0.90?

46. Se ha encontrado que los préstamos para vivienda otorgados por un Banco
a través de sus diferentes sucursales el año pasado tienen una distribución
aproximadamente normal con media 43 000 dólares y sólo un 2.28 % son
superiores a 60 000 dólares. Si las condiciones de préstamo continúan para
el siguiente año:

Capítulo 4. Distribuciones de probabilidad 291


a. Hallar la desviación estándar
b. Si 4 de cada 5 préstamos son por montos no mayores a un valor k, halle
el valor de k.
c. ¿Qué porcentaje de préstamos se espera que estén entre 30 000 dólares y
45 000 dólares?
d. Si de la base de datos del banco se eligen al azar y de manera indepen-
diente los préstamos para vivienda de 20 clientes, hallar la probabilidad
de que no más de 7 de ellos sean superiores a 50 000 dólares.

47. En un laboratorio de pruebas, el error al medir la temperatura (en ºC) es una


variable aleatoria X con función de densidad de probabilidad:
f=
( x) k x 2 , − 1< x ≤ 2
a. Halle el valor de k y construya la función de distribución acumulada de
X. Calcule P( X > 1.0)
b. Si se hacen 50 mediciones independientes de la temperatura, ¿en cuán-
tas de ellas se espera un error de medición no mayor a 1.25?

48. Si las variables aleatorias X, Y, Z y W, son independientes y se dis­-


tribuyen como:
X → χ(15) Y → χ(210) ; W → t(10) Z → N (0 ,1)
2

Hallar:
a. K, si P [ U > k ] =
0.9, donde U= X + Y
b. P[(W > 1.372)  (Z < 0.6745)]
Y / 10
c. P(0.3515 < < k) =
0.80
X / 15

49. El número medio de accesos al Aula Virtual de la universidad es de uno


cada 15 segundos.
a. Determine el intervalo de tiempo necesario para que la probabilidad de
que no haya acceso alguno al Aula Virtual en ese lapso sea de 0.5.
b. Si se observan dos intervalos de tiempo, uno de 10:00 a 10:01 a. m. y el
otro de 6:30 a 6:31 p. m., ¿cuál es la probabilidad de que en solo uno de
dichos intervalos el número de accesos al Aula Virtual sea no menor a 6?
c. Si un acceso al Aula Virtual fue a las 11:00 a. m., ¿cuál es la probabilidad
de que transcurra más 10 segundos para que ocurra el siguiente acceso?
d. ¿Cuál es la probabilidad de que transcurran más de dos minutos hasta
que ocurra el quinto acceso al Aula Virtual?

292 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


50. Suponga que la compra mensual de un dispositivo para la reparación de
computadoras en la empresa A se distribuye normalmente. En el 84.13 %
de los meses se compró por un valor menor o igual a treinta mil soles y en
el 97.72 % de los meses se compró por una cantidad mayor o igual a quince
mil soles.
a. Halle la media, desviación estándar y coeficiente de variación de la dis-
tribución de compras mensuales.
b. Suponga que en la empresa B la compra mensual por el mismo concepto
tiene distribución uniforme con media igual a 25 mil soles y sólo en el
10 % de los meses las compras superaron los 33 mil soles. ¿Cuál de las
dos empresas es más homogénea en sus compras?

51. La cantidad de horas semanales que los operadores de una empresa infor-
mática dedican a cargar ciertos datos se distribuye normalmente con media
4 y la probabilidad de que necesiten a lo más 4.75 horas es de 0.9332.
a. Hallar la desviación estándar y calcular la probabilidad de que la canti-
dad de horas semanales dedicadas a cargar dichos datos esté compren-
dida entre 3 y 4.5 horas.
b. ¿Cuál es la cantidad de horas semanales mínima que dedican el 30 % de
los operadores que más horas semanales dedican a cargar datos?
c. Si se observan los tiempos de 6 operadores elegidos al azar, ¿cuál es la
probabilidad de que a lo más uno de ellos haya empleado menos de 3.5
horas en esta tarea?

52. Las variables aleatorias X, Y y Z son independientes con distribuciones


X →χ(230) , Y →χ(220) , Z → N (0 ,1) . Calcular lo siguiente:
a. Los límites del 90% central de la distribución de X
b. El valor de k tal que P ( Z > k ) =
0.08
c. El valor de c tal que: P(c < X + Y < 65) =
0.8715

53. En base a los registros obtenidos por los atletas pertenecientes a la federa-
ción de atletismo de un país A, se ha establecido que los tiempos que em-
plean para los 100 metros planos siguen una distribución normal con una
media de 12.0 segundos y una desviación estándar de 1.5 segundos.
a. Hallar la probabilidad de que un atleta emplee un tiempo que se dife-
rencie de la media en no más de 0.5 segundos.
b. Si se establece como criterio que, para clasificar al campeonato interna-
cional, el atleta debe realizar la prueba 4 veces y en por lo menos 3 de
ellas debe registrar como máximo un tiempo de 11.5 segundos, calcule
la probabilidad que un atleta cualquiera lo logre.

Capítulo 4. Distribuciones de probabilidad 293


c. En un país B, el tiempo que sus atletas emplean para los 100 metros
planos también tiene distribución normal con desviación estándar 1.5 se-
gundos y se sabe que el 34.46 % de atletas cumplió con el tiempo máximo
de 11.5 segundos. En promedio, ¿en cuál de los dos países los atletas son
más rápidos al correr los 100 metros planos? Justifique numéricamente.

54. Cercano el mes de diciembre, las tiendas por departamento se encuentran


en plena campaña navideña. ROPÓN S. A. se ha relanzado al mercado li-
meño después de 25 años y pretende competir con otras dos grandes tien-
das por departamentos. En tal sentido ROPÓN S. A. pretende impulsar los
beneficios de su tarjeta de crédito OHHROPON. Su división de crédito ha
conseguido una base de datos de clientes solicitantes de crédito para los
cuales su principal preocupación es su capacidad crediticia en función del
monto solicitado como compras al crédito. La función de distribución acu-
mulada es la siguiente:
0 , x<0

F( x) 0.2 x , 0 ≤ x < 5
=
1 , x≥5

Donde x viene expresada en miles de soles.


a. De entre las distribuciones especiales estudiadas en clase, indique el
nombre de la distribución de probabilidad de X con su o sus parámetros.
b. El gerente decide confiar en su equipo de expertos y le solicita un in-
forme conteniendo lo siguiente: Si a los clientes que solicitan préstamos
entre 500 y 3500 soles se les dará como obsequio una entrada al cine con
acompañante, ¿qué porcentaje de clientes resultará beneficiado?
c. ¿Cuánto se espera recibir (en promedio) como solicitud de crédito por
cliente?
d. La atención en ROPÓN S. A. se congestiona grandemente y se consi-
dera que por hora se atienden, en promedio, 100 solicitudes de crédito.
Determine la probabilidad de que en un tiempo máximo de 9.5 horas se
atiendan 1000 solicitudes.

55. Beta Gas es una empresa repartidora a domicilio de gas propano, que recibe
los pedidos por teléfono. En este marco responda las siguientes preguntas:
a. En un lote de 36 balones recibidos de la empresa distribuidora, 4 de ellos
tienen un defecto no apreciable a simple vista en la válvula de salida,
pero que se evidencia al cabo de un periodo corto de funcionamiento. De
éste lote se han entregado 10 balones elegidos al azar. La política de Beta
Gas establece el inmediato cambio de balón por otro bueno, esta última
operación le cuesta 6 soles. Calcular la probabilidad de que, tras la entre-
ga de los 10 balones, la empresa tenga que gastar por lo menos 12 soles.

294 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


b. Se ha podido establecer que en promedio se reciben 2 pedidos cada 7
minutos
b.1 Calcular la probabilidad de que en los próximos 35 minutos se reci-
ban cuando menos 15 pedidos.
b.2 Se acaba de recibir un pedido, hallar la probabilidad de que trans-
curra más de 4 minutos para recibir para recibir otro pedido.
b.3 ¿Cuál es la probabilidad de que se reciban 4 pedidos en menos de 16
minutos?
Escenario
c. El contenido de gas en los balones de 10 kg es una variable aleatoria que
se distribuye normalmente con media 10 kg y desviación estándar 0.2
kg. Si se eligen al azar 8 de estos balones, halle la probabilidad de que 4
de ellos contengan más de 9.9 kg.

56. Resuelva lo que se pide:


a. Las variables aleatorias X, Y y Z son independientes con distribuciones:
X → χ(220) ; Y → χ(216) ; Z → N (0,1). Hallar:

a.1) P ( Z >1.6445 )
a.2) k, tal que: P( k ≤ X + Y ≤ 48.5) =
0.4029

 20Y 
a.3) P 0.355 < < 2.666 
 16X 
a.4) b tal que: P [ 0.245 < Z 2 < b ] =
0.4254

57. El número de ventas que puede hacer un agente en un día al visitar a n


potenciales clientes es una variable aleatoria con distribución binomial con
media 8 y varianza 4.8. Si por cada venta el agente obtiene una ganancia de
35 soles, ¿cuál es la probabilidad de que su ganancia de un día sea de por lo
menos 420 soles?

58. El número de departamentos para vivienda vendidos por una inmobiliaria


diariamente en una zona de Lima tiene una distribución de Poisson de me-
dia igual a 3.
a. Hallar la probabilidad de que el número de departamentos vendidos en
un día cualquiera en esa zona sea superior a 4.
b. El horario de atención diaria en la empresa es de 12 horas, se acaba de
vender un departamento, hallar la probabilidad de que transcurran más
de 5 horas para que se pueda vender otro.
c. ¿Cuántas horas, como mínimo, se tendrá que esperar para que se pue-
dan vender 5 departamentos con una probabilidad de 0.15?

Capítulo 4. Distribuciones de probabilidad 295


59. El peso de los melones que comercializa una tienda de frutas sigue una
distribución normal de media de 2 kg y desviación estándar de 500 g. Los
melones inferiores a 1,9 kg no se comercializan y se envían a la fábrica de
conservas. Si los melones vienen en cajas de 10:
a. Hallar la probabilidad de que un melón elegido al azar no sea enviado a
la fábrica de conservas.
b. Calcular la probabilidad de que la caja entera vaya a la fábrica de conservas.
c. Hallar la probabilidad de que el cuarto melón revisado sea el primero
enviado a la fábrica de conservas
d. Si por melón correcto se recibe 4.50 soles y por cada uno que se envía a
la conservera se recibe sólo 1.5 soles, calcular la cantidad que se espera
recibir por cada caja.

60. Las especificaciones de un proceso de producción de rodamientos señalan


que estos deben tener un centímetro de radio, con tolerancia de ± 0.05 cen-
tímetros. El fabricante gana 0.10 dólares por cada rodamiento aceptado. Si el
radio es menor de lo permitido, el rodamiento se debe refundir, produciendo
una pérdida de 0.05 dólares; por otra parte, si el radio es mayor de lo permi-
tido se debe rebajar el rodamiento, con una pérdida de 0.03 dólares. Supon-
gamos que el radio de los rodamientos tiene una distribución normal con
medía 1.01 centímetros y una varianza de 0.0009 centímetros cuadrados.
a. Si se fabrican 10 000 rodamientos, ¿cuántos de ellos se espera que cum-
plan las especificaciones?
b. ¿Cuál es la ganancia esperada por rodamiento?
c. ¿A cuánto se debería modificar la ganancia por cada rodamiento acepta-
do si se espera ganar 0,07 dólares por cada rodamiento?
d. Si de un lote de 500 rodamientos se eligen al azar y sin reposición 12,
¿cuál es la probabilidad de que más de la mitad de los rodamientos ele-
gidos cumplan con las especificaciones?

61. Los clientes de un banco que deben recibir un tratamiento especial llegan
de acuerdo con un proceso de Poisson con un promedio de un cliente cada
20 minutos.
a. ¿Cuál es la probabilidad de que en un período de media hora lleguen
más de 2 clientes que deben recibir un tratamiento especial en el banco?
b. A todo cliente que debe recibir un tratamiento especial se le entrega
un premio; pero al empezar la jornada de trabajo el administrador se
da cuenta que solo dispone de cinco de estos premios. En las primeras
dos horas de atención, ¿esperaría el administrador agotar los premios?;
¿por qué?

296 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


c. ¿Cuál es la probabilidad de que transcurran más de 15 minutos para que
llegue un cliente de tratamiento especial?
d. ¿Cuál es la probabilidad de que pase más de una hora hasta la llegada
del tercer cliente que deba recibir un tratamiento especial en el banco?

62. En cada uno de los siguientes enunciados no realice cálculos, solo indique
la variable aleatoria, la distribución pertinente y los valores de los paráme-
tros que corresponden.
a. Una compañía de seguros atiende, en promedio, a un asegurado que ha
sufrido un accidente automovilístico cada 30 minutos. Se desea conocer
la probabilidad de que se atiendan una cierta cantidad de asegurados
con accidentes automovilísticos en 2 horas.
b. Un embarque de 100 artículos contiene 5 unidades defectuosas. Para
inspección, se elegirá al azar y sin reemplazo 10 unidades. Si se encuen-
tra una cierta cantidad de unidades defectuosas, se rechazará todo el
embarque. Se desea conocer la probabilidad de rechazar el embarque.

63. Las variables; X, Y, V y W son independientes con distribuciones:


X →χ(230) ; Y → t( 20) ; V → N (µ= 0 ; s2= 4) ; W →χ(215) . Hallar:

a. Los valores de c y k tal que: P(c < X < k ) =


0.90, si P( X > k ) =
0.02
 30W 
b. P  0.4 ≤ ≤1.4 
 15X 
 V 
2 
c. El valor de b tal que: P 7.962 ≤   +W ≤ b  =0.7298
 2 

d. P(|Y |> 2.5) =


1 − P( −2.5 ≤ t( 20) ≤ 2.5) =
0.0212

64. Los pedidos por delivery llegan a cierto supermercado (que atiende las 24
horas del día) según un proceso de Poisson.
a. Si la probabilidad de que en una hora llegue por lo menos un pedido es
0.9817, ¿cuántos pedidos se espera que lleguen en 2 horas?
b. Si en promedio llegan 4 pedidos por hora, halle la probabilidad de que
el primer pedido demore en llegar más de 10 pero menos de 25 minutos.
Debe definir una variable e identificar su modelo.

Capítulo 4. Distribuciones de probabilidad 297


Respuestas a los problemas
propuestos
Capítulo 1. Estadística descriptiva

1. Población / muestra / unidad de análisis / características / cualitativa ordinal


/ datos / cualitativa nominales / estadístico / parámetro / moda / cuartil 1.
2. Presentación teatral / 180 presentaciones teatrales / 48 presentaciones teatrales.
3. -
4. a. 20 b. 38.33 %
5. a. 11.46 %
6. a. - - - b. 16.67 % c. 80 % d. 35 %
7. ---
8. a. 12 jóvenes b. 72.5 % c. 80 %
9. a. S/ 600 b. [4500; 5100]
c. 5 familias d. 181 familias
10. a. 8 b. - - - c. 72 %
11. S/ 3849.08
12. Miraflores
13. –0.326
14. a. ----- b. 1.136 horas - - c. –0.148
15. a. Máquina B (151g) b. No c. 3.0968 g
16. a. 96.5 kg b. Sí presenta (C.V. % = 10.89 %)
17. 115.21 segundos
18. a. No (coeficiente de variación ha disminuido)
b. k = S/ 100
19. ii
20. a. i. De 30 a 40 años
ii. Q3 = 6 juegos/atracciones
iii. 4.85 juegos/atracciones
b. i. 4 participantes
ii. US$ 6.53
iii. 1ra vez
c. S/ 94.85
d. i. Rango: De 30 a 40 años y bigote inferior:
S/ 78, bigote superior: S/ 153.
ii. De 18 a 30 años y de 40 años a más

Respuestas a los problemas propuestos 301


Capítulo 2. Probabilidad

1. 72 placas
2. a. 180 b. 105 c. 105
3. a. 40320 b. 9216 c. 576
4. a. 55 b. 165
5. 103 488
6. a. 9009 b. 8151
7. a.
125 b.
60 c.
60 d.
6
8. 0.5185
9. a. 50 % b. 0.4286 c. No
10. 0.9755
11. 0.00061035
12. a. 0.8 b. No
13. a. 0.40 b. 0.55 c. 0.40
14. a. 0.48 b. 0.41667 c. 0.19231
15. a. 0.34 b. 0.33
16. a. 0.06 b. 0.94
17.
= P( A) 1=
/ 3, P( B) 1=
/ 2, P(C ) 1 / 2
18. a. 0.1352 b. el método 2 (0.852)
19. a. 0.967 b. 0.2927 c. 0.98
20. a. 0.63375 b. fallas eléctricas (0.5461)
21. a. 0.7333 b. 0.5539

Capítulo 3. Variable aleatoria

1. a. Discreta b. Continua c. Continua


d. Continua e. Continua.
2. a. Ω = {C, C C, C C C, C C C C, ... , }
b. RX = {1, 2, 3, 3, 4, …}. En efecto:
= X (C ) 1;= X ( C C ) 2; =
X ( C C C ) 3; X=
( C C C C ) 4; ....;

X (C ) 1;=
X ( C C ) 2; =
X ( C C C ) 3; X=
( C C C C ) 4; ....;

3. Sea X = número de artículos buenos escogidos, entonces: X = {0 ,1, 2 , 3, 4 , 5}
La función de probabilidad de X es:

x 0 1 2 3 4 5 Total
P(X = x) 6/15504 210/15 504 1820/15 504 5460/15 504 6006/15 504 2002/15 504 1

302 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


4. Sea, X = número de artículos de la marca A escogidos, entonces: X = {1, 2, 3}
La función de probabilidad de X es:
X 1 2 3 Total
P(X = x) 0.2 0.5 0.3 1

5. Sea, X = número de hermanos elegidos para integar el proyecto, entonces,


X = {0, 1, 2}
La función de probabilidad de X es:
X 0 1 2 Total
P(X = x) 12/35 17/35 6/35 1

6. Sea, X= número de pruebas necesarias hasta encontrar el segundo defectuo-


so, entonces: X = {2, 3, 4, 5}
La función de probabilidad de X es:
x 2 3 4 5 Total
P(X = x) 0.1 0.2 0.3 0.4 1

7. Sea, X = número de pedidos que se envían a tiempo, X = {0, 1, 2 , 3}


La función de probabilidad de X es:
x 0 1 2 3 Total
P(X = x) 0.001 0.027 0.243 0.729 1

P( X= 3=
a. ) 0.729
P( X= 0=
b. ) 0.001
P( X ≥ 2) =
c. 0.972
8. Definamos la variable X = ganancia de la compañía por una póliza
Entonces, la distribución de probabilidad de la variable X es:
x p(x) x × p(x)
–148 500 0.008 –1 188
1 500 0.992 1 488
Total 1 300
9. Definamos la variable X = ganancia al invertir 10 000 soles
Entonces, la distribución de probabilidad de la variable X es:
x p(x) x × p(x)
–10 000 0.15 –1 500
–5 000 0.35 –1 750
10 000 0.40 4 000
20 000 0.10 2 000
Total 1 2 750

Respuestas a los problemas propuestos 303


10. Estrategia 1 Estrategia 2
x p(x) x × p(x) x p x × p(x)
20 000 0.2 4 000 100 000 0.5 50 000
30 000 0.4 12 000 0 0.5 0
50 000 0.4 20 000
Total 1 36 000 50 000

La segunda estrategia.

11. Continua No continua


x p(x) x × p(x) x p x × p(x)
1 000 000 0.4 400 000 –400 000 0.4 –160 000
– 600 000 0.6 –360 000 100 000 0.6 60 000
Total 1 40 000 –100 000
Continuar.

12. Definamos la variable X = ganancia de una póliza


P: prima a pagar
Entonces, la distribución de probabilidad de la variable X es:
x p(x) x × p(x)
P – 80 000 0.004 0.004P – 320
P – 40 000 0.007 0.007P – 280
P – 20 000 0.01 0.01P – 200
P 0.979 0.979P
Total 1 P – 800
Entonces 200 = P – 800, entonces P = 1000 dólares.
13. Sea X: sale el número elegido
G: ganancia del jugador
X 0 1 2 3 4 Total
G(X) –3 1 2 3 5
P (x) 0,48148 0,38611 0,11611 0,01552 0,00078 1.0
E(G(X)) = –0.77565, no le conviene jugar.
14. Sea C = costo del proyecto
X 27 28 29 30 31 32 Total
P (x) 0,05 0,15 0,25 0,40 0,10 0,05 1.0
C(X) 1400 1600 1800 2000 2300 2600
E(X) = 1920 E(X2) = 3 759 000, V(X) = 72 600, s =269.444

304 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


15. Sea X: número de caramelos de sabor fresa, G: ganancia del jugador,
P: pago por el derecho a jugar.
X 0 1 2 3 Total
P(x) 0,216 0,432 0,288 0,064 1.0
G 9 11 13 15 ------
E(X) = 11.4 = P, entonces P = 11.4
338 350
16. a. P(50 ≤=
x ≤ 75) 1625
= / 5050 0.3218 b.=
E[ X ] = 67
5050
17. a. P ( 2.2 ≤ x ≤ 4.8) =
0.5055
b. ( x ≤ a) 0.9;=
P= ⇒ a 5.692
P( x ≤ a) 0.5;=
c.
= ⇒ a 4.2426
d. d.1 E( X ) = 4; E( X 2 ) = 18 V ( X ) =18 − 42 = 2
E(U) = 18 V(U) = 8 2.8284
sU =
CV(U) = 15.7135 %.
d.2 P(U > 20 ) = 0.30555.
18.  0 , x≤0
 3
 x
a.
= F( x)  , 0 < x < 5 b. P(10 ≤ x ≤ 20) =0.448
 25
3

 1, x≥5

E( X ) = 18.75; E( X 2 ) = 375
c.
= E( X ) 18=
.75, V ( X ) 375
= – 18.752 23.4375
= CV ( X ) 25.8198 %.

 0 , x ≤ −1
 3
 x +1
19. a.
= F( x)  , − 1 < x < 2 b.
P( x < 0)= F(0)= 0.111
 9
 1 , x≥2

E( X ) 0=
c.
= .25; E( X 2 ) 0.4
E( X ) =0.25, V ( X ) =0.4 − 0.252 =0.3375 CV ( X ) =232.379 %.

20. a. k = 1 P ( x < 6=
) 0.6= 0.77459 b. P ( X ≤ 7 X > 3) =0.6388
2 10
E( X ) 3=
c.
= .3333; E( X 2 ) 20
E(X) = 3.333 V(X) = 20 – 3.3332 = 8.8911 CV(X) = 89.463 %.
d.
P( x > µ
= ) p( x > 3.333
=) 0.42294 ⇒ 42.294 %
1 b
21. a. ∫ ( a + bx 2 ) dx = 1; ⇒ a + =1 (1)
0 3
1 3 a b 3
∫ x( a + bx ) dx = ⇒ + = ( 2)
2

0 5 2 4 5

Respuestas a los problemas propuestos 305


Solucionando encontramos: a = 0.6 b = 1.2
P( x > 0.6) =
b. 0.08

dF( x)  0 , otro caso


f ( x)
22. a. = =  b. P(0.1< x < 0.2) =
0.17
dx  2 ( 1 − x) , 0 < x < 1
c.
E( X ) = 0.333

23. a. P ( x ≤=
a) 0.75; ⇒=a 3.1744
b. 0.5 P(solo una) = 5 × 0.55 = 0.15625
P ( x ≤ 0) =

24. a. c = 3 × 2003 P ( t < 400 / t > 300 ) =


0.57812558
b. 0.296 P(solo uno) = 5 × 0.296 × 0.7044 = 0.36354
P(t > 300) =



 0 , x ≤1

 x3 − 1
25. A. F( x) =  , 1 < x < 2 B. P  x < 2 
20  x > .  = 0.30667
  1 5 
 13x 2 17
 − , 2 ≤x<3
100 100

 1 , x≥ 3

 0 , x≤0
26. a. F( x) =  − x /10
b. P(6 ≤ x ≤ 18) =0.383513
1 − e , x>0

c. P( x > 5)= e –0.5= 0.6065; por lo tanto se espera que: 100 × 0.6065 =
61
tengan una duración superior a 5 años.
27. Definamos:
k = Número de horas para que vuelva a revisar el telar
La variable aleatoria es C = costo que se incurre porque se llega antes de que
el telar se pare o después de haberse parado; entonces se tiene:
 9( k − x) , x≤k
C( x) = 
 3( x − k ) , x>k
Donde X es el tiempo de funcionamiento del telar y tiene por función de
densidad de probabilidad:
1
 , 90 ≤ x ≤ 120
f ( x) =  30
0 , otro caso

E(C ) = 0.2k 2 − 39k + 1935
k = 97.5
28. E(Y) = 1190 CV(Y) = 27.92 %

306 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


29. a. k = 1.25
 0 , x≤ 0

  x 
5
F( x) 1.25  x −  , 0 < x ≤ 1
=
 5 
 
 , x≥1
1
P(0.3 ≤ x ≤ 0=
b. .6) F(0.6) − F(0=
.3) 0.3562
E(X) = 0.4167
c. V(X) = 0.23809 – 0.41672 = 0.06448, sX =0.25394
30. a. P(T > 10) = 1 – F(10) = 0.75 b. E(T) = 11.6667
c. 0.32 d. E(C) = 5 + 0.5 × E(T 2) = 5 + 0.5 × 141.6667 = 75.8333
31. a. P(Y > 11 000)= P( X ≥ 7)= 0.20
b.
Y 6 000 11 000 26 000 51 000 Total
P(y) 0.6 0.2 0.15 0.05 1
E(Y) = 12 250 E(Y 2) = 277 250 000 V(Y ) = 127 187 500 sX =
11 277.743

0 , t≤ 2

 1 3
32. a. =
F (t )  (t −8) , 2<t≤5
117
 1 , t≥ 5

P(C < 140) = P(T < 3) = F(3) = 0.1624


b.
P(T ≥ 4) = 1– F(4) = 1 – 0.4786 = 0.5214.
c.
d. E(T) = 3.90385.

Capítulo 4: Distribuciones de probabilidad

1. 0.9999
2. 0.2642
3. 0.09375
4. a. 0.001128 b. 0.5443 c. 4770 soles
5. a) X → b(n = 20; p = 0.2) b. 0.5981 c. 18 000 soles d. 0.4114
6. 0.684321
7. a. 0.2669 b. 0.415982 c. 2.93
8. a. 0.4143 b. 0.585714
9. a. 0.257143 b. 0.5789 c. 0.6842
10. a. 0.5571 b. 0.6945
11. a. 0.36217 b. 0.5194
12. a. 0.0902235 b. 0.8009

Respuestas a los problemas propuestos 307


13. a. 0.160623 b. 0.08392
14. 0.3528
15. a. 0.124104 b. 0.5152
16. a. 0.175467 b. 0.2650
17. a. 0.0183156 b. 0.256
18. a. 14.3 % b. 0.077
19. a. 750 soles b. 0.3433
c. En la tienda 1 las ventas diarias son más homogéneas
20. a. 400 b. 75 %
21. a. 165 b. 145 c. 0.83
22. a. 0.375 b. 1.33 c. 0.7564
 0 , si x < 1
0 , x <1 
  x −1 , 1 ≤ x ≤ 1.5
 2( x − 1) 
23. a. f ( x) 
= , si 1 ≤ x ≤ 1.5 b. Fx( x) =  1.5
 1.5 1 − ( 4 − x) , 1.5 < x ≤ 4
 2( 4 − x)  7.5
 , si 1.5 < x ≤ 4 
 7.5 1 , si x > 4
24. a. 0.8552 b. 58.67
25. a. s = 26.92; 0.4575 b. p = 0.3551; 0.7318
26. a. = s 12 b. El proceso alterno es más homogéneo en su duración.
µ 48; =
27. 0.01069
28. A = 20; B = 0.8
29. a. 456.2 b. 29.3
30. a. Zona A(C.V.=13.33 %) b. 0.5
31. a. 0.3012 b. 0.2739
32. a. 0.4866 b. 0.1342
33. a. 0.5134 b. 0.5654 c. 1200
34. a. 0.4964 b. 0.4346 c. 230.3 minutos
35. a. 0.3549 b. 0.9592
36. 0.02574
37. 0.6916
38. a. 5.1 b. 8.305
39. a. 6 horas b. 0.4346
40. a. 6.75 b. 0.4477
41. a. 768.3 b. 0.4559
42. 299.6 días
43. a. 40.26 b. 0.5749 c. 0.9281 d. a = -2.461, b = 2.461
44. a. 0.5190 b. 0.1088 c. 0.3804 d. 0.2

308 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


45. a. 0.8009 b. 0.7488 c. 21.06
46. a. 8 500 b. 50 154 c. 53 % d. 0.9632
47. a. 0.7778 b. 16
48. a. 16.47 b. 0.775 c. 1.787
49. a. 10.4 b. 0.3374 c. 0.5134 d. 0.09963
50. a.
= s 5 C.=
µ 25; = V . 20 % b. La empresa A
51. a. 0.8186 b. 4.262 horas c. 0.7558
52. a. 18.49 y 43.77 b. 1.751 c. 35.75
53. a. 0.2611 b. 0.1458
c. los atletas del país A, en promedio, son más rápidos que los del B
54. a. X → U(a b 5)
= 0; = b. 0.6 c. 2 500 soles d. 0.05505
55. a. 0.05653 b.1. 0.08346 b.2. 0.3189 b.3. 0.6696 c. 0.144973
56. a.1. 0.1 a.2. 34.97 a.3. 0.96 a.4. 1.678
57. 0.05653
58. a. 0.1847 b. 0.2865 c. 29.07 horas
59. a. 0.5793 b. 0.0001737 c. 0.0817 d. 32.38 soles
60. a. 0.8860 b. 0.0847 dólares c. K = 0.0838 dólares d. 0.991
61. a. 0.1912 b. 6 clientes especiales c. 0.4724 d. 0.4232
62. a. X: número de asegurados atendidos X → P(λ =4)
b. X: número de unidades defectuosas
X → H (n = 100, M = 5, n = 10), 0.4162
63. a. c = 19.87; k = 47.96 b. 0.7579 c. 20 d. 0.0212
64. a. 8 b. 0.3245

Respuestas a los problemas propuestos 309


Bibliografía

Anderson, D. R., Sweeney, D. J., Williams, Thomas A., Camm, Jeffrey D., y Co-
chran, James J. (2016). Estadística para negocios y economía. México: México
D. F.: Cengage Learning.
Carrascal, A. U. (2011). Estadística descriptiva con Microsoft Excel 2010. México:
México D.F: Alfaomega.
Chue J., Barreno E., Castillo C., Millones R., y Vásquez F. (2012). Estadística des­
criptiva y probabilidades. Perú, Lima: Fondo editorial Universidad de Lima.
Córdova, M. (2005). Estadística descriptiva e inferencial. Perú, Lima: Moshera.
García, O. C. (2011). Estadística descriptiva y probabilidades para ingenieros. Lima,
Perú, Lima: Empresa Editora Macro E.I.R.L.
Levine, D. M., Krehbiel, T. C., y Berenson, M. L. (2006). Estadística para administra­
ción. México, México D. F.: Pearson Educación.
Lind, D. A., Mason, R. D., Marchal, W. G., y Hano, R. M. C. (2004). Estadística para
administración y economía. México, México D. F.: Alfaomega.
Mendenhall, W., Beaver, R. J., Beaver, B. M., y Velázquez, A. J. A. (2015). Introduc­
ción a la probabilidad y estadística. México, México D. F.: Cengage Learning.
Mitacc, M. (2011). Tópicos de estadística descriptiva y probabilidad. Perú, Lima: Thales.
Montgomery, D. C., y Runger, G. C. (2004). Probabilidad y estadística aplicadas a la
ingeniería. México, México D. F.: Limusa-Wiley.
Romero, M. S. J., y Ordóñez, C. X. G. (2014). Estadística descriptiva e inferencial.
España, Madrid: CEF.
Spiegel, M. R., Schiller, J. J., Srinivasan, R. A., y Vargas, E. M. A. (2013). Probabili­
dad y estadística. México, México D.F.: McGraw-Hill/Interamericana.
Webster, A. L. (2005). Estadística aplicada a los negocios y a la economía. México D.
F.: McGraw-Hill.

Bibliografía 311
Anexos
Anexo 1
Resumen de fórmulas de estadística descriptiva

Estadígrafo Datos originales Datos agrupados

n k
Media ∑ xi ∑ yi fi
i =1 i =1
aritmética X= Y=
n n

 X n +1 , n impar
 ( 2 ) n 

  − FMe − 1 
Me =  Me LI Me + c  2
= 
Mediana  X n + X n+ 2  f Me 
 ( 2) (
2
)  

 2

 d1 
Mo LI Mo + c 
= 
Moda Valor de la variable más frecuente.  d1 + d2 
d1
= d2
f Mo − f Mo − 1 = f Mo − f Mo + 1

 kn 
 − FP − 1 
+ c  100
k
Pk LI P
= 
Percentiles k
 fP 
k
 

n k k
∑ Xi − n x ∑ yi fi − n Y ∑ fi ( yi − Y )
2 2 2 2 2
Desviación i =1 =i 1=i 1
SX = =SY =
estándar n −1 n −1 n −1

Coeficiente de S S
C.V ( X ) = X (100) C.V (Y ) = Y (100)
variación X Y

3 ( X − Me ) X − Mo
Coeficiente de asimetría de
= Pearson: C.A = C. A
S S

 n n! n!
C kn =
=  Pkn =
k
  k !( n − k )! (n − k )!

Anexos 315
Anexo 2
Resumen de fórmulas de probabilidad

P( E ∪ F ) =P( E) + P( F ) si E ∩ F =Φ P( E ') =−
1 P( E)
P( E ∪=
F ) P( E) + P( F ) − P( E ∩ F ) si E ∩ F ≠ Φ

P( E ∩ F )
Probabilidad condicional
= P( E / F ) P( F ) ≠ 0
P( F )

k
Probabilidad total P( A) = ∑ P( Ei ) P( A / Ei )
i =1

P( Ei ) P( A / Ei )
Probabilidad de Bayes P( Ei / A) = k
∑ P( Ei ) P( A / Ei )
i =1

x
Función de distribución (V. A. continua) F( x) = P( X ≤ x) = ∫ f ( x) dx
−∞


Valor esperado E( X ) = µ = ∑ x p( x) E( X ) =µ = ∫ x f ( x) dx
−∞

Varianza V ( X ) =s2 =E( X 2 ) − [ E( X )]2


E( X 2 ) = ∑ x 2 p( x) E( X 2 ) = ∫ x 2 f ( x) dx
−∞

316 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Anexo 3
Distribuciones notables de probabilidad

Distribución Función de probabilidad E(X) V(X)

 n n− x
P( X )   px q
= x=
 x
Binomial   np npq
x = 0, 1, 2, . . . , n q=1–p

 M  N − M 
  
P( X
= x=
)  x  n− x  M  M  M   N − n 
Hipergeométrica n  n  1 −   
N N  N  N   N −1 
 
n

e −λ λ x
P( X= x=)
Poisson x! λ λ
x = 0, 1, 2, . . . λ > 0

1 a+b (b − a)2
Uniforme f ( x)
= a ≤ x ≤b
b−a 2 12

1 x - µ 
2 E( X ) =
µ V (X) =
s2
−  
Normal 1
f ( x) = e 2 s  x−µ
2ps2 −∞ < x < ∞ Z=
s

1 −( x / b )
Exponencial =f ( x) e x>0 b b2
b

a −1 −x
1 b
Gamma f ( x) = x e ab ab2
ba Γ(a)

x
−  a  1   2    1   
2
a 
Weibull f ( x) = x a −1
e b bΓ 1 +  b 2 Γ  1 +  −  Γ  1 +   
ba  a    a    a  

Anexos 317
Distribución Función de probabilidad E(X) V(X)

 1 v −1 − x
 x 2 e 2 , si x > 0, v > o
 v/ 2  v 
Ji-cuadrado f ( x) =  2 Γ   v 2v
 2
0 , si x ≤ 0

  v +1
 Γ
 2 
f ( x)  
1
= , − ∞ < x < ∞; v > 0 v
T de Student  Γ  v  vp
v +1 0 , v>2
 x 2  2 v−2
  2  1 + 
 v 

 m+n m
m−2
 Γ  2 2n2 ( m + n − 2)
  2  m x 2
  , si x > 0, m > 0, n > 0
 n m(n − 2)2 (n − 4)
f ( x) = Γ  m  Γ  n   n 
m+n
F (Fisher)  m  2
  2  2 1 +   x  n−2
  n  con n > 4
0 , si x ≤ 0

318 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios


Este libro se terminó de imprimir en abril del 2018,
en Tarea Asociación Gráfica Educativa
Psje. María Auxiliadora 156-164, Breña, Lima, Perú
Teléfonos: 424-8104 / 332-3229
tareagrafica@tareagrafica.com

También podría gustarte