Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AREQUIPA - PERÚ
2011
Prólogo
La finalidad de este trabajo es la de servir como texto guı́a para el curso de Estadı́stica
y Probabilidad, ofrecido a los alumnos del Area de Ingenierı́as de la Universidad Católica
de Santa Marı́a.
Los temas aquı́ tratados son los que generalmente se dictan en un curso de Estadı́stica
y Probabilidad. Ası́, los temas son presentados y ordenados tratando de mantener una
continuidad e integración, que permitan abordar rapidamente los conceptos y herramientas
básicos en la Estadı́stica y Probabilidad; a esto último también contribuyen los ejemplos
ilustrativos que se ofrecen.
Este trabajo resume las clases del curso impartidas por los autores a los alumnos de
Ingenierı́as, durante algunos semestres anteriores, comenzo con la elaboración de pequeñas
separatas y listas de ejercicios que fueron entregadas a los alumnos durante el dictado del
curso. Aquı́, se debe agradecer las facilidades brindadas por la Facultad Ingenierı́as por las
facilidades brindadas en la elaboración de este texto y por promover este tipo de trabajos.
Finalmente, se debe advertir a los alumnos que este texto no debe sustituir a los prin-
cipales textos del tema, ni a las clases, ni a sus propios apuntes, que esperamos ahora se
puedan hacer en mejores condiciones. La lectura de la bibliografı́a sobre el tema es nece-
saria y valiosa para un mejor aprendizaje.
2
Índice general
1. Estadı́stica Descriptiva 6
1.1. ¿Qué es la Estadı́stica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Elementos, población, muestra, caracteres . . . . . . . . . . . . . . . . . . . 7
1.3. Variables estadı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1. Clasificación de las variables . . . . . . . . . . . . . . . . . . . . . . . 8
1.4. Escalas o niveles de medición . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5. Organización de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5.1. Distribución de frecuencias . . . . . . . . . . . . . . . . . . . . . . . 10
1.5.2. Distribución de frecuencias por intervalos . . . . . . . . . . . . . . . 15
1.5.3. Distribución de frecuencias acumuladas . . . . . . . . . . . . . . . . 19
1.6. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3
3. Probabilidad 70
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.2. Experimentos y eventos aleatorios . . . . . . . . . . . . . . . . . . . . . . . 71
3.2.1. Operaciones básicas con eventos aleatorios . . . . . . . . . . . . . . . 72
3.3. Conteo de puntos muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.3.1. Variaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.3.2. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.3.3. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.4. Probabilidad de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.5. Probabilidad clásica y probabilidad geométrica . . . . . . . . . . . . . . . . 78
3.6. Probabilidad condicionada e independencia de eventos . . . . . . . . . . . . 80
3.6.1. Eventos independientes . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4
5.3.4. Modelo o Distribución normal . . . . . . . . . . . . . . . . . . . . . . 141
5.3.5. Propiedades de estandarización . . . . . . . . . . . . . . . . . . . . . 142
5.3.6. Propiedad de cerradura de distribución normal . . . . . . . . . . . . 142
5.4. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
Bibliografı́a 161
5
Capı́tulo 1
Estadı́stica Descriptiva
6
do métodos numéricos y gráficos que resumen y presentan la información contenida
en ellos.
5. Estadı́stico. Función definida sobre los valores numéricos de una muestra. En rela-
ción al tamaño de la población, ésta puede ser:
Finita: Como es el caso del número de personas que llegan al servicio de ur-
gencia de un hospital en un dı́a;
Infinita: Si por ejemplo estudiamos el mecanismo aleatorio que describe la
secuencia de caras y sellos obtenida en el lanzamiento repetido de una moneda
al aire.
7
7. Modalidades Diferentes situaciones posibles de un carácter. Las modalidades deben
ser a la vez exhaustivas y mutuamente excluyentes. Cada elemento posee una y sólo
una de las modalidades posibles.
8. Clases Conjunto de una o más modalidades en el que se verifica que cada modalidad
pertenece a una y sólo una de las clases.
Variables cuantitativas. Son las que tienen por modalidades cantidades numéricas
con las que podemos hacer operaciones aritméticas. Dentro de este tipo de variables
podemos distinguir dos grupos:
8
• Continuas, cuando admiten una modalidad intermedia entre dos cualesquiera
de sus modalidades, el peso X de un niño al nacer. En este caso los valores de
las variables son números reales, es decir
X∈R
Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece como
discreta. Este es el caso en que hay limitaciones en lo que concierne a la precisión
del aparato de medida de esa variable. Si medimos la altura en metros de personas
con una regla que ofrece dos decimales de precisión, podemos obtener
1. Nominal. Aquı́, los números solo sirven para distinguir valores o categorı́as diferen-
tes de la variable. Ejemplo. El sexo de los electores se mide a este nivel de medición
o escala. Una escala apropiada puede ser, por ejemplo:
0=femenino; 1=masculino.
a=femenino; b=masculino
2. Ordinal. Aquı́, los números, además de servir para distinguir, reflejan un orden
existente entre los valores de la variable, según el menor o mayor grado en el que
se encuentre presente la caracterı́stica. Ejemplo. El grado de instrucción del elector,
se suele medir con medir con este nivel. Para simplificar, supongamos que solo dis-
tinguimos cuatro: analfabeto, primaria, secundaria y superior. Entonces, una escala
apropiada puede ser:
9
0= analfabeto; 1= primaria; 2= secundaria; 3=superior
Ejemplo 1.3. Los ingresos del elector se miden con este nivel o escala, pues existe
una unidad de medida y existe el cero absoluto u origen natural, es decir, un valor
que, sin importar la escala de razón empleada, indica ausencia de ingresos.
Los cuadros númericos de una sola variable estadı́stica se denominan distribución de fre-
cuencias. En el procedimiento para construir distribuciones de frecuencias nos referiremos
a muestras, mientras no se diga lo contrario.
10
1. Variable cualitativa.
Consideremos una población estadı́stica de n individuos, descrita según un carácter
o variable C cuyas modalidades han sido agrupadas en un número k de clases, que
denotamos mediante {C1 , C2 , ..., Ck }. Para cada una de las clases Ci , i = 1, 2, ..., k ,
introducimos las siguientes magnitudes:
pi = hi × 100 %.
Gráfica
Existe una gran variedad de gráficas para la distribución de frecuencias de variable
cualitativa, las más comunes son la de barras y la de sectores circulares.
En una gráfica de barras los datos de cada una de las modalidades Ci se representan
por una barra rectangular vertical (u horizontal), cuya altura (o largo) es proporcio-
nal a su frecuencia. Las barras se dibujan dejando un espacio entre ellas.
Si la escala es nominal las categorias pueden ser colocadas en cualquier orden. Pero,
11
si la escala es ordinal las categorias deben ir ordenadas. En una gráfica circular, los
datos de cada categorı́a Ci se representan por un sector circular cuyo ángulo en el
centro es igual a hi × 360o
Si la gráfica por sectores circulares es tridimensional se denomina pastel.
B, N, N, B, R, N, N, B, B, N,
B, N, N, R, B, N, B, R, B, N.
SOLUCIÓN.
La tabulación de estos datos, donde la variable cualitativa es X : Color de la bebida
gaseosa, es la distribución de frecuencias del siguiente cuadro
Cuadro 1.2Distribución de personas por su color preferido de una marca de bebida
gaseosa
12
La figura 1.2 es la representación mediante gráfica de sectores circulares del cuadro
1.2. La frecuencia 45 % es equivalente a 0,45×360o = 162o , la frecuencia 40 % es equi-
valente a 0,40 × 360o = 144o , y la frecuencia 15 % es equivalente a 0,15 × 360o = 54o ,
13
cualitativa.
Grafica.
La representación gráfica más común de una distribución de frecuencias de una
variable discreta es del tipo bastón que consiste en trazar en cada valor distinto de
la variable, segmentos de recta proporcionales a su frecuencia.
También, se pueden usar barras rectangulares para graficar una distribución de fre-
cuencias de variable discreta.
Ejemplo 1.5. En una encuesta realizada a 20 familias sobre el número de hijos por
familia (variable X), se obtuvo el siguiente resultado:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0,
3, 2, 1, 3, 2, 3, 3, 1, 2, 4.
Solución.
Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0,1,2,3, 4
que se repiten respectivamente 1,4,7,6,2 veces. La distribución de frecuencias de X se da
en el siguiente cuadro (cuadro 1.4.)
14
En la gráfica de bastones, figura 1.3, se indican las frecuencias absolutas y relativas en
cada valor distinto de la variable
15
En este texto se conviene y recomienda:
2. El número de intervalos elegido, debe dar una distribución de frecuencias mono mo-
dal, es decir, una distribución cuyas frecuencias van aumentando progresivamente
hasta una frecuencia, máxima y luego van disminuyendo también progresivamente.
R = Xmax − Xmin
k = 1 + 3,3log(n), n ≥ 10,
I1 = [Xmin , Xmin + A[
I2 = [Xmin , +A, Xmin , +2A[
I3 = [Xmin , +2A, Xmin , +3A[
... ...
Ik = [Xmin , +(k − 1)A, Xmin , +kA]
R
Observese que se cierra el último intervalo. Esto se debe a que si la división k es
exacta en el número de+ decimales de los datos ningun dato quedara fuera.
16
Ejemplo 1.6. Los ingresos quincenales en dólares (variable X) de 45 personas son:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
Solución:
1. De los datos, se encuentra Xmax = 89 y Xmin = 26. El rango de los datos es:
R = 89 − 26 = 63
k = 1 + 3,3log(45) = 6,45 ≈ 7.
R 63
A= = =9
k 7
17
Marca de clase
Definición: La marca de clase del intervalo Ii = [Li−1 , Li [ es el número mi , que se define
como el punto medio del intervalo, esto es,
Li−1 + Li
mi =
2
La marca de clase es el número que representa a todos los datos contenidos en le intervalo.
Observación. Es evidente que al representar los datos tabulados en un intervalo por
sus correspondientes marcas de clase se dejan sin efecto los valores recopilados, por los
que se pierde alguna información.
Solución
18
1.5.3. Distribución de frecuencias acumuladas
Con variables cualitativas a nivel nominal no tiene ningún significado las frecuencias
acumuladas
∑
i
Fi = f1 + f2 + ... + fi = fj i = 1, 2, ..., k
j=1
Fi f1 + f2 + ... + fi ∑ i
Hi = = = h1 + h2 + ... + hi = hj i = 1, 2, ..., k
n n
j=1
∑
i
Pi = p1 + p2 + ... + pi = pj i = 1, 2, ..., k
j=1
Ejemplo 1.8. El siguiente cuadro muestra las frecuencias acumuladas del número de hijos
de 20 familias
Cuadro 1.7. Distribución de frecuencias acumuladas del número de hijos por familia
Número de fi hi pi Fi Hi Pi
hijos Xi
0 1 0.05 5 1 0.05 5
1 4 0.20 20 5 0.25 25
2 7 0.35 35 12 0.60 60
3 6 0.30 30 18 0.90 90
4 2 0.10 10 20 1.00 100
Total 20 1,00 100 %
El valor 12 de F3 significa que existen 12 familias que tienen 2 hijos o menos, o que el
60 % de las familias tienen 2 hijos o menos
19
Observación. Las figuras 1.5 son en realidad son en realidad de una distribución de-
nominada función de distribución acumulada (FDA).
Por ejemplo, la figura 1.5(b) donde las frecuencias relativas, corresponden FDA que
sigue:
0 si x<0
0,05 si 0 ≤ x < 1
0,25 si 1 ≤ x < 2
H(x) =
0,60 si 2 ≤ x < 3
0,90 si 3 ≤ x < 4
1 si x≥4
En general, si las variable discreta X tiene valores distintos x1 , x2 , ..., xk con frecuencias
relativas respectivas h1 + h2 + ... + hk , entonces, su FDA menor o igual que x para x ∈ R,
se define por:
0 si x < x1
i
∑
H(x) = hj si xi ≤ x < xi+1 , i = 1, 2, ..., k − 1
j=1
1 si x ≥ xk
Si la distribución de frecuencias es de intervalos, la frecuencia acumulada de cada in-
tervalo es la suma de las frecuencias (absolutas, relativas o porcentajes) hasta ese intervalo.
20
Gráfica (caso continuo)
La mas usada es el poligono de frecuencias acumuladas, conocida también como ojiva. La
ojiva, se obtiene uniendo con segmentos de recta, los puntos cuya abscisa es proporcional
al lı́mite superior (Li ) de cada intervalo y cuya ordenada es proporcional a la frecuencia
acumulada respectiva (absoluta, relativa, porcentaje).
En el siguiente cuadro (cuadro 1.8.) se presentan las frecuencias acumuladas de los
ingresos quincenales de 45 personas que corresponde al cuadro 1.6.
Intervalos fi hi pi Fi Hi Pi
[Li−1 ; Li [
[26, 35[ 1 0.022 2.2 1 0.022 2.2
[35, 44[ 4 0.089 8.9 5 0.111 11.1
[44, 53[ 5 0.111 11.1 10 0.222 22.2
[53, 62[ 14 0.311 31.1 24 0.533 53.3
[62, 71[ 14 0.311 31.1 38 0.844 84.4
[71, 80[ 5 0.111 11.1 43 0.956 95.6
[80, 89[ 2 0.044 4.4 45 1.00 100
Total 45 1,00 100 %
La figura siguiente (figura 1.6) representa la ojiva de la distribución de los ingresos quin-
cenales de 45 personas
21
Curva de frecuencias
Una curva de frecuencias se obtiene del poligono de frecuencias “suavizando”sus puntos
angulosos. En el proceso de suavización se recomienda tener en cuenta que la “porción”de
área que se descarta deberá ser proporcional a la “porción”de área que se incluye en el
interior de la gráfica La siguiente figura (figura 1.7) es una curva de frecuencias.
Las curvas de frecuencias pueden tener una gran variedad de formas. Algunas de ellas
son las siguientes:
Distribuciones Simétricas
Las curvas simétricas son de 3 tipos:
Normal o mesocúrtica
Platicúrtica
Leptocúrtica
22
Distribuciones Asimétricas
Las curvas asimétricas pueden ser de dos tipos:
Núemro de hijos X 1 2 3 4
Frecuencias fi 1 3 5 3
23
identico (salvo un cambio de escala en el eje de ordenadas) al diagrama de barras
para frecuencias relativas y que ha sido calculado usando las columnas de xi y hi . El
diagrama escalonado (acumulado) se ha construido con la información procedente
de las columnas xi y Fi .
2. Ejercicio 2
La siguiente distribución se refiere a la duración en horas (completas) de un lote de
500 tubos:
Solución.
En primer lugar observamos que la variable en estudio es discreta (horas completas),
pero al tener un rango tan amplio de valores resulta más conveniente agruparla en
24
intervalos, como si de una variable continua se tratase. La consecuencia es una ligera
perdida de precisión.
El último intervalo está abierto por el lı́mite superior. Dado que en él hay 25 ob-
servaciones puede ser conveniente cerrarlo con una amplitud “razonable”. Todos los
intervalos excepto el tercero tienen una amplitud de 200 horas, luego podrı́amos ce-
rrar el último intervalo en 1300 horas
Antes de realizar el histograma conviene hacer una observación importante. El his-
tograma representa las frecuencias de los intervalos mediante áreas y no mediante
alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas tenien-
do en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es
necesario diferenciar entre los conceptos de área y altura, pero en este caso el tercer
intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su área
en un rectángulo de base doble (lo que reduce su áltura a la mitad).
Ası́ será conveniente añadir a la habitual tabla de frecuencias una columna que repre-
sente a las amplitudes de cada intervalo, y otra de frecuencias relativas rectificadas,
gi , para representar la altura del histograma. Los gráficos requeridos se representan
en las figuras siguientes.
25
Por otro lado, mirando el histograma se ve que sumando frecuencias relativas, hasta
las 900 horas de duración hay
Esta cantidad se obtiene de modo más directo viendo a qué altura corresponde al
valor 900 en el diagrama de frecuencias acumuladas (ojiva).
Como en total son 500 tubos, el número de tubos con una duración igual o menor
que 900 horas es 0,675 × 500 = 337,5, redondeando, 338 tubos.
26
1.7. Ejercicios propuestos
1. a Número de teléfono celular.
b Puntaje en un examen de un curso el la escuela de Ingenierı́a de Sistemas e
Informática.
c Puesto en el examen de ingreso.
d Tiempo de reacción ante un estimulo visual.
e Intención de voto para las próximas elecciones de alcalde.
f Pérdida de peso, en kilogramos, de los corredores en la Maratón de Huancayo.
g Número de DNI.
h Ingreso mensual familiar.
i Dirección de una vivienda.
j Número de botes que da una pelota al ser lanzada de una cierta altura.
2.1 Una empresa que vende microcomputadoras ha llevado a cabo un estudio para
analizar el número de microcomputadoras que existen en pequeñas empresas
del distrito A. Para el efecto toma una muestra aleatoria de 40 empresas en-
contrando los siguientes resultados:
5 7 9 7 8 5 4 4 3 7
8 4 9 6 8 7 6 9 8 4
6 4 7 4 3 5 8 5 9 6
7 9 4 7 5 8 7 9 6 8
2, 81 4, 20 3, 85 9, 11 2, 08 5, 91 1, 62 6, 72 21, 66
27
3, 07 2, 95 8, 77 4, 73 9, 21 14, 21 1, 58 9, 85 78, 81
6, 65 1, 80 7, 01 1, 89 4, 23 6, 58 4, 74 8, 53 10, 56
12 18 5 2 8 24 17 5 9 15
27 35 18 14 3 9 15 20 24 27
30 22 21 17 20 36 28 23 12 11
22 32 37 40 28 36 35 39 12 19
28 20 15 6 4 12 16
59 92 54 48 73 60 73 75 74 84
33 61 71 38 47 53 63 48 41 68
60 44 39 34 75 86 72 50 47 52
65 68 70 47 40 36 70 38 40 52
60 50 90 84 72 88 49 40
33 25 20 33 25 16 16 16 16 20
12 20 33 33 20 33 20 12 25 20
33 25 16 25 33 25 20 20 20 20
12 25 16 16 20 16 25 20 25 16
28
3. Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en
el año 2002 son los siguientes:
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
[Li−1 , Li [ fi
[4,10[ 1
[10,16[ 3
[16,22[ 6
[22,28[ 12
[28,34[ 11
[34,40[ 5
[40,46] 2
[Li−1 , Li [ fi hi
[-19,-17[
[-17,-15[ 2
[-15,-13[ 8
[-13,-11[ 0.125
[-11,-9[ 4
[-9,-7] 0.2083
29
6. Completar la tabla de distribución para una muestra de 4308 elementos, si se sabe
que a partir de la segunda frecuencia absoluta se cumple que cada frecuencia es la
quinta parte de la anterior más dos. Además se conoce que:
k = 5 X1 = 60 X4 = 105
[Li−1 , Li [ fi Fi hi Hi
[30, 50[ m n 0.15 z
[50,70[ p q w a
[70,90[ r s 0.25 b
[90,110[ 10 u x 0.7
[110,130] 30 v y
Hallar:
a m+n
b r−p+a
8. La compañı́a ABC, muestreó sus registros de embarque durante cierto dı́a, obtenien-
do los siguientes resultados con respecto al tiempo transcurrido desde la recepción
de la orden hasta la entrega (en dı́as).
20 12 5 8 19 14 10 11 15 6
24 7 7 13 29 13 6 4 11 11
9. En una fábrica se sabe que el jornal mı́nimo es S/115, si se conoce además que:
20 obreros ganan por lo menos S/155, pero menos de S/165 68 obreros ganan por
lo menos S/145; 106 obreros ganan por lo menos S/135; 135 obreros ganan por lo
menos S/125 y el restante 10 % de los obreros ganan menos de S/125. Además se
sabe que el rango es 50. Completar la tabla de distribución de frecuencias.
30
18 perciben haberes inferiores a $390 mensuales; 20 % son profesionales y reciben
un haber de por lo menos $490 mensuales. Construir la tabla de distribución de
frecuencias relativas.
[Li−1 , Li [ fi Fi hi
[160,170[
[170,180[ 48 60
[180,190[ 0.125
[190,200[ 0.075
[200,210]
3 2 5 0 1 3 2 1 0 1 3 4 2 4 4 4 3 3 2 3
Marca de clase 45 55 65 75 85
2n 3n n 3n n
Frcuencia relativa 25 100 50 50 100
¿Qué porcentaje de estudiantes obtuvieron una nota menor que 60 puntos o mayor
o igual a 80 puntos?
14. Dada la siguiente distribución de frecuencias en base al ingreso familiar de 200 fa-
milias.
[Li−1 , Li [ fi Fi
[ , [ 12
[ ,270[
[ ,300[ 30 90
[ , [ 126
[330, ]
[ , ] 50
31
¿Cuántas familias tienen un ingreso comprendido entre 260 y 320?
[Li−1 , Li [ fi Fi hi
[ , [ 8
[ 12 , [
[ , [ 0.2
[ , 24 [ 17
[ , ]
16. Los tiempos de vida útil (en dı́as) de un tipo de bacteria, se tabuló en una distribución
de frecuencias de 5 intervalos de igual amplitud con frecuencias relativas acumuladas:
0.10; 0.25; 0.55; 0.80; 1.00. Determine la distribución de frecuencias absolutas, si la
tercera frecuencia absoluta acumulada es 11, si la segunda marca de clase es 6, y si
el lı́mite inferior del cuarto intervalo es 12.
17. En una fábrica se sabe que el jornal mı́nimo es S/115, si se conoce además que:
20 obreros ganan por lo menos S/155, pero menos de S/165 68 obreros ganan por
lo menos S/145; 106 obreros ganan por lo menos S/135; 135 obreros ganan por lo
menos S/125 y el restante 10 % de los obreros ganan menos de S/125. Además se
sabe que el rango es 50. Completar la tabla de distribución de frecuencias.
18. La compañı́a ABC, muestreó sus registros de embarque durante cierto dı́a, obtenien-
do los siguientes resultados con respecto al tiempo transcurrido desde la recepción
de la orden hasta la entrega (en dı́as).
20 12 5 8 19 14 10 11 15 6
24 7 7 13 29 13 6 4 11 11
32
20. Una compañı́a tiene 60 trabajadores. El sueldo mı́nimo de un trabajador es $100 y
el máximo $590 mensuales. El 80 % de los trabajadores ganan por lo menos $210;
18 perciben haberes inferiores a $390 mensuales; 20 % son profesionales y reciben
un haber de por lo menos $490 mensuales. Construir la tabla de distribución de
frecuencias relativas.
33
Capı́tulo 2
Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto
a una medida que indique el valor alrededor del cuál se agrupan los datos, se asocie una
medida que haga referencia a la variabilidad que refleje dicha fluctuación. En este sentido
pueden examinarse varias caracterı́sticas, siendo las más comunes:
34
A lo largo de este capı́tulo, y siguiendo este orden, iremos estudiando los estadı́sticos
que nos van a orientar sobre cada uno de estos niveles de información: valores alrededor de
los cuales se agrupa la muestra, la mayor o menor fluctuación alrededor de esos valores, nos
interesaremos en ciertos valores que marcan posiciones caracterı́sticas de una distribución
de frecuencias ası́ como su simetrı́a y su forma.
La media,
La mediana,
La moda.
X = x1 h1 + ... + xk hk
1
= (x1 f1 + ... + xk fk )
n
1∑
k
= xi fi
n
i=1
35
habrá una pérdida de precisión que será tanto mayor cuanto mayor sea la diferencia entre
los valores reales y las marcas de clase, o sea, cuanto mayores sean las longitudes ai , de
los intervalos.
Solución
Del cuadro 1.6 tenemos:
1∑
k
2702
X= mi fi = = $60,04
n 45
i=1
a Uno de ellos es que es muy sensible a los valores extremos de la variable: ya que todas las
observaciones intervienen en el cálculo de la media, la aparición de una observación
extrema, hará que la media se desplace en esa dirección. En consecuencia,
d Si consideramos una variable discreta, por ejemplo, el número de hijos en las familias
de Arequipa el valor de la media puede no pertenecer al conjunto de valores de la
variable; Por ejemplo X = 2,5 hijos.
36
a 120 3 14 1 99 7 30 2000 16
b 30 77 3 300 36 11 10000 29
Solución
1 3 7 14 16 30 99 120 2000
3 11 29 30 36 77 300 10000
La mediana en este caso, puede ser cualquier número situado entre 30 y 36, ya que
este dividirá a los datos en dos grupos de 4 datos cada uno. Pero, para evitar la
infinidad de valores, se elige como mediana la semisuma de los dos valores centrales.
Esto es, Med = 30+362 .
37
Si en lugar de las frecuencias absolutas se utilizan las relativas (o porcentajes), enton-
ces, haciendo hi = fni , Hi = Fi−1
n en la fórmula de la mediana, se tiene:
1
2 − Hi−1
Med = Li−1 + A
hi
Observación
Entre las propiedades de la mediana, vamos a destacar las siguientes:
Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones
extremas, ya que no depende de los valores que toma la variable, sino del orden de
las mismas. Por ello es adecuado su uso en distribuciones asimétricas.
38
[Li−1 , Li [ fi
[ 0 , 10 [ 60
[ 10 , 20 [ 80
[ 20 , 30 [ 30
[ 30 , 100 [ 20
[ 100 , 500 ] 10
Solución
[Li−1 , Li [ fi A m mfi Fi
[ 0 , 10 [ 60 10 5 300 60
[ 10 , 20 [ 80 10 15 1200 140
[ 20 , 30 [ 30 10 25 750 170
[ 30 , 100 [ 20 70 65 1300 190
[ 100 , 500 ] 10 400 300 3000 200
Total 200 6550
n
La primera frecuencia absoluta acumulada que supera el valor 2 = 100 es Fi = 140. Por
ello el intervalo que contiene a la mediana es [10,20[.Asi:
n
− Fi−1 200
− 60
Med = Li−1 + 2
A = 10 + 2
× 10 = 15
fi 80
39
2.1.3. La moda Mo
Llamaremos moda a cualquier máximo relativo de la distribución de frecuencias, es
decir, cualquier valor de la variable que más veces se repite.
La moda no siempre existe y si existe, no siempre es única.
c 31 11 12 19 no existe. (También vale decir que cada uno de los datos es una moda).
donde:
Li−1 : es el limite inferior del intervalo modal
d1 = fi − fi−1 , esto es, d1 es igual a la frecuencia absoluta modal menos la frecuencia
absoluta del intervalo inmediatamente anterior.
d2 = fi − fi+1 , esto es, d2 es igual a la frecuencia absoluta modal menos la frecuencia
absoluta del intervalo inmediatamente posterior.
A: es la amplitud del intervalo modal.
Observación
40
inclinación, es más aconsejable el uso de la mediana. Sin embargo en estudios relacionados
con propósitos estadı́sticos y de inferencia suele ser más apta la media.
Ejemplo 2.5. Consideramos una tabla estadı́stica relativa a una variable continua, de la
que nos dan los intervalos, las marcas de clase mi , y las frecuencias absolutas, fi .
[Li−1 , Li [ mi fi
[0,2[ 1 2
[2,4[ 3 1
[4,6[ 5 4
[6,8[ 7 3
[ 8 , 10 ] 9 2
Solución
Para calcular la media podemos añadir una columna con las cantidades mi fi . La suma de
los términos de esa columna dividida por n = 12 es la media:
[Li−1 , Li [ mi fi Fi mi fi
[0,2[ 1 2 2 2
[2,4[ 3 1 3 3
[4,6[ 5 4 7 20
[6,8[ 7 3 10 21
[ 8 , 10 ] 9 2 12 18
Total 12 64
1∑
k
64
X= mi fi = = 5,33
n 12
i=1
La mediana es el valor de la variable que deja por debajo de sı́ a la mitad de las n obser-
vaciones, es decir 6. Construimos la tabla de las frecuencias absolutas acumuladas, Fi , y
vemos que eso ocurre en la modalidad tercera, es decir,
i=3
[Li−1 , Li [= [4, 6[ Intervalo donde se encuentra la mediana
n
−Fi−1 12
−3
Med = Li−1 + 2
fi A=4+ 2
4 × 2 = 5,5
41
[L0 , L1 [= [0, 2[, la moda se calcula como
( ) ( )
d1 2−0
Mo = Li−1 + A=0+ × 2 = 1,33
d1 + d2 (2 − 0) + (2 − 1)
En este caso, como se ve en la siguiente figura, la moda no toma un valor único, sino el
conjunto Mo = {1,33, 5,5}
42
Los cuartiles, Qi , son un caso particular de los percentiles. Hay 3, y se definen como:
Q1 = P25
Q2 = P50 = Med
Q3 = P75
De forma análoga se definen los deciles como los valores de la variable que dividen a las
observaciones en 10 grupos de igual tamaño. Más precisamente, definimos D1 , D2 , ..., D9
como:
Di = P10 , i = 1, ..., 9
Los percentiles (que incluyen a la mediana, cuartiles y deciles) también son denominados
estadı́sticos de posición.
Ejemplo 2.6. Dada la siguiente distribución en el número de hijos de cien familias, hallar
sus cuartiles.
xi fi Fi
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
Total 100
Solución
n n
1. Primer cuartil: 4 = 25; Primer Fi > 4 = 39; luego Q1 = 2
2n 2n
2. Segundo cuartil: 4 = 50; Primer Fi > 4 = 65; luego Q2 = 3
3n 3n
3. Tercer cuartil: 4 = 75; Primer Fi > 4 = 85; luego Q3 = 4
Ejemplo 2.7. Calcular los cuartiles en la siguiente distribución de una variable continua:
[Li−1 , Li [ fi Fi
[0,1[ 10 10
[1,2[ 12 22
[2,3[ 12 34
[3,4[ 10 44
[4,5] 7 51
Total 51
43
Solución
1. Primer cuartil:
n n
4 = 12,75; Primer Fi > 4 = 22; luego la linea i es la del intervalo [1,2[
n
− Fi−1 12,75 − 10
Q1 = P25 = Li−1 + 4
A=1+ × 1 = 1,23
fi 12
2. Segundo cuartil:
2n 2n
4 = 25,5; Primer Fi > 4 = 34; luego la linea i es la del intervalo [2,3[
2n
− Fi−1 25,5 − 22
Q2 = P50 = Li−1 + 4
A=2+ × 1 = 2,29
fi 12
3. Tercer cuartil:
3n 3n
4 = 38,25; Primer Fi > 4 = 44; luego la linea i es la del intervalo [3,4[
3n
− Fi−1 38,25 − 34
Q3 = P75 = Li−1 + 4
A=3+ × 1 = 3,445
fi 10
Ejemplo 2.8. Han sido ordenados los pesos de 21 personas en la siguiente tabla:
[Li−1 , Li [ fi
[ 38 , 45 [ 3
[ 45 , 52 [ 2
[ 52 , 59 [ 7
[ 59 , 66 [ 3
[ 66 , 73 ] 6
Total 21
Encontrar aquellos valores que dividen a los datos en 4 partes con el mismo número de
observaciones.
Solución
Las cantidades que buscamos son los tres cuartiles: Q1 , Q2 y Q3 . Para calcularlos, le
añadimos a la tabla las columnas con las frecuencias acumuladas, para localizar qué in-
tervalos son los que contienen a los cuartiles buscados:
[Li−1 , Li [ fi Fi
[ 38 , 45 [ 3 3
[ 45 , 52 [ 2 5
[ 52 , 59 [ 7 12 Q1 , Q2
[ 59 , 66 [ 3 15
[ 66 , 73 ] 6 21 Q3
Total 21
44
Q1 y Q2 se encuentran en el intervalo [52,59[, ya que F3 = 12 es la primera frecuencia de
distribución acumulada que supera a n4 y 2n
4 .
Q3 esta en [66,73[, pues F5 = 21 es es la primera frecuencia de distribución acumulada
que supera a 3n 4
Ejemplo 2.9. La distribución de una variable tiene por polı́gono acumulativo de frecuen-
cias el de la siguiente figura. Si el número total de observaciones es 50:
a Elaborar una tabla estadı́stica con los siguientes elementos: intervalos, marcas de clase,
frecuencia absoluta, frecuencia absoluta acumulada, frecuencias relativa y frecuencias
relativa acumulada
b Calcule la moda
45
Solución
[Li−1 , Li [ fi Fi hi Hi mi A
[0,5[ 10 10 0.2 0.3 2.5 5
[5,7[ 25 35 0.5 0.7 6 2
[ 7 , 12 [ 5 40 0.1 0.8 9.5 5
[ 12 , 15 ] 10 50 0.2 1 13.5 7
Total 50
b Calculemos la moda:
( ) ( )
d1 1
Mo = Li−1 + A=5+ × 2 = 5,66
d1 + d2 2+1
c n
− Fi−1 12,5 − 10
Q1 = P25 = Li−1 + 4
A=5+ × 2 = 5,2
fi 25
2n
− Fi−1 25 − 10
Q2 = P50 = Li−1 + 4
A=5+ × 2 = 6,2
fi 25
3n
− Fi−1 37,5 − 35
Q3 = P75 = Li−1 + 4
A=7+ × 5 = 9,5
fi 5
Una medida razonable de la variabilidad podrı́a ser la amplitud o rango, que se obtiene
restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil
de calcular y sus unidades son las mismas que las de la variable, aunque posee varios
inconvenientes:
46
En el transcurso de esta sección, veremos medidas de dispersión mejores que la anterior.
Estas se determinan en función de la distancia entre las observaciones y algun estadı́stico
de tendencia central.
El rango
El rango intercuartil
La varianza
La desviación estándar
El coeficiente de variación
2.3.1. El Rango R
Definición 2.1. El rango de variación R, de una serie de datos, es la diferencia entre sus
valores máximo y mı́nimo. Esto es:
R = Xmax − Xmin
El rango es una medidad de dispersión muy fácilmente calculable, pero es muy ines-
table, ya que depende únicamente de los dos valores extremos. Su valor puede cambiar
grandemente si se añade o elimina un sólo dato.
a 15 20 20 25; R = 25 − 15 = 10
b 195 200 200 200 200 200 200 200 205; R = 205 − 195 = 10
Claramente puede apreciarse que en la segunda serie los datos están menos dispersos, Pues
en ella hay mayor cantidad de datos parecidos a su promedio.
El Rango intercuartil es una medida que excluye el 25 % más alto y el 25 % más bajo,
dando un rango dentro del cual se encuentra el 50 % central de los datos observados y a
diferencia del rango total no se encuentra afectada por los valores extremos.
47
2.3.3. Varianza y desviación estándar
1. Varianza de datos no tabulados
La varianza de n valores x1 , x2 , ..., xn de alguna variable cuntitativa X cuya media
es X, es el número:
∑n
(xi − X)2
i=1
S2 =
n
Es facil ver que:
∑
n
x2i
i=1 2
S2 = −X
n
2. Varianza de datos tabulados
Variable disdreta
La varianza de n valores de una variable estadı́stica X que se clasifican en k valores
distintos x1 , x2 , ..., xk con frecuencias absolutas respectivas f1 , f2 , ..., fk y cuya media
es X se calcula con la siguiente fórmula:
∑
n
fi (xi − X)2
i=1
S2 =
n
Se verifica que:
∑
n
fi x2i
i=1 2
S2 = −X
n
Varinaza de datos tabulados por intervalos
La varianza de n valores de una variable estadı́stica X tabulados k intervalos con
marcas de clases m1 , m2 , ..., mk con frecuencias absolutas respectivas f1 , f2 , ..., fk y
cuya media es X se calcula con la siguiente fórmula:
∑
n
fi (mi − X)2
i=1
S2 =
n
Se verifica que:
∑
n
fi m2i
i=1 2
S2 = −X
n
3. Desviación estándar S
La desviación estándar se define como la raı́z cuadrada de la varianza, esto es:
√
S = S2
48
2.3.4. Coeficiente de variación CV
Hemos visto que las medidas de centralización y dispersión nos dan información sobre
una muestra. Nos podemos preguntar si tiene sentido usar estas magnitudes para compa-
rar dos poblaciones. Por ejemplo, si nos piden comparar la dispersión de los pesos de las
poblaciones de elefantes de dos circos diferentes, nos dará información útil.
¿Pero qué ocurre si lo que comparamos es la altura de unos elefantes con respecto a su
peso? Tanto la media como la desviación tı́pica, y , se expresan en las mismas unidades
que la variable. Por ejemplo, en la variable altura podemos usar como unidad de longitud
el metro y en la variable peso, el kilogramo. Comparar una desviación (con respecto a la
media) medida en metros con otra en kilogramos no tiene ningún sentido.
El problema no deriva sólo de que una de las medidas sea de longitud y la otra sea de
masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la masa, de
dos poblaciones, pero con distintas unidades. Este es el caso en que comparamos el peso
en toneladas de una población de 100 elefantes con el correspondiente en miligramos de
una población de 50 hormigas.
El problema no se resuelve tomando las mismas escalas para ambas poblaciones. Por
ejemplo, se nos puede ocurrir medir a las hormigas con las mismas unidades que los elefan-
tes (toneladas). Si la ingerierı́a genética no nos sorprende con alguna barbaridad, lo lógico
es que la dispersión de la variable peso de las hormigas sea practicamente nula (¡Aunque
haya algunas que sean 1000 veces mayores que otras!)
S
CV =
X
Observación
Es importante destacar que los coefientes de variación sirven para comparar las variabi-
lidades de dos conjuntos de valores (muestras o poblaciones), mientras que si deseamos
comparar a dos individuos de cada uno de esos conjuntos, es necesario usar los valores
tipificados.
49
2.4. Valores Estandarizados o Tipificados Z
Se conoce por Estandarización al proceso de restar la media y dividir por su desviación
tı́pica a una variable X. De este modo se obtiene una nueva variable:
X −X
Z=
S
Donde Z = 0 y SZ2 = 1 Esta nueva variable carece de unidades y permite hacer compara-
bles dos medidas que en un principio no lo son, por aludir a conceptos diferentes. Ası́ por
ejemplo nos podemos preguntar si un elefante es más grueso que una hormiga determina-
da, cada uno en relación a su población. También es aplicable al caso en que se quieran
comparar individuos semejantes de poblaciones diferentes. Por ejemplo si deseamos com-
parar el nivel académico de dos estudiantes de diferentes Universidades para la concesión
de una beca de estudios, en principio serı́a injusto concederla directamente al que posea
una nota media más elevada, ya que la dificultad para conseguir una buena calificación
puede ser mucho mayor en un centro que en el otro, lo que limita las posibilidades de
uno de los estudiante y favorece al otro. En este caso, lo más correcto es comparar las
calificaciones de ambos estudiantes, pero estandarizados cada una de ellas por las medias
y desviaciones estándar respectivas de las notas de los alumnos de cada Universidad.
a La variable estandarizada Z.
c Coeficiente de variación de Z.
Solución
Para calcular la variable estandarizada:
X −X
Z=
S
50
Partimos de los datos del enunciado. Será necesario calcular en primer lugar la media y
desviación tı́pica de la variable original (X).
[Li−1 , Li [ mi fi mi fi m2i hi
[0,4[ 2 47 94 188
[ 4 , 10 [ 7 32 224 1568
[ 10 , 20 [ 15 17 255 3825
[ 20 , 40 ] 30 4 120 3600
Total 100 693 9181
693
X = = 6,93
100
9,181
2
SX = − 6,932 = 43,78
√100
SX = 43,78 = 6,6
A partir de estos valores podremos calcular los valores tipificados para las marcas de clase
de cada intervalo y construir su distribución de frecuencias:
2 − 6,93
z1 = = −0,745
6,6
7 − 6,93
z2 = = 0,011
6,6
15 − 6,93
z3 = = 1,22
6,6
30 − 6,93
z4 = = 3,486
6,6
zi fi zi fi zi2 fi
-0.745 47 -35.015 26.086
0.011 32 0.352 0.004
1.220 17 20.720 25.303
3.486 4 13.944 48.609
Total 100 0.021 100.002
0,021
Z = ≈0
100
100,02
SZ2 = − 02 ≈ 1
√ 100
SZ = 1=1
A pesar de que no se debe calcular el coeficiente de variación sobre variables que presenten
valores negativos (y Z los presenta), lo calculamos con objeto de ilustrar el porqué:
SZ 1
CV = = =∞
Z 0
51
Es decir, el coeficiente de variación no debe usarse nunca con variables estandarizadas.
Estas ideas son las que vamos a desarrollar en lo que resta del capı́tulo.
52
Cuando la variable es discreta, decimos que es simétrica, si lo es con respecto a la media.
Observación
Se podrı́a pensar que definir la simetrı́a con usando la mediana para variables con-
tinuas y usando la media para variables discretas es una elección arbitraria. En
realidad esto no es ası́, pues si una variable es continua, coinciden los ambos criterios
de simetrı́a (con respecto a la media y a la mediana). Es más, se tiene que media y
mediana coinciden para distribuciones continuas simétricas. Por otro lado,
Dentro de los tipos de asimetrı́a posible, vamos a destacar los dos fundamentales
(figura ):
Asimetrı́a positiva:
Si las frecuencias más altas se encuentran en el lado izquierdo de la media, mientras que
en derecho hay frecuencias más pequeñas (cola).
Asimetrı́a negativa:
Cuando la cola está en el lado izquierdo.
53
cuidadosamente la gráfica, podemos no ver claro de qué lado están las frecuencias más
altas. Conviene definir entonces unos estadı́sticos que ayuden a interpretar la asimetrı́a, a
los que llamaremos ı́ndices de asimetrı́a, y que denotaremos mediante As . Vamos a definir
a continuación algunos de los ı́ndices de asimetrı́a más usuales como son el ı́ndice basado
en los tres cuartiles, el momento de tercer orden y la distancia entre la moda y la media
o la media y la mediana.
Una pista para saber si una distribución de frecuencias es asimétrica positiva tendremos :
Q3 − Q2 > Q2 − Q1
Q3 − Q2 < Q2 − Q1
54
Basándonos en que si una distribución de frecuencias es simétrica y unimodal, entonces
la media, la mediana y la moda coinciden, podemos definir otras medidas de asimetrı́a,
como son:
X − Mo
As =
S
O bien,
3(X − Med )
As =
S
Diremos que hay asimetrı́a positiva si As > 0 y negativa si As < 0 (véase la siguiente
figura).
[Li−1 , Li [ fi
[7,9[ 4
[ 9 , 11 [ 18
[ 11 , 12 [ 14
[ 12 , 13 [ 27
[ 13 , 14 [ 42
[ 14 , 15 [ 31
[ 15 , 17 [ 20
[ 17 , 19 ] 1
Solución
En primer lugar realizamos los cálculos necesarios a partir de la tabla de frecuencias:
55
[Li−1 , Li [ fi mi Fi mfi m2i fi
[7,9[ 4 8 4 32 256
[ 9 , 11 [ 18 10 22 180 1800
[ 11 , 12 [ 14 11.5 36 161 1851.5
[ 12 , 13 [ 27 12.5 63 337.5 4218.75
[ 13 , 14 [ 42 13.5 105 567 7654.5
[ 14 , 15 [ 31 14.5 136 449.5 6517.75
[ 15 , 17 [ 20 16 156 320 5120
[ 17 , 19 ] 1 18 157 18 324
Total 157 2065 27742.25
La media es X = 2065
157 = 13,15 años. La varianza la calculamos a partir de la columna de
2
la xi fi como sigue:
27742,25 √
S2 = − 13,152 = 3,78 años2 ⇒ S = 3,78 = 1,94 años
157
El coeficiente de variación no posee unidades y es:
1,94
CV = = 0,15 = 15 % de variabilidad
13,15
En lo que concierne a la simetrı́a podemos utilizar el coeficiente de asimetrı́a para el cual
es preciso el cálculo de los cuartiles:
Q1 = 12 + 39,25−36
27 × 1 = 12,12
78,5−63
Med = Q2 = 13 + 42 × 1 = 13,37
Q3 = 14 + 117,75−105
31 × 1 = 14,41
Lo que nos dice que aproximadamente en un rango de Q3 − Q1 = 2,29 años se encuentra
el 50 % central del total de observaciones Además:
(Q3 − Q2 ) − (Q2 − Q1 ) (14,41 − 13,37) − (13,37 − 12,12)
As = = = −0,09
Q3 − Q1 14,41 − 12,12
Este resultado nos indica que existe una ligera asimetrı́a a la izquierda (negativa). Un
resultado similar se obtiene si observamos la siguiente figura (Figura ) veremos que la
distribución de frecuencias es unimodal, siendo la moda
42 − 27
Mo = 13 + × 1 = 13,57
(42 − 27) + (42 − 31)
X − Mo 13,15 − 13,57
As = = = −0,21
S 1,94
56
2.6. Ejercicios Propuestos
1. Una empresa grande de equipos deportivos está probando el efecto de dos planes
publicitarios sobre las ventas de los últimos 4 meses. Dadas las ventas que se ven
aquı́, ¿cuál programa de publicidad parece producir el crecimiento promedio más
alto en ventas mensuales?
2. Los estadı́sticos del programa de Meals on Wheels (comida sobre ruedas), el cual
lleva comidas calientes a enfermos confinados en casa, desean evaluar sus servicios.
El número de comidas diarias que suministran aparece en la siguiente tabla de fre-
cuencia. Calcular la media, mediana y la moda e interprete.
3. Bill Karl compró 20 acciones a $15 cada una, 50 acciones a $20 cada una, 100 acciones
a $30 cada una y 75 acciones a $35 cada una. ¿Cuál es el precio promedio por acción?.
Edades Frecuencia
[50 , 55 [ 8
[ 55, 60 [ 13
[ 60 , 65 [ 15
[ 65 , 70 [ 10
[ 70 , 75 [ 3
[ 75 , 80 ] 1
57
5. Dado el siguiente cuadro estadı́stico con ancho de clase constante igual a 20. Deter-
mine la media de los datos.
[Li−1 , Li [ mi fi Fi mfi
[ , [ 880
[ , [ 1950
[ , [ 35 1800
[ , [ 13
[ , 200 [
[ , ] 4 70
[Li−1 , Li [ fi
[ 16 , 32 [ 6
[ 32 , 48 [ n
[ 48 , 64 [ 8
[ 64 , 80 [ 3n
[ 80 , 96] 3
7. En un examen de estadı́stica tomado el mismo dı́a y hora a los tres grupos del tercer
ciclo de Ingenierı́a de Sistemas: A , B y C con un total de 150 alumnos se obtuvo
una nota promedio de 13,2 , las notas promedio de los grupos A y B fueron 12 y 14
respectivamente; los registros del grupo C se extraviaron pero se sabe que el grupo
A es el 36 % del total y que el número de alumnos del grupo B es la tercera parte
de las matriculadas en el grupo C.
a Hallar el valor de a.
b ¿Bajo qué edad se encuentra el 35 % más joven?
c ¿Cuántas personas tienen como mı́nimo 20 años? Justifique.
58
9. De un grupo de pequeñas empresas se sabe que ninguna tiene más de 5 trabajadores
ni menos de 2, la mayorı́a tiene 3 trabajadores, el 20 % tiene 5 trabajadores, 2 de
cada 20 empresas tiene 4 trabajadores; la proporción de empresas que tienen dos
trabajadores es 0,25. Calcular e interpretar la media aritmética.
11. Los siguientes datos corresponden a los sueldos de los trabajadores de una compañı́a.
Sueldos N ro de trabajadores
[ 950 , 1000 [ 5
[ 1000 , 1050 [ 12
[ 1050 , 1100 [ 9
[ 1100 , 1150 [ 8
[1150 , 1200[ 4
[1200 , 1250[ 10
[1250 , 1300[ 6
59
13. Una fábrica de aparatos electrónicos ha comenzado un estudio para mejorar su efi-
ciencia. Efectuó para esto un relevamiento en las sección de armado de visores para
computadora durante 10 dı́as consecutivos. La cantidad de visores armados diaria-
mente fueron:
30 20 50 80 40 50 60 30 70 50
15. En un grupo hay 40 estudiantes varones con una edad promedio de 20 años, las
mujeres son en promedio más jóvenes en un 10 %; ¿cuántas mujeres hay si la edad
promedio de la clase es de 19 años?
16. El salario promedio mensual pagado a los trabajadores de una compañı́a es de $200.
Los salarios promedios mensuales pagados a hombres y mujeres de la compañı́a son
210 y 150 respectivamente. Determinar el porcentaje de hombres y mujeres que
trabajan en la compañı́a.
17. Una compañı́a minera tiene 100 trabajadores. Para los nombrados el haber máximo
es $450 y el mı́nimo $60. Hay un 5 % de eventuales (en prueba) que trabajan ad-
honorem o perciben compensaciones inferiores a $60. Quince trabajadores nombrados
perciben haberes inferiores a $250 y el 85 % ganan haberes inferiores a $400. Con
esta información, calcule las medidas de tendencia central posibles.
18. Un grupo de 200 estudiantes con estatura inedia de 60.96 pulg. Se divide en dos
grupos, un grupo con una estatura media de 63.4 pulg. y el otro con 57.3 pulg. ¿
Cuántos estudiantes hay en cada grupo?.
19. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos
alternativas de aumento: a) S/. 75 a cada uno, b) 15 % de su sueldo más 10 soles a
cada uno. Si la empresa dispone a lo más de S/. 94,000 para pagar sueldos, ¿cuál
alternativa es más conveniente?.
60
21. El sueldo medio de los obreros de una fábrica es de $286.
22. En una empresa donde el sueldo medio es de $400 se incrementa un personal igual al
25 % del ya existente con un sueldo medio igual al 60 % de los antiguos. Si 3 meses
más tarde se incrementan cada sueldo en 20 %, más $30, ¿cuánto es el nuevo salario
medio?.
Xi 5 10 15 20 25
fi 3 7 5 3 2
24. Calcular todas las medidas de dispersión para los datos de la siguiente distribución
26. Si X es una variable que tiene media 15 y varianza 25; hallar la media, varianza y
desviación tı́pica de Y en los siguientes casos:
a Y = 4 + 16X
b Y = 16 − 4X
1
c Y = 4 + 14 X
27. La producción de papa en Tn. fue de 4000 Tn. con variancia de 3600 para el depar-
tamento de Cuzco, mientras que para el departamento de Puno fue de 10 000 Tn.
con 1440000 de variancia, en que departamento se puede decir que la producción de
papa es más homogénea
61
28. Un grupo de trescientos alumnos llevan el curso de Estadı́stica y Probabilidad dis-
tribuidos en cuatro secciones. Si se sabe que el número de alumnos por sección están
en una progresión aritmética cuya razón es 20 y además se conoce que las notas
promedio de las secciones A , C y D son 12, 14 y 11 mientras que las varianzas de
los grupos A y C son 16 y 4 y las desviaciones estándar de B y D son 3 y 1 respecti-
vamente. Si la nota promedio en el curso es 12,37; hallar e interpretar la desviación
estándar de las cuatro secciones juntas.
29. En una empresa donde los salarios tienen una media S/. 2500 y una desviación
estándar de S/. 300 el Sindicato solicita que cada salario Xi se transforme en Yi ,
mediante la siguiente relación:
Yi = 3,5Xi + 10
30. Se tienen tres empresa con aproximadamente igual número de trabajadores. El núme-
ro de inasistencias registradas durante los últimos seis meses en cada una de las tres
empresas se da a continuación: Empresa:
A : 3 19 4 5 15 6
B : 7 8 11 9 14 16
C : 10 17 12 2 18 13
¿En cuál de estas tres empresas existe mayor variabilidad con respecto al número de
inasistencias?
31. Una empresa de fabricación de productos cerámicos dispone de tres centros de pro-
ducción. En el centro A, el más grande y moderno, se hace un estudio de los m2 de
azulejo producidos al mes durante el año pasado, obteniéndose una media de pro-
ducción mensual X A = 250000m2 , con una desviación estándar SA = 15000m2 . Se
sabe que el centro B, por tener maquinaria más anticuada que A, produce cada mes
un tercio de la producción de A, y que el centro C, por tener un horno menos que
B, produce cada mes 25000 m2 menos que B ¿Cual es la media y la varianza de la
producción mensual de C?
32. Se utiliza dos máquinas diferentes para fabricar conductos de salida de papel desti-
nados a copiadoras Kodak. Los conductos de una m uestra de la primera máquina
medı́an:
12,2, 11,9, 11,8, 12,1, 11,9, 12,4, 11,3 12,3
62
pulgadas. Los conductos hechos con la segunda máquina medı́an:
33. Un entrenador de pista y campo debe decidir a cuál de sus dos velocistas selec-
cionará para los cien metros planos en una próxima competencia. El entrenador
basará la decisión en los resultados de cinco carreras entre los dos atletas, celebradas
en un periódo de una hora, con descanso de 15 minutos. Los siguientes tiempos (en
segundos) se registraron para las cinco carreras:
Atleta Carrera
1 2 3 4 5
Mendoza 11,1 11.0 11.0 15.8 11.1
Ramirez 11.3 11.4 11.4 11.5 11.4
Con base en estos datos, ¿a cuál de los dos velocistas debe seleccionar el entrenador?
¿por qué?
A A B B C C
Xi Fi [Li−1 , Li [ mi fi Hi hi Xi2
2.5 3 [2,6[ 16 0.1 2.5
7.5 8 [6,10[ 144 0.2 10
12.5 22 [10,14[ 240 0.8 86.4
17.5 30 [14,18[ 240 1 45
35. Durante un periodo de diez años, los precios de un producto fueron en promedio
de $80 con una desviación estándar de $12. En el periodo anterior de 10 años,
el promedio fue de $50 con una varianza de $36. ¿En qué periodo hubo mayor
estabilidad?
63
impedı́a comprobar directamente la afirmación. ¿Son admisibles dichos valores de la
media y la varianza, teniendo en cuenta lo que puede verse del cuadro? Justificar.
37. Los alumnos de un grupo obtuvieron en matemática II una nota media de 68.7
puntos con una desviación estándar de 15.4 y los de otro grupo obtuvieron en la
misma asignatura un promedio de 50.9 puntos con una desviación estándar de 19.6.
¿Cuál de los dos grupos tiene un rendimiento más heterogéneo?
64
a Dibuje un gráfico que permita comparar ambos grupos.
b Calcule las medidas de tendencia central para aquellos sujetos con CI ¡95.
c Calcular las medidas de dispersión para aquellos sujetos con.
Calcule
65
b) Hallar la ganancia más frecuente y la ganancia promedio
c) Hallar la desviación estándar
44. En un examen 20 alumnos del curso A obtienen una media de 60 puntos. y desvia-
ción estándar de 20 puntos En el curso B los alumnos obtienen una media de 80
y desviación estándar de 16. Ante un reclamo se decide subir en 5 % mas 5 puntos
adicionales a todos los alumnos del curso A, en cambio como hubo muchas copias
en el curso B se decidió disminuir la quinta parte de la calificación. Después de los
mencionados ajustes ¿Cual es el puntaje medio de los 50 alumnos?
47. El salario promedio en una ciudad es de 11000u.m. con una variancia de 2000u.m.
¿Cuales serán la nueva media y la nueva variancia si se efectúan los siguientes cam-
bios:
66
c) Si se duplican los sueldos
48. En el mes de enero el promedio de los salarios de una empresa era de 40 unidades
monetarias (u.m.). En el mes de febrero la empresa consideró un incremento del
25 % en el número de empleados, con un salario igual al 80 % del promedio de los
antiguos empleados. En el mes de marzo la empresa hizo efectivo un aumento del
25 % en el salario de cada uno de los empleados, más una bonificación de 20 u.m.
por escolaridad.
N ro de kı́lometros mi fi hi Fi Hi
[ ; [ 0.5475
[ ; [ 6
[ ; [ 0.15625
[ ; 16 [
[ ; [ 9
Total
50. Se toman las medidas de 80 personas las que tienen estatura media de 1.70m y
desviación estándar de 3.4cm. Posteriormente se verificó que la media usada tenia 4
cm de menos. Rectifique los estadı́sticos mencionados.
52. La distribución de edades del Censo de Residentes a 1 de enero de 2007 para las
comunidades autónomas de Aragón y Canarias, en miles de personas, es la siguiente:
67
Edades Aragón Canarias
[0, 20[ 3.54 4.35
[20, 40[ 21.56 29.99
[40, 60[ 31.63 35.21
[60, 80[ 28.14 21.97
[80, 100] 15.12 8.48
53. El costo inicial de producción, X, de una muestra de 50 objetos de cierto tipo, tiene
una desviación estándar de $3. La media de costos de producción es de 25 para 30
objetos de la muestra y de $20 para el resto. El costo final de producción Y es dado
por la relación:
Y = 1,15X + 2
54. Los siguientes datos corresponden a los sueldos mensuales de los obreros que trabajan
en una compañı́a.
Sueldos No de Obreros
[390, 420[ 12
[420, 450[ 35
[450, 580[ 26
[580, 610[ 8
[610, 740[ 20
[740, 770[ 10
[770, 850] 6
68
c) Se desea agrupar a los obreros en tres categorı́as: A, B y C teniendo en cuenta
sus sueldos. El 20 % inferior estarán en la categorı́a C, el 25 % superior en la
categorı́a A. Hallar los lı́mites entre estas categorı́as.
69
Capı́tulo 3
Probabilidad
3.1. Introducción
70
y varianza matemática, relacionándolos con los conceptos de media y varianza de una
variable estadı́stica.
Obsérvese que los eventos elementales son eventos aleatorios compuestos por un sólo ele-
mento. Por supuesto los eventos aleatorios son más generales que los elementales, ya que
son conjuntos que pueden contener no a uno sólo, sino a una infinidad de eventos elemen-
tales, y también no contener ninguno. Eventos aleatorios que aparecen con gran frecuencia
en el cálculo de probabilidades son los siguientes:
1. Evento seguro:
Es aquel que siempre se verifica después del experimento aleatorio, es decir, el mismo
Ω
Ω ⊂ Ω ⇒ Ω Es el evento seguro
2. Evento imposible:
Es aquel que nunca se verifica como resultado del experimento aleatorio. Como debe
ser un subconjunto de Ω, la única posibilidad es que el evento imposible sea el
conjunto vacı́o
{∅} ⊂ Ω ⇒ ∅ Es el evento imposible
71
3. Evento unitario:
Es aquel que está formado por un único elemto
4. Evento complementario:
Se denomina complemento del evento A, que se denota por Ac , aquel evento que
consiste de todos los puntos muestrales que no están en el evento A.
2. El experimento aleatorio de lanzar una moneda tantas veces como sea necesario
hasta que aparezca la primera cara tiene por espacio muestral:
3. El experimento aleatorio que consiste en medir la vida útil (en horas) de una marca
de artefacto eléctrico tiene por espacio muestral:
Ω = {t ∈ R/t ≥ 0}
A ∪ B = {ω ∈ Ω/ω ∈ A o ω ∈ B}
72
2. Dados dos eventos aleatorios, se denomina intersección de A y B al conjunto formado
por todos los eventos elementales que pertenecen a A y B a la vez, es decir,
A ∩ B = {ω ∈ Ω/ω ∈ A y ω ∈ B}
A − B = {ω ∈ Ω/ω ∈ A y ω ∈
/ B}
Algebra de eventos
Las siguientes identidades básicas se verifican para eventos
1. A ∪ A = A, A∩A=A
2. A ∪ B = B ∪ A, A∩B =B∩A
3. A ∪ Ac = Ω, A ∩ Ac = ∅
4. A ∪ ∅ = A, A∩∅=∅
5. A ∪ Ω = Ω, A∩Ω=A
6. Ωc = ∅ ∅c = Ω, (Ac )c = A
7. A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
8. (A ∪ B)c = Ac ∩ B c , (A ∩ B)c = Ac ∪ B c
Nota
Sean A1 , A2 , ..., An cualquier colección finita de n eventos,
1. El evento de que ocurra por lo menos uno de ellos se describe por el conjunto:
∪
n
A1 ∪ A2 ∪ ... ∪ An = Ai
i=1
73
3. La regla de De Morgan:
[n ]c [ ]c
∪ ∩
n ∩
n ∪
n
Ai = (Ai )c , Ai = (Ai )c
i=1 i=1 i=1 i=1
Regla de la adición
1. Si A y B son eventos mutuamente disjuntos, entonces,
74
3.3.1. Variaciones
A) Variaciones simples
Se denomina variaciones simples de k objetos tomados de n objetos distintos, a cada
uno de los arreglos que se hagan con los k objetos, de manera que estos arreglos
difieran en algún elemento o en el orden de colocación.
El número de variaciones diferentes de k objetos tomados de n objetos distintos,
denotado por Vkn , está dado por:
n!
Vkn =
(n − k)!
Por ejemplo las variaciones de 2 elementos del conjunto A = {a, b, c, d} son los
siguientes arreglos:
ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc.
V Rkn = nk
3.3.2. Permutaciones
Se denomina permutación de n objetos a cada una de las variaciones de los n objetos.
El número de permutaciones de n objetos distintos, denotado por P n es:
P n = Vnn = n!
Por ejemplo el número de permutaciones del conjunto A = {a, b, c} está dado por:
75
3.3.3. Combinaciones
Se denomina combinación de k objetos tomados de n objetos distintos, a cada selección
que podamos hacer de k objetos de los n objetos dados, sin tener en cuenta el orden de los
mismos y de manera que no pueden haber dos combinaciones con los mismos elementos.
El número de combinaciones de orden k que se puede formar a partir de n elementos
distintos, denotado por Ckn es:
n!
Ckn = .
k!(n − k)!
Por ejemplo las combinaciones de 3 elementos del conjunto A = {1, 2, 3, 4, 5} son:
123, 124, 125, 134, 135, 145, 234, 235, 245, 345.
Solución
De los 20 tornillos, 10 son buenos, 5 con defectos sólo A, 2 con defectos sólo B y 3 con
defectos A y B.
El número de formas diferentes de extraer 11 tornillos con las condiciones dadas es:
Ejemplo 3.3. Hallar el número de maneras diferentes en que se pueden formar números
enteros positivos con los dı́gitos 3,4,5,6,7 de manera que los dı́gitos no se repitan.
Solución
Los números pueden tener de una a cinco cifras, luego el total de números es:
Ejemplo 3.4. Cuántos elementos tiene el espacio muestral asociado al experimento alea-
torio de extraer al azar 3 bolas rojas de una urna que contiene 6 bolas rojas:
a A la vez
76
Solución
a C36
b 6×5×4
c 6×6×6
1. P(A) ≥ 0.
2. P(Ω) = 1
P(A) ≤ P(B)
77
Ninguno de los premios
Solución
Sean los eventos:
A: Ganar el primer premio
B: Ganar el segundo premio
Se tiene que P(A) = 25 , P(B) = 83 , P(A ∪ B) = 3
4
Sabemos que:
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
Sustituyendo tenemos:
3 2 3
= + − P(A ∩ B)
4 5 8
entonces,
1
P(A ∩ B) =
40
La probabilidad de ganar sólo uno de los premios es:
Pero
P(A ∩ B c ) = P(A) − P(A ∩ B) = 2
5 − 40
1
= 15
40
P(Ac ∩ B) = P(B) − P(A ∩ B) = 3
8 − 40 =
1 14
40
Entonces:
15 14 29
P((A ∩ B c ) ∪ (Ac ∩ B)) = + =
40 40 40
La probabilidadde no ganar ninguno de los premios es:
3 1
P((A ∪ B)c ) = 1 − P(A ∪ B) = 1 − =
4 4
Ejemplo 3.6. Una urna contiene 5 fichas similares de las cuales 3 son de color rojo y 2
de color azul. Si de esa urna se extraen al azar 3 fichas a la vez, calcular la probabilidad
de que sólo una de ellas sea de color rojo.
78
Solución
Definamos primero el evento A como:
A: Sólo una de las 3 fichas es de color rojo,
Entonces, en este caso el número de elementos del espacio muestral Ω es igual al número
de formas diferentes de extraer 3 fichas a la vez de la urna que contiene 5 fichas, es decir:
5!
n(Ω) = C35 = = 10.
3!2!
Por otra parte, el número de elemnetos del evento A, es igual al número de formas de
extraer a la vez 3 fichas de las cuales una es roja y dos son blancas, es decir:
Luego:
n(A) 3
P(A) = = .
n(Ω) 10
Definición 3.3. (Probabilidad geométrica) Sea Ω un espacio muestral continuo o infinito.
Si A es cualquier evento del espacio muestral Ω tal que la medida (longitud o área) de A
exista, entonces la probabilidad de A es:
m(A)
P(A) =
m(Ω)
Solución
Sea:
X: Demanada del producto A, en miles de kilogramos
Y : Demanda del producto B, en miles de kilogramos
El espacio muestral Ω es el conjunto:
Ω = {(x, y) ∈ R2 /1 ≤ x ≤ 5, 1 ≤ y ≤ 5}
A = {(x, y) ∈ Ω/3 ≤ x + y ≤ 5}
79
En la figura se observa que A es la parte rayada cuya área es:
3×3 1×1
Area(A) = − =4
2 2
Por tanto:
área(A) 4
P(A) = = = 0,25
área(Ω) 4×4
Solución
El espacio muestral que corresponde a este experimento es
Ω = {1, 2, 3, 4, 5, 6}
y se ha de calcular la probabilidad del evento A = {4}. Si el dado no está cargado, todos los
números tienen la misma probabilidad de salir, y siguiendo la definición de probabilidad
tenemos:
n(A) Casos favorables a A 1
P= = =
n(Ω) Casos posibles 6
Por otro lado, si ha salido un número par entonces tenemos el evento B = {2, 4, 6},
entonces, por la definición de probabilidad condicional
P(A ∩ B) 1
P(A|B) = =
P(B) 3
80
Observación. Obsérvese que según la definición de probabilidad condicionada, se puede
escribir la probabilidad de la intersección de dos eventos de probabilidad no nula como:
a P(A ∩ B) = P(A)P(B|A)
b P(A ∩ B) = P(B)P(A|B)
Esta relación puede ser escrita de modo equivalente, cuando dos eventos son de proba-
bilidad no nula como:
o
A es independiente de B, con P(B) ̸= 0 ⇔ P(A) = P(A|B)
1. A y B c son independientes.
2. Ac y B son independientes.
3. Ac y B c son independientes.
Teorema 3.6. Sean A y B dos eventos cualesquiera, tales que P(A|B) exista, entonces
se cumple que:
P(Ac |B) = 1 − P(A|B)
Ejemplo 3.9. En una estación de esquı́, para navidades, la experiencia indica que hay un
tiempo soleado sólo el 15 % de los dı́as. Por otro lado, se ha calculado que cuando un dı́a
es soleado, hay una probabilidad del 20 % de que el dı́a posterior también lo sea. Calcular
la probabilidad de que, en navidades, un fin de semana completo sea soleado.
81
Solución
Llamemos S al evento sábado soleado y D al evento domingo soleado.
La única manera en que un fin de semana completo sea soleado es que lo sea en primer
lugar el sábado, y que el domingo posterior también. Es decir:
2. La producción continue.
Solución
Sean los eventos
A: Falla la máquina 1,
B: Falla la máquina 2,
entonces,
1 2
P(A ∩ B) = , P(Ac ∩ B) = ,
5 15
5
entonces P(B) = 15 .
Además de P(A ∩ B) = P(A)P(B), resulta P(A) = 9
15
1. P(A ∩ B c ) = P(A)P(B c ) = 9
15 × 10
15 = 6
15
2.
P(A ∩ B) = P(A)P(B)
P(A ∩ B) = P(A)P(B|A)
82
2. En general, si A1 , A2 , ..., An son n eventos independientes, entonces:
P(A1 ∩A2 ∩A3 ∩...∩An ) = P(A1 )P(A2 |A1 )P(A3 |A1 ∩A2 )...P(An |A1 ∩A2 ∩...∩An−1 )
Teorema 3.8. (Probabilidad total) Sean A1 , ..., An eventos dos a dos disjuntos, los únicos
posibles (es decir constituyen una partición de Ω) y con probabilidades positivas. Sea B un
evento arbitrario con P(B) > 0. Entonces
∑
n
P(B) = P(Ai )P(B|Ai ).
i=1
Teorema 3.9. (Regla de Bayes) Sean A1 , ..., An eventos dos a dos disjuntos, los únicos
posibles (es decir constituyen una partición de Ω) y con probabilidades positivas. Sea B un
evento arbitrario con P(B) > 0. Entonces
P(Ai )P(B|Ai )
P(Ai |B) = , para cada i = 1, 2, ..., k
P(B)
∑
n
donde P(B) = P(Ai )P(B|Ai ).
i=1
Ejemplo 3.11. Un lote contiene 15 objetos de los cuales 7 son calificados como E (éxito)
y el resto como F (fracasos). Del lote se escogen 5 objetos al azar una tras otra, calcular
la probabilidad de que los cinco sean éxitos, si las extracciones se hacen:
a Con reposición
b Sin reposición
Solución
Sean los eventos:
Ei : Sale objeto exitoso en la extracción i, i = 1, 2, 3, 4, 5.
Fi : Sale objeto fracasado en la extracción i, i = 1, 2, 3, 4, 5.
Si A es el evento los 5 objetos sustraı́dos sucesivamente son éxitos, entonces,
A = E1 ∩ E2 ∩ E3 ∩ E4 ∩ E5
a Si las extracciones son con reposición los eventos son independientes, entonces
83
b Si las extracciones son sin reposición los eventos son dependientes, entonces
P(A) = P(E1 )P(E2 |E1 )P(E3 |E1 ∩ E2 )P(E4 |E1 ∩ E2 ∩ E3 )P(E5 |E1 ∩ E2 ∩ E3 ∩ E4 )
7 6 5 4 3 V7
= × × × × = 515
15 14 13 12 11 V5
Ejemplo 3.12. Se ha determinado que las probabilidades de que un televidente vea los
programas A, B y C son 0,5, 0,4 y 0,7 respectivamente. ¿Cuál es el porcentaje de televi-
dentes que ven por lo menos dos de los programas?. Se asume que cada persona ve los
programas independientemente uno del otro.
Solución
eventos disjuntos
= P (A ∩ B ∩ C c ) + P (A ∩ B c ∩ C) + P (Ac ∩ B ∩ C) + P (A ∩ B ∩ C)
= P (A) · P (B) · P (C c ) + P (A) · P (B c ) · P (C) + P (Ac ) · P (B) · P (C) + P (A) · P (B) · P (C)
= 0,5 · 0,4 · 0,3 + 0,5 · 0,6 · 0,7 + 0,5 · 0,4 · 0,7 + 0,5 · 0,4 · 0,7
= 0,06 + 0,21 + 0,14 + 0,14
= 0,55
El porcentaje de que los televidentes vean por lo menos dos de los programas es de un
55 %.
Ejemplo 3.13. Un ensamblador de computadoras usa partes que provienen de tres pro-
veedores P1 , P2 y P3 . De 2000 partes recibidas 1000 provienen de P1 , 600 de P2 y el resto de
P3 . De experiencias pasadas, el ensamblador sabe que las partes defectuosas que provienen
de P1 , P2 y P3 son respectivamente 3 %, 4 % y 5 %. Si se elige una computadora al azar,
b Si contiene una parte defectuosa, ¿cuál es la probabilidad de que haya sido proveı́do de
P2 ?
Solución
Sean los eventos:
Ai : Parte proviene del proveedor Pi , i = 1, 2, 3 y
84
B: Parte defectuosa.
Tenemos las siguientes probabilidades:
1000 600 400
P(A1 ) = = 0,5, P(A2 ) = = 0,3, P(A3 ) = = 0,2
2000 2000 2000
P(B|A1 ) = 0,03, P(B|A2 ) = 0,04, P(B|A3 ) = 0,05
Por tanto:
Ejemplo 3.14. Las probabilidades de que los socios S1 y S2 sean elegidos presidente de
su club son respectivamente 0.4 y 0.6. Las probabilidades de que se aumenten las cuotas
mensuales a los socios son de 0.9 si sale elegido S1 y de 0.2 si sale elegido S2 ,
a ¿Cuál es la probabilidad de que haya un aumento en las cuotas mensuales de los socios?
b Si se aumenta las cuotas mensuales ¿cuál socio es mas probable de salir elegido?
Solución
Sean los eventos:
Ai : Sale elegido el candidato Si , i = 1, 2 y
B: Se incrementan las cuotas mensuales a los socios.
Tenemos las siguientes probabilidades:
Por tanto:
85
b
P(A1 )P(B|A1 ) 0,4 × 0,9
P(A1 |B) = = = 0,75
P(B) 0,48
P(A2 )P(B|A2 ) 0,6 × 0,2
P(A2 |B) = = = 0,25
P(B) 0,48
La probabilidad de A1 se modifica de 0.4 a 0.75 y la de A2 de 0.6 a 0.25. En conse-
cuencia, se puede concluir que, si se aumentan las cuotas mensuales, probablemente
el socio S2 no sea elegido presidente de su club.
Ejemplo 3.15. Un experimentado estadistico consiste en lanzar dos dados una o dos
veces. Un jugador gana si consigue la suma 7 en el primer lanzamiento; pierde si saca 2
ó 12, si consigue otras sumas no pierde ni gana, en este último caso tiene opción para
un segundo lanzamiento y si en este segundo lanzamiento consigue la suma 7 pierde, en
caso contrario gana y termina el juego ¿Cuál es la probabilidad que el jugador pierda?
Solución
A: Gana 7....1ro
B: Pierde 2 ó 12
C: Otros → juega otra vez
A : Gana 7...1ro
B : Pierde 2 ó 12 Gana
↗
C : otros → juega otra vez
↘
Pierde
6
Gana =
36
↗
2 30
P → Pierde = Gana
36 36
↘ ↗
28
No pierde ni gana
36
↘
6
Pierde
( )( ) 36
2 28 6
P (Pierde) = +
36 36 36
2 168
P (Pierde) = +
36 1296
P (Pierde) = 0, 184
86
tarde al trabajo, mientras que 20 % de las veces que toma el microbús llega tarde a su
trabajo.
b Si llega temprano al trabajo un dı́a cualquiera, ¿cúal es la probabilidad que haya tomado
el microbús?
Solución
T → 0,30
0,3 → A→
T c → 0,70
T → 0,20
0,7 → M → c
T → 0,80
P (T ) = P (A) · P (T | A) + P (M ) · P (T | M )
= 0,3 · 0,30 + 0,7 · 0,20
= 0,23
P (A) · P (T | A)
P (A | T ) =
P (T )
0,3 · 0,30
=
0,23
= 0,39
b)
P (M ) · P (T c | M )
P (M | T c ) =
P (T c )
0,7 · 0,80
=
0,77
= 0,73
Ejemplo 3.17. Se estima que la probabilidad de que una compañia B tenga éxito al
comercializar un producto es de 0.95 si su competidora la compañia A no interviene en
el mercado, y es de 0.15 si la compania A interviene en el mercado. Si se estima que A
intervendrı́a en el mercado con probabilidad de 0.7.
87
b Si la compañia B no tuviera éxito, ¿en cuanto se estima la probabilidad de que A
intervenga en el mercado?
Solución
Sea los eventos: B: La compañia B tiene éxito
A: La compañia A interviene en el mercado
tenemos las siguientes probabilidades:
P(A) = 0,7, P(Ac ) = 0,3, P(B|A) = 0,15, P(B|Ac ) = 0,15
P(B c |A) = 0,85, P(B c |Ac ) = 0,05
88
3.7. Ejercicios propuestos
1. A un departamento de mercadeo se le ha solicitado que diseñe códigos de color para
las 42 lı́neas de discos compactos vendidos por Godoy Records. Se han de utilizar
tres colores en cada lı́nea, pero una combinación de tres colores empleados para una
de ellas no puede reordenarse y ser utilizada para identificar una distinta lı́nea de
CD.
a ¿Serán adecuados siete colores tomados tres a la vez para codificar por color todas
las lı́neas?
b ¿Cuántos colores serı́an suficientes?
2. Al montar un equipo electrónico, seis alambres se conectan a una caja que tiene seis
terminales. ¿De cuántas formas pueden conectarse los alambres a las terminales si
sólo entra un alambre en cada terminal?
3. ¿De cuántas maneras puede un profesor escoger uno o más estudiantes a partir de
seis elegibles.
4. Suponga que hay ocho máquinas disponibles pero sólo tres espacios en el piso del
taller donde se han de instalar tales máquinas. ¿De cuántos modos diferentes pueden
colocarse las ocho en los tres espacios disponibles?
5. Un entrenador de fútbol tiene un equipo formado por 11 jugadores de los cuales uno
es su hijo. ¿Cuántos quintetos de basketball se pueden formar si su hijo siempre debe
estar dentro del quinteto?
89
10. La empresa de rodajes ZQF ha producido un lote de 50 rodajes especiales. Estos
han sido colocados en tres cajas para enviarlos a los proveedores. Al proveedor A
le enviarán 25 rodajes, al proveedor B 10 rodajes y al proveedor C los restantes. El
supervisor sabe que existen 4 rodajes defectuosos. Determine el número de formas
posibles de hacer los envı́os si se quiere que los cuatro rodajes defectuosos lleguen al
mismo proveedor
12. ¿De cuántas formas pueden instalarse en lı́nea 5 focos blancos y 6 focos rojos si
deben colocarse
a alternadamente
b los blancos juntos?
13. ¿Cuántas señales distintas pueden hacerse con cinco banderas distintas agrupándolas
de tres en tres y sin que se repita ninguna? ¿Y agrupándolas de todas las formas
posibles (es decir, de una en una, de dos en dos, etc)?
14. Se tienen nueve puntos en un plano. Cuatro de ellos están alineados y los restantes
están dispuestos de forma que no hay nunca 3 alineados. ¿Cuántos triángulos pueden
formarse que tengan sus vértices sobre esos 9 puntos? ¿Cuántas rectas distintas
determinan esos puntos?
15. En una fábrica hay varios centros de almacenamiento, cada uno de los cuales está uni-
do a los demás por una cinta transportadora. Calcula el número de centros de la
fábrica si se sabe que el número de cintas transportadoras es 66.
16. Con las letras de la palabra BRAVO, ¿cuántas ordenaciones distintas pueden hacerse
de forma que no haya dos vocales juntas?
17. Averiguar cuántos números mayores que 200 y menores que 700 pueden formarse
con las cifras 1, 2, 3, 4, 5, 6, 7 sin que tengan cifras repetidas. Responde a la misma
cuestión en el caso de que las cifras se puedan repetir.
18. Una organización estudiantil tiene que elegir un delegado y un subdelegado. Hay 7
candidatos. ¿Cuántas combinaciones se pueden hacer con los candidatos para realizar
la selección?
90
19. ¿Cuál es el número de colocaciones diferentes de 7 libros en una estanterı́a de modo
que tres libros determinados estén siempre separados entre sı́?
20. ¿Cuántos números de cinco cifras se pueden escribir con cuatro dos y cuatro cincos?
21. ¿Cuál es el tamaño mı́nimo de una población para que exista al menos un dı́a al año
(de 365 dı́as) donde coincidan la fecha del aniversario de nacimiento de al menos
nueve personas?
24. De cuántas formas 5 hombres y 3 mujeres se pueden sentar alrededor de una mesa
redonda de modo que dos mujeres no se encuentren juntas. (Dos formas son iguales
si se llega de una a otra por rotación. No importa únicamente el sexo sino también
que persona es)
25. Con las cifras 0,1,2,3,4,5,6,7,8 se forman números de cinco cifras, ¿Cuántos números
diferentes pueden formarse sin repetir cifras?
26. En una cafeterı́a hay 4 tipos de bocadillos para comer. ¿De cuántas maneras distintas
se pueden elegir seis bocadillos de entre los 4 tipos?
28. Con los dı́gitos 1,2,3,4,5 se forman números de tres cifras. ¿Cuántos números dife-
rentes pueden formarse sin repetir cifras que sean múltiplos de 3?
30. En una carrera de maratón intervienen 4 corredores por cada uno de los 4 equipos.
Supuesto que terminan la carrera todos los corredores, ¿cuántos resultados distintos
pueden darse al acabar la carrera en los cuales no hay ningún corredor del equipo A
entre los tres primeros?
91
32. Se tienen çadenas”formadas por dos letras seguidas de cuatro dı́gitos y otras tres
letras más. No están permitidas las repeticiones de letras y dı́gitos dentro de cada
grupo, pero el último grupo de tres letras puede contener una o dos de las utilizadas
al principio de la cadena. ¿Cuántas cadenas distintas se pueden formar si el número
de letras disponibles es 26?
33. Un comerciante tiene 12 unidades de cierto artı́culo de los cuales 4 tienen algún
tipo de defecto. Un cliente muy exigente quiere comprar 3 de tales artı́culos pero
le explica al comerciante que si alguno contienen defectos devolverá la compra y
pedirá la devolución de su dinero. Si el comerciante escoge al azar y a la vez 4 de
tales artı́culos, ¿cuál es la probabilidad de que con esos 4 artı́culos pueda atender
satisfactoriamente al cliente?
35. En una muestra de 120 loretanos se encontró que el 60 % sufre alguna enfermedad,
el 30 % tienen al menos 30 años, y el 20 % son menores de 30 años y sanos. Si uno
de tales loretanos es escogido al azar, ¿cuál es la probabilidad
38. Se ha comprobado que en una ciudad están enfermos con diarrea el 60 % de los niños,
con sarampión el 50 % y el 20 % con ambas enfermedades.
92
a) Probabilidad de que elegido un niño al azar, esté enfermo con diarrea, sarampión
o ambas.
b) En un colegio con 450 niños, ¿Cuántos cabe esperar que estén enfermos con
diarrea o sarampión?
39. Una caja contiene 8 bolas rojas, 4 azules y 6 verdes. Se extraen 3 bolas al azar y se
desea saber:
40. Una caja contiene 2 bolas blancas, 3 negras y 4 rojas. Otra contiene 3 blancas, 5
negras y 4 rojas. Se toma una bola al azar de cada caja. ¿Qué probabilidad hay de
que sean del mismo color?
41. . En una bolsa hay 8 bolas rojas, 10 negras y 6 blancas. Tres niños sacan, sucesiva-
mente, dos bolas cada uno, sin reintegrar ninguna. Hallar la probabilidad de que el
primero saque las dos rojas, el segundo las dos negras y el tercero las dos blancas?
42. Se tiene tres urnas de igual aspecto. En la primera hay 3 bolas blancas y 4 negras;
en la segunda hay 5 negras y en la tercera hay 2 blancas y 3 negras. Se desea saber:
a) Si se extrae una bola de una urna, elegida al azar, cuál es la probabilidad de que
la bola extraı́da sea negra.
b) Se ha extraı́do una bola negra de una de las urnas. ¿Cuál es la probabilidad de
que haya sido extraı́da de la 2a urna?
43. Entre cincuenta varones que asisten a un partido de fútbol, se trata de ubicar a uno
que viste de chompa azul, pantalón negro y tiene los ojos verdes. Se sabe que hay
20 que tienen chompa azul, 15 pantalón negro y 18 tienen los ojos verdes. Hay 7
con chompa azul y pantalón negro y no tienen los ojos verdes, 4 con chompa azul
y ojos verdes y no tienen pantalón negro, 6 con pantalón negro y ojos verdes pero
sin chompa azul. Además los varones que tienen una sola caracterı́stica del buscado
suman 16. Si se extrae al azar a uno de estos varones, ¿cuál es la probabilidad que
tenga ojos verdes o chompa azul pero no pantalón negro?
44. En un lote de producción hay 25 productos, 5 de los cuales tienen defectos menores
y 9 tienen defectos mayores, si se toman de este lote tres productos, determine la
probabilidad de que:
93
a) El primer producto no tenga defectos y que el segundo y tercero tengan defectos
mayores.
b) El primer producto tenga defectos menores, el segundo tenga defectos mayores
y que el tercero no tenga defectos.
c) El primer producto y el tercero no tengan defectos.
46. De las 100 personas que asisten a un congreso 40 hablan francés, 40 inglés, 51 cas-
tellano, 11 francés e inglés, 12 francés y castellano y 13 inglés y castellano. Se eligen
al azar dos asistentes y se desea saber:
47. Un estudiante hace dos pruebas el mismo dı́a con probabilidades 0.6 de pasar la
primera, 0.8 la segunda y 0.5 ambas. Se pide:
49. Un monedero contiene monedas de medio sol en número igual a 4 veces el número
de monedas de 20 céntimos, y contiene monedas de un sol en número igual a 3 veces
el número de monedas de medio sol. Si se elige una moneda al azar, calcular la
probabilidad de que su valor sea al menos de medio sol.
50. En un conjunto de 132 personas, se sabe que el número de los que saben Word, Excel
y C++ es igual a : 1/6 de los que saben sólo Word, 1/5 de los que saben sólo Excel,
1/4 de los que saben sólo C++, 1/2 de los que saben Word y Excel, 1/3 de los que
saben Word y C++, 1/4 de los que saben Excel y C++. Si se extrae una persona al
azar, ¿cuál es la probabilidad de que dicha persona sepa Word o Excel?
94
51. Se escogen al azar tres computadoras entre 15 , de los cuales cinco son defectuosas.
Hallar la probabilidad de que:
53. Cuatro amigos que se dirigen a un lugar, toman 4 rutas diferentes de acuerdo al
riesgo que se corre de tener algún accidente. Si se le asignan las probabilidades de
riesgo para cada ruta: 0,2 ; 0,15 ; 0,25 ; 0,10. Hallar la probabilidad;
54. Entre los 200 empleados de un departamento. Hay 150 graduados, 60 del total con-
sagran parte de su tiempo por lo menos a trabajos de estadı́stica y 40 de los 150
graduados dedican parte de su tiempo por lo menos a trabajos de estadı́stica. Si se
toma al azar uno de estos empleados, ¿cuál es la probabilidad de que no sea graduado
y no trabaje en estadı́stica?
55. En una encuesta de opinión se encontró que el 25 % de los electores votarı́an por
el candidato E. De los que no votarı́an por E el 20 % son mujeres y el resto son
hombres. Además la probabilidad de que un elector elegido al azar sea hombre es de
0.7. Si se elige un elector al azar y resulta ser mujer, ¿cuál es la probabilidad de que
no vote por E?
56. Un lote contiene n objetos. La probabilidad de que al menos uno sea defectuoso es
0.06, mientras que la probabilidad de que al menos dos sean defectuosos es 0.04.
Calcular la probabilidad de que:
95
b exactamente un objeto sea defectuosos
57. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras
realizadas por estas, el 80 % supera los $ 200, mientras que de las compras realizadas
por hombres sólo el 30 % supera esa cantidad.
a P(B|A) = P(B|Ac ).
b Ac , y B c son también eventos independientes
59. En una oficina hay dos computadoras A y B que trabajan de manera independiente.
Si en un momento cualquiera la probabilidad de que la máquina B este en mal estado
es 1/4 y la probabilidad de que sólo la maquina A este en mal estado es 3/10, ¿cuál
es la probabilidad de que solo la maquina B este en malas condiciones?
60. En una etapa de la producción de un artı́culo se aplica soldadura y para eso se usan
tres diferentes robots. La probabilidad de que la soldadura sea defectuosa varı́a para
cada uno de los tres, ası́ como la proporción de artı́culos que cada uno procesa, de
acuerdo a la siguiente tabla. Robot Defectuosos Art. procesados
61. Una alumna está indecisa con relación a que si se matricula en el curso de estadı́stica o
en el curso de quı́mica. Aunque ella realmente prefiere matricularse en quı́mica estima
que su probabilidad de aprobar estadı́stica es 1/4 mientras que su probabilidad de
aprobar quı́mica es 1/3. Si la alumna decide matricularse en uno de estos cursos
mediante el lanzamiento de una moneda, ¿cuál es la probabilidad de que ella apruebe
el curso de quı́mica?
96
62. Un sistema de comunicación binario transmite 0 o 1. Por causas del ruido del sis-
tema a veces un 0 transmitido se recibe como un 1 y viceversa. Suponiendo que la
probabilidad de que un 0 se transmita incorrectamente es 0,06, que la probabilidad
de que un 1 se transmita correctamente es 0,90, y que la probabilidad de transmitir
un 0 es de 0,45. Calcular la probabilidad de que en una transmisión no haya error.
63. La probabilidad de que Cecilia estudie para su examen final de estadı́stica es 0,20. Si
estudia, la probabilidad de que apruebe el examen es 0,80 en tanto que si no estudia
la probabilidad es de sólo 0,50.
64. Al examinar los registros anteriores de los balances de una compañı́a, un auditor
descubre que el 15 % contienen errores. Además, 60 % de estos balances incorrectos
fueron considerados valores inusuales basándose en los datos anteriores. El 20 %
de todos los balances se consideraron también valores inusuales. Si los datos de
un determinado balance parecen ser inusuales, ¿cuál es la probabilidad de que sea
incorrecto?
65. El señor Vásquez tiene tres secretarias con diferentes niveles de competencia. La
secretaria A ha escrito el 20 % de un trabajo, la secretaria B el 40 % y la secretaria
C el 40 %. Hay un error ortográfico que irrita en especial al señor Vásquez, y éste ha
calculado que A lo comete el 90 % de las veces que tiene que escribir la palabra en
cuestión, que B lo comete el 40 % de las veces y C nunca.
67. Un cuadro clı́nico se manifiesta por la ocurrencia de tres sı́ntomas (1, 2 y 3). Un
grupo de pacientes que posiblemente presenten este cuadro ingresan en un hospital
especializado, la probabilidad de que uno de estos pacientes posea el sı́ntoma 1 es
97
0.95. Uno de cada cuatro pacientes que presentan el sı́ntoma 1 también presentan el
sı́ntoma 2. Además se sabe que el 75 % de estos pacientes que presentan los sı́ntomas
1 y 2 también presentan el sı́ntoma 3. ¿Cuál es la probabilidad de que un paciente
posea el cuadro clı́nico?
70. El profesor López dicta un curso de Estadı́stica y quiere tomar una prueba en cada
clase. Sabedor de que a veces se olvida de ir a hacer su clase, ha dado instrucciones a
su jefe de prácticas que se haga cargo de la clase cuando él está ausente. Si el profesor
López hace la clase, la probabilidad es 0,70 de que tome la prueba en tanto que si el
jefe de prácticas hace la clase, esta probabilidad es de sólo 0,10. Si el profesor López
falta el 80 % de las clases:
98
b Sólo uno de los cuatro clientes decida comprar un artı́culo en promoción.
c Sólo dos de los cuatro clientes decida comprar un artı́culo en promoción.
d Sólo tres de los cuatro clientes decida comprar un artı́culo en promoción.
72. Con el fin de ganar 5000 soles un inversionista realizará una de tres opciones. La
probabilidad de que se realice la opción 1 es 0.3. Si se realiza la opción 1, la pro-
babilidad de ganar 5000 soles es 0.4. Si se realiza la opción 2, lo cual ocurre con
probabilidad 0.2, la probabilidad de ganar 5000 soles es 0.1. Cuando se realiza la
opción 3, la probabilidad de ganar 5000 soles es 0.25. Cuantificar la confianza del
inversionista en esta situación.
74. Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y 1 negra y
C con 2 bolas rojas y 3 negras. Escogemos una urna al azar y extraemos una bola.
Si la bola ha sido roja, ¿cuál es la probabilidad de haber sido extraı́da de la urna A?
75. En un saquito hay papeletas de tres colores, con las siguientes probabilidades de
ser elegidas: a) Amarilla: probabilidad de 0.50, b) Verde: probabilidad de 0.30 c)
Roja: probabilidad de 0.20. Según el color de la papeleta elegida, podrás participar
en diferentes sorteos. Ası́, si la papeleta elegida es: a) Amarilla: participas en un
sorteo con una probabilidad de ganar de 0.40. b) Verde: participas en otro sorteo
con una probabilidad de ganar de 0.60 c) Roja: participas en un tercer sorteo con
una probabilidad de ganar de 0.80. Con esta información, ¿qué probabilidad tienes
de ganar el sorteo en el que participes?
99
77. Hay una epidemia de cólera. Un sı́ntoma muy importante es la diarrea, pero ese
sı́ntoma también se presenta en personas con intoxicación, y, aún, en personas que
no tienen nada serio. La probabilidad de tener diarrea teniendo cólera, intoxicación
y no teniendo nada serio es de 0,99; 0,5 y 0,004 respectivamente. Por otra parte, se
sabe que el 2 % de la población tiene cólera, el 0,5 % intoxicación y el resto (97,5 %),
nada serio. Se desea saber:
78. En una población de ratas el 70 % son de los Andes y el 30 % del Himalaya. Entre las
andinas el 30 % tienen las orejas rosadas y entre las del Himalaya el 50 %. Se elige al
azar una rata y tiene las orejas rosadas, calcular la probabilidad de que sea andina.
79. Una enfermedad puede ser producida por tres virus A, B y C. En un laboratorio se
tienen tres tubos con virus A, dos con virus B y cinco con virus C. La probabilidad de
que el virus A produzca la enfermedad es 1/3, la de B 2/3 y la de C 1/7. Se inocula
al azar un virus a un animal y contrae la enfermedad. ¿Cuál es la probabilidad de
que el virus que se le inoculó fuera de tipo C?
81. De una cesta de 20 higos, 4 están podridos. Se saca uno y se mete en otra cesta con
6 podridos y 18 buenos. Extraemos un higo de la segunda cesta y no está podrido,
Calcular la probabilidad de que el primero estuviera bueno.
82. Un gran número de personas que viven en una sección determinada de una comuni-
dad han estado expuestas durante los últimos diez años a la radiactividad procedente
de un vertedero en el que se almacenan deshechos atómicos. Se realiza una inves-
tigación para descubrir si hay alguna asociación aparente entre la exposición y el
desarrollo de una cierta enfermedad de la sangre. Para llevar a cabo el experimento
se eligen muestras aleatorias de 300 personas en la comunidad que han estado ex-
puestas al peligro y 320 no expuestas. En ambos grupos, se determinó el número de
personas que tenı́an la citada enfermedad. Los resultados se muestran en la siguiente
tabla:
100
Tiene la enfermedad No tiene la enfermedad
Expuesto a la radioactividad 52 248 300
No expuesto a la radioactividad 48 272 320
100 520 620
83. Unos estudios muestran que los ejemplares de una cierta raza de liebres de alta
montaña (liebre esquiadora) mueren antes de lo normal, aún en ausencia de depre-
dadores o de enfermedad conocida alguna. Dos de las causas de muerte identificadas
son: baja cantidad de azúcar en sangre, y convulsiones. Se estima que el 7 % de los
animales presenta ambos sı́ntomas, el 40 % bajo nivel de azúcar en sangre, y el 25 %
sufre de convulsiones.
a) ¿Cuál es el porcentaje de muertes producidas por causas que no sean las men-
cionadas?
b) ¿Cuál es la probabilidad de que una liebre recientemente muerta, tomada al azar,
registre bajo nivel de azúcar en sangre y haya, además, muerto con convulsio-
nes?
c) ¿Pueden considerarse independientes ambos fenómenos (descenso de azúcar, y
convulsiones)?
d) ¿Cuál es la probabilidad de que una liebre presente bajo nivel de azúcar, pero
no convulsiones? ¿Y de que no presente ninguno de los dos sı́ntomas?
e) ¿Cuál es la probabilidad que presente un único sı́ntoma?
f ) Sabiendo que el animal ha presentado convulsiones, ¿cuál es la probabilidad de
que presente también azúcar en sangre?
g) Sabiendo que el animal no presentaba bajo nivel de azúcar, ¿cuál es la probabi-
lidad de que tampoco tuviera convulsiones?
101
84. El mecanismo de un sistema de alarma consta de dos partes A y B, que funcio-
nan independientemente. Para que el sistema salte ante una emergencia, alguno de
los mecanismos (puede que ambos) debe detectar la emergencia. La probabilidad
de que A funcione correctamente, es del 90 %. La probabilidad de que B funcione
correctamente, es del 95 %.
85. Con base en varios estudios una compañı́a ha clasificado, de acuerdo con la posibi-
lidad de descubrir petróleo, las formaciones geológicas presentes en una cierta zona
en tres tipos, I, II, III. Aproximadamente el 35 % de las formaciones de la zona co-
rresponden al tipo I, el 40 % al tipo II y el resto al tipo III. Además, de acuerdo con
la experiencia se sabe que el petróleo aparece en un 40 % de formaciones de tipo I,
en un 20 % de formaciones de tipo II y en un 30 % de formaciones de tipo III. La
compañı́a perfora en un determinado sitio de esa zona.
86. Una planta armadora industrial recibe microcircuitos procedentes de tres fabricantes
A, B, C. El 50 % del total se compra a A, mientras que a B y C se les compra un
25 % a cada uno. El porcentaje de circuitos defectuosos para A, B, C es 5, 10 y 12 %
respectivamente. Si los circuitos se almacenan en la planta sin importar quién fue el
proveedor:
87. Tras un vertido contaminante en un rı́o, se sabe que el rı́o puede recuperarse total o
parcialmente, siendo la probabilidad de que el se recupere totalmente igual al 80 %.
Caso de recuperarse, la probabilidad de que una cierta especie de pez que vive en
sus aguas alcance de nuevo una población similar a la que tenı́a antes del vertido,
es del 90 %. En cambio, si la recuperación es parcial dicha probabilidad se reduce al
30 %.
102
a) ¿Cuál es la probabilidad de que la población de peces alcance de nuevo el tamaño
de antes del vertido?
b) Si efectivamente se detecta un año más tarde que la población de peces ha recu-
perado el tamaño inicial, ¿cuál es la población de que el ecosistema del rı́o se
haya recuperado totalmente?
103
Capı́tulo 4
Variables aleatorias
4.1. Introducción
Normalmente, los resultados posibles (espacio muestral Ω) de un experimento aleatorio
no son valores numéricos. Por ejemplo, si el experimento consiste en lanzar de modo
ordenado tres monedas al aire, para observar el número de caras (C ) y sellos (S ) que se
obtienen, el espacio muestral asociado a dicho experimento aleatorio serı́a:
En estadı́stica resulta más fácil utilizar valores numéricos en lugar de trabajar directamen-
te con los elementos de un espacio muestral como el anterior. Ası́ preferimos identificar los
eventos {CSS, SSC, SSC} con el valor numérico 1 que representa el número de caras ob-
tenidas al realizar el experimento. De este modo aparece el concepto de variable aleatoria,
X, unidimensional como el de toda función
X : Ω→R
ω 7→ X(ω) = x
que atribuye un único número real x, a cada evento elemental ω, del espacio muestral Ω.
RX = {x ∈ R/x = X(ω), ω ∈ Ω}
X ≡ Número de caras
104
X(CCC) = 3
X(SSS) = 0
Observación
La variable X no recibe el calificativo de aleatoria por el hecho de que atribuya de modo
imprevisible un valor cualquiera a un elemento ya que este valor está definido de forma
precisa (determinı́stica). Lo que es aleatorio en realidad, es que al hacer el experimento,
no sabemos qué elemento de Ω puede ocurrir.
La composición de una función real con una variable aleatoria es también variable
aleatoria, pues está definida sobre Ω y a cada elemento suyo le asocia un valor real, es
decir:
X : Ω → R, G : R → R
enonces:
G(X) = G ◦ X : Ω → R
ω 7→ G(X(ω))
En función de los valores que tome la variable, esta puede ser clasificada en discreta o
continua del siguiente modo:
Variable aleatoria discreta es aquella que sólo puede tomar un número finito o
infinito numerable de valores. Ejemplo:
X:Ω→N
Variable aleatoria continua es aquella que puede tomar un número infinito no nume-
rable de valores.
X:Ω→R
105
P(X ∈ [a, b]) = PX [{ω ∈ Ω/X(ω) ∈ [a, b]}]
f : N → [0, 1]
xi 7→ f (xi ) = P (X = xi )
Ejemplo 4.1. Si retomamos el caso del lanzamiento de 3 monedas de forma que cada una
de ellas tenga probabilidad 1/2 de dar como resultado cara o sello, se tiene que:
1 1 1 1
f (3) = P(X = 3) = P[{CCC}] = × × =
2 2 2 8
1 1 1 1 1 1 1 1 1 3
f (2) = P(X = 2) = P[{CCS, CSC, SCC}] = × × + × × + × × =
2 2 2 2 2 2 2 2 2 8
1 1 1 1 1 1 1 1 1 3
f (1) = P(X = 1) = P[{CSS, SCS, SSC}] = × × + × × + × × =
2 2 2 2 2 2 2 2 2 8
1 1 1 1
f (0) = P(X = 0) = P[{SSS}] = × × =
2 2 2 8
Observación Obsérvese que X está definido sobre el espacio muestral de sucesos Ω,
mientras que f lo está sobre el espacio de números reales R.
i) f (x) ≥ 0, ∀x ∈ R
∑
ii) f (xi ) = 1
xi ∈RX
La condición ii)
∑
n
Es : f (xi ) = 1, si RX = {x1 , x2 , ..., xn } es finito
i=1
∞
∑
Es : f (xi ) = 1, si RX = {x1 , x2 , x3 , ...} es infinito
i=1
106
Nota
1. Si A ⊂ R, entonces, la probabilidad de A, es el número:
∑ ∑
P(A) = P(X = xi ) = f (xi ).
xi ∈A xi ∈A
Valores xi de X x1 x2 x3 ... xn
Probabilidad pi = P(X = xi ) p1 p2 p3 ... pn
Esta función se representa gráficamente del mismo modo que la distribución de frecuencias
relativas acumuladas.
Ejemplo 4.2. En el ejemplo de las 3 monedas, calcular la función de probabilidades,
función de distribución acumulada, y graficarlas.
Solución
1 1 1 1
f (3) = P(X = 3) = P[{CCC}] = × × =
2 2 2 8
1 1 1 1 1 1 1 1 1 3
f (2) = P(X = 2) = P[{CCS, CSC, SCC}] = × × + × × + × × =
2 2 2 2 2 2 2 2 2 8
1 1 1 1 1 1 1 1 1 3
f (1) = P(X = 1) = P[{CSS, SCS, SSC}] = × × + × × + × × =
2 2 2 2 2 2 2 2 2 8
1 1 1 1
f (0) = P(X = 0) = P[{SSS}] = × × =
2 2 2 8
Valores xi de X 0 1 2 3
Probabilidad f (xi ) = P(X = xi ) 1/8 3/8 3/8 1/8
Luego la f.d.a. es
1
F (0) = P(X ≤ 0) = f (0) =
8
1 3 4
F (1) = P(X ≤ 1) = f (0) + f (1) = + =
8 8 8
1 3 3 7
F (2) = P(X ≤ 2) = f (0) + f (1) + f (2) = + + =
8 8 8 8
1 3 3 1 8
F (3) = P(X ≤ 3) = f (0) + f (1) + f (2) + f (3) = + + + = = 1
8 8 8 8 8
107
Es decir,
0 si x<0
si 0 ≤ x < 1
1/8
F (x) = 4/8 si 1 ≤ x < 2
7/8 si 2 ≤ x < 3
1 si x≥3
y
F (−∞) = lı́m F (x) = 0
x→−∞
∑
k ∑
k
f (xi ) = P(X = xi ) = 1
i=1 i=1
Aun cuando la variable tomase un número infinito de valores, x1 , x2 , ..., no hay ningún
problema en comprobar que cada xi contribuye con una cantidad f (xi ) al total, de modo
108
que
∞
∑ ∞
∑
f (xi ) = P(X = xi ) = 1
i=1 i=1
Cuando la variable es continua, no tiene sentido hacer una suma de las probabilidades de
cada uno de los términos en el sentido anterior, ya que el conjunto de valores que puede
tomar la variable es no numerable. En este ∫ caso, lo que generaliza de modo natural el
∑
concepto de suma ( ) es el de integral ( ). Por otro lado, para variables continuas no
tiene interés hablar de la probabilidad de que X = x ∈ R, ya que esta siempre vale 0.
De este modo es necesario introducir un nueva definición para v.a. continuas,
i) f (x) ≥ 0
∫ +∞
ii) f (x)dx = 1
−∞
∫
iii) P(A) = P(X ∈ A) = f (x)dx, para cualquier intervalo A ∈ R
A
109
Observación
Por ser f una función integrable, la probabilidad de un punto es nula:
∫ a
P(X = a) = P(a ≤ X ≤ a) = f (x)dx = 0
a
y por ello al calcular la probabilidad de un intervalo no afectara nada el que este sea
abierto o cerrado por cualquiera de sus extremos, pues estos son puntos y por tanto de
probabilidad nula:
Ejemplo 4.3. Sea f (x) una función definida en todos los números reales por
{
cx2 si 0≤x≤2
f (x) =
0 otro caso
a Hallar el valor de la constante c para que f (x) sea una función de densidad para alguna
variable aleatoria X.
Solución
resultando c = 38 . Luego
{
3x2
8 si 0≤x≤2
f (x) =
0 otro caso
b [ 3 ]1
∫ 1
3x2 x 1
P(0 < X ≤ 1) = dx = =
0 8 8 0 8
110
Ejemplo 4.4. La función de densidad de una variable aleatoria continua X, es descrita
por: {
ce−βx si x ≥ 0
f (x) =
0 si x < 0
Solución
a ∫ ∫ [ ]
+∞ +∞
1 2 1
1= f (x)dx = ce−βx dx = c 0 + =c
−∞ 0 β 0 β
resultando c = β. Luego
{
βe−βx si x ≥ 0
f (x) =
0 si x < 0
∫ x
b Si x < 0, F (x) = 0, Si x ≥ 0, F (x) = P(X ≤ x) = βe−βt dt = 1 − e−βx
0
b Dada la f.d.a. F (x) de una v.a. discreta con rango RX = {x1 , x2 , ..., xk }, entonces la
función de probabilidad f (x) de X es:
c Dada la f.d.a. F (x) de una v.a. continua X, entonces su función de densidad f (x) es
igual a la derivada de la f.d.a. con respecto a x, donde ésta exista, esto es,
d d
f (x) = F (x), ∀x tal que F (x) exista.
dx dx
∫ x
En efecto, si F (x) = f (t)dt, entonces, f (x) = F ′ (x) para todo x donde exista
−∞
la derivada F ′ (x).
111
a Hallar la constante k y la función de densidad.
Solución
Solución
( ) ( )
y+4 y+4
FY (y) = P(Y ≤ y) = P(3X − 4 ≤ y) = P X ≤ = FX
3 3
y+4
entonces FY (y) = FX (u), donde u = 3
luego
dFY (y) dFX (u) du 1 y+4
g(y) = = × = f (u) donde u = .
dy du dy 3 3
Por tanto, {
1
12 si 2 ≤ y ≤ 14
g(y) =
0 otro caso
112
Definición 4.4. Sea X una v.a. continua. Se denomina esperanza matemática de X o
valor esperado, y se denota bien E(X) o bien µX , a la cantidad que se expresa como:
∫
E(X) = xf (x)dx
RX
Observación
Resulta, entonces, que en el caso discreto:
∑ ∑
E(X) = xi f (xi ) = xi P (X = xi )
xi ∈RX xi ∈RX
Ası́ la esperanza o media es el promedio de los valores posibles de la variable aleatoria con
sus respectivas probabilidades.
Propiedad básica del valor esperado
Sea X una variable aleatoria y GX : RX −→ R una función. Entonces, la esperanza de la
variable aleatoria puede obtenerse usando la distribución de probabilidades de X, según
sea esta discreta o continua, como se indica a continuación:
Si X es discreta, entonces:
∑
E(G(X)) = G(x)f (x)
x∈RX
Si X es continua, entonces:
∫
E(G(X)) = G(x)f (x)dx
RX
Observación
Resulta, entonces, que en el caso discreto:
∑ ∑
E(G(X)) = G(x)f (x) = G(x)P (X = x)
x∈RX x∈RX
E(aX + b) = aE(X) + b.
E(b) = b.
E(X + b) = E(X) + b.
E(aX) = aE(X).
113
3. Si X e Y son variables aleatorias y a y b son constante reales, entonces,
En particular se tiene:
E(XY ) = E(X)E(Y ).
Solución
Sea:
X: El número de caras que se obtienen al lanzar cuatro monedas.
La distribución de probabilidad de X se da en la siguiente tabla:
Valores xi de X 0 1 2 3 4
Probabilidad f (xi ) = P(X = xi ) 1/16 4/16 6/16 4/16 1/16
∑
4 ( ) ( ) ( ) ( ) ( )
1 4 6 4 1
E(X) = xf (x) = 0 +1 +2 +3 +4 =2
16 16 16 16 16
x=0
Esto significa que si una persona lanza 4 monedas, muchas veces, en promedio obtendrá 2
caras por lanzamiento
Ejemplo 4.8. La vida útil de un objeto en miles de horas, es una variable aleatoria
continua X cuya función de densidad es:
{
1 − x2 si 0≤x≤2
f (x) =
0 otro caso
114
Solución
∫ ∫ ( [ 2 ]2
2
x) x x3 2
E(X) = xf (x)dx = x 1− dx = − =
RX 0 2 2 6 0 3
En consecuencia, puede esperarse que la vida útil promedio del objeto sea de 2
3 × 1000 =
666,67 horas
Ejemplo 4.9. Suponga que un juego al azar consiste en lanzar un dado y que el jugador
puede ganar $ 7, si obtiene al menos 5 puntos, o perder $2 en caso contrario.
Solución
Sea:
X: Puntaje obtenido al lanzar el dado,
Entonces X toma los valores 1,2,3,4,5,6
Valores xi de X 0 1 2 3 4 5 6
Probabilidad f (xi ) = P(X = xi ) 1/16 1/6 1/6 1/6 1/6 1/6 1/6
∑
6 ( ) ( ) ( ) ( ) ( ) ( )
1 1 1 1 1 1
E(U (X)) = U (x)f (x) = −2 −2 −2 −2 +7 +7 =1
6 6 6 6 6 6
i=1
b Para que el juego sea justo entonces E(U (X)) = 0, primero definamos la utilidad:
{
k si x = 5, 6
U (x) =
−2 si x = 1, 2, 3, 4
∑
6 ( ) ( ) ( ) ( ) ( ) ( )
1 1 1 1 1 1
E(U (X)) = U (x)f (x) = −2 −2 −2 −2 +k +k =0
6 6 6 6 6 6
i=1
entonces: ( ) ( )
1 1
−8 + 2k =0
6 6
2k = 8
k=4
Para que el juego sea justo se deberı́a ganar $4.
115
4.5. Varianza
2 , cuya media
La varianza de una variable aleatoria X, denotado por Var(X), o por σX
o esperanza es E(X), se define como:
[ ]
Var(X) = E (X − E(X))2
donde:
[ ] ∑
a Si X es discreta se tiene: Var(X) = E (X − E(X))2 = x∈RX (x − E(X))2 P(X = x)
[ ] ∫
b Si X es continua se tiene: Var(X) = E (X − E(X))2 = (x − E(X))2 f (x)dx
RX
Observación
La desviación estándar mide la variabilidad promedio en relación a la media. Por medio
de la propiedad básica del valor esperado, puede verificarse que:
Var(aX + b) = a2 Var(X)
En particular se tiene:
116
Ejemplo 4.10. Calcular la varianza y la desviación estándar de la distribución de proba-
bilidad de la variable aleatoria X que se define como el número de caras al lanzar cuatro
monedas.
Solución
Sea la variable aleatoria X definida como:
X: Número de caras al lanzar cuatro monedas.
La distribución de probabilidad de X es:
Valores xi de X 0 1 2 3 4
Probabilidad f (xi ) = P(X = xi ) 1/16 4/16 6/16 4/16 1/16
∑
4 ( ) ( ) ( ) ( ) ( )
1 4 6 4 1
E(X 2 ) = (x2 )f (x) = 02 + 12 + 22 + 32 + 42 =5
16 16 16 16 16
x=0
Por lo tanto:
Var(X) = E(X 2 ) − [E(X)]2 = 5 − (2)2 = 1.
Ejemplo 4.11. La vida útil de un objeto en miles de horas, es una variable aleatoria
continua X cuya función de densidad es:
{
1 − x2 si 0≤x≤2
f (x) =
0 otro caso
Solución
En el ejemplo 4.8 se calculo el valor esperado de X resultando, E(X) = 23 , además:
∫ ∫ ( [ 3 ]2
2
x) x x4 2
2
E(X ) = 2
(x )f (x)dx = 2
x 1− dx = − =
RX 0 2 3 8 0 3
Por lo tanto: [ ]2
2 2 2
Var(X) = E(X ) − [E(X)] = −
2
= 2
3 3 9
La desviación estándar de X es:
√
√ 2
σX = Var(X) = .
9
117
Ejemplo 4.12. El número de defectos de un producto es una variable aleatoria X cuya
función de probabilidad se da en la siguiente tabla.
Valores xi de X 0 1 2 3 4 5
Probabilidad f (xi ) = P(X = xi ) 1/10 2/10 3/10 2/10 1/10 1/10
Si el costo del producto está dado por la expresión:
C = 4 + 2X − 0,2X 2
Solución
E(X) = 0 × 0,1 + 1 × 0,2 + 2 × 0,3 + 3 × 0,2 + 4 × 0,1 + 5 × 0,1 = 2,3
E(X 2 ) = 02 × 0,1 + 12 × 0,2 + 22 × 0,3 + 32 × 0,2 + 42 × 0,1 + 52 × 0,1 = 7,3
E(C) = 4 + 2E(X) − 0,2E(X 2 ) = 4 + 2 × 2,3 − 0,2 × 7,3 = 7,14
Ejemplo 4.13. Consideremos una variable aleatoria continua con función de densidad,
{
cx3 si 0≤x≤1
f (x) =
0 otro caso
Calcular:
Solución
118
c El valor esperado es:
∫ 1 ∫ 1 [ ]1
4x5 3 4
E(x) = xf (x)dx = x(4x )dx = =
0 0 5 0 5
d
P(0,2 ≤ X ≤ 0,7) = F (0,7) − F (0,2) = 0,74 − 0,24 = 0,24
Calcular:
a Media
b Varianza
c P(0,2 ≤ X ≤ 0,8)
Solución
a Sabemos que::
∫ 1 ∫ 1 [ ]1
x2 1
µX = E(X) = xf (x)dx = x(1)dx = =
0 0 2 0 2
entonces: [ ]2
1 1 1
Var(X) = E(X ) − [E(X)] = −2
= 2
3 2 12
c ∫ ∫
0,8 0,8
P(0,2 ≤ X ≤ 0,8) = f (x)dx = 1dx = [x]0,8
0,2 = 0,8 − 0,2 = 0,6
0,2 0,2
119
Demanda D 0 10 20 30 40 50
Probabilidad 1/10 1/10 2/10 3/10 2/10 1/10
Si el tendero comercializa 30 unidades diariamente, ¿cuánto serı́a su utilidad esperada?
Solución
Entonces
( ) ( ) ( ) ( ) ( )
1 1 2 2 1
U (x) = −270 − 160 − 50 + 60 + 60
10 10 10 10 10
U (x) = −27 − 16 − 10 + 18 + 12 + 6
U (x) = −17
Ejemplo 4.16. La fracción de tiempo X, que una computadora está en uso udrante un
dı́a de trabajo de 8 horas, es una variable aleatria con función de densidad:
120
{
2x si 0≤x≤1
f (x) =
0 otro caso
a Calcular la esperanza de X
b Hallar la varianza de X
c Hallar el valor esperado del costo por el uso de la computadora si èste es:
C(x) = 5 + 3x + 0, 1x2
Solución
a Calcular la varianza
∫ ∫1 ∫1
E(x) = Rx xf (x)dx = o x(2x) = 0 2x2
[ 2 ]1
2x
3 0
2
E(x) =
3
b Hallar la varianza
[ ]1
∫ ∫1 ∫1 x4 1
E(x2 ) = (x2 )f (x)dx = 0 x2 (2x) = 0 2x3 = =
2 0 2
1
E(x2 ) =
2
Var(x) = E(x2 ) − [E(x)]2
1 4 1
Var(x) = − =
2 9 18
1
Var(x) =
18
c Hallar el valor esperado X el costo del uso de la computadora
C(x) = 5 + 3x + 0, 1x2
C(x) = 7, 05
121
4.6. Ejercicios propuestos
1. El número de hijos por familia de una determinada región es una variable aleatoria
X cuya función de probabilidad es:
Valores xi de X 0 1 2 3 4
Probabilidad f (xi ) = P(X = xi ) 1/16 4/16 k 4/16 1/16
2. Se venden 500 boletos de una rifa que consiste de un premio de $200, 4 premios de
$50, y 10 premios de $5. Si cada boleto cuesta $1, y si usted adquiere un boleto,
4. Del total de personas que se presentan para un puesto de trabajo el 60 % son hombres
y el resto mujeres. Aquellos que reúnen todos los requisitos para dicho puesto son el
40 % de los hombres y el 50 % de las mujeres. De tres personas que se presentan.
122
a Determinar el rango de la variable aleatoria .
b ¿Cuál es el valor de la constante c?
c Determinar la probabilidad de que en más de la mitad de las semanas de (de este
periodo) la inversión sea de alto riesgo.
d Determinar la probabilidad de que en más de dos de las semanas de (de este
periodo) la inversión sea de alto riesgo, pero no en todas las semanas la inversión
es de alto riesgo
e Cuantas semanas se espera que la inversión sea de alto riego.
6. Sea X una variable aleatoria con f.d.a F (x), defina de la siguiente forma:
0 si x<0
0≤x<2
0,2 si
F (x) = 0,7 si 2≤x<6
0,9 si
6≤x<8
1 si x≥8
123
a Determinar c y la función de densidad f (x) de X.
b Hallar la función de distribución acumulada de X.
c Hallar la probabilidad de que el tiempo de vida, de la componente sea mayor que
1000 horas.
10. En un problema de una prueba aplicada a niños pequeños, se les pide que hagan
corresponder cada uno de los 3 dibujos de animales con la palabra que identifica a
ese animal. Si un niño asigna aleatoriamente las 3 palabras a los 3 dibujos, encontrar
la distribución de probabilidad para X, definida como el número de correspondencias
correctas.
11. Suponga que el ingreso familiar mensual, en miles de unidades monetarias u.m., en
una ciudad, es una v.a continua con función de densidad:
{
4k si 0 ≤ x < 1
f (x) =
k(5 − x) si 1 ≤ x ≤ 5
12. Cierto productor fabrica un bien cuya demanda semanal, en toneladas es una variable
aleatoria X, con rango 0 y 10 toneladas, y función de densidad,
1
f (x) = , x ∈ RX .
10
Cada tonelada producida le cuesta 10 mil soles y la vende en 25 mil soles. Toda
cantidad que no se logra vender se pierde sin generar un costo adicional al de su
fabricación. Suponga que en cierta semana el productor decide fabricar 5 toneladas.
124
13. La demanda semanal, en miles de galones, de gasolina en una estación de servicios
es una v.a. continua X cuya función de densidad está dada por la siguiente gráfica:
15. Suponga que el número de llamadas telefónicas que recibe una central en un perı́odo
de tiempo, es una variable aleatoria X, cuya función de probabilidad:
e−λ (λ)x
f (x) = , x = 0, 1, ..., λ = constante
x|
Calcular la media del número de llamadas en ese perı́odo
∑∞
z zk
Sug. e =
k|
k=0
16. Suponga que un juego consiste en lanzar un dado y que si se obtiene al menos 5
puntos se gana $2, en caso contrario se pierde el número obtenido en dólares.
17. Suponga que la vida útil en años de cierto tipo de computadoras es una variable
aleatoria X con función de densidad,
{
2 − 2x si 0≤x ≤1
f (x) =
0 otro caso
125
El distribuidor ofrece una garantı́a de 6 meses. Si la computadora falla en ese perı́odo
se remplazará por otra, a lo más una sola vez. Si cada computadora tiene el costo
de fabricación de $400 y el precio de venta de $900, ¿cuánto es la utilidad esperada
por computadora?
18. Una urna contiene ocho fichas. Una ficha tiene un cero escrito sobre ella, una tiene
un tres, tres fichas tienen escrito un uno, tres tienen un dos. Se saca una ficha al
azar. Sea Y el número seleccionado en la ficha.
a Hallar Dominio de Y .
b Hallar el Rango de Y .
c Determinar la función de probabilidad.
d Hallar la función de distribución acumulada
19. Un vendedor puede visitar en un dı́a uno o dos clientes con probabilidaddes 2/5
y 3/5 respectivamente. De cada visita en forma, independiente, puede resultar una
venta por $500 con probabilidad 1/6 o ninguna venta con probabilidad 5/6 si X son
las ventas diarias, calcular la media y la varianza de X.
126
Duración X (dı́as) 10 11 12 13 14
Probabilidad 0.1 0.3 0.3 0.2 0.1
{
42x(1 − x)5 si 0≤x ≤1
f (x) =
0 otro caso
a Hallar el valor de k.
b Hallar la función de distribución acumulada.
c Calcular el valor esperado
d Calcular la varianza
25. La fracción de tiempo X, que una computadora está en uso durante un dı́a de trabajo
de 8 horas, es una variable aleatoria con función de densidad:
{
2x si 0≤x ≤1
f (x) =
0 otro caso
a Calcular la esperanza de X.
b Hallar la varianza de X.
c Hallar el valor esperado del costo por el uso de la computadora si éste es:
C(X) = 5 + 3x + 0,1x2
127
26. Un fabricante de aparatos de televisión ofrece un año de garantı́a de restitución
gratuita si el tubo de imagen falla. El fabricante estima el tiempo de falla, T , como
una variable aleatoria con la siguiente distribución de probabilidad:
{
1 − 4t
f (t) = 4e si t>0
0 otro caso
¿Qué porcentaje de aparatos tendrá que reparar?
27. Un juego consiste en lanzar una moneda 3 veces y luego un par de dados. Se pagan
S/5 por cada cara y también tantos soles como puntuación obtenga en los dados.
¿Cuánto esperarı́a ganar?
28. Un capataz en una fábrica tiene trabajando para él tres hombres y tres mujeres.
Desea elegir dos trabajadores para una labor especial y decide seleccionarlos al azar
para no introducir algún sesgo en su selección. Sea Y el número de mujeres en su
selección. Hallar la función de probabilidad.
29. La demanda en miles de metros de determinada tela que produce una compañı́a
textil es una variable aleatoria X que tiene función de densidad siguiente:
1
f (x) = , si 0 ≤ x ≤ 10.
10
Si por cada metro de tela vendida gana $4, pero por cada metro de tela no vendida
en la temporada se pierde $1.
30. La vida útil de un objeto es una variable aleatoria X con función de densidad:
{
βe−βx si x≥0
f (x) =
0 si x<0
calcular la varianza y la desviación estándar de X .
31. La vida útil de una baterı́a en años es una variable aleatoria X con función de
densidad: {
0,2e−0,2x si x≥0
f (x) =
0 si x<0
Si el costo del producto está dado por la expresión.
C = 80 + 2X + 0,04X 2 .
128
32. Sea X una variable aleatoria con función de densidad:
{
2x
9 si 0≤x≤3
f (x) =
0 otro caso
33. Un robot posiciona diez unidades en un torno para maquinado cuando se gradúa el
torno. Si el robot no tiene la unidad posicionada de manera apropiada, ésta cae, y la
posición del torno permanece abierta, resultando de ese modo un ciclo que produce
menos de diez unidades. Un estudio del funcionamiento pasado del robot indica que
si X : número de posiciones abiertas,
0,6 si x=0
0,3 si x=1
f (x) =
0,1 si x=2
0 otro caso
Y = 20x2 .
129
Capı́tulo 5
Distribuciones o modelos
probabilı́sticos
5.1. Introducción
Como complemento al capı́tulo anterior en el que definimos todos los conceptos rela-
tivos a variables aleatorias, describimos en éste las principales leyes de probabilidad que
encontramos en las aplicaciones del cálculo de probabilidades. Describiremos las principa-
les leyes de probabilidad de cada una de ellas, las cuales constituirán el soporte subyacente
de la inferencia estadı́stica y a las que será necesario hacer referencia en el estudio de di-
cho bloque. En este capı́tulo estudiaremos dos procesos muy importantes, tanto para v.a.
discrteas como para continuas.
Ahora veamos los tres modelos que se generan a partir de un proceso de Bernoulli.
130
5.2.1. Modelo o distribución Binomial
Se dice que la variable X, definida como el número de éxitos que ocurren en n
pruebas independientes tiene distribución binomial con parámetros n y p y se escribe
X v B(n, p) si su función de probabilidad es:
( )
n
f (k) = P(X = k) = pk q n−k , k = 0, 1, ..., n, q = 1 − p.
k
Donde p es la probabilidad de éxito de X.
b Var(X) = npq.
Ejemplo 5.1. La probabilidad de que cierto tipo de objeto pase con éxito una determinada
prueba es 5/6. Se prueban 10 de tales objetos. Si X es la variable aleatoria que se define
como el número de objetos que pasan la prueba:
a Determinar la función de probabilidad de X.
131
b Queremos P(X = 5), entonces:
( )( ) ( )
10 5 5 1 5
f (5) = P(X = 5) =
5 6 6
b Determine la utilidad y la utilidad esperada que producen a la tienda los 5 clientes que
alquilan automóviles.
Solución
a Sea X el número de clientes que alquilan automoviles tipo A. Entonces, los valores
posibles para X son: 0,1,2,3,4,5.
La probabilidad del evento E: Un cliente alquila un automóvil tipo A es p = 0,7 y
q = 1 − p = 0,3. La distribución de probabilidad de X es:
( )
5
f (k) = P(X = k) = (0,7)k (0,3)5−k , k = 0, 1, 2, 3, 4, 5.
k
U = 20 + 15X + (5 − X)5, X = 0, 1, 2, 3, 4, 5.
132
5.2.2. Modelo o distribución Geométrica
Se dice que la variable X definida como el número de repeticiones independientes
hasta que ocurra el primer éxito, tiene distribución geométrica con parámetro p y se
escribe X v G(p) si su función de probabilidad es:
a E(X) = p1 .
q
b Var(X) = p2
.
d ¿Qué probabilidad hay de que su primera venta ocurra después de más de 5 llamadas
si ya hizo 3 llamadas sin éxito?
Solución
a Como la variable X es el número de llamadas hasta conseguir una venta. Sus posi-
bles valores son: 1, 2, 3,..., etc. El modelo de probabilidad de X es geométrica de
parámetro p = 0,02, es decir X v G(0,02), entonces su función de probabilidad de
X es:
f (k) = P(X = k) = (0,02)(0,98)k−1 , k = 1, 2, ...
1 1
c E(X) = p = 0,02 = 50. A la larga en la llamada número 50 obtiene su primera venta.
133
d El evento ya se hizo 3 llamadas sin éxito es equivalente al evento requiere hacer más de
3 llamadas hasta que obtenga un éxito. Entonces:
Ejemplo 5.4. Un matrimonio quiere tener una hija, y por ello deciden tener hijos hasta
el nacimiento de una hija. Calcular el número esperado de hijos (entre varones y hembras)
que tendrá el matrimonio. Calcular la probabilidad de que la pareja acabe teniendo tres
hijos o más.
Solución
Este es un ejemplo de variable geométrica. Vamos a suponer que la probabilidad de tener
un hijo varón es la misma que la de tener una hija mujer. Sea X la v.a. definida como:
X: Número de hijos hasta que nasca a niña.
Es claro que X v G(0,5), y su función de probabilidad es:
1 1
Sabemos que el número esperado de hijos es E(X) = p = 0,5 = 2, por tanto el número
esperado en total entre hijos varones y la niña es 2.
La probabilidad de que la pareja acabe teniendo tres o más hijos, es la de que tenga 2
o más hijos varones (la niña está del tercer lugar en adelante), es decir,
a E(X) = pr .
134
rq
b Var(X) = p2
.
Ejemplo 5.5. Una maquina produce artı́culos de uno en uno y de manera independiente,
Se considera que el 10 % de ellos son defectuosos. Si la máquina se detiene apenas produce
el cuarto artı́culo defectuoso. Si X es el número de artı́culos producidos hasta tener 4
defectuosos:
Solución
r 4
b E(X) = p = 0,1 = 40.
d Queremos:
( )
∑
9
k−1
P(X ≥ 10) = 1 − P(4 ≤ X ≤ 9) = (0,1)4 (0,9)k−4 .
k=4
4−1
Ejemplo 5.6. Para tratar a un paciente de una afección de pulmón han de ser operados
en operaciones independientes sus 5 lóbulos pulmonares. La técnica a utilizar es tal que
si todo va bien, lo que ocurre con probabilidad de 7/11, el lóbulo queda definitivamente
sano, pero si no es ası́ se deberá esperar el tiempo suficiente para intentarlo posteriormente
de nuevo. Se practicará la cirugı́a hasta que 4 de sus 5 lóbulos funcionen correctamente.
¿Cuál es el valor esperado de intervenciones que se espera que deba padecer el paciente?
¿Cuál es la probabilidad de que se necesiten 10 intervenciones?
135
Solución
Este es un ejemplo claro de experimento aleatorio regido por un modelo Pascal, ya que se
realizan intervenciones hasta que se obtengan 4 lóbulos sanos, y éste es el criterio que se
utiliza para detener el proceso. Identificando los parámetros se tiene:
( 7)
X: Número de operaciones hasta obtener 4 lóbulos sanos. X v P a 4, 11 . Luego:
r 4 44
E(X) = = =
p 7/11 7
Luego el número esperado de intervenciones que deberá sufrir el paciente es de aproxima-
damente 6.
La probabilidad de que el número de intervenciones sea 10, es:
( )( ) ( )
10 − 1 7 4 4 10−4
f (10) = P(X = 10) = .
4−1 11 11
c H(N, n, r) ∼
= B(n, p). Esto para un valor de N suficientemente grande
136
tasa o promedio de ocurrencias ω por unidad de medida.
a E(X) = λ
b Var(X) = λ
Ejemplo 5.7. Suponga que llegan en forma aleatoria una serie de llamadas a una central
telefónica con un promedio de tres llamadas por minuto.
Solución
Sea X el número de llamadas que ocurren en el periodo de 5 minutos, entonces, X v P (λ),
donde λ = 3 × 5 = 15 es el promedio del número de llamadas en 5 minutos, es decir,
X v P (λ = 15),
a La función de probabilidad de X es :
e−15 15k
f (k) = P (X = k) = , k = 0, 1, 2, ...
k!
b La probabilidad de que no ocurra llamada alguna en el periodo de 5 minutos es
P(X = 0), es decir:
e−15 150
f (0) = P (X = 0) = = e−15 .
0!
137
La probabilidad de que ocurra al menos 16 llamadas es en el periodo de 5
minutos es:
∑
15 −15 k
e 15
P(X ≥ 16) = 1 − P(X ≤ 15) = 1 − F (15) = 1 − .
k!
k=0
Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo
que el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello
ocurra en un instante tf , no depende del tiempo transcurrido anteriormente en
el que no ha pasado nada.
138
Siendo β = ω.
La f.d.a de la variable aleatoria exponencial X es:
F (x) = P(X ≤ x) = 1 − e−βx , x ≥ 0.
También:
P(X ≥ x) = e−βx , x ≥ 0.
a E(X) = β1 .
1
b Var(X) = β2
.
c Si X v exp(β) entonces P(X > s + t|X > s) = P(X > t), ∀t, s > 0.
Ejemplo 5.8. El tiempo durante el cual cierta marca de baterı́a trabaja en forma efectiva
hasta que falle (tiempo de falla) se distribuye exponencialmente con tiempo promedio de
fallas igual a 360 dı́as.
a ¿Qué probabilidad hay que el tiempo de falla sea mayor que 400 dı́as?
b Si una de estas baterı́as ha trabajado ya 400 dı́as, ¿qué probabilidad hay que trabaje
más de 200 dı́as más?
b Si la baterı́a ya trabajo 400 dı́as, quiere decir que su tiempo de falla es mayor que 400
dı́as. Luego,
P(X > 400 + 200|X > 400) = P(X > 200) = e− 360 200 = e− 360 = 0,574.
1 200
139
5.3.3. Modelo o distribución uniforme
S e dice que una v.a. continua X tiene distribución uniforme en el intervalo de extremos
finitos a y b es decir [a, b] , y se escribe X v U [a, b], si su función de densidad es constante
y es dada por:
1
f (x) = , a ≤ x ≤ b.
b−a
La f.d.a de la variable aleatoria uniforme X es:
x−a
F (x) = P(X ≤ x) = a ≤ x ≤ b.
b−a
a+b
a E(X) = 2 .
(b−a)2
b Var(X) = 12
Observación
Esta distribución es adecuada para describir a una variable que asuma sus valores uniforme
o indistintamente en un intervalo de extremos finito
Ejemplo 5.9. Dos gerentes A y B deben encontrarse en cierto lugar entre las 7 p.m. y 8
p.m. para firmar un contrato. Cada uno espera al otro a lo más 10 minutos, ¿cuál es la
probabilidad de que no se encuentren sabiendo que A llega a las 7:30 p.m.?
Solución
Sea la variable aleatoria X el tiempo de llegada de B, que puede hacerlo en cualquier
instante aleatorio entre las 7 p.m. y las 8 p.m. o entre 0 y 60 minutos. Entonces X v U [0, 60]
y su función de densidad es:
1
f (x) = , 0 ≤ x ≤ 60.
60
Puesto que A llega a las 7:30 p.m. o a los 30 minutos después de las 7 p.m. y espera a lo
más 10 minutos, B no se encontrará con A si B llega de 7 p.m. o menos de 7:20 p.m. o si
llega después de las 7:40 p.m. Entonces, la probabilidad de que A y B no se encuentren es:
∫ 20 ∫ 60
1 1 20 20 2
P(0 ≤ X < 20 o 40 < X ≤ 60) = dx + dx = + = .
0 60 40 60 60 60 3
Ejemplo 5.10. Un vendedor cobra honorarios fijos de S/.200 más una comisión de 5 %
del total de las ventas que realiza. Si el total de las ventas que realiza es una variable
aleatoria X con distribución uniforme entre 0 y 2000.
140
c Si vende como mı́nimo S/.500, ¿qué probabilidad hay de que gane más de S/.260?
Solución
Sabemos que X es la variable aleatoria definida como el total de ventas y X v U [0, 2000].
La utilidad o ganancia del vendedor es :
U = 200 + 0,05X.
a E(X) = µ.
b Var(X) = σ 2 .
141
2. Si µ = 0 y σ 2 = 1, la distribución se llama normal estándar
3. No hay fórmula explı́cita para la distribución acumulada; pero existen tablas para
la distribución normal estándar, ası́, para poder usarlas previamente se debe pasar
a la forma estándar.
X − µX
Z= .
σX
µT = µX + µY , y σT2 = σX
2
+ σY2 .
Ejercicio
Utilizando la tabla de probabilidades normal estándar hallar
a P(Z ≤ 1,2)
b P(Z ≤ −1,28)
c P(0,81 ≤ Z ≤ −1,91)
142
d P(−1,24 ≤ Z ≤ 2,25)
e P(−2 ≤ Z ≤ 2)
f P(Z ≥ 2,23)
Ejercicio
Utilizando la tabla de probabilidades normal estándar hallar el valor de z tal que
a P(Z ≤ z) = 0,861
b P(Z ≥ z) = 0,2236
c P(−z ≤ Z ≤ z) = 0,95
Ejemplo 5.11. Los ingresos en cierto sector pueden ser modelados por una v.a. X con
distribución normal de media 20 unidades monetarias (u.m.) y desviación estándar de
5u.m. ¿Calcular la probabilidad de que el ingreso de un trabajador de este sector sea
superior a 22u.m?
Solución
Sea X la v.a. definida como el ingreso en cierto sector circular, entonces X v N (20, 52 )
Queremos:
P(X > 22) = 1 − P(X ≤ 22) = 1 − FX (22).
X−20
Usando la estandarización Z = 5 tenemos:
22 − 20
FX (22) = FZ ( ) = FZ (0,4) = 0,6554.
5
Entonces:
P(X > 22) = 1 − 0,6554 = 0,3446.
Ejemplo 5.12. Suponga que el ingreso familiar mensual en una comunidad tiene distri-
bución normal con media $600 y desviación estándar $100.
a Calcular la probabilidad de que el ingreso de una familia escogida al azar sea menor que
$400.
Solución
Sea X la v.a. que representa los ingresos familiares mensuales. Entonces X v N (600, 1002 ).
( )
a P(X < 400) = P Z < 400−600
100 = P(Z < −2) = FZ (−2) = 0,0228.
143
b Se debe hallar k tal que P(X ≥ k) = 0,05 o P(X < k) = 0,95, entonces:
( )
k − 600
0,95 = P(X < k) = P Z <
100
k−600
de donde resulta 100 = 1,645, entonces k = 764,5.
Ejemplo 5.13. Supongamos que cierto fenómeno pueda ser representado mediante una
v.a. X v N (45, 81). Calcular la probabilidad de que X tome un valor entre 39 y 48.
Solución
Queremos:
P(39 ≤ X ≤ 48).
144
5.4. Ejercicios propuestos
1. Supóngase que en cierta población el 52 % de todos los nacimientos que se registraron
son varones. Si aleatoriamente se escogen cinco registros de nacimientos dentro de
esa población, ¿cuál es la probabilidad de que exactamente tres de ellos pertenezcan
a varones?
2. Un estudiante contesta al azar (o sea sin saber nada) 9 preguntas, siendo cada una
de 4 respuestas, de las cuales sólo una es correcta.
6. El diámetro del punto producido por una impresora tiene una distribución normal
con media de 0,002 pulgadas y desviación estándar de 0,0004 pulgadas.
a ¿Cuál es la probabilidad de que el diámetro del punto sea mayor que 0,0026
pulgadas?
145
b ¿Cuál es la probabilidad de que el diámetro del punto esté entre 0,0014 y 0,0026
pulgadas?
c ¿Qué valor debe tener la desviación estándar del diámetro para que la probabilidad
del inciso b) sea 0,995?
10.
9. Al realizar un experimento, la probabilidad de lograr el objetivo es 0.4. Si se rea-
liza el experimento 20 veces bajo las mismas condiciones y asumiendo resultados
independientes
146
d Si el costo de producción de una resistencia es:
C = 50 − X.
13. Se lanza al aire una moneda cargada 8 veces, de tal manera que la probabilidad de
que aparezca cara es de 2/3, mientras que la probabilidad de que aparezca sello es de
1/3, Determine la probabilidad de que en el último lanzamiento aparezca una cara.
14. Sı́ la probabilidad de que un cierto dispositivo de medición muestre una desviación
excesiva es de 0.05, ¿cuál es la probabilidad de que;
C = 200 + 5X + 4X 2 .
Se sabe que la varianza del número de repeticiones necesarias hasta obtener éxito es
40/36. Si en estas condiciones, el experimento debe ser realizado por 200 personas
hasta que cada una de ellas obtenga éxito, ¿cuánto serı́a el costo esperado?
147
17. Cierto virus ha invadido al 5 % de los niños. Si tales niños son examinados uno por
uno, ¿cuál es la probabilidad de que el doceavo niño examinado sea el quinto niño
encontrado atacado por el virus?
19. El chofer de un auto en un paradero sabe que sus pasajeros llegan en forma aleatoria
a razón de 1 persona cada 3 minutos siguiendo una distribución de Poisson. El auto
tiene una capacidad de 5 plazas contando al chofer. Calcular la probabilidad de que
se sobrepase la capacidad del auto en los 10 primeros minutos
20. Un lı́quido contiene cierta bacteria con un promedio de 3 bacterias por cm3 , calcular
la probabilidad de que en una muestra,
21. Un banco atiende todos los dı́as de 8am. a 4pm., y se sabe que el número de clientes
por dı́a que van a solicitar un préstamo por más de $10000 tiene una distribución de
Poisson con una media de 3 clientes por dı́a.
22. Suponga que aviones pequeños llegan a cierto aeropuerto según un proceso de Pois-
son, con tasa λ = 8 aviones por hora, de modo que el número de llegadas durante
un periodo de t horas es una variable aleatoria de Poisson con parámetro λ = 8t.
148
23. El número medio de automóviles que llegan a una estación de suministro de gasolina
es de 240 por hora. Si dicha estación puede atender a un máximo de ocho automóviles
por minuto, determine la probabilidad de que, en un minuto dado, lleguen a la
estación más automóviles de los que puede atender.
25. Cierto tipo de loceta puede tener un número X de puntos defectuoso que sigue una
distribución de Poisson con una media de 3 puntos defectuosos por loceta. El precio
de la loceta es $1 si X = 0, de $0.70 si X = 1 o 2, y de $0.1 si X > 2. Calcular el
precio esperado por loceta.
26. El número de usuarios que acuden a cierta base de datos confidencial sigue una
distribución de Poisson con una media de dos usuarios por hora.
a Calcular la probabilidad de que entre las 8am. y el mediodı́a acudan más de dos
usuarios.
b Si un operador de la base de datos trabaja todos los dı́as de 8am. hasta el mediodı́a,
¿cuál es la probabilidad de que este operador tenga que esperar más de 7 dı́as
hasta observar el primer dı́a en el cual acceden más de dos usuraos?
149
28. Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de falla en
años está dado por la variable aleatoria T , distribuida exponencialmente con tiempo
promedio de falla µ = 5. Sı́ 5 de estos componentes se instalan en diferentes sistemas,
¿cuál es la probabilidad de que al menos 2 continúen funcionando después de 8 años?
29. El tiempo que transcurre antes de que una persona sea atendida en una cafeterı́a
es una variable aleatoria que tiene una distribución exponencial con una media de
4 minutos. ¿Cuál es la probabilidad de que una persona sea atendida antes de que
transcurran 3 minutos en al menos 4 de los 6 dı́as siguientes?
30. Cierto tipo de baterı́a dura un promedio de 3 años, con una desviación tı́pica de 0,5
años. Suponiendo que la duración de las baterı́as es una variable normal:
32. La utilidad por las ventas mensuales (en miles de dólares) de una tienda de muebles,
es una variable aleatoria con distribución normal. En el 5 % de las ventas mensuales
la utilidad ha sido menos que 3.42, mientras que en el 1 % de las ventas mensuales
la utilidad ha sido mayor que 19.32.
33. El tiempo entre dos llamadas consecutivas a una central telefónica de la universidad
tiene distribución exponencial con media de 10 segundos. Encontrar la probabilidad
de que el tiempo entre dos llamadas a la central telefónica sea de más de 20segundos.
34. Las notas de un curso de Fı́sica, tienen distribución normal con una media de 13 y
una desviación estándar de 3. Las notas de un curso de Quı́mica, tienen distribución
150
normal con una media de 14 y una desviación estándar de 4. Si las notas son inde-
pendientes, encontrar la probabilidad de que para un alumno que ha llevado los dos
cursos.
35. La estatura de las mujeres de un colegio sigue una distribución normal. La moda
de la estatura es de 165cm y la desviación estándar de 10cm. La condición para
ser jugadora del equipo de voleibol es medir más de170cm. Se toma una muestra
aleatoria de 40 mujeres, hallar la probabilidad que por lo menos se pueda escoger 3
jugadoras para el equipo de voleibol.
36. Suponga que el tiempo X, en minutos, que demora una tarea tiene distribución
uniforme en [1,5]. Si el costo C para terminar la tarea es función del tiempo y es
dada por la expresión
C = 10 + x + 3X 2 ,
37. La llegada de cada uno de los empleados a su centro de trabajo se produce inde-
pendientemente, de acuerdo a la distribución uniforme en el intervalo comprendido
entre las 8:00 y 8:25a.m. Si 10 empleados llegaron al centro de trabajo después de
las 8:10a.m., ¿cuál es la probabilidad de que 4 de ellos hayan llegado entre las 8:15
y 8.20a.m.
38. Un vendedor tiene un sueldo fijo de S/.400 más una comisión del 5 % sobre el importe
de las ventas que realiza. Si el importe de las ventas tiene una distribución uniforme
entre 0 y 3400 nuevos soles,
a Hallar el ingreso medio del vendedor, ¿con qué probabilidad obtendrı́a al menos
ese monto?
b Se le ofrece como ingreso único el 25 % de sus ventas, si como mı́nimo quiere ganar
S/.480, ¿le conviene la propuesta?
39. Los beneficios anuales de una empresa A siguen una distribución normal con media
$80 y desviación estándar $10 y los beneficios de otra empresa B siguen una distri-
bución normal con media $70 y desviación estándar $5, ¿cuál es la probabilidad que
en un año la empresa A tenga mas beneficios que la empresa B?
151
a Calcule la probabilidad de que un mensaje de 10 dı́gitos binarios (0 y 1) sea
incorrecto, si la probabilidad de recibir un digito incorrecto es 0.06 y si los
dı́gitos se reciben de manera independiente.
b Si durante cierta mañana se han recibido 15 mensajes de 10 dı́gitos, ¿cuál es la
probabilidad de que al menos 12 de ellos se hayan recibido correctamente?
42. El consumo mensual de arroz, en kilos, por familia en cierta ciudad tiene una media
desconocida y una desviación estándar de 2 kilogramos. Si se selecciona una muestra
aleatoria de 45 familias de esta ciudad.
43. El diámetro del punto producido por una impresora tiene una distribución normal
con media de 0,002 pulgadas y desviación estándar de 0,0004 pulgadas.
a ¿Cuál es la probabilidad de que el diámetro del punto sea mayor que 0,0026
pulgadas?
b ¿Cuál es la probabilidad de que el diámetro del punto esté entre 0,0014 y 0,0026
pulgadas?
c ¿Qué valor debe tener la desviación estándar del diámetro para que la probabilidad
del inciso b) sea 0,995?
44. Las visitas recibidas diariamente a una Web son inferiores a 3500 el 22 % de los
dı́as, y entre 3500 y 6440 visitas se producen el 55 %. El 23 % restante son dı́as
con afluencia superior a 6440 visitas. Admitiendo que el número de visitas por dı́a
se distribuye normalmente, estime qué valore corresponden a la esperanza y a la
desviación estándar de esta variable.
152
45. La longitud de un estuche moldeado por inyección para una cinta magnética tiene
una distribución normal con una media de 90,2 milı́metros y desviación estándar de
0,1 milı́metros.
a ¿Cuál es la probabilidad de que la longitud de una pieza sea mayor que 90,3
milı́metros o menor que 89,7 milı́metros?
b ¿A qué valor debe ajustarse la media del proceso para que el mayor número de
partes tenga una longitud entre 89,7 y 90,3 milı́metros?
c Si se desechan los estuches cuya longitud no está entre 89,7 y 90,3 milı́metros,
¿cuál es el rendimiento del proceso para el valor de la media determinado en el
inciso b)?
46. Un industrial produce cojinetes con un diámetro medio de 0,750 de pulgada. Hay
una cierta cantidad de variabilidad asociada con el proceso de manufactura; esto es,
no todos los cojinetes tienen, exactamente 0,750 de pulgada en el diámetro, hay una
desviación estándar de 0,002 de pulgada. Suponga que el control de calidad exige
que los cojinetes tengan diámetro entre 0,745 y 0,755. Cualquier cantidad fuera de
este rango debe ser desechada, elaborada de nuevo o vendida como desperdicio.
¿Qué proporción de cojinetes serán desechados si suponemos que los diámetros de
los cojinetes están normalmente distribuidos.
47. La vida promedio de cierto tipo de motor pequeño es de 10 años con una desviación
estándar de 2 años. El fabricante repone sin cargo todos los motores que fallen
dentro del periodo de garantı́a. Si está dispuesto a reponer sólo 3 % de los motores
que fallan, ¿qué tan larga deberá ser la garantı́a que otorgue? Suponga que las vidas
de los motores siguen una distribución normal.
48. Las calificaciones de una prueba final de Estadı́stica tienen distribución normal con
una media igual a 8. Si el 6.68 % de los estudiantes tienen nota aprobatoria (mayor o
igual a 11), ¿Cómo debe modificarse cada nota para conseguir un 45 % de aprobados?
50. Suponga que le tiempo de vida útil de un modelo de computadora es una variable
aleatoria con distribución exponencial cuya media es 10 meses. Si el costo del montaje
de cada computadora es $660 y la venta es de $1000 determinar la utilidad esperada
por cada computadora sabiendo que el distribuidor cambia por otra computadora
nueva si esta dura menos de 5 meses.
153
Práctica N o 1
Apellidos y nombres: ...............................................................................................
Firma:...............................................
Fecha:...............................................
Nota:................................................
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
154
155
2. Las secciones A , B y C del curso de Estadı́stica y Probabilidad rinden el mismo
examen parcial. Los resultados obtenidos se registran en las siguientes tablas:
A A B B C C
Xi Fi [Li−1 , Li [ Xi fi Hi hi Xi2
2.5 3 [2,6[ 16 0.1 2.5
7.5 8 [6,10[ 144 0.2 10
12.5 22 [10,14[ 240 0.8 86.4
17.5 30 [14,18[ 240 1 45
156
157
Práctica N o 2
Apellidos y nombres: ...............................................................................................
Firma:...............................................
Fecha:...............................................
Nota:................................................
158
2. Sea X una variable aleatoria con función de densidad:
x si 0≤x ≤1
f (x) = k−x si 1≤x ≤2
0 otro caso
a Hallar el valor de k.
b Hallar la función de distribución acumulada.
c Calcular el valor esperado
d Calcular la varianza
159
3. La longitud de un estuche moldeado por inyección para una cinta magnética tiene
una distribución normal con una media de 90,2 milı́metros y desviación estándar de
0,1 milı́metros.
a ¿Cuál es la probabilidad de que la longitud de una pieza sea mayor que 90,3
milı́metros o menor que 89,7 milı́metros?
b ¿A qué valor debe ajustarse la media del proceso para que el mayor número de
partes tenga una longitud entre 89,7 y 90,3 milı́metros?
c Si se desechan los estuches cuya longitud no está entre 89,7 y 90,3 milı́metros,
¿cuál es el rendimiento del proceso para el valor de la media determinado en el
inciso b)?
160
Bibliografı́a
161