Está en la página 1de 161

UNIVERSIDAD CATÓLICA DE SANTA MARIA

FACULTAD DE CIENCIAS E INGENIERÍAS

GUIA DE ESTADISTICA Y PROBABILIDADES

Mgr. DIEGO ALONSO GUTIERREZ YANARICO


Mgr. RONNY GONZALES MEDINA

AREQUIPA - PERÚ

2011
Prólogo

La finalidad de este trabajo es la de servir como texto guı́a para el curso de Estadı́stica
y Probabilidad, ofrecido a los alumnos del Area de Ingenierı́as de la Universidad Católica
de Santa Marı́a.
Los temas aquı́ tratados son los que generalmente se dictan en un curso de Estadı́stica
y Probabilidad. Ası́, los temas son presentados y ordenados tratando de mantener una
continuidad e integración, que permitan abordar rapidamente los conceptos y herramientas
básicos en la Estadı́stica y Probabilidad; a esto último también contribuyen los ejemplos
ilustrativos que se ofrecen.
Este trabajo resume las clases del curso impartidas por los autores a los alumnos de
Ingenierı́as, durante algunos semestres anteriores, comenzo con la elaboración de pequeñas
separatas y listas de ejercicios que fueron entregadas a los alumnos durante el dictado del
curso. Aquı́, se debe agradecer las facilidades brindadas por la Facultad Ingenierı́as por las
facilidades brindadas en la elaboración de este texto y por promover este tipo de trabajos.
Finalmente, se debe advertir a los alumnos que este texto no debe sustituir a los prin-
cipales textos del tema, ni a las clases, ni a sus propios apuntes, que esperamos ahora se
puedan hacer en mejores condiciones. La lectura de la bibliografı́a sobre el tema es nece-
saria y valiosa para un mejor aprendizaje.

Arequipa, julio de 2011

2
Índice general

1. Estadı́stica Descriptiva 6
1.1. ¿Qué es la Estadı́stica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Elementos, población, muestra, caracteres . . . . . . . . . . . . . . . . . . . 7
1.3. Variables estadı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1. Clasificación de las variables . . . . . . . . . . . . . . . . . . . . . . . 8
1.4. Escalas o niveles de medición . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5. Organización de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5.1. Distribución de frecuencias . . . . . . . . . . . . . . . . . . . . . . . 10
1.5.2. Distribución de frecuencias por intervalos . . . . . . . . . . . . . . . 15
1.5.3. Distribución de frecuencias acumuladas . . . . . . . . . . . . . . . . 19
1.6. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2. Medidas de Posición y Dispersión 34


2.1. Estadı́sticos de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . 35
2.1.1. La media o media aritmética X . . . . . . . . . . . . . . . . . . . . . 35
2.1.2. La mediana Med . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.1.3. La moda Mo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.2. Estadı́sticos de posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.3. Medidas de variabilidad o dispersión . . . . . . . . . . . . . . . . . . . . . . 46
2.3.1. El Rango R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.3.2. Rango Intercuartil RI . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.3.3. Varianza y desviación estándar . . . . . . . . . . . . . . . . . . . . . 48
2.3.4. Coeficiente de variación CV . . . . . . . . . . . . . . . . . . . . . . . 49
2.4. Valores Estandarizados o Tipificados Z . . . . . . . . . . . . . . . . . . . . . 50
2.5. Asimetrı́a y apuntamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.5.1. Estadı́sticos de asimetrı́a . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.5.2. Índice basado en los tres cuartiles . . . . . . . . . . . . . . . . . . . 54
2.6. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3
3. Probabilidad 70
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.2. Experimentos y eventos aleatorios . . . . . . . . . . . . . . . . . . . . . . . 71
3.2.1. Operaciones básicas con eventos aleatorios . . . . . . . . . . . . . . . 72
3.3. Conteo de puntos muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.3.1. Variaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.3.2. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.3.3. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.4. Probabilidad de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.5. Probabilidad clásica y probabilidad geométrica . . . . . . . . . . . . . . . . 78
3.6. Probabilidad condicionada e independencia de eventos . . . . . . . . . . . . 80
3.6.1. Eventos independientes . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

4. Variables aleatorias 104


4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.2. Variable aleatoria discreta y función de probabilidad . . . . . . . . . . . . . 105
4.2.1. Función de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.2.2. Función de distribución acumulada de la v.a. discreta . . . . . . . . 107
4.3. Variable aleatoria continua y función de densidad . . . . . . . . . . . . . . . 108
4.3.1. Función de distribución acumulada de la v.a. continua . . . . . . . . 110
4.3.2. Propiedades de la función de distribución acumulada . . . . . . . . . 111
4.4. Valor esperado o esperanza matemática . . . . . . . . . . . . . . . . . . . . 112
4.4.1. Propiedades del valor esperado . . . . . . . . . . . . . . . . . . . . . 113
4.5. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.5.1. Propiedades de la varianza . . . . . . . . . . . . . . . . . . . . . . . 116
4.6. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

5. Distribuciones o modelos probabilı́sticos 130


5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
5.2. Proceso de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
5.2.1. Modelo o distribución Binomial . . . . . . . . . . . . . . . . . . . . . 131
5.2.2. Modelo o distribución Geométrica . . . . . . . . . . . . . . . . . . . 133
5.2.3. Modelo o distribución de Pascal o Binomial Negativa . . . . . . . . . 134
5.2.4. Modelo o distribución hipergeométrica . . . . . . . . . . . . . . . . . 136
5.3. Proceso de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.3.1. Modelo o distribución de Poisson . . . . . . . . . . . . . . . . . . . . 137
5.3.2. Modelo o distribución exponencial . . . . . . . . . . . . . . . . . . . 138
5.3.3. Modelo o distribución uniforme . . . . . . . . . . . . . . . . . . . . . 140

4
5.3.4. Modelo o Distribución normal . . . . . . . . . . . . . . . . . . . . . . 141
5.3.5. Propiedades de estandarización . . . . . . . . . . . . . . . . . . . . . 142
5.3.6. Propiedad de cerradura de distribución normal . . . . . . . . . . . . 142
5.4. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

Bibliografı́a 161

5
Capı́tulo 1

Estadı́stica Descriptiva

1.1. ¿Qué es la Estadı́stica?


Cuando se habla de estadı́stica, se suele pensar en una relación de datos numéricos
presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto
popular que existe sobre el término y que cada vez está más extendido debido a la influen-
cia de nuestro entorno, ya que hoy dı́a es casi imposible que cualquier medio de difusión,
periódico, radio, televisión, etc., no nos aborde diariamente con cualquier tipo de informa-
ción estadı́stica sobre accidentes de tráfico, ı́ndices de crecimiento de población, turismo,
tendencias polı́ticas, etc. Sólo cuando nos adentramos en un mundo más especı́fico como
es el campo de la investigación de las Ciencias Sociales: Medicina, Biologı́a, Psicologı́a,
... empezamos a percibir que la Estadı́stica no sólo es algo más, sino que se convierte
en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por
tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su
variabilidad intrı́nseca, no puedan ser abordadas desde la perspectiva de las leyes determi-
nisticas. Podrı́amos, desde un punto de vista más amplio, definir la estadı́stica como LA
CIENCIA QUE ESTUDIA CÓMO DEBE EMPLEARSE LA INFORMACIÓN Y CÓMO
DAR UNA GUÍA DE ACCIÓN EN SITUACIONES PRÁCTICAS QUE ENTRAÑAN
INCERTIDUMBRE. La ESTADÍSTICA se ocupa de los métodos y procedimientos para
recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la
variabilidad e incertidumbre sea una causa intrı́nseca de los mismos; ası́ como de realizar
inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso
formular predicciones. Podrı́amos por tanto clasificar la Estadı́stica en descriptiva, cuando
los resultados del análisis no pretenden ir más allá del conjunto de datos, e inferencial
cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos
más amplio.

Estadı́stica descriptiva. Describe, analiza y representa un grupo de datos utilizan-

6
do métodos numéricos y gráficos que resumen y presentan la información contenida
en ellos.

Estadı́stica inferencial. Apoyándose en el cálculo de probabilidades y a partir de


datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generaliza-
ciones sobre un conjunto mayor de datos.

1.2. Elementos, población, muestra, caracteres


Establecemos a continuación algunas definiciones de conceptos básicos y fundamentales
como son: elemento, población, muestra, carácteres, variables, etc., a las cuales haremos
referencia continuamente a lo largo del texto

1. Individuos o elementos. Personas u objetos que contienen cierta información que


se desea estudiar.

2. Población. Conjunto de individuos o elementos que cumplen ciertas propiedades


comunes.

3. Muestra. Subconjunto representativo de una población.

4. Parámetro. Función definida sobre los valores numéricos de caracterı́sticas medibles


de una población.

5. Estadı́stico. Función definida sobre los valores numéricos de una muestra. En rela-
ción al tamaño de la población, ésta puede ser:

Finita: Como es el caso del número de personas que llegan al servicio de ur-
gencia de un hospital en un dı́a;
Infinita: Si por ejemplo estudiamos el mecanismo aleatorio que describe la
secuencia de caras y sellos obtenida en el lanzamiento repetido de una moneda
al aire.

Ejemplo 1.1. Consideremos la población formada por todos los estudiantes de la


Universidad Tecnológica del Perú(finita). La altura media de todos los estudiantes es
el parámetro µ. El conjunto formado por los alumnos de la Facultad de Arquitectuta
e Ingenı́erias es una muestra de dicha población y la altura media de esta muestra,
X, es un estadı́stico.

6. Caracteres Propiedades, rasgos o cualidades de los elementos de la población. Estos


caracteres pueden dividirse en cualitativos y cuantitativos.

7
7. Modalidades Diferentes situaciones posibles de un carácter. Las modalidades deben
ser a la vez exhaustivas y mutuamente excluyentes. Cada elemento posee una y sólo
una de las modalidades posibles.

8. Clases Conjunto de una o más modalidades en el que se verifica que cada modalidad
pertenece a una y sólo una de las clases.

1.3. Variables estadı́sticas


Cuando hablemos de variable haremos referencia a un sı́mbolo (X, Y, A, B, ...) que puede
tomar cualquier modalidad (valor) de un conjunto determinado, que llamaremos dominio
de la variable o rango.

Definición 1.1. Se denomina variable estadı́stica a una caracterı́stica definida en la po-


blación por la tarea de investigación estadı́stica, que puede tomar dos o más valores (cua-
lidades o números).

Ejemplo 1.2. En la población constituida por los empleados de la universidad, algunas


variables estadı́sticas definidas en ésta población son:
X : “Sexo”. Valores: Masculino, Femenino
Y : “Estado civil”. Valores: Soltero, casado, viudo, divorciado
Z : “Número de hijos”. Valores: 0,1,2,etc.
W : “Grado de instrucción”. Valores: Analfabeto, primaria, secundaria, superior

1.3.1. Clasificación de las variables


Las variables se clasifican en cualitativas y cuantitativas. las variables cuantitativas se
clasifican en discretas o continuas.

Variables cualitativas. Cuando las modalidades posibles son no numéricas. Por


ejemplo, una variable de color:

A ∈ {“rojo”, “verde”, “azul”, ...}

Variables cuantitativas. Son las que tienen por modalidades cantidades numéricas
con las que podemos hacer operaciones aritméticas. Dentro de este tipo de variables
podemos distinguir dos grupos:

• Discretas, cuando no admiten siempre una modalidad intermedia entre dos


cualesquiera de sus modalidades. Un ejemplo es el número de caras X, obtenido
en el lanzamiento repetido de una moneda. Es obvio que cada valor de la variable
es un número natural
X∈N

8
• Continuas, cuando admiten una modalidad intermedia entre dos cualesquiera
de sus modalidades, el peso X de un niño al nacer. En este caso los valores de
las variables son números reales, es decir

X∈R

Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece como
discreta. Este es el caso en que hay limitaciones en lo que concierne a la precisión
del aparato de medida de esa variable. Si medimos la altura en metros de personas
con una regla que ofrece dos decimales de precisión, podemos obtener

X ∈ {..., 1,50, 1,51, 1,52, 1,53, ...}.

1.4. Escalas o niveles de medición


Por medición se puede entender al proceso de observación de una caracterı́stica de
interés sobre las unidades de población. Esta medición se debe expresar como un número
que informe, lo más precisamente posible, sobre la caracterı́stica en la unidad observada.
Claro está que no siempre los números informaran lo mismo, pues depende de la naturaleza
de lo observado, según esto, se tienen distintos niveles de medición o escalas, solemos
considerar cuatro niveles:

1. Nominal. Aquı́, los números solo sirven para distinguir valores o categorı́as diferen-
tes de la variable. Ejemplo. El sexo de los electores se mide a este nivel de medición
o escala. Una escala apropiada puede ser, por ejemplo:

0=femenino; 1=masculino.

En general, cualquier escala de este tipo es de la forma:

a=femenino; b=masculino

para ciertos a y b números reales, fijados previamente y con la única condición de


que sean diferentes.

2. Ordinal. Aquı́, los números, además de servir para distinguir, reflejan un orden
existente entre los valores de la variable, según el menor o mayor grado en el que
se encuentre presente la caracterı́stica. Ejemplo. El grado de instrucción del elector,
se suele medir con medir con este nivel. Para simplificar, supongamos que solo dis-
tinguimos cuatro: analfabeto, primaria, secundaria y superior. Entonces, una escala
apropiada puede ser:

9
0= analfabeto; 1= primaria; 2= secundaria; 3=superior

3. De intervalo. Además de las caracterı́sticas anteriores, se tiene que las diferencias


entre los números asignados representan propiamente cantidades de la caracterı́stica
medida. Esto se logra definiendo una unidad de medida y un cero u origen, este último
es arbitrario por no existir naturalmente, es decir, no existe un valor que indique
ausencia de la caracterı́stica que se mide. Como ejemplo tendriamos la temperatura
que se mide en una determinada ciudad

4. De razón. Aquı́, los propios números asignados en la medición ya representan can-


tidades de la caracterı́stica que se mide. Estas escalas se caracterizan, no solo por
tener una unidad de medida; sino tambén por poseer un cero absoluto u origen na-
tural, el cual significa ausencia de la caracterı́stica que se mide. Por esta razon las
proporciones entre los propios números ya representan cantidades y de allı́ el nombre
de escala de razón.

Ejemplo 1.3. Los ingresos del elector se miden con este nivel o escala, pues existe
una unidad de medida y existe el cero absoluto u origen natural, es decir, un valor
que, sin importar la escala de razón empleada, indica ausencia de ingresos.

1.5. Organización de datos


Después de la recopilación de datos, es necesario resumirlos y presentarlos en forma
tal, que faciliten su comprensión y posterior análisis y utilización. Para ello, se ordenan en
cuadros númericos y luego se representan en gráficos. Existen muchos paquetes estadı́sticos
para organizar datos. Todo cuadro númerico debe tener:

Un tı́tulo adecuado para evitar confusiones y para expresar brevemente su contenido.

La fuente de los datos, si no son datos propı̀os.

Las unidades en que se expresan los datos.

Los cuadros númericos de una sola variable estadı́stica se denominan distribución de fre-
cuencias. En el procedimiento para construir distribuciones de frecuencias nos referiremos
a muestras, mientras no se diga lo contrario.

1.5.1. Distribución de frecuencias


Se tienen dos casos, cuando la variable es cualitativa y cuando la variable es cuantita-
tiva.

10
1. Variable cualitativa.
Consideremos una población estadı́stica de n individuos, descrita según un carácter
o variable C cuyas modalidades han sido agrupadas en un número k de clases, que
denotamos mediante {C1 , C2 , ..., Ck }. Para cada una de las clases Ci , i = 1, 2, ..., k ,
introducimos las siguientes magnitudes:

Frecuencia absoluta (fi ) de la clase Ci es el número ni , de observaciones que


presentan una modalidad perteneciente a esa clase.
Frecuencia relativa (hi ) de la clase Ci es el cociente fi , entre las frecuencias
absolutas de dicha clase y el número total de observaciones, es decir:
fi
hi =
n
La suma de todas las frecuencias relativas es igual a uno. Obsérvese también que
fi es el tanto por uno de observaciones que están en la clase Ci . Multiplicado
por 100 % representa el porcentaje de la población que comprende esa clase.
Frecuencia porcentaje (pi ) de la clase Ci se define como el producto de la
frecuencia relativa hi y el 100 %, es decir:

pi = hi × 100 %.

El total de la suma de las frecuencias porcentuales es igual a cien.

Cuadro 1.1 Distribución de frecuencias de una variable cualitativa

Categorı́as de la Frecuencias abso- Frecuencias rela- Frecuencias por-


variable X lutas fi tivas hi centuales pi
C1 f1 h1 p1
C2 f2 h2 p2
... ... ... ...
Ck fk hk pk
Total n 1,00 100 %

Gráfica
Existe una gran variedad de gráficas para la distribución de frecuencias de variable
cualitativa, las más comunes son la de barras y la de sectores circulares.
En una gráfica de barras los datos de cada una de las modalidades Ci se representan
por una barra rectangular vertical (u horizontal), cuya altura (o largo) es proporcio-
nal a su frecuencia. Las barras se dibujan dejando un espacio entre ellas.
Si la escala es nominal las categorias pueden ser colocadas en cualquier orden. Pero,

11
si la escala es ordinal las categorias deben ir ordenadas. En una gráfica circular, los
datos de cada categorı́a Ci se representan por un sector circular cuyo ángulo en el
centro es igual a hi × 360o
Si la gráfica por sectores circulares es tridimensional se denomina pastel.

Ejemplo 1.4. En una encuesta de opinión acerca de la preferencia de ciertas bebidas


gaseosas por sus colores: Negro(N ), Blanco (B), Rojo (R), 20 consumidores dierón
las siguientes respuestas:

B, N, N, B, R, N, N, B, B, N,

B, N, N, R, B, N, B, R, B, N.

Construir la distribución de frecuencias. Graficar la distribución.

SOLUCIÓN.
La tabulación de estos datos, donde la variable cualitativa es X : Color de la bebida
gaseosa, es la distribución de frecuencias del siguiente cuadro
Cuadro 1.2Distribución de personas por su color preferido de una marca de bebida
gaseosa

Valores de X Frecuencias abso- Frecuencias rela- Frecuencias por-


lutas fi tivas hi centuales pi
Negro (N) 9 0.45 45
Blanco (B) 8 0.40 40
Rojo (R) 3 0.15 15
Total 20 1,00 100 %

La siguiente figura (Fig. 1.1) es la representación gráfica por medio de barrras de la


distribución de personas por el color de su bebida gaseosa

12
La figura 1.2 es la representación mediante gráfica de sectores circulares del cuadro
1.2. La frecuencia 45 % es equivalente a 0,45×360o = 162o , la frecuencia 40 % es equi-
valente a 0,40 × 360o = 144o , y la frecuencia 15 % es equivalente a 0,15 × 360o = 54o ,

2. Variable cuantitativa discreta


Suponga que se ha recolectado n valores de alguna variable discreta X. El procedi-
miento más simple de organizar n datos, consiste en ordenar estos valores numéricos
en forma ascendente.
Si todos los n datos son distintos entre si, se obtendrá una distribución de frecuencias
de n valores de la variable X, donde cada uno de estos valores tienen frecuencias
absolutas igual a uno.
Si algunos valores se repiten, y al terminar el ordenamiento se obtienen k (k ≤ n)
valores distintos de X, digamos x1 , x2 , ..., xk , con frecuencias absolutas respectivas
f1 , f2 , ..., fk , la distribución de frecuencias de estos n datos se resume en el siguiente
cuadro (cuadro 1.3.)
Cuadro 1.3 Distribución de frecuencias de una variable discreta

Valores de la va- Frecuencias abso- Frecuencias rela- Frecuencias por-


riable X lutas fi tivas hi centuales pi
X1 f1 h1 p1
X2 f2 h2 p2
... ... ... ...
Xk fk hk pk
Total n 1,00 100 %

Las frecuencias absolutas relativas y porcentajes poseen, en el caso de la variable


discreta y continua, el mismo significado y propiedades, que en el caso de la variable

13
cualitativa.

Observación. Cuando es grande el número de datos observados de una variable


discreta, su organización es engorrosa. En este caso, para resumir los datos y poder
calcular las medidas descriptivas, es conveniente seguir el método de organización de
datos de una variable continua por intervalos que se describirá mas adelante.

Grafica.
La representación gráfica más común de una distribución de frecuencias de una
variable discreta es del tipo bastón que consiste en trazar en cada valor distinto de
la variable, segmentos de recta proporcionales a su frecuencia.
También, se pueden usar barras rectangulares para graficar una distribución de fre-
cuencias de variable discreta.

Ejemplo 1.5. En una encuesta realizada a 20 familias sobre el número de hijos por
familia (variable X), se obtuvo el siguiente resultado:

2, 1, 2, 4, 1, 3, 2, 3, 2, 0,

3, 2, 1, 3, 2, 3, 3, 1, 2, 4.

Construir la distribución de frecuencias de la variable X. Graficar

Solución.
Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0,1,2,3, 4
que se repiten respectivamente 1,4,7,6,2 veces. La distribución de frecuencias de X se da
en el siguiente cuadro (cuadro 1.4.)

Cuadro 1.3 Distribución del número de hijos por familia

Número de hijos Frecuencias abso- Frecuencias rela- Frecuencias por-


Xi lutas fi tivas hi centuales pi
0 1 0.05 5
1 4 0.20 20
2 7 0.35 35
3 6 0.30 30
4 2 0.10 10
Total 20 1,00 100 %

La gráfica de bastones se da en la siguiente figura (figura1.3)

14
En la gráfica de bastones, figura 1.3, se indican las frecuencias absolutas y relativas en
cada valor distinto de la variable

1.5.2. Distribución de frecuencias por intervalos


La distribución de frecuencias por intervalos o clases se usa cuando la variable estadı́sti-
ca es continua o cuando el número de valores distintos de una variable discreta es muy
grande.
Esta distribución se obtiene diviendo el rango de variación de los datos en k intervalos
y determinando el número de datos que contiene cada intervalo (Cuadro 1.5)

Cuadro1.5. Distribución de frecuencias por intervalos

Intervalos Ii Conteos Frecuencias abso- Frecuencias rela- Frecuencias por-


lutas fi tivas hi centuales pi
I1 ///... f1 h1 p1
I2 ///... f2 h2 p2
... ... ... ... ...
Ik ///... fk hk pk
Total n 1,00 100 %

Para construir la distribución de frecuencias de intrevalos hay varios procedimientos.

15
En este texto se conviene y recomienda:

1. Elegir no más de 20 intervalos ni menos de 5, ya que muchos intervalos pueden com-


plicar innecesariamente los cálculos de las medidas descriptivas, y pocos intervalos
podrián omitir caracterı́sticas importantes de los datos. Se recomienda casi siempre
elegir intervalos de igual amplitud A.

2. El número de intervalos elegido, debe dar una distribución de frecuencias mono mo-
dal, es decir, una distribución cuyas frecuencias van aumentando progresivamente
hasta una frecuencia, máxima y luego van disminuyendo también progresivamente.

Construccı́on de la distribución de frecuencias


Dados n valores de alguna variable cuantitativa X continua (o discreta con más de 20
valores distintos) uno de de los métodos para construir la distribución de frecuencias es:

1. Determinar el rango (R) de variación de los datos que se define por

R = Xmax − Xmin

donde Xmax es el dato máximo y Xmin es el dato mı́nimo.

2. Determinar el número de intervalos, k, mediante la regla de Sturges, donde

k = 1 + 3,3log(n), n ≥ 10,

redondeando el número al entero inmediato mayor.

3. Determinar la amplitud del intervalo, dividiendo el rango entre el número de inter-


valos. Esto es,
R
A= .
k
Si la división no es exacta en el número de decimales de los datos, el número A se
aproxima por exceso de manera que se cubra todo el rango.

4. Determinar los extremos de los intervalos de la siguiente manera:

I1 = [Xmin , Xmin + A[
I2 = [Xmin , +A, Xmin , +2A[
I3 = [Xmin , +2A, Xmin , +3A[
... ...
Ik = [Xmin , +(k − 1)A, Xmin , +kA]
R
Observese que se cierra el último intervalo. Esto se debe a que si la división k es
exacta en el número de+ decimales de los datos ningun dato quedara fuera.

16
Ejemplo 1.6. Los ingresos quincenales en dólares (variable X) de 45 personas son:

63 89 36 49 56 64 59 35 78

43 53 70 57 62 43 68 62 26

64 72 52 51 62 60 71 61 55

59 60 67 57 67 61 67 51 81

53 64 76 44 73 56 62 63 60

Construir una distribución de frecuencias de 8 intervalos.

Solución:
1. De los datos, se encuentra Xmax = 89 y Xmin = 26. El rango de los datos es:
R = 89 − 26 = 63

2. El número de intervalos se elige con la regla de Sturges:

k = 1 + 3,3log(45) = 6,45 ≈ 7.

3. La amplitud del intervalo se elige a partir del valor

R 63
A= = =9
k 7

4. Los intervalos, el conteo y las frecuencias absolutas de los 45 ingresos quincenales se


dan en le siguiente cuadro (cuadro 1.6)

Cuadro 1.6 Distribución de los ingresos de 45 personas

Intervalos Ii Conteos Frecuencias abso- Frecuencias rela- Frecuencias por-


[Li−1 , Li [ lutas fi tivas hi centuales pi
[26, 35[ / 1 0.022 2.2
[35, 44[ //// 4 0.089 8.9
[44, 53[ //// 4 0.089 8.9
[53, 62[ /////////////// 15 0.333 33.3
[62, 71[ ////////////// 14 0.311 31.1
[71, 80[ ///// 5 0.111 11.1
[80, 89] // 2 0.044 4.4
Total 45 1,00 100 %

17
Marca de clase
Definición: La marca de clase del intervalo Ii = [Li−1 , Li [ es el número mi , que se define
como el punto medio del intervalo, esto es,
Li−1 + Li
mi =
2
La marca de clase es el número que representa a todos los datos contenidos en le intervalo.
Observación. Es evidente que al representar los datos tabulados en un intervalo por
sus correspondientes marcas de clase se dejan sin efecto los valores recopilados, por los
que se pierde alguna información.

Gráfica de la distribución por intervalos


Cuando las variables son continuas (o discreta con mas de 20 valores), utilizamos como
diagramas los histogramas y los polı́gonos de frecuencias.
Histograma
Se construye a partir de la tabla estadı́stica, representando sobre cada intervalo, un
rectángulo que tiene a este segmento como base. El criterio para calcular la altura de
cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o
relativas) de cada intervalo y el área de los mismos.
Polı́gono de frecuencias
Se construye fácilmente si tenemos representado previamente el histograma, ya que consis-
te en unir mediante lineas rectas los puntos del histograma que corresponden a las marcas
de clase. Para representar el polı́gono de frecuencias en el primer y último intervalo, supo-
nemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia
nula, y se unen por una lı́nea recta los puntos del histograma que corresponden a sus
marcas de clase. Obsérvese que de este modo, el polı́gono de frecuencias tiene en común
con el histograma el que las áreas de la gráficas sobre un intervalo son idénticas.

Ejemplo 1.7. Del ejemplo 1.6. graficar su histograma y su poligono de frecuencias

Solución

18
1.5.3. Distribución de frecuencias acumuladas
Con variables cualitativas a nivel nominal no tiene ningún significado las frecuencias
acumuladas

Frecuencia absoluta acumulada (Fi )


Se calcula sobre variables cuantitativas de la siguiente manera:


i
Fi = f1 + f2 + ... + fi = fj i = 1, 2, ..., k
j=1

Frecuencia relativa acumulada (Hi )


Se calcula sobre variables cuantitativas de la siguiente manera:

Fi f1 + f2 + ... + fi ∑ i
Hi = = = h1 + h2 + ... + hi = hj i = 1, 2, ..., k
n n
j=1

Frecuencia porcentaje acumulada (Pi )


Se calcula sobre variables cuantitativas de la siguiente manera:


i
Pi = p1 + p2 + ... + pi = pj i = 1, 2, ..., k
j=1

Ejemplo 1.8. El siguiente cuadro muestra las frecuencias acumuladas del número de hijos
de 20 familias

Cuadro 1.7. Distribución de frecuencias acumuladas del número de hijos por familia

Número de fi hi pi Fi Hi Pi
hijos Xi
0 1 0.05 5 1 0.05 5
1 4 0.20 20 5 0.25 25
2 7 0.35 35 12 0.60 60
3 6 0.30 30 18 0.90 90
4 2 0.10 10 20 1.00 100
Total 20 1,00 100 %

El valor 12 de F3 significa que existen 12 familias que tienen 2 hijos o menos, o que el
60 % de las familias tienen 2 hijos o menos

Gráfica: Las siguientes figuras, figuras 1.5(a) y 1.5(b), representan la distribución


de frecuencias acumuladas y relativas respectivamente, “menor o igual que”del número de
hijos por familia del cuadro 1.7.

19
Observación. Las figuras 1.5 son en realidad son en realidad de una distribución de-
nominada función de distribución acumulada (FDA).

Por ejemplo, la figura 1.5(b) donde las frecuencias relativas, corresponden FDA que
sigue: 

 0 si x<0



 0,05 si 0 ≤ x < 1



 0,25 si 1 ≤ x < 2
H(x) =

 0,60 si 2 ≤ x < 3



 0,90 si 3 ≤ x < 4



 1 si x≥4
En general, si las variable discreta X tiene valores distintos x1 , x2 , ..., xk con frecuencias
relativas respectivas h1 + h2 + ... + hk , entonces, su FDA menor o igual que x para x ∈ R,
se define por:


 0 si x < x1
 i

 ∑
H(x) = hj si xi ≤ x < xi+1 , i = 1, 2, ..., k − 1



 j=1

1 si x ≥ xk
Si la distribución de frecuencias es de intervalos, la frecuencia acumulada de cada in-
tervalo es la suma de las frecuencias (absolutas, relativas o porcentajes) hasta ese intervalo.

20
Gráfica (caso continuo)
La mas usada es el poligono de frecuencias acumuladas, conocida también como ojiva. La
ojiva, se obtiene uniendo con segmentos de recta, los puntos cuya abscisa es proporcional
al lı́mite superior (Li ) de cada intervalo y cuya ordenada es proporcional a la frecuencia
acumulada respectiva (absoluta, relativa, porcentaje).
En el siguiente cuadro (cuadro 1.8.) se presentan las frecuencias acumuladas de los
ingresos quincenales de 45 personas que corresponde al cuadro 1.6.

Cuadro 1.8. Distribución de frecuencias acumuladas de ingresos

Intervalos fi hi pi Fi Hi Pi
[Li−1 ; Li [
[26, 35[ 1 0.022 2.2 1 0.022 2.2
[35, 44[ 4 0.089 8.9 5 0.111 11.1
[44, 53[ 5 0.111 11.1 10 0.222 22.2
[53, 62[ 14 0.311 31.1 24 0.533 53.3
[62, 71[ 14 0.311 31.1 38 0.844 84.4
[71, 80[ 5 0.111 11.1 43 0.956 95.6
[80, 89[ 2 0.044 4.4 45 1.00 100
Total 45 1,00 100 %

La figura siguiente (figura 1.6) representa la ojiva de la distribución de los ingresos quin-
cenales de 45 personas

21
Curva de frecuencias
Una curva de frecuencias se obtiene del poligono de frecuencias “suavizando”sus puntos
angulosos. En el proceso de suavización se recomienda tener en cuenta que la “porción”de
área que se descarta deberá ser proporcional a la “porción”de área que se incluye en el
interior de la gráfica La siguiente figura (figura 1.7) es una curva de frecuencias.

Las curvas de frecuencias pueden tener una gran variedad de formas. Algunas de ellas
son las siguientes:

Distribuciones Simétricas
Las curvas simétricas son de 3 tipos:

Normal o mesocúrtica

Platicúrtica

Leptocúrtica

La siguiente figura (figura 1.8) muestra estos tres casos

22
Distribuciones Asimétricas
Las curvas asimétricas pueden ser de dos tipos:

Asimétricas positivas ( o de cola a la derecha)

Asiméticas negativas (o de cola a la izquierda)

La siguiente figura (figura 1.9) muestra estos dos casos

1.6. Ejercicios resueltos


1. Ejercico 1
Clasificadas 12 familias por su número de hijos se obtuvo:

Núemro de hijos X 1 2 3 4
Frecuencias fi 1 3 5 3

Comparar los diagramas de barras para frecuencias absolutas y relativas. Graficar


la función de distribución acumulada.
Solución
En primer lugar, escribimos la tabla de frecuencias en el modo habitual:

Variable X Frecuencias abso- Frecuencias rela- Frecuencias por-


lutas fi tivas hi centuales pi
xi fi hi pi
1 1 0.083 1
2 3 0.250 4
3 5 0.416 9
4 3 0.250 12
Total 12 1,00

Con las columnas relativas a xi y fi realizamos el diagrama de barras para fre-


cuencias absolutas, lo que se muestra en la siguiente figura. Como puede verse es

23
identico (salvo un cambio de escala en el eje de ordenadas) al diagrama de barras
para frecuencias relativas y que ha sido calculado usando las columnas de xi y hi . El
diagrama escalonado (acumulado) se ha construido con la información procedente
de las columnas xi y Fi .

2. Ejercicio 2
La siguiente distribución se refiere a la duración en horas (completas) de un lote de
500 tubos:

Duración en horas Número de tubos


[300,500[ 50
[500,700[ 150
[700,1100[ 275
más de 1100 25
Total 500

Representar el histograma de frecuencias relativas y el polı́gono de frecuencias.


Trazar la curva de frecuencias relativas acumuladas.
Determinar el número mı́nimo de tubos que tienen una duración inferior a 900
horas.

Solución.
En primer lugar observamos que la variable en estudio es discreta (horas completas),
pero al tener un rango tan amplio de valores resulta más conveniente agruparla en

24
intervalos, como si de una variable continua se tratase. La consecuencia es una ligera
perdida de precisión.
El último intervalo está abierto por el lı́mite superior. Dado que en él hay 25 ob-
servaciones puede ser conveniente cerrarlo con una amplitud “razonable”. Todos los
intervalos excepto el tercero tienen una amplitud de 200 horas, luego podrı́amos ce-
rrar el último intervalo en 1300 horas
Antes de realizar el histograma conviene hacer una observación importante. El his-
tograma representa las frecuencias de los intervalos mediante áreas y no mediante
alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas tenien-
do en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es
necesario diferenciar entre los conceptos de área y altura, pero en este caso el tercer
intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su área
en un rectángulo de base doble (lo que reduce su áltura a la mitad).
Ası́ será conveniente añadir a la habitual tabla de frecuencias una columna que repre-
sente a las amplitudes de cada intervalo, y otra de frecuencias relativas rectificadas,
gi , para representar la altura del histograma. Los gráficos requeridos se representan
en las figuras siguientes.

Intervalos Amplitud Frecuencias Frecuencias Frecuencias re- Frecuencias


[Li−1 , Li [ absolutas fi relativas hi lativa rectifica- absolutas
da gi acumuladas Fi
[300, 500[ 200 50 0.10 0.10 0.10
[500, 700[ 200 150 0.30 0.30 0.40
[700, 1100[ 400 275 0.55 0.275 0.95
[1100, 1300] 200 25 0.05 0.05 1.00
Total 500 1,00

Figura: Histograma. Obsérvese que la altura del histograma en cada intervalo es


gi que coincide en todos con hi salvo en el intervalo [700, 1100[ en el que ya que la
amplitud de ese intervalo es doble a la de los demás.

25
Por otro lado, mirando el histograma se ve que sumando frecuencias relativas, hasta
las 900 horas de duración hay

0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos.

Esta cantidad se obtiene de modo más directo viendo a qué altura corresponde al
valor 900 en el diagrama de frecuencias acumuladas (ojiva).
Como en total son 500 tubos, el número de tubos con una duración igual o menor
que 900 horas es 0,675 × 500 = 337,5, redondeando, 338 tubos.

26
1.7. Ejercicios propuestos
1. a Número de teléfono celular.
b Puntaje en un examen de un curso el la escuela de Ingenierı́a de Sistemas e
Informática.
c Puesto en el examen de ingreso.
d Tiempo de reacción ante un estimulo visual.
e Intención de voto para las próximas elecciones de alcalde.
f Pérdida de peso, en kilogramos, de los corredores en la Maratón de Huancayo.
g Número de DNI.
h Ingreso mensual familiar.
i Dirección de una vivienda.
j Número de botes que da una pelota al ser lanzada de una cierta altura.

2. Para cada uno de los siguientes problemas:

a Identificar: población, muestra, unidad estadı́stica, variable y tipo de variable.


b Clasificar los datos en una tabla de distribución de frecuencias, usar el criterio de
Sturges cuando sea necesario.
c Interpretar: f2 , h3 , h1 , F4 , H3 , p2 , P4 .

2.1 Una empresa que vende microcomputadoras ha llevado a cabo un estudio para
analizar el número de microcomputadoras que existen en pequeñas empresas
del distrito A. Para el efecto toma una muestra aleatoria de 40 empresas en-
contrando los siguientes resultados:

5 7 9 7 8 5 4 4 3 7

8 4 9 6 8 7 6 9 8 4

6 4 7 4 3 5 8 5 9 6

7 9 4 7 5 8 7 9 6 8

2.2 Un experto en computadoras, tratando de optimizar la operación de un sistema,


reunió datos sobre el tiempo, en microsegundos, entre las solicitudes de servicio
de un proceso especial.

2, 81 4, 20 3, 85 9, 11 2, 08 5, 91 1, 62 6, 72 21, 66

27
3, 07 2, 95 8, 77 4, 73 9, 21 14, 21 1, 58 9, 85 78, 81

6, 65 1, 80 7, 01 1, 89 4, 23 6, 58 4, 74 8, 53 10, 56

43, 00 16, 72 2, 61 26, 46 34, 87 4, 19 4, 03 2, 78 28, 84

2.3 La confiabilidad de un sistema de cómputo se mide en términos de la vida de un


componente de hardware especı́fico (por ejemplo, la unidad de disco).Se prueba
un conjunto componentes de computadora hasta que fallen, y se registra su vida
(en meses).

12 18 5 2 8 24 17 5 9 15

27 35 18 14 3 9 15 20 24 27

30 22 21 17 20 36 28 23 12 11

22 32 37 40 28 36 35 39 12 19

28 20 15 6 4 12 16

2.4 El tiempo de respuesta de computadora se define como el tiempo que un usuario


debe esperar mientras la computadora accede a información en el disco. Se
observaron aleatoriamente un grupo de 48 computadoras del Laboratorio de
Ingenierı́a de Sistemas y se obtuvo los siguientes resultados (en milisegundos):

59 92 54 48 73 60 73 75 74 84

33 61 71 38 47 53 63 48 41 68

60 44 39 34 75 86 72 50 47 52

65 68 70 47 40 36 70 38 40 52

60 50 90 84 72 88 49 40

2.5 En fechas recientes se recabaron datos correspondientes a la velocidad MHz de


50 computadoras elegidas al azar en las oficinas de la UTP.

33 25 20 33 25 16 16 16 16 20

12 20 33 33 20 33 20 12 25 20

33 25 16 25 33 25 20 20 20 20

12 25 16 16 20 16 25 20 25 16

28
3. Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en
el año 2002 son los siguientes:

440 560 335 587 613 400 424 466 565 393

453 650 407 376 470 560 321 500 528 526

570 430 618 537 409 600 550 432 591 428

440 340 558 460 560 607 382 667 512 492

450 530 501 471 660 470 364 634 580 450

574 500 462 380 518 480 625 507 645 382

a Construya la tabla de frecuencias.


b Identifique la población, muestra y la variable con su tipo de escala.

4. Se distribuye el número de empresas según sus inversiones en millones de soles.

[Li−1 , Li [ fi
[4,10[ 1
[10,16[ 3
[16,22[ 6
[22,28[ 12
[28,34[ 11
[34,40[ 5
[40,46] 2

¿Cuántas empresas intervienen en menos de 25 millones de soles?

5. Se tiene las temperaturas observadas en el hemisferio norte durante 24 dı́as en ◦ C.

[Li−1 , Li [ fi hi
[-19,-17[
[-17,-15[ 2
[-15,-13[ 8
[-13,-11[ 0.125
[-11,-9[ 4
[-9,-7] 0.2083

¿Durante cuántos dı́as se obtuvo una temperatura de -16 a -10?

29
6. Completar la tabla de distribución para una muestra de 4308 elementos, si se sabe
que a partir de la segunda frecuencia absoluta se cumple que cada frecuencia es la
quinta parte de la anterior más dos. Además se conoce que:

k = 5 X1 = 60 X4 = 105

7. Dada la siguiente distribución de frecuencias:

[Li−1 , Li [ fi Fi hi Hi
[30, 50[ m n 0.15 z
[50,70[ p q w a
[70,90[ r s 0.25 b
[90,110[ 10 u x 0.7
[110,130] 30 v y

Hallar:

a m+n
b r−p+a

8. La compañı́a ABC, muestreó sus registros de embarque durante cierto dı́a, obtenien-
do los siguientes resultados con respecto al tiempo transcurrido desde la recepción
de la orden hasta la entrega (en dı́as).

20 12 5 8 19 14 10 11 15 6

24 7 7 13 29 13 6 4 11 11

a ¿Qué afirmación puede hacer sobre la eficacia del procesamiento de pedidos a


partir de la distribución de frecuencias?
b Si la compañı́a quiere asegurarse de que la mitad de sus entregas se realicen en diez
o menos dı́as, ¿puede usted determinar mediante la distribución de frecuencias
si la compañı́a ha alcanzado su meta?

9. En una fábrica se sabe que el jornal mı́nimo es S/115, si se conoce además que:
20 obreros ganan por lo menos S/155, pero menos de S/165 68 obreros ganan por
lo menos S/145; 106 obreros ganan por lo menos S/135; 135 obreros ganan por lo
menos S/125 y el restante 10 % de los obreros ganan menos de S/125. Además se
sabe que el rango es 50. Completar la tabla de distribución de frecuencias.

10. Una compañı́a tiene 60 trabajadores. El sueldo mı́nimo de un trabajador es $100 y


el máximo $590 mensuales. El 80 % de los trabajadores ganan por lo menos $210;

30
18 perciben haberes inferiores a $390 mensuales; 20 % son profesionales y reciben
un haber de por lo menos $490 mensuales. Construir la tabla de distribución de
frecuencias relativas.

11. La tabla muestra la distribución del ingreso familiar correspondiente a 80 familias.

[Li−1 , Li [ fi Fi hi
[160,170[
[170,180[ 48 60
[180,190[ 0.125
[190,200[ 0.075
[200,210]

Determinar el número de familias que ganan menos de 200 nuevos soles.

12. Se revisaron 20 lotes de 48 artı́culos cada uno y se encontró el siguiente número de


artı́culos defectuosos por lote:

3 2 5 0 1 3 2 1 0 1 3 4 2 4 4 4 3 3 2 3

Construir el cuadro de distribución de frecuencias y ¿qué porcentaje de lotes tienen


2 o más pero menos de 4 artı́culos defectuosos?

13. En una prueba de estadı́stica se evaluaron a “n” estudiantes y se obtuvo el siguiente


cuadro estadı́stico.

Marca de clase 45 55 65 75 85
2n 3n n 3n n
Frcuencia relativa 25 100 50 50 100

¿Qué porcentaje de estudiantes obtuvieron una nota menor que 60 puntos o mayor
o igual a 80 puntos?

14. Dada la siguiente distribución de frecuencias en base al ingreso familiar de 200 fa-
milias.

[Li−1 , Li [ fi Fi
[ , [ 12
[ ,270[
[ ,300[ 30 90
[ , [ 126
[330, ]
[ , ] 50

31
¿Cuántas familias tienen un ingreso comprendido entre 260 y 320?

15. Se tiene la siguiente distribución simétrica:

[Li−1 , Li [ fi Fi hi
[ , [ 8
[ 12 , [
[ , [ 0.2
[ , 24 [ 17
[ , ]

Si el ancho de clase es constante. ¿Cuántos datos habrá en el intervalo [12 - 20[?

16. Los tiempos de vida útil (en dı́as) de un tipo de bacteria, se tabuló en una distribución
de frecuencias de 5 intervalos de igual amplitud con frecuencias relativas acumuladas:
0.10; 0.25; 0.55; 0.80; 1.00. Determine la distribución de frecuencias absolutas, si la
tercera frecuencia absoluta acumulada es 11, si la segunda marca de clase es 6, y si
el lı́mite inferior del cuarto intervalo es 12.

17. En una fábrica se sabe que el jornal mı́nimo es S/115, si se conoce además que:
20 obreros ganan por lo menos S/155, pero menos de S/165 68 obreros ganan por
lo menos S/145; 106 obreros ganan por lo menos S/135; 135 obreros ganan por lo
menos S/125 y el restante 10 % de los obreros ganan menos de S/125. Además se
sabe que el rango es 50. Completar la tabla de distribución de frecuencias.

18. La compañı́a ABC, muestreó sus registros de embarque durante cierto dı́a, obtenien-
do los siguientes resultados con respecto al tiempo transcurrido desde la recepción
de la orden hasta la entrega (en dı́as).

20 12 5 8 19 14 10 11 15 6

24 7 7 13 29 13 6 4 11 11

a ¿Qué afirmación puede hacer sobre la eficacia del procesamiento de pedidos a


partir de la distribución de frecuencias?
b Si la compañı́a quiere asegurarse de que la mitad de sus entregas se realicen en diez
o menos dı́as, ¿puede usted determinar mediante la distribución de frecuencias
si la compañı́a ha alcanzado su meta?

19. El consumo mensual de agua de 150 hogares, se tabularon en una distribución de


frecuencias simétrica de 6 intervalos, siendo las frecuencias f2 = 25, F3 = 75, F5 =
130. Si el lı́mite inferior del sexto intervalo es igual a 60, y si el 75 % de los consumos
son mayores de 42,5m3 , Completar la distribución de frecuencias.

32
20. Una compañı́a tiene 60 trabajadores. El sueldo mı́nimo de un trabajador es $100 y
el máximo $590 mensuales. El 80 % de los trabajadores ganan por lo menos $210;
18 perciben haberes inferiores a $390 mensuales; 20 % son profesionales y reciben
un haber de por lo menos $490 mensuales. Construir la tabla de distribución de
frecuencias relativas.

33
Capı́tulo 2

Medidas de Posición y Dispersión

Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto
a una medida que indique el valor alrededor del cuál se agrupan los datos, se asocie una
medida que haga referencia a la variabilidad que refleje dicha fluctuación. En este sentido
pueden examinarse varias caracterı́sticas, siendo las más comunes:

La tendencia central de los datos;

La dispersión o variación con respecto a este centro;

Los datos que ocupan ciertas posiciones.

La simetrı́a de los datos.

La forma en la que los datos se agrupan.

34
A lo largo de este capı́tulo, y siguiendo este orden, iremos estudiando los estadı́sticos
que nos van a orientar sobre cada uno de estos niveles de información: valores alrededor de
los cuales se agrupa la muestra, la mayor o menor fluctuación alrededor de esos valores, nos
interesaremos en ciertos valores que marcan posiciones caracterı́sticas de una distribución
de frecuencias ası́ como su simetrı́a y su forma.

2.1. Estadı́sticos de tendencia central


Las tres medidas más usuales de tendencia central son:

La media,

La mediana,

La moda.

2.1.1. La media o media aritmética X


La media aritmética de una variable estadı́stica es la suma de todos sus posibles valores,
ponderada por las frecuencias de los mismos. Es decir, si la tabla de valores de una variable
X es
X fi hi
x1 f1 h1
... ... ...
xk fk hk

la media es el valor que podemos escribir de las siguientes formas equivalentes:

X = x1 h1 + ... + xk hk
1
= (x1 f1 + ... + xk fk )
n
1∑
k
= xi fi
n
i=1

Si los datos no están ordenados en una tabla, entonces


x1 + ... + xn
X=
n
Observación
Hemos supuesto implı́citamente en la definición de media que tratábamos con una variable
X discreta. Si la variable es continua tendremos que cambiar los valores de xi por las
marcas de clase correspondientes. En general, la media aritmética obtenida a partir de
las marcas de clase mi , diferirá de la media obtenida con los valores reales, xi . Es decir,

35
habrá una pérdida de precisión que será tanto mayor cuanto mayor sea la diferencia entre
los valores reales y las marcas de clase, o sea, cuanto mayores sean las longitudes ai , de
los intervalos.

Ejemplo 2.1. Calcular la media aritmética de la distribución de frecuencias de los 45


ingresos quincenales del ejemplo 1.6

Solución
Del cuadro 1.6 tenemos:

1∑
k
2702
X= mi fi = = $60,04
n 45
i=1

Proposición 2.1. Dados r grupos con n1 , n2 , ..., nr observaciones y siendo X 1 , X 2 ,...,X r


las respectivas medias de cada uno de ellos. Entonces la media de las n = n1 + n2 + ... + nr
observaciones es
n1 X 1 + ... + nr X r
X=
n1 + ... + nr
Observación
A pesar de las buenas propiedades que ofrece la media, ésta posee algunos inconvenientes:

a Uno de ellos es que es muy sensible a los valores extremos de la variable: ya que todas las
observaciones intervienen en el cálculo de la media, la aparición de una observación
extrema, hará que la media se desplace en esa dirección. En consecuencia,

b No es recomendable usar la media como medida central en las distribuciones muy


asimétricas;

c Depende de la división en intervalos en el caso de variables continuas.

d Si consideramos una variable discreta, por ejemplo, el número de hijos en las familias
de Arequipa el valor de la media puede no pertenecer al conjunto de valores de la
variable; Por ejemplo X = 2,5 hijos.

2.1.2. La mediana Med


Consideramos una variable discreta X cuyas observaciones en una tabla estadı́stica
han sido ordenadas de menor a mayor. Llamaremos mediana, Med , al primer valor de la
variable que deja por debajo de sı́ al 50 % de las observaciones.
La mediana es la medida promedio que depende del número de datos ordenados y no
de los valores de estos datos.

Ejemplo 2.2. Calcular la mediana para la siguiente serie de datos

36
a 120 3 14 1 99 7 30 2000 16

b 30 77 3 300 36 11 10000 29

Solución

a La serie ordenada de los nueve datos es:

1 3 7 14 16 30 99 120 2000

La mediana es el quinto dato ordenado que divide a la serie en 2 grupos de 4 datos


cada uno. Esto es Med = 16.

b La serie ordenada de los ocho datos es:

3 11 29 30 36 77 300 10000

La mediana en este caso, puede ser cualquier número situado entre 30 y 36, ya que
este dividirá a los datos en dos grupos de 4 datos cada uno. Pero, para evitar la
infinidad de valores, se elige como mediana la semisuma de los dos valores centrales.
Esto es, Med = 30+362 .

Mediana de datos tabulados


- Si los valores de una variable se tabulan en una distribución de frecuencias por intervalos
el cálculo de la mediana se determina aproximadamente por interpolación a partir de la
distribución de frecuencias acumuladas

Para calcular la mediana.

Primero se determina el intervalo Ii = [Li−1 , Li [ que contiene a la mediana. Para esto,


se determina las frecuencias acumuladas Fi y Fi−1 de manera que:
n
Fi−1 ≤ < Fi
2
La mediana Med ∈ [Li−1 , Li [ intervalo de amplitud A, cuya frecuencia absoluta acumulada
es Fi y la frecuencia absoluta es fi .

Segundo Se aplica la siguiente formula para el calculo de la mediana:


n
2 − Fi−1
Med = Li−1 + A
fi

37
Si en lugar de las frecuencias absolutas se utilizan las relativas (o porcentajes), enton-
ces, haciendo hi = fni , Hi = Fi−1
n en la fórmula de la mediana, se tiene:

1
2 − Hi−1
Med = Li−1 + A
hi

Observación
Entre las propiedades de la mediana, vamos a destacar las siguientes:

Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones
extremas, ya que no depende de los valores que toma la variable, sino del orden de
las mismas. Por ello es adecuado su uso en distribuciones asimétricas.

Es de cálculo rápido y de interpretación sencilla.

A diferencia de la media, la mediana de una variable discreta es siempre un valor de


la variable que estudiamos (ej. La mediana de una variable número de hijos toma
siempre valores enteros).

Es función de los intervalos escogidos.

Ejemplo 2.3. Obtener la media aritmética y la mediana en la distribución adjunta. De-


terminar gráficamente cuál de los dos promedios es más significativo.

38
[Li−1 , Li [ fi
[ 0 , 10 [ 60
[ 10 , 20 [ 80
[ 20 , 30 [ 30
[ 30 , 100 [ 20
[ 100 , 500 ] 10

Solución

[Li−1 , Li [ fi A m mfi Fi
[ 0 , 10 [ 60 10 5 300 60
[ 10 , 20 [ 80 10 15 1200 140
[ 20 , 30 [ 30 10 25 750 170
[ 30 , 100 [ 20 70 65 1300 190
[ 100 , 500 ] 10 400 300 3000 200
Total 200 6550

La media aritmética es:


1∑
k
6550
X= mi fi = = 32,75
n 200
i=1

n
La primera frecuencia absoluta acumulada que supera el valor 2 = 100 es Fi = 140. Por
ello el intervalo que contiene a la mediana es [10,20[.Asi:

n
− Fi−1 200
− 60
Med = Li−1 + 2
A = 10 + 2
× 10 = 15
fi 80

Para ver la representatividad de ambos promedios, realizamos el histograma en la siguiente


figura , y observamos que dada la forma de la distribución, la mediana es más representa-
tiva que la media.

39
2.1.3. La moda Mo
Llamaremos moda a cualquier máximo relativo de la distribución de frecuencias, es
decir, cualquier valor de la variable que más veces se repite.
La moda no siempre existe y si existe, no siempre es única.

Ejemplo 2.4. La moda de los datos:

a 7 9 7 8 7 4 7 13 7 es igual a 7. Esta serie de datos es unimodal.

b 5 3 4 5 7 3 5 6 3 es igual tanto a 3, como a 5. Esta serie de datos es bimodal.

c 31 11 12 19 no existe. (También vale decir que cada uno de los datos es una moda).

Moda de datos tabulados por intervalos


En el caso de variables continuas (o discretas por intervalos) es más correcto hablar de
intervalos modales. Una vez que este intervalo, [li−1 , Li [, se ha obtenido, se utiliza la
siguiente fórmula para calcular la moda:
( )
d1
Mo = Li−1 + A,
d1 + d2

donde:
Li−1 : es el limite inferior del intervalo modal
d1 = fi − fi−1 , esto es, d1 es igual a la frecuencia absoluta modal menos la frecuencia
absoluta del intervalo inmediatamente anterior.
d2 = fi − fi+1 , esto es, d2 es igual a la frecuencia absoluta modal menos la frecuencia
absoluta del intervalo inmediatamente posterior.
A: es la amplitud del intervalo modal.

Observación

a Es muy fácil de calcular.

b Puede no ser única.

c Es función de los intervalos elegidos a través de su amplitud, número y lı́mites de los


mismos.

d Aunque el primero o el último de los intervalos no posean extremos inferior o superior


respectivamente, la moda puede ser calculada.

Relación entre media, mediana y moda


En el caso de distribuciones unimodales, la mediana está con frecuencia comprendida entre
la media y la moda (incluso más cerca de la media). En distribuciones que presentan cierta

40
inclinación, es más aconsejable el uso de la mediana. Sin embargo en estudios relacionados
con propósitos estadı́sticos y de inferencia suele ser más apta la media.

Veamos un ejemplo de cálculo de estas tres magnitudes.

Ejemplo 2.5. Consideramos una tabla estadı́stica relativa a una variable continua, de la
que nos dan los intervalos, las marcas de clase mi , y las frecuencias absolutas, fi .

[Li−1 , Li [ mi fi
[0,2[ 1 2
[2,4[ 3 1
[4,6[ 5 4
[6,8[ 7 3
[ 8 , 10 ] 9 2

Solución
Para calcular la media podemos añadir una columna con las cantidades mi fi . La suma de
los términos de esa columna dividida por n = 12 es la media:

[Li−1 , Li [ mi fi Fi mi fi
[0,2[ 1 2 2 2
[2,4[ 3 1 3 3
[4,6[ 5 4 7 20
[6,8[ 7 3 10 21
[ 8 , 10 ] 9 2 12 18
Total 12 64

1∑
k
64
X= mi fi = = 5,33
n 12
i=1

La mediana es el valor de la variable que deja por debajo de sı́ a la mitad de las n obser-
vaciones, es decir 6. Construimos la tabla de las frecuencias absolutas acumuladas, Fi , y
vemos que eso ocurre en la modalidad tercera, es decir,

i=3
[Li−1 , Li [= [4, 6[ Intervalo donde se encuentra la mediana
n
−Fi−1 12
−3
Med = Li−1 + 2
fi A=4+ 2
4 × 2 = 5,5

Para el cálculo de la moda, lo primero es encontrar los intervalos modales, buscando


los máximos relativos en la columna de las frecuencias absolutas, fi . Vemos que hay dos
modas, correspondientes a las modalidades i = 1, i = 3. En el primer intervalo modal,

41
[L0 , L1 [= [0, 2[, la moda se calcula como
( ) ( )
d1 2−0
Mo = Li−1 + A=0+ × 2 = 1,33
d1 + d2 (2 − 0) + (2 − 1)

En el segundo intervalo modal, [L2 , L3 [= [4, 6[, la moda se calcula como


( ) ( )
d1 4−1
Mo = Li−1 + A=4+ × 2 = 5,5
d1 + d2 (4 − 1) + (4 − 3)

En este caso, como se ve en la siguiente figura, la moda no toma un valor único, sino el
conjunto Mo = {1,33, 5,5}

2.2. Estadı́sticos de posición


Para una variable discreta, se define el percentil de orden k, como la observación, Pk ,
que deja por debajo de si el k % de la población. Esta definición nos recuerda a la mediana,
pues como consecuencia de la definición es evidente que Med = P50 . En el caso de una
variable continua, el intervalo donde se encuentra Pk ∈ [Li−1 , Li [, se calcula buscando el
que deja debajo de si al k % de las observaciones. Dentro de él, Pk se obtiene según la
relación:
n k − Fi−1
Pk = Li−1 + 100 A
fi
Por su propia naturaleza, el percentil puede estar situado en cualquier lugar de la distri-
bución, por lo que no puede considerarsele como una medida de tendencia central.

42
Los cuartiles, Qi , son un caso particular de los percentiles. Hay 3, y se definen como:

Q1 = P25
Q2 = P50 = Med
Q3 = P75

De forma análoga se definen los deciles como los valores de la variable que dividen a las
observaciones en 10 grupos de igual tamaño. Más precisamente, definimos D1 , D2 , ..., D9
como:
Di = P10 , i = 1, ..., 9

Los percentiles (que incluyen a la mediana, cuartiles y deciles) también son denominados
estadı́sticos de posición.

Ejemplo 2.6. Dada la siguiente distribución en el número de hijos de cien familias, hallar
sus cuartiles.
xi fi Fi
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
Total 100
Solución

n n
1. Primer cuartil: 4 = 25; Primer Fi > 4 = 39; luego Q1 = 2
2n 2n
2. Segundo cuartil: 4 = 50; Primer Fi > 4 = 65; luego Q2 = 3
3n 3n
3. Tercer cuartil: 4 = 75; Primer Fi > 4 = 85; luego Q3 = 4

Ejemplo 2.7. Calcular los cuartiles en la siguiente distribución de una variable continua:

[Li−1 , Li [ fi Fi
[0,1[ 10 10
[1,2[ 12 22
[2,3[ 12 34
[3,4[ 10 44
[4,5] 7 51
Total 51

43
Solución

1. Primer cuartil:
n n
4 = 12,75; Primer Fi > 4 = 22; luego la linea i es la del intervalo [1,2[
n
− Fi−1 12,75 − 10
Q1 = P25 = Li−1 + 4
A=1+ × 1 = 1,23
fi 12
2. Segundo cuartil:
2n 2n
4 = 25,5; Primer Fi > 4 = 34; luego la linea i es la del intervalo [2,3[

2n
− Fi−1 25,5 − 22
Q2 = P50 = Li−1 + 4
A=2+ × 1 = 2,29
fi 12
3. Tercer cuartil:
3n 3n
4 = 38,25; Primer Fi > 4 = 44; luego la linea i es la del intervalo [3,4[

3n
− Fi−1 38,25 − 34
Q3 = P75 = Li−1 + 4
A=3+ × 1 = 3,445
fi 10
Ejemplo 2.8. Han sido ordenados los pesos de 21 personas en la siguiente tabla:

[Li−1 , Li [ fi
[ 38 , 45 [ 3
[ 45 , 52 [ 2
[ 52 , 59 [ 7
[ 59 , 66 [ 3
[ 66 , 73 ] 6
Total 21

Encontrar aquellos valores que dividen a los datos en 4 partes con el mismo número de
observaciones.
Solución
Las cantidades que buscamos son los tres cuartiles: Q1 , Q2 y Q3 . Para calcularlos, le
añadimos a la tabla las columnas con las frecuencias acumuladas, para localizar qué in-
tervalos son los que contienen a los cuartiles buscados:

[Li−1 , Li [ fi Fi
[ 38 , 45 [ 3 3
[ 45 , 52 [ 2 5
[ 52 , 59 [ 7 12 Q1 , Q2
[ 59 , 66 [ 3 15
[ 66 , 73 ] 6 21 Q3
Total 21

44
Q1 y Q2 se encuentran en el intervalo [52,59[, ya que F3 = 12 es la primera frecuencia de
distribución acumulada que supera a n4 y 2n
4 .
Q3 esta en [66,73[, pues F5 = 21 es es la primera frecuencia de distribución acumulada
que supera a 3n 4

Ası́ se tiene que::


n
− Fi−1 5,25 − 5
Q1 = P25 = Li−1 + 4
A = 52 + × 7 = 52,25
fi 7
2n
− Fi−1 10,5 − 5
Q2 = P50 = Li−1 + 4
A = 52 + × 7 = 57,5
fi 7
3n
− Fi−1 15,75 − 15
Q3 = P75 = Li−1 + 4
A = 66 + × 7 = 66,875
fi 6
Obsérvese que Q2 = Med . Esto es lógico, ya que la mediana divide a la distribución en dos
partes con el mismo número de observaciones, y Q2 , hace lo mismo, pues es deja a dos
cuartos de los datos por arriba y otros dos cuartos por abajo.

Ejemplo 2.9. La distribución de una variable tiene por polı́gono acumulativo de frecuen-
cias el de la siguiente figura. Si el número total de observaciones es 50:

a Elaborar una tabla estadı́stica con los siguientes elementos: intervalos, marcas de clase,
frecuencia absoluta, frecuencia absoluta acumulada, frecuencias relativa y frecuencias
relativa acumulada

b Calcule la moda

c Determine los cuartiles

45
Solución

a En la siguiente tabla se proporciona la información pedida y algunos cálculos auxiliares


que nos permitirán responder a otras cuestiones

[Li−1 , Li [ fi Fi hi Hi mi A
[0,5[ 10 10 0.2 0.3 2.5 5
[5,7[ 25 35 0.5 0.7 6 2
[ 7 , 12 [ 5 40 0.1 0.8 9.5 5
[ 12 , 15 ] 10 50 0.2 1 13.5 7
Total 50

b Calculemos la moda:
( ) ( )
d1 1
Mo = Li−1 + A=5+ × 2 = 5,66
d1 + d2 2+1

c n
− Fi−1 12,5 − 10
Q1 = P25 = Li−1 + 4
A=5+ × 2 = 5,2
fi 25
2n
− Fi−1 25 − 10
Q2 = P50 = Li−1 + 4
A=5+ × 2 = 6,2
fi 25
3n
− Fi−1 37,5 − 35
Q3 = P75 = Li−1 + 4
A=7+ × 5 = 9,5
fi 5

2.3. Medidas de variabilidad o dispersión


Los estadı́sticos de tendencia central o posición nos indican donde se sitúa un grupo de
puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o valores
están próximas entre sı́ o si por el contrario están o muy dispersas.

Una medida razonable de la variabilidad podrı́a ser la amplitud o rango, que se obtiene
restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil
de calcular y sus unidades son las mismas que las de la variable, aunque posee varios
inconvenientes:

No utiliza todas las observaciones (sólo dos de ellas);

Se puede ver muy afectada por alguna observación extrema;

El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier


caso nunca disminuye.

46
En el transcurso de esta sección, veremos medidas de dispersión mejores que la anterior.
Estas se determinan en función de la distancia entre las observaciones y algun estadı́stico
de tendencia central.

Las principales medidas de dispersión son:

El rango

El rango intercuartil

La varianza

La desviación estándar

El coeficiente de variación

2.3.1. El Rango R
Definición 2.1. El rango de variación R, de una serie de datos, es la diferencia entre sus
valores máximo y mı́nimo. Esto es:

R = Xmax − Xmin

Siendo Xmax el valor máximo y Xmin el valor mı́nimo.

El rango es una medidad de dispersión muy fácilmente calculable, pero es muy ines-
table, ya que depende únicamente de los dos valores extremos. Su valor puede cambiar
grandemente si se añade o elimina un sólo dato.

Ejemplo 2.10. Dadas las dos series de datos

a 15 20 20 25; R = 25 − 15 = 10

b 195 200 200 200 200 200 200 200 205; R = 205 − 195 = 10

Claramente puede apreciarse que en la segunda serie los datos están menos dispersos, Pues
en ella hay mayor cantidad de datos parecidos a su promedio.

2.3.2. Rango Intercuartil RI


Definición 2.2. El rango intercuartil RI, es la diferencia entre sus cuartiles tercero y
primero. Esto es
RI = Q3 − Q1

El Rango intercuartil es una medida que excluye el 25 % más alto y el 25 % más bajo,
dando un rango dentro del cual se encuentra el 50 % central de los datos observados y a
diferencia del rango total no se encuentra afectada por los valores extremos.

47
2.3.3. Varianza y desviación estándar
1. Varianza de datos no tabulados
La varianza de n valores x1 , x2 , ..., xn de alguna variable cuntitativa X cuya media
es X, es el número:
∑n
(xi − X)2
i=1
S2 =
n
Es facil ver que:

n
x2i
i=1 2
S2 = −X
n
2. Varianza de datos tabulados
Variable disdreta
La varianza de n valores de una variable estadı́stica X que se clasifican en k valores
distintos x1 , x2 , ..., xk con frecuencias absolutas respectivas f1 , f2 , ..., fk y cuya media
es X se calcula con la siguiente fórmula:

n
fi (xi − X)2
i=1
S2 =
n
Se verifica que:

n
fi x2i
i=1 2
S2 = −X
n
Varinaza de datos tabulados por intervalos
La varianza de n valores de una variable estadı́stica X tabulados k intervalos con
marcas de clases m1 , m2 , ..., mk con frecuencias absolutas respectivas f1 , f2 , ..., fk y
cuya media es X se calcula con la siguiente fórmula:

n
fi (mi − X)2
i=1
S2 =
n
Se verifica que:

n
fi m2i
i=1 2
S2 = −X
n
3. Desviación estándar S
La desviación estándar se define como la raı́z cuadrada de la varianza, esto es:

S = S2

48
2.3.4. Coeficiente de variación CV

Hemos visto que las medidas de centralización y dispersión nos dan información sobre
una muestra. Nos podemos preguntar si tiene sentido usar estas magnitudes para compa-
rar dos poblaciones. Por ejemplo, si nos piden comparar la dispersión de los pesos de las
poblaciones de elefantes de dos circos diferentes, nos dará información útil.

¿Pero qué ocurre si lo que comparamos es la altura de unos elefantes con respecto a su
peso? Tanto la media como la desviación tı́pica, y , se expresan en las mismas unidades
que la variable. Por ejemplo, en la variable altura podemos usar como unidad de longitud
el metro y en la variable peso, el kilogramo. Comparar una desviación (con respecto a la
media) medida en metros con otra en kilogramos no tiene ningún sentido.
El problema no deriva sólo de que una de las medidas sea de longitud y la otra sea de
masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la masa, de
dos poblaciones, pero con distintas unidades. Este es el caso en que comparamos el peso
en toneladas de una población de 100 elefantes con el correspondiente en miligramos de
una población de 50 hormigas.

El problema no se resuelve tomando las mismas escalas para ambas poblaciones. Por
ejemplo, se nos puede ocurrir medir a las hormigas con las mismas unidades que los elefan-
tes (toneladas). Si la ingerierı́a genética no nos sorprende con alguna barbaridad, lo lógico
es que la dispersión de la variable peso de las hormigas sea practicamente nula (¡Aunque
haya algunas que sean 1000 veces mayores que otras!)

En los dos primeros casos mencionados anteriormente, el problema viene de la dimen-


sionalidad de las variables, y en el tercero de la diferencia enorme entre las medias de
ambas poblaciones. El coeficiente de variación es lo que nos permite evitar estos pro-
blemas, pues elimina la dimensionalidad de las variables y tiene en cuenta la proporción
existente entre medias y desviación tı́pica. Se define del siguiente modo:

S
CV =
X

Observación
Es importante destacar que los coefientes de variación sirven para comparar las variabi-
lidades de dos conjuntos de valores (muestras o poblaciones), mientras que si deseamos
comparar a dos individuos de cada uno de esos conjuntos, es necesario usar los valores
tipificados.

49
2.4. Valores Estandarizados o Tipificados Z
Se conoce por Estandarización al proceso de restar la media y dividir por su desviación
tı́pica a una variable X. De este modo se obtiene una nueva variable:

X −X
Z=
S
Donde Z = 0 y SZ2 = 1 Esta nueva variable carece de unidades y permite hacer compara-
bles dos medidas que en un principio no lo son, por aludir a conceptos diferentes. Ası́ por
ejemplo nos podemos preguntar si un elefante es más grueso que una hormiga determina-
da, cada uno en relación a su población. También es aplicable al caso en que se quieran
comparar individuos semejantes de poblaciones diferentes. Por ejemplo si deseamos com-
parar el nivel académico de dos estudiantes de diferentes Universidades para la concesión
de una beca de estudios, en principio serı́a injusto concederla directamente al que posea
una nota media más elevada, ya que la dificultad para conseguir una buena calificación
puede ser mucho mayor en un centro que en el otro, lo que limita las posibilidades de
uno de los estudiante y favorece al otro. En este caso, lo más correcto es comparar las
calificaciones de ambos estudiantes, pero estandarizados cada una de ellas por las medias
y desviaciones estándar respectivas de las notas de los alumnos de cada Universidad.

Ejemplo 2.11. Dada la distribución de edades (medidas en años) en un colectivo de 100


personas, obtener:

a La variable estandarizada Z.

b Valores de la media y varianza de Z.

c Coeficiente de variación de Z.

Horas trabajadas Número de Empleados


[Li−1 , Li [ fi
[0,4[ 47
[ 4 , 10 [ 32
[ 10 , 20 [ 17
[ 20 , 40 ] 4
Total 100

Solución
Para calcular la variable estandarizada:
X −X
Z=
S

50
Partimos de los datos del enunciado. Será necesario calcular en primer lugar la media y
desviación tı́pica de la variable original (X).
[Li−1 , Li [ mi fi mi fi m2i hi
[0,4[ 2 47 94 188
[ 4 , 10 [ 7 32 224 1568
[ 10 , 20 [ 15 17 255 3825
[ 20 , 40 ] 30 4 120 3600
Total 100 693 9181

693
X = = 6,93
100
9,181
2
SX = − 6,932 = 43,78
√100
SX = 43,78 = 6,6

A partir de estos valores podremos calcular los valores tipificados para las marcas de clase
de cada intervalo y construir su distribución de frecuencias:
2 − 6,93
z1 = = −0,745
6,6
7 − 6,93
z2 = = 0,011
6,6
15 − 6,93
z3 = = 1,22
6,6
30 − 6,93
z4 = = 3,486
6,6
zi fi zi fi zi2 fi
-0.745 47 -35.015 26.086
0.011 32 0.352 0.004
1.220 17 20.720 25.303
3.486 4 13.944 48.609
Total 100 0.021 100.002

0,021
Z = ≈0
100
100,02
SZ2 = − 02 ≈ 1
√ 100
SZ = 1=1

A pesar de que no se debe calcular el coeficiente de variación sobre variables que presenten
valores negativos (y Z los presenta), lo calculamos con objeto de ilustrar el porqué:
SZ 1
CV = = =∞
Z 0

51
Es decir, el coeficiente de variación no debe usarse nunca con variables estandarizadas.

2.5. Asimetrı́a y apuntamiento


Sabemos cómo calcular valores alrededor de los cuales se distribuyen las observaciones
de una variable sobre una muestra y sabemos cómo calcular la dispersión que ofrecen
los mismos con respecto al valor de central. Nos proponemos dar un paso más allá en
el análisis de la variable. En primer lugar, nos vamos a plantear el saber si los datos se
distribuyen de forma simétrica con respecto a un valor central, o si bien la gráfica que
representa la distribución de frecuencias es de una forma diferente del lado derecho que
del lado izquierdo.

Si la simetrı́a ha sido determinada, podemos preguntarnos si la curva es más o menos


apuntada (larga y estrecha). Este apuntamiento habrá que medirlo comparado a cierta
distribución de frecuencias que consideramos normal (no por casualidad es éste el nombre
que recibe la distribución de referencia).

Estas ideas son las que vamos a desarrollar en lo que resta del capı́tulo.

2.5.1. Estadı́sticos de asimetrı́a


Para saber si una distribución de frecuencias es simétrica, hay que precisar con res-
pecto a qué. Un buen candidato es la mediana, ya que para variables continuas, divide
al histograma de frecuencias en dos partes de igual área. Podemos basarnos en ella para,
de forma natural, decir que una distribución de frecuencias es simétrica si el lado
derecho de la gráfica (a partir de la mediana) es la imagen por un espejo del lado izquierdo
(como la siguiente figura).

52
Cuando la variable es discreta, decimos que es simétrica, si lo es con respecto a la media.
Observación

Se podrı́a pensar que definir la simetrı́a con usando la mediana para variables con-
tinuas y usando la media para variables discretas es una elección arbitraria. En
realidad esto no es ası́, pues si una variable es continua, coinciden los ambos criterios
de simetrı́a (con respecto a la media y a la mediana). Es más, se tiene que media y
mediana coinciden para distribuciones continuas simétricas. Por otro lado,

en el caso de variables discretas, la distribución es simétrica si el lado derecho del


diagrama se obtiene por imagen especular desde la media. En este caso coincide la
media con la mediana si el número de observaciones es impar.

Si la variable es continua simétrica y unimodal, coinciden la media, la mediana y la


moda.

Dentro de los tipos de asimetrı́a posible, vamos a destacar los dos fundamentales
(figura ):

Asimetrı́a positiva:
Si las frecuencias más altas se encuentran en el lado izquierdo de la media, mientras que
en derecho hay frecuencias más pequeñas (cola).

Asimetrı́a negativa:
Cuando la cola está en el lado izquierdo.

Cuando realizamos un estudio descriptivo es altamente improbable que la distribución


de frecuencias sea totalmente simétrica. En la práctica diremos que la distribución de
frecuencias es simétrica si lo es de un modo aproximado. Por otro lado, aún observando

53
cuidadosamente la gráfica, podemos no ver claro de qué lado están las frecuencias más
altas. Conviene definir entonces unos estadı́sticos que ayuden a interpretar la asimetrı́a, a
los que llamaremos ı́ndices de asimetrı́a, y que denotaremos mediante As . Vamos a definir
a continuación algunos de los ı́ndices de asimetrı́a más usuales como son el ı́ndice basado
en los tres cuartiles, el momento de tercer orden y la distancia entre la moda y la media
o la media y la mediana.

2.5.2. Índice basado en los tres cuartiles


Si una distribución es simétrica, es claro que deben haber tantas observaciones entre
la que deja por debajo de sı́ las tres cuartas partes de la distribución y la mediana, como
entre la mediana y la que deja por debajo de sı́ un cuarto de todas las observaciones. De
forma abreviada esto es,
Q3 − Q2 = Q2 − Q1

Una pista para saber si una distribución de frecuencias es asimétrica positiva tendremos :

Q3 − Q2 > Q2 − Q1

Por analogı́a, si es asimétrica negativa, se tendrá

Q3 − Q2 < Q2 − Q1

Para quitar dimensionalidad al problema, utilizamos como ı́ndice de asimetrı́a la cantidad:


(Q3 − Q2 ) − (Q2 − Q1 )
As =
Q3 − Q1
El número obtenido, As , es invariante ante cambios de origen de referencia y de escala.

Otros indices de asimetrı́a

54
Basándonos en que si una distribución de frecuencias es simétrica y unimodal, entonces
la media, la mediana y la moda coinciden, podemos definir otras medidas de asimetrı́a,
como son:
X − Mo
As =
S

O bien,
3(X − Med )
As =
S

Diremos que hay asimetrı́a positiva si As > 0 y negativa si As < 0 (véase la siguiente
figura).

Ejemplo 2.12. Las edades de un grupo de personas se reflejan en la tabla siguiente:

[Li−1 , Li [ fi
[7,9[ 4
[ 9 , 11 [ 18
[ 11 , 12 [ 14
[ 12 , 13 [ 27
[ 13 , 14 [ 42
[ 14 , 15 [ 31
[ 15 , 17 [ 20
[ 17 , 19 ] 1

Determinar la variabilidad de la edad mediante los estadı́sticos varianza, desviación estándar,


coeficiente de variación y rango intercuartı́lico. Estudie la simetrı́a de la variable.

Solución
En primer lugar realizamos los cálculos necesarios a partir de la tabla de frecuencias:

55
[Li−1 , Li [ fi mi Fi mfi m2i fi
[7,9[ 4 8 4 32 256
[ 9 , 11 [ 18 10 22 180 1800
[ 11 , 12 [ 14 11.5 36 161 1851.5
[ 12 , 13 [ 27 12.5 63 337.5 4218.75
[ 13 , 14 [ 42 13.5 105 567 7654.5
[ 14 , 15 [ 31 14.5 136 449.5 6517.75
[ 15 , 17 [ 20 16 156 320 5120
[ 17 , 19 ] 1 18 157 18 324
Total 157 2065 27742.25

La media es X = 2065
157 = 13,15 años. La varianza la calculamos a partir de la columna de
2
la xi fi como sigue:

27742,25 √
S2 = − 13,152 = 3,78 años2 ⇒ S = 3,78 = 1,94 años
157
El coeficiente de variación no posee unidades y es:
1,94
CV = = 0,15 = 15 % de variabilidad
13,15
En lo que concierne a la simetrı́a podemos utilizar el coeficiente de asimetrı́a para el cual
es preciso el cálculo de los cuartiles:
Q1 = 12 + 39,25−36
27 × 1 = 12,12
78,5−63
Med = Q2 = 13 + 42 × 1 = 13,37
Q3 = 14 + 117,75−105
31 × 1 = 14,41
Lo que nos dice que aproximadamente en un rango de Q3 − Q1 = 2,29 años se encuentra
el 50 % central del total de observaciones Además:
(Q3 − Q2 ) − (Q2 − Q1 ) (14,41 − 13,37) − (13,37 − 12,12)
As = = = −0,09
Q3 − Q1 14,41 − 12,12

Este resultado nos indica que existe una ligera asimetrı́a a la izquierda (negativa). Un
resultado similar se obtiene si observamos la siguiente figura (Figura ) veremos que la
distribución de frecuencias es unimodal, siendo la moda
42 − 27
Mo = 13 + × 1 = 13,57
(42 − 27) + (42 − 31)

En cuyo caso podemos usar como medida del sesgo:

X − Mo 13,15 − 13,57
As = = = −0,21
S 1,94

56
2.6. Ejercicios Propuestos
1. Una empresa grande de equipos deportivos está probando el efecto de dos planes
publicitarios sobre las ventas de los últimos 4 meses. Dadas las ventas que se ven
aquı́, ¿cuál programa de publicidad parece producir el crecimiento promedio más
alto en ventas mensuales?

Mes Plan 1 Plan 2


Enero 1657.0 4735.0
Febrero 1998.0 5012.0
Marzo 2267,0 5479.0
Abril 3432,0 5589,0

2. Los estadı́sticos del programa de Meals on Wheels (comida sobre ruedas), el cual
lleva comidas calientes a enfermos confinados en casa, desean evaluar sus servicios.
El número de comidas diarias que suministran aparece en la siguiente tabla de fre-
cuencia. Calcular la media, mediana y la moda e interprete.

Número de comidas por dı́a Número de dı́as


[0 , 5 [ 3
[ 5, 10 [ 6
[ 10 , 15 [ 5
[ 15 , 20 [ 8
[ 20 , 25 [ 2
[ 25 , 30 ] 3

3. Bill Karl compró 20 acciones a $15 cada una, 50 acciones a $20 cada una, 100 acciones
a $30 cada una y 75 acciones a $35 cada una. ¿Cuál es el precio promedio por acción?.

4. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nación


reportadas aparecen en la siguiente tabla de frecuencias. Calcule e interprete la me-
dia, la mediana y la moda. Además, calcule e interprete: Q1 , Q2 , D1 , D6 , P15 , P90 .

Edades Frecuencia
[50 , 55 [ 8
[ 55, 60 [ 13
[ 60 , 65 [ 15
[ 65 , 70 [ 10
[ 70 , 75 [ 3
[ 75 , 80 ] 1

57
5. Dado el siguiente cuadro estadı́stico con ancho de clase constante igual a 20. Deter-
mine la media de los datos.

[Li−1 , Li [ mi fi Fi mfi
[ , [ 880
[ , [ 1950
[ , [ 35 1800
[ , [ 13
[ , 200 [
[ , ] 4 70

6. Dada la siguiente distribución de frecuencias, calcular el valor de “n”sabiendo que


la moda es 60 y pertenece al tercer intervalo.

[Li−1 , Li [ fi
[ 16 , 32 [ 6
[ 32 , 48 [ n
[ 48 , 64 [ 8
[ 64 , 80 [ 3n
[ 80 , 96] 3

7. En un examen de estadı́stica tomado el mismo dı́a y hora a los tres grupos del tercer
ciclo de Ingenierı́a de Sistemas: A , B y C con un total de 150 alumnos se obtuvo
una nota promedio de 13,2 , las notas promedio de los grupos A y B fueron 12 y 14
respectivamente; los registros del grupo C se extraviaron pero se sabe que el grupo
A es el 36 % del total y que el número de alumnos del grupo B es la tercera parte
de las matriculadas en el grupo C.

a Hallar la nota promedio del grupo C.


b Calcular la nota promedio de los grupos A y C juntos.

8. La siguiente tabla de distribución de frecuencias muestra la edad de un grupo de


personas. Si además se sabe que la moda es 27,5.

[Li−1 , Li [ [10,20[ [20,30[ [30,40[ [40,50]


fi a 30 a + 10 20

a Hallar el valor de a.
b ¿Bajo qué edad se encuentra el 35 % más joven?
c ¿Cuántas personas tienen como mı́nimo 20 años? Justifique.

58
9. De un grupo de pequeñas empresas se sabe que ninguna tiene más de 5 trabajadores
ni menos de 2, la mayorı́a tiene 3 trabajadores, el 20 % tiene 5 trabajadores, 2 de
cada 20 empresas tiene 4 trabajadores; la proporción de empresas que tienen dos
trabajadores es 0,25. Calcular e interpretar la media aritmética.

10. Dada la siguiente distribución de frecuencias:

[Li−1 , Li [ [20,30[ [30,40[ [40,50[ [50,60[ [60,70]


fi 3 1 2 6 x

Hallar el valor de x si se sabe que la mediana es 61,6.

11. Los siguientes datos corresponden a los sueldos de los trabajadores de una compañı́a.

Sueldos N ro de trabajadores
[ 950 , 1000 [ 5
[ 1000 , 1050 [ 12
[ 1050 , 1100 [ 9
[ 1100 , 1150 [ 8
[1150 , 1200[ 4
[1200 , 1250[ 10
[1250 , 1300[ 6

a Calcular e interpretar la media aritmético.


b Si a cada trabajador se le duplica el sueldo pero a la vez se le hace un descuento
de 150 soles, ¿cuál será el nuevo sueldo promedio?
c Si cada trabajador recibe un incremento del 30 % de su sueldo, ¿cuál serı́a el nuevo
sueldo promedio?
d Si cada trabajador recibe un aumento de 270 soles y al mismo tiempo se decreta
un descuento del 3,5 % del nuevo haber, ¿cuál es el sueldo promedio?

12. En un examen tomado a tres secciones de un curso de estadı́stica de 91 alumnos,


el puntaje medio general fue de 69,3. Los puntajes medios de las secciones 1 y 2
fueron 70,4 y 64,2 respectivamente. Se perdieron los archivos con las notas de la
sección 3 pero los ayudantes recuerdan que las secciones 1 y 2 tenı́an exactamente el
mismo número de alumnos, mientras que el ayudante de la sección 3 menciona que
su sección tenı́a 5 estudiantes menos que la 1. ¿Cuál es el promedio de las notas de
la sección 3?

59
13. Una fábrica de aparatos electrónicos ha comenzado un estudio para mejorar su efi-
ciencia. Efectuó para esto un relevamiento en las sección de armado de visores para
computadora durante 10 dı́as consecutivos. La cantidad de visores armados diaria-
mente fueron:
30 20 50 80 40 50 60 30 70 50

Calcule todas las medidas de tendencia central proporcionando un significado a su


valor de manera que sirva para los fines propuestos en el estudio.

14. La siguiente información es relativa a los sueldos de un grupo de trabajadores en una


compañı́a donde, el 12 % de ellos ganan S/530, el 24 % ganan S/560, el 20 % ganan
S/600, el 15 % ganan S/650, el 13 % ganan S/680 y el resto ganan S/700. ¿Cuál es
el salario medio?

15. En un grupo hay 40 estudiantes varones con una edad promedio de 20 años, las
mujeres son en promedio más jóvenes en un 10 %; ¿cuántas mujeres hay si la edad
promedio de la clase es de 19 años?

16. El salario promedio mensual pagado a los trabajadores de una compañı́a es de $200.
Los salarios promedios mensuales pagados a hombres y mujeres de la compañı́a son
210 y 150 respectivamente. Determinar el porcentaje de hombres y mujeres que
trabajan en la compañı́a.

17. Una compañı́a minera tiene 100 trabajadores. Para los nombrados el haber máximo
es $450 y el mı́nimo $60. Hay un 5 % de eventuales (en prueba) que trabajan ad-
honorem o perciben compensaciones inferiores a $60. Quince trabajadores nombrados
perciben haberes inferiores a $250 y el 85 % ganan haberes inferiores a $400. Con
esta información, calcule las medidas de tendencia central posibles.

18. Un grupo de 200 estudiantes con estatura inedia de 60.96 pulg. Se divide en dos
grupos, un grupo con una estatura media de 63.4 pulg. y el otro con 57.3 pulg. ¿
Cuántos estudiantes hay en cada grupo?.

19. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos
alternativas de aumento: a) S/. 75 a cada uno, b) 15 % de su sueldo más 10 soles a
cada uno. Si la empresa dispone a lo más de S/. 94,000 para pagar sueldos, ¿cuál
alternativa es más conveniente?.

20. De una central telefónica salieron 70 llamadas de menos de 3 minutos promediando


2.3 minutos, 40 llamadas de menos de 10 minutos pero no menos de 3 minutos,
promediando 6.4 minutos, y 10 llamadas de al menos 10 minutos promediando 15
minutos. Calcular la duración promedio de todas las llamadas.

60
21. El sueldo medio de los obreros de una fábrica es de $286.

a ¿Que porcentajes de hombres y mujeres trabajan en la fábrica si sus sueldos medios


respectivos son $300 y $260?.
b Si el 60 % de los obreros tienen menos de 30 años y percibe el 20 % del total de
los sueldos, ¿cuánto es el sueldo medio de los obreros de al menos 30 años?

22. En una empresa donde el sueldo medio es de $400 se incrementa un personal igual al
25 % del ya existente con un sueldo medio igual al 60 % de los antiguos. Si 3 meses
más tarde se incrementan cada sueldo en 20 %, más $30, ¿cuánto es el nuevo salario
medio?.

23. Calcular todas las medidas de dispersión para la siguiente distribución

Xi 5 10 15 20 25
fi 3 7 5 3 2

24. Calcular todas las medidas de dispersión para los datos de la siguiente distribución

[Li−1 , Li [ [0,100[ [100,200[ [200,300[ [300,800]


fi 90 140 150 120

25. Se sabe que la media aritmética de la siguiente distribución es 11,5.

[Li−1 , Li [ [4,6[ [6,10[ [10,16[ [16,20[ [20,30]


fi 4 5 x 3 1

Calcular la desviación estándar

26. Si X es una variable que tiene media 15 y varianza 25; hallar la media, varianza y
desviación tı́pica de Y en los siguientes casos:

a Y = 4 + 16X
b Y = 16 − 4X
1
c Y = 4 + 14 X

27. La producción de papa en Tn. fue de 4000 Tn. con variancia de 3600 para el depar-
tamento de Cuzco, mientras que para el departamento de Puno fue de 10 000 Tn.
con 1440000 de variancia, en que departamento se puede decir que la producción de
papa es más homogénea

61
28. Un grupo de trescientos alumnos llevan el curso de Estadı́stica y Probabilidad dis-
tribuidos en cuatro secciones. Si se sabe que el número de alumnos por sección están
en una progresión aritmética cuya razón es 20 y además se conoce que las notas
promedio de las secciones A , C y D son 12, 14 y 11 mientras que las varianzas de
los grupos A y C son 16 y 4 y las desviaciones estándar de B y D son 3 y 1 respecti-
vamente. Si la nota promedio en el curso es 12,37; hallar e interpretar la desviación
estándar de las cuatro secciones juntas.

29. En una empresa donde los salarios tienen una media S/. 2500 y una desviación
estándar de S/. 300 el Sindicato solicita que cada salario Xi se transforme en Yi ,
mediante la siguiente relación:

Yi = 3,5Xi + 10

El directorio acoge parcialmente la petición rebajando los salarios propuestos por el


Sindicato en un 20 %, lo que es aceptado. Se pide calcular la varianza de la nueva
distribución de salarios.

30. Se tienen tres empresa con aproximadamente igual número de trabajadores. El núme-
ro de inasistencias registradas durante los últimos seis meses en cada una de las tres
empresas se da a continuación: Empresa:

A : 3 19 4 5 15 6

B : 7 8 11 9 14 16
C : 10 17 12 2 18 13
¿En cuál de estas tres empresas existe mayor variabilidad con respecto al número de
inasistencias?

31. Una empresa de fabricación de productos cerámicos dispone de tres centros de pro-
ducción. En el centro A, el más grande y moderno, se hace un estudio de los m2 de
azulejo producidos al mes durante el año pasado, obteniéndose una media de pro-
ducción mensual X A = 250000m2 , con una desviación estándar SA = 15000m2 . Se
sabe que el centro B, por tener maquinaria más anticuada que A, produce cada mes
un tercio de la producción de A, y que el centro C, por tener un horno menos que
B, produce cada mes 25000 m2 menos que B ¿Cual es la media y la varianza de la
producción mensual de C?

32. Se utiliza dos máquinas diferentes para fabricar conductos de salida de papel desti-
nados a copiadoras Kodak. Los conductos de una m uestra de la primera máquina
medı́an:
12,2, 11,9, 11,8, 12,1, 11,9, 12,4, 11,3 12,3

62
pulgadas. Los conductos hechos con la segunda máquina medı́an:

12,2, 11,9, 11,5, 12,1, 12,2, 11,9, 11,8

pulgadas. Si se desea utilizar la máquina que produzca conductos de tamaños más


uniformes; ¿qué máquina deberá utilizarse?

33. Un entrenador de pista y campo debe decidir a cuál de sus dos velocistas selec-
cionará para los cien metros planos en una próxima competencia. El entrenador
basará la decisión en los resultados de cinco carreras entre los dos atletas, celebradas
en un periódo de una hora, con descanso de 15 minutos. Los siguientes tiempos (en
segundos) se registraron para las cinco carreras:

Atleta Carrera
1 2 3 4 5
Mendoza 11,1 11.0 11.0 15.8 11.1
Ramirez 11.3 11.4 11.4 11.5 11.4

Con base en estos datos, ¿a cuál de los dos velocistas debe seleccionar el entrenador?
¿por qué?

34. Las secciones A , B y C del curso de Estadı́stica y Probabilidad rinden el mismo


examen parcial. Los resultados obtenidos se registran en las siguientes tablas:

A A B B C C
Xi Fi [Li−1 , Li [ mi fi Hi hi Xi2
2.5 3 [2,6[ 16 0.1 2.5
7.5 8 [6,10[ 144 0.2 10
12.5 22 [10,14[ 240 0.8 86.4
17.5 30 [14,18[ 240 1 45

a En cuál de las secciones las notas son más homogéneas?


b Calcular e interpretar la desviación estándar para las tres secciones juntas.

35. Durante un periodo de diez años, los precios de un producto fueron en promedio
de $80 con una desviación estándar de $12. En el periodo anterior de 10 años,
el promedio fue de $50 con una varianza de $36. ¿En qué periodo hubo mayor
estabilidad?

36. En la sección financiera de un diario apareció la distribución de la variable discreta


adjunta. Se decı́a en el texto del artı́culo que la media aritmética era 120 y la varianza
25. Desafortunadamente la publicación apareció con dos manchas de tinta, lo cual

63
impedı́a comprobar directamente la afirmación. ¿Son admisibles dichos valores de la
media y la varianza, teniendo en cuenta lo que puede verse del cuadro? Justificar.

Xi 105 110 115 120 125 130 135 140


fi 37 90 95 85 60

37. Los alumnos de un grupo obtuvieron en matemática II una nota media de 68.7
puntos con una desviación estándar de 15.4 y los de otro grupo obtuvieron en la
misma asignatura un promedio de 50.9 puntos con una desviación estándar de 19.6.
¿Cuál de los dos grupos tiene un rendimiento más heterogéneo?

38. Si la nota media de unos estudiantes varones es 3 y la desviación estándar de sus


notas es 0.25 en tanto que las correspondientes cifras para las estudiantes mujeres
son 3.2 y 0.25 ¿muestran menor variabilidad las notas de los estudiantes varones?
¿por qué?

39. En el siguiente conjunto de números, se proporcionan los pesos (redondeados a la


libra más próxima) de los bebés nacidos durante un cierto intervalo de tiempo en un
hospital:
4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8,
9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.

a Calcular las medidas de tendencia central.


b Calcular las medidas de dispersión.
c ¿Es esta una distribución sesgada? De ser ası́, ¿en qué dirección?
d Encontrar el percentil 24.

40. Con el fin de observar la relación entre la inteligencia y el nivel socioeconómico


(medido por el salario mensual familiar) se tomaron dos grupos, uno formado con
sujetos de cociente intelectual inferior a 95 y otro formado por los demás; De cada
sujeto se anotó el salario mensual familiar. Teniendo en cuenta los resultados que se
indican en la tabla:
Nivel Socioeconómico Sujetos con CI< 95 Sujetos con CI≥ 95
[Li−1 , Li [ fi fi
[ 4 , 10 [ 75 19
[ 10 , 16 [ 35 26
[ 16 , 22 [ 20 25
[ 22 , 28 [ 30 30
[ 28 , 34 [ 25 54
[ 34, 40 ] 15 96

64
a Dibuje un gráfico que permita comparar ambos grupos.
b Calcule las medidas de tendencia central para aquellos sujetos con CI ¡95.
c Calcular las medidas de dispersión para aquellos sujetos con.

41. Un estudio consistió en anotar el número de palabras leı́das en 15 segundos por un


grupo de 120 sujetos disléxicos y 120 individuos normales. Teniendo en cuenta los
resultados de la tabla

Nro de palabras leı́das Disléxicos nD Normales nN


25 o menos 56 1
26 24 9
27 16 21
28 12 29
29 10 28
30 o más 2 32

Calcule

a Las medias aritméticas de ambos grupos.


b Las medianas de ambos grupos.
c El porcentaje de sujetos disléxicos que superaron la mediana de los normales.
d Compare la variabilidad relativa de ambos grupos.

42. En un estudio comparativo del porcentaje de rendimiento de ciertos bonos se ela-


boró una distribución de frecuencias de 5 intervalos de amplitudes iguales, siendo las
marcas de clase primera y quinta 15 y 55 respectivamente. Si el 65 % de los bonos
rinden menos del 40 %, el 25 % menos del 30 %, el 90 % menos del 50 % y el 95 % al
menos 20 %,

a) Calcule los promedios de rendimiento.


b) Si el 50 % de los bonos de mayor rendimiento deben pagar un impuesto, ¿a partir
de que rendimiento corresponde pagar impuesto?
c) ¿Es la mediana, el punto medio entre los cuartiles 1 y 3? Justifique.

43. Las ganancias diarias de los establecimientos de un centro comercial se presentan en


una tabla de frecuencias con 6 intervalos de clase constante y se sabe que: la mı́nima
ganancia es de $6, el rango es 36, el 50 % de los establecimientos ganan más de 25.58
dólares diarios, H2 = 0,15, F2 = 120, h3 = 0,25, H5 = 0,93, f4 = 304, f2 = 2f 1.

a) Reconstruir la distribución de todas las frecuencias.

65
b) Hallar la ganancia más frecuente y la ganancia promedio
c) Hallar la desviación estándar

44. En un examen 20 alumnos del curso A obtienen una media de 60 puntos. y desvia-
ción estándar de 20 puntos En el curso B los alumnos obtienen una media de 80
y desviación estándar de 16. Ante un reclamo se decide subir en 5 % mas 5 puntos
adicionales a todos los alumnos del curso A, en cambio como hubo muchas copias
en el curso B se decidió disminuir la quinta parte de la calificación. Después de los
mencionados ajustes ¿Cual es el puntaje medio de los 50 alumnos?

45. Al calcular la media y la desviación estándar de 80 datos, resultaron 30 y 4 respec-


tivamente. Un chequeo mostró que en lugar del valor 1.7 se introdujo 17. Corrija la
media y la desviación estándar.

46. Un conjunto habitacional está formado por 3 edificios de departamentos. Se tiene


los siguientes datos respecto al consumo mensual de electricidad de cada uno de los
edificios.
Edificio 1: Tiene 8 departamentos, la media y la desviación estándar de los consumos
es S/. 85 y S/. 12, respectivamente.
Edificio 2: Tiene 9 departamentos cuyos consumos en soles son 88, 92, 106, 110,
93, 102, 91, 94, 80.
Edificio 3: Los consumos se dan en la siguiente tabla.

Consumo en soles Departamentos


[50, 60[ 1
[60, 70[ 2
[70, 80[ 4
[80, 90] 3

a) ¿Cuál de los edificios tiene el menor consumo de electricidad?


b) ¿En cuál de los edificios los valores que representa los consumos están más dis-
persos?
c) ¿Cuál es el consumo promedio en todo el conjunto habitacional?

47. El salario promedio en una ciudad es de 11000u.m. con una variancia de 2000u.m.
¿Cuales serán la nueva media y la nueva variancia si se efectúan los siguientes cam-
bios:

a) Se aumenta 810u.m a todos


b) Se aumenta el 15 % de su salario a cada trabajador

66
c) Si se duplican los sueldos

48. En el mes de enero el promedio de los salarios de una empresa era de 40 unidades
monetarias (u.m.). En el mes de febrero la empresa consideró un incremento del
25 % en el número de empleados, con un salario igual al 80 % del promedio de los
antiguos empleados. En el mes de marzo la empresa hizo efectivo un aumento del
25 % en el salario de cada uno de los empleados, más una bonificación de 20 u.m.
por escolaridad.

a) Halle el sueldo promedio de los salarios de los empleados en el mes de marzo


b) Calcule la tasa promedio de crecimiento de las medias de los sueldos entre enero
y marzo

49. Ochocientos alumnos de la especialidad de Educación Fı́sica fueron sometidos a una


prueba de resistencia en la cual se observo el número de kilómetros que podı́an correr
sin detenerse. Los datos recogidos se organizan en la siguiente tabla.

N ro de kı́lometros mi fi hi Fi Hi
[ ; [ 0.5475
[ ; [ 6
[ ; [ 0.15625
[ ; 16 [
[ ; [ 9
Total

a) Si se sabe que sólo el 3.875 % de los alumnos corrieron al menos 12 kilómetros


sin detenerse, complete la tabla usando 5 decimales y determine la resistencia
promedio de los alumnos
b) Los 60 alumnos con mayor resistencia fueron seleccionados. Estime la resistencia
media de ese grupo.

50. Se toman las medidas de 80 personas las que tienen estatura media de 1.70m y
desviación estándar de 3.4cm. Posteriormente se verificó que la media usada tenia 4
cm de menos. Rectifique los estadı́sticos mencionados.

51. Multiplicando cada número 3, 6, 2, 1, 7 y 5 por 2 y sumando entonces 5, obtenemos


el conjunto 11, 17, 9 7, 19 15. ¿Cual es la relación entre la desviación estándar de
ambos conjuntos? ¿Y entre las medias?

52. La distribución de edades del Censo de Residentes a 1 de enero de 2007 para las
comunidades autónomas de Aragón y Canarias, en miles de personas, es la siguiente:

67
Edades Aragón Canarias
[0, 20[ 3.54 4.35
[20, 40[ 21.56 29.99
[40, 60[ 31.63 35.21
[60, 80[ 28.14 21.97
[80, 100] 15.12 8.48

a) Representa sobre los mismos ejes de coordenadas los polı́gonos de frecuencias de


la distribución de la edad para las dos CC.AA. (emplea distinto trazo o distintos
colores). ¿Que conclusiones obtienes a la vista de los histogramas?
b) Calcula la edad mediana para las dos comunidades. Compáralas. ¿Qué indican
estos resultados?
c) Qué comunidad tiene mayor variabilidad en la distribución de su edad? Demues-
tralo con la media, mediana, desviación y varianza.

53. El costo inicial de producción, X, de una muestra de 50 objetos de cierto tipo, tiene
una desviación estándar de $3. La media de costos de producción es de 25 para 30
objetos de la muestra y de $20 para el resto. El costo final de producción Y es dado
por la relación:
Y = 1,15X + 2

Suponga que el precio de venta de cada objeto de la muestra es proporcional al


cuadrado del costo final de producción, ¿cuánto se recaudarı́a por la venta total de
los 50 objetos?

54. Los siguientes datos corresponden a los sueldos mensuales de los obreros que trabajan
en una compañı́a.

Sueldos No de Obreros
[390, 420[ 12
[420, 450[ 35
[450, 580[ 26
[580, 610[ 8
[610, 740[ 20
[740, 770[ 10
[770, 850] 6

a) Hallar el sueldo que es excedido por el 50 % de los obreros.


b) Calcular el sueldo que gana la mayorı́a de los obreros.

68
c) Se desea agrupar a los obreros en tres categorı́as: A, B y C teniendo en cuenta
sus sueldos. El 20 % inferior estarán en la categorı́a C, el 25 % superior en la
categorı́a A. Hallar los lı́mites entre estas categorı́as.

69
Capı́tulo 3

Probabilidad

3.1. Introducción

Si el único propósito del investigador es describir los resultados de un experimento


concreto, los métodos analizados en los capı́tulos anteriores pueden considerarse suficien-
tes. No obstante, si lo que se pretende es utilizar la información obtenida para extraer
conclusiones generales sobre todos aquellos objetos del tipo de los que han sido estudia-
dos, entonces estos métodos constituyen sólo el principio del análisis, y debe recurrirse a
métodos de inferencia estadı́stica, los cuales implican el uso inteligente de la teorı́a de la
probabilidad.
Comenzamos este bloque interpretando la noción de probabilidad y la terminologı́a
subyacente a esta área de las matemáticas, ya que la probabilidad constituye por sı́ misma
un concepto básico que refleja su relación con la faceta del mundo exterior que pretende
estudiar: los fenómenos aleatorios, los cuales obedecen unas ciertas reglas de comporta-
miento. De alguna manera, el concepto de probabilidad, se relaciona o nos recuerda las
propiedades de la frecuencia relativa.
A partir de ella, y junto con las definiciones de probabilidad condicionada y la de eventos
independientes, se deducen los teoremas fundamentales del Cálculo de Probabilidades.
Nos centraremos posteriormente en el eslabón que une la teorı́a de la probabilidad y
la estadı́stica aplicada: la noción de variable aleatoria, mostrando de esta manera, como
puede emplearse la teorı́a de la probabilidad para sacar conclusiones precisas acerca de una
población en base a una muestra extraı́da de ella, y que muchos de los estudios estadı́sticos
son de hecho, estudio de las propiedades de una o más variables aleatorias.
Tal como hemos citado anteriormente, en las aplicaciones prácticas es importante po-
der describir los rasgos principales de una distribución, es decir, caracterizar los resultados
del experimento aleatorio mediante unos parámetros. Llegamos ası́ al estudio de las ca-
racterı́sticas asociadas a una variable aleatoria introduciendo los conceptos de esperanza

70
y varianza matemática, relacionándolos con los conceptos de media y varianza de una
variable estadı́stica.

3.2. Experimentos y eventos aleatorios


Diremos que un experimento es aleatorio si se verifican las siguientes condiciones:

1. Se puede repetir indefinidamente, siempre en las mismas condiciones;

2. Antes de realizarlo, no se puede predecir el resultado que se va a obtener;

3. El resultado que se obtenga, ω, pertenece a un conjunto conocido previamente de


resultados posibles. A este conjunto, de resultados posibles, lo denominaremos es-
pacio muestral y lo denotaremos normalmente mediante la letra Ω. Los elementos
del espacio muestral se denominan eventos elementales.

ω1 , ω2 ∈ Ω ⇒ ω1 , ω2 son eventos elementales

Cualquier subconjunto de Ω será denominado evento aleatorio, y se denotará normalmente


con las letras A, B, ...

A, B ∈ Ω ⇒ A, B son eventos aleatorios

Obsérvese que los eventos elementales son eventos aleatorios compuestos por un sólo ele-
mento. Por supuesto los eventos aleatorios son más generales que los elementales, ya que
son conjuntos que pueden contener no a uno sólo, sino a una infinidad de eventos elemen-
tales, y también no contener ninguno. Eventos aleatorios que aparecen con gran frecuencia
en el cálculo de probabilidades son los siguientes:

1. Evento seguro:
Es aquel que siempre se verifica después del experimento aleatorio, es decir, el mismo

Ω ⊂ Ω ⇒ Ω Es el evento seguro

2. Evento imposible:
Es aquel que nunca se verifica como resultado del experimento aleatorio. Como debe
ser un subconjunto de Ω, la única posibilidad es que el evento imposible sea el
conjunto vacı́o
{∅} ⊂ Ω ⇒ ∅ Es el evento imposible

71
3. Evento unitario:
Es aquel que está formado por un único elemto

{ωi } ∈ Ω ⇒ {ωi } Es el evento unitario

4. Evento complementario:
Se denomina complemento del evento A, que se denota por Ac , aquel evento que
consiste de todos los puntos muestrales que no están en el evento A.

Clasificación de los espacios muestrales


Por el número de elementos o puntos muestrales, los espacios muestrales se clasifican en:

Discretos finitos, consisten de un número finito de elementos

Discretos infinitos, consisten de un número infinito numerable de elementos

Continuos, consisten de un número infinito no numerable de elementos.

Ejemplo 3.1. A continuación se dan algunos ejemplos de experimentos aleatorios y sus


correspondientes espacios muestrales:

1. El experimento aleatorio de lanzar un dado y observar el resultado obtenido tiene


por espacio muestral:
Ω = {1, 2, 3, 4, 5, 6}

2. El experimento aleatorio de lanzar una moneda tantas veces como sea necesario
hasta que aparezca la primera cara tiene por espacio muestral:

Ω = {C, SC, SSC, SSSC, ...etc.}

3. El experimento aleatorio que consiste en medir la vida útil (en horas) de una marca
de artefacto eléctrico tiene por espacio muestral:

Ω = {t ∈ R/t ≥ 0}

3.2.1. Operaciones básicas con eventos aleatorios


Al ser los eventos aleatorios nada más que subconjuntos de un conjunto Ω, espacio
muestral, podemos aplicarles las conocidas operaciones con conjuntos, como son la unión,
intersección y diferencia:

1. Dados dos eventos aleatorios, se denomina unión de A y B al conjunto formado


por todos los eventos elementales que pertenecen a A o bien que pertenecen a B
(incluyendo los que están en ambos simultáneamente), es decir

A ∪ B = {ω ∈ Ω/ω ∈ A o ω ∈ B}

72
2. Dados dos eventos aleatorios, se denomina intersección de A y B al conjunto formado
por todos los eventos elementales que pertenecen a A y B a la vez, es decir,

A ∩ B = {ω ∈ Ω/ω ∈ A y ω ∈ B}

3. Dos eventos son mutuamente disjuntos, si no tienen elementos en comun, esto es


A ∩ B = ∅.

4. Dados dos eventos aleatorios, se denomina diferencia de A y B y se representa con


A − B al conjunto formado por todos los eventos elementales que pertenecen a A y
que no pertenecen a B es decir,

A − B = {ω ∈ Ω/ω ∈ A y ω ∈
/ B}

Algebra de eventos
Las siguientes identidades básicas se verifican para eventos

1. A ∪ A = A, A∩A=A

2. A ∪ B = B ∪ A, A∩B =B∩A

3. A ∪ Ac = Ω, A ∩ Ac = ∅

4. A ∪ ∅ = A, A∩∅=∅

5. A ∪ Ω = Ω, A∩Ω=A

6. Ωc = ∅ ∅c = Ω, (Ac )c = A

7. A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)

8. (A ∪ B)c = Ac ∩ B c , (A ∩ B)c = Ac ∪ B c

Nota
Sean A1 , A2 , ..., An cualquier colección finita de n eventos,

1. El evento de que ocurra por lo menos uno de ellos se describe por el conjunto:

n
A1 ∪ A2 ∪ ... ∪ An = Ai
i=1

2. El evento de que ocurran todos ellos juntos se describe por el conjunto:



n
A1 ∩ A2 ∩ ... ∩ An = Ai
i=1

73
3. La regla de De Morgan:
[n ]c [ ]c
∪ ∩
n ∩
n ∪
n
Ai = (Ai )c , Ai = (Ai )c
i=1 i=1 i=1 i=1

3.3. Conteo de puntos muestrales


Cuando es grande el número de resultados posibles de un experimento aleatorio, no
suele ser fácil el recuento de tales resultados, por eso, es necesario dar ciertas reglas que
nos faciliten el conteo de puntos muestrales.

Número de puntos muestrales


El número de elemtos de un evento arbitrario A se denota por n(A).
Es evidente que:

n(∅) = 0 y n(A) ≥ 0, para todo evento A


Regla de multiplicación
Si una operación puede realizarse de n1 formas y una segunda operación puede realizarse
de n2 formas, entonces, las dos operaciones pueden realizarse de n1 × n2 formas.
Esto es si A y B son dos conjuntos finitos, entonces, el número de elementos del producto
cartesiano A × B está dado por:
n(A) × n(B)
En general: si A1 , A2 , ..., Ak son k conjuntos finitos, entonces, el número de elementos del
producto cartesiano A1 × A2 × ... × Ak está dado por:

n(A1 ) × n(A2 ) × ... × n(Ak ).

Regla de la adición
1. Si A y B son eventos mutuamente disjuntos, entonces,

n(A ∪ B) = n(A) + n(B)

2. En general, Si A1 , A2 , ..., An son eventos dos a dos mutuamente disjuntos, entonces,



n
n(A1 ∪ A2 ∪ ... ∪ An ) = (Ai ).
i=1

3. Si A y B son eventos cualesquiera, entonces,

n(A ∪ B) = n(A) + n(B) − n(A ∩ B)

4. Si A, B y C son eventos cualesquiera, entonces,

n(A ∪ B ∪ C) = n(A) + n(B) + n(C) − n(A ∩ B) − n(A ∩ C) − n(B ∩ C) + n(A ∩ B ∩ C).

74
3.3.1. Variaciones
A) Variaciones simples
Se denomina variaciones simples de k objetos tomados de n objetos distintos, a cada
uno de los arreglos que se hagan con los k objetos, de manera que estos arreglos
difieran en algún elemento o en el orden de colocación.
El número de variaciones diferentes de k objetos tomados de n objetos distintos,
denotado por Vkn , está dado por:
n!
Vkn =
(n − k)!
Por ejemplo las variaciones de 2 elementos del conjunto A = {a, b, c, d} son los
siguientes arreglos:

ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc.

Con la fórmula se tendrı́a lo siguiente:


4!
V24 = = 12
(4 − 2)!
B) Variaciones con repetición
Se denomina variaciones con repetición de k objetos tomados de n objetos distintos,
a cada uno de los arreglos que se hagan con los k objetos, de manera que estos
arreglos puedan ser uno mismo de los n objetos.
El número de variaciones con repetición de k objetos tomados de n objetos distintos,
denotado por V Rkn , está dado por:

V Rkn = nk

Por ejemplo el número de variaciones con repetición de dos elemntos tomados de 3


elementos distintos es:
V R23 = 32 = 9

3.3.2. Permutaciones
Se denomina permutación de n objetos a cada una de las variaciones de los n objetos.
El número de permutaciones de n objetos distintos, denotado por P n es:

P n = Vnn = n!

Por ejemplo el número de permutaciones del conjunto A = {a, b, c} está dado por:

abc, acb, bac, bca, cab, cba.

Con la fórmula tendrı́amos:


P 3 = V33 = 3! = 6

75
3.3.3. Combinaciones
Se denomina combinación de k objetos tomados de n objetos distintos, a cada selección
que podamos hacer de k objetos de los n objetos dados, sin tener en cuenta el orden de los
mismos y de manera que no pueden haber dos combinaciones con los mismos elementos.
El número de combinaciones de orden k que se puede formar a partir de n elementos
distintos, denotado por Ckn es:
n!
Ckn = .
k!(n − k)!
Por ejemplo las combinaciones de 3 elementos del conjunto A = {1, 2, 3, 4, 5} son:

123, 124, 125, 134, 135, 145, 234, 235, 245, 345.

Con la fórmula tendrı́amos:


5!
C35 = = 10
3!(5 − 3)!
Ejemplo 3.2. una caja contiene 20 tornillos similares, de los cuales 10 son buenos, 8
tienen defectos del tipo A, 5 defectos del tipo B, y 3 los dos tipos de defectos. ¿Cuántos
elementos tiene el espacio muestral que resulta de escoger al azar 11 tornillos de manera
que 2 tengan defectos A y B, 3 defectos sólo A, 2 con defectos sólo B y 4 sin defectos?

Solución
De los 20 tornillos, 10 son buenos, 5 con defectos sólo A, 2 con defectos sólo B y 3 con
defectos A y B.
El número de formas diferentes de extraer 11 tornillos con las condiciones dadas es:

C410 C35 C23 C22 = 6300

Ejemplo 3.3. Hallar el número de maneras diferentes en que se pueden formar números
enteros positivos con los dı́gitos 3,4,5,6,7 de manera que los dı́gitos no se repitan.

Solución
Los números pueden tener de una a cinco cifras, luego el total de números es:

V15 + V25 + V35 + V45 + V55 = 5 + 20 + 60 + 120 + 120 = 325

Ejemplo 3.4. Cuántos elementos tiene el espacio muestral asociado al experimento alea-
torio de extraer al azar 3 bolas rojas de una urna que contiene 6 bolas rojas:

a A la vez

b Una a una sin reposición

c Una a una con reposición

76
Solución

a C36

b 6×5×4

c 6×6×6

3.4. Probabilidad de eventos


Definición 3.1. Sea Ω el espacio muestral asociado a un experimento aleatorio. LA PRO-
BABILIDAD de cualquier evento A ∈ Ω, es el número real P(A) que satisface los siguientes
axiomas:

1. P(A) ≥ 0.

2. P(Ω) = 1

3. Si A y B son dos eventos mutuamente disjuntos, entonces,

P(A ∪ B) = P(A) + P(B).

Teorema 3.1. Si ∅ es el evento imposible, entonces P(∅) = 0.

Teorema 3.2. Si Ac es el evento complementario del evento A, entonces,

P(A) = 1 − P(Ac ), o P(Ac ) = 1 − P(A).

Teorema 3.3. Si A y B son dos eventos cualesquiera tales que A ⊂ B, entonces,

P(A) ≤ P(B)

Teorema 3.4. Si A y B son dos eventos cualesquiera entonces,

P(A ∪ B) = P(A) + P(B) − P(A ∩ B).

Corolario 3.1. Si A, B y C son eventos cualesquiera entonces,

P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C).

Ejemplo 3.5. Suponga que en un sorteo la probabilidad de ganar el primer premio es


2/5 y la probabilidad de ganar el segundo premio es 3/8. Si la probabilidad de ganar al
menos uno de los dos premios es 3/4, calcular la probabilidad de ganar:

Sólo uno de los premios

77
Ninguno de los premios

Solución
Sean los eventos:
A: Ganar el primer premio
B: Ganar el segundo premio
Se tiene que P(A) = 25 , P(B) = 83 , P(A ∪ B) = 3
4
Sabemos que:
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).

Sustituyendo tenemos:
3 2 3
= + − P(A ∩ B)
4 5 8
entonces,
1
P(A ∩ B) =
40
La probabilidad de ganar sólo uno de los premios es:

P((A ∩ B c ) ∪ (Ac ∩ B)) = P(A ∩ B c ) + P(Ac ∩ B)

Pero
P(A ∩ B c ) = P(A) − P(A ∩ B) = 2
5 − 40
1
= 15
40
P(Ac ∩ B) = P(B) − P(A ∩ B) = 3
8 − 40 =
1 14
40
Entonces:
15 14 29
P((A ∩ B c ) ∪ (Ac ∩ B)) = + =
40 40 40
La probabilidadde no ganar ninguno de los premios es:

3 1
P((A ∪ B)c ) = 1 − P(A ∪ B) = 1 − =
4 4

3.5. Probabilidad clásica y probabilidad geométrica


Definición 3.2. (Probabilidad clásica) Sea Ω un espacio muestral finito equiprobable de
n elementos. Si A es cualquier evento del espacio muestral Ω que consiste de k elementos
(0 ≤ k ≤ n), entonces la probabilidad de A es:

n(A) Casos favorables a A


P= =
n(Ω) Casos posibles

Ejemplo 3.6. Una urna contiene 5 fichas similares de las cuales 3 son de color rojo y 2
de color azul. Si de esa urna se extraen al azar 3 fichas a la vez, calcular la probabilidad
de que sólo una de ellas sea de color rojo.

78
Solución
Definamos primero el evento A como:
A: Sólo una de las 3 fichas es de color rojo,
Entonces, en este caso el número de elementos del espacio muestral Ω es igual al número
de formas diferentes de extraer 3 fichas a la vez de la urna que contiene 5 fichas, es decir:
5!
n(Ω) = C35 = = 10.
3!2!
Por otra parte, el número de elemnetos del evento A, es igual al número de formas de
extraer a la vez 3 fichas de las cuales una es roja y dos son blancas, es decir:

n(A) = C13 C22 = 1 × 3 = 3

Luego:
n(A) 3
P(A) = = .
n(Ω) 10
Definición 3.3. (Probabilidad geométrica) Sea Ω un espacio muestral continuo o infinito.
Si A es cualquier evento del espacio muestral Ω tal que la medida (longitud o área) de A
exista, entonces la probabilidad de A es:

m(A)
P(A) =
m(Ω)

Ejemplo 3.7. La demanda de dos productos A y B varı́a aleatoriamente en un rango de


1000 a 5000 kilogramos. El distribuidor decide bajar el precio de venta de ambos productos
si la suma de sus demandas varı́a de 3000 a 5000 kilogramos. Calcular la probabilidad de
que el precio de venta de ambos productos baje.

Solución
Sea:
X: Demanada del producto A, en miles de kilogramos
Y : Demanda del producto B, en miles de kilogramos
El espacio muestral Ω es el conjunto:

Ω = {(x, y) ∈ R2 /1 ≤ x ≤ 5, 1 ≤ y ≤ 5}

Si definimos el evento C como:


C: El precio de ambos productos baja, entonces, en términos de la demanda,

A = {(x, y) ∈ Ω/3 ≤ x + y ≤ 5}

79
En la figura se observa que A es la parte rayada cuya área es:
3×3 1×1
Area(A) = − =4
2 2
Por tanto:
área(A) 4
P(A) = = = 0,25
área(Ω) 4×4

3.6. Probabilidad condicionada e independencia de eventos


Sea B ⊂ Ω un evento aleatorio de probabilidad no nula, P(B) > 0. Para cualquier
otro evento A ⊂ Ω, llamamos probabilidad condicionada de A dado B a la cantidad que
representamos mediante P(A|B) y que se calcula como:
P(A ∩ B)
P(A|B) = .
P(B)
Ejemplo 3.8. Se lanza un dado al aire ¿Cuál es la probabilidad de que salga el número 4?
Si sabemos que el resultado ha sido un número par, ¿se ha modificado esta probabilidad?

Solución
El espacio muestral que corresponde a este experimento es

Ω = {1, 2, 3, 4, 5, 6}

y se ha de calcular la probabilidad del evento A = {4}. Si el dado no está cargado, todos los
números tienen la misma probabilidad de salir, y siguiendo la definición de probabilidad
tenemos:
n(A) Casos favorables a A 1
P= = =
n(Ω) Casos posibles 6
Por otro lado, si ha salido un número par entonces tenemos el evento B = {2, 4, 6},
entonces, por la definición de probabilidad condicional
P(A ∩ B) 1
P(A|B) = =
P(B) 3

80
Observación. Obsérvese que según la definición de probabilidad condicionada, se puede
escribir la probabilidad de la intersección de dos eventos de probabilidad no nula como:

a P(A ∩ B) = P(A)P(B|A)

b P(A ∩ B) = P(B)P(A|B)

O sea, la probabilidad de la intersección de dos eventos, es la probabilidad de uno cual-


quiera de ellos, multiplicada por la probabilidad del segundo sabiendo que ha ocurrido el
primero.

3.6.1. Eventos independientes


Definición 3.4. Si entre dos eventos no existe ninguna relación cabe esperar que la
expresión “sabiendo que” no aporte ninguna información. De este modo introducimos el
concepto de independencia de dos eventos A y B como:

A es independiente de B ⇔ P(A ∩ B) = P(A)P(B)

Esta relación puede ser escrita de modo equivalente, cuando dos eventos son de proba-
bilidad no nula como:

A es independiente de B, con P(A) ̸= 0 ⇔ P(B) = P(B|A)

o
A es independiente de B, con P(B) ̸= 0 ⇔ P(A) = P(A|B)

Teorema 3.5. Si los eventos A y B son independientes, entonces:

1. A y B c son independientes.

2. Ac y B son independientes.

3. Ac y B c son independientes.

Teorema 3.6. Sean A y B dos eventos cualesquiera, tales que P(A|B) exista, entonces
se cumple que:
P(Ac |B) = 1 − P(A|B)

Ejemplo 3.9. En una estación de esquı́, para navidades, la experiencia indica que hay un
tiempo soleado sólo el 15 % de los dı́as. Por otro lado, se ha calculado que cuando un dı́a
es soleado, hay una probabilidad del 20 % de que el dı́a posterior también lo sea. Calcular
la probabilidad de que, en navidades, un fin de semana completo sea soleado.

81
Solución
Llamemos S al evento sábado soleado y D al evento domingo soleado.
La única manera en que un fin de semana completo sea soleado es que lo sea en primer
lugar el sábado, y que el domingo posterior también. Es decir:

P(S ∩ D) = P(S)P(D|S) = 0,15 × 0,2 = 0,03

Luego sólo el 3 % de los fines de semana son soleados.

Ejemplo 3.10. Suponga que en un proceso de producción se utilizan las máquinas, 1 y 2,


que trabajan en forma independiente para producir cierto bien. Si la probabilidad de que
ambas máquinas fallen es 1/5 y de que falle sólo la 2 es 2/15. Calcular la probabilidad de
que.

1. Falle sólo la maquina 1.

2. La producción continue.

Solución
Sean los eventos
A: Falla la máquina 1,
B: Falla la máquina 2,
entonces,
1 2
P(A ∩ B) = , P(Ac ∩ B) = ,
5 15
5
entonces P(B) = 15 .
Además de P(A ∩ B) = P(A)P(B), resulta P(A) = 9
15

1. P(A ∩ B c ) = P(A)P(B c ) = 9
15 × 10
15 = 6
15

2.

P((Ac ∩ B) ∪ (A ∩ B c ) ∪ (Ac ∩ B c )) = P(Ac ∩ B) + P(A ∩ B c ) + P(Ac ∩ B c )


= P(Ac )P(B) + P(A)P(B c ) + P(Ac )P(B c )
6 5 9 10 6 10 12
= × + × + × =
15 15 15 15 15 15 15

Teorema 3.7. (Regla de la multiplicación)

1. Si A y B son dos eventos independientes, entonces:

P(A ∩ B) = P(A)P(B)

Si A y B son dos eventos dependientes, entonces:

P(A ∩ B) = P(A)P(B|A)

82
2. En general, si A1 , A2 , ..., An son n eventos independientes, entonces:

P(A1 ∩ A2 ∩ ... ∩ An ) = P(A1 )P(A2 )...P(An )

Si A1 , A2 , ..., An son n eventos dependientes, entonces:

P(A1 ∩A2 ∩A3 ∩...∩An ) = P(A1 )P(A2 |A1 )P(A3 |A1 ∩A2 )...P(An |A1 ∩A2 ∩...∩An−1 )

Siempre y cuando P(A1 ∩ A2 ∩ ... ∩ An−1 ) > 0

Teorema 3.8. (Probabilidad total) Sean A1 , ..., An eventos dos a dos disjuntos, los únicos
posibles (es decir constituyen una partición de Ω) y con probabilidades positivas. Sea B un
evento arbitrario con P(B) > 0. Entonces


n
P(B) = P(Ai )P(B|Ai ).
i=1

Teorema 3.9. (Regla de Bayes) Sean A1 , ..., An eventos dos a dos disjuntos, los únicos
posibles (es decir constituyen una partición de Ω) y con probabilidades positivas. Sea B un
evento arbitrario con P(B) > 0. Entonces

P(Ai )P(B|Ai )
P(Ai |B) = , para cada i = 1, 2, ..., k
P(B)

n
donde P(B) = P(Ai )P(B|Ai ).
i=1

Ejemplo 3.11. Un lote contiene 15 objetos de los cuales 7 son calificados como E (éxito)
y el resto como F (fracasos). Del lote se escogen 5 objetos al azar una tras otra, calcular
la probabilidad de que los cinco sean éxitos, si las extracciones se hacen:

a Con reposición

b Sin reposición

Solución
Sean los eventos:
Ei : Sale objeto exitoso en la extracción i, i = 1, 2, 3, 4, 5.
Fi : Sale objeto fracasado en la extracción i, i = 1, 2, 3, 4, 5.
Si A es el evento los 5 objetos sustraı́dos sucesivamente son éxitos, entonces,

A = E1 ∩ E2 ∩ E3 ∩ E4 ∩ E5

a Si las extracciones son con reposición los eventos son independientes, entonces

P(A) = P(E1 )P(E2 )P(E3 )P(E4 )P(E5 )


7 7 7 7 7 75
= × × × × = 5
15 15 15 15 15 15

83
b Si las extracciones son sin reposición los eventos son dependientes, entonces

P(A) = P(E1 )P(E2 |E1 )P(E3 |E1 ∩ E2 )P(E4 |E1 ∩ E2 ∩ E3 )P(E5 |E1 ∩ E2 ∩ E3 ∩ E4 )
7 6 5 4 3 V7
= × × × × = 515
15 14 13 12 11 V5

Ejemplo 3.12. Se ha determinado que las probabilidades de que un televidente vea los
programas A, B y C son 0,5, 0,4 y 0,7 respectivamente. ¿Cuál es el porcentaje de televi-
dentes que ven por lo menos dos de los programas?. Se asume que cada persona ve los
programas independientemente uno del otro.

Solución

P (A) = 0,5 , P (B) = 0,4 , P (C) = 0,7

P [(A ∩ B ∩ C c ) ∪ (A ∩ B c ∩ C) ∪ (Ac ∩ B ∩ C) ∪ (A ∩ B ∩ C)]

eventos disjuntos

= P (A ∩ B ∩ C c ) + P (A ∩ B c ∩ C) + P (Ac ∩ B ∩ C) + P (A ∩ B ∩ C)
= P (A) · P (B) · P (C c ) + P (A) · P (B c ) · P (C) + P (Ac ) · P (B) · P (C) + P (A) · P (B) · P (C)
= 0,5 · 0,4 · 0,3 + 0,5 · 0,6 · 0,7 + 0,5 · 0,4 · 0,7 + 0,5 · 0,4 · 0,7
= 0,06 + 0,21 + 0,14 + 0,14
= 0,55

El porcentaje de que los televidentes vean por lo menos dos de los programas es de un
55 %.

Ejemplo 3.13. Un ensamblador de computadoras usa partes que provienen de tres pro-
veedores P1 , P2 y P3 . De 2000 partes recibidas 1000 provienen de P1 , 600 de P2 y el resto de
P3 . De experiencias pasadas, el ensamblador sabe que las partes defectuosas que provienen
de P1 , P2 y P3 son respectivamente 3 %, 4 % y 5 %. Si se elige una computadora al azar,

a ¿Cuál es la probabilidad de que contenga una parte defectuosa?

b Si contiene una parte defectuosa, ¿cuál es la probabilidad de que haya sido proveı́do de
P2 ?

Solución
Sean los eventos:
Ai : Parte proviene del proveedor Pi , i = 1, 2, 3 y

84
B: Parte defectuosa.
Tenemos las siguientes probabilidades:
1000 600 400
P(A1 ) = = 0,5, P(A2 ) = = 0,3, P(A3 ) = = 0,2
2000 2000 2000
P(B|A1 ) = 0,03, P(B|A2 ) = 0,04, P(B|A3 ) = 0,05

Por tanto:

a Aplicando la regla de probabilidad total, se obtiene,

P(B) = P(A1 )P(B|A1 ) + P(A2 )P(B|A2 ) + P(A3 )P(B|A3 )


= 0,5 × 0,03 + 0,3 × 0,04 + 0,2 × 0,05
= 0,037

b Aplicando la regla de Bayes, se obtiene,

P(A2 )P(B|A2 ) 0,3 × 0,04


P(A2 |B) = = = 0,3243
P(B) 0,037

Ejemplo 3.14. Las probabilidades de que los socios S1 y S2 sean elegidos presidente de
su club son respectivamente 0.4 y 0.6. Las probabilidades de que se aumenten las cuotas
mensuales a los socios son de 0.9 si sale elegido S1 y de 0.2 si sale elegido S2 ,

a ¿Cuál es la probabilidad de que haya un aumento en las cuotas mensuales de los socios?

b Si se aumenta las cuotas mensuales ¿cuál socio es mas probable de salir elegido?

Solución
Sean los eventos:
Ai : Sale elegido el candidato Si , i = 1, 2 y
B: Se incrementan las cuotas mensuales a los socios.
Tenemos las siguientes probabilidades:

P(A1 ) = 0,4, P(A2 ) = 0,6, P(B|A1 ) = 0,9, P(B|A2 ) = 0,2

Por tanto:

P(B) = P(A1 )P(B|A1 ) + P(A2 )P(B|A2 )


= 0,4 × 0,9 + 0,6 × 0,2
= 0,48

85
b
P(A1 )P(B|A1 ) 0,4 × 0,9
P(A1 |B) = = = 0,75
P(B) 0,48
P(A2 )P(B|A2 ) 0,6 × 0,2
P(A2 |B) = = = 0,25
P(B) 0,48
La probabilidad de A1 se modifica de 0.4 a 0.75 y la de A2 de 0.6 a 0.25. En conse-
cuencia, se puede concluir que, si se aumentan las cuotas mensuales, probablemente
el socio S2 no sea elegido presidente de su club.

Ejemplo 3.15. Un experimentado estadistico consiste en lanzar dos dados una o dos
veces. Un jugador gana si consigue la suma 7 en el primer lanzamiento; pierde si saca 2
ó 12, si consigue otras sumas no pierde ni gana, en este último caso tiene opción para
un segundo lanzamiento y si en este segundo lanzamiento consigue la suma 7 pierde, en
caso contrario gana y termina el juego ¿Cuál es la probabilidad que el jugador pierda?
Solución
A: Gana 7....1ro
B: Pierde 2 ó 12
C: Otros → juega otra vez
A : Gana 7...1ro
B : Pierde 2 ó 12 Gana

C : otros → juega otra vez

Pierde

6
Gana =
36

2 30
P → Pierde = Gana
36 36
↘ ↗
28
No pierde ni gana
36

6
Pierde
( )( ) 36
2 28 6
P (Pierde) = +
36 36 36
2 168
P (Pierde) = +
36 1296
P (Pierde) = 0, 184

Ejemplo 3.16. Un ingeniero toma un autobús o un microbús para ir a su trabajo con


probabilidades de 0,3 y 0,7 respectivamente. 30 % de la veces que toma el autobús llega

86
tarde al trabajo, mientras que 20 % de las veces que toma el microbús llega tarde a su
trabajo.

a Si llega tarde al trabajo en un dı́a particular, ¿cúal es la probabilidad de que haya


tomado el autobús?

b Si llega temprano al trabajo un dı́a cualquiera, ¿cúal es la probabilidad que haya tomado
el microbús?

Solución

a) A : Ingeniero toma el autobús T : LLega tarde


M : Ingeniero toma el microbús T c : No llega tarde

T → 0,30
0,3 → A→
T c → 0,70
T → 0,20
0,7 → M → c
T → 0,80

P (T ) = P (A) · P (T | A) + P (M ) · P (T | M )
= 0,3 · 0,30 + 0,7 · 0,20
= 0,23

P (A) · P (T | A)
P (A | T ) =
P (T )
0,3 · 0,30
=
0,23
= 0,39

b)

P (M ) · P (T c | M )
P (M | T c ) =
P (T c )
0,7 · 0,80
=
0,77
= 0,73

Ejemplo 3.17. Se estima que la probabilidad de que una compañia B tenga éxito al
comercializar un producto es de 0.95 si su competidora la compañia A no interviene en
el mercado, y es de 0.15 si la compania A interviene en el mercado. Si se estima que A
intervendrı́a en el mercado con probabilidad de 0.7.

a ¿Cuál es la probabilidad de que la compañia B tenga éxito?

87
b Si la compañia B no tuviera éxito, ¿en cuanto se estima la probabilidad de que A
intervenga en el mercado?

Solución
Sea los eventos: B: La compañia B tiene éxito
A: La compañia A interviene en el mercado
tenemos las siguientes probabilidades:
P(A) = 0,7, P(Ac ) = 0,3, P(B|A) = 0,15, P(B|Ac ) = 0,15
P(B c |A) = 0,85, P(B c |Ac ) = 0,05

P(B) = P(A)P(B|A) + P(Ac )P(B|Ac )


= 0,7 × 0,15 + 0,3 × 0,95
= 0,39

P(B c ) = P(A)P(B c |A) + P(Ac )Pc (B|Ac )


= 0,7 × 0,85 + 0,3 × 0,05
= 0,61

Si B no tuviera éxito, la probabilidad de que A intervenga en el mercado es:

P(A)P(B c |A) 0,7 × 0,85


P(A|B c ) = c
= = 0,975
P(B ) 0,61

88
3.7. Ejercicios propuestos
1. A un departamento de mercadeo se le ha solicitado que diseñe códigos de color para
las 42 lı́neas de discos compactos vendidos por Godoy Records. Se han de utilizar
tres colores en cada lı́nea, pero una combinación de tres colores empleados para una
de ellas no puede reordenarse y ser utilizada para identificar una distinta lı́nea de
CD.

a ¿Serán adecuados siete colores tomados tres a la vez para codificar por color todas
las lı́neas?
b ¿Cuántos colores serı́an suficientes?

2. Al montar un equipo electrónico, seis alambres se conectan a una caja que tiene seis
terminales. ¿De cuántas formas pueden conectarse los alambres a las terminales si
sólo entra un alambre en cada terminal?

3. ¿De cuántas maneras puede un profesor escoger uno o más estudiantes a partir de
seis elegibles.

4. Suponga que hay ocho máquinas disponibles pero sólo tres espacios en el piso del
taller donde se han de instalar tales máquinas. ¿De cuántos modos diferentes pueden
colocarse las ocho en los tres espacios disponibles?

5. Un entrenador de fútbol tiene un equipo formado por 11 jugadores de los cuales uno
es su hijo. ¿Cuántos quintetos de basketball se pueden formar si su hijo siempre debe
estar dentro del quinteto?

6. En un edificio de 10 pisos entran al ascensor, en el primer piso, 3 personas. cada una


baja al azar a partir del segundo piso. ¿De cuántas maneras posibles éstas personas
pueden bajar en pisos diferentes?

7. Una caja contiene 8 dulces de piña, 6 de naranja y 4 de fresa. ¿Cuántos elementos


tiene el espacio muestral que resulta de extraer un dulce al azar de cada sabor?

8. Una compañı́a desea ascender a 3 de sus 10 gerentes a posiciones de vicepresidentes


deventas , de manufacturas y de finanzas. Hallar el número de formas distintas de
efectuar los ascensos.

9. Un microbús tiene 29 asientos para pasajeros, distribuidos en 6 filas de 4 asientos


cada uno, con un pasillo en le medio y al final 5 asientos juntos. ¿De cuántas maneras
diferentes podrán ubicarse 25 pasajeros de modo tal, que los 14 asientos que dan a
las ventanillas queden ocupados?

89
10. La empresa de rodajes ZQF ha producido un lote de 50 rodajes especiales. Estos
han sido colocados en tres cajas para enviarlos a los proveedores. Al proveedor A
le enviarán 25 rodajes, al proveedor B 10 rodajes y al proveedor C los restantes. El
supervisor sabe que existen 4 rodajes defectuosos. Determine el número de formas
posibles de hacer los envı́os si se quiere que los cuatro rodajes defectuosos lleguen al
mismo proveedor

11. Un estudiante planea matricularse en los cursos A, B y C. Los horarios de A son a


las 8,11 y 15 horas. Los de B son a las 8,10 y 15 horas y los de C a las 10,12 y 15
horas. Si las clases son de una hora, ¿cuántos horarios distintos puede preparar en
los 3 cursos de manera que no haya cruces?

12. ¿De cuántas formas pueden instalarse en lı́nea 5 focos blancos y 6 focos rojos si
deben colocarse

a alternadamente
b los blancos juntos?

13. ¿Cuántas señales distintas pueden hacerse con cinco banderas distintas agrupándolas
de tres en tres y sin que se repita ninguna? ¿Y agrupándolas de todas las formas
posibles (es decir, de una en una, de dos en dos, etc)?

14. Se tienen nueve puntos en un plano. Cuatro de ellos están alineados y los restantes
están dispuestos de forma que no hay nunca 3 alineados. ¿Cuántos triángulos pueden
formarse que tengan sus vértices sobre esos 9 puntos? ¿Cuántas rectas distintas
determinan esos puntos?

15. En una fábrica hay varios centros de almacenamiento, cada uno de los cuales está uni-
do a los demás por una cinta transportadora. Calcula el número de centros de la
fábrica si se sabe que el número de cintas transportadoras es 66.

16. Con las letras de la palabra BRAVO, ¿cuántas ordenaciones distintas pueden hacerse
de forma que no haya dos vocales juntas?

17. Averiguar cuántos números mayores que 200 y menores que 700 pueden formarse
con las cifras 1, 2, 3, 4, 5, 6, 7 sin que tengan cifras repetidas. Responde a la misma
cuestión en el caso de que las cifras se puedan repetir.

18. Una organización estudiantil tiene que elegir un delegado y un subdelegado. Hay 7
candidatos. ¿Cuántas combinaciones se pueden hacer con los candidatos para realizar
la selección?

90
19. ¿Cuál es el número de colocaciones diferentes de 7 libros en una estanterı́a de modo
que tres libros determinados estén siempre separados entre sı́?

20. ¿Cuántos números de cinco cifras se pueden escribir con cuatro dos y cuatro cincos?

21. ¿Cuál es el tamaño mı́nimo de una población para que exista al menos un dı́a al año
(de 365 dı́as) donde coincidan la fecha del aniversario de nacimiento de al menos
nueve personas?

22. En una carrera de maratón intervienen 4 españoles, 4 italianos, 4 ingleses y 4 france-


ses. Supuesto que terminan la carrera todos los corredores, cuántos podios distintos
pueden darse al acabar la carrera en los cuales no hay españoles.

23. ¿Cuántas permutaciones del conjunto de números 1, 2, 3, 4, 5 y 6, satisfacen la


condición: el 1 está en primera posición y el 4 en la tercera?

24. De cuántas formas 5 hombres y 3 mujeres se pueden sentar alrededor de una mesa
redonda de modo que dos mujeres no se encuentren juntas. (Dos formas son iguales
si se llega de una a otra por rotación. No importa únicamente el sexo sino también
que persona es)

25. Con las cifras 0,1,2,3,4,5,6,7,8 se forman números de cinco cifras, ¿Cuántos números
diferentes pueden formarse sin repetir cifras?

26. En una cafeterı́a hay 4 tipos de bocadillos para comer. ¿De cuántas maneras distintas
se pueden elegir seis bocadillos de entre los 4 tipos?

27. Sea E un alfabeto con 5 vocales y 21 consonantes. ¿Cuántas palabras de 5 letras


pueden formarse con las letras de E, tales que la primera y la última letras sean
vocales distintas y las otras tres sean consonantes distintas?

28. Con los dı́gitos 1,2,3,4,5 se forman números de tres cifras. ¿Cuántos números dife-
rentes pueden formarse sin repetir cifras que sean múltiplos de 3?

29. ¿Cuántas permutaciones del conjunto de números {1,2,3,4,6,9} satisfacen la condi-


ción de que en la primera posición y en la última haya un múltiplo de 3?

30. En una carrera de maratón intervienen 4 corredores por cada uno de los 4 equipos.
Supuesto que terminan la carrera todos los corredores, ¿cuántos resultados distintos
pueden darse al acabar la carrera en los cuales no hay ningún corredor del equipo A
entre los tres primeros?

31. ¿Cuántas permutaciones del conjunto de números 1,2,3,4,5 y 6, satisfacen la condi-


ción: el 1 está en primera posición y el 4 en la tercera?

91
32. Se tienen çadenas”formadas por dos letras seguidas de cuatro dı́gitos y otras tres
letras más. No están permitidas las repeticiones de letras y dı́gitos dentro de cada
grupo, pero el último grupo de tres letras puede contener una o dos de las utilizadas
al principio de la cadena. ¿Cuántas cadenas distintas se pueden formar si el número
de letras disponibles es 26?

33. Un comerciante tiene 12 unidades de cierto artı́culo de los cuales 4 tienen algún
tipo de defecto. Un cliente muy exigente quiere comprar 3 de tales artı́culos pero
le explica al comerciante que si alguno contienen defectos devolverá la compra y
pedirá la devolución de su dinero. Si el comerciante escoge al azar y a la vez 4 de
tales artı́culos, ¿cuál es la probabilidad de que con esos 4 artı́culos pueda atender
satisfactoriamente al cliente?

34. Se va a seleccionar a 3 alumnos de 10 alumnos candidatos compuesto de 7 hombres y


3 mujeres para una determinada tarea. El seleccionador no sabe que los 10 alumnos
están calificados de 1 a 10, según su eficiencia en esa tarea. Calcular la probabilidad
de que la terna contenga

a Uno de los 2 mejores y dos de los 3 peores candidatos.


b Por lo menos una mujer.

35. En una muestra de 120 loretanos se encontró que el 60 % sufre alguna enfermedad,
el 30 % tienen al menos 30 años, y el 20 % son menores de 30 años y sanos. Si uno
de tales loretanos es escogido al azar, ¿cuál es la probabilidad

a De que sufra alguna enfermedad y tenga al menos 30 años?


b De que sufra alguna enfermedad si tiene al menos 30 años?

36. Un sistema está formado por dos componentes A y B. Si la probabilidad de que A


falle es 0,7 y la de que B fracase es 0,8 ¿qué probabilidad hay de que:

a el sistema siga funcionando bien.


b ambos componentes fallen.
c falle cualquiera de ellos.

37. Un producto está formado de tres partes A, B y C. El proceso de fabricación es tal


que la probabilidad de defecto es en A 0,03, en B 0,04 y en C 0,08. Probabilidad de
que el producto no sea defectuoso.

38. Se ha comprobado que en una ciudad están enfermos con diarrea el 60 % de los niños,
con sarampión el 50 % y el 20 % con ambas enfermedades.

92
a) Probabilidad de que elegido un niño al azar, esté enfermo con diarrea, sarampión
o ambas.
b) En un colegio con 450 niños, ¿Cuántos cabe esperar que estén enfermos con
diarrea o sarampión?

39. Una caja contiene 8 bolas rojas, 4 azules y 6 verdes. Se extraen 3 bolas al azar y se
desea saber:

a) La probabilidad de que las tres sean rojas.


b) La probabilidad de que dos sean rojas y una verde.
c) La probabilidad de que dos sean azules y la otra de otro color.
d) La probabilidad de que todas sean de distinto color.
e) La probabilidad de que todas sean del mismo color.

40. Una caja contiene 2 bolas blancas, 3 negras y 4 rojas. Otra contiene 3 blancas, 5
negras y 4 rojas. Se toma una bola al azar de cada caja. ¿Qué probabilidad hay de
que sean del mismo color?

41. . En una bolsa hay 8 bolas rojas, 10 negras y 6 blancas. Tres niños sacan, sucesiva-
mente, dos bolas cada uno, sin reintegrar ninguna. Hallar la probabilidad de que el
primero saque las dos rojas, el segundo las dos negras y el tercero las dos blancas?

42. Se tiene tres urnas de igual aspecto. En la primera hay 3 bolas blancas y 4 negras;
en la segunda hay 5 negras y en la tercera hay 2 blancas y 3 negras. Se desea saber:

a) Si se extrae una bola de una urna, elegida al azar, cuál es la probabilidad de que
la bola extraı́da sea negra.
b) Se ha extraı́do una bola negra de una de las urnas. ¿Cuál es la probabilidad de
que haya sido extraı́da de la 2a urna?

43. Entre cincuenta varones que asisten a un partido de fútbol, se trata de ubicar a uno
que viste de chompa azul, pantalón negro y tiene los ojos verdes. Se sabe que hay
20 que tienen chompa azul, 15 pantalón negro y 18 tienen los ojos verdes. Hay 7
con chompa azul y pantalón negro y no tienen los ojos verdes, 4 con chompa azul
y ojos verdes y no tienen pantalón negro, 6 con pantalón negro y ojos verdes pero
sin chompa azul. Además los varones que tienen una sola caracterı́stica del buscado
suman 16. Si se extrae al azar a uno de estos varones, ¿cuál es la probabilidad que
tenga ojos verdes o chompa azul pero no pantalón negro?

44. En un lote de producción hay 25 productos, 5 de los cuales tienen defectos menores
y 9 tienen defectos mayores, si se toman de este lote tres productos, determine la
probabilidad de que:

93
a) El primer producto no tenga defectos y que el segundo y tercero tengan defectos
mayores.
b) El primer producto tenga defectos menores, el segundo tenga defectos mayores
y que el tercero no tenga defectos.
c) El primer producto y el tercero no tengan defectos.

45. Probar que:

P((Ac ∩ B) ∪ (A ∩ B c )) = P(A) + P(B) − 2P(A ∩ B)

46. De las 100 personas que asisten a un congreso 40 hablan francés, 40 inglés, 51 cas-
tellano, 11 francés e inglés, 12 francés y castellano y 13 inglés y castellano. Se eligen
al azar dos asistentes y se desea saber:

a) ¿Cuál es la probabilidad de que ninguno hable francés?


b) ¿Cuál es la probabilidad de que hablen castellano?
c) ¿Cuál es la probabilidad de que se entiendan sólo en castellano?
d) ¿Cuál es la probabilidad de que sólo hablen un idioma?
e) ¿Cuál es la probabilidad de que hablen los tres idiomas?

47. Un estudiante hace dos pruebas el mismo dı́a con probabilidades 0.6 de pasar la
primera, 0.8 la segunda y 0.5 ambas. Se pide:

a) Probabilidad de pasar al menos una prueba.


b) Probabilidad de no pasar ninguna prueba.
c) Probabilidad de pasar sólo una de las pruebas.

48. Comprobar si la siguiente igualdad es correcta:


m m−1
Cnm = C
n n−1

49. Un monedero contiene monedas de medio sol en número igual a 4 veces el número
de monedas de 20 céntimos, y contiene monedas de un sol en número igual a 3 veces
el número de monedas de medio sol. Si se elige una moneda al azar, calcular la
probabilidad de que su valor sea al menos de medio sol.

50. En un conjunto de 132 personas, se sabe que el número de los que saben Word, Excel
y C++ es igual a : 1/6 de los que saben sólo Word, 1/5 de los que saben sólo Excel,
1/4 de los que saben sólo C++, 1/2 de los que saben Word y Excel, 1/3 de los que
saben Word y C++, 1/4 de los que saben Excel y C++. Si se extrae una persona al
azar, ¿cuál es la probabilidad de que dicha persona sepa Word o Excel?

94
51. Se escogen al azar tres computadoras entre 15 , de los cuales cinco son defectuosas.
Hallar la probabilidad de que:

a) ninguna sea defectuosa.


b) una exactamente sea defectuosa.
c) una por lo menos sea defectuosa

52. En una fábrica de calzado se manufactura independientemente costura (toda la parte


superior del calzado relacionada con el cuero), suela y tacón, siendo estas partes
armadas aleatoriamente en cada zapato. Se sabe que en este proceso, el 5 % de las
costuras, el 4 % de las suelas y el 1 % de los tacones tienen fallas; ¿qué porcentaje
de pares de zapatos resulta:

a Con fallas en sus tres componentes.


b Sin fallas en sus tres componentes.

53. Cuatro amigos que se dirigen a un lugar, toman 4 rutas diferentes de acuerdo al
riesgo que se corre de tener algún accidente. Si se le asignan las probabilidades de
riesgo para cada ruta: 0,2 ; 0,15 ; 0,25 ; 0,10. Hallar la probabilidad;

a Que ninguno tenga dificultades.


b Que los cuatro sufran accidentes.
c Que los dos primeros sufran accidentes y los restantes no.

54. Entre los 200 empleados de un departamento. Hay 150 graduados, 60 del total con-
sagran parte de su tiempo por lo menos a trabajos de estadı́stica y 40 de los 150
graduados dedican parte de su tiempo por lo menos a trabajos de estadı́stica. Si se
toma al azar uno de estos empleados, ¿cuál es la probabilidad de que no sea graduado
y no trabaje en estadı́stica?

55. En una encuesta de opinión se encontró que el 25 % de los electores votarı́an por
el candidato E. De los que no votarı́an por E el 20 % son mujeres y el resto son
hombres. Además la probabilidad de que un elector elegido al azar sea hombre es de
0.7. Si se elige un elector al azar y resulta ser mujer, ¿cuál es la probabilidad de que
no vote por E?

56. Un lote contiene n objetos. La probabilidad de que al menos uno sea defectuoso es
0.06, mientras que la probabilidad de que al menos dos sean defectuosos es 0.04.
Calcular la probabilidad de que:

a todos los objetos sean no defectuosos

95
b exactamente un objeto sea defectuosos

57. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras
realizadas por estas, el 80 % supera los $ 200, mientras que de las compras realizadas
por hombres sólo el 30 % supera esa cantidad.

a Elegido un ticket de compra al azar, ¿cuál es la probabilidad de que supere los


$200?
b Si se sabe que el ticket de compra no supera los $ 200 ¿cuál es la probabilidad de
que la compra haya sido hecha por una mujer?

58. Pruebe que si A y B son Eventos independientes, entonces :

a P(B|A) = P(B|Ac ).
b Ac , y B c son también eventos independientes

59. En una oficina hay dos computadoras A y B que trabajan de manera independiente.
Si en un momento cualquiera la probabilidad de que la máquina B este en mal estado
es 1/4 y la probabilidad de que sólo la maquina A este en mal estado es 3/10, ¿cuál
es la probabilidad de que solo la maquina B este en malas condiciones?

60. En una etapa de la producción de un artı́culo se aplica soldadura y para eso se usan
tres diferentes robots. La probabilidad de que la soldadura sea defectuosa varı́a para
cada uno de los tres, ası́ como la proporción de artı́culos que cada uno procesa, de
acuerdo a la siguiente tabla. Robot Defectuosos Art. procesados

Robot Defectuosos Artı́culos procesados


A 0.002 18 %
B 0.005 42 %
C 0.001 40 %

a ¿Cuál es la proporción global de artı́culos defectuosos producida por las tres


máquinas?
b Si tomo un artı́culo al azar y resulta con defectos en la soldadura, ¿cuál es la
probabilidad de que haya sido soldado por el robot C?

61. Una alumna está indecisa con relación a que si se matricula en el curso de estadı́stica o
en el curso de quı́mica. Aunque ella realmente prefiere matricularse en quı́mica estima
que su probabilidad de aprobar estadı́stica es 1/4 mientras que su probabilidad de
aprobar quı́mica es 1/3. Si la alumna decide matricularse en uno de estos cursos
mediante el lanzamiento de una moneda, ¿cuál es la probabilidad de que ella apruebe
el curso de quı́mica?

96
62. Un sistema de comunicación binario transmite 0 o 1. Por causas del ruido del sis-
tema a veces un 0 transmitido se recibe como un 1 y viceversa. Suponiendo que la
probabilidad de que un 0 se transmita incorrectamente es 0,06, que la probabilidad
de que un 1 se transmita correctamente es 0,90, y que la probabilidad de transmitir
un 0 es de 0,45. Calcular la probabilidad de que en una transmisión no haya error.

63. La probabilidad de que Cecilia estudie para su examen final de estadı́stica es 0,20. Si
estudia, la probabilidad de que apruebe el examen es 0,80 en tanto que si no estudia
la probabilidad es de sólo 0,50.

a ¿cuál es la probabilidad de que Cecilia apruebe su examen final de estadı́stica?


b dado que Cecilia aprobó su examen, ¿cuál es la probabilidad de que ella haya
estudiado?

64. Al examinar los registros anteriores de los balances de una compañı́a, un auditor
descubre que el 15 % contienen errores. Además, 60 % de estos balances incorrectos
fueron considerados valores inusuales basándose en los datos anteriores. El 20 %
de todos los balances se consideraron también valores inusuales. Si los datos de
un determinado balance parecen ser inusuales, ¿cuál es la probabilidad de que sea
incorrecto?

65. El señor Vásquez tiene tres secretarias con diferentes niveles de competencia. La
secretaria A ha escrito el 20 % de un trabajo, la secretaria B el 40 % y la secretaria
C el 40 %. Hay un error ortográfico que irrita en especial al señor Vásquez, y éste ha
calculado que A lo comete el 90 % de las veces que tiene que escribir la palabra en
cuestión, que B lo comete el 40 % de las veces y C nunca.

a ¿cuál es la probabilidad de que no encuentre error?


b Si el señor Vásquez encuentra ese error en una página del trabajo, ¿cuál es la
probabilidad de que esa página lo haya escrito la secretaria A?
c Si no encuentra error, ¿cuál es la probabilidad de que dicha página haya sido
escrita por la secretaria B?

66. Cierta enfermedad en drogadictos se caracteriza por la ocurrencia de al menos uno de


dos trastornos. La probabilidad de que ocurra el primer trastorno en un drogadicto
es 0.10; y la probabilidad de que ocurra solo el segundo trastorno es 0.29. Determinar
la probabilidad de que ocurra dicha enfermedad en un drogadicto.

67. Un cuadro clı́nico se manifiesta por la ocurrencia de tres sı́ntomas (1, 2 y 3). Un
grupo de pacientes que posiblemente presenten este cuadro ingresan en un hospital
especializado, la probabilidad de que uno de estos pacientes posea el sı́ntoma 1 es

97
0.95. Uno de cada cuatro pacientes que presentan el sı́ntoma 1 también presentan el
sı́ntoma 2. Además se sabe que el 75 % de estos pacientes que presentan los sı́ntomas
1 y 2 también presentan el sı́ntoma 3. ¿Cuál es la probabilidad de que un paciente
posea el cuadro clı́nico?

68. Se debe realizar dos inversiones. La probabilidad de que se realice la inversión I es


0.3. Si se realiza la inversión I, la probabilidad de ganar 5000 soles es 0.4. Si se realiza
la inversión II, La probabilidad de ganar 5000 soles es 0.1.

a ¿Cuál es la probabilidad de que se realice la inversión I y se gane 5000 soles?


b ¿Cuál es la probabilidad de que se realice la inversión II y se gane 5000 soles?
c ¿Cuál es la probabilidad de que se gane 5000 soles?
d Si se gano 5000 soles, ¿cuál inversión es la más probable de haber sido realizada?

69. El estilo de ventas de un vendedor temperamental es fuertemente afectado por el


éxito o fracaso de su intento precedente de ventas. Si él acaba de hacer una venta su
confianza y efectividad aumentan y la probabilidad de vender a su siguiente prospecto
es 3/4. Cuando fracasa, su manera es tı́mida y la probabilidad de que él venda a su
siguiente prospecto es solamente 1/3. Suponga que la probabilidad de que él venda
a su primer contacto en un dı́a dado es 1/2. Hallar la probabilidad de que él haga
cuando menos dos ventas a sus primeros tres contactos en un dı́a dado.

70. El profesor López dicta un curso de Estadı́stica y quiere tomar una prueba en cada
clase. Sabedor de que a veces se olvida de ir a hacer su clase, ha dado instrucciones a
su jefe de prácticas que se haga cargo de la clase cuando él está ausente. Si el profesor
López hace la clase, la probabilidad es 0,70 de que tome la prueba en tanto que si el
jefe de prácticas hace la clase, esta probabilidad es de sólo 0,10. Si el profesor López
falta el 80 % de las clases:

a ¿cuál es la probabilidad de que haya una prueba en una clase dada?


b Suponiendo que hubo prueba en una clase determinada, ¿cuál es la probabilidad
de que el profesor López haya estado ausente?

71. En un supermercado cada cliente decide, independientemente de los demás, si compra


o no compra un artı́culo en promoción. Se sabe que le 75 % de los clientes compran
un artı́culo en promoción. Suponga que 4 clientes (1, 2, 3 y 4) ingresan en el super-
mercado. Sean los eventos: Ai el cliente i decida comprar un artı́culo en promoción,
. Use estos eventos para calcular las siguientes probabilidades:

a Ninguno de los cuatro clientes decida comprar un artı́culo en promoción.

98
b Sólo uno de los cuatro clientes decida comprar un artı́culo en promoción.
c Sólo dos de los cuatro clientes decida comprar un artı́culo en promoción.
d Sólo tres de los cuatro clientes decida comprar un artı́culo en promoción.

72. Con el fin de ganar 5000 soles un inversionista realizará una de tres opciones. La
probabilidad de que se realice la opción 1 es 0.3. Si se realiza la opción 1, la pro-
babilidad de ganar 5000 soles es 0.4. Si se realiza la opción 2, lo cual ocurre con
probabilidad 0.2, la probabilidad de ganar 5000 soles es 0.1. Cuando se realiza la
opción 3, la probabilidad de ganar 5000 soles es 0.25. Cuantificar la confianza del
inversionista en esta situación.

73. Tres máquinas, A, B y C, producen el 45 %, 30 % y 25 %, respectivamente, del total


de las piezas producidas en una fábrica. Los porcentajes de producción defectuosa
de estas máquinas son del 3 %, 4 % y 5 %, respectivamente.

a Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa.


b Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de
haber sido producida por la máquina B.
c ¿Qué máquina tiene la mayor probabilidad de haber producido la citada pieza
defectuosa?

74. Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y 1 negra y
C con 2 bolas rojas y 3 negras. Escogemos una urna al azar y extraemos una bola.
Si la bola ha sido roja, ¿cuál es la probabilidad de haber sido extraı́da de la urna A?

75. En un saquito hay papeletas de tres colores, con las siguientes probabilidades de
ser elegidas: a) Amarilla: probabilidad de 0.50, b) Verde: probabilidad de 0.30 c)
Roja: probabilidad de 0.20. Según el color de la papeleta elegida, podrás participar
en diferentes sorteos. Ası́, si la papeleta elegida es: a) Amarilla: participas en un
sorteo con una probabilidad de ganar de 0.40. b) Verde: participas en otro sorteo
con una probabilidad de ganar de 0.60 c) Roja: participas en un tercer sorteo con
una probabilidad de ganar de 0.80. Con esta información, ¿qué probabilidad tienes
de ganar el sorteo en el que participes?

76. En un hospital especializado en enfermedades de tórax ingresan un 50 % de enfermos


de bronquitis, un 30 % de neumonı́a y un 20 % con gripe. La probabilidad de curación
completa en cada una de dichas enfermedades es, respectivamente, 0,7; 0,8 y 0,9. Un
enfermo internado en el hospital ha sido dado de alta completamente curado. Hallar
la probabilidad de que el enfermo dado de alta hubiera ingresado con bronquitis.

99
77. Hay una epidemia de cólera. Un sı́ntoma muy importante es la diarrea, pero ese
sı́ntoma también se presenta en personas con intoxicación, y, aún, en personas que
no tienen nada serio. La probabilidad de tener diarrea teniendo cólera, intoxicación
y no teniendo nada serio es de 0,99; 0,5 y 0,004 respectivamente. Por otra parte, se
sabe que el 2 % de la población tiene cólera, el 0,5 % intoxicación y el resto (97,5 %),
nada serio. Se desea saber:

a) Elegido un individuo de la población ¿Qué probabilidad hay de que tenga diarrea?


b) Se sabe que determinado individuo tiene diarrea ¿Cuál es la probabilidad de
tenga cólera?

78. En una población de ratas el 70 % son de los Andes y el 30 % del Himalaya. Entre las
andinas el 30 % tienen las orejas rosadas y entre las del Himalaya el 50 %. Se elige al
azar una rata y tiene las orejas rosadas, calcular la probabilidad de que sea andina.

79. Una enfermedad puede ser producida por tres virus A, B y C. En un laboratorio se
tienen tres tubos con virus A, dos con virus B y cinco con virus C. La probabilidad de
que el virus A produzca la enfermedad es 1/3, la de B 2/3 y la de C 1/7. Se inocula
al azar un virus a un animal y contrae la enfermedad. ¿Cuál es la probabilidad de
que el virus que se le inoculó fuera de tipo C?

80. Un psicólogo de una empresa de seguros ha estudiado el comportamiento de los


conductores y ha constatado que la probabilidad de que un conductor sobrio tenga
un accidente es de 0,001 y uno ebrio 0,5. La probabilidad de conducir borracho es
de 0,01. Hallar la probabilidad de que se produzca un accidente y al hacer la prueba
de alcoholemia dé positivo.

81. De una cesta de 20 higos, 4 están podridos. Se saca uno y se mete en otra cesta con
6 podridos y 18 buenos. Extraemos un higo de la segunda cesta y no está podrido,
Calcular la probabilidad de que el primero estuviera bueno.

82. Un gran número de personas que viven en una sección determinada de una comuni-
dad han estado expuestas durante los últimos diez años a la radiactividad procedente
de un vertedero en el que se almacenan deshechos atómicos. Se realiza una inves-
tigación para descubrir si hay alguna asociación aparente entre la exposición y el
desarrollo de una cierta enfermedad de la sangre. Para llevar a cabo el experimento
se eligen muestras aleatorias de 300 personas en la comunidad que han estado ex-
puestas al peligro y 320 no expuestas. En ambos grupos, se determinó el número de
personas que tenı́an la citada enfermedad. Los resultados se muestran en la siguiente
tabla:

100
Tiene la enfermedad No tiene la enfermedad
Expuesto a la radioactividad 52 248 300
No expuesto a la radioactividad 48 272 320
100 520 620

a) ¿Cuál es la probabilidad de que, tomado un individuo al azar, haya estado ex-


puesto a la radiactividad? ¿Y de que tenga la enfermedad?
b) ¿Cuál es la probabilidad de que tomado un individuo al azar tenga la enfermedad
ó haya estado expuesto a la radiactividad? ¿Cuál es la probabilidad de que haya
estado expuesta a la radiactividad y no tenga la enfermedad?
c) ¿Puede considerarse que tener la enfermedad es independiente de haber estado
expuesto a la radiactividad?
d) Sabiendo que un individuo, tomado al azar, tiene la enfermedad, ¿cuál es la
probabilidad de que haya estado expuesto a la radiactividad?

83. Unos estudios muestran que los ejemplares de una cierta raza de liebres de alta
montaña (liebre esquiadora) mueren antes de lo normal, aún en ausencia de depre-
dadores o de enfermedad conocida alguna. Dos de las causas de muerte identificadas
son: baja cantidad de azúcar en sangre, y convulsiones. Se estima que el 7 % de los
animales presenta ambos sı́ntomas, el 40 % bajo nivel de azúcar en sangre, y el 25 %
sufre de convulsiones.

a) ¿Cuál es el porcentaje de muertes producidas por causas que no sean las men-
cionadas?
b) ¿Cuál es la probabilidad de que una liebre recientemente muerta, tomada al azar,
registre bajo nivel de azúcar en sangre y haya, además, muerto con convulsio-
nes?
c) ¿Pueden considerarse independientes ambos fenómenos (descenso de azúcar, y
convulsiones)?
d) ¿Cuál es la probabilidad de que una liebre presente bajo nivel de azúcar, pero
no convulsiones? ¿Y de que no presente ninguno de los dos sı́ntomas?
e) ¿Cuál es la probabilidad que presente un único sı́ntoma?
f ) Sabiendo que el animal ha presentado convulsiones, ¿cuál es la probabilidad de
que presente también azúcar en sangre?
g) Sabiendo que el animal no presentaba bajo nivel de azúcar, ¿cuál es la probabi-
lidad de que tampoco tuviera convulsiones?

101
84. El mecanismo de un sistema de alarma consta de dos partes A y B, que funcio-
nan independientemente. Para que el sistema salte ante una emergencia, alguno de
los mecanismos (puede que ambos) debe detectar la emergencia. La probabilidad
de que A funcione correctamente, es del 90 %. La probabilidad de que B funcione
correctamente, es del 95 %.

a) ¿Cuál es la probabilidad de que, ante una emergencia, el mecanismo no funcione


correctamente? ¿Cuál la de que funcione correctamente?
b) Sabiendo que el mecanismo ha funcionado, ¿cuál es la probabilidad de que A sin
embargo no haya saltado?

85. Con base en varios estudios una compañı́a ha clasificado, de acuerdo con la posibi-
lidad de descubrir petróleo, las formaciones geológicas presentes en una cierta zona
en tres tipos, I, II, III. Aproximadamente el 35 % de las formaciones de la zona co-
rresponden al tipo I, el 40 % al tipo II y el resto al tipo III. Además, de acuerdo con
la experiencia se sabe que el petróleo aparece en un 40 % de formaciones de tipo I,
en un 20 % de formaciones de tipo II y en un 30 % de formaciones de tipo III. La
compañı́a perfora en un determinado sitio de esa zona.

a) Calcula la probabilidad de descubrir petróleo.


b) Si la perforación ha encontrado petróleo, calcula la probabilidad de que se haya
debido a una formación del tipo II.

86. Una planta armadora industrial recibe microcircuitos procedentes de tres fabricantes
A, B, C. El 50 % del total se compra a A, mientras que a B y C se les compra un
25 % a cada uno. El porcentaje de circuitos defectuosos para A, B, C es 5, 10 y 12 %
respectivamente. Si los circuitos se almacenan en la planta sin importar quién fue el
proveedor:

a) Determinar la probabilidad de que una unidad armada en la planta contenga un


circuito defectuoso.
b) Si un circuito está defectuoso, ¿cuál es la probabilidad de que haya sido vendido
por el proveedor B?

87. Tras un vertido contaminante en un rı́o, se sabe que el rı́o puede recuperarse total o
parcialmente, siendo la probabilidad de que el se recupere totalmente igual al 80 %.
Caso de recuperarse, la probabilidad de que una cierta especie de pez que vive en
sus aguas alcance de nuevo una población similar a la que tenı́a antes del vertido,
es del 90 %. En cambio, si la recuperación es parcial dicha probabilidad se reduce al
30 %.

102
a) ¿Cuál es la probabilidad de que la población de peces alcance de nuevo el tamaño
de antes del vertido?
b) Si efectivamente se detecta un año más tarde que la población de peces ha recu-
perado el tamaño inicial, ¿cuál es la población de que el ecosistema del rı́o se
haya recuperado totalmente?

103
Capı́tulo 4

Variables aleatorias

4.1. Introducción
Normalmente, los resultados posibles (espacio muestral Ω) de un experimento aleatorio
no son valores numéricos. Por ejemplo, si el experimento consiste en lanzar de modo
ordenado tres monedas al aire, para observar el número de caras (C ) y sellos (S ) que se
obtienen, el espacio muestral asociado a dicho experimento aleatorio serı́a:

Ω = {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}

En estadı́stica resulta más fácil utilizar valores numéricos en lugar de trabajar directamen-
te con los elementos de un espacio muestral como el anterior. Ası́ preferimos identificar los
eventos {CSS, SSC, SSC} con el valor numérico 1 que representa el número de caras ob-
tenidas al realizar el experimento. De este modo aparece el concepto de variable aleatoria,
X, unidimensional como el de toda función

X : Ω→R
ω 7→ X(ω) = x

que atribuye un único número real x, a cada evento elemental ω, del espacio muestral Ω.

El dominio de una variable aleatoria es Ω y el rango es un subconjunto de los números


reales que denotaremos por RX , siendo,

RX = {x ∈ R/x = X(ω), ω ∈ Ω}

Por ejemplo, en el ejemplo anterior, se define la variable aleatoria

X ≡ Número de caras

del siguiente modo


X:Ω→R

104
X(CCC) = 3

X(CCS, CSC, SCC) = 2


X(CSS, SCS, SSC) = 1

X(SSS) = 0

Observación
La variable X no recibe el calificativo de aleatoria por el hecho de que atribuya de modo
imprevisible un valor cualquiera a un elemento ya que este valor está definido de forma
precisa (determinı́stica). Lo que es aleatorio en realidad, es que al hacer el experimento,
no sabemos qué elemento de Ω puede ocurrir.

La composición de una función real con una variable aleatoria es también variable
aleatoria, pues está definida sobre Ω y a cada elemento suyo le asocia un valor real, es
decir:
X : Ω → R, G : R → R

enonces:

G(X) = G ◦ X : Ω → R
ω 7→ G(X(ω))

En función de los valores que tome la variable, esta puede ser clasificada en discreta o
continua del siguiente modo:
Variable aleatoria discreta es aquella que sólo puede tomar un número finito o
infinito numerable de valores. Ejemplo:

X:Ω→N

Variable aleatoria continua es aquella que puede tomar un número infinito no nume-
rable de valores.
X:Ω→R

4.2. Variable aleatoria discreta y función de probabilidad


Si sobre los elementos de Ω existe una distribución de probabilidad, esta se transmite
a los valores que toma la variable X. Es decir, toda v.a. conserva la estructura proba-
bilı́stica del experimento aleatorio que describe, en el sentido de que si PX es la función
de probabilidad definida sobre el espacio muestral Ω, ésta induce otra función P definida
sobre R, de forma que conserva los valores de las probabilidades:

P(X = x) = PX [{ω ∈ Ω/X(ω) = x}]

105
P(X ∈ [a, b]) = PX [{ω ∈ Ω/X(ω) ∈ [a, b]}]

De ahora en adelante utilizaremos solo la expresión P(X = x) o P(X ∈ [a, b])

4.2.1. Función de probabilidad


Dada una v.a. discreta X : Ω → N, su función de probabilidad f , se define de
modo que f (xi ) es la probabilidad de que X tome ese valor:

f : N → [0, 1]
xi 7→ f (xi ) = P (X = xi )

Si xi no es uno de los valores que puede tomar X, entonces f (xi ) = 0. La representación


gráfica de la función de probabilidad se realiza mediante un diagrama de barras análogo
al de distribución de frecuencias relativas para variables discretas

Ejemplo 4.1. Si retomamos el caso del lanzamiento de 3 monedas de forma que cada una
de ellas tenga probabilidad 1/2 de dar como resultado cara o sello, se tiene que:

1 1 1 1
f (3) = P(X = 3) = P[{CCC}] = × × =
2 2 2 8
1 1 1 1 1 1 1 1 1 3
f (2) = P(X = 2) = P[{CCS, CSC, SCC}] = × × + × × + × × =
2 2 2 2 2 2 2 2 2 8
1 1 1 1 1 1 1 1 1 3
f (1) = P(X = 1) = P[{CSS, SCS, SSC}] = × × + × × + × × =
2 2 2 2 2 2 2 2 2 8
1 1 1 1
f (0) = P(X = 0) = P[{SSS}] = × × =
2 2 2 8
Observación Obsérvese que X está definido sobre el espacio muestral de sucesos Ω,
mientras que f lo está sobre el espacio de números reales R.

Toda función de probabilidad f (x) debe satisfacer las siguientes condiciones

i) f (x) ≥ 0, ∀x ∈ R

ii) f (xi ) = 1
xi ∈RX

La condición ii)

n
Es : f (xi ) = 1, si RX = {x1 , x2 , ..., xn } es finito
i=1



Es : f (xi ) = 1, si RX = {x1 , x2 , x3 , ...} es infinito
i=1

106
Nota
1. Si A ⊂ R, entonces, la probabilidad de A, es el número:
∑ ∑
P(A) = P(X = xi ) = f (xi ).
xi ∈A xi ∈A

2. La función de probabilidad de una variable aleatoria X se puede expresar(cuando el


rango es finito) por una tabla como la siguiente:

Valores xi de X x1 x2 x3 ... xn
Probabilidad pi = P(X = xi ) p1 p2 p3 ... pn

4.2.2. Función de distribución acumulada de la v.a. discreta


La función de distribución acumulada (f.d.a.), F (x), de la variable aleatoria discreta x,
cuya función de probabilidad es f (x), se define por:
∑ ∑
F (x) = P(X ≤ x) = P(X = k) = f (k), para − ∞ < x < ∞.
k≤x k≤x

Esta función se representa gráficamente del mismo modo que la distribución de frecuencias
relativas acumuladas.
Ejemplo 4.2. En el ejemplo de las 3 monedas, calcular la función de probabilidades,
función de distribución acumulada, y graficarlas.
Solución
1 1 1 1
f (3) = P(X = 3) = P[{CCC}] = × × =
2 2 2 8
1 1 1 1 1 1 1 1 1 3
f (2) = P(X = 2) = P[{CCS, CSC, SCC}] = × × + × × + × × =
2 2 2 2 2 2 2 2 2 8
1 1 1 1 1 1 1 1 1 3
f (1) = P(X = 1) = P[{CSS, SCS, SSC}] = × × + × × + × × =
2 2 2 2 2 2 2 2 2 8
1 1 1 1
f (0) = P(X = 0) = P[{SSS}] = × × =
2 2 2 8
Valores xi de X 0 1 2 3
Probabilidad f (xi ) = P(X = xi ) 1/8 3/8 3/8 1/8
Luego la f.d.a. es
1
F (0) = P(X ≤ 0) = f (0) =
8
1 3 4
F (1) = P(X ≤ 1) = f (0) + f (1) = + =
8 8 8
1 3 3 7
F (2) = P(X ≤ 2) = f (0) + f (1) + f (2) = + + =
8 8 8 8
1 3 3 1 8
F (3) = P(X ≤ 3) = f (0) + f (1) + f (2) + f (3) = + + + = = 1
8 8 8 8 8

107
Es decir, 

 0 si x<0



 si 0 ≤ x < 1
 1/8
F (x) = 4/8 si 1 ≤ x < 2



 7/8 si 2 ≤ x < 3



1 si x≥3

Proposición 4.1. La función de distribución F , es una función no decreciente, es decir,

Si x1 < x2 ⇒ F (x1 ) ≤ F (x2 )

Además, es continua a la derecha

lı́m F (x) = F (a)


x→a+

y
F (−∞) = lı́m F (x) = 0
x→−∞

F (+∞) = lı́m F (x) = 1


x→+∞

4.3. Variable aleatoria continua y función de densidad


Si una variable discreta toma los valores x1 , ..., xk , tenemos:


k ∑
k
f (xi ) = P(X = xi ) = 1
i=1 i=1

Aun cuando la variable tomase un número infinito de valores, x1 , x2 , ..., no hay ningún
problema en comprobar que cada xi contribuye con una cantidad f (xi ) al total, de modo

108
que

∑ ∞

f (xi ) = P(X = xi ) = 1
i=1 i=1

Cuando la variable es continua, no tiene sentido hacer una suma de las probabilidades de
cada uno de los términos en el sentido anterior, ya que el conjunto de valores que puede
tomar la variable es no numerable. En este ∫ caso, lo que generaliza de modo natural el

concepto de suma ( ) es el de integral ( ). Por otro lado, para variables continuas no
tiene interés hablar de la probabilidad de que X = x ∈ R, ya que esta siempre vale 0.
De este modo es necesario introducir un nueva definición para v.a. continuas,

Definición 4.1. Se dice que la función f (x), f : R −→ R, es función de densidad de


la v.a. continua X si satisface las siguientes condiciones:

i) f (x) ≥ 0
∫ +∞
ii) f (x)dx = 1
−∞

iii) P(A) = P(X ∈ A) = f (x)dx, para cualquier intervalo A ∈ R
A

y que además verifica que dado a < b, se tiene que,


∫ b
P(a ≤ X ≤ b) = f (x)dx
a

109
Observación
Por ser f una función integrable, la probabilidad de un punto es nula:
∫ a
P(X = a) = P(a ≤ X ≤ a) = f (x)dx = 0
a

y por ello al calcular la probabilidad de un intervalo no afectara nada el que este sea
abierto o cerrado por cualquiera de sus extremos, pues estos son puntos y por tanto de
probabilidad nula:

P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a < X < b)

Ejemplo 4.3. Sea f (x) una función definida en todos los números reales por
{
cx2 si 0≤x≤2
f (x) =
0 otro caso

a Hallar el valor de la constante c para que f (x) sea una función de densidad para alguna
variable aleatoria X.

b Calcular P(0 < X ≤ 1).

Solución

a Sabemos que el área bajo la curva es igual a uno, entonces:


∫ +∞ ∫ 2 [ ]2
2 x3 8
1= f (x)dx = cx dx = c =c
−∞ 0 3 0 3

resultando c = 38 . Luego
{
3x2
8 si 0≤x≤2
f (x) =
0 otro caso

b [ 3 ]1
∫ 1
3x2 x 1
P(0 < X ≤ 1) = dx = =
0 8 8 0 8

4.3.1. Función de distribución acumulada de la v.a. continua


Definición 4.2. La función de distribución acumulada (f.d.a.), F (x), de una variable
aleatoria continua X con función de densidad f (x), se define por:
∫ x
F (x) = P(X ≤ x) = f (t)dt, para − ∞ < x < +∞.
−∞

110
Ejemplo 4.4. La función de densidad de una variable aleatoria continua X, es descrita
por: {
ce−βx si x ≥ 0
f (x) =
0 si x < 0

a Determinar el valor de la constante c.

b Hallar la función de distribución acumulada F (x) de la v.a. X

Solución

a ∫ ∫ [ ]
+∞ +∞
1 2 1
1= f (x)dx = ce−βx dx = c 0 + =c
−∞ 0 β 0 β
resultando c = β. Luego
{
βe−βx si x ≥ 0
f (x) =
0 si x < 0
∫ x
b Si x < 0, F (x) = 0, Si x ≥ 0, F (x) = P(X ≤ x) = βe−βt dt = 1 − e−βx
0

4.3.2. Propiedades de la función de distribución acumulada


a P(a ≤ X ≤ b) = F (b) − F (a).

b Dada la f.d.a. F (x) de una v.a. discreta con rango RX = {x1 , x2 , ..., xk }, entonces la
función de probabilidad f (x) de X es:

f (xi ) = P (X = xi ) = F (xi ) − F (xi−1 )

donde F (x) = 0 para todo x < x1 .

c Dada la f.d.a. F (x) de una v.a. continua X, entonces su función de densidad f (x) es
igual a la derivada de la f.d.a. con respecto a x, donde ésta exista, esto es,
d d
f (x) = F (x), ∀x tal que F (x) exista.
dx dx
∫ x
En efecto, si F (x) = f (t)dt, entonces, f (x) = F ′ (x) para todo x donde exista
−∞
la derivada F ′ (x).

Ejemplo 4.5. Si la f.d.a. F (x) de una variable aleatoria X se define por:


{
1 − ke−x/5 si x ≥ 0
F (x) =
0 si x < 0

111
a Hallar la constante k y la función de densidad.

b ¿Para qué valor de la costante c es P(X ≥ c) = 0,01?

Solución

a F (+∞) − F (0) = (1 − k × 0) − (1 − k × e0 ) = 1, entonces K = 1. Luego,


{
1 −x/5
dF (x) 5e si x ≥ 0
f (x) = =
dx 0 si x < 0

b 0,01 = P(X ≥ c) = 1 − P(X < c) = 1 − F (c) = 1 − (1 − e−c/5 ).


De donde resulta, c = 23.

Ejemplo 4.6. Si la variable aleatoria continua X tiene función de densidad:


{
1
4 si 2≤x≤6
f (x) =
0 otro caso
Determine la función de densidad de la variable aleatoria Y = 3X − 4.

Solución
( ) ( )
y+4 y+4
FY (y) = P(Y ≤ y) = P(3X − 4 ≤ y) = P X ≤ = FX
3 3
y+4
entonces FY (y) = FX (u), donde u = 3

luego
dFY (y) dFX (u) du 1 y+4
g(y) = = × = f (u) donde u = .
dy du dy 3 3
Por tanto, {
1
12 si 2 ≤ y ≤ 14
g(y) =
0 otro caso

4.4. Valor esperado o esperanza matemática


La distribución de probabilidad de una variable aleatoria se caracteriza básicamente a
través de medidas de la tendencia central y de la dispersión. Estas medidas caracterı́sti-
cas de la distribución, denominadas parámetros se describen por medio de la esperanza
matemática

Definición 4.3. Sea X una v.a. discreta. Se denomina esperanza matemática de X o


valor esperado, y se denota bien E(X) o bien µX , a la cantidad que se expresa como:

E(X) = xi f (xi )
xi ∈RX

112
Definición 4.4. Sea X una v.a. continua. Se denomina esperanza matemática de X o
valor esperado, y se denota bien E(X) o bien µX , a la cantidad que se expresa como:

E(X) = xf (x)dx
RX

Observación
Resulta, entonces, que en el caso discreto:
∑ ∑
E(X) = xi f (xi ) = xi P (X = xi )
xi ∈RX xi ∈RX

Ası́ la esperanza o media es el promedio de los valores posibles de la variable aleatoria con
sus respectivas probabilidades.
Propiedad básica del valor esperado
Sea X una variable aleatoria y GX : RX −→ R una función. Entonces, la esperanza de la
variable aleatoria puede obtenerse usando la distribución de probabilidades de X, según
sea esta discreta o continua, como se indica a continuación:

Si X es discreta, entonces:

E(G(X)) = G(x)f (x)
x∈RX

Si X es continua, entonces:

E(G(X)) = G(x)f (x)dx
RX

Observación
Resulta, entonces, que en el caso discreto:
∑ ∑
E(G(X)) = G(x)f (x) = G(x)P (X = x)
x∈RX x∈RX

4.4.1. Propiedades del valor esperado


1. Si a y b son constante reales, entonces,

E(aX + b) = aE(X) + b.

2. Como consecuencia de la propiedad 1) se tiene

E(b) = b.
E(X + b) = E(X) + b.
E(aX) = aE(X).

113
3. Si X e Y son variables aleatorias y a y b son constante reales, entonces,

E(aX + bY ) = aE(X) + bE(Y ).

En particular se tiene:

E(X + Y ) = E(X) + E(Y ).


E(X − Y ) = E(X) − E(Y ).

4. Si X e Y son variables aleatorias independientes y a y b son constante reales, enton-


ces,
E(aXbY ) = abE(X)E(Y ).

En particular, si X e Y son variables aleatorias independientes, entonces:

E(XY ) = E(X)E(Y ).

Ejemplo 4.7. Calcular el valor esperado de la distribución de probabilidad de la variable


aleatoria que se define como el número de caras cuando se lanzan cuatro monedas.

Solución
Sea:
X: El número de caras que se obtienen al lanzar cuatro monedas.
La distribución de probabilidad de X se da en la siguiente tabla:

Valores xi de X 0 1 2 3 4
Probabilidad f (xi ) = P(X = xi ) 1/16 4/16 6/16 4/16 1/16

El valor esperado de X es el número


4 ( ) ( ) ( ) ( ) ( )
1 4 6 4 1
E(X) = xf (x) = 0 +1 +2 +3 +4 =2
16 16 16 16 16
x=0

Esto significa que si una persona lanza 4 monedas, muchas veces, en promedio obtendrá 2
caras por lanzamiento

Ejemplo 4.8. La vida útil de un objeto en miles de horas, es una variable aleatoria
continua X cuya función de densidad es:
{
1 − x2 si 0≤x≤2
f (x) =
0 otro caso

Calcular la esperanza de vida del objeto.

114
Solución
∫ ∫ ( [ 2 ]2
2
x) x x3 2
E(X) = xf (x)dx = x 1− dx = − =
RX 0 2 2 6 0 3
En consecuencia, puede esperarse que la vida útil promedio del objeto sea de 2
3 × 1000 =
666,67 horas

Ejemplo 4.9. Suponga que un juego al azar consiste en lanzar un dado y que el jugador
puede ganar $ 7, si obtiene al menos 5 puntos, o perder $2 en caso contrario.

a ¿Cuánto espera ganar en el juego el jugador?

b ¿Cuánto deberı́a ganar para el juego sea justo?

Solución
Sea:
X: Puntaje obtenido al lanzar el dado,
Entonces X toma los valores 1,2,3,4,5,6

La distribución de probabilidades de X está dado en la siguiente tabla:

Valores xi de X 0 1 2 3 4 5 6
Probabilidad f (xi ) = P(X = xi ) 1/16 1/6 1/6 1/6 1/6 1/6 1/6

a La función utilidad de este juego, es definida por:


{
7 si x = 5, 6
U (x) =
−2 si x = 1, 2, 3, 4


6 ( ) ( ) ( ) ( ) ( ) ( )
1 1 1 1 1 1
E(U (X)) = U (x)f (x) = −2 −2 −2 −2 +7 +7 =1
6 6 6 6 6 6
i=1

b Para que el juego sea justo entonces E(U (X)) = 0, primero definamos la utilidad:
{
k si x = 5, 6
U (x) =
−2 si x = 1, 2, 3, 4


6 ( ) ( ) ( ) ( ) ( ) ( )
1 1 1 1 1 1
E(U (X)) = U (x)f (x) = −2 −2 −2 −2 +k +k =0
6 6 6 6 6 6
i=1
entonces: ( ) ( )
1 1
−8 + 2k =0
6 6
2k = 8
k=4
Para que el juego sea justo se deberı́a ganar $4.

115
4.5. Varianza
2 , cuya media
La varianza de una variable aleatoria X, denotado por Var(X), o por σX
o esperanza es E(X), se define como:
[ ]
Var(X) = E (X − E(X))2

donde:
[ ] ∑
a Si X es discreta se tiene: Var(X) = E (X − E(X))2 = x∈RX (x − E(X))2 P(X = x)
[ ] ∫
b Si X es continua se tiene: Var(X) = E (X − E(X))2 = (x − E(X))2 f (x)dx
RX

Observación
La desviación estándar mide la variabilidad promedio en relación a la media. Por medio
de la propiedad básica del valor esperado, puede verificarse que:

Var(X) = E(X 2 ) − [E(X)]2

Esta ultima es la mas usada en el calculo de probabilidades.

4.5.1. Propiedades de la varianza


1. Var(X) ≥ 0

2. Si a y b son constante reales, entonces.

Var(aX + b) = a2 Var(X)

Como consecuencia de la propiedad 2 se tiene:

Var(b) = 0 donde b es constante


Var(X + b) = Var(X)
Var(aX) = a2 Var(X)

3. Si X e Y son variables aleatorias independientes y a y b son constante reales, enton-


ces,
Var(aX + bY ) = a2 Var(X) + b2 Var(Y )

En particular se tiene:

Var(X + Y ) = Var(X) + Var(Y )


Var(X − Y ) = Var(X) + Var(Y )

116
Ejemplo 4.10. Calcular la varianza y la desviación estándar de la distribución de proba-
bilidad de la variable aleatoria X que se define como el número de caras al lanzar cuatro
monedas.

Solución
Sea la variable aleatoria X definida como:
X: Número de caras al lanzar cuatro monedas.
La distribución de probabilidad de X es:

Valores xi de X 0 1 2 3 4
Probabilidad f (xi ) = P(X = xi ) 1/16 4/16 6/16 4/16 1/16

y en el ejemplo 4.7 se ha calculado que E(X) = 2. Además


4 ( ) ( ) ( ) ( ) ( )
1 4 6 4 1
E(X 2 ) = (x2 )f (x) = 02 + 12 + 22 + 32 + 42 =5
16 16 16 16 16
x=0

Por lo tanto:
Var(X) = E(X 2 ) − [E(X)]2 = 5 − (2)2 = 1.

La desviación estándar de X es:



σX = Var(X) = 1.

Ejemplo 4.11. La vida útil de un objeto en miles de horas, es una variable aleatoria
continua X cuya función de densidad es:
{
1 − x2 si 0≤x≤2
f (x) =
0 otro caso

Calcular la varianza y la desviación estándar de X.

Solución
En el ejemplo 4.8 se calculo el valor esperado de X resultando, E(X) = 23 , además:
∫ ∫ ( [ 3 ]2
2
x) x x4 2
2
E(X ) = 2
(x )f (x)dx = 2
x 1− dx = − =
RX 0 2 3 8 0 3

Por lo tanto: [ ]2
2 2 2
Var(X) = E(X ) − [E(X)] = −
2
= 2
3 3 9
La desviación estándar de X es:

√ 2
σX = Var(X) = .
9

117
Ejemplo 4.12. El número de defectos de un producto es una variable aleatoria X cuya
función de probabilidad se da en la siguiente tabla.
Valores xi de X 0 1 2 3 4 5
Probabilidad f (xi ) = P(X = xi ) 1/10 2/10 3/10 2/10 1/10 1/10
Si el costo del producto está dado por la expresión:

C = 4 + 2X − 0,2X 2

determinar el costo esperado del producto.

Solución
E(X) = 0 × 0,1 + 1 × 0,2 + 2 × 0,3 + 3 × 0,2 + 4 × 0,1 + 5 × 0,1 = 2,3
E(X 2 ) = 02 × 0,1 + 12 × 0,2 + 22 × 0,3 + 32 × 0,2 + 42 × 0,1 + 52 × 0,1 = 7,3
E(C) = 4 + 2E(X) − 0,2E(X 2 ) = 4 + 2 × 2,3 − 0,2 × 7,3 = 7,14

Ejemplo 4.13. Consideremos una variable aleatoria continua con función de densidad,
{
cx3 si 0≤x≤1
f (x) =
0 otro caso

Calcular:

a El valor de la constante c para que sea una función de densidad.

b La función de distribución acumulada (f.d.a).

c La media o valor esperado.

d Probabilidad de que la variable este comprendida entre 0,2 y 0,7.

Solución

a Por ser función de densidad se cumple que:


∫ 1 ∫ 1 [ 4 ]1
x 1
f (x)dx = 1 = 3
cx dx = c ⇒ c = 1 ⇒ c = 4.
0 0 4 0 4
{
4x3 si 0≤x≤1
f (x) =
0 otro caso
∫ x ∫ x [ ]x
3 4t4
b F (x) = f (t)dt = 4t dt = = x4
0 0 4 0
Luego la función de distribución acumulada es:


 0 si x<0
F (x) = x si 0 ≤ x < 1
4


1 si x≥1

118
c El valor esperado es:
∫ 1 ∫ 1 [ ]1
4x5 3 4
E(x) = xf (x)dx = x(4x )dx = =
0 0 5 0 5

d
P(0,2 ≤ X ≤ 0,7) = F (0,7) − F (0,2) = 0,74 − 0,24 = 0,24

Ejemplo 4.14. La variable aleatoria continua X tiene como función de densidad:




 0 si x<0
f (x) = 1 si 0 ≤ x ≤ 1


0 si x>1

Calcular:

a Media

b Varianza

c P(0,2 ≤ X ≤ 0,8)

Solución

a Sabemos que::
∫ 1 ∫ 1 [ ]1
x2 1
µX = E(X) = xf (x)dx = x(1)dx = =
0 0 2 0 2

b Por definición tenemos que,Var(X) = E(X 2 ) − [E(X)]2 , entonces:


∫ 1 ∫ 1 [ ]1
2 2 2 x3 1
E(X ) = x f (x)dx = x (1)dx = =
0 0 3 0 3

entonces: [ ]2
1 1 1
Var(X) = E(X ) − [E(X)] = −2
= 2
3 2 12
c ∫ ∫
0,8 0,8
P(0,2 ≤ X ≤ 0,8) = f (x)dx = 1dx = [x]0,8
0,2 = 0,8 − 0,2 = 0,6
0,2 0,2

Ejemplo 4.15. Una tienda de comestibles comercializa diariamente un producto que


compra a $8 y vende a $10 cada unidad. Debido a que el producto es perecedero, las
unidades que se quedan sin vender al final del dı́a se desechan; perdiendo además del
costo $1 por unidad. El tendero ha establecido que la distribución de probabilidades de la
demanda diaria del producto es la que se da en la siguiente tabla.

119
Demanda D 0 10 20 30 40 50
Probabilidad 1/10 1/10 2/10 3/10 2/10 1/10
Si el tendero comercializa 30 unidades diariamente, ¿cuánto serı́a su utilidad esperada?
Solución

vende compra pierde


D=0 U = 0 − 8(30) − 30
U = −240 − 30
U = −270
D = 10 U = 10(10) − 8(30) − 20
U = 100 − 240 − 20
U = −160
D = 20 U = 20(10) − 8(30) − 30
U = 200 − 240 − 30
U = −50
D = 30 U = 30(10) − 8(30) − 0
U = 300 − 240
U = 60
D = 40 U = 30(10) − 8(30) − 0
U = 300 − 240
U = 60
D = 50 U = 30(10) − 8(30) − 0
U = 300 − 240
U = 60


 −270 1/10 D =0



 −160

 1/10 D = 10

 −50 2/10 D = 20
U=

 60 3/10 D = 30





 60 2/10 D = 40

 60 1/10 D = 50

Entonces
( ) ( ) ( ) ( ) ( )
1 1 2 2 1
U (x) = −270 − 160 − 50 + 60 + 60
10 10 10 10 10
U (x) = −27 − 16 − 10 + 18 + 12 + 6
U (x) = −17

Ejemplo 4.16. La fracción de tiempo X, que una computadora está en uso udrante un
dı́a de trabajo de 8 horas, es una variable aleatria con función de densidad:

120
{
2x si 0≤x≤1
f (x) =
0 otro caso

a Calcular la esperanza de X

b Hallar la varianza de X

c Hallar el valor esperado del costo por el uso de la computadora si èste es:

C(x) = 5 + 3x + 0, 1x2

Solución

a Calcular la varianza
∫ ∫1 ∫1
E(x) = Rx xf (x)dx = o x(2x) = 0 2x2
[ 2 ]1
2x
3 0
2
E(x) =
3
b Hallar la varianza
[ ]1
∫ ∫1 ∫1 x4 1
E(x2 ) = (x2 )f (x)dx = 0 x2 (2x) = 0 2x3 = =
2 0 2
1
E(x2 ) =
2
Var(x) = E(x2 ) − [E(x)]2
1 4 1
Var(x) = − =
2 9 18
1
Var(x) =
18
c Hallar el valor esperado X el costo del uso de la computadora

C(x) = 5 + 3x + 0, 1x2

C(x) = 5 + 3E(x) + 0, 1E(x2 )


2 1
C(x) = 5 + 3. + 0, 1( )
3 2
C(x) = 7 + 0, 05

C(x) = 7, 05

121
4.6. Ejercicios propuestos
1. El número de hijos por familia de una determinada región es una variable aleatoria
X cuya función de probabilidad es:

Valores xi de X 0 1 2 3 4
Probabilidad f (xi ) = P(X = xi ) 1/16 4/16 k 4/16 1/16

a Calcular el valor de la constante k.


b Si una familia tiene al menos dos hijos ¿cuál es la probabilidad de que tenga tres
hijos?

2. Se venden 500 boletos de una rifa que consiste de un premio de $200, 4 premios de
$50, y 10 premios de $5. Si cada boleto cuesta $1, y si usted adquiere un boleto,

a hallar la función de probabilidad de la utilidad.


b Que probabilidad Hay de ganar algún premio.
c Hallar la f. d. a. de la utilidad.

3. Un objeto producido puede contener, en forma independiente, a lo más tres tipos


de defectos: A con probabilidad 0.04, B con probabilidad 0.08 y C con probabilidad
0.05. Si se selecciona al azar uno de tales objetos,

a ¿qué probabilidad hay de que sea defectuosa?


b hallar la distribución de probabilidades del número de defectos del objeto.

4. Del total de personas que se presentan para un puesto de trabajo el 60 % son hombres
y el resto mujeres. Aquellos que reúnen todos los requisitos para dicho puesto son el
40 % de los hombres y el 50 % de las mujeres. De tres personas que se presentan.

a Hallar la distribución de probabilidades del número de personas que cubren el


puesto de trabajo.
b ¿Cuál es la probabilidad de que al menos dos personas consigan el puesto de
trabajo?

5. Para describir la distribución del número de semanas, X, en la que una inversión es de


alto riego, durante cierto perı́odo de 8 semanas, se asume como modelo probabilı́stico
a la función:
c(5x )
f (x) =
x|
También se sabe que por lo menos en una semana (de este perı́odo)la inversión
será de alto riesgo, pero no en todas las semanas tendremos una inversión de alto
riesgo.

122
a Determinar el rango de la variable aleatoria .
b ¿Cuál es el valor de la constante c?
c Determinar la probabilidad de que en más de la mitad de las semanas de (de este
periodo) la inversión sea de alto riesgo.
d Determinar la probabilidad de que en más de dos de las semanas de (de este
periodo) la inversión sea de alto riesgo, pero no en todas las semanas la inversión
es de alto riesgo
e Cuantas semanas se espera que la inversión sea de alto riego.

6. Sea X una variable aleatoria con f.d.a F (x), defina de la siguiente forma:


 0 si x<0



 0≤x<2
 0,2 si
F (x) = 0,7 si 2≤x<6


 0,9 si
 6≤x<8



1 si x≥8

a Hallar P(X ≤ 6).


b Hallar la función de probabilidades de X.
c Hallar f (4).

7. El tiempo de espera (en minutos) de un pasajero en un paradero de ómnibus en el


intervalo [0,5] es una v.a. continua X cuya función de densidad es:
{
c
5 si 0≤x≤5
f (x) =
0 otro caso

a Halle el valor de c y la f.d.a. F (x) de X.


b Calcule la probabilidad de que el pasajero espere al menos 2 minutos
c Calcule la probabilidad de que el pasajero espere exactamente 2 minutos
d ¿Cuánto es el tiempo máximo de espera para que tome el ómnibus con probabili-
dad 3/5?

8. Suponga que el tiempo de vida de una componente electrónica, en miles de horas,


es una v.a. X cuya función de densidad tiene la gráfica siguiente:

123
a Determinar c y la función de densidad f (x) de X.
b Hallar la función de distribución acumulada de X.
c Hallar la probabilidad de que el tiempo de vida, de la componente sea mayor que
1000 horas.

9. Un embarque de ocho microcomputadoras similares que se envı́a a un distribuidor


contiene 3 aparatos defectuosos. Si un colegio realiza una compra aleatoria de dos
de estas computadoras; encontrar la distribución de probabilidad para el número de
computadoras defectuosas.

10. En un problema de una prueba aplicada a niños pequeños, se les pide que hagan
corresponder cada uno de los 3 dibujos de animales con la palabra que identifica a
ese animal. Si un niño asigna aleatoriamente las 3 palabras a los 3 dibujos, encontrar
la distribución de probabilidad para X, definida como el número de correspondencias
correctas.

11. Suponga que el ingreso familiar mensual, en miles de unidades monetarias u.m., en
una ciudad, es una v.a continua con función de densidad:
{
4k si 0 ≤ x < 1
f (x) =
k(5 − x) si 1 ≤ x ≤ 5

a Determinar el valor de la constante k.


b Calcular el porcentaje de familias con ingresos mensuales de alo más 2000 u.m.

12. Cierto productor fabrica un bien cuya demanda semanal, en toneladas es una variable
aleatoria X, con rango 0 y 10 toneladas, y función de densidad,

1
f (x) = , x ∈ RX .
10
Cada tonelada producida le cuesta 10 mil soles y la vende en 25 mil soles. Toda
cantidad que no se logra vender se pierde sin generar un costo adicional al de su
fabricación. Suponga que en cierta semana el productor decide fabricar 5 toneladas.

a ¿Cuál es la probabilidad de satisfacer la demanda?


b ¿Cuál es la probabilidad de satisfacer la demanda y al mismo tiempo el productor
gane más de 30 mil soles?
c ¿Cuál es la probabilidad de que la demanda no sea satisfecha?
d ¿Cuál es la probabilidad de que el productor gane más de 30 mil soles?

124
13. La demanda semanal, en miles de galones, de gasolina en una estación de servicios
es una v.a. continua X cuya función de densidad está dada por la siguiente gráfica:

a Determinar la función de densidad de la v.a. X.


b Hallar la f.d.a. de X y graficarla.
c ¿Qué cantidad de gasolina debe tener semanalmente la estación de servicios para
satisfacer la demanda en el 62.5 % de las semanas?

14. Un fabricante de aparatos de televisión ofrece un año de garantı́a de restitución


gratuita si el tubo de imagen falla. El fabricante estima el tiempo de falla, X, definida
como una variable aleatoria con la siguiente función de densidad:
{
0,25e−0,25x si x≥0
f (x) =
0 si x<0
¿Qué porcentaje de aparatos tendrá que reparar?

15. Suponga que el número de llamadas telefónicas que recibe una central en un perı́odo
de tiempo, es una variable aleatoria X, cuya función de probabilidad:
e−λ (λ)x
f (x) = , x = 0, 1, ..., λ = constante
x|
Calcular la media del número de llamadas en ese perı́odo
∑∞
z zk
Sug. e =
k|
k=0

16. Suponga que un juego consiste en lanzar un dado y que si se obtiene al menos 5
puntos se gana $2, en caso contrario se pierde el número obtenido en dólares.

a Defina la función utilidad en el juego.


b Calcular la utilidad esperada en el juego

17. Suponga que la vida útil en años de cierto tipo de computadoras es una variable
aleatoria X con función de densidad,
{
2 − 2x si 0≤x ≤1
f (x) =
0 otro caso

125
El distribuidor ofrece una garantı́a de 6 meses. Si la computadora falla en ese perı́odo
se remplazará por otra, a lo más una sola vez. Si cada computadora tiene el costo
de fabricación de $400 y el precio de venta de $900, ¿cuánto es la utilidad esperada
por computadora?

18. Una urna contiene ocho fichas. Una ficha tiene un cero escrito sobre ella, una tiene
un tres, tres fichas tienen escrito un uno, tres tienen un dos. Se saca una ficha al
azar. Sea Y el número seleccionado en la ficha.

a Hallar Dominio de Y .
b Hallar el Rango de Y .
c Determinar la función de probabilidad.
d Hallar la función de distribución acumulada

19. Un vendedor puede visitar en un dı́a uno o dos clientes con probabilidaddes 2/5
y 3/5 respectivamente. De cada visita en forma, independiente, puede resultar una
venta por $500 con probabilidad 1/6 o ninguna venta con probabilidad 5/6 si X son
las ventas diarias, calcular la media y la varianza de X.

20. Un capataz de una planta manufacturera tiene 5 hombres y 3 mujeres trabajando


con él. El capataz desea seleccionar cuatro trabajadores para un trabajo especial.
Deseando no tener influencia en la selección de los trabajadores, él decide seleccionar
al azar los cuatro trabajadores. Sea Y el número de hombres en el grupo. Hallar la
tabla de distribución de probabilidad de Y.

21. La producción mı́nima de una máquina es de 2000 tornillos diarios y la máxima de


6000. Si la distribución de probabilidad del número de tornillos en miles producidos
se puede representar por la función de densidad:
3
f (x) = (8x2 − x3 − 12x)
128
Determinar la producción más probable de la producción de la máquina.

22. Un contratista norteamericano está interesado en conocer el costo total de un pro-


yecto sobre el que intenta hacer una oferta. Estima que los materiales costarán 25
000 dólares y su trabajo 900 dólares diarios. Si se necesitan X dı́as para terminar el
proyecto, el costo total del trabajo será 900X dólares y el costo total del proyecto
(en dólares) será.
C(X) = 25000 + 900X

El contratista construye unas probabilidades subjetivas sobre la duración del pro-


yecto, como se indica a continuación:

126
Duración X (dı́as) 10 11 12 13 14
Probabilidad 0.1 0.3 0.3 0.2 0.1

a Hallar la media de la duración X.


b Calcular la varianza de X.
c Calcular la media del costo total C.
d Hallar la desviación estándar del costo total C.

23. La variable aleatoria que representa la proporción de accidentes automovilı́sticos


fatales en cierto paı́s, tiene la siguiente función de densidad:

{
42x(1 − x)5 si 0≤x ≤1
f (x) =
0 otro caso

a Demostrar que f (x) es una función de densidad.


b Determinar el valor esperado.

24. Sea X una variable aleatoria con función de densidad:




 x si 0≤x ≤1
f (x) = k−x si 1≤x ≤2


0 otro caso

a Hallar el valor de k.
b Hallar la función de distribución acumulada.
c Calcular el valor esperado
d Calcular la varianza

25. La fracción de tiempo X, que una computadora está en uso durante un dı́a de trabajo
de 8 horas, es una variable aleatoria con función de densidad:
{
2x si 0≤x ≤1
f (x) =
0 otro caso

a Calcular la esperanza de X.
b Hallar la varianza de X.
c Hallar el valor esperado del costo por el uso de la computadora si éste es:

C(X) = 5 + 3x + 0,1x2

127
26. Un fabricante de aparatos de televisión ofrece un año de garantı́a de restitución
gratuita si el tubo de imagen falla. El fabricante estima el tiempo de falla, T , como
una variable aleatoria con la siguiente distribución de probabilidad:
{
1 − 4t
f (t) = 4e si t>0
0 otro caso
¿Qué porcentaje de aparatos tendrá que reparar?

27. Un juego consiste en lanzar una moneda 3 veces y luego un par de dados. Se pagan
S/5 por cada cara y también tantos soles como puntuación obtenga en los dados.
¿Cuánto esperarı́a ganar?

28. Un capataz en una fábrica tiene trabajando para él tres hombres y tres mujeres.
Desea elegir dos trabajadores para una labor especial y decide seleccionarlos al azar
para no introducir algún sesgo en su selección. Sea Y el número de mujeres en su
selección. Hallar la función de probabilidad.

29. La demanda en miles de metros de determinada tela que produce una compañı́a
textil es una variable aleatoria X que tiene función de densidad siguiente:
1
f (x) = , si 0 ≤ x ≤ 10.
10
Si por cada metro de tela vendida gana $4, pero por cada metro de tela no vendida
en la temporada se pierde $1.

a ¿Cuanto se espera que sea la demanda de la tela en la temporada?


b Si se decide producir 5000 metros de tela, ¿cuál es la utilidad esperada de la
compañı́a?

30. La vida útil de un objeto es una variable aleatoria X con función de densidad:
{
βe−βx si x≥0
f (x) =
0 si x<0
calcular la varianza y la desviación estándar de X .

31. La vida útil de una baterı́a en años es una variable aleatoria X con función de
densidad: {
0,2e−0,2x si x≥0
f (x) =
0 si x<0
Si el costo del producto está dado por la expresión.

C = 80 + 2X + 0,04X 2 .

Determinar el costo esperado y la varianza dél tiempo de vida útil de la baterı́a.

128
32. Sea X una variable aleatoria con función de densidad:
{
2x
9 si 0≤x≤3
f (x) =
0 otro caso

a Calcular la media y la varianza de X.


b Hallar la media y la varianza de la variable aleatoria Y = 2X − 3.

33. Un robot posiciona diez unidades en un torno para maquinado cuando se gradúa el
torno. Si el robot no tiene la unidad posicionada de manera apropiada, ésta cae, y la
posición del torno permanece abierta, resultando de ese modo un ciclo que produce
menos de diez unidades. Un estudio del funcionamiento pasado del robot indica que
si X : número de posiciones abiertas,


 0,6 si x=0


 0,3 si x=1
f (x) =

 0,1 si x=2


 0 otro caso

Si la pérdida debida a posiciones vacı́as está dada por:

Y = 20x2 .

Calcular el valor esperado y la varianza de Y .

129
Capı́tulo 5

Distribuciones o modelos
probabilı́sticos

5.1. Introducción

Como complemento al capı́tulo anterior en el que definimos todos los conceptos rela-
tivos a variables aleatorias, describimos en éste las principales leyes de probabilidad que
encontramos en las aplicaciones del cálculo de probabilidades. Describiremos las principa-
les leyes de probabilidad de cada una de ellas, las cuales constituirán el soporte subyacente
de la inferencia estadı́stica y a las que será necesario hacer referencia en el estudio de di-
cho bloque. En este capı́tulo estudiaremos dos procesos muy importantes, tanto para v.a.
discrteas como para continuas.

5.2. Proceso de Bernoulli

En el proceso deBernoulli a nuestro evento de interés E lo denominaremos como éxito,


mientras que a su complemento E c fracaso. En el proceso de interés se puede decir que la
observación es discreta, puesto que lo hacemos dentro de un ensayo u oportunidades, en
cada uno de ellos puede ocurrir el evento que nos interesa o su complemento. Supongamos
que la probabilidad p de que ocurra E es siempre la misma y que no ocurra q = 1 − p
tmabién, que estas ocurrencias son independientes. Si el proceso de observación del evento
E se da bajo estas condiciones, diremos que estamos frente a un proceso de Bernoulli.

Ahora veamos los tres modelos que se generan a partir de un proceso de Bernoulli.

130
5.2.1. Modelo o distribución Binomial
Se dice que la variable X, definida como el número de éxitos que ocurren en n
pruebas independientes tiene distribución binomial con parámetros n y p y se escribe
X v B(n, p) si su función de probabilidad es:
( )
n
f (k) = P(X = k) = pk q n−k , k = 0, 1, ..., n, q = 1 − p.
k
Donde p es la probabilidad de éxito de X.

Esta definición puede interpretarse en el siguiente sentido: Supongamos que realizamos


n pruebas de Bernouilli, Xi , donde en todas ellas, la probabilidad de éxito es la misma ,p,
y queremos calcular el número de éxitos, k, obtenidos del total de las n pruebas.
La f.d.a F (x) de la variable aleatoria binomial X es:
( )

x
n
F (x) = P(X ≤ x) = pk q n−k , x = 0, 1, ..., n.
k=0
k
a E(X) = np.

b Var(X) = npq.
Ejemplo 5.1. La probabilidad de que cierto tipo de objeto pase con éxito una determinada
prueba es 5/6. Se prueban 10 de tales objetos. Si X es la variable aleatoria que se define
como el número de objetos que pasan la prueba:
a Determinar la función de probabilidad de X.

b Calcular la probabilidad de que 5 objetos pasen la prueba.

c Calcule la media y la desviación estándar de X.

d Determinar la f.d.a. F (x) de X.

e Usando F (x), calcular P(7 < X ≤ 9).


Solución
a Cada uno de los objetos puede pasar la prueba con éxito (E), o puede no pasar la prueba
(F ). La probabilidad de que el objeto pase la prueba es 5/6 y de que no pase la prueba
es 1/6 y como X es la variable aleatoria que se define como el número de objetos
que pasan la prueba de los 10 objetos, estamos bajo una distribución binomial de
( )
parámetros 10 y 5/6, es decir X v B 10, 56 . La distribución de probabilidad de X
es: ( )( ) ( )
10 5 k 1 10−k
f (k) = P(X = k) = , k = 0, 1, ..., 10,
k 6 6

131
b Queremos P(X = 5), entonces:
( )( ) ( )
10 5 5 1 5
f (5) = P(X = 5) =
5 6 6

c La media de esta distribución es:


5 50
E(X) = np = 10 × = .
6 6
Su desviación estándar es:

√ √ 5 1
σX = Var(X) = npq = 10 × × = 1,1785
6 6
d Su f.d.a. es:
( )( ) ( )

x
10 5 k 1 10−k
F (x) = P(X ≤ x) = , x = 0, 1, ..., 10,
k 6 6
k=0
( )( ) ( )

9
10 5 k 1 10−k
e P(7 < X ≤ 9) = F (9) − F (7) = .
k 6 6
k=8
Ejemplo 5.2. En una tienda de alquiler de autos, cada vez que un cliente alquile un
automóvil debe pagar como mı́nimo $4. Si alquila un auto tipo A debe pagar $15 más, y
si alquila un auto tipo no A debe pagar $5 más. Se sabe que la probabilidad de que un
cliente alquile un auto tipo A es de 0.7. De cinco clientes que alquilan autos en esta tienda:
a Determine la distribución de probabilidades de los clientes que alquilan automóviles
tipo A.

b Determine la utilidad y la utilidad esperada que producen a la tienda los 5 clientes que
alquilan automóviles.
Solución

a Sea X el número de clientes que alquilan automoviles tipo A. Entonces, los valores
posibles para X son: 0,1,2,3,4,5.
La probabilidad del evento E: Un cliente alquila un automóvil tipo A es p = 0,7 y
q = 1 − p = 0,3. La distribución de probabilidad de X es:
( )
5
f (k) = P(X = k) = (0,7)k (0,3)5−k , k = 0, 1, 2, 3, 4, 5.
k

b La utilidad U que producen los cinco clientes es:

U = 20 + 15X + (5 − X)5, X = 0, 1, 2, 3, 4, 5.

Dado que E(X) = np = 5 × 0,7 = 3,5, la utilidad esperada es:

E(U ) = 45 + 10E(X) = 45 + 10 × 3,5 = 80.

132
5.2.2. Modelo o distribución Geométrica
Se dice que la variable X definida como el número de repeticiones independientes
hasta que ocurra el primer éxito, tiene distribución geométrica con parámetro p y se
escribe X v G(p) si su función de probabilidad es:

f (k) = P(X = k) = pq k−1 , k = 1, 2, ...

Donde p es la probabilidad de éxito de X.


En la distribución geométrica el conjunto de posibles valores que puede tomar la variable
X es infinito numerable, mientras que en la binomial, estos son en número finito.
La f.d.a de la variable aleatoria geométrica X es:

F (x) = P(X ≤ x) = 1 − q x , x = 1, 2, ...

a E(X) = p1 .
q
b Var(X) = p2
.

Ejemplo 5.3. Un vendedor a domicilio hace llamadas telefónicas a clientes potenciales.


La probabilidad de vender en cada llamada es 0.02. Si X es el número de llamadas hasta
conseguir una venta,

a Determinar la función de probabilidad de X.

b Calcule la probabilidad de que la sexta llamada sea su primera venta.

c Calcule el esperado del número de llamadas hasta obtener su primera venta.

d ¿Qué probabilidad hay de que su primera venta ocurra después de más de 5 llamadas
si ya hizo 3 llamadas sin éxito?

Solución

a Como la variable X es el número de llamadas hasta conseguir una venta. Sus posi-
bles valores son: 1, 2, 3,..., etc. El modelo de probabilidad de X es geométrica de
parámetro p = 0,02, es decir X v G(0,02), entonces su función de probabilidad de
X es:
f (k) = P(X = k) = (0,02)(0,98)k−1 , k = 1, 2, ...

b La probabilidad de que la sexta llamada sea su primera venta es:

f (6) = P(X = 6) = (0,02)(0,98)5 = 0,018.

1 1
c E(X) = p = 0,02 = 50. A la larga en la llamada número 50 obtiene su primera venta.

133
d El evento ya se hizo 3 llamadas sin éxito es equivalente al evento requiere hacer más de
3 llamadas hasta que obtenga un éxito. Entonces:

P((X > 5) ∩ (X > 3)) P(X > 5) 1 − F (5) 0,985


P(X > 5|X > 3) = = = = = 0,982 .
P (X > 3) P (X > 3) 1 − F (3) 0,983

Ejemplo 5.4. Un matrimonio quiere tener una hija, y por ello deciden tener hijos hasta
el nacimiento de una hija. Calcular el número esperado de hijos (entre varones y hembras)
que tendrá el matrimonio. Calcular la probabilidad de que la pareja acabe teniendo tres
hijos o más.

Solución
Este es un ejemplo de variable geométrica. Vamos a suponer que la probabilidad de tener
un hijo varón es la misma que la de tener una hija mujer. Sea X la v.a. definida como:
X: Número de hijos hasta que nasca a niña.
Es claro que X v G(0,5), y su función de probabilidad es:

f (k) = P(X = k) = (0,5)(0,5)k−1 , k = 1, 2, ...

1 1
Sabemos que el número esperado de hijos es E(X) = p = 0,5 = 2, por tanto el número
esperado en total entre hijos varones y la niña es 2.

La probabilidad de que la pareja acabe teniendo tres o más hijos, es la de que tenga 2
o más hijos varones (la niña está del tercer lugar en adelante), es decir,

P(X ≥ 3) = 1 − P(X < 3) = 1 − F (2) = 1 − (1 − 0,52 1) = 0,25.

5.2.3. Modelo o distribución de Pascal o Binomial Negativa


Se dice que la variable X definida como el número de intentos hasta que ocurran r
éxitos, tiene distribución Pascal con parámetros r y p y se escribe X v P a(r, p), si su
función de probabilidad es:
( )
k−1
f (k) = P(X = k) = pr q k−r , k = r, r + 1, r + 2, ...
r−1

Donde p es la probabilidad de éxito de X.


La f.d.a de la variable aleatoria Pascal X es:
( )

x
k−1
F (x) = P(X ≤ x) = pr q k−r , x = r, r + 1, r + 2, ...
k=r
r−1

a E(X) = pr .

134
rq
b Var(X) = p2
.

Ejemplo 5.5. Una maquina produce artı́culos de uno en uno y de manera independiente,
Se considera que el 10 % de ellos son defectuosos. Si la máquina se detiene apenas produce
el cuarto artı́culo defectuoso. Si X es el número de artı́culos producidos hasta tener 4
defectuosos:

a Determinar la función de probabilidad de X

b ¿Cuál es el número esperado de artı́culos producidos hasta que se detiene la máquina?

c ¿Cuál es la probabilidad de que la máquina se detenga en el décimo artı́culo producido?

d ¿Cuál es la probabilidad de que produzca al menos 10 artı́culos para que la máquina se


detenga?

Solución

a Como X es el número de artı́culos producidos hasta tener 4 defectuosos. El modelo de


probabilidad de X es Pascal con parámetros r = 4 y p = 0,1, es decir X v P a(4, 0,1).
Entonces su función de probabilidad de X es:
( )
k−1
f (k) = P(X = k) = (0,1)4 (0,9)k−4 , k = 4, 5, 6, ...
4−1

r 4
b E(X) = p = 0,1 = 40.

c Queremos P(X = 10), esto es:


( )
10 − 1
f (10) = P(X = 10) = (0,1)4 (0,9)10−4
4−1

d Queremos:
( )

9
k−1
P(X ≥ 10) = 1 − P(4 ≤ X ≤ 9) = (0,1)4 (0,9)k−4 .
k=4
4−1

Ejemplo 5.6. Para tratar a un paciente de una afección de pulmón han de ser operados
en operaciones independientes sus 5 lóbulos pulmonares. La técnica a utilizar es tal que
si todo va bien, lo que ocurre con probabilidad de 7/11, el lóbulo queda definitivamente
sano, pero si no es ası́ se deberá esperar el tiempo suficiente para intentarlo posteriormente
de nuevo. Se practicará la cirugı́a hasta que 4 de sus 5 lóbulos funcionen correctamente.
¿Cuál es el valor esperado de intervenciones que se espera que deba padecer el paciente?
¿Cuál es la probabilidad de que se necesiten 10 intervenciones?

135
Solución
Este es un ejemplo claro de experimento aleatorio regido por un modelo Pascal, ya que se
realizan intervenciones hasta que se obtengan 4 lóbulos sanos, y éste es el criterio que se
utiliza para detener el proceso. Identificando los parámetros se tiene:
( 7)
X: Número de operaciones hasta obtener 4 lóbulos sanos. X v P a 4, 11 . Luego:
r 4 44
E(X) = = =
p 7/11 7
Luego el número esperado de intervenciones que deberá sufrir el paciente es de aproxima-
damente 6.
La probabilidad de que el número de intervenciones sea 10, es:
( )( ) ( )
10 − 1 7 4 4 10−4
f (10) = P(X = 10) = .
4−1 11 11

5.2.4. Modelo o distribución hipergeométrica


Un experimento hipergeométrico consiste en escoger al azar una muestra de tamaño
n, uno a uno sin reposición, de N elementos o resultados posibles, donde r de los cuales
pueden clasificarse como éxitos, y los N − r restantes fracasos.
Se denomina variable aleatoria hipergeométrica a la variable X que se define como el
número de éxitos de una muestra de tamaño n que se selecciona al azar uno a uno sin
reposición de N elementos o resultados posibles, de los cuales r son clasificados como como
éxitos y los restantes N − r como fracasos y se escribe X v H(N, n, r), si su función de
probabilidad es:
( )( )
r N −r
k n−k
f (k) = P(X = k) = ( ) , k = 0, 1, 2, ..., n
N
r
Si X es una variable aleatoria con distribución hipergeométrica H(N, n, r), y sean
p = Nr , q = 1 − p entonces,
a E(X) = np
−n
b V (X) = npq N
N −1

c H(N, n, r) ∼
= B(n, p). Esto para un valor de N suficientemente grande

5.3. Proceso de Poisson


En el proceso de Poisson se observa el evento de interés E, en una región continua,
como por ejemplo un intervalo de tiempo o un área y el evento de interés E ocurre con

136
tasa o promedio de ocurrencias ω por unidad de medida.

Ahora veamos algunos modelos que se generan a partir de un proceso de Poisson.

5.3.1. Modelo o distribución de Poisson


Se dice que la variable X definida como el número de ocurrencias de E en una
región de medida t, tiene distribución tienen distribución de Poisson de parámetro λ y
se escribe X v P (λ) si su función de probabilidad es:
e−λ λk
f (k) = P (X = k) = , k = 0, 1, 2, ... λ = ωt
k!
La f.d.a de la variable aleatoria Poisoon X es:

x
e−λ λk
F (x) = P (X ≤ x) = , x = 0, 1, 2, ...
k!
k=0

a E(X) = λ

b Var(X) = λ

Ejemplo 5.7. Suponga que llegan en forma aleatoria una serie de llamadas a una central
telefónica con un promedio de tres llamadas por minuto.

a Determinar la función de probabilidad de X.

b Calcular la probabilidad de que en el periodo de 5 minutos:

No ocurra llamada alguna


Ocurran al menos 16 llamadas

c Si cada llamada cuesta S/.0.50, ¿Cuánto es el costo esperado?

Solución
Sea X el número de llamadas que ocurren en el periodo de 5 minutos, entonces, X v P (λ),
donde λ = 3 × 5 = 15 es el promedio del número de llamadas en 5 minutos, es decir,
X v P (λ = 15),

a La función de probabilidad de X es :
e−15 15k
f (k) = P (X = k) = , k = 0, 1, 2, ...
k!
b La probabilidad de que no ocurra llamada alguna en el periodo de 5 minutos es
P(X = 0), es decir:
e−15 150
f (0) = P (X = 0) = = e−15 .
0!

137
La probabilidad de que ocurra al menos 16 llamadas es en el periodo de 5
minutos es:


15 −15 k
e 15
P(X ≥ 16) = 1 − P(X ≤ 15) = 1 − F (15) = 1 − .
k!
k=0

c Sea C el costo en 5 minutos, entonces C = 0,5X y como E(X) = λ = 15 , entonces

E(C) = 0,5E(X) = 0,5(15) = 7,5.

En promedio, en un periodo de 5 minutos el costo será S/.7.5.

5.3.2. Modelo o distribución exponencial

La distribución exponencial es el equivalente continuo de la distribución geométrica


discreta. Esta ley de distribución describe procesos en los que:

Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo
que el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello
ocurra en un instante tf , no depende del tiempo transcurrido anteriormente en
el que no ha pasado nada.

Ejemplos de este tipo de distribuciones son:

El tiempo que tarda una partı́cula radiactiva en desintegrarse. El conocimiento


de la ley que sigue este evento se utiliza en Ciencia, por ejemplo, la datación de
fósiles o cualquier materia orgánica mediante la técnica del carbono 14, C 14 ;
El tiempo que puede transcurrir en un servicio de urgencias, para la llegada de
un paciente;
En un proceso de Poisson donde se repite sucesivamente un experimento a
intervalos de tiempo iguales, el tiempo que transcurre entre la ocurrencia de dos
sucesos consecutivos sigue un modelo probabilı́stico exponencial. Por ejemplo,
el tiempo que transcurre entre que sufrimos dos veces una herida importante.

En el proceso de Poisson, se dice que la v.a. X definida como la medida de la


región que habrá que observar hasta que se presente el primer éxito, tiene
distribución exponencial de parámetro β y se escribe X v exp(β) si su función de
densidad es: {
βe−βx si x≥0
f (x) =
0 si x<0

138
Siendo β = ω.
La f.d.a de la variable aleatoria exponencial X es:
F (x) = P(X ≤ x) = 1 − e−βx , x ≥ 0.
También:
P(X ≥ x) = e−βx , x ≥ 0.

a E(X) = β1 .
1
b Var(X) = β2
.
c Si X v exp(β) entonces P(X > s + t|X > s) = P(X > t), ∀t, s > 0.

Ejemplo 5.8. El tiempo durante el cual cierta marca de baterı́a trabaja en forma efectiva
hasta que falle (tiempo de falla) se distribuye exponencialmente con tiempo promedio de
fallas igual a 360 dı́as.
a ¿Qué probabilidad hay que el tiempo de falla sea mayor que 400 dı́as?

b Si una de estas baterı́as ha trabajado ya 400 dı́as, ¿qué probabilidad hay que trabaje
más de 200 dı́as más?

c Si se están usando 5 de tales baterı́as calcular la probabilidad de que más de dos de


ellas continúen trabajando después de 360 dı́as?
Solución
Sea:
X : El tiempo que trabaja la baterı́a hasta que falle.
1 1
El tiempo promedio de falla es de 360 dı́as. Entonces β = E(X) = 360 y su función de
densidad es: {
1 − 360
1
360 e x
si x≥0
f (x) =
0 si x<0
a P(X > 400) = 1 − P(X ≤ 400) = 1 − F (400) = 1 − (1 − e− 360 400 ) = e− 360 = 0,329
1 400

b Si la baterı́a ya trabajo 400 dı́as, quiere decir que su tiempo de falla es mayor que 400
dı́as. Luego,
P(X > 400 + 200|X > 400) = P(X > 200) = e− 360 200 = e− 360 = 0,574.
1 200

c La probabilidad de que una baterı́a trabaje más de 360 dı́as es:


P(X > 360) = e− 360 360 = e− 360 = 0,368.
1 360

Sea Y : Número de baterı́as de 5 que siguen trabajando después de 360 dı́as,


entonces Y v B(n = 5, p = 0,368), y
( )
∑ 2
5
P(Y ≥ 3) = 1 − P(Y ≤ 2) = 1 − FY (2) = (0,368)k (0,632)5−k = 0,26376
k=0
k

139
5.3.3. Modelo o distribución uniforme
S e dice que una v.a. continua X tiene distribución uniforme en el intervalo de extremos
finitos a y b es decir [a, b] , y se escribe X v U [a, b], si su función de densidad es constante
y es dada por:
1
f (x) = , a ≤ x ≤ b.
b−a
La f.d.a de la variable aleatoria uniforme X es:
x−a
F (x) = P(X ≤ x) = a ≤ x ≤ b.
b−a
a+b
a E(X) = 2 .

(b−a)2
b Var(X) = 12

Observación
Esta distribución es adecuada para describir a una variable que asuma sus valores uniforme
o indistintamente en un intervalo de extremos finito

Ejemplo 5.9. Dos gerentes A y B deben encontrarse en cierto lugar entre las 7 p.m. y 8
p.m. para firmar un contrato. Cada uno espera al otro a lo más 10 minutos, ¿cuál es la
probabilidad de que no se encuentren sabiendo que A llega a las 7:30 p.m.?

Solución
Sea la variable aleatoria X el tiempo de llegada de B, que puede hacerlo en cualquier
instante aleatorio entre las 7 p.m. y las 8 p.m. o entre 0 y 60 minutos. Entonces X v U [0, 60]
y su función de densidad es:
1
f (x) = , 0 ≤ x ≤ 60.
60
Puesto que A llega a las 7:30 p.m. o a los 30 minutos después de las 7 p.m. y espera a lo
más 10 minutos, B no se encontrará con A si B llega de 7 p.m. o menos de 7:20 p.m. o si
llega después de las 7:40 p.m. Entonces, la probabilidad de que A y B no se encuentren es:
∫ 20 ∫ 60
1 1 20 20 2
P(0 ≤ X < 20 o 40 < X ≤ 60) = dx + dx = + = .
0 60 40 60 60 60 3

Ejemplo 5.10. Un vendedor cobra honorarios fijos de S/.200 más una comisión de 5 %
del total de las ventas que realiza. Si el total de las ventas que realiza es una variable
aleatoria X con distribución uniforme entre 0 y 2000.

a ¿Cuánto es la utilidad promedio del vendedor?

b ¿Qué probabilidad hay de que obtenga honorarios superiores a S/.275?¿Cuánto debe


vender como mı́nimo?

140
c Si vende como mı́nimo S/.500, ¿qué probabilidad hay de que gane más de S/.260?

d ¿Cuál es la probabilidad de que obtenga una ganancia igual a S/.250?

Solución
Sabemos que X es la variable aleatoria definida como el total de ventas y X v U [0, 2000].
La utilidad o ganancia del vendedor es :

U = 200 + 0,05X.

a E(U ) = E(200 + 0,05X) = 200 + 0,05E(X) = 200 + 0,05 × 1000 = 250.


∫ 2000
1 500
b P(U > 275) = P(200 + 0,05X > 275) = P(X > 1500) = dx = = 0,25.
1500 2000 2000
c P(U > 260|X > 500) = P(200 + 0,05X > 260|X > 500) = P(X > 1200|X > 500) =
= P(X>1200) 800
P(X>500) = 1500 .

d P(U = 250) = P(X = 1000) = 0.

5.3.4. Modelo o Distribución normal


La distribución normal, recibe este nombre ya que una gran mayorı́a de las v.a continuas
de la naturaleza siguen esta distribución. Se dice que una v.a. X sigue una distribución
normal de parámetros µ y σ 2 , lo que denotamos por X v N (µ, σ 2 ), si su función de
densidad es: [ ( ) ]
1 1 x−µ 2
f (x) = √ exp − , −∞ < x < ∞.
σ 2π 2 σ
Observación

1. Estos dos parámetros µ y σ 2 coinciden además con la media (esperanza) y la varianza


respectivamente de la distribución, es decir:

a E(X) = µ.
b Var(X) = σ 2 .

La forma de la función de densidad es la llamada campana de Gauss.

141
2. Si µ = 0 y σ 2 = 1, la distribución se llama normal estándar

3. No hay fórmula explı́cita para la distribución acumulada; pero existen tablas para
la distribución normal estándar, ası́, para poder usarlas previamente se debe pasar
a la forma estándar.

5.3.5. Propiedades de estandarización


1. Cualquier distribución normal puede convertirse en una normal estándar. En efecto,
si X v N (µX , σX
2 ), y consideramos

X − µX
Z= .
σX

Entonces Z v N (0, 1).


X−µX
Es decir: Si X v N (µX , σX
2 ) y Z =
σX ⇒ Z v N (0, 1).
Por lo tanto:
( ) ( )
k − µX k − µX
FX (k) = P(X ≤ k) = P Z ≤ = FZ .
σX σX

Esta transformación se conoce como la formula de estandarización.

2. P(a ≤ Z ≤ b) = P(Z ≤ b) − P(Z ≤ a) = FZ (b) − FZ (a).

3. FZ (−a) = P(Z ≤ −a) = 1 − P(Z ≤ a) = 1 − FZ (a), esto es, es simétrica respecto a


la vertical Z = 0.

4. P(−a ≤ Z ≤ a) = 2P(Z ≤ a) − 1 = 2FZ (a) − 1.

5.3.6. Propiedad de cerradura de distribución normal


La suma de variables normales e independientes sigue teniendo distribución normal: Si
X v N (µX , σX
2 ) e Y v N (µ , σ 2 ) son v.a. independientes, entonces la variable aleatoria
Y Y
T = X + Y tiene distribución normal, es decir: T v N (µT , σT2 ), donde:

µT = µX + µY , y σT2 = σX
2
+ σY2 .

Ejercicio
Utilizando la tabla de probabilidades normal estándar hallar

a P(Z ≤ 1,2)

b P(Z ≤ −1,28)

c P(0,81 ≤ Z ≤ −1,91)

142
d P(−1,24 ≤ Z ≤ 2,25)

e P(−2 ≤ Z ≤ 2)

f P(Z ≥ 2,23)

Ejercicio
Utilizando la tabla de probabilidades normal estándar hallar el valor de z tal que

a P(Z ≤ z) = 0,861

b P(Z ≥ z) = 0,2236

c P(−z ≤ Z ≤ z) = 0,95

Ejemplo 5.11. Los ingresos en cierto sector pueden ser modelados por una v.a. X con
distribución normal de media 20 unidades monetarias (u.m.) y desviación estándar de
5u.m. ¿Calcular la probabilidad de que el ingreso de un trabajador de este sector sea
superior a 22u.m?

Solución
Sea X la v.a. definida como el ingreso en cierto sector circular, entonces X v N (20, 52 )
Queremos:
P(X > 22) = 1 − P(X ≤ 22) = 1 − FX (22).
X−20
Usando la estandarización Z = 5 tenemos:

22 − 20
FX (22) = FZ ( ) = FZ (0,4) = 0,6554.
5
Entonces:
P(X > 22) = 1 − 0,6554 = 0,3446.

Ejemplo 5.12. Suponga que el ingreso familiar mensual en una comunidad tiene distri-
bución normal con media $600 y desviación estándar $100.

a Calcular la probabilidad de que el ingreso de una familia escogida al azar sea menor que
$400.

b Si el 5 % de las familias con mayores ingresos deben pagar un impuesto, ¿a partir de


que ingreso familiar se debe pagar impuesto?

Solución
Sea X la v.a. que representa los ingresos familiares mensuales. Entonces X v N (600, 1002 ).
( )
a P(X < 400) = P Z < 400−600
100 = P(Z < −2) = FZ (−2) = 0,0228.

143
b Se debe hallar k tal que P(X ≥ k) = 0,05 o P(X < k) = 0,95, entonces:
( )
k − 600
0,95 = P(X < k) = P Z <
100
k−600
de donde resulta 100 = 1,645, entonces k = 764,5.

Ejemplo 5.13. Supongamos que cierto fenómeno pueda ser representado mediante una
v.a. X v N (45, 81). Calcular la probabilidad de que X tome un valor entre 39 y 48.

Solución
Queremos:
P(39 ≤ X ≤ 48).

Comenzamos haciendo el cambio de variable:


X − 45
Z= .
9
de modo que

P(39 ≤ X ≤ 48) = P(X ≤ 48) − P(X ≤ 39)


( ) ( )
48 − 45 39 − 45
= P Z< −P Z <
9 9
= P(Z < 0,33) − P(Z < −0,67)
= 0,6293 − 0,2514
= 0,3679

144
5.4. Ejercicios propuestos
1. Supóngase que en cierta población el 52 % de todos los nacimientos que se registraron
son varones. Si aleatoriamente se escogen cinco registros de nacimientos dentro de
esa población, ¿cuál es la probabilidad de que exactamente tres de ellos pertenezcan
a varones?

2. Un estudiante contesta al azar (o sea sin saber nada) 9 preguntas, siendo cada una
de 4 respuestas, de las cuales sólo una es correcta.

a Determinar la distribución de probabilidades del número de preguntas contestadas


correctamente.
b Si para aprobar tal examen debe contestar correctamente al menos 6 preguntas,
¿cuál es la probabilidad de aprobar el examen?

3. En una producción, la probabilidad de que un objeto sea defectuoso es 0.2. Si en


una muestra de n de tales objetos escogidos al azar uno por uno, se espera que haya
un defectuoso.

a Calcular la probabilidad de que haya dos objetos defectuosos.


b ¿Cuántos objetos defectuosos es más probable que ocurra?

4. El 75 % de la mercaderı́a que recibe un comerciante del fabricante A es de calidad


excepcional, mientras que el 80 % de la mercaderı́a que recibe un comerciante del
fabricante B es de calidad excepcional. El 60 % del total de la mercaderı́a lo adquiere
de A y el resto de B. Si se seleccionan 4 unidades de la mercaderı́a, ¿qué probabilidad
hay de que se encuentren 2 unidades que sean de calidad excepcional?

5. Un vendedor a domicilio compra diariamente 10 unidades de un producto a $2 cada


una. Por cada producto gana $3 si lo vende o pierde $1 además del costo si no lo
vende en el dı́a. Si la probabilidad de venta de cada unidad es 0.2 y si las ventas son
independientes.

a Hallar la distribución de probabilidad de las unidades vendidas.


b Calcular la utilidad esperada del vendedor.

6. El diámetro del punto producido por una impresora tiene una distribución normal
con media de 0,002 pulgadas y desviación estándar de 0,0004 pulgadas.

a ¿Cuál es la probabilidad de que el diámetro del punto sea mayor que 0,0026
pulgadas?

145
b ¿Cuál es la probabilidad de que el diámetro del punto esté entre 0,0014 y 0,0026
pulgadas?
c ¿Qué valor debe tener la desviación estándar del diámetro para que la probabilidad
del inciso b) sea 0,995?

7. En promedio, el 10 % de las varillas de madera usadas en cierto producto se en-


cuentran demasiado nudosas para ser usadas. ¿Cuál es la probabilidad de que en un
paquete de 15 varillas no más de cuatro estén demasiado nudosas?

8. Un profesor de cómputo afirma que en la primera lección de Ïntroducción a la compu-


tación como procesadores de texto”, para secretarias sin conocimientos previos en la
materia, se da un 80 % de asimilación (teórico - práctica). Calcule las probabilidades
de que si este curso se da a 7 secretarias:

a tres ó más asimilen el curso.


b dos ó menos no asimilen el curso.
c todos asimilen el curso.
d entre 2 y 6 (inclusive) asimilen el curso.

10.
9. Al realizar un experimento, la probabilidad de lograr el objetivo es 0.4. Si se rea-
liza el experimento 20 veces bajo las mismas condiciones y asumiendo resultados
independientes

a Calcular la probabilidad de lograr el objetivo por lo menos en tres de las 20 veces.


b El costo del experimento es de S/. 1500, si se logra el objetivo; y de S/.3000 si no
se logra. Calcular el costo esperado para realizar el experimento.

11. El tiempo de duración X, en meses, de un tipo de resistencia eléctrica tiene función


de densidad: {
0,5e−0,5x si x≥0
f (x) =
0 si x<0

a ¿Cuál es la probabilidad de que una de tales resistencias eléctricas dure más de 4


meses?
b Si se prueban 10 resistencias eléctricas, ¿cuál es la probabilidad de que ninguna
dure más de 4 meses?
c ¿Cuántas resistencias se probarı́an para que con probabilidad igual a 0.9 se tenga
al menos una que dure más de 4 meses?

146
d Si el costo de producción de una resistencia es:

C = 50 − X.

¿Cuánto es el valor esperado del costo?

12. En cierto proceso de producción se sabe que el porcentaje de artı́culos defectuosos


es de 0.02. Se controlan la calidad de los artı́culos uno por uno

a Calcular la probabilidad de que el décimo artı́culo probado sea el primer defectuoso


encontrado.
b En promedio, ¿cuántos artı́culos se probarı́an hasta encontrar el primer defectuo-
so?

13. Se lanza al aire una moneda cargada 8 veces, de tal manera que la probabilidad de
que aparezca cara es de 2/3, mientras que la probabilidad de que aparezca sello es de
1/3, Determine la probabilidad de que en el último lanzamiento aparezca una cara.

14. Sı́ la probabilidad de que un cierto dispositivo de medición muestre una desviación
excesiva es de 0.05, ¿cuál es la probabilidad de que;

a El sexto de estos dispositivos de medición sometidos a prueba sea el primero en


mostrar una desviación excesiva?
b El séptimo de estos dispositivos de medición sometidos a prueba, sea el primero
que no muestre una desviación excesiva?

15. Un experimento se repite de manera independiente hasta que se obtiene el primer


éxito. El costo C producido, está en función de X, donde X es el número de repeti-
ciones necesarias hasta tener éxito y es dado por.

C = 200 + 5X + 4X 2 .

Se sabe que la varianza del número de repeticiones necesarias hasta obtener éxito es
40/36. Si en estas condiciones, el experimento debe ser realizado por 200 personas
hasta que cada una de ellas obtenga éxito, ¿cuánto serı́a el costo esperado?

16. Un experimento analiza la resistencia de una barra de acero sometiéndola a pruebas


sucesivas hasta que se rompa. Las pruebas son independientes y el costo de realizar
cada prueba es de 30 soles. Si la barra no se rompe el costo de la prueba se aumenta en
10 soles debido a ciertos reajustes en el equipo de medición. La probabilidad de que
la barra se rompa en cada prueba es 0.1. Calcule el costo esperado del experimento.

147
17. Cierto virus ha invadido al 5 % de los niños. Si tales niños son examinados uno por
uno, ¿cuál es la probabilidad de que el doceavo niño examinado sea el quinto niño
encontrado atacado por el virus?

18. La probabilidad de realizar con éxito un experimento quı́mico es 0.9. Si el experi-


mento se repite de forma independiente cada vez.

a Hallar la función de probabilidad del número de repeticiones necesarias hasta


completar el primer resultado exitoso.
b Hallar la función de probabilidad del número de repeticiones necesarias hasta
completar dos resultados exitosos.
c Calcular la probabilidad de que para completar dos resultados exitosos se necesiten
más de cuatro repeticiones.

19. El chofer de un auto en un paradero sabe que sus pasajeros llegan en forma aleatoria
a razón de 1 persona cada 3 minutos siguiendo una distribución de Poisson. El auto
tiene una capacidad de 5 plazas contando al chofer. Calcular la probabilidad de que
se sobrepase la capacidad del auto en los 10 primeros minutos

20. Un lı́quido contiene cierta bacteria con un promedio de 3 bacterias por cm3 , calcular
la probabilidad de que en una muestra,

a de 1/3 cm3 , no contenga bacteria alguna.


b de 2cm3 , contenga por lo menos una bacteria.

21. Un banco atiende todos los dı́as de 8am. a 4pm., y se sabe que el número de clientes
por dı́a que van a solicitar un préstamo por más de $10000 tiene una distribución de
Poisson con una media de 3 clientes por dı́a.

a ¿Cuál es la probabilidad de que hasta el mediodı́a no se haya producido una


solicitud de préstamo por más de $10000?
b En cuatro dı́as, ¿cuál es la probabilidad de que en dos de los dı́as hasta el mediodı́a
no se haya producido una solicitud de préstamo por más de $10000?

22. Suponga que aviones pequeños llegan a cierto aeropuerto según un proceso de Pois-
son, con tasa λ = 8 aviones por hora, de modo que el número de llegadas durante
un periodo de t horas es una variable aleatoria de Poisson con parámetro λ = 8t.

a ¿Cuál es la probabilidad de que exactamente cinco aviones pequeños lleguen du-


rante un periodo de una hora?¿Por lo menos cinco?
b ¿Cuál es la probabilidad de que por lo menos 20 aviones pequeños lleguen durante
un periodo de 2 12 horas? ¿De que a lo sumo diez lleguen durante ese periodo?

148
23. El número medio de automóviles que llegan a una estación de suministro de gasolina
es de 240 por hora. Si dicha estación puede atender a un máximo de ocho automóviles
por minuto, determine la probabilidad de que, en un minuto dado, lleguen a la
estación más automóviles de los que puede atender.

24. Con la finalidad de diseñar un sistema de control de tráfico, un ingeniero de tránsito


estudia el número de automóviles que llegan a una intersección de calles. Entre otros
resultados, él concluye que el número de automóviles que llegan a esa intersección
tiene media de 3 por minuto.

a Describa el modelo de probabilidad adecuado para número de automóviles que


llegan a esa intersección en un periodo de un minuto.
b Hallar la probabilidad de que no llegue automóvil alguno a esa intersección en 30
segundos.
c Si el pago por hora al ingeniero está dado por T = 2 + 0,1X + 0,0001X 2 dólares,
donde X es el número de automóviles que llegan a esa intersección en una hora.
Calcule el pago esperado por hora.

25. Cierto tipo de loceta puede tener un número X de puntos defectuoso que sigue una
distribución de Poisson con una media de 3 puntos defectuosos por loceta. El precio
de la loceta es $1 si X = 0, de $0.70 si X = 1 o 2, y de $0.1 si X > 2. Calcular el
precio esperado por loceta.

26. El número de usuarios que acuden a cierta base de datos confidencial sigue una
distribución de Poisson con una media de dos usuarios por hora.

a Calcular la probabilidad de que entre las 8am. y el mediodı́a acudan más de dos
usuarios.
b Si un operador de la base de datos trabaja todos los dı́as de 8am. hasta el mediodı́a,
¿cuál es la probabilidad de que este operador tenga que esperar más de 7 dı́as
hasta observar el primer dı́a en el cual acceden más de dos usuraos?

27. La demanda D de un producto de temporada navideña es una variable aleatoria con


distribución normal. Según su experiencia, un comerciante estima que con 0.0062 de
probabilidad le demandarán más de 565 unidades y con 0.1587 de probabilidad la
demanda será menor a 110 unidades.

a Halle los parámetros de la distribución.


b Hallar la probabilidad de que la demanda este entre 230 unidades y 250 unidades.

149
28. Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de falla en
años está dado por la variable aleatoria T , distribuida exponencialmente con tiempo
promedio de falla µ = 5. Sı́ 5 de estos componentes se instalan en diferentes sistemas,
¿cuál es la probabilidad de que al menos 2 continúen funcionando después de 8 años?

29. El tiempo que transcurre antes de que una persona sea atendida en una cafeterı́a
es una variable aleatoria que tiene una distribución exponencial con una media de
4 minutos. ¿Cuál es la probabilidad de que una persona sea atendida antes de que
transcurran 3 minutos en al menos 4 de los 6 dı́as siguientes?

30. Cierto tipo de baterı́a dura un promedio de 3 años, con una desviación tı́pica de 0,5
años. Suponiendo que la duración de las baterı́as es una variable normal:

a ¿Qué porcentaje de baterı́as se espera que duren entre 2 y 4 años?


b Si una baterı́a lleva funcionando 3 años. ¿cuál es la probabilidad de que dure
menos de 4,5 años?

31. Suponga que la demanda mensual de un bien de consumo se distribuye normalmente


con una media de 650kg. y una desviación estándar de 100kg.

a ¿Qué probabilidad hay de que la demanda no supere los 500kg.


b ¿Qué cantidad del bien debe haber mensualmente a fin de satisfacer la demanda
en el 89.8 % de los meses?

32. La utilidad por las ventas mensuales (en miles de dólares) de una tienda de muebles,
es una variable aleatoria con distribución normal. En el 5 % de las ventas mensuales
la utilidad ha sido menos que 3.42, mientras que en el 1 % de las ventas mensuales
la utilidad ha sido mayor que 19.32.

a Halle la media y la varianza de la utilidad por las ventas mensuales.


b ¿Cuál es la probabilidad de que la utilidad por las ventas en un mes sea superior
a los $16580?
c ¿Cuál es la probabilidad de que la utilidad por las ventas en un mes sea menos de
$8580?

33. El tiempo entre dos llamadas consecutivas a una central telefónica de la universidad
tiene distribución exponencial con media de 10 segundos. Encontrar la probabilidad
de que el tiempo entre dos llamadas a la central telefónica sea de más de 20segundos.

34. Las notas de un curso de Fı́sica, tienen distribución normal con una media de 13 y
una desviación estándar de 3. Las notas de un curso de Quı́mica, tienen distribución

150
normal con una media de 14 y una desviación estándar de 4. Si las notas son inde-
pendientes, encontrar la probabilidad de que para un alumno que ha llevado los dos
cursos.

a La suma de las notas sea mayor que 30.


b El promedio de las notas esté entre 12 y 16.
c La nota de Fı́sica sea mayor que la nota de Quı́mica.

35. La estatura de las mujeres de un colegio sigue una distribución normal. La moda
de la estatura es de 165cm y la desviación estándar de 10cm. La condición para
ser jugadora del equipo de voleibol es medir más de170cm. Se toma una muestra
aleatoria de 40 mujeres, hallar la probabilidad que por lo menos se pueda escoger 3
jugadoras para el equipo de voleibol.

36. Suponga que el tiempo X, en minutos, que demora una tarea tiene distribución
uniforme en [1,5]. Si el costo C para terminar la tarea es función del tiempo y es
dada por la expresión
C = 10 + x + 3X 2 ,

calcular el valor esperado del costo.

37. La llegada de cada uno de los empleados a su centro de trabajo se produce inde-
pendientemente, de acuerdo a la distribución uniforme en el intervalo comprendido
entre las 8:00 y 8:25a.m. Si 10 empleados llegaron al centro de trabajo después de
las 8:10a.m., ¿cuál es la probabilidad de que 4 de ellos hayan llegado entre las 8:15
y 8.20a.m.

38. Un vendedor tiene un sueldo fijo de S/.400 más una comisión del 5 % sobre el importe
de las ventas que realiza. Si el importe de las ventas tiene una distribución uniforme
entre 0 y 3400 nuevos soles,

a Hallar el ingreso medio del vendedor, ¿con qué probabilidad obtendrı́a al menos
ese monto?
b Se le ofrece como ingreso único el 25 % de sus ventas, si como mı́nimo quiere ganar
S/.480, ¿le conviene la propuesta?

39. Los beneficios anuales de una empresa A siguen una distribución normal con media
$80 y desviación estándar $10 y los beneficios de otra empresa B siguen una distri-
bución normal con media $70 y desviación estándar $5, ¿cuál es la probabilidad que
en un año la empresa A tenga mas beneficios que la empresa B?

40. Un sistema de comunicaciones recibe mensajes digitales de acuerdo con un protocolo.

151
a Calcule la probabilidad de que un mensaje de 10 dı́gitos binarios (0 y 1) sea
incorrecto, si la probabilidad de recibir un digito incorrecto es 0.06 y si los
dı́gitos se reciben de manera independiente.
b Si durante cierta mañana se han recibido 15 mensajes de 10 dı́gitos, ¿cuál es la
probabilidad de que al menos 12 de ellos se hayan recibido correctamente?

41. Un sistema de comunicaciones recibe mensajes digitales de acuerdo con un protocolo.


Si un mensaje llega de forma incorrecta se reenvı́a todo el mensaje nuevamente hasta
que llegue el mensaje correctamente. El costo de todo el proceso, en décimos de soles,
es igual al cuadrado del número de intentos necesarios hasta obtener el mensaje
correcto. Calcular el costo esperado de recibir un mensaje correctamente, si sabe
que la probabilidad de que un mensaje llegue correctamente es de 0.5.

42. El consumo mensual de arroz, en kilos, por familia en cierta ciudad tiene una media
desconocida y una desviación estándar de 2 kilogramos. Si se selecciona una muestra
aleatoria de 45 familias de esta ciudad.

a ¿Cuál es la probabilidad de que el consumo mensual de arroz de una familia,


escogida al azar, difiera en menos de un kilo de media real?
b Si luego de una investigación se concluye que la distribución de la población es
normal y que el consumo medio de arroz por familia es 12 kilogramos, calcule
la probabilidad de que más del 20 % de las familias de la muestra consuman al
menos 15 kilogramos de arroz al mes.

43. El diámetro del punto producido por una impresora tiene una distribución normal
con media de 0,002 pulgadas y desviación estándar de 0,0004 pulgadas.

a ¿Cuál es la probabilidad de que el diámetro del punto sea mayor que 0,0026
pulgadas?
b ¿Cuál es la probabilidad de que el diámetro del punto esté entre 0,0014 y 0,0026
pulgadas?
c ¿Qué valor debe tener la desviación estándar del diámetro para que la probabilidad
del inciso b) sea 0,995?

44. Las visitas recibidas diariamente a una Web son inferiores a 3500 el 22 % de los
dı́as, y entre 3500 y 6440 visitas se producen el 55 %. El 23 % restante son dı́as
con afluencia superior a 6440 visitas. Admitiendo que el número de visitas por dı́a
se distribuye normalmente, estime qué valore corresponden a la esperanza y a la
desviación estándar de esta variable.

152
45. La longitud de un estuche moldeado por inyección para una cinta magnética tiene
una distribución normal con una media de 90,2 milı́metros y desviación estándar de
0,1 milı́metros.

a ¿Cuál es la probabilidad de que la longitud de una pieza sea mayor que 90,3
milı́metros o menor que 89,7 milı́metros?
b ¿A qué valor debe ajustarse la media del proceso para que el mayor número de
partes tenga una longitud entre 89,7 y 90,3 milı́metros?
c Si se desechan los estuches cuya longitud no está entre 89,7 y 90,3 milı́metros,
¿cuál es el rendimiento del proceso para el valor de la media determinado en el
inciso b)?

46. Un industrial produce cojinetes con un diámetro medio de 0,750 de pulgada. Hay
una cierta cantidad de variabilidad asociada con el proceso de manufactura; esto es,
no todos los cojinetes tienen, exactamente 0,750 de pulgada en el diámetro, hay una
desviación estándar de 0,002 de pulgada. Suponga que el control de calidad exige
que los cojinetes tengan diámetro entre 0,745 y 0,755. Cualquier cantidad fuera de
este rango debe ser desechada, elaborada de nuevo o vendida como desperdicio.
¿Qué proporción de cojinetes serán desechados si suponemos que los diámetros de
los cojinetes están normalmente distribuidos.

47. La vida promedio de cierto tipo de motor pequeño es de 10 años con una desviación
estándar de 2 años. El fabricante repone sin cargo todos los motores que fallen
dentro del periodo de garantı́a. Si está dispuesto a reponer sólo 3 % de los motores
que fallan, ¿qué tan larga deberá ser la garantı́a que otorgue? Suponga que las vidas
de los motores siguen una distribución normal.

48. Las calificaciones de una prueba final de Estadı́stica tienen distribución normal con
una media igual a 8. Si el 6.68 % de los estudiantes tienen nota aprobatoria (mayor o
igual a 11), ¿Cómo debe modificarse cada nota para conseguir un 45 % de aprobados?

49. La distribución de la duración en meses de cierto tipo de objeto es exponencial con


parámetro β, ¿cuál es el valor de β si se sabe que hay una probabilidad de 0.7 de
que uno de estos objetos tenga una duración a lo más de 6 meses?

50. Suponga que le tiempo de vida útil de un modelo de computadora es una variable
aleatoria con distribución exponencial cuya media es 10 meses. Si el costo del montaje
de cada computadora es $660 y la venta es de $1000 determinar la utilidad esperada
por cada computadora sabiendo que el distribuidor cambia por otra computadora
nueva si esta dura menos de 5 meses.

153
Práctica N o 1
Apellidos y nombres: ...............................................................................................
Firma:...............................................
Fecha:...............................................
Nota:................................................

1. Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en


el año 2002 son los siguientes:

440 560 335 587 613 400 424 466 565 393

453 650 407 376 470 560 321 500 528 526

570 430 618 537 409 600 550 432 591 428

440 340 558 460 560 607 382 667 512 492

450 530 501 471 660 470 364 634 580 450

574 500 462 380 518 480 625 507 645 382

a Construya la tabla de frecuencias.


b Identifique la población, muestra y la variable con su tipo de escala.
c Calcule las medidas de tendencia central.
d Calcule las medidas de dispersión.

154
155
2. Las secciones A , B y C del curso de Estadı́stica y Probabilidad rinden el mismo
examen parcial. Los resultados obtenidos se registran en las siguientes tablas:

A A B B C C
Xi Fi [Li−1 , Li [ Xi fi Hi hi Xi2
2.5 3 [2,6[ 16 0.1 2.5
7.5 8 [6,10[ 144 0.2 10
12.5 22 [10,14[ 240 0.8 86.4
17.5 30 [14,18[ 240 1 45

a En cuál de las secciones las notas son más homogéneas?


b Calcular e interpretar la desviación estándar para las tres secciones juntas.

156
157
Práctica N o 2
Apellidos y nombres: ...............................................................................................
Firma:...............................................
Fecha:...............................................
Nota:................................................

1. En un saquito hay papeletas de tres colores, con las siguientes probabilidades de


ser elegidas: a) Amarilla: probabilidad de 0.50, b) Verde: probabilidad de 0.30 c)
Roja: probabilidad de 0.20. Según el color de la papeleta elegida, podrás participar
en diferentes sorteos. Ası́, si la papeleta elegida es: a) Amarilla: participas en un
sorteo con una probabilidad de ganar de 0.40. b) Verde: participas en otro sorteo
con una probabilidad de ganar de 0.60 c) Roja: participas en un tercer sorteo con
una probabilidad de ganar de 0.80. Con esta información, ¿qué probabilidad tienes
de ganar el sorteo en el que participes?

158
2. Sea X una variable aleatoria con función de densidad:


 x si 0≤x ≤1
f (x) = k−x si 1≤x ≤2


0 otro caso

a Hallar el valor de k.
b Hallar la función de distribución acumulada.
c Calcular el valor esperado
d Calcular la varianza

159
3. La longitud de un estuche moldeado por inyección para una cinta magnética tiene
una distribución normal con una media de 90,2 milı́metros y desviación estándar de
0,1 milı́metros.

a ¿Cuál es la probabilidad de que la longitud de una pieza sea mayor que 90,3
milı́metros o menor que 89,7 milı́metros?
b ¿A qué valor debe ajustarse la media del proceso para que el mayor número de
partes tenga una longitud entre 89,7 y 90,3 milı́metros?
c Si se desechan los estuches cuya longitud no está entre 89,7 y 90,3 milı́metros,
¿cuál es el rendimiento del proceso para el valor de la media determinado en el
inciso b)?

160
Bibliografı́a

[1] Cordova, Z. Manuel. Estadı́stica Descriptiva e Inferencial. Editorial MOSHERA.

[2] Larson. Introducción a la Teorı́a de la Probabilidad e Inferencia Estadı́stica. Li-


musa.

[3] Meyer P.L. Probabilidad y Aplicaciones Estadı́sticas. Fondo Educativo Interame-


ricano.

[4] Walpole y Myer. Probabilidad y Estadı́stica McGraw-Hill.

[5] Cordova, Z. Manuel. Estadı́stica Aplicada. Editorial MOSHERA.

161

También podría gustarte