Está en la página 1de 133

CAPÍTULO 1

INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

La industria se encuentra comprometida con un continuo perfeccionamiento en cuanto a la


calidad de sus productos y servicios se refiere, es en esta vía en la cuál se puede competir
exitosamente.

Para llevar a cabo satisfactoriamente esta labor, los ingenieros desempeñan una tarea
primordial, puesto que ellos son los encargados de diseñar nuevos productos, hacer los
cálculos necesarios para el desarrollo del producto, desarrollar nuevos procesos de
fabricación, así como mejorar los sistemas existentes.

Los procedimientos estadísticos son una herramienta importante en estas actividades ya


que suministran al ingeniero métodos descriptivos y analíticos para poder tomar las mejores
decisiones a partir de los datos observados.

1
2 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

1.1. Definición de estadística

La estadística se ocupa en realizar inferencias acerca de una población, con base en la


información contenida en una muestra tomada de esa población. La teoría de la estadística
tiene por objetivo cuantificar información, diseñar procedimientos para recolectar datos y
analizar tales datos.

Un preludio necesario para realizar inferencias acerca de una población es la capacidad


para describir características de un conjunto de números. Las distribuciones de frecuencia
brindan un método gráfico para caracterizar poblaciones conceptuales o reales de números.

El mecanismo para hacer inferencias es proporcionado por la teoría de la probabilidad. El


probabilista razona desde una población conocida hasta el resultado de un experimento
individual: la muestra. En contraste, el experto en estadística calcula la probabilidad de
una muestra observada y usa esta información para realizar inferencias sobre una población
desconocida, de esta manera la probabilidad es la base de la estadística.

1.2. Estadística descriptiva e inferencial

La estadística descriptiva es la rama de la estadística que presenta técnicas para describir


conjuntos de mediciones. Seguramente todos nosotros hemos visto estadísticas descriptivas
de varias maneras: gráficas de barras, gráficas de pastel, gráficas de líneas, tablas numé-
ricas, promedios, etc. Las gráficas y resúmenes numéricos generados en un computador se
han vuelto algo común en las presentaciones realizadas por los medios de comunicación:
noticieros, periódicos, informativos, programas deportivos etc.

La estadística descriptiva está formada por procedimientos empleados para resumir y


describir características importantes de un conjunto de mediciones.

Si el conjunto de mediciones es toda la población, solo es necesario emplear la estadística


descriptiva para obtener conclusiones. No obstante, podría resultar demasiado costoso o
llevaría demasiado tiempo enumerar toda la población. En estas situaciones lo más viable
es obtener una muestra de la población que nos permita contestar preguntas acerca de la
totalidad de la población. La rama de la estadística que se ocupa de este problema se llama
estadística inferencial.

La estadística inferencial se compone de procedimientos empleados para hacer inferencias (es


decir, obtener conclusiones, hacer predicciones, tomar decisiones) acerca de características
poblacionales, a partir de información contenida en una muestra sacada de la población.
1.3. CONCEPTOS BÁSICOS 3

1.3. Conceptos básicos

El objetivo de la primer parte del curso es presentar las técnicas más comunes de la
estadística descriptiva: la rama de la estadística relacionada con la descripción de
conjuntos de datos tanto de muestras como de poblaciones. Antes de esto
debemos introducir algunas definiciones propias del lenguaje estadístico.
1.1 Definición. Una variable es una característica que cambia con el tiempo o con
diferentes individuos u objetos de estudio.

Por ejemplo, la temperatura en Bogotá es una variable que cambia con el tiempo. Por otra
parte, la afiliación religiosa, el origen étnico, la estatura, la edad o el peso son variables que
cambian con cada individuo elegido.
1.2 Definición. Una unidad experimental es el individuo u objeto sobre el cuál se mide
una variable. Una medición o dato se obtiene cuando se mide una variable sobre una
unidad experimental.

Si se genera una medición por cada unidad experimental en todo el conjunto, los datos
resultantes constituyen la población de interés. Cualquier subconjunto más pequeño de
datos es una muestra.
1.3 Definición. Una población es el conjunto de todos los datos de interés para el estudio
realizado.
1.4 Definición. Una muestra es un subconjunto de datos elegidos de la población de
interés.
1.5 Definición. El censo es el recuento de datos estadísticos sobre toda una población
específica, de manera que se puedan conocer algunas características de interés.

Los datos que suelen recogerse en un censo son edad, género, nivel de educación, acceso a
servicios básicos, ingresos mensuales, características de la vivienda habitada, entre otros.

Pese a su utilidad los censos no suelen realizarse con tanta frecuencia debido al costo que
implica su realización.
1.6 Definición. La encuesta es un instrumento para recoger información cualitativa y/o
cuantitativa de una población estadística. Para ello, se elabora un cuestionario, cuyos datos
obtenidos son procesados con métodos estadísticos.

Para realizar una encuesta, el investigador debe elaborar un formulario de preguntas que
dependen de los objetivos del estudio, tal formulario o cuestionario se aplica normalmente
a una muestra representativa.
4 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

1.7 Definición. Un parámetro es una medición numérica que describe algunas


características de la población.
Cuando Lincoln fué elegido presidente por primera vez, votaron 1 865 908 personas, y él
recibió el 39.8 % de los votos. La población se compone de todos esos votos, y el 39.8 % es
un parámetro.

1.8 Definición. Un estadístico es una medición numérica que describe algunas caracte-
rísticas de una muestra.
Con base en una muestra de 900 ejecutivos encuestados, se encontró que el 45 % de ellos
no contrataría a alguien con un error ortográfico en su solicitud de empleo. Esta cifra del
45 % es un estadístico, ya que está basada en una muestra.

1.4. Tipos de variables

Las variables se pueden clasificar en dos categorías: cualitativas y cuantitativas.

1.9 Definición. Las variables cualitativas miden una cualidad o característica en cada
unidad experimental. Las variables cuantitativas miden una cantidad numérica en cada
unidad experimental.

Las variables cuantitativas a su vez se clasifican como discretas y continuas.

1.10 Definición. Una variable discreta puede tomar solo un número finito o contable
de valores. Una variable continua toma una cantidad de valores correspondientes a los
puntos de un intervalo de recta.

1.11 Ejemplo. Se elige un grupo de cinco estudiantes de ingeniería de la Universidad


Distrital, los datos obtenidos se registran en la siguiente tabla. Identifique los distintos
elementos que se relacionan con este conjunto de datos.
Estudiante Número de Estatura Carrera Género
materias inscritas (ingeniería)
1 7 163.8 cm Ambiental Femenino
2 9 174.25 cm Mecánica Masculino
3 5 152.4 cm Industrial Femenino
4 8 158.62 cm Ambiental Femenino
5 6 186.1 cm Sistemas Masculino

En este ejemplo se examinan cuatro variables, las unidades experimentales sobre las cuales
se miden las variables son cinco estudiantes de la Universidad Distrital.
1.5. EJERCICIOS SOBRE CONCEPTOS BÁSICOS 5

Las variables son: número de materias, estatura, carrera y género, note que cada una de
ellas cambia de un estudiante a otro.

Si consideramos la cantidad de materias inscritas por cada estudiante de ingeniería como


población de interés, las cinco cantidades de la segunda columna representan una muestra
de esta población. Esta variable arroja un número, por tanto se trata de una variable
cuantitativa, y como tal puede ser discreta o continua. Debido a que el número de materias
es contable, esta variable cuantitativa es discreta.

La siguiente variable de interés es la estatura (en centímetros) de los estudiantes de


ingeniería de la Universidad Distrital. Debido a que el resultado de una medición es un
número, estamos ante una variable cuantitativa. Como al medir exactamente la estatura de
un estudiante se puede obtener un valor del intervalo [140, 210] la variable cuantitativa es
continua.

La tercer variable es la carrera, que puede pertenecer a una de cuatro categorías: ambiental,
industrial, mecánica o sistemas. En este caso la variable es cualitativa, al igual que la cuarta
variable de interés, la cual indica el género del estudiante, esta variable solo puede caer en
una de dos categorías: femenino o masculino.

1.5. Ejercicios sobre conceptos básicos

1. Un conjunto de datos consta de las edades que tenían al morir cada uno de los 41
presidentes de los Estados Unidos ahora desaparecidos.
a) ¿Este conjunto de datos es una muestra o una población?
b) ¿Cuál es la variable que se está midiendo?
c) ¿De qué tipo es la variable?
d) ¿Cuáles son las unidades experimentales sobre las cuales se mide la variable?

2. Determine si el valor dado es un parámetro o un estadístico.


a) El senado actual de Estados Unidos se compone de 84 hombres y 16 mujeres.
b) Se selecciona una muestra de estudiantes de ingeniería de la Universidad Distrital
y el número promedio de libros comprados este año fue igual a 4.2.
c) Un noticiero de Bogotá le preguntó a 100 usuarios de transmilenio por su
percepción acerca de la seguridad en el sistema, el 62 % manifestó sentirse
inseguros en este medio de transporte.
d) En un estudio de los 2223 pasajeros del Titanic, se encontró que 706 sobrevivieron
cuando éste se hundió.
6 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

3. Clasifique en cada caso si se trata de una variable cualitativa o cuantitativa. Cuando


la variable sea cuantitativa diga si es discreta o continua.
a) Afiliación política: demócrata, republicano, independiente.
b) Cantidad de taxis no registrados en la ciudad de Bogotá.
c) Peso de un paquete listo para su envío.
d) Clasificación del sabor de la comida en determinado restaurante: excelente, bueno,
regular, malo.
e) volumen del jugo de naranja en un vaso.
f ) Color de un dulce M&M: café, amarillo, rojo, anaranjado, verde, azul.

4. Un investigador médico quiere estimar el tiempo de supervivencia de un paciente


después del inicio de un tipo específico de cáncer y después de un régimen particular
de radioterapia.
a) ¿Cuál es la variable de interés para el investigador médico?
b) ¿De qué tipo es la variable?
c) Identifique la población de interés para el investigador.
d) ¿Cuáles son las unidades experimentales sobre las cuales se mide la variable?

5. Identifique las unidades experimentales en las que se miden las siguientes variables:
a) Género de un estudiante.
b) Cantidad de errores en el examen final.
c) Edad de jubilación de un pensionado en Colombia.
d) Número de flores en una planta de azalea.
e) Color de un automóvil que entra al parqueadero de la Universidad Distrital.

6. Un investigador educativo quiere evaluar la efectividad de un nuevo método para


enseñar a los estudiantes sordos. El aprovechamiento al final de un periodo de ense-
ñanza se mide con el resultado del estudiante en un examen de lectura.
a) ¿Cuál es la variable a medir?
b) ¿Cuál es la población de interés?
c) ¿Cuales son las unidades experimentales?

7. La encuesta a los suscriptores de The Wall Street Journal formuló ciertas preguntas
sobre las características y los intereses de los lectores. Determine si cada una de las
siguientes preguntas proporciona datos cualitativos o cuantitativos.
a) ¿Qué edad tiene?
b) ¿Es usted hombre o mujer?
c) ¿Le interesan los deportes? Si es así indique cuáles.
d) ¿Cuántos años lleva en su empleo actual?
1.5. EJERCICIOS SOBRE CONCEPTOS BÁSICOS 7

8. En cada caso diga si la variable es cualitativa o cuantitativa. Si la variable es


cuantitativa diga si es discreta o continua.
a) El uso más frecuente del horno microondas: recalentar, descongelar, calentar.
b) El número de consumidores que se niegan a contestar una encuesta telefónica.
c) La puerta que elige un ratón en un experimento de laberinto: A, B o C.
d) el tiempo ganador de un caballo que corre el derby de Kentucky.
e) La cantidad de estudiantes que ingresan por semestre a la Universidad Distrital.
f ) El equipo de fútbol favorito de una persona.

9. La revista Foreign Affairs realizó una encuesta para desarrollar un perfil de sus
suscriptores. Se formularon las siguientes preguntas:
a) ¿Cuántas noches ha permanecido en un hotel en el último año?
b) ¿Donde adquiere sus libros? Se listaron tres opciones: Bookstore, Internet y Book
club.
c) ¿Posee o alquila vehículo de lujo? (Sí o no).
d) ¿Qué edad tiene?
Diga si cada pregunta proporciona datos cualitativos o cuantitativos.

10. Identifique las siguientes variables cuantitativas como discretas o continuas:


a) Población de cada barrio de Medellín.
b) Peso de los periódicos recuperados para reciclaje en un día.
c) Tiempo que le toma a cada estudiante de teoría de las probabilidades resolver el
examen final.
d) Cantidad de libros que los estudiantes de teoría de las probabilidades han
solicitado de la Biblioteca.

11. El departamento de comercio informó que recibió las siguientes aplicaciones para el
premio nacional de calidad: 23 de las empresas de manufactura grandes, 18 de las
empresas de servicios grandes y 30 de las pequeñas empresas.
a) ¿El tipo de empresa es una variable cualitativa o cuantitativa?
b) ¿Qué porcentaje de las aplicaciones proviene de las pequeñas empresas?
c) ¿Qué porcentaje de las aplicaciones proviene de empresas de servicios?
8 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

1.6. Resumen de datos cualitativos

Después de reunir los datos, se pueden consolidar y resumir para mostrar la siguiente
información:
Qué categorías de la variable se midieron.
Con qué frecuencia apareció cada categoría.

Para este propósito se puede construir una tabla estadística, con la cual se pueden apreciar
gráficamente los datos clasificados en las categorías.

1.12 Definición. Una distribución de frecuencia es un resumen tabular de datos que


muestra el número (frecuencia) de elementos en cada una de varias clases o categorías
disyuntas (que no se superponen).

De esta manera, la tabla estadística se compone de una lista de las categorías consideradas
junto a una medición de frecuencia con que aparece cada categoría. Para ello se dispone de
tres parámetros:
La frecuencia o número de datos en cada categoría.
la frecuencia relativa o proporción de datos en cada categoría.
El porcentaje de datos en cada categoría.

Si n representa el número total de datos del conjunto, se puede encontrar la frecuencia


relativa y el porcentaje por medio de las siguientes expresiones:
Frecuencia
Frecuencia relativa = Porcentaje = 100 · Frecuencia relativa
n
Hay que tener presente que la suma de frecuencias es n, la suma de las frecuencias relativas
es 1 y la suma de los porcentajes es 100 %.

Las categorías para una variable cualitativa se eligen de manera que cada medición
pertenezca exactamente a una de ellas, una vez que se han clasificado y resumido los datos
en una tabla estadística, se puede usar una gráfica de sectores o una gráfica de barras para
mostrar la distribución de los datos.

Una gráfica de sectores también llamada diagrama de pastel, es una gráfica circular que
muestra cómo se distribuyen los datos entre las categorías. En una gráfica de barras se
exhibe la misma distribución de mediciones en categorías pero usando unas barras en las
cuales su altura determina con qué frecuencia se observa una categoría particular.

1.13 Ejemplo. Coke Classic, Diet Coke, Dr Pepper, Pepsi y Sprite son cinco bebidas
refrescantes muy conocidas en Estados Unidos. Los datos presentados en la siguiente tabla
representan la bebida favorita obtenida a partir de una encuesta telefónica.
1.6. RESUMEN DE DATOS CUALITATIVOS 9

Coke Classic Pepsi Diet Coke Pepsi Coke Classic


Pepsi Coke Classic Dr Pepper Coke Classic Diet Coke
Diet Coke Sprite Coke Classic Pepsi Coke Classic
Pepsi Coke Classic Coke Classic Pepsi Dr Pepper
Coke Classic Diet Coke Pepsi Sprite Coke Classic
Dr Pepper Diet Coke Coke Classic Coke Classic Pepsi
Sprite Coke Classic Coke Classic Diet Coke Pepsi
Pepsi Coke Classic Pepsi Dr Pepper Coke Classic
Coke Classic Pepsi Coke Classic Sprite Diet Coke
Diet Coke Dr Pepper Pepsi Coke Classic Sprite

Construya una tabla de frecuencias, una gráfica de barras y una gráfica de sectores para
este conjunto de datos cualitativos.

Comenzamos hallando la tabla de frecuencias, la columna referente al ángulo es opcional y


se determina multiplicando la frecuencia relativa por 360.

Categoría Frecuencia Frecuencia Frecuencia Ángulo


relativa porcentual
Coke Classic 19 0.38 38 % 136.8◦
Diet Coke 8 0.16 16 % 57.6◦
Dr Pepper 5 0.10 10 % 36◦
Pepsi 13 0.26 26 % 93.6◦
Sprite 5 0.10 10 % 36◦
Total 50 1.00 100 % 360◦

Ahora procedemos a encontrar la gráfica de barras, con el objetivo de enfatizar la cantidad


real o frecuencia de cada categoría. Con ayuda de un programa informático como excel o
R project se puede obtener un diagrama como el siguiente:
10 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Finalmente construímos la gráfica de sectores


(o gráfica de pastel), el impacto visual es distin-
to, el diagrama de pastel se utiliza para mostrar
la relación de las partes con el todo, al acudir a
un programa informático se obtiene el diagrama
adjunto.

1.7. Ejercicios sobre datos cualitativos


1. En una encuesta se pidió a 400 evaluadores de la
educación pública en Estados Unidos que calificaran la Evaluación Frecuencia
educación básica primaria. A 35
La letra A corresponde a la calificación más alta mientras
B 260
que D es la más baja.
C 93
Sus respuestas se resumen en la tabla de la derecha.
D 12
Realice una tabla estadística de frecuencias, un diagrama
de barras y una gráfica de pastel para la distribución de Total 400
frecuencia.
2. En la ciudad de Bogotá se pregunta a 120 personas si en el próximo partido de las
eliminatorias al mundial, la selección Colombia gana, empata o pierde. 60 de ellas
afirman que ganará, 24 aseguran que empatará y 36 dicen que perderá. Realice las
distribuciones de frecuencia, así como los diagramas de barras y de sectores para la
distribución de frecuencia relativa.

3. En orden alfabético, los seis apellidos más comunes en Estados Unidos son: Brown,
Davis, Johnson, Jones, Smith y Williams. Una muestra de 50 personas con uno de
estos apellidos proporcionó los siguientes datos:
Brown Williams Williams Williams Brown
Smith Jones Smith Johnson Smith
Davis Smith Brown Williams Johnson
Johnson Smith Smith Johnson Brown
Williams Davis Johnson Williams Johnson
Williams Johnson Jones Smith Brown
Johnson Smith Smith Brown Jones
Jones Jones Smith Smith Davis
Davis Jones Williams Davis Smith
Jones Johnson Brown Johnson Davis
1.7. EJERCICIOS SOBRE DATOS CUALITATIVOS 11

a) Elabore una tabla estadística de frecuencias.


b) Realice un diagrama de barras de frecuencia relativa.
c) Haga un diagrama de sectores de frecuencia relativa.
d) Basado en la tabla de frecuencia, ¿Cuáles son los tres apellidos más comunes?
4. Las cuatro ramas de las fuerzas armadas en
Ejército Fuerza aérea
Estados Unidos son muy diferentes en su
Blanco 58.4 % 75.5 %
formación con respecto a las distribuciones de
Negro 26.3 % 16.2 %
género, raza y edad. La tabla de la derecha
Latino 8.9 % 5.0 %
muestra el desglose racial de los miembros del
Otro 6.4 % 3.3 %
ejército y la fuerza aérea.
a) Defina las variables medidas en esta tabla.
b) Construya un diagrama de pastel de frecuencia porcentual.
c) Realice un diagrama de barras de frecuencia porcentual.
d) ¿Qué porcentaje de los miembros del ejército son minorías, es decir, no blancos?
e) ¿Qué porcentaje de los miembros de la fuerza aérea son minorías?

5. Una bolsa pequeña de maní confitado M & M contiene 21 dulces con los colores
descritos en la lista adjunta, elabore una tabla estadística de frecuencias y las gráficas
de barras y sectores de frecuencia relativa para este conjunto de datos cualitativos.
Café Rojo Amarillo Café Anaranjado Amarillo Verde
Rojo Anaranjado Azul Café Azul Verde Azul
Verde Café Azul Café Anaranjado Café azul

6. Se selecciona una muestra de 20 vehículos que ingresan a un parqueadero de Bogotá


y el registro arroja la siguiente lista:
moto automóvil camioneta moto camioneta
automóvil moto furgón automóvil moto
camioneta moto moto automóvil automóvil
furgón camioneta automóvil camioneta moto
a) ¿Qué variable se está midiendo?
b) Elabore una tabla estadística de frecuencias para este conjunto de datos.
c) Realice una gráfica de barras de frecuencia.
d) Construya una gráfica de sectores de frecuencia.
e) ¿Qué porcentaje de los vehículos que ingresaron al parqueadero posee más de dos
ruedas?
Categoría Frecuencia
7. Doscientas personas están agrupadas en
A 44
cuatro categorías: A, B, C y D como se
B 56
indica en la tabla de la derecha.
C 76
a) ¿Cuál es la unidad experimental?
D 24
12 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

b) ¿Cuál es la variable que se está midiendo?


c) Trace un diagrama de barras de frecuencia relativa para describir los datos.
d) Realice un diagrama de pastel de frecuencia relativa que describa los datos.
e) ¿Qué proporción de las personas está en las categorías A o B?
f) ¿Qué proporción de las personas no está en la categoría C?

8. Se tiene una distribución de frecuencia relativa parcial, y el tamaño de la muestra es


de 200 datos
Clase Frecuencia relativa
A 0.22
B 0.18
C 0.40
D ?
a) ¿Cuál es la frecuencia relativa de la clase D?
b) ¿Cuál es la frecuencia de la clase D?
c) Elabore la distribución de frecuencia.
d) Construya un diagrama de barras y un diagrama de pastel para la distribución
de frecuencia relativa.

9. Un cuestionario proporciona 58 respuestas Sí, 42 respuestas No y 20 no respondieron.


a) En el diagrama circular, ¿Cuántos grados mediría la sección del círculo
correspondiente a la respuesta Si?
b) ¿Cuántos grados mediría la sección del círculo que corresponde a la respuesta No?
c) Elabore un diagrama de pastel de la frecuencia.
d) Realice un diagrama de barras de la frecuencia.

10. Un fabricante de Jeans tiene plantas en California (CA), Arizona (AZ) y Texas (TX).
Se selecciona al azar una muestra de 25 jeans de la base de datos computarizada y se
registra el estado en el que se produjo cada uno:
CA AZ AZ TX CA
CA CA TX TX TX
AZ AZ CA AZ TX
CA AZ TX TX TX
CA AZ AZ CA CA
a) ¿Cuál es la variable que se está midiendo?
b) Construya una gráfica de sectores de frecuencia relativa.
c) Elabore una gráfica de barras de frecuencia relativa.
d) ¿Qué proporción de jeans se fabricó en Texas?
e) ¿Qué estado produjo la mayoría de jeans de la muestra?
1.8. RESUMEN DE DATOS CUANTITATIVOS 13

1.8. Resumen de datos cuantitativos

Como se definió en la sección 1.6, una distribución de frecuencia es un resumen tabular de


los datos que muestra el número (frecuencia) de elementos en cada una de las clases que no
se superponen. Esta definición es válida para datos tanto cualitativos como cuantitativos,
sin embargo para datos cuantitativos hay que considerar las clases que no se superponen y
que se usan en la distribución de frecuencia.

1.8.1. Distribuciones de frecuencia. Histograma

Un histograma de frecuencia relativa es semejante a una gráfica de barras, que se usa para
resumir datos cuantitativos en lugar de datos cualitativos. Primero dividimos el intervalo
de mediciones, de las más pequeñas a las más grandes, en subintervalos de igual longitud,
que llamaremos clases. Si se ponen en columna los puntos de cada clase y se traza una barra
sobre cada columna se habrá creado un histograma de frecuencia relativa.

1.14 Definición. Un histograma de frecuencias para un conjunto de datos cuantitati-


vos, es una gráfica de barras en la que la altura de cada barra muestra con qué frecuencia
(medida como proporción o frecuencia relativa) las mediciones caen en cada clase. Las clases
se grafican a lo largo del eje horizontal.

Si un dato coincide con un punto frontera de clase, se acostumbra usar el método de inclusión
izquierda: se incluye el valor si éste coincide con el extremo izquierdo de la clase y se excluye
si coincide con el extremo derecho.

A continuación se indica una manera práctica de construir un histograma.

Determine el número de clases, usualmente este número se encuentra entre 5 y 10. Entre
más datos se tengan, más clases serán necesarias.
Calcule el ancho de clase al dividir la diferencia entre los valores máximo y mínimo entre
el número de clases, y aproxime superiormente este valor hasta obtener un número entero
o un número con una cifra decimal.
Localice las fronteras de clase. La primer clase puede incluir la medición más pequeña.
En las otras clases aplique el método de inclusión izquierda.
Construya una tabla estadística que contenga las clases, sus frecuencias, frecuencias
relativas y si es pertinente las frecuencias acumuladas (estas frecuencias se mencionarán
a continuación).
Elabore un histograma similar a una gráfica de barras, ubicando los intervalos de clase en
el eje horizontal y las frecuencias relativas como las alturas de las barras.
14 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Frecuencias acumuladas: estas frecuencias utilizan el número, los anchos y los límites de
clases desarrollados para las distribuciones de frecuencia, sin embargo, en lugar de indicar
la frecuencia de cada clase, la distribución de frecuencia acumulada exhibe el número de
datos con valores menores que la frontera superior de cada clase.
Tenga en cuenta que si n representa la cantidad de datos, en la última fila de la frecuencia
acumulada debe aparecer n, y en la última fila de la frecuencia relativa acumulada debemos
encontrar el número 1. El siguiente ejemplo ilustra el uso de estas distribuciones.

1.15 Ejemplo. Los datos de la tabla de la derecha 7.2 7.8 6.8 6.2 8.2
son los pesos de 30 bebés de gestación completa al 8.0 8.2 5.6 8.6 7.1
momento de nacer, nacidos en un hospital metropoli- 8.2 7.7 7.5 7.2 7.7
tano de California y registrados al décimo de libra más 5.8 6.8 6.8 8.5 7.5
cercano. Realice un histograma de frecuencia relativa 6.1 7.9 9.4 9.0 7.8
que describa el comportamiento de éstos datos. 8.5 9.0 7.7 6.7 7.7
Trabajemos con ocho clases. El rango (o intervalo) de datos es 9.4 − 5.6 = 3.8.
3.8
El ancho mínimo de clase es igual a = 0.475, para mayor comodidad aproximamos
8
este ancho de clase a 0.5 (se aproxima superiormente).
La primer clase empieza incluyendo el dato 5.6 y todos los datos menores a 5.6 + 0.5 = 6.1.
La segunda clase incluye los datos mayores o iguales a 6.1 y menores que 6.1 + 0.5 = 6.6.
La tercer clase incluye los datos mayores o iguales a 6.6 y menores que 6.6 + 0.5 = 7.1.
Continuando de esta manera llegamos a la octava clase, que incluye los datos mayores o
iguales a 9.1 y menores o iguales a 9.1 + 0.5 = 9.6.

Al ubicar cada dato en su respectiva clase podemos construir la tabla de frecuencias que
acompaña este ejemplo, en este caso se incluyen las frecuencias acumuladas para ilustrar
su uso, pero si no se solicitan no es necesario incluirlas.

Clase fronteras frecuencia frecuencia frecuencia frecuencia relativa


de clase relativa acumulada acumulada
2 2
1 5.6 ≤ x < 6.1 2 30 2 30
2 4
2 6.1 ≤ x < 6.6 2 30 4 30
4 8
3 6.6 ≤ x < 7.1 4 30 8 30
5 13
4 7.1 ≤ x < 7.6 5 30 13 30
8 21
5 7.6 ≤ x < 8.1 8 30 21 30
5 26
6 8.1 ≤ x < 8.6 5 30 26 30
3 29
7 8.6 ≤ x < 9.1 3 30 29 30
1 30
8 9.1 ≤ x < 9.6 1 30 30 30 =1

Observe que al final de la columna correspondiente a la frecuencia acumulada se encuentra


el número 30, que es precisamente el número de datos; y que al final de la columnna
correspondiente a la frecuencia relativa acumulada se aprecia el número 1.
1.8. RESUMEN DE DATOS CUANTITATIVOS 15

Con la información de esta tabla se construye el histograma de frecuencias relativas

1.8.2. Diagrama de puntos


Algunos conjuntos de datos cuantitativos constan de números que no pueden separarse
fácilmente en clases o intervalos de tiempo, en estos casos se requiere otra manera de
graficar este tipo datos.

La gráfica más simple para los datos cuantitativos es el diagrama de puntos. Para un
conjunto pequeño de mediciones, por ejemplo el conjunto 2, 6, 9, 3, 7, 6, se pueden trazar
los datos simplemente como puntos en un eje horizontal. Para el ejemplo mencionado, el
diagrama de puntos se ilustra a continuación.

Para un conjunto más grande de datos, como el de la siguiente figura, es posible que el
diagrama de puntos no dé información clara y que su interpretación sea difícil de realizar.
16 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

1.16 Ejemplo. Los datos cuantitativos de la tabla


12 14 19 18
de la derecha representan el tiempo en días
15 15 18 17
necesario para completar las auditorías de final de
20 27 22 23
año para una muestra de 20 clientes de Clifford, una
22 21 33 28
firma de contadores públicos. Realice un diagrama
14 18 16 13
de puntos para este conjunto de datos.
Sobre un eje horizontal ubicamos ciertos valores, luego ubicamos los puntos para obtener
la siguiente gráfica.

1.8.3. Diagrama de tallo y hoja


Otra manera sencilla de mostrar la distribución de un conjunto cuantitativo de datos es
por medio de una representación gráfica de los datos usando los valores numéricos reales de
cada punto de los datos.

Para construir un diagrama de tallo y hoja se puede seguir el siguiente procedimiento.


1) Divida cada medición en dos partes: el tallo y la hoja.
2) Liste los tallos en una columna, con una línea vertical a su derecha.
3) Para cada medición registre la parte de la hoja en la misma fila que el tallo correspon-
diente, a la derecha de la línea vertical.
4) Ordene las hojas de menor a mayor en cada tallo.
5) Especifique la unidad de hoja para que de ser necesario, el lector pueda obtener las
mediciones reales.
1.17 Ejemplo. En la tabla de la derecha se encuen- 90 70 70 57 70
tran los precios de 20 marcas distintas de zapatillas 75 70 65 68 60
para hacer deporte. Elabore un diagrama de tallo y 74 70 95 75 70
hoja para mostrar la distribución de los datos. 68 65 40 65 70

Para crear el tallo y las hojas se puede dividir cada observación en sus unidades y sus
decenas, el tallo es la cifra de las decenas, mientras que la hoja es la cifra de las unidades,
por ejemplo, para las zapatillas que costaron $ 68, el tallo es 6 y la hoja es 8. Los tallos
varían de 4 a 9 y se listan a la izquierda de la línea vertical.
La indicación que aclara que la unidad de hoja es 1, sirve para que el lector comprenda que
el tallo 7 y la hoja 5 representan el número 75.
1.8. RESUMEN DE DATOS CUANTITATIVOS 17

4 0 4 0
5 7 5 7
6 5 8 0 8 5 5 unidad de hoja = 1 6 0 5 5 5 8 8
7 0 0 0 5 0 4 0 5 0 0 reordenamiento =⇒ 7 0 0 0 0 0 0 0 4 5 5
8 8
9 0 5 9 0 5

A partir del diagrama de tallo y hoja se aprecia que el menor dato es 40, el mayor es 95, el
que más se repite es 70 que aparece siete veces, que el 65 aparece tres veces, etc.

En ciertas ocasiones el diagrama de tallo y hoja nos conduce a una gráfica con pocos tallos
y una gran cantidad de hojas dentro de cada tallo, para realizar un diagrama más práctico
y en el cuál se pueda apreciar la información de manera más clara, se pueden prolongar los
tallos al dividir cada uno en varias lineas, por lo general los tallos se dividen en una de dos
formas:
En dos líneas, con las hojas 0-4 en la primera línea y las hojas 5-9 en la segunda línea.

En cinco líneas, con hojas 0-1, 2-3, 4-5, 6-7 y 8-9 en las cinco líneas, respectivamente.

1.18 Ejemplo. Consideremos de nuevo el ejemplo 7.2 7.8 6.8 6.2 8.2
1.15 que nos habla del peso de 30 bebés al nacer. 8.0 8.2 5.6 8.6 7.1
En la tabla de la derecha se tienen de nuevo los datos. 8.2 7.7 7.5 7.2 7.7
Realizar el diagrama de tallo y hoja extendido, 5.8 6.8 6.8 8.5 7.5
dividiendo cada tallo en dos partes como lo indica la 6.1 7.9 9.4 9.0 7.8
primer viñeta del párrafo anterior. 8.5 9.0 7.7 6.7 7.7

Si se usa el punto decimal como línea divisoria entre el tallo y las hojas, tenemos solamente
cinco tallos, algunos con una gran cantidad de hojas haciendo el diagrama un poco tedioso
de interpretar. Al escribir cada tallo en dos renglones consecutivos vemos ocho tallos debido
a que la primera línea del tallo 5 y la segunda línea del tallo 9 están vacías, esto produce
una gráfica más descriptiva.

5 8 6 5 6 8
6 1 2 6 1 2
6 8 8 8 7 6 7 8 8 8
7 2 2 1 unidad de hoja = 0.1 7 1 2 2
7 8 7 9 5 7 7 5 8 7 reordenamiento =⇒ 7 5 5 7 7 7 7 8 8 9
8 0 2 2 2 8 0 2 2 2
8 5 6 5 8 5 5 6
9 0 4 0 9 0 0 4
18 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Este diagrama muestra que el dato que más se repite es 7.7 ya que aparece cuatro veces,
también muestra que el menor valor es 5.6 y el mayor es 9.4, otra característica rescatable
es que la mayoría de los pesos se encuentran entre 7 y 8 libras.
Si esta gráfica se gira 90◦ a la izquierda se puede apreciar que los datos se han agrupado
en forma de campana, algo muy especial en el ámbito de la estadística.

1.8.4. Características de las gráficas

Una vez se ha elaborado una gráfica para un conjunto de datos es conveniente tener en
cuenta los siguientes aspectos:

Verifique las escalas horizontal y vertical para tener claro lo que se está midiendo.

Examine la ubicación de la distribución de los datos. ¿Donde está el centro de la


distribución en el eje horizontal? Si está comparando dos distribuciones, ¿están ambos
centros en el mismo lugar?

Examine la forma de la distribución. ¿La distribución tiene un máximo? Si es así,


ésta es la medición, categoría o clase que ocurre con más frecuencia. ¿Hay más de un
máximo? ¿Hay una cantidad aproximadamente igual de datos a la izquierda y a la
derecha del máximo?

Busque cualquier medición inusual o valor atípico, es decir, ¿existe alguna medición
mucho más grande o pequeña que las demás? Tales valores atípicos podrían no ser
representativos de los otros valores del conjunto.

1.19 Definición. Una distribución es simétrica si sus lados izquierdo y derecho forman
imágenes idénticas cuando se dividen por su valor medio.
Una distribución es sesgada a la derecha si una proporción mayor de datos se localiza a la
derecha del valor máximo, este tipo de distribuciones pueden presentar algunas mediciones
extremadamente grandes.
Una distribución es sesgada a la izquierda si una proporción mayor de datos se localiza
a la izquierda del valor máximo, tales distribuciones pueden presentar algunas mediciones
extremadamente pequeñas.

A continuación se presentan algunos histogramas para poner en práctica las definiciones de


forma que se acaban de formular.
1.9. EJERCICIOS SOBRE DATOS CUANTITATIVOS 19

1.9. Ejercicios sobre datos cuantitativos

1. A continuación se registran 40 mediciones de los tiempos que un bus urbano tarda


(en minutos) en recorrer cinco de sus paradas, en 40 dás distintos. Tenga en cuenta
que algunos días el tráfico puede hacer el recorrido más lento.
14 21 23 21 16 19 22 25 16 16
24 24 25 19 16 19 18 19 21 12
16 17 18 23 25 20 23 16 20 19
24 26 15 22 24 20 22 24 22 20
a) Elabore una tabla de distribución de frecuencias considerando cinco clases,
incluyendo las frecuencias acumuladas.
b) Construya un histograma de frecuencia.
c) Construya un histograma de frecuencias relativas acumuladas.
20 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

2. Remitiéndonos al ejercicio anterior,


a) Realice un diagrama de tallo y hoja extendido y úselo para determinar cuáles son
las mediciones número 7, 17, 27 y 37. Especifique la unidad de hoja.
b) ¿Qué fracción de los datos es menor que 16? ¿Qué fracción de los datos es mayor
que 22?
c) Elabore un diagrama de puntos.

4.5 3.2 3.5 3.9 3.5 3.9


3. A la derecha se presenta una lista de precios (en 4.3 4.8 3.6 3.9 4.3 4.2
dólares) de un desayuno básico en 24 ciudades 3.8 3.7 4.3 4.4 3.4 4.2
diferentes de los Estados Unidos. 4.4 4.0 3.6 3.5 3.9 4.0
a) Realice una tabla estadística de frecuencias, incluyendo aquellas de distribución
acumulada, escoja el número de clases.
b) Elabore un histograma de frecuencias.

4. Considere el ejercicio anterior.


a) Construya un diagrama de tallo y hoja, elija convenientemente la unidad de hoja.
b) Haga un diagrama de tallo y hoja extendido y explique si esto mejora la presen-
tación de los datos.
c) Realice un diagrama de puntos y compare la forma de este daigrama con el del
histograma y los de tallo y hojas. ¿Todos proporcionan la misma información?

5. Se registró el tiempo (en meses) entre el inicio de una enfermedad en particular y su


repetición, en 50 pacientes:
2.1 4.4 2.7 32.3 9.9 9.0 2.0 6.6 3.9 1.6
14.7 9.6 16.7 7.4 8.2 19.2 6.9 4.3 3.3 1.2
4.1 18.4 0.2 6.1 13.5 7.4 0.2 8.3 0.3 1.3
14.1 1.0 2.4 2.4 18.0 8.7 24.0 1.4 8.2 5.8
1.6 3.5 11.4 18.0 26.7 3.7 12.6 23.1 5.6 0.4
a) Elabore un histograma de frecuencias relativas para los datos, elija la cantidad
de clases.
b) ¿Describiría la forma de la distribución como aproximadamente simétrica, sesgada
a la derecha o a la izquierda?
c) Determine la fracción del tiempo de repetición de la enfermedad menor a 11
meses.
1.9. EJERCICIOS SOBRE DATOS CUANTITATIVOS 21

6. Para encontrar la distribución de los tiempos (en minutos) de atención a los clientes
de una cadena de supermercados, se registró el muestra de 60 tiempos de servicio a
clientes, los cuales se presentan a continuación:
3.6 1.9 2.1 0.3 0.8 0.2 1.0 1.4 1.8 1.6 1.1 1.8
0.3 1.1 0.5 1.2 0.6 1.1 0.8 1.7 1.4 0.2 1.3 3.1
0.4 2.3 1.8 4.5 0.9 0.7 0.6 2.8 2.5 1.1 0.4 1.2
0.4 1.3 0.8 1.3 1.1 1.2 0.8 1.0 0.9 0.7 3.1 1.7
1.1 2.2 1.6 1.9 5.2 0.5 1.8 0.3 1.1 0.6 0.7 0.6
a) Construya un diagrama de tallo y hoja extendido, indique la unidad de hoja.
b) ¿Qué fracción de los tiempos de servicio es menor o igual a un minuto?
c) Encuentre las mediciones número 15, 25, 35 y 45.

7. Remítase al ejercicio anterior.


a) Haga un histograma de frecuencias relativas para los tiempos de servicio, escoja
la cantidad de clases.
b) Describa la forma de la distribución.
c) ¿Observa algún dato atípico? Si los hay ¿Qué interpretación hace de ellos?
d) Al comparar el diagrama de tallo y hoja con el histograma puede afirmar que las
dos gráficas proporcionan la misma información?

61 93 91 86 55
8. Las calificaciones en un examen de 100 puntos se
63 86 82 76 57
registraron para 20 estudiantes y se encuentran
94 89 67 62 72
a la derecha.
87 68 65 75 84
a) Realice un diagrama de puntos para este conjunto de datos (use una escala
horizontal adecuada).
b) Describa la forma de los datos.
c) La forma de la distribución es poco común. Dé una razón para este
comportamiento.

9. Una variable discreta solo puede asumir 1 2 1 0 2


los valores 0, 1 y 2. 2 1 1 0 0
A la derecha se presenta un conjunto de 2 2 1 1 0
20 datos de esta variable. 0 1 2 1 1
a) Construya una tabla de frecuencias (incluya las frecuencias acumuladas).
b) Elabore un histograma de frecuencia para este conjunto de datos.
c) ¿Qué proporción de las mediciones es mayor a 1?
d) ¿Qué proporción de las mediciones es menor a 2?
22 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

10. A continuación aparecen tres diagramas de puntos, clasifique cada uno de ellos según
su forma (simétrico, sesgado a derecha/izquierda).

1.10. Medidas de tendencia central

Las gráficas permiten representar la forma básica de una distribución de datos, pero el uso
de los métodos gráficos tienen limitaciones, por ejemplo, un simple cambio de escala en un
histograma puede cambiar la percepción de la forma de la distribución, otro problema con
las gráficas es que ellas son imprecisas a la hora de aplicar alguna inferencia estadística.

Una manera de superar estos problemas es usar medidas numéricas, las cuales se determi-
nan para una muestra o una población de datos. Se pueden usar las mediciones para calcular
un conjunto de números que transmitirán una imagen mental aceptable de la distribución
de frecuencias. Recuerde que estas medidas se llaman parámetros cuando se relacionan con
la población, y estadísticos cuando se calculan a partir de las mediciones de una muestra.

Una de las medidas numéricas más utilizadas son las medidas de tendencia central, es decir,
una medida en el eje horizontal que ubica el centro de la distribución.

1.20 Definición. Una medida de tendencia central es un valor que se encuentra en el


centro de un conjunto de datos.

La media (aritmética) generalmente es la más imoprtante de todas las medidas numéricas


utilizadas para describir datos; constituye lo que se conoce comunmente como promedio.
1.10. MEDIDAS DE TENDENCIA CENTRAL 23

A
Plo largo del curso asumiremos la siguiente notación:
denota la sumatoria de un conjunto de valores.
x es la variable que representa los valores de las mediciones.
n representa el número de valores de una muestra.
N representa el número de valores de una población.
1.21 Definición. La media de un conjunto de mediciones es igual a la suma de las
mediciones, dividida entre el número de mediciones.
n
P
xi es la media de un conjunto de valores de una muestra.
i=1
x̄ = Se denomina x barra.
n
N
P
xi es la media de un conjunto de valores de una población.
i=1 Se denomina mu.
µ=
N
1.22 Ejemplo. Un ingeniero está diseñando un conector de nylon que se usará en un motor
de automóvil. Se realizan ocho unidades y se miden las fuerzas de desconexión, produciendo
los siguientes datos (en lb − pie): 12.6, 12.8, 13.4, 12.3, 13.6, 13.5, 12.7, 13.1.
Calcule la media muestral de fuerza de desconexión.
8
P
xi
i=1 12.6 + 12.8 + 13.4 + 12.3 + 13.6 + 13.5 + 12.7 + 13.1
x̄ = = = 13.0
8 8
por tanto, la fuerza de desconexión promedio es de 13 lb − pie.

Una segunda medida de tendencia central es la mediana, la cual se define a continuación.


1.23 Definición. La mediana m de un conjunto de n mediciones es igual al dato que se
encuentra en la posición media cuando las mediciones están ordenadas de menor a mayor.
Si el número de valores es impar, la mediana es el número que se localiza exactamente a la
mitad de la lista.
Si el número de valores es par, la mediana se obtiene calculando la media de los dos números
que están en la mitad.
1.24 Ejemplo. Encuentre la mediana de las fuerzas de desconexión del ejemplo 1.22

Recordemos que hay 8 datos, es decir, un número par. Primero organizamos los datos de
menor a mayor y hallamos el promedio entre los datos cuarto y quinto:

12.3 12.6 12.7 12.8 13.1 13.4 13.5 13.6


12.8 + 13.1
al promediar los datos encerrados en el rectángulo obtenemos: m = = 12.95
2
24 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

1.25 Ejemplo. Determine la mediana para el conjunto de mediciones: 2, 9, 11, 5, 6.

Ordenamos las mediciones: 2 5 6 9 11

Como hay cinco datos, la mediana será el ubicado en el tercer lugar, es decir, m = 6.

Otra manera de localizar el centro de una distribución es buscar el valor que más se repita.

1.26 Definición. La moda M de un conjunto de datos es el valor que se presenta con


mayor frecuencia.
Cuando dos valores ocurren con la misma frecuencia y ésta es la más alta, los dos valores
son modas, y se dice que el conjunto es bimodal.
Cuando más de dos valores ocurren con la misma frecuencia y ésta es la más alta, tales
valores son modas, por lo que el conjunto de datos es multimodal.
Cuando ningún valor se repite, se dice que no hay moda.

1.27 Ejemplo. 1. Considere el ejemplo 1.15 que habla del peso al nacer de 30 bebés.
La moda de este conjunto de datos es M = 7.7.
2. El ejemplo 1.17 suministra el precio de un par de zapatillas de 20 marcas distintas.
La moda de estas mediciones es 70.
3. El ejemplo 1.22 nos da la fuerza de desconexión de 8 conectores de nylon. En este
caso decimos que no hay moda.

1.10.1. Forma de una distribución de mediciones

Una comparación de la media, la mediana y la moda puede proporcionarnos información


sobre el sesgo de una distribución, tema abordado en la sección 1.8.4.

Recordemos que una distribución de datos es sesgada si no es simétrica y se extiende más


hacia un lado que hacia el otro.

Las distribuciones sesgadas a la izquierda (o con sesgo negativo) poseen una cola
izquierda más larga, en este caso es muy común que tanto la media como la mediana
se encuentren a la izquierda de la moda.
Generalmente en este tipo de distribuciones, la media es menor que la mediana.

Las distribuciones sesgadas a la derecha (o con sesgo positivo) presentan una cola hacia
la derecha, en esta situación normalmente la media y la mediana son mayores que la moda.
Usualmente en las distribuciones sesgadas a la derecha, la media se encuentra a la derecha
de la mediana.
1.11. EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL 25

Las anteriores características se pueden apreciar en la siguiente gráfica

1.11. Ejercicios sobre medidas de tendencia central

1. Considere las 10 mediciones: 3, 5, 4, 6, 10, 5, 6, 9, 2, 8.


a) Calcule la media, la mediana y la moda.
b) Elabore un diagrama de puntos para el conjunto de datos dados.
c) Localice las tres medidas de tendencia central en el diagrama de puntos, con base
en ellas diga si la distribución es simétrica o sesgada.

2. Un computador se ha vuelto un artículo común 1 0 2 1 1


en los hogares de las familias Bogotanas. Una 0 2 1 1 0
muestra de 25 familias produjo las mediciones de 0 1 2 3 2
la derecha, sobre la variable que mide la cantidad 1 1 1 0 1
de computadores por familia. 3 1 0 1 1
a) Realice un diagrama de puntos y diga si la distribución es simétrica o sesgada.
b) Calcule: x̄, m y M.
c) Trace un histograma de frecuencia relativa y localice las medidas de tendencia
central sobre el eje horizontal.

3. El ejemplo 1.16 nos da el tiempo necesario para completar las auditorías para una
muestra de 20 clientes de una firma de contadores.
a) Determine x̄, m y M.
b) Según los resultados obtenidos en la parte a) diga si la distribución es simétrica
o sesgada.
c) En el ejemplo mencionado aparece el diagrama de puntos para el conjunto de
mediciones. ¿Tal diagrama es consistente con la forma de la distribución que usted
dió en la parte b)?
26 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

4. El ejemplo 1.15 suministra el peso al nacer de 30 bebés, y en la parte 1) del ejemplo


1.27 se determinó la moda de este conjunto de datos.
a) Encuentre la media y la mediana de éstas mediciones.
b) Según los resultados obtenidos en la parte a) diga si la distribución es simétrica
o sesgada.
c) En el ejemplo 1.18 se construyó un diagrama de tallo y hoja extendido para tales
mediciones. ¿Este diagrama es consistente con la forma de la distribución que usted
dió en la parte b)?

5. El ejemplo 1.17 proporciona el precio de zapatillas de 20 marcas distintas así como el


diagrama de tallo y hoja. En la segunda parte del ejemplo 1.27 se halló la moda.
a) Calcule la media y la mediana de éstas mediciones.
b) Según los resultados obtenidos en la parte a) diga si la distribución es simétrica
o sesgada.
c) ¿El diagrama de tallo y hoja para tales mediciones es consistente con la forma de
la distribución que usted dió en la parte b)?

6. En la tabla de la derecha aparece el precio esti- 0.99 0.60 1.23 0.85 0.65
mado (en dólares) de una lata de atún empacado 0.53 1.41 1.12 0.63 0.67
en agua de 6 onzas, para 14 marcas diferentes. 0.69 0.60 1.92 0.66
a) Determine la media, la mediana y la moda para este conjunto de datos.
b) Diga si la distribución es simétrica o sesgada.
c) Realice un diagrama de puntos. ¿Esto confirma la conclusión sobre la forma de
la distribución hecha en la parte b)?

7. En la tabla adjunta se encuentra el número de 16 7 2 6 4 1


cafeterias Starbucks en 18 ciudades a no más de 7 1 1 1 3 2
20 millas de la Universidad de California. 11 1 5 8 1 4
a) Encuentre la media, la mediana y la moda para estas mediciones.
b) Determine si la distribución es simétrica o sesgada.
c) Elabore un diagrama de puntos. ¿Esto confirma la conclusión sobre la forma de
la distribución hecha en la parte b)?

8. En un experimento automotriz sobre millaje y consumo de gasolina se aplicó una


prueba circulación a 13 automóviles a lo largo de 300 millas tanto en ciudad como en
autopista. Los siguientes datos se obtuvieron para el rendimiento en millas por galón
Ciudad 16.2 16.7 15.9 14.4 13.2 15.3 16.8 16.0 16.1 15.3 15.2 15.3 15.6
Autopista 18.6 20.6 18.3 18.6 19.2 17.4 17.2 18.6 19.0 21.1 19.4 18.5 18.7
Determine la media y la mediana para el rendimiento de la circulación en la ciudad
y la autopista.
1.12. MEDIDAS DE VARIACIÓN 27

9. Walt Disney Company compró a Pixar Animation Studios en el año 2006. Algunas
películas producidas por estas compañias durante los 10 anõs previos a la compra
aparecen en la tabla adjunta, los ingresos se miden en millones de dólares.

Disney Movies Ingresos Pixar Movies Ingresos


Pocahontas 346 Toy Story 362
Hercules 253 ABug’s Life 363
Mulan 304 Toy Story 2 485
Tarzan 448 Monsters Inc 525
Lilo & Stitch 273 Finding Nemo 865
Dinosaur 354 The Incredibles 631
a) Calcule la media y la mediana de los ingresos para comparar el éxito en taquilla
de las películas producidas por ambas empresas.
b) ¿Los estadísticos determinados en el literal anterior sugieren una razón por la que
Disney se interesó en comprar Pixar?
10. Al investigar los tiempos que se requieren en el servicio en automóvil (en segundos),
se obtuvieron los siguientes resultados
McDonald’s 287 128 92 267 176 240 192 118 153 254 193 136
Jack in the Box 136 130 126 126 139 141 137 138 133 131 134 129
a) Determine la media y la mediana de los datos para comparar los tiempos de
servicio.
b) ¿Cuál de los gigantes en comida es más veloz? ¿La diferencia parece ser
significativa?

1.12. Medidas de variación


Dos conjuntos de datos pueden tener el mismo centro, pero verse diferentes debido a la
forma en que los valores se dispersan a partir del centro.
Las dos distribuciones de la imagen tienen centro en x = 4, pero hay una gran diferencia
en la forma en que las mediciones se dispersan.
28 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

La variabilidad o dispersión es una característica muy importante en la estadística. Por


ejemplo, para una fábrica de tornillos una dispersión excesiva en el diámetro del tornillo
implicaría un alto porcentaje de piezas defectuosas.

La medida más simple de variación se presenta a continuación.

1.28 Definición. El rango, R, de un conjunto de mediciones se define como la diferencia


entre la medición mayor y la menor.

1.29 Ejemplo. Recordemos el ejemplo 1.22 que nos habla de la fuerza de desconexión de
ocho mediciones, a continuación escribimos las mediciones:
12.6, 12.8, 13.4, 12.3, 13.6, 13.5, 12.7, 13.1
La mayor medición es 13.6 y la menor es 12.3, por tanto el rango es R = 13.6 − 12.3 = 1.3

Otra medida de dispersión de gran relevancia es la varianza. Para distinguir entre la


varianza de una muestra y la varianza de una población usamos el símbolo s2 para la
varianza muestral y σ 2 para la varianza poblacional (σ es una letra griega denominada
sigma). La varianza es un número que es relativamente grande para datos muy variables
y relativamente pequeña para datos poco variables.
1.30 Definición. a) La varianza de una población N
(xi − µ)2
P
de N mediciones es el promedio de los cuadrados de las
desviaciones de las mediciones alrededor de su media µ, i=1
σ2 =
es decir: N

b) La varianza de una muestra de n mediciones n


(xi − x̄)2
P
es la suma de los cuadrados de las desviaciones de las
i=1
mediciones alrededor de su media x̄, dividida entre n − 1, s2 =
n−1
esto es:
Existe otra manera de hallar la varianza muestral, esto se  n
P
2
n xi
consigue mediante una fórmula equivalente a la anterior, P
x2i − i=1
n
tal expresión se conoce como fórmula computacional i=1
s2 =
de la varianza muestral y viene dada por: n−1
La varianza se mide en términos del cuadrado de las unidades originales de medición.
Si por ejemplo, las unidades originales se miden en metros m, la varianza se expresa en m2 .
Una pregunta frecuente que surge al apreciar la definición de la varianza muestral es
¿por qué es necesario dividir entre n − 1 en lugar de n? Así como se emplea la media
muestral x̄ para aproximar la media poblacional µ, se puede usar la varianza muestral s2
para estimar la varianza poblacional σ 2 . Resulta que la varianza muestral s2 con n − 1 en
el denominador da mejores estimaciones de σ 2 de lo que daría un estimador calculado con
n en el denominador. Esta es la principal razón para dividir entre n − 1 en lugar de n.
1.12. MEDIDAS DE VARIACIÓN 29

Tomando la raíz cuadrada de la varianza, obtenemos la desviación estándar, que regresa la


medida de dispersión a las unidades originales de medición.
1.31 Definición. La desviación estándar de un conjunto de mediciones, es igual a la
raíz cuadrada positiva de la varianza.

La notación utilizada en cuanto a varianza y desviación estándar se refiere es la siguiente:


n : número de mediciones en la muestra N : número de mediciones en la población
s2 : varianza muestral σ 2 : varianza poblacional
s : desviación estándar muestral σ : desviación estándar poblacional
1.32 Ejemplo. Se ha tomado una muestra de cinco conductores, la variable que
consideramos es el número de comparendos que les han registrado por infringir las
normas de tránsito. Los resultados son: 5, 7, 1, 2, 4.
Calcular la varianza muestral y la desviación estándar muestral.

Se verifica fácilmente que la media muestral es


xi xi − x̄ (xi − x̄)2
x̄ = 3.8.
5 1.2 1.44
La tabla de la derecha nos suministra la
7 3.2 10.24
desviación de la media en la segunda columna,
1 −2.8 7.84
y el cuadrado de la desviación de la media en la
2 −1.8 3.24
tercer columna.
4 0.2 0.04
En la última fila aparece la sumatoria de cada
19 0.0 22.80
columna
5 5
(xi − x̄)2
P
(xi − x̄)2 = 22.8
P
La tabla nos indica que
i=1 i=1 22.8
y por tanto la varianza muestral es: s2 = = = 5.7
5−1 4
Al tomar la raíz cuadrada se obtiene
√ la desviación estándar muestral (aproximada a la
primer cifra decimal): s = 5.7 = 2.4.

El siguiente estadístico nos dice qué tan grande es la desviación estándar con respecto a la
media.
1.33 Definición. El coeficiente de variación se expresa por medio del siguiente
desviación estándar
porcentaje: CV = · 100 %
media
Al implementar la notación para muestras y poblaciones respectivamente, la anterior
s σ
expresión equivale a: CV = · 100 % o CV = · 100 %
x̄ µ

El coeficiente de variación es un estadístico útil para comparar la dispersión de variables


que tienen tanto desviaciones estándar como medias distintas.
30 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

1.34 Ejemplo. El coeficiente de variación de las mediciones del ejemplo 1.32 es:
s 2.4
CV = · 100 % = · 100 % = 63.2 %
x̄ 3.8
este resultado indica que la desviación estándar muestral es el 63.2 % del valor de la media
muestral, un número tan alto indica que los datos se encuentran muy dispersos.

1.13. Ejercicios sobre medidas de variación

1. Considere las 10 mediciones: 3, 5, 4, 6, 10, 5, 6, 9, 2, 8.


a) Calcule el rango.
b) Determine la varianza muestral.
c) Encuentre la desviación estándar muestral.
d) Halle el coeficiente de variación.
2. Un computador se ha vuelto un artículo común 1 0 2 1 1
en los hogares de las familias Bogotanas. Una 0 2 1 1 0
muestra de 25 familias produjo las mediciones de 0 1 2 3 2
la derecha, sobre la variable que mide la cantidad 1 1 1 0 1
de computadores por familia. 3 1 0 1 1
a) Encuentre el rango, la varianza y desviación estándar.
b) Calcule el coeficiente de variación.

3. El ejemplo 1.16 nos da el tiempo necesario para completar las auditorías para una
muestra de 20 clientes de una firma de contadores.
Determine R, s2 , s y CV.

4. El ejemplo 1.15 suministra el peso al nacer de 30 bebés.


a) Encuentre la varianza muestral.
b) Obtenga la desviación estándar muestral.
c) Calcule el coeficiente de variación.

5. El ejemplo 1.17 proporciona el precio de zapatillas de 20 marcas distintas.


a) Calcule el rango R.
b) Halle la varianza muestral.
c) Determine la desviación estándar muestral.
d) Obtenga el coeficiente de variación.

6. En la tabla de la derecha aparece el precio esti- 0.99 0.60 1.23 0.85 0.65
mado (en dólares) de una lata de atún empacado 0.53 1.41 1.12 0.63 0.67
en agua de 6 onzas, para 14 marcas diferentes. 0.69 0.60 1.92 0.66
a) Determine la desviación estándar muestral.
b) Calcule el coeficiente de variación.
1.13. EJERCICIOS SOBRE MEDIDAS DE VARIACIÓN 31

7. En la tabla adjunta se encuentra el número de 16 7 2 6 4 1


cafeterias Starbucks en 18 ciudades a no más de 7 1 1 1 3 2
20 millas de la Universidad de California. 11 1 5 8 1 4
Encuentre la desviación estándar muestral y el coeficiente de variación.

8. En un experimento automotriz sobre millaje y consumo de gasolina se aplicó una


prueba circulación a 13 automóviles a lo largo de 300 millas tanto en ciudad como en
autopista. Los siguientes datos se obtuvieron para el rendimiento en millas por galón
Ciudad 16.2 16.7 15.9 14.4 13.2 15.3 16.8 16.0 16.1 15.3 15.2 15.3 16.2
Autopista 19.4 20.6 18.3 18.6 19.2 17.4 17.2 18.6 19.0 21.1 19.4 18.5 18.7
a) Calcule el coeficiente de variación muestral para la prueba en la ciudad.
b) Halle el coeficiente de variación muestral para la prueba en la autopista.
c) ¿Que puede concluir al comparar los coeficientes de las partes a) y b)?

9. Walt Disney Company compró a Pixar Animation Studios en el año 2006. Algunas
películas producidas por estas compañias durante los 10 anõs previos a la compra
aparecen en la tabla adjunta, los ingresos se miden en millones de dólares.

Disney Movies Ingresos Pixar Movies Ingresos


Pocahontas 346 Toy Story 362
Hercules 253 ABug’s Life 363
Mulan 304 Toy Story 2 485
Tarzan 448 Monsters Inc 525
Lilo & Stitch 273 Finding Nemo 865
Dinosaur 354 The Incredibles 631
a) Calcule el coeficiente de variación muestral para los ingresos de las películas
producidas por Disney.
b) Halle el coeficiente de variación muestral para los ingresos de las películas
producidas por Pixar.
c) ¿Que puede concluir al comparar los coeficientes de las partes a) y b)?

10. Al investigar los tiempos que se requieren en el servicio en automóvil (en segundos),
se obtuvieron los siguientes resultados
McDonald’s 287 128 92 267 176 240 192 118 153 254 193 136
Jack in the Box 136 130 126 126 139 141 137 138 133 131 134 129
a) Calcule el coeficiente de variación muestral para el tiempo de servicio en McDo-
nald’s.
b) Halle el coeficiente de variación muestral para el tiempo de servicio en Jack in
the Box.
c) ¿Que puede concluir al comparar los coeficientes de las partes a) y b)?
32 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

1.14. Medidas de posición relativa


En esta sección se estudiarán ciertas medidas que sirven para comparar valores de
diferentes conjuntos de datos o para comparar valores dentro del mismo conjunto de datos.
A continuación se introducen las puntuaciones z (para comparar valores de distintos
conjuntos de datos), así como los cuartiles y percentiles (para comparar valores dentro
del mismo conjunto de datos).

1.14.1. Puntuación z
Un puntaje z mide la distancia entre una observación y la media, medidas en unidades de
desviación estándar.

1.35 Definición. El puntaje z mide el número de desviaciones estándar que una medición
x se encuentra por arriba o por debajo de la media. Este número puede ser positivo o
negativo y se calcula mediante las siguientes expresiones:
x − x̄ x−µ
Muestra: z= Población: z=
s σ
1.36 Ejemplo. La estatura promedio de los hombres en Estados Unidos es de 69 pulgadas
con una desviación estándar de 2.8 pulgadas, en tanto que la estatura promedio de las
mujeres en dicho país es de 63.6 pulgadas con una desviación estándar de 2.5 pulgadas.

El legendario jugador de la nba Michael Jordan mide 78 pulgadas, mientras que la


exjugadora de la wnba Rebecca Lobo mide 76 pulgadas. En efecto, Jordan es más alto
que Rebecca por dos pulgadas, pero ¿la estatura de Jordan entre los hombres, excede la de
Rebecca entre las mujeres?

Para comparar las estaturas de estos exdeportistas en relación con las poblaciones de
hombres y mujeres, debemos hallar los puntajes z de sus estaturas:

Michael Jordan: Rebecca Lobo:


x−µ 78 − 69 x−µ 76 − 63.6
z= = = 3.21 z= = = 4.96
σ 2.8 σ 2.5
La estatura de Jordan está 3.21 desviaciones estándar arriba de la media, mientras que la
estatura de Rebecca se encuentra 4.96 desviaciones arriba de la media, de esto se sigue que
la estatura de Rebecca entre las mujeres es relativamente mayor que la de Jordan entre los
hombres.

Los puntajes z también son útiles para indicar cuando una medición es infrecuente, esto es,
cuando un dato esta considerablemente arriba o abajo de la media.
Más precisamente, los valores comunes son aquellos que satisfacen la desigualdad
−2 ≤ puntaje z ≤ 2.
1.14. MEDIDAS DE POSICIÓN RELATIVA 33

Los valores infrecuentes tienen puntuaciones z menores que −2 o mayores que 2, esto es,
puntaje z < 2 o puntaje z > 2.

En 1988 Mugsy Bogues jugó en los Charlotte Hornets de la nba, este exbasquetbolista sólo
mide 63 pulgadas. Vamos a averiguar si tal estatura también es un valor inf recuente.
x−µ 63 − 69
Hallando su puntaje z tenemos: z = = = −2.14 y por tanto decimos que la
σ 2.8
estatura de Mugsy también es un valor inf recuente.

Los cuartiles y percentiles también son medidas de posición, pero se usan para comparar
valores dentro del mismo conjunto de datos.

Recuerde que la mediana m es el valor que está en la mitad de los datos, de modo que el
50 % de los datos son menores o iguales a m, y el restante 50 % son mayores o iguales a m.
1.37 Definición. Así como la mediana m divide los datos en dos partes iguales,
los cuartiles, denotados Q1 , Q2 , y Q3 dividen los valores ordenados en cuatro
partes iguales.

El primer cuartil o cuartil inferior, Q1 , es un valor x que separa el 25 % inferior de los


valores ordenados, del 75 % superior.

El segundo cuartil es igual a la mediana, separa el 50 % inferior de los valores ordenados,


del 50 % superior.

El tercer cuartil o cuartil superior, Q3 , es un valor x que separa el 75 % inferior de los


valores ordenados, del 25 % superior.
En la siguiente gráfica se ilustra el concepto que acabamos de mencionar.
34 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Un percentil es otra medida de posición relativa y se usa con frecuencia en conjuntos grandes
de números, éstas medidas no son prácticas en conjuntos pequeños.
1.38 Definición. Un conjunto de n mediciones se ha reacomodado en orden de magnitud.
El p-ésimo percentil es el valor de x que es mayor o igual al p % de las mediciones, y
menor o igual que el restante (100 − p) %.

Nótese que el percentil-25 no es otra cosa más que el primer cuartil Q1 , el percentil-50 es
igual a la mediana y que el percentil-75 coincide con el tercer cuartil.

Cálculo de los cuartiles y percentiles


Cuando las n mediciones están organizadas en orden de magnitud, el primer cuartil, Q1 ,
es el valor de x en la posición 0.25(n + 1).
El tercer cuartil, Q3 , es el valor de x en la posición 0.75(n + 1).

Si los números 0.25(n + 1) y 0.75(n + 1) no son enteros (como sucede casi siempre), los
cuartiles se hallan por interpolación, usando los valores de las dos posiciones adyacentes.

El cálculo de un percentil se realiza de manera muy similar. Si se tienen n datos, el p-ésimo


percentil se encuentra en la posición 0.p(n + 1). Si éste valor no es entero, se debe realizar
la interpolación entre los dos datos adyacentes.
1.39 Ejemplo. En la siguiente tabla se registra el nivel de nicotina registrado sobre 40
personas que fuman o que han fumado alguna vez en su vida.
1 0 131 173 265 188 44 277 32 3
35 112 477 289 197 103 193 149 313 491
130 205 164 179 17 233 87 121 266 290
123 167 224 216 48 86 284 1 184 173

Calcule los tres cuartiles, así como el percentil 30 : P 30 y el percentil 90 : P 90 .

Primero organizamos los datos en orden de magnitud, y obtenemos la tabla presentada a


continuación:
0 1 1 3 17 32 35 44 48 86
87 103 112 121 123 130 131 149 164 167
173 173 179 184 188 193 197 205 216 224
233 265 266 277 284 289 290 313 477 491

El primer cuartil se encuentra en la posición 0.25(n + 1) = 0.25(40 + 1) = 0.25(41) = 10.25.


El segundo cuartil coincide con la mediana y por tanto es el promedio entre la vigésima
medición y la vigésimo primera.
El tercer cuartil se encuentra en la posición 0.75(n + 1) = 0.75(40 + 1) = 0.75(41) = 30.75
1.14. MEDIDAS DE POSICIÓN RELATIVA 35

Esto significa que Q1 está a 1/4 de distancia entre la décima y onceava mediciones:
167 + 173
Q1 = 86 + 0.25(87 − 86) = 86.25. m= = 170
2
Q3 se ubica a 3/4 de distancia entre la trigésima medición y la trigésimo primera:
Q3 = 224 + 0.75(233 − 224) = 230.75.

P 30 se encuentra en la posición: 0.30(41) = 12.3 y P 90 está en la posición 0.90(41) = 36.9.


De esta manera P 30 se halla a 3/10 de distancia entre la doceava y treceava mediciones:
103 + 0.3(112 − 103) = 105.7 mientras que P 90 se halla a 9/10 de distancia entre la 36ava
y 37ava mediciones: 289 + 0.9(290 − 289) = 289.9.

Los cuatro cuartiles dividen la distribución de datos en cuatro partes, cada una de ellas
contiene aproximadamente el 25 % de los datos. Los cuartiles Q1 y Q3 conforman la frontera
del 50 % medio de la distribución. Se puede medir el rango de este 50 % por medio de la
siguiente medida numérica.
1.40 Definición. El rango intercuartil (IQR) para un conjunto de mediciones, se define
como la diferencia entre el cuartil superior e inferior, esto es, IQR = Q3 − Q1
1.41 Ejemplo. En el ejemplo 1.39 se encontró lo siguiente: Q1 = 86.25 en tanto que
Q3 = 230.75, por tanto, IQR = 230.75 − 86.25 = 144.5

A continuación se presenta un conjunto de números que brinda un resúmen rápido y


aproximado de la distribución considerada.

El resumen de los cinco números consta del dato menor, el cuartil inferior, la mediana,
el cuartil superior y el dato mayor, presentados en orden ascendente:
Min, Q1 , Mediana, Q3 , Max
1.42 Ejemplo. Elabore el resumen de los cinco números correspondiente al ejemplo 1.39.

Si nos remitimos al ejemplo 1.39 podemos apreciar que allí se calculan los tres cuartiles,
solo falta agregar el dato menor: 0, y el dato mayor: 491. De esta manera, el resumen de
los cinco números es:
0 86.25 170 230.75 491

1.14.2. Diagrama de caja

El diagrama de caja es un resumen gráfico que presenta las características más importantes
de un conjunto de datos.
Este diagrama esta basado en el resumen de los cinco números y en el rango intercuartílico.

Para su elaboración podemos seguir los siguientes pasos:


36 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Calcule la mediana, los cuartiles inferior y superior, así como el IQR para el conjunto
de mediciones.
Trace una recta horizontal que represente la escala de medición, forme una caja arriba
de tal recta con su extremo izquierdo en Q1 y su extremo derecho en Q3 . Trace una
recta vertical que atraviese la caja en la ubicación de la mediana.
Calcule el límite inferior y superior mediante las expresiones:
límite inferior: Q1 − 1.5(IQR) límite superior: Q3 + 1.5(IQR)
Los datos menores que el límite inferior, y los datos mayores que el límite superior,
son llamados resultados atípicos, márquelos con un asterisco (∗) en el diagrama.
prolongue rectas horizontales llamadas bigotes desde los extremos laterales de la caja,
hasta las mediciones más pequeñas y más grandes que no sean resultados atípicos.

1.43 Ejemplo. El ejemplo 1.39 presenta los niveles de nicotina en 40 personas. Realice el
diagrama de caja.
Los cuartiles, mediana y rango intercuartílico vienen dados por:
Q1 = 86.25, m = 170, Q3 = 230.75, IQR = 144.5

Límite inferior: Q1 − 1.5(IQR) = 86.25 − 1.5(144.5) = −130.5


Límite superior: Q3 + 1.5(IQR) = 230.75 + 1.5(144.5) = 447.5

En el conjunto de datos no hay ninguno de ellos que sea menor que el límite inferior,
sin embargo hay dos datos mayores que el límite superior: 477 y 491, éstos son
los resultados atípicos.

La menor medición que no es un resultado atípico es 0, por tanto, el bigote izquierdo


se prolonga desde el extremo izquierdo de la caja hasta el 0.
El mayor valor que no es un resultado atípico es el 313, y así el bigote derecho sale
desde el extremo derecho de la caja y llega hasta el número 313.

Al reunir esta información se obtiene el diagrama de caja presentado a continuación.


1.14. MEDIDAS DE POSICIÓN RELATIVA 37

* *

0 50 100 150 200 250 300 350 400 450 500

El diagrama de caja también se puede utilizar para describir la forma de una distribución
de datos, si la mediana está cerca de la mitad de la caja, la distribución es simétrica; si la
mediana está a la izquierda del centro (cerca al primer cuartíl) la distribución es sesgada a
la derecha; si la mediana está a la derecha del centro (cerca al tercer cuartíl) la distribución
es sesgada a la izquierda. El diagrama de caja del ejemplo 1.39 nos indica que la distribución
es prácticamente simétrica.
Los diagramas de caja también se emplean para comparar aspectos como medianas
o variación en dos o más variables medidas en las mismas unidades.
1.44 Ejemplo. Para comparar los salarios mensuales de los empleados de una empresa
multinacional, se selecccionó una muestra de 200 empleados en la sección de negocios y se
registró la profesión y el suedo mensual de cada profesional.
La figura adjunta presenta los diagramas de caja para los profesionales en contabilidad,
finanzas, sistemas de información, administración de empresas y marketing.

Algunas observaciones acerca de los sueldos por área de especialización, a partir de los
diagramas de caja son las siguientes:
Con base en las medianas se concluye que los salarios ordenados de mayor a menor,
corresponden a las áreas de contabilidad, sistemas de información,finanzas, marketing
y administración.
Se presentan resultados atípicos de sueldos altos en contabilidad, finanzas y marketing.
Los salarios en el área de finanzas tienen menos variación, mientras que en contabilidad
se presenta la mayor variación.
38 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

1.15. Ejercicios sobre medidas de posición relativa


y diagrama de caja

1. La temperatura corporal humana tiene una media de 98.6◦ F y una desviación estándar
de 0.62◦ F. Se le tomó la temperatura a Juan, María y Pablo, tres estudiantes del curso
de estadística, y registraron 100◦ F, 96.96◦ F y 98.2◦ F respectivamente.
Calcule los tres puntajes z y clasifíquelos como valores comunes o infrecuentes.

2. Considere la muestra de 10 mediciones: 1, 1, 0, 15, 2, 3, 4, 0, 1, 3.


El dato menor es 0 y el dato mayor es 15. ¿Alguno de ellos es infrecuente?

3. Cierto estudiante presentó tres exámenes finales, en el de ecuaciones diferenciales sacó


18, en el de inglés obtuvo 144 y en el de estadística 90.
Diga que calificacíon relativa es mayor, si en el examen de ecuaciones diferenciales la
media es 15 y la desviación estándar es 5, en inglés la media es 128 y la desviación
estándar es 34 y en el estadística la media es 86 y la desviación estándar es 18.

4. El ejemplo 1.39 indica el nivel de nicotina en una muestra de 40 personas. Determine


los siguientes percentiles (aproximados a la segunda cifra decimal):
a) P 20 b) P 70 c) P 33 d) P 85 e) P 21

5. Un conjunto de datos tiene las siguientes medidas de posición relativa: Q1 = 42, y


Q3 = 50. Calcule el límite inferior y el límite superior del diagrama de caja y diga
en cada caso si la medición es un resultado atípico:
a) 60 b) 29 c) 65 d) 31 e) 62

6. La tabla de la derecha suministra los salarios


3450 3550 3650 3480
mensuales (en dólares) para una muestra de 12
3355 3310 3490 3730
ingenieros.
3540 3925 3520 3480
a) Calcule el resumen de los cinco números.

b) El diagrama de caja se presenta arriba, determine los límites inferior y superior;


verifique que hay exactamene un resultado atípico y encuentre este valor.
1.15. EJERCICIOS SOBRE MEDIDAS DE POSICIÓN RELATIVA
Y DIAGRAMA DE CAJA 39

7. El ejemplo 1.15 da el peso (en libras) al nacer de 30 bebés.


a) Construya el diagrama de caja para este conjunto de datos.
b) Al observar la ubicación de la mediana diga si la gráfica es simétrica o sesgada.
c) ¿Encuentra resultados atípicos? De haber resultados atípicos, ¿qué tipo de
atención médica deben recibir tales bebés?
8. Los datos siguientes son las cantidades de
sodio por rebanada (en miligramos) para
cada una de ocho marcas de queso regular:
340, 300, 520, 340, 320, 290, 260, 330.
El diagrama de caja se aprecia a la derecha.
a) Calcule el resumen de los cinco números.
b) Encuentre el límite inferior y el límite
superior, verifique que no hay bigote a la
derecha
c) Compruebe que la distribución de datos
solo posee un resultado atípico.

9. A la derecha se presentan dos diagramas


de caja, el primero de ellos muestra el con-
tenido de sodio en cinco marcas de queso
sin grasa con las siguientes cantidades de
sodio: 300, 320, 180, 300, 290.
El segundo diagrama presenta los niveles
de sodio en una rebanada de queso regular
del ejercicio anterior.
a) Calcule el resumen de los cinco
números para el queso sin grasa.

b) Para las mediciones sobre el queso sin grasa, halle el límite inferior y el límite
superior; verifique que no hay resultados atípicos en este tipo de queso.
c) Según la ubicación de las medianas, ¿qué tipo de queso presenta los mayores
niveles de sodio?
d) Según la posición de las medianas, ¿cómo es la forma de las distribuciones? ¿Cuál
presenta mayor sesgo?
e) ¿Qué tipo de queso presenta menor variabilidad en los niveles de sodio?

10. El ejemplo 1.16 nos da el tiempo (en días) requerido para completar las auditorías de
final de año para 20 clientes de una firma de contadores.
a) Realice el diagrama de caja para este conjunto de datos.
b) Determine la forma de la distribución, basado en la ubicación de la mediana.
40 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

11. Al investigar los tiempos que se requieren en el servicio en automóvil (en segundos),
se obtuvieron los siguientes resultados
McDonald’s 287 128 92 267 176 240 192 118 153 254 193 136
Jack in the Box 136 130 126 126 139 141 137 138 133 131 134 129
a) Realice los dos diagramas de caja de tiempo de servicio.
b) Al comparar la ubicación de las medianas diga cuál empresa es más rápida al
despachar la comida.
c) ¿Qué empresa presenta la menor variación en el tiempo de servicio?

12. El ejemplo 1.17 suministra el precio (en dólares) de 20 pares de zapatillas.


a) Elabore el diagrama de caja para este conjunto de datos.
b) ¿Encuentra resultados atípicos?

1.16. Teorema de Chebyshev y regla empírica


Los resultados que vamos a estudiar en esta sección hacen evidente la importancia de la
media y de la desviación estándar en una distribución de datos.

En esta sección se empleará la notación correspondiente a una población pero debe tenerse
presente que su resultado también aplica para datos muestrales.

El teorema de Chebyshev se aplica a cualquier conjunto de mediciones y se utiliza para


describir una muestra o una población.

Teorema de Chebyshev
La proporción de cualquier conjunto de datos que está dentro de k desviaciones
estándar de la media, es por lo menos 1 − k12 , donde k es cualquier número
positivo mayor que 1. Para k = 2, k = 3 y k = 4, tenemos:

Al menos 3/4 de los datos están dentro de dos desviaciones estándar de la media, o
equivalentemente, por lo menos el 75 % de las mediciones pertenecen al intervalo
µ − 2σ ≤ x ≤ µ + 2σ

Al menos 8/9 de los datos están dentro de tres desviaciones estándar de la media, o
equivalentemente, por lo menos el 89 % de las mediciones pertenecen al intervalo
µ − 3σ ≤ x ≤ µ + 3σ

Al menos 15/16 de los datos están dentro de cuatro desviaciones estándar de la media,
o equivalentemente, por lo menos el 94 % de las mediciones pertenecen al intervalo
µ − 4σ ≤ x ≤ µ + 4σ
1.16. TEOREMA DE CHEBYSHEV Y REGLA EMPÍRICA 41

Tenga presente que k puede asumir cualquier valor mayor que 1, por ejemplo, si k = 1.6
realizamos el cálculo 1 − k12 = 1 − 1.61 2 = 1 − 0.39 = 0.61, para concluir lo siguiente:
por lo menos el 61 % de las mediciones pertenecen al intervalo
µ − 1.6σ ≤ x ≤ µ + 1.6σ
1.45 Ejemplo. Se ha realizado un examen de estadística a 80 estudiantes de física de la
Universidad Distrital, la media de las calificaciones es 3.5 y la varianza 0.04.
a) Aplique el teorema de Chebyshev para describir la distribución de los datos.
b) ¿Qué porcentaje de los estudiantes obtuvieron calificaciones entre 3.2 y 3.8?
c) ¿Cuántos estudiantes obtuvieron calificaciones entre 3.0 y 4.0?

El enunciado nos dice que x̄ = 3.5 y que s2 = 0.04, por tanto s = 0.2

a) Por lo menos el 75 % de las mediciones se encuentran en el intervalo


x̄ − 2 s ≤ x ≤ x̄ + 2 s ⇐⇒ 3.5 − (2)(0.2) ≤ x ≤ 3.5 + (2)(0.2) ⇐⇒ 3.1 ≤ x ≤ 3.9

Por lo menos el 89 % de las mediciones se ubican en el intervalo


x̄ − 3 s ≤ x ≤ x̄ + 3 s ⇐⇒ 3.5 − (3)(0.2) ≤ x ≤ 3.5 + (3)(0.2) ⇐⇒ 2.9 ≤ x ≤ 4.1
3.8 − 3.5
b) En el caso de las calificaciones entre 3.2 y 3.8, notamos que k = = 1.5 y
0.2
1 1
de esta manera, 1 − k2 = 1 − 1.52 = 1 − 0.44 = 0.56, el teorema de Chebyshev implica que
por lo menos el 56 % de las calificaciones pertenecen a este intervalo.
4.0 − 3.5
c) Razonamos de la misma forma que en el literal anterior. k = = 2.5.
0.2
Ahora hallamos el porcentaje de las mediciones que se encuentra en tal intervalo: 1 − k12 =
1 − 2.51 2 = 1 − 0.16 = 0.84, el teorema de Chebyshev nos dice que por lo menos el 84 % de
las calificaciones se encuentran entre 3.0 y 4.0.
Hallamos el 84 % de 80 estudiantes para concluir que las notas de por lo menos 67.2
estudiantes se encuentran allí (si se quiere expresar una respuesta en números enteros
decimos que por lo menos 67 estudiantes tienen calificaciones entre 3.0 y 4.0).
42 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Regla empírica
En muchas aplicaciones prácticas los conjuntos de datos exhiben una distribución simétrica
con forma de campana, como lo indica la imagen, la regla empírica nos dice que bajo este
supuesto:

El intervalo µ − σ ≤ x ≤ µ + σ contiene aproximadamente el 68 % de las


mediciones.
El intervalo µ − 2σ ≤ x ≤ µ + 2σ contiene aproximadamente el 95 % de las
mediciones.
El intervalo µ − 3σ ≤ x ≤ µ + 3σ contiene aproximadamente el 99.7 % de las
mediciones.

La distribución con forma de campana que se muestra en la figura, se conoce como


distribución normal
1.46 Ejemplo. Los envases de detergente líquido se llenan automáticamente en una línea
de producción. Los pesos de llenado suelen tener una distribución en forma de campana. Si
el peso medio de llenado es de 16 onzas y la desviación estándar es 0.25 onzas, use la regla
empírica para describir la distribución.
Los pesos de llenado satisfacen la hipótesis de la regla empírica: forma de campana, por
tanto se puede afirmar lo siguiente:
Aproximadamente el 68 % de los envases llenos pesará entre 15.75 y 16.25 onzas.
Aproximadamente el 95 % de los envases llenos pesará entre 15.50 y 16.50 onzas.
Casi todos los envases llenos (el 99.7 %) pesarán entre 15.25 y 16.75 onzas.
1.17. EJERCICIOS SOBRE EL TEOREMA DE CHEVYSHEV
Y LA REGLA EMPÍRICA 43

Regla práctica del intervalo


El teorema de Chebyshev y la regla empírica son herramientas que indican que generalmente
las mediciones se localizan en un intervalo a dos desviaciones estándar de la media, como
lo indica la figura.

Esto indica que el rango total de las mediciones, desde la menor hasta la mayor, debe ser
un valor numérico muy cercano a cuatro desviaciones estándar.

Desde luego, esta es una aproximación muy burda pero a la vez útil para detectar errores
graves al calcular s. Si el rango, R, abarca alrededor de cuatro desviaciones estándar, se
puede escribir: R ≈ 4s ⇐⇒ s ≈ R4 .

1.47 Ejemplo. En el ejemplo 1.32 se calculó la desviación estándar del conjunto de datos
5, 7, 1, 2, 4. Utilice la regla práctica del intervalo para verificar el cálculo de s.

El rango de las cinco mediciones es R = 7 − 1 = 6.


En el ejemplo 1.32 se calculó s = 2.4.
La regla práctica del intervalo nos dice que s ≈ R4 = 6
4 = 1.5

No se pretende que el rango sea exactamente igual a 4s, lo que se busca es descubrir errores
graves en el cálculo de s, tales como no dividir la suma de los cuadrados de las desviaciones
entre n − 1, o no tomar la raíz cuadrada de s2 ; tales errores generan valores para s mucho
mayores que la aproximación suministrada por la regla práctica del intervalo cuando se
hacen los cálculos a mano.

1.17. Ejercicios sobre el Teorema de Chevyshev


y la regla empírica

1. Las calificaciones obtenidas por 200 estudiantes en un examen de cálculo diferencial


indica que la media es 70 y la desviación estándar es 5.
a) ¿Qué porcentaje de estudiantes obtuvieron puntuaciones entre 60 y 80?
b) ¿Cuántos estudiantes obtuvieron puntuaciones entre 58 y 82?

2. La media y la varianza de una muestra de 25 mediciones son 75 y 100 respectivamente.


Use el teorema de Chebyshev para describir la distribución de las mediciones.
44 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

3. En un estudio de tiempo efectuado en una planta manufacturera, se mide el tiempo


para completar una operación especifica para cada uno de los 40 trabajadores, y los
resultados muestran una distribución con forma de campana, con una media igual a
12.8 min y una desviación estándar de 1.7 min.
Describa los resultados de la distribución.
26.1 26.0 14.5 29.3 19.7
4. Se ha realizado una pruba teorica de
22.1 21.2 26.6 31.9 25.0
conducción a 25 aspirantes.
15.9 20.8 20.2 17.8 13.3
La escala de calificación va de 0 a 34.
25.6 26.5 15.7 22.1 13.8
Los resultados aparecen a la derecha.
29.0 21.3 23.5 22.1 10.2
a) Describa la distribución por medio del teorema de Chebyshev.
b) Describa la distrbución usando la regla empírica.
c) Realice una tabla estadística de frecuencia y frecuencia relativa, en los intervalos
[x̄ − 2s, x̄ + 2s] y [x̄ − 3s, x̄ + 3s].
d) ¿Los resultados obtenidos en la parte c) se ajustan más a los resultados
suministrados por el teorema de Chebyshev o por la regla empírica?

5. a) Calcule la desviación estándar de la distribución del ejercicio anterior.


b) Aplique la regla práctica del intervalo al ejercicio anterior.
c) ¿En cuanto difiere la real desviación estándar de la suministrada por la regla
práctica del intervalo?

6. Un conjunto de datos tiene una media de 73 y una desviación estándar de 5. No se


sabe nada acerca del tamaño del conjunto de datos, ni de la forma de la distribución.
a) ¿Qué proporción de los datos se encuentra en el intervalo [60, 86]?
b) ¿En qué intervalo se encuentra el 75 % de las mediciones?

7. El tiempo necesario para que el conductor de un automóvil responda a una situación


particular de emergencia se registró para 10 conductores, arrojando los siguientes
valores 0.5, 0.8, 1.1, 0.7, 0.6, 0.9, 0.7, 0.8, 0.7, 0.8.
a) Calcule la media muestral x̄ y la desviación estándar muestral s.
b) Encuentre el porcentaje de las mediciones en cada intervalo:
[x̄ − 2s, x̄ + 2s] y [x̄ − 3s, x̄ + 3s].
c) ¿Los resultados obtenidos en el literal b) concuerdan con los suministrados por
el teorema de Chebyshev o con los de la regla empírica?

8. Los datos presentados a continuación son los pesos (en libras) de 27 paquetes de carne
molida de un supermercado:
1.08 0.99 0.97 1.18 1.41 1.28 0.83 1.06 1.14
1.38 0.75 0.96 1.08 0.87 0.89 0.89 0.96 1.12
1.12 0.93 1.24 0.89 0.98 1.14 0.92 1.18 1.17
1.17. EJERCICIOS SOBRE EL TEOREMA DE CHEVYSHEV
Y LA REGLA EMPÍRICA 45

a) Elabore un diagrama de tallo y hoja, ¿la gráfica tiene aproximadamente forma


de campana?
b) Encuentre x̄ y s.
c) Determine el porcentaje de mediciones en los intervalos
[x̄ − s, x̄ + s], [x̄ − 2s, x̄ + 2s] y [x̄ − 3s, x̄ + 3s].
d) ¿Los resultados obtenidos en el literal c) coinciden con los de la regla empírica?

9. El ejemplo 1.39 indica los niveles de nicotina en 40 personas.


a) Calcule la desviación estándar s de este conjunto de datos.
b) Aplique la regla práctica del intervalo para estimar el valor de s.
c) ¿En cuánto difiere s de su aproximación?

10. La prueba Weschler sobre el coeficiente intelectual en adultos presenta una distribu-
ción normal (forma de campana), con media de 100 y desviación estándar de 15.
a) ¿Qué porcentaje de adultos tiene puntuaciones entre 55 y 145?
b) El 68 % de las mediciones ¿en qué intervalo se encuentra?
CAPÍTULO 2

PROBABILIDAD

2.1. Introducción

El concepto de probabilidad es necesario para trabajar con mecanismos físicos, biológicos


o sociales que generan observaciones que no se pueden predecir con certeza. Por ejemplo
la presión sanguínea de una persona en un determinado momento o la carga exacta que
un puente puede resistir antes de desplomarse, son sucesos que no se pueden determinar
con precisión, pero la frecuencia relativa con que ocurren en una larga serie de intentos es
a veces sorprendentemente estable. Los sucesos con esta propiedad se denominan eventos
aleatorios o estocásticos.

Eventos aleatorios como los ya mencionados, nos generan la necesidad de contar con una
teoría de probabilidad, que dará un método riguroso para hallar un número (o probabilidad)
que estará de acuerdo con la frecuencia relativa real de que ocurra un evento en una larga
serie de intentos.

En definitiva la probabilidad es una medida numérica de la posibilidad de que un evento


ocurra. Los valores de probabilidad se asignan en una escala de 0 a 1. Una probabilidad
cercana a 0 indica que el evento tiene pocas posibilidades de suceder, mientras que una
probabilidad cercana a 1 indica que es casi seguro que el evento ocurra.

46
2.2. CONJUNTOS 47

2.2. Conjuntos

Un conjunto es una colección de objetos, también llamados elementos, que tienen en


común alguna propiedad.

Se acostumbra usar letras mayúsculas para designar conjuntos y minúsculas para


denotar sus elementos. Cuando un elemento a pertenece a un conjunto A se escribe a ∈ A.
Si todos los elementos de un conjunto A también son elementos de un conjunto B, se dice
que A es un subconjunto de B, o que A está contenido en B, en cuyo caso se escribe A ⊆ B.
El conjunto nulo o vacío, denotado ∅, es el conjunto que no contiene elementos, se asume
que el conjunto vacío es un subconjunto de todo conjunto.

Los conjuntos y las relaciones entre ellos se pueden representar en forma adecuada mediante
el uso de diagramas de Venn.

El diagrama de Venn de la imagen de la izquierda muestra dos conjuntos A y B del conjunto


universal S. El conjunto A consta de todos los puntos dentro del triángulo mientras que B
se compone de todos los puntos dentro del círculo. Note que A ⊆ B.

Si A y B son dos conjuntos de puntos. La unión de A y B, denotada A ∪ B, es el conjunto


de todos los puntos en A o en B. Esto se aprecia en el diagrama de la derecha. La palabra
clave para expresar la unión de dos conjuntos es o, que significa A o B o ambos.

La intersección de A y B, denotada A ∩ B, es el conjunto de todos los puntos en A y B. El


diagrama de Venn de la izquierda ilustra esta situación. La palabra clave para expresar la
intersección de dos conjuntos es y, que significa A y B simultáneamente.

Si A es un subconjunto del conjunto universal S, el complemento de A, denotado Ā, es


el conjunto de puntos que están en S pero no en A. Esto se aprecia en el diagrama de la
derecha.
48 CAPÍTULO 2. PROBABILIDAD

Se dice que dos conjuntos A y B son


disjuntos o mutuamente excluyentes
si A ∩ B = ∅.
Observe que los conjuntos mutuamente
excluyentes no tienen puntos en común.
El diagrama de la derecha ilustra esta
situación.

Leyes distributivas y leyes de Morgan


Los conjuntos poseen dos propiedades similares a las leyes distributivas de los números
reales, estas son:

A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)

A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)

Las leyes de Morgan tienen gran importancia en la teoría de los conjuntos, ellas establecen
lo siguiente:

(A ∩ B) = Ā ∪ B̄

(A ∪ B) = Ā ∩ B̄

2.1 Ejemplo. Se Lanza un dado y se denota con S el conjunto de todas las posibles
observaciones numéricas, esto es, S = { 1, 2, 3, 4, 5, 6 }.
Se definen tres conjuntos: A = { 1, 2 }, B = { 1, 3 } y C = { 2, 4, 6 }.

Determine: a) A ∪ B b) A ∩ B c) Ā d) B ∩ C
2.3. EJERCICIOS SOBRE CONJUNTOS 49

a) A ∪ B = { 1, 2, 3 } b) A ∩ B = { 1 } c) Ā = { 3, 4, 5, 6 }

d) B ∩ C = ∅ De la parte b) concluimos que A y B no son mutuamente


excluyentes, mientras que de la parte d) se deduce que B y C si lo son.

2.3. Ejercicios sobre conjuntos

1. Represente en diagramas de Venn las leyes distributivas de conjuntos.

2. Represente en diagramas de Venn las leyes de Morgan.

3. En la biblioteca la Universidad Distrital hay 24 libros de computación y un estudiante


de ingeniería de sistemas está interesado en la forma como se describen los 3 temas
principales: compiladores, estructuras de datos y procesadores, hay algunos libros
de computación que no tratan estos temas. La base de datos dice que 8 libros tienen
información sobre compiladores, 13 sobre estructuras de datos, 13 sobre procesadores,
5 sobre compiladores y estructuras de datos, 3 sobre compiladores y procesadores, 6
sobre estructuras de datos y procesadores y 2 libros tienen información sobre los 3
temas. Determine la cantidad de libros que:
a) tratan de exactamente uno de estos tres temas
b) no tienen información sobre estos temas
c) poseen información sobre exactamente dos de los tres temas.

4. Suponga que una familia tiene dos hijos de distintas edades y estamos interesados en
el género de estos niños. Usemos la notación H para hombre y M para mujer, y el
orden de las letras para indicar el hijo mayor, por ejemplo M H indica que el mayor
es la niña y que el menor es el niño. Hay cuatro puntos en el conjunto universal de
posibilidades: S = { M M, M H, HM, HH}. Denote con A el subconunto de S que no
contiene hombres, B el subconjunto que contiene dos hombres y C es subconjunto que
contiene por lo menos un hombre. Indique los elementos de los siguientes conjuntos:
a) A ∩ B̄ b) A ∪ B c) Ā ∩ C d) A ∪ C e) B ∩ C̄ f ) B̄ ∪ C

5. De una encuesta a 60 estudiantes de la Universidad Distrital, se encontró que 9 estaban


viendo estadística, 36 tomaban cálculo y tan solo 3 recibían clase de estas dos materias.
Algunos de los encuestados no tomaban ninguna de estas dos asignaturas. Encuentre
el número de estudiantes que:
a) Tomaban cálculo, estadística o ambos.
b) Recibían clase de cálculo pero no de estadística.
c) No estaban cursando ni cálculo ni estadística.
d) Tomaban clase de estadística pero no de cálculo.
50 CAPÍTULO 2. PROBABILIDAD

6. Sean A y B dos eventos. Escriba expresiones que contengan uniones, intersecciones y


complementos que describan lo siguiente:
a) ocurren ambos eventos
b) ninguno ocurre
c) al menos uno ocurre
d) exactamente uno ocurre.

7. Algunos profesores de estadística llegaron a un restaurante mexicano a comer tacos.


La mesera tomó la orden, y anotó lo siguiente: 28 deben llevar cebolla, 23 picante, 29
cilantro, 9 llevan sólo llevan picante y cilantro, 3 sólo llevan picante, 8 sólo cilantro y
5 los tres acompañamientos. Determine el número de tacos que:
a) fueron comprados
b) LLevaban cebolla y picante más no cilantro
c) LLevaban solamente cebolla
d) LLevaban cebolla y cilantro pero no picante.

8. Un grupo de cinco solicitantes para un par de trabajos idénticos está formado por tres
hombres (H1 , H2 , H3 ) y dos mujeres (M1 , M2 ). El empleador debe seleccionar dos de
los cinco solicitantes para los trabajos. Denote con S el conjunto de todas las posibles
selecciones para los dos trabajos. Denote con A el subconjunto de todos los resultados
posibles a la selección de dos hombres y con B al subconjunto correspondiente a la
selección de por lo menos una mujer. Indique los siguientes conjuntos:
a) A ∩ B b) A ∩ B̄ c) Ā ∩ B d) Ā ∩ B̄
e) A ∪ B f ) A ∪ B̄ g) Ā ∪ B h) Ā ∪ B̄

9. Se lanzan dos dados, uno blanco y otro negro; y se observan los números de las caras
superiores. Denotemos con S el conjunto de todos los pares posibles que se pueden
observar (si por ejemplo se observa un 2 en el dado blanco y un 3 en el dado negro se
escribe (2, 3)). Especifique los siguientes subconjuntos de S:
a) El número observado en el dado negro es par.
b) La suma de los dos números es par.
c) La suma de los dos números es 8.
d) Se observa el mismo número en el dado blanco y en el dado negro.

10. La facultad de ingeniería de la Universidad Distrital necesita contratar 25 ingenieros


con maestría para trabajo de invastigación, así como 40 para labores docentes. De
todos estos ingenieros se espera que 10 realicen ambos tipos de labores. ¿Cuántos
ingenieros debe contratar?

11. Se lanzan dos monedas corrientes: una de $ 100 y otra de $ 200 y se registra lo que se
aprecia en su cara superior escribiendo primero el resultado de la moneda de $ 100 y
luego el resultado de la moneda de $ 200, por ejemplo la pareja sc indica que ha caído
sello en la moneda de $ 100 y cara en la de $ 200.
2.4. ESPACIO MUESTRAL Y AXIOMAS DE PROBABILIDAD 51

Halle el conjunto S de todas las posibilidades y los siguientes subconjuntos de S:


a) No se observa ni una cara.
b) Se aprecia exactamente una cara.
c) Las dos monedas han caído cara.

12. Se lanzan tres monedas corrientes: una de $ 100, otra de $ 200 y otra de $ 500 y se
registra lo que se aprecia en su cara superior escribiendo primero el resultado de la
moneda de $ 100, luego el resultado de la moneda de $ 200 y finalmente el resultado
de la moneda de $ 500, por ejemplo la terna ssc indica que ha caído sello en la moneda
de $ 100, sello en la moneda de $ 200 y cara en la de $ 500.
Halle el conjunto S de todas las posibilidades y los siguientes subconjuntos de S:
a) No se observa ni una cara.
b) Se aprecia una cara.
c) Se observan dos caras.
d) Las tres monedas han caído cara.

2.4. Espacio muestral y axiomas de probabilidad

En esta sección se realiza una definición de gran relevancia en todo el campo de la estadística:
el concepto de probabilidad. Primero es necesario realizar las siguientes definiciones.

2.2 Definición. Un experimento es el proceso por medio del cual se hace una
observación.

Un evento simple no se puede descomponer. Cada evento simple corresponde a un


solo punto muestral. Usaremos la notación Ei para denotar un evento simple o el
correspondiente punto muestral.

El espacio muestral asociado con un experimento es el conjunto formado por todos


los posibles puntos muestrales. Denotaremos el espacio muestral por medio de S.

Un espacio muestral discreto es aquel que está formado ya sea por un número
finito o contable de puntos muestrales distintos.

Un evento de un espacio muestral discreto S es un subconjunto de S.

Un evento compuesto se puede descomponer en dos o más eventos simples.

2.3 Ejemplo. Considere el experimento que consiste en lanzar un dado corriente y observar
el puntaje que aparece en la cara superior.

En este experimento se aprecian seis eventos simples:


52 CAPÍTULO 2. PROBABILIDAD

E1 : observar un 1. E2 : observar un 2. E3 : observar un 3.


E4 : observar un 4. E5 : observar un 5. E6 : observar un 6.

A continuación se presentan tres eventos compuestos: A : Observar un número impar.


B : Observar un número menor que 5. C : Observar un 2 o un 3.

Axiomas de probabilidad Sea S un espacio muestral asociado con un experimento,


a todo evento A en S (A ⊆ S) se le asocia un número denotado P (A), llamado
probabilidad de A, de modo que se cumplen los siguientes axiomas:
P (A) ≥ 0

P (S) = 1

Si A y B son dos eventos mutuamente excluyentes: A ∩ B = ∅,


entonces P (A ∪ B) = P (A) + P (B).

2.4 Ejemplo. Retomemos el ejemplo 2.3, como hay seis eventos simples lo más natural es
que la probabilidad de cada uno de ellos sea 16 , esto es, P (Ei ) = 61 para cada i = 1, 2, . . . , 6.
Para encontrar la probabilidad de los tres eventos compuestos empleamos el tercer axioma:
P (A) = P (E1 ) + P (E3 ) + P (E5 ) = 12 P (B) = P (E1 ) + P (E2 ) + P (E3 ) + P (E4 ) = 32
1
P (C) = P (E2 ) + P (E3 ) = 3 Observe que se satisface el segundo axioma:
P (S) = P (E1 ) + P (E2 ) + P (E3 ) + P (E4 ) + P (E5 ) + P (E6 ) = 1.

2.5 Ejemplo. Un fabricante tiene cinco terminales de computador aparentemente idénticas,


listas para ser enviadas. Sin que él lo sepa, dos de las cinco son defectuosas. Un pedido en
particular solicita dos de las terminales. El pedido se surte seleccionando al azar dos de las
cinco terminales. Use la notación B1 , B2 , B3 para las tres terminales buenas y D1 , D2
para las dos defecuosas.
a) Indique el espacio muestral del experimento.
b) Denote con A el evento que indica que el pedido se surta con terminales idóneas.
Determine los puntos muestrales de A.
c) Construya un diagrama de Venn para el experimento que ilustre el evento A.
d) Asigne probabilidades a los eventos simples de tal manera que se use la información
sobre el experimento y se satisfagan los axiomas de probabilidad.
e) Calcule la probabilidad del evento A.

a) Cualquier evento simple está formado por un par de terminales seleccionadas para el
envío. Al considerar todas las posibilidades obtenemos:
E1 = { B1 , B2 } E2 = { B1 , B3 } E3 = { B2 , B3 } E4 = { B1 , D1 } E5 = { B1 , D2 }
E6 = { B2 , D1 } E7 = { B2 , D2 } E8 = { B3 , D1 } E9 = { B3 , D2 } E10 = { D1 , D2 }
2.5. EJERCICIOS SOBRE ESPACIO MUESTRAL Y AXIOMAS 53

b) A = { E1 , E2 , E3 }
d) Debido a que las terminales se seleccionan S
al azar, cualquier par de terminales es tan pro-
bable de ser seleccionado como cualquier otro, E4 E5
A E6
por tanto la probabilidad de un evento simple E1
1
es P (Ei ) = 10 = 0.1 para i = 1, 2, . . . , 10. E7
E3 E10
e) Como A = E1 ∪ E2 ∪ E3 , el tercer E2
axioma de las probabilidades implica que E8
E9
P (A) = P (E1 ) + P (E2 ) + P (E3 ) = 0.3

2.6 Ejemplo. Se lanzan tres monedas corrientes: una de $ 100, otra de $ 200 y otra de
$ 500 y se registra lo que se aprecia en su cara superior escribiendo primero el resultado de
la moneda de $ 100, luego el resultado de la moneda de $ 200 y finalmente el resultado de la
moneda de $ 500, por ejemplo la terna ssc indica que ha caído sello en la moneda de $ 100,
sello en la moneda de $ 200 y cara en la de $ 500. Sea A el evento consistente en observar
exactamente dos caras.
a) Halle el espacio muestral S del experimento.
b) Describa el evento A y calcule su probabilidad.
c) Describa el evento Ā y determine su probabilidad.

a) El espacio muestral es S = { ccc, ccs, csc, scc, ssc, scs, css, sss }.
Como las monedas son corrientes y hay 8 puntos muestrales en S, la probabilidad de cada
evento simple es 81 = 0.125.
b) El evento A viene dado por A = { ccs, csc, scc } y su probabilidad es
P (A) = P (ccs) + P (csc) + P (scc) = 83 = 0.375.
c) Al hallar el complemento de A se obtiene Ā = { ccc, ssc, scs, css, sss }, su
probabilidad es P (Ā) = 85 = 0.625.
Observe que P (A) = 0.375 y que P (Ā) = 1 − P (A) = 1 − 0.375 = 0.625.

2.5. Ejercicios sobre espacio muestral y axiomas

1. Un espacio muestral está formado por cinco eventos simples: E1 , E2 , E3 , E4 y E5 .


a) Si P (E1 ) = P (E2 ) = 0.15, P (E3 ) = 0.4 y P (E4 ) = 2P (E5 ),
halle las probabilidades de E4 y E5 .
b) Si P (E1 ) = 3P (E2 ) = 0.3, encuentre las probabilidades de los eventos simples
restantes si se sabe que son igualmente probables.
54 CAPÍTULO 2. PROBABILIDAD

2. Una encuesta clasificó un gran número de adultos de acuerdo con su capacidad


visual. Las proporciones caen en las cuatro categorías que aparecen en la tabla.
Si se selecciona a un adulto al azar del grupo grande, encuentre las probabilidades de
los eventos definidos a continuación.
a) El adulto necesita lentes. usa lentes
b) El adulto necesita lentes pero no los usa. necesita lentes si no
c) El adulto no necesita lentes. si 0.44 0.14
d) El adulto usa lentes los necesite o no. no 0.02 0.40
3. Una empresa de explotación petrolera no encuentra petróleo en la mayoría de las
perforaciones. La empresa perfora dos pozos, los 4 eventos simples y 3 de sus
probabilidades aparecen en la tabla.

evento simple primer perforación segunda perforación Probabilidad


E1 halla petróleo halla petróleo 0.01
E2 halla petróleo no halla petróleo ?
E3 no halla petróleo halla petróleo 0.09
E4 no halla petróleo no halla petróleo 0.81
Encuentre la probabilidad de que la compañia encuentre petróleo
a) en la primera perforación pero no en la segunda;
b) en por lo menos una perforación.

4. Dos monedas corrientes (una de $ 100 y otra de $ 200) se tiran al aire y se observan
sus caras superiores (la notación sc indica sello en la moneda de $ 100 y cara en la
moneda de $ 200).
a) Halle el espacio muestral S de este experimento.
b) Asigne probabilidades a cada evento simple (las monedas son corrientes).
c) Se definen dos eventos: A es aquel en el que se aprecia exactamente una cara;
mientras que B registra por lo menos una cara. Halle los puntos muestrales de cada
evento y sus respectivas probabilidades.
d) Calcule las siguientes probabilidades: P (A ∩ B), P (A ∪ B), P (Ā ∩ B) y P (A ∩ B̄).
e) Muestre que: P (A) = P (A ∩ B) + P (A ∩ B̄)

5. Dos solicitantes se seleccionan al azar, de un grupo de cinco que han enviado la


solicitud de empleo. Halle la probabilidad de que:
a) se seleccione exactamente a uno de los dos mejores;
b) se seleccione por lo menos a uno de los dos mejores;
c) no se seleccione a ninguno de los dos mejores.

6. Se necesitan dos jurados adicionales para completar un jurado para un juicio criminal.
Hay seis jurados en perspectiva, dos mujeres y cuatro hombres. Los dos jurados se
seleccionan al azar de entre los seis disponibles.
2.5. EJERCICIOS SOBRE ESPACIO MUESTRAL Y AXIOMAS 55

a) Determine el espacio muestral S para este experimento.


b) Encuentre la probabilidad de que se seleccionen dos mujeres.
c) Halle la probabilidad de que se seleccionen dos hombres.
b) Calcule la probabilidad de que se seleccione una mujer y un hombre.

7. Se analizan las placas circulares plásticas de policarbonato de un proveedor para la


resistencia a las rayaduras (res. ray.) y la resistencia a los impactos (res. imp.). Los
resultados de 100 placas circulares se resumen a continuación

El evento que consiste en una placa circular con alta resis-


res. imp.
tencia a los impactos se denota A y el evento consistente
res. ray. alta baja
en una placa circular con alta resistencia a las rayaduras
alta 80 9
se denota B. Si se selecciona una placa circular al azar,
baja 6 5
determine las siguientes probabilidades:
a) P (A) b) P (B) c) P (Ā) d) P (B̄)
e) P (A ∩ B) f ) P (A ∪ B) g) P (Ā ∩ B) h) P (A ∪ B̄)

8. Se lanzan dos dados, uno blanco y otro negro; y se observan los números de las caras
superiores. Denotemos con S el conjunto de todos los pares posibles que se pueden
observar (si por ejemplo se observa un 2 en el dado blanco y un 3 en el dado negro
se escribe (2, 3)). Halle el espacio muestral S de este experimento y las siguientes
probabilidades:
a) La suma de los dos números es 3 d) La suma de los dos números es 8.
b) La suma de los dos números es 5 e) La suma de los dos números es 10.
c) La suma de los dos números es 7. f ) La suma de los dos números es 12.

9. Cuatro corredores igualmente calificados: John, Bill, Ed y Dave, corren un sprint de


100 metros planos y se registra el orden de llegada.
a) Determine el espacio muestral S e indique que probabilidad se debe asignar a
cada evento simple.
b) ¿Cuál es la probabilidad de que Dave gane la carrera?
c) ¿Cuál es la probabilidad de que Ed gane la carrera y John llegue en segundo
lugar?
d) ¿Cuál es la probabilidad de que Bill termine en el último lugar?

10. Un frasco contiene cuatro monedas: una de $ 5 centavos, una de $ 10 centavos, una
de $ 25 centavos y otra de $ 50 centavos. Se seleccionan al azar tres monedas del frasco.
a) Halle el espacio muestral S e indique que probabilidad de cada punto muestral.
b) ¿Cuál es la probabilidad de que la selección contenga la moneda de $ 50 centavos?
c) ¿Cuál es la probabilidad de que la suma total sacada sea mayor o igual a $ 60
centavos?
56 CAPÍTULO 2. PROBABILIDAD

2.6. Técnicas de conteo

Esta sección presenta algunos resultados útiles de la teoría del análisis combinatorio, así
como su aplicación al cálculo de la probabilidad de un evento.

Cuando el número de eventos simples de un espacio muestral es muy grande y la enume-


ración manual de todo punto muestral se vuelve algo muy complejo, contar el número de
de puntos del espacio muestral y del evento de interés puede ser la única forma práctica
de calcular la probabilidad de un evento. De hecho, si un espacio muestral tiene N puntos
muestrales igualmente probables y un evento A contiene exactamente na puntos muestrales,
na
la probabilidad de A es P (A) = .
N
2.7 Teorema (Principio fundamental del conteo). Considere un experimento que se realiza
en dos etapas. Si la primera etapa se puede efectuar de m formas, y para cada una de éstas,
la segunda etapa se puede realizar de n formas, entonces hay mn formas para efectuar el
experimento. Este teorema también se conoce como la regla mn.
2.8 Ejemplo. Un urbanista de un condominio nuevo ofrece a los futuros compradores de
una casa la elección para el estilo de fachada entre Tudor, rústica, colonial y tradicional
en casas de una planta, dos pisos o casa en desniveles. ¿En cuántas formas diferentes un
comprador puede ordenar una de estas casas?

La primer etapa es la elección de la fachada, ESTILO DE LA PLANES DE


FACHADA CONSTRUCCIÓN
se tienen 4 posibilidades para esto. la plan
ta
Una so
Dos pisos
Desniv
eles
Tómese la segunda etapa como elegir el tipo
or la plan
ta

de casa: un piso, dos pisos o en desniveles, Tud Una so


Dos pisos
Rústica Desniv
eles
apreciamos tres maneras de hacer esto.
ta
Colonia Una so
la plan
l
Dos pisos
Tra
Debido al principio fundamental del conteo, dicio
Desniv
eles
nal
ta
hay mn = (4)(3) = 12 posibilidades. la plan
Una so
Dos pisos
Desniv
eles

2.9 Ejemplo. Se lanzan dos dados, uno blanco y otro negro; y se observan los números
de las caras superiores. Denotemos con S el conjunto de todos los pares posibles que se
pueden observar (si por ejemplo se observa un 2 en el dado blanco y un 3 en el dado negro
se escribe (2, 3)). ¿Cuántos eventos simples hay en el espacio muestral?
El dado blanco puede caer en una de m = 6 formas, el dado negro también cae en una
de n = 6 formas. Como el experimento comprende dos etapas, el número total de eventos
simples en S es mn = (6)(6) = 36.
2.6. TÉCNICAS DE CONTEO 57

2.10 Ejemplo. El profesor de estadística tiene cinco camisas y dos corbatas. ¿De cuántas
maneras puede elegir una camisa y una corbata?

La primer etapa del experimento es la eleccón de la camisa, el profesor puede hacer esto de
cinco maneras. La segunda etapa es la selección de la corbata, solo tiene dos posibilidades
para ello. Por la regla mn el profesor puede elegir una camisa y una corbata de 10 formas.
2.11 Teorema (Regla mn extendida). Si un experimento se realiza en k etapas, con n1
formas de efectuar la primera etapa, n2 formas de realizar la segunda etapa, . . . , y nk for-
mas de hacer la k−ésima etapa, entonces el número de formas para efectuar el experimento
es igual a n1 · n2 · n3 · · · nk .
2.12 Ejemplo. Se lanzan tres monedas corrientes: una de $ 100, otra de $ 200 y otra de
$ 500 y se registra lo que se aprecia en su cara superior escribiendo primero el resultado de
la moneda de $ 100, luego el resultado de la moneda de $ 200 y finalmente el resultado de la
moneda de $ 500, por ejemplo la terna ssc indica que ha caído sello en la moneda de $ 100,
sello en la moneda de $ 200 y cara en la de $ 500.
¿Cuántos puntos muestrales hay en el espacio muestral?

Este experimento se realiza en tres etapas, la primera de ellas consiste en el lanzamiento de


la moneda de $ 100, como solo hay dos opciones: cara o sello, la primer etapa se realiza de
dos maneras. La segunda etapa registra el resultado de la moneda de $ 200, también hay
dos resultados posibles. La tercer y última etapa de nuevo se puede realizar de dos maneras.
La regla mn extendida implica que el experimento tiene n1 · n2 · n3 = (2)(2)(2) = 8 puntos
muestrales.
2.13 Ejemplo. Sara va armar un computador por su propia cuenta. Tiene la opción de
comprar los circuitos integrados de dos marcas, el disco duro de cuatro marcas, la memoria
de tres marcas y un conjunto de accesorios en cinco tiendas locales. ¿De cuántas formas
diferentes Sara puede comprar las partes del computador?

En este ejercicio n1 = 2, n2 = 4, n3 = 3 y n4 = 5. El teorema anterior implica


que hay n1 · n2 · n3 · n4 = (2)(4)(3)(5) = 120 formas diferentes de comprar las partes.
2.14 Ejemplo. Un experimento consiste en registrar el cumpleaños para cada uno de los
20 alumnos del curso de estadística. Ignorando los años bisiestos, es decir, asumiendo que
hay 365 cumpleaños distintos posibles, encuentre el número de puntos muestrales y diga
cuál es la probabilidad de que cada estudiante tenga un cumpleaños distinto.

Enumeramos los días del año: 1, 2, 3, . . . , 364, 365. Un punto muestral puede ser
representado por una sucesión ordenada de 20 números, donde el primero de ellos denota
el número de la fecha del cumpleaños del primer estudiante, el segundo número representa
la fecha del cumpleaños del segundo estudiante, y así sucesivamente. Al aplicar 20 veces la
regla mn extendida deducimos que el espacio muestral S contiene 36520 puntos muestrales.
58 CAPÍTULO 2. PROBABILIDAD

Denotemos con A el evento de que cada estudiante tenga un cumpleaños distinto. Supon-
gamos que (x1 , x2 , x3 , . . . , x19 , x20 ) ∈ A, donde x1 es un número que representa la
fecha del primer estudiante, x2 es un número que representa la fecha del segundo estu-
diante, y así sucesivamente. x1 puede asumir cualquiera de los 365 valores posibles, x2
puede tomar cualquier valor, excepto el ya asignado a x1 , es decir, hay 364 posibilida-
des para x2 . Similarmente x3 puede asumir cualquier valor distinto de los asignados a x1
y a x2 , por tanto hay 363 posibilidades. El conjunto del cual se puede seleccionar x20
contiene 346 elementos: todos excepto los 19 valores asignados anteriormente. De nuevo
una aplicación de la regla mn extendida implica que el evento A se puede obtener de
n1 · n2 · n3 · · · n20 = (365)(364)(363) · · · (346) formas.

Ahora podemos calcular la probabilidad del evento A, recordemos que


na (365)(364)(363) · · · (346)
P (A) = = = 0.5885616 ≈ 0.59.
N 36520
2.15 Ejemplo. ¿Cuántos números pares de cuatro cifras se pueden formar con los dígitos
0, 1, 2, 5, 6, y 9, si cada dígito se puede usar sólo una vez?

Como el número debe ser par, tenemos tres opciones para la posición de las unidades. Sin
embargo, para un número de cuatro dígitos la posición de los millares no puede ser cero.
De esta manera, consideramos la posición de las unidades en dos partes: cero o distinto de
cero.

a) La posición de las cifras de las unidades es 0, esto es, n1 = 1. Ahora tenemos 5 opciones
para las cifras de los millares: n2 = 5; 4 posibilidades para la cifra de las centenas: n3 = 4; y
3 opciones para la cifra de las decenas: n4 = 3. Por esta ramificación vemos que la cantidad
de números pares es: n1 · n2 · n3 · n4 = (1)(5)(4)(3) = 60.

b) La posición de las cifras de las unidades es distinto de cero 0, esto implica que en la cifra
de las unidades podemos colocar el 2 o el 6, y así n1 = 2; debido a que el 0 no se puede ubicar
en la cifra de los millares tenemos que n2 = 4; se han usado dos números de seis, y así la cifra
de las centenas se puede elegir de cuatro maneras: n3 = 4; finalmente quedan tres números
para la cifra de las decenas n4 = 3, lo que nos conduce a : n1 ·n2 ·n3 ·n4 = (2)(4)(4)(3) = 96.

Como los dos casos anteriores son mutuamente excluyentes, la cantidad total de números
pares es 60 + 96 = 156.

Otras reglas de conteo importantes, son las relacionadas con las permutaciones y las combi-
naciones, las permutaciones nos permiten calcular el número de resultados experimentales
cuando se seleccionan r objetos de un conjunto de n objetos, y el orden de selección es
importante. Los mismos r objetos acomodados en un orden distinto originan otra permuta-
ción. Por otra parte, en las combinaciones no es importante el orden en el que se acomodan
los objetos.
2.6. TÉCNICAS DE CONTEO 59

2.16 Teorema. El número de permutaciones de n objetos tomados r a la vez, está dado


n!
por Prn = (recuerde que 0! = 1).
(n − r)!
2.17 Definición. El número de combinaciones de n objetos tomados r a la vez es el número
 uno de tamaño r, que
de subconjuntos, cada  se pueden formar a partir de n objetos. Este
n n n!
número se denota y es igual a: = .
r r r!(n − r)!
Debemos tener presente que en las combinaciones no es importante el orden en que se
acomodan los objetos.

2.18 Ejemplo. La Universidad Distrital otorga tres importantes premios a sus profesores
de la maestría en ingeniería, los premios son: a la investigación, a la innovación y a la
enseñanza. Si el cuerpo de profesores de la maestría se compone de 25 docentes y si cada
profesor puede recibir un premio como máximo, ¿cuántas selecciones posibles existen?

Debido a que el orden es importante, se trata de un ejercicio de permutaciones, la cantidad


25! 25!
de ternas posibles es igual a P325 = = = (25)(24)(23) = 13800
(25 − 3)! 22!
2.19 Ejemplo. Una tarjeta de circuito impreso se puede comprar a uno de seis proveedores,
¿En cuántas formas se pueden escoger tres proveedores de entre los seis?

Sólo es importante qué


 proveedores se han escogido y no el orden de selección, el número
6 6!
de formas es: = = 20
3 3!(6 − 3)!
2.20 Ejemplo. Determine todas las permutaciones que se pueden formar con las letras
a, b, c y d considerando: a) dos a la vez b) tres a la vez c) cuatro a la vez

4!
a) El número de permutaciones es P24 = = 12.
(4 − 2)!
Estas son: ab, ba, ac, ca, ad, da, bc, cb, bd, db, cd, dc.
4!
b) Hay P34 = = 24 permutaciones, y vienen dadas por:
(4 − 3)!
abc, acb, bac, bca, cab, cba, abd, adb, bad, bda, dab, dba,
acd, adc, cad, cda, dac, dca, bcd, bdc, cbd, cdb, dbc, dcb.
4!
c) Ahora tenemos P44 = = 24 permutaciones, se enuncian a continuación:
(4 − 4)!
abcd, abdc, acbd, acdb, adbc, adcb, bacd, badc, bcad, bcda, bdac, bdca,
cabd, cadb, cbad, cbda, cdab, cdba, dabc, dacb, dbac, dbca, dcab, dcba.
60 CAPÍTULO 2. PROBABILIDAD

2.21 Ejemplo. Un niño tiene una colección de juegos de Game-Boy compuesta por 10
juegos recreativos y 5 de deportes. El niño está reunido con sus amigos y le pide a su madre
que le lleve 3 juegos recreativos y 2 de deportes. ¿De cuántas maneras diferentes se puede
hacer esto?

El orden no es importante en este experimento, que se puede realizar en dos etapas.


La primera etapa consiste
  en seleccionar 3 cartuchos recreativos de 10, la cantidad de
10 10!
posibilidades es: = = 120.
3 3!(10 − 3)!
La
 segunda etapa se realiza al seleccionar 2 cartuchos deportivos de 5, ahora tenemos:
5 5!
= = 10 posibilidades.
2 2!(5 − 2)!
La regla mn permite concluir que hay (120)(10) = 1200 formas de selección.
2.22 Ejemplo. Carlos es el jefe de mantenimiento en una gran empresa de tuberías.
Él tiene 32 billetes de lotería y piensa darle un billete a cada uno de los cuatro
empleados mas puntuales. Además al trabajador más puntual Carlos le piensa dar
cuatro días de descanso, al segundo más puntual le dará tres días de permiso, al
tercero más puntual le dará dos días de permiso y al cuarto más puntual le dará un día de
permiso. ¿De cuántas maneras puede hacer esto?

El orden en que son entrgados los billetes de lotería es importante, de ahí que las
posibilidades que tiene Carlos de asignar los billetes de lotería es
32! 32!
P432 = = = (32)(31)(30)(29) = 863040
(32 − 4)! 28!
2.23 Ejemplo. Una máquina está compuesta de cinco partes que se pueden ensamblar en
cualquier orden. Se ha de realizar una prueba para determinar el tiempo necesario para
cada orden de ensamble. Si cada orden se ha de probar una vez, ¿cuántas pruebas deben
efectuarse?

El orden en el cual se ensambla la máquina es importante, de manera que estamos hablando


de permutaciones. Hay cinco partes y para ensamblar la máquina hay que usar cada una
de las cinco partes, por tanto la cantidad buscada es
5! 5!
P55 = = = 5! = (5)(4)(3)(2)(1) = 120.
(5 − 5)! 0!
2.24 Ejemplo. Cinco fabricantes producen cierto aparato electrónico, cuya calidad varía
de un fabricante a otro. Si fuéramos a seleccionar tres fabricantes al azar, ¿cuál es la
probabilidad de que la selección contenga exactamente dos de los tres mejores?

El número total de eventos simples N se puede


 contar
 como el número de formas para
5 5!
escoger tres de los cinco fabricantes: N= = = 10.
3 3!(5 − 3)!
2.7. EJERCICIOS DE TÉCNICAS DE CONTEO 61

Como los fabricantes se seleccionan al azar, cualquiera de esos 10 eventos simples será
1
igualmente probable, con probabilidad 10 = 0.1.

El evento de interés es A : seleccionar exactamente dos de los tres mejores.


Se puede encontrar nA : el número de eventos en A, en dos etapas puesto que el evento A
ocurrirá cuando se seleccionen dos de los  tres
 mejores y luego uno de los dos peores.
3 3!
La primer etapa se puede realizar de = = 3 maneras, mientras que la
  2 2!(3 − 2)!
2 2!
segunda se efectúa de = = 2 formas.
1 1!(2 − 1)!
Finalmente se aplica la regla mn para determinar que hay nA = (3)(2) = 6 resultados
favorables de los 10 posibles, y por tanto la probabilidad del evento A es
nA 6
P (A) = = = 0.6
N 10

2.7. Ejercicios de técnicas de conteo


1. Encuentre el número de eventos simples que hay en el espacio muestral.
a) Se lanzan 3 dados: uno blanco, otro negro y otro beige y se registra el número
observado en sus caras superiores.
b) Se tiran al aire 4 monedas: una de $ 50, otra de $ 100, otra de $ 200 y otra de
$ 500 y se registra la cantidad de caras observadas.
c) Se lanza un dado y se toma una ficha de un dominó.
2. Una mujer de negocios de Antioquia está preparando su itinerario para una visita a
seis ciudades importantes: Armenia, Barranquilla, Bogotá, Cali, Cartagena y Nariño.
La distancia recorrida y por tanto el costo del viaje, dependerá del orden en que ella
plantee su ruta.
a) ¿Cuántos itinerarios diferentes son posibles?
b) Si la mujer selecciona al azar uno de los posibles itinerarios, ¿cuál es la probabilidad
de que visite Bogotá antes que a Cartagena?
3. Se seleccionan 5 cartas de un mazo de 52 cartas para una mano de póker. Determine
el número de posibles manos de póker, y con base en esta respuesta calcule la proba-
bilidad de que en una mano de poker salga:
a) 4 ases y cualquier otra carta;
b) 4 ases y un rey;
c) 3 ases y dos reyes;
d) ningún as;
e) por lo menos un as;
4. La directora de personal de una corporación ha contratado diez nuevos ingenieros
que tienen la capacidad para desempeñar tres puestos de trabajo muy distintos.
¿De cuántas formas puede ella ocupar los puestos?
62 CAPÍTULO 2. PROBABILIDAD

5. Un restaurante ofrece un menú especial en el que, por un costo fijo una persona puede
seleccionar de entre 4 aperitivos, 3 ensaladas, 4 entradas y 5 postres. ¿Cuántas comidas
diferentes hay si una de ellas consta de un aperitivo, una ensalada, una entrada y un
postre?

6. Un torneo de tenis se disputa con 8 tenistas. Cada enfrentamiento es de eliminación


directa. Si los enfrentamientos se asignan al azar, ¿de cuántas maneras se puede jugar
la primera ronda? ¿de cuántas maneras se puede jugar la segunda ronda?

7. Un estudiante de Física de la Universidad Distrital pondrá en su biblioteca cinco libros


de física, cuatro de cálculo, y tres de estadística. Los quiere acomodar de manera que
los de cada materia queden juntos. ¿De cuántas formas puede hacer esto?

8. Un estudio concluyó que siguiendo 7 reglas sencillas para la salud, una persona puede
prolongar su vida aproximadamente una década. Estas reglas son: no fumar, hacer
ejercicio habitualmente, moderar el consumo de alcohol, dormir entre 7 y 8 horas
diarias, mantener un peso apropiado, desayunar y no ingerir alimentos entre comidas.
De cuántas formas puede una persona adoptar 5 de estas reglas:
a) ¿si la persona actualmente infringe las 7 reglas?
b) ¿si la persona nunca nunca bebe y desayuna?
c) ¿Si la persona no fuma?

9. ¿Cuántos números telefónicos diferentes de siete dígitos se pueden formar si el primer


dígito no puede ser cero?

10. El profesor de cálculo vectorial tiene tan solo 12 alumnos en su clase. ¿Cuál es la
probabilidad de que cada estudiante tenga un cumpleaños distinto? (suponga que el
año no es bisiesto).

11. En una urna hay 40 balotas numeradas, 8 de ellas están premiadas y se distinguen
con color rojo, las restantes no estan premiadas y tienen color blanco. La profesora
de química extrae de la urna un puñado de 5 balotas. Determine de cuántas maneras
se pueden sacar si:
a) exactamente tres balotas salieron premiadas;
b) por lo menos tres balotas están premiadas.

12. a) Determine todas las permutaciones que se pueden formar con las letras a, b y c
considerando dos letras a la vez; luego considerando tres letras a a la vez.
b) Encuentre todas las permutaciones que se pueden formar con las letras
a, b, c, d y e considerando dos letras a la vez.

13. La mamá de caperucita roja, que tenía una gran canasta con 7 guayabas, 6 duraznos,
5 manzanas y 4 peras, le encargó a su hija seleccionar 4 guayabas, 3 duraznos,
2 manzanas, y 2 peras para llevar a la casa de la abuela.
2.7. EJERCICIOS DE TÉCNICAS DE CONTEO 63

a) ¿De cuántas formas Caperucita puede seleccionar las frutas siguiendo las
indicaciones de su mamá?
b) Determine las selecciones posibles si la niña olvida las indicaciones de la madre y
tan solo elige 11 frutas al azar.

14. Si una prueba de opción múltiple consta de 5 preguntas, cada una con 4 respuestas
posibles, de las cuales sólo una es correcta.
a) ¿De cuántas formas diferentes puede un estudiante elegir una respuesta a cada
pregunta?
b) Si un estudiante responde adivinando, ¿cuál es la probabilidad de que todas sus
respuestas estén erradas?

15. Un automóvil sólo tiene lugar para seis personas, incluyendo el conductor. Seis amigos
que viven cerca y estudian en la Universidad Libre utilizan este auto para ir a la
Universidad. Determine de cuántas maneras se pueden acomodar si:
a) cualquiera de ellos puede conducir.
b) solo el dueño del carro puede conducir.

16. Una tarjeta de circuitos impresos tiene 8 sitios diferentes en los que puede instalarse
un componente. Si van a colocarse 5 componentes idénticos en la tarjeta, ¿cuántos
diseños diferentes son posibles?

17. La academia cinematográfica de Cannes ha seleccionado ocho películas para otorgarles


cuatro premios: mejor guión, mejor fotografía, mejores efectos especiales, y mejor
dirección. Si la academia acuerda que ninguna película puede obtener dos o más
premios, ¿de cuántas maneras se pueden otorgar tales distinciones?

18. ¿Cuántos números pares de cinco dígitos se pueden formar con los dígitos 0, 2, 3, 4,
5, 6, y 9, si cada dígito se puede usar sólo una vez?

19. De cuántas maneras se pueden sentar 4 niños y 5 niñas en una fila, si se deben alternar
unos y otras?

20. Un estudiante de estadística pondrá 8 libros en la repisa de su habitación. Determine


de cuántas maneras los puede acomodar si la condición es que:
a) tres libros específicos siempre tienen que estar juntos;
b) tres libros específicos jamás deben que estar juntos.

21. A partir de 5 arquitectos y 7 ingenieros se va a conformar un comité que conste de 2


arquitectos y de 3 ingenieros. ¿De cuántas maneras se puede hacer esto si:
a) cualquier arquitecto y cualquier ingeniero pueden incluirse;
b) un ingeniero en particular debe incluirse;
c) dos arquitectos en particular no pueden incluirse.
64 CAPÍTULO 2. PROBABILIDAD

2.8. Leyes aditivas de la probabilidad

Antes de enunciar algunas reglas útiles que facilitan el cálculo de las probabilidades, es
necesario introducir una definición importante.

2.25 Definición. Un conjunto de eventos { A1 , A2 , . . . , An } de un espacio muestral S


se denomina una partición de S, si A1 , A2 , . . . , An son mutuamente excluyentes y si
A1 ∪ A2 ∪ . . . ∪ An = S.

2.26 Ejemplo. Consideremos el ejemplo 2.3 que nos habla de un experimento consistente
en lanzar un dado y registrar el número de la cara superior. Allí se determinó que el espacio
muestral es S = { E1 , E2 , E3 , E4 , E5 , E6 }. Algunas particiones del espacio muestral son:
P1 = {{ E1 , E2 , E3 }, { E4 , E5 , E6 }}

P2 = {{ E1 , E2 }, { E3 , E4 }, { E5 , E6 }}

P3 = {{ E1 }, { E2 , E3 , E4 }, { E5 , E6 }}

P4 = {{ E1 , E3 , E5 }, { E2 , E4 , E6 }}

2.27 Teorema. Leyes aditivas de probabilidad.


Si A y B son dos eventos entonces P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

Si A y B son dos eventos mutuamente excluyentes, entonces P (A∪B) = P (A)+P (B)

Si A1 , A2 , . . . , An son n eventos mutuamente excluyentes, entonces


P (A1 ∪ A2 ∪ . . . ∪ An ) = P (A1 ) + P (A2 ) + . . . + P (An )

Si A1 , A2 , . . . , An forman una partición de S entonces


P (A1 ∪ A2 ∪ . . . ∪ An ) = P (A1 ) + P (A2 ) + . . . + P (An ) = 1

Si A y Ā son eventos complementarios entonces P (A) + P (Ā) = 1

2.28 Ejemplo. María es una ingeniera ambiental que después de presentar entrevistas en
dos empresas en donde aspira trabajar, determina que la probabilidad que tiene de lograr
un empleo en la empresa A es 0.8, y que la probabilidad de obtenerlo en la empresa B es
0.6. Si por otro lado, considera que la probabilidad de recibir ofertas de ambas empresas es
0.5, ¿qué probabilidad tiene de obtener al menos una oferta de esas dos empresas?
Por la primer regla del teorema anterior,
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0.8 + 0.6 − 0.5 = 0.9

2.29 Ejemplo. ¿Cuál es la probabilidad de obtener un total de seis o diez cuando se lanza
un par de dados?
2.9. EJERCICIOS DE REGLAS ADITIVAS DE LA PROBABILIDAD 65

Sea A el evento que resulte un seis y B el evento que salga un diez. Ahora bien, para
5 de los 36 puntos muestrales ocurre un total de seis y sólo para 3 de los 36 se observa
un diez. Los eventos A y B son mutuamente excluyentes debido a que no pueden ocurrir
5 3 8
simultáneamente, por tanto, P (A ∪ B) = P (A) + P (B) = 36 + 36 = 36 = 29 ≈ 0.222
2.30 Ejemplo. La probabilidad de que un mecánico automotriz dé servicio a 3, 4, 5, 6, 7,
8 o más vehículos se encuentra en la siguiente tabla
cantidad de vehículos 3 4 5 6 7 8 o más
probabilidad de servicio 0.12 0.17 0.28 0.24 0.10 0.09
¿Cuál es la probabilidad de que dé servicio al menos a 5 vehículos en un día de trabajo?
Sea A el evento: dar servicio por lo menos a 5 vehículos, por tanto el evento complementario
de A sería: Ā : dar servicio a menos de 5 vehículos, esto equivale a decir lo siguiente:
Ā : dar servicio a 3 o a 4 vehículos. Calcular la probabilidad de Ā es muy sencillo: basta con
realizar la suma: 0.12+0.17 = 0.29, de esto se sigue que: P (A) = 1−P (Ā) = 1−0.29 = 0.71

2.9. Ejercicios de reglas aditivas de la probabilidad


1. Suponga que P (A) = 0.4 y P (B) = 0.2.
a) Determine un intervalo de valores en el cual se encuentren las siguientes
probabilidades: i) P (A ∩ B) ii) P (A ∪ B)
b) Si los eventos son A y B son mutuamente excluyentes, encuentre las
probabilidades: i) P (A ∩ B) ii) P (A ∪ B)
2. Encuentre los errores en cada una de las siguientes aseveraciones:
La probabilidad de que un vendedor venda 0, 1, 2 o 3 autos a diario, vienen
dados por la siguiente tabla:
cantidad de autos 0 1 2 3
probabilidad de venta 0.19 0.38 0.29 0.15
La probabilidad de que llueva mañana es 0.46 y la probabilidad de que no llueva
mañana es 0.52.
La probabilidad de que una impresora cometa 0, 1, 2, 3, 4 o más errores son:
cantidad de errores 0 1 2 3 4 o más
probabilidad de error 0.19 0.34 -0.25 0.43 0.29
Al sacar una carta de una baraja en un solo intento, la probabilidad de selec-
cionar un corazón es 14 , la probabilidad de seleccionar una carta negra es 21 y la
probabilidad de seleccionar una carta de corazones y negra es 18 .

3. Una caja contiene 500 sobres idénticos, de los cuales 75 contienen $ 100 en efectivo,
150 contienen $ 25 y 275 contienen $ 10. ¿Cuál es el espacio muestral para la diferentes
cantidades de dinero? Asigne probabilidades a los puntos muestrales y después calcule
la probabilidad de que el primer sobre seleccionado contenga menos de $ 100.
66 CAPÍTULO 2. PROBABILIDAD

4. La probabilidad de que la profesora de matemáticas lleve a la Universidad Distrital


su libro de cálculo es 0.7, la probabilidad de que lleve a la Universidad su libro de
estadística es 0.4 y la probabilidad de que lleve su libro de cálculo o su libro de
estadística es 0.8. ¿Cuál es la probabilidad de que la profesora de matemáticas
a) lleve ambos libros?
b) no lleve ningún libro?
5. Suponga que se descubre que en un grupo de 500 estudiantes universitarios de último
año, 210 fuman, 258 consumen bebidas alcohólicas, 216 comen entre comidas, 122
fuman y consumen bebidas alcohólicas, 83 comen entre comidas y consumen bebidas
alcohólicas, 97 fuman y comen entre comidas y 53 tienen esos tres hábitos nocivos para
la salud. Si se selecciona al azar un miembro de este grupo, calcule la probabilidad de
que el estudiante:
a) fume pero no beba bebidas alcohólicas;
b) coma entre comidas y consuma bebidas alcohólicas pero no fume.
c) no fume ni coma entre comidas.
6. Un fabricante de automóviles está preocupado por los defectos que han reportado
los compradores de su sedán de 4 puertas más vendido. Un estudio a las quejas de
los compradores inconformes ha reportado una probabilidad de 0.25 de que haya un
defecto en el sistema de frenos; 0.18 de que haya un defecto en la transmisión; 0.17
de que haya un defecto en el sistema de combustible y 0.40 de que haya un defecto
en alguna otra área. Calcule la probabilidad de que:
a) el defecto esté en los frenos o en el sistema de combustible, si la probabilidad de
que haya defectos en ambos sistemas de manera simultánea es 0.15;
b) no haya defecto en los frenos o en el sistema de combustible.
7. En la tabla de la derecha se listan las proba- dormitorio de adultos 0.03
bilidades, suministradas por consumer digest de dormitorio de niños 0.15
encontrar un computador en ciertos lugares de dormitorio de invitados 0.14
una casa. Encuentre la probabilidad de que un estudio 0.40
computador: sala-comedor 0.28
a) se encuentre en un dormitorio;
b) no se encuentre en un dormitorio.
8. Un sistema detector de humo utiliza dos aparatos A y B. Si hay humo, la probabilidad
de que éste sea detectado por el aparato A es 0.95 mientras que probabilidad de
ser detectado por el aparato B es 0.98; la probabilidad de ser detectado por ambos
aparatos es 0.94. a) Encuentre la probabilidad de que el humo no sea detectado.
b) Si hay humo, encuentre la probabilidad de que sea detectado por lo menos por
uno de los dos aparatos.
c) Si hay humo, calcule la probabilidad de que sea detectado exactamente por uno
de los dos aparatos.
2.9. EJERCICIOS DE REGLAS ADITIVAS DE LA PROBABILIDAD 67

9. Suponga que A y B son dos eventos tales que P (A) = 0.8 y P (B) = 0.7.
a) ¿Es posible que P (A ∩ B) = 0.1? Argumente.
b) ¿Cuál es el menor valor posible para P (A ∩ B)?
c) ¿Es posible que P (A ∩ B) = 0.77? Justifique.
d) ¿Cuál es el mayor valor posible para P (A ∩ B)?

10. Existe interés por la vida de un componente electrónico. Se sabe que la probabilidad
de que el componente funcione más de 6000 horas es 0.42. Suponga que la probabilidad
de que el componente no dure más de 4000 horas es 0.04.
a) ¿Cuál es la probabilidad de que la vida del componente sea menor o igual a 6000
horas?
b) ¿Cuál es la probabilidad de que la vida del componente sea mayor que 4000 horas?
c) ¿Cuál es la probabilidad de que la vida del componente sea mayor que 4000 horas
y menor o igual a 6000 horas?

11. Se toman 3 libros al azar, de un estante que contiene 5 libros de física, 3 de cálculo y
uno de química. Determine la probabilidad de qué:
a) se seleccione el libro de química;
b) Se seleccionen 2 libros de física y un libro de cálculo;
c) no se seleccione el libro de química.

12. Se abrieron cursos libres de matemáticas y de inglés para un grupo de 100 estudiantes
graduados de secundaria, 54 tomaron curso de matemáticas, 69 de inglés y 35 tomaron
ambos cursos, algunos estudiantes no tomaron ningún curso. Calcule la probabilidad
de que:
a) uno de éstos estudiantes tome curso de matemáticas o de inglés;
b) uno de éstos estudiantes no haya tomado ningun curso;
c) uno de éstos estudiantes tome curso de matemáticas pero no de inglés;
d) uno de éstos estudiantes tome curso de inglés pero no de matemáticas.

13. En una escuela primaria de California, se encontró que el 40 % de los niños era de
origen hispano; además, se comprobó que el 12 % eran zurdos. Determine el porcentaje
de pequeños que son diestros y de origen no hispano, si se sabe que el 5 % de ellos son
hispanos zurdos.

14. Se lanza un par de dados, halle la probabilidad de que la suma de las caras superiores:
a) sea menor que cinco;
b) sea a lo sumo cinco;
c) sea mayor que diez;
d) sea por lo menos diez.
68 CAPÍTULO 2. PROBABILIDAD

2.10. Probabilidad condicional e independencia de eventos


La probabilidad de un evento a menudo suele verse afectada por el hecho de si otro evento
relacionado ha ocurrido ya. Suponga que se tiene un evento A con probabilidad P (A). Si
se tiene el conocimiento de que un evento relacionado, denotado por B, ya ocurrió, esta
información se puede aprovechar mediante el cálculo de una nueva probabilidad del evento
A, a la cual se denomina probabilidad condicional, y se escribe P (A|B), esta notación se
utiliza para indicar que se está considerando la probabilidad del evento A dada la condición
de que B ha ocurrido. De ahí que la notación P (A|B) se lea la probabilidad de A dado B.
2.31 Definición. La probabilidad condicional de un evento A, dado que un evento B ha
P (A ∩ B)
ocurrido, es igual a P (A|B) =
P (B)
2.32 Ejemplo. Se lanza un dado corriente una sola vez. Hallar la probabilidad de observar
un 3, dado que se obtuvo un número impar.
Considere los dos eventos A : observar un 3 B : observar un número impar.
Se busca la probabilidad P (A|B), ello requiere la probabilidad de la intersección P (A ∩ B),
1
P (A ∩ B) 1
como A ⊆ B =⇒ A ∩ B = A, de esta manera, P (A|B) = = 61 =
P (B) 2
3

2.33 Ejemplo. Suponga que en la población


Hombres Mujeres Total
general, hay 51 % de hombres y 49 % de
Daltónicos 0.04 0.002 0.042
mujeres, y que las proporciones de hombres y
No daltónicos 0.47 0.488 0.958
mujeres daltónicos se muestran en la siguiente
Total 0.51 0.49 1.00
tabla de probabilidad
a) ¿Cuál es la probabilidad de ser daltónico, dado que la persona es hombre?
b) ¿Cuál es la probabilidad de ser daltónico, dado que la persona es mujer?
a) Definamos los dos eventos: A : ser daltónico; B : ser hombre.
Esto implica que el hecho de no ser daltónico se denota Ā y el ser mujer B̄.
Si sabemos que el evento B ha ocurrido, debemos restringir nuestra atención a sólo el 51 %
de la población que es de hombres. Al observar los valores de la tabla podemos deducir lo
P (A ∩ B) 0.04
siguiente: P (A|B) = = = 0.0784
P (B) 0.51

b) Ahora estamos restringidos a sólo el 49 % de la población que es de mujeres, por tanto


P (A ∩ B̄) 0.002
P (A|B̄) = = = 0.0041
P (B̄) 0.49
Suponga que la probabilidad de que ocurra un evento A no es afectada por que suceda o
no el evento B. Cuando esto sucede, decimos que los eventos A y B son independientes.
Esta relación entre eventos se ve expresada por la siguiente definición.
2.10. PROBABILIDAD CONDICIONAL E INDEPENDENCIA DE EVENTOS 69

2.34 Definición. Se dice que dos eventos A y B son independientes si se presenta


cualquiera de los siguientes casos:
P (A|B) = P (A), P (B|A) = P (B), P (A ∩ B) = P (A)P (B).
De otro modo, se dice que los eventos son dependientes.

2.35 Ejemplo. Considere los siguientes eventos en el tiro de un solo dado.


A : Observar un número impar, A = { E1 , E3 , E5 }.
B : Observar un número par, B = { E2 , E4 , E6 }.
C : Observar un 3 o un 6, C = { E3 , E6 }.
Diga si los eventos: a) A y B son independientes. b) A y C son independientes.

a) Para decidir si A y B son independientes, debemos analizar si se satisface la definición


anterior. P (A) = 21 , P (B) = 21 , P (A∩B) = P (∅) = 0, como P (A∩B) 6= P (A)P (B)
debido a que P (A∩B) = 0, mientras que P (A)P (B) = 21 · 12 = 14 , se concluye que los eventos
A y B son dependientes.

b) La intersección de A y C es A ∩ C = {E3 }, es decir, observar un 3; además,


P (A) = 12 , P (C) = 31 , P (A ∩ C) = P (E3 ) = 61 .
Con estos valores podemos apreciar que la definición 2.34 se satisface: P (A∩B) = P (A)P (C),
puesto que ambos lados de esta igualdad son iguales a 61 y así los eventos son independientes.

2.36 Ejemplo. Tres marcas de café: X, Y y Z van a ser clasificadas por un juez de
acuerdo con su sabor. Considere los siguientes eventos,
A : la marca X es mejor que la marca Y . B : la marca X es la mejor.
C : la marca X es la segunda mejor. D : la marca X es la peor.
Si el juez en realidad no tiene preferencia por el sabor y al azar asigna lugar a las marcas,
diga si: a) A y B son independientes. b) A y C son independientes.
c) A y D son independientes.

La cantidad de puntos muestrales es la permutación de tres objetos, tomados tres a la vez;


es decir, P33 = 6. El espacio muestral es S = { XY Z, XZY, Y XZ, Y ZX, ZXY, ZY X }
donde el orden en que aparecen las letras indican la calidad de la marca, por ejemplo el
punto muestral ZXY indica que Z es la marca de mejor calidad, X es la marca de segunda
mejor calidad y Y es la marca de peor calidad. Los seis puntos muestrales son igualmente
probables.

De esta manera, los puntos muestrales de los cuatro eventos considerados son:
A = { XY Z, XZY, ZXY }, B = { XY Z, XZY }, C = { Y XZ, ZXY } y
D = { Y ZX, ZY X }, podemos ver que P (A) = 21 , P (B) = 13 , P (C) = 13 , y P (D) = 31 .

a) A ∩ B = { XY Z, XZY }, entonces, P (A ∩ B) 6= P (A)P (B), puesto que 31 6= 12 · 13


b) A ∩ C = { ZXY }, por tanto, P (A ∩ C) = P (A)P (C), ya que 61 = 12 · 13
c) A ∩ D = ∅, de lo cual se obtiene que P (A ∩ D) 6= P (A)P (D), puesto que 0 6= 21 · 13 .
70 CAPÍTULO 2. PROBABILIDAD

Hemos visto que A y B son dependientes, A y C son independientes y que A y D son


dependientes.
2.37 Ejemplo. Un experimento consiste en lanzar dos monedas: una de $ 100, otra de
$ 200 y registrar el resultado. Diga si los eventos A : cae cara en la moneda de $ 100, y
B : cae sello en la moneda de $ 200 son independientes.
El espacio muestral consta de cuatro puntos: S = { cc, cs, sc, ss } donde por ejemplo el
evento sc indica que cayó sello en la moneda de $ 100 y cara en la moneda de $ 200.
Con esta notación los dos eventos vienen dados por: A = { cc, cs } y B = { cs, ss }.
Como A ∩ B = { cs } se puede apreciar que la definición 2.34 se verifica:
P (A ∩ B) = P (A)P (B), ya que 41 = 21 · 12

2.11. Ejercicios de probabilidad condicional e independencia


1. Sean A y B dos eventos tales que P (A) = 0.5, P (B) = 0.3 y P (A ∩ B) = 0.1.
Calcule las siguientes probabilidades:
a) P (A|B) b) P (B|A) c) P (A|A∪B) d) P (A|A∩B) e) P (A∩B|A∪B)
2. Para cierta población de empleados, el Género
porcentaje que aprueba o reprueba un resultado masculino femenino total
exámen de competencia en un trabajo, aprobado 24 36 60
de acuerdo con el género, se aprecia en la reprobado 16 24 40
tabla de la derecha. total 40 60 100
Un empleado va a ser seleccionado al azar de esta población. Considere los dos eventos:
A : el empleado aprueba el examen M : se selecciona un hombre.
a) ¿Los eventos A y M son independientes?
b) ¿Los eventos Ā y M̄ son independientes?
3. Cien adultos fueron entrevistados en una encuesta telefónica sobre la opnión con
respecto a las cargas que implican los préstamos para estudiantes universitarios y si
quienes contestaron tenían un hijo actualmente en la universidad. Sus respuestas se
resumen en la siguiente tabla:
carga de préstamo
hijo en la universidad alta razonable baja total
si 0.20 0.09 0.01 0.30
no 0.41 0.21 0.08 0.70
total 0.61 0.30 0.09 1.00
Se definen los siguientes eventos:
A : la carga del préstamo es alta. B : la carga del préstamo es razonable.
C : la carga del préstamo es baja. D : tiene hijo en la universidad.
De los siguientes eventos, ¿cuáles son independientes?
a) A y D b) B y D c) C y D
2.11. EJERCICIOS DE PROBABILIDAD CONDICIONAL E INDEPENDENCIA 71

4. Sean A y B dos eventos tales que P (A) = 0.2, P (B) = 0.3 y P (A ∪ B) = 0.4
Encuentre lo siguiente:
a) P (A ∩ B̄) b) P (A|B̄) c) P (Ā ∩ B) d) P (Ā|B)

5. Las enfermedades I y II son prevalecientes entre las personas de cierta población. Se


supone que el 10 % de la población contraerá la infermedad I alguna vez en su vida,
mientras que el 15 % contraerá la endermedad II con el tiempo. Además se estima
que el 3 % contraerá ambas enfermedades.
a) Encuentre la probabilidad de que una persona elegida al azar de esta población
contraiga al menos una enfermedad.
b) Determine la probabilidad condicional de que una persona elegida al azar de
esta población contraiga ambas enfermedades, dado que ha contraído al menos una
enfermedad.

6. Un experimento consiste en lanzar un solo dado y observar el número de puntos que


aparecen en la cara superior. Los eventos A, B y C están definidos como sigue:
A : observar un número menor que 4.
B : observar un número menor o igual que 2.
C : observar un número mayor que 3.
a) Calcule las siguientes probabilidades: i) P (A∩B) ii) P (A∩C) iii) P (B∩C)
b) ¿ Los eventos A y B son independientes? ¿Son mutuamente excluyentes?
c) ¿ Los eventos A y C son independientes? ¿Son mutuamente excluyentes?
d) ¿ Los eventos B y C son independientes? ¿Son mutuamente excluyentes?

7. Un experimento puede resultar en por lo menos


evento A evento Ā
uno de los eventos A, Ā, B, B̄, con las
evento B 0.34 0.46
probabilidades que se aprecian en la tabla.
evento B̄ 0.15 0.05
Encuentre las siguientes probabilidades:
a) P (A) b) P (B) c) P (Ā) d) P (B̄) e) P (A|B)
f ) P (Ā|B) g) P (A|B̄) h) P (Ā|B̄) i) P (B|A) j) P (B|Ā)

8. El profesor de estadística lanza un dado blanco y un dado negro sobre la mesa, mira
los números que salieron y los cubre con la mano para que sus alumnos no los vean.
Entonces pregunta lo siguiente:
a) ¿cuál es la probabilidad de que uno de los dados muestre un cuatro y el otro un
cinco?
b) suponga que el profesor le proporciona a sus alumnos la información de que en
uno de los dados salió el cinco. Conociendo este dato, ¿cuál es la probabilidad de que
el otro dado muestre el cuatro?
72 CAPÍTULO 2. PROBABILIDAD

9. Suponga que P (A) = 0.4 y que P (A ∩ B) = 0.12.


a) Calcule P (B|A).
b) ¿Los eventos A y B son mutuamente excluyentes?
c) Si P (B) = 0.3 ¿los eventos A y B son independientes?

10. En un grupo de 36 estudiantes de la Universidad Distrital hay 9 que dominan el idioma


inglés, 4 el francés y 2 ambos idiomas (ya contados entre los anteriores). Se selecciona
un alumno al azar y se comprueba que domina el inglés. ¿Cuál es la probabilidad de
que domine el francés?

11. Se lanzan al aire tres monedas, una de $ 100, otra de $ 200 y otra de $ 500, y se registra
el número de caras. Considere los tres eventos: A : se aprecian tres caras o tres sellos.
B : se observa por lo menos una cara. C : caen por lo menos dos caras.
De los siguientes eventos, ¿cuáles son independientes?
a) A y B b) A y C c) B y C

12. Demuestre que P (A|B) + P (Ā|B) = 1

2.12. Leyes multiplicativas de la probabilidad y la regla de


Bayes

Mientras que la ley aditiva de la probabilidad se utiliza para calcular la probabilidad de la


unión de dos eventos, la ley multiplicativa se emplea para determinar la probabilidad de la
intersección de dos eventos.

2.38 Teorema. La probabilidad de que los eventos A y B ocurran es:

P (A ∩ B) = P (A)P (B|A) o P (A ∩ B) = P (B)P (A|B)

2.39 Ejemplo. En un experimento de preferencia de color, se ponen en un recipiente ocho


juguetes idénticos salvo por el color; dos son rojos y seis son verdes.
Se le pide a un niño que escoja dos juguetes al azar, uno tras otro y sin reposición. ¿Cuál
es la probabilidad de que el niño elija los dos juguetes rojos?

El experimento se puede visualizar mediante un diagrama de árbol, como el que aparece a


continuación.
2.12. LEYES MULTIPLICATIVAS DE LA PROBABILIDAD Y LA REGLA DE BAYES 73

Considere los siguientes eventos


A : Se elige un juguete rojo en la primer selección.
B : Se elige un juguete rojo en la segunda selección.
El evento C : ambos juguetes son rojos es la
intersección de A y B, esto es, C = A ∩ B.
Puesto que sólo hay dos juguetes rojos en el
recipiente, P (A) = 28 = 41 . Falta calcular P (B|A).
Si se sabe que ha sucedido A es por que en la primer
selección se ha elegido uno rojo, por tanto quedan
7 juguetes: uno rojo y 6 verdes. Si en la segunda
selección se extrae uno rojo entonces P (B|A) = 17

Con esta información y la regla de la multiplicación se puede calcular la probabilidad bus-


cada: P (C) = P (A ∩ B) = P (A)P (B|A) = 41 17 = 281
≈ 0.0357

2.40 Teorema (Ley de probabilidad total). Suponga que { B1 , B2 , . . . , Bk } es una


partición de un espacio muestral S, y que P (Bi ) > 0 para todo i = 1, 2, . . . , k.
Entonces la probabilidad de cualquier evento A viene dada por:

P (A) = P (B1 )P (A|B1 ) + P (B2 )P (A|B2 ) + . . . + P (Bk )P (A|Bk )

2.41 Ejemplo. De los ingenieros graduados en el año 2015, las dos terceras partes han
conseguido empleo ejerciendo su profesión, y la tercera parte restante se encuentra sin
empleo. El 12 % de los ingenieros empleados habla inglés, mientras que el 6 % de los
ingenieros desempleados habla inglés. ¿Cuál es la probabilidad de que un ingeniero
graduado en el 2015 hable inglés?
Definamos los tres eventos, A : El ingeniero graduado en el 2015 habla inglés.
E : El ingeniero graduado en el 2015 tiene empleo.
D : El ingeniero graduado en el 2015 no tiene empleo.
74 CAPÍTULO 2. PROBABILIDAD

Es claro que los eventos E y D forman una P(A E) = 0.12


partición del espacio muestral.

3
2/
=
E)
El teorema de probabilidad total implica la siguiente

P(
ecuación: P (A) = P (E)P (A|E) + P (D)P (A|D).

P(
El enunciado nos da todas las probabilidades del

D)
lado derecho de esta ecuación, por tanto,

=
1/
2 1 1

P (A) = 3 (0.12) + 3 (0.06) = 10 = 0.1

3
P(A D) = 0.06

2.42 Ejemplo. Una empresa de manufactura emplea tres plantas para la elaboración de
su producto. La primer planta produce el 30 % de la producción total, la segunda planta
produce el 45 % y la tercer planta produce el 25 %. La tasa de artículos defectuosos es
diferente para las tres plantas, en la primer planta el 5 % de los artículos son defectuosos,
en la segunda el 2 % son defectuosos y en la tercera el el 4 % son defectuosos.
Halle la probabilidad de que la empresa produzca un artículo defectuoso.

Definamos los siguientes eventos;


P(D B1) = 0.05
B1 : el producto es elaborado en la primer planta.
B2 : el producto es elaborado en la segunda planta.

0.3
)=
B3 : el producto es elaborado en la tercer planta.
B1
D : el producto es defectuoso. P(
P(B2) = 0.45 P(D B2) = 0.02

La partición del espacio muestral está formada


P(
B3

por B1 , B2 , B3 , una aplicación de la ley de


)=
0.2

probabilidad total nos permite calcular la probabilidad


5

del evento D a partir de la expresión: P(D B3) = 0.04

P (D) = P (B1 )P (D|B1 ) + P (B2 )P (D|B2 ) + P (B3 )P (D|B3 ),


ingresando los valores suministrados por en el enunciado:
P (D) = (0.30)(0.05) + (0.45)(0.02) + (0.25)(0.04) = 0.015 + 0.009 + 0.010 = 0.034.

En el estudio de la probabilidad condicional se indicó que la revisión de las probabilidades


cuando se obtiene nueva información es una fase importante del análisis de la probabilidad.
A menudo comenzamos el análisis con las estimaciones de probabilidad previa o probabili-
dad a priori para eventos específicos de interés.

Por tanto, de fuentes como una muestra, un informe especial o una prueba de productos, se
obtiene información adicional sobre los eventos. Con esta nueva información actualizamos
los eventos de probabilidad previos mediante el cálculo de las probabilidades revisadas,
2.12. LEYES MULTIPLICATIVAS DE LA PROBABILIDAD Y LA REGLA DE BAYES 75

conocidas como probabilidades posteriores o probabilidad a posteriori. El teorema de Bayes


proporciona un medio para efectuar estos cálculos. Los pasos se resumen en el siguiente
diagrama.

2.43 Teorema (Regla de Bayes). Si los eventos { B1 , B2 , . . . , Bk } forman una parti-


ción de un espacio muestral S, donde P (Bi ) > 0 para todo i = 1, 2 . . . , k, entonces para
cualquier evento A, la probabilidad condicional P (Bj |A) viene dada por

P (Bj )P (A|Bj )
P (Bj |A) =
P (B1 )P (A|B1 ) + P (B2 )P (A|B2 ) + . . . + P (Bk )P (A|Bk )

2.44 Ejemplo. Retomemos el ejemplo 2.41. Un ingeniero graduado en el 2015 ha regresado


a su Universidad por un certificado, este ingeniero no sabe inglés. ¿Cuál es la probabilidad
de que esté desempleado?
.12
E) = 0
P(A
Puesto que se cuenta con un ingeniero que no sabe
inglés y se quiere averiguar la probabilidad de que sea /3
) =2 P(A
E) = 0
desempleado, nos están pidiendo P (D|Ā). P(E .88

Un diagrama de árbol ayuda bastante en la


P(D 0 .06
comprensión del ejercicio, se debe ampliar el )= D) =
1/3 P(A
diagrama de árbol que aparece en el ejemplo 2.41
por uno como el de la derecha. P(A
D) =
0.9 4

P (D)P (Ā|D)
Al aplicar la regla de Bayes se obtiene: P (D|Ā) =
P (E)P (Ā|E) + P (D)P (Ā|D)
Cada una de estas probabilidades se encuentra en el diagrama, de esta manera,
1 0.94

3 (0.94) 3 0.94
P (D|Ā) = 2  1
 = 2.7 = 2.7 = 0.348
3 (0.88) + 3 (0.94) 3

2.45 Ejemplo. Consideremos de nuevo el ejemplo 2.42. Supongamos ahora que tenemos
un artículo defectuoso. ¿Cuál es la probabilidad de que el artículo haya sido elaborado en
la segunda planta?
76 CAPÍTULO 2. PROBABILIDAD

Ahora se sabe que el artículo es defectuoso, por tanto P(D B1) = 0.05
el diagrama de árbol presentado en el ejemplo 2.42

0.3
es óptimo para resolver este ejercicio y de nuevo lo

)=
B1
utilizamos.

P(
Se requiere la probabilidad de que el artículo P(B2) = 0.45 P(D B2) = 0.02
defectuoso provenga de la segunda planta, es decir,

P(
se busca P (B2 |D).

B3
)=
0.2
La regla de Bayes especifica la manera de encontrar

5
esta probabilidad, esto se consigue al aplicar la P(D B3) = 0.04
fórmula:
P (B2 )P (D|B2 )
P (B2 |D) =
P (B1 )P (D|B1 ) + P (B2 )P (D|B2 ) + P (B3 )P (D|B3 )
por consiguiente:
(0.45)(0.02) 0.009
P (B2 |D) = = = 0.265
(0.3)(0.05) + (0.45)(0.02) + (0.25)(0.04) 0.034

2.13. Ejercicios de leyes multiplicativas y regla de Bayes

1. De una baraja de 52 cartas se extraen dos de ellas, una tras otra y sin reposición.
a) Encuentre la probabilidad de que las dos sean ases.
b) Halle la probabilidad de que la primer carta extraída sea un as y la segunda sea
un diez.
c) Obtenga la probabilidad de que una carta extraída sea un as y la otra carta
extraída sea un diez.

2. Una caja contiene 15 bolas iguales salvo en su color. Hay 6 rojas, 4 blancas y 5
azules. Se extraen dos bolas, una tras otra sin reposición. Calcular las siguientes
probabilidades:
a) las dos bolas son azules;
b) las primera es blanca y la segunda es roja;
c) Se extraiga una bola blanca y otra bola roja.

3. La caja I contiene 3 canicas rojas y 2 azules. La caja II contiene 2 canicas rojas y 8


azules. Se lanza una moneda corriente. Si cae cara se toma una canica de la caja I.
Si cae sello se toma una canica de la caja II. Encuentre la probabilidad de:
a) tomar una canica roja;
b) tomar una canica azul.
2.13. EJERCICIOS DE LEYES MULTIPLICATIVAS Y REGLA DE BAYES 77

4. En el ejemplo anterior suponga que la persona que lanza la moneda no dice si cayó
cara o sello, pero si dice que tomó una canica roja.
a) ¿Cuál es la probabilidad de que se haya tomado de la caja I?
b) ¿Cuál es la probabilidad de que se haya tomado de la caja II?

5. Un fusible elctrónico es fabricado por cinco líneas de producción en una operación


de manufactura. Las cinco líneas de producción producen fusibles al mismo ritmo y
normalmente producen sólo el 2 % de fusibles defectuosos, que se dispersan al azar
en la producción. Desafortunadamente la línea I de producción sufrió problemas
mecánicos y produjo el 5 % de piezas defectuosas durante el mes de marzo. Un cliente
recibió un lote de fusibles producidos en marzo y probó un fusible que falló.
Halle la probabilidad de: a) encontrar un fusible defectuoso;
b) que el fusible defectuoso se haya producido en la línea I;
c) que el fusible defectuoso se haya producido en una de las otras cuatro líneas.

6. Una población de electores contiene 40 % de republicanos y 60 % de demócratas. Se


publica que el 30 % de los republicanos y el 70 % de los demócratas están a favor
de un tema de elección. Se determina que una persona seleccionada al azar de esta
población está a favor del tema en cuestión. Encuentre la probabilidad a posteriori
de que esta persona sea un demócrata.
Si se sabe que una persona seleccionada al azar de esta población está en contra
del tema en cuestión, halle la probabilidad a posteriori de que esta persona sea un
republicano.

7. Una prueba diagnóstica para una enfermedad es tal que detecta correctamente la
enfermedad en el 90 % de los individuos que en realidad tienen la enfermedad.
También, si una persona no tiene la enfermedad, la prueba reportará que él o ella
no la tiene con probabilidad 0.97. Sólo el 2 % de la población tiene la enfermedad
en cuestión. Si una persona es seleccionada al azar de la población y la prueba
diagnóstica indica que tiene la enfermedad, ¿cuál es la probabilidad condicional de
que tenga en realidad la enfermedad? ¿considera confiable esta prueba diagnóstica?

8. Use la ley de probabilidad total para demostrar la siguiente afirmación. Si P (A|B) =


P (A|B̄), entonces A y B son independientes

9. Se observa que que hombres y mujeres reaccionan de modo diferente a un conjunto


determinado de circunstancias; se sabe que el 70 % de las mujeres reaccionan positi-
vamente a estas circunstancias, mientras que de este mismo modo reaccionan sólo el
40 % de los hombres. Un grupo de 20 personas: 15 mujeres y 5 hombres, se sometió a
estas circunstancias y a los sujetos se les pidió describieran sus reacciones en un cues-
tionario escrito. Una respuesta escogida al azar fue negativa. ¿Cuál es la probabilidad
de que haya sido un hombre?
78 CAPÍTULO 2. PROBABILIDAD

10. Los registros de delincuencia urbana muestran que el 20 % de todos los delitos son
violentos y que el 80 % no lo son. El 90 % de los delitos violentos son denunciados,
mientras que el 70 % de los no violentos se denuncian.
a) ¿Cuál es la probabilidad de que se denuncie un delito?
b) Si un delito es denunciado ¿cuál es la probabilidad de que sea violento?
c) Si un delito es denunciado ¿cuál es la probabilidad de que no sea violento?

11. Una máquina operada por un trabajador produce un artículo defectuoso con proba-
bilidad 0.01 si el trabajador sigue exactamente las instrucciones de operación de la
máquina, y con probabilidad 0.03 si no las sigue. Si el trabajador sigue las instruc-
ciones el 90 % del tiempo, ¿qué proporción de todos los artículos producidos por la
máquina será defectuosa?

12. En cierta ciudad francesa hay tres aeropuertos, el aeropuerto A maneja el 50 % de todo
el tráfico aéreo y los aeropuertos B y C manejan el 30 % y el 20 % respectivamente.
Los porcentajes de detección de armas en los tres aeropuertos son 0.9, 0.8 y 0.85
respectivamente. Si se encuentra un pasajero en uno de estos tres aeropuertos llevando
un arma de fuego,
a) ¿cuál es la probabilidad de que el pasajero use el aeropuerto A?
b) ¿cuál es la probabilidad de que el pasajero use el aeropuerto C?

13. Un estudiante contesta una pregunta de opción múltiple de un examen que ofrece
cuatro posibles respuestas. Suponga que la probabilidad de que el estudiante conozca
la respuesta a la pregunta es 0.8 y la probabilidad de que adivine es 0.2.
Suponga que si el estudiante adivina, la probabilidad de que seleccione la respuesta
correcta es 0.25. Si el estudiante contesta correctamente una pregunta, ¿cuál es la
probabilidad de que realmente conozca la respuesta correcta?

14. Hay dos métodos, A y B, para enseñar cierta habilidad industrial. El porcentaje de
personas que han hecho el curso y reprueban es 20 % para el método A, y s 10 % para
el método B. El método A es más económico y por tanto se usa el 70 % de las veces,
mientras que el método B se usa el 30 % de las veces.
A Pablo se le enseñó la habilidad por uno de los dos métodos pero no la aprendió
correctamente. ¿Cuál es la probabilidad de que se le haya enseñado por el método A?
A María se le enseñó la habilidad y la aprendió satisfactoriamente. ¿Cuál es la
probabilidad de que se le haya enseñado por el método B?
CAPÍTULO 3

VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

3.1. Introducción

En el capítulo anterior se define el concepto de experimento y los resultados experimen-


tales correspondientes. Una variable aleatoria proporciona un medio para describir estos
resultados con valores numéricos. Las variables aleatorias deben asumir valores numéricos.
3.1 Definición. Una variable aleatoria es una función de valor real para la cual el dominio
es un espacio muestral.
Algunos ejemplos de variables aleatorias pueden ser:
X = Número de artículos defectuosos fabricados en una planta de producción.

X = Tiempo transcurrido entre dos llamadas telefónicas consecutivas en una oficina


de servicio al cliente.
Las variables aleatorias cuantitativas se clasifican en dos categorías: discretas o continuas,
de acuerdo con los valores que X pueda tomar. Es importante distinguir entre variables
aleatorias discretas y continuas porque se requieren técnicas diferentes para describir sus
distribuciones.
3.2 Definición. Una variable aleatoria X es discreta si puede tomar sólo un número finito
o contable infinito de valores distintos.

79
80 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Un ejemplo de variable aleatoria discreta puede ser, X = Número de artículos defectuosos


fabricados en una planta de producción, debido a que X puede asumir los valores 0, 1, 2, 3, . . .
3.3 Definición. La probabilidad de que una variable aleatoria discreta X tome el valor
x, denotada P (X = x), se define como la suma de las probabilidades de todos los puntos
muestrales en el espacio muestral S, a los que se asigna el valor x.
En ocasiones la expresión P (X = x) simplemente se denota como p(x).
La distribución de probabilidad, o simplemente la función de probabilidad p(x), para una
variable aleatoria X puede ser representada por una fórmula, una tabla, o una gráfica que
produzca p(x) para toda x.

La función de distribución acumulada de una variable aleatoria discreta X, denotada por


F (x), es tal que F (x) = P (X ≤ x) para todo x.
3.4 Teorema. Una distribución de probabilidad discreta X satisface las siguientes
condiciones:
0 ≤ p(x) ≤ 1 para todo x.
P
p(x) = 1 donde la sumatoria se extiende sobre todos los valores
x de x con probabilidad diferente de cero.
3.5 Ejemplo. Se lanzan al aire dos monedas corrientes, una de $ 100 y otra de $ 200.
Sea X igual al número observado de caras. Encuentre la distribución de probabilidad p(x)
y también la función de distribución acumulada F (x).
El espacio muestral de este experimento es S = { cc, cs, sc, ss } donde el evento cs
significa que en la moneda de $ 100 cayó cara y en la moneda de $ 200 cayó sello.
Las siguientes tablas ayudan a la comprensión del ejercicio.
para cada valor de x se puede calcular p(x) al
evento simple probabilidad valor de X
sumar las probabilidades de los eventos simples
cc 0.25 2
correspondientes al valor de x.
cs 0.25 1
Solo hay un evento simple que conduce a x = 0,
sc 0.25 1
el evento ss, su probabilidad es 0.25; por tanto
ss 0.25 0
p(0) = 0.25.
Hay dos eventos simples correspondientes a x = 1, los eventos cs y sc, sus probabilidades
suman 0.50; por consiguiente p(1) = 0.50.
Solamente el evento simple cc corresponde a x = 2, su probabilidad es 0.25; esto implica
que p(2) = 0.25.
Esta información nos permite construir la siguiente tabla que representa la distribución de
probabilidad p(x) y la función de distribución acumulada F (x).

x 0 1 2
observe que las dos propiedades del teorema anterior se
p(x) 0.25 0.50 0.25
satisfacen: 0 ≤ P (i) ≤ 1, para i = 0, 1, 2.
F (x) 0.25 0.75 1
3.2. VALOR ESPERADO Y VARIANZA DE VARIABLES ALEATORIAS DISCRETAS 81

Al hallar la sumatoria sobre todos los posibles valores de x se obtiene:


P2
p(i) = p(0) + p(1) + p(2) = 0.25 + 0.50 + 0.25 = 1
i=0

Aunque consideraremos las variables aleatorias continuas en la parte final del curso, se da
su definición para comprender la diferencia entre estos dos tipos de variables.

3.6 Definición. Una variable aleatoria que puede asumir cualquier valor numérico en un
intervalo de números reales, se llama variable aleatoria continua.
Los resultados experimentales basados en escalas de medición tales como el tiempo, el peso,
la distancia, o la temperatura se describen por medio de este tipo de variable.
Un ejemplo de variable aleatoria continua puede ser el tiempo transcurrido entre dos
llamadas telefónicas consecutivas en una oficina de servicio al cliente, en este caso la variable
X puede tomar cualquier valor no negativo: x ≥ 0.

3.7 Ejemplo. Algunas variables aleatorias continuas son

experimento variable aleatoria X valores posibles de X


atención en un banco tiempo (en minutos) entre la llegada x≥0
de dos clientes consecutivos
llenado de una lata de Cantidad de onzas en una lata de 0 ≤ x ≤ 12.1
gaseosa (máx 12.1 Oz) gaseosa
construcción de una porcentaje del proyecto completado 0 ≤ x ≤ 100
biblioteca después de 6 meses de trabajo
prueba de un nuevo temperatura (en grados Fahrenheit) 150 ≤ x ≤ 212
proceso químico a la que ocurre la reacción

3.2. Valor esperado y varianza de variables aleatorias discretas

El valor esperado de una variable aleatoria, también llamado media o esperanza, es una
medida de su posición central que nos suministra el resultado medio teórico de un número
infinito de ensayos. Podemos considerar este valor esperado en el sentido de que constituye
el valor promedio que esperaríamos obtener si los ensayos pudiesen continuar de manera
indefinida.

Aun cuando el valor esperado proporciona el valor medio de la variable aleatoria, a menudo
necesitamos de una medida de variabilidad o dispersión. Así como la varianza se usó en la
parte de estadística descriptiva para resumir la variabilidad de los datos, ahora la varianza
se usa para resumir la variabilidad de una variable aleatoria.
82 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

3.8 Definición. Sea X una variable aleatoria discreta (v.a.d.)


P con función de probabilidad
p(x). El valor esperado de X se define como E(X) = x · p(x) donde la sumatoria
x
se extiende sobre todos los valores admisibles por la variable aleatoria X.

3.9 Nota. El valor esperado también se conoce como la media y se denota E(X) = µ.

3.10 Ejemplo. Calcular el valor esperado de la variable aleatoria del ejemplo 3.5.

Recordemos que la función de distribución de


x 0 1 2
probabilidad de la variable aleatoria discreta X
p(x) 0.25 0.50 0.25
se aprecia mediante la tabla de la derecha.
2
P
Al aplicar la definición 3.8 se obtiene: E(X) = xp(x) = 0 · 0.25 + 1 · 0.50 + 2 · 0.25 = 1
x=0

3.11 Definición. Si X es una variable aleatoria discreta que tiene media E(X) = µ, la
varianza de la variable aleatoria X, denotada V (X) = σ 2P , se define como el valor
esperado de (X − µ)2 , esto es: V (X) = σ 2 = E[(X − µ)2 ] = (x − µ)2 p(x)
x
La desviación estándar de X, denotada σ, es la raíz cuadrada positiva de la varianza.

3.12 Ejemplo. Encuentre la varianza y la desviación estándar de la variable aleatoria del


ejemplo 3.5.

En el ejemplo anterior se apreció que


x 0 1 2
µ = 1. La siguiente tabla tiene la
(x − µ)2 (0 − 1)2 = 1 (1 − 1)2 = 0 (2 − 1)2 = 1
casilla (x − µ)2 para cada valor de
p(x) 0.25 0.50 0.25
x.
Calculamos la varianza multiplicando las respectivas componentes de las filas 2 y 3:
2
V (X) = σ 2 = (x − µ)2 p(x) = 1 · 0.25 + 0 · 0.50 + 1 · 0.25 = 0.50
P
x=0 √ √
La desviación estándar es: σ = σ 2 = 0.50 = 0.707

3.13 Nota. Existe una fórmula muy práctica para hallar la varianza de una variable
aleatoria discreta: V (X) = σ 2 = E(X 2 ) − µ2

A continuación vamos a aplicar la fórmula anterior x 0 1 2


para hallar la varianza del ejemplo 3.5. Ahora x2 0 1 4
incluimos una fila para los valores de x2 p(x) 0.25 0.50 0.25

Al multiplicar los correspondientes valores de las filas 2 y 3 obtenemos:


3.2. VALOR ESPERADO Y VARIANZA DE VARIABLES ALEATORIAS DISCRETAS 83

2
E(X 2 ) = x2 p(x) = 0 · 0.25 + 1 · 0.50 + 4 · 0.25 = 1.50 por tanto
P
x=0

V (X) = E(X 2 ) − µ2 = 1.5 − 12 = 0.5, el mismo resultado del ejercicio anterior.

El siguiente teorema se refiere al valor esperado y varianza de una variable aleatoria discreta.

3.14 Teorema. Sea X una variable aleatoria discreta, sea c una constante y sean
g(X), g1 (X), g2 (X), . . . , gk (X), funciones de la v.a.d. X. Entonces:

E(c) = c

E[c g(X)] = cE[g(X)]

E[ g1 (X) + g2 (X) + . . . + gk (X)] = E[g1 (X)] + E[g2 (X)] + . . . + E[gk (X)]

3.15 Ejemplo. Una tienda de electrónica vende un modelo particular de computador


portátil. Solo quedan cuatro computadores y la gerente se pregunta cual será la
demanda para hoy. Ella se entera en el departamento de marketing de que la distribución de
probabilidad para la demanda diaria de unidades de ese modelo es como aparece en la tabla.
x 0 1 2 3 4 5
p(x) 0.10 0.40 0.20 0.15 0.10 0.05

a) Halle la media, la varianza y la desviación estándar de X.


Al graficar un histograma para p(x) vemos que la función de probabilidad p(x) tiene
aproximadamente forma de campana.
b) ¿Se ajusta correctamente la regla empírica a los intervalos µ ± σ y µ ± 2σ?
5
P
a) E(X) = µ = xp(x) = 0 · 0.10 + 1 · 0.40 + 2 · 0.20 + 3 · 0.15 + 4 · 0.10 + 5 · 0.05 = 1.90
x=0
Para determinar la varianza agregamos una fila más a la tabla, que indique el valor de x2
para cada valor admisible de x.

x 0 1 2 3 4 5
x2 0 1 4 9 16 25
p(x) 0.10 0.40 0.20 0.15 0.10 0.05

Obtenemos el valor esperado de X 2 apoyados en la tabla:


5
E(X 2 ) = x2 p(x) = 02 · 0.10 + 12 · 0.40 + 22 · 0.20 + 32 · 0.15 + 42 · 0.10 + 52 · 0.05 = 5.40.
P
x=0
2 2 2
√ ) −√µ = 5.4 − 1.9 = 1.79.
Al aplicar la fórmula de la nota 3.13 se tiene: V (X) = E(X
La desviación correcta a tres cifras decimales es: σ = σ 2 = 1.79 = 1.338.
84 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

La regla empírica nos dice que aproximadamente el 68 % de los datos se encuentran en el


intervalo µ ± σ ⇐⇒ 1.9 ± 1.338 ⇐⇒ 0.562 a 3.238. Al acudir a la tabla vemos que la
probabilidad correspondiente a este intervalo es igual a 0.75.
Aproximadamente el 95 % de los datos se encuentran en el intervalo
µ ± 2σ ⇐⇒ 1.9 ± 2.676 ⇐⇒ −0.776 a 4.576.
La tabla nos dice que la probabilidad correspondiente a este intervalo es igual a 0.95.
Podemos concluir que los resultados si se ajustan a los suministrados por la regla empírica.
3.16 Ejemplo. En una lotería realizada a beneficio de una institución local de caridad, se
han de vender 8000 boletos a $ 10 cada uno. El premio es un automóvil de $ 24000. Si usted
compra dos boletos, ¿cuál es su ganancia esperada?

La ganacia X puede tomar uno de dos valores.


7998
O bien perderá $ 20 (es decir su ganancia será −$ 20) con probabilidad 8000 ,
2
o ganará $ 23980, con probabilidad 8000 .

La distribución de probababilidad para la ganancia x -20 23980


7998 2
X se muestra en la tabla de la derecha p(x) 8000 8000

Por consiguiente
P la ganancia esperada será:
7998 2
E(X) = µ = x p(x) = −20 · 8000 + 23980 · 8000 = −14
x
La ganancia esperada en este caso es una pérdida de $14.

3.17 Ejemplo. Determine la prima anual para una póliza de seguro de $10000 que cubre
un evento que en un largo tiempo, ha ocurrido a razón de 2 veces en 100. Sea X igual a la
ganancia financiera anual para la compañia de seguros que resulte de la venta de la póliza y
sea C igual a la prima anual desconocida. Calcule el valor de C tal que la ganancia esperada
sea igual a cero (si la ganancia es cero hay un punto de equilibrio).

Comencemos por determinar los valores que la ganancia X puede tomar y luego determinar
p(x). Si el evento no ocurre durante el año, la compañia ganará la prima de x = C dólares.
Si el evento sucede la ganancia será negativa, esto es, la compañia perderá x = 10000 dólares
menos la prima de C dólares ya recolectada, es decir, x = −(10000 − C) = C − 10000.
98 2
Las probabilidades asociadas con estos dos valores de x son 100 y 100 respectivamente.

La función de distribución de probababilidad para x C C − 10000


98 2
la ganancia X se muestra en la tabla: p(x) 100 100

98 2
Al resolver la ecuación µ = 0 se obtiene: C · 100 + (C − 10000) · 100 = 0 =⇒
98C 2C
100 + 100 − 200 = 0 =⇒ C = 200. Por tanto, Si la compañia de seguros cobra una prima
anual de $ 200, la ganancia es cero y así se obtiene el punto de equilibrio.
3.2. VALOR ESPERADO Y VARIANZA DE VARIABLES ALEATORIAS DISCRETAS 85

Identificación de resultados poco comunes (atípicos) mediante el empleo de


probabilidades
La siguiente información presenta un método ampliamente usado en la estadística
inferencial, más precisamente en la prueba de hipótesis.
Tal explicación se fundamenta en la regla del suceso poco común que dice lo siguiente:

Si bajo un supuesto dado, la probabilidad de un suceso particular que se observa


es extremadamente pequeña (menor o igual a 0.05), concluimos que el supuesto
probablemente no es correcto.

Ahora ilustramos el tema considerado mediante un ejemplo y más adelante lo generalizamos.


3.18 Ejemplo. Supongamos que se cree que una moneda está cargada a favor de las caras,
para probar esta aseveración se lanza la moneda 100 veces obteniendo 55 caras, este resulta-
do no es evidencia alguna de que la moneda esté cargada, puesto que es muy posible que al
lanzar una moneda corriente 100 veces se aprecien 55 caras. No obstante, la probabilidad de
obtener 55 caras en 100 lanzamientos de una moneda corriente es bastante baja: 0.0485 (esto
se puede calcular un poco más adelante, al estudiar la distribución binomial), sin embargo
no consideramos que observar 55 caras en 100 lanzamientos sea un resultado poco común.
Un criterio más adecuado es considerar la probabilidad de observar por lo menos 55 caras
en 100 lanzamientos de una moneda corriente, esta probabilidad es alta: 0.1841, de esta
manera sabemos que el hecho de ver 55 caras en 100 lanzamientos no es un indicador de
que la moneda esté cargada, o en otros términos no es un resultado poco común.
El ejemplo anterior permite entender el siguiente criterio.
3.19 Teorema (Resultados poco comunes o atípicos). En una variable aleatoria discreta
X se dice que
x éxitos en n ensayos es un número inusualmente alto de éxitos, si la probabilidad
de observar x o más éxitos: P (X ≥ x) es extremadamente pequeña (menor o igual a
0.05).
x éxitos en n ensayos es un número inusualmente bajo de éxitos, si la probabilidad de
observar x o menos éxitos: P (X ≤ x) es extremadamente pequeña (menor o igual a
0.05).
3.20 Ejemplo. Un laboratorio está trabajando en obtener un procedimiento confiable
para que una mujer embarazada de a luz una niña. Suponiendo que la probabilidad de
nacimineto es igual para cada género se obtienen las siguientes probabilidades, basadas en
n = 15 ensayos:

x 11 12
p(X = x) 0.0417 0.0139
p(X ≥ x) 0.0592 0.0176
86 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Para efectos de pruebas internas que debe realizar el laboratorio antes de sacar al mercado
su producto, con una muestra de 15 madres, ¿cuál debe ser la cantidad mínima de niñas
observadas para que su producto sea confiable?
Nos interesa el menor valor de x que produce una probabilidad P (X ≥ x) extremadamente
pequeña, es decir, menor o igual a 0.05.
De la tabla podemos observar que dicho valor es x = 12, puesto que P (X ≥ 12) = 0.0176.
Al aplicar la regla del suceso poco común deducimos que si 15 madres han dado a luz
12 niñas, el supuesto que dice que la probabilidad de nacimiento de cada género es igual
posiblemente no es cierto, de esta manera la probabilidad de que nazca una niña será mayor
que la de tener un niño.
Concluímos que el laboratorio en sus pruebas internas, debe observar que en una muestra
de 15 madres que usan su producto, por lo menos 12 de ellas dan a luz una niña.

3.3. Ejercicios de variables aleatorias, media y varianza


1. Identifique las siguientes variables aleatorias como discretas o continuas.
a) Aumento en tiempo de vida alcanzado por un paciente de cáncer como resultado
de una cirugía.
b) Resistencia a la ruptura (en libras por pulgada cuadrada) de un cable de acero
de una pulgada de diámetro.
c) Número de venados muertos por un año en una reserva natural estatal de fauna
silvestre.
d) Número de facturas sin pagar para una empresa de telefonía nacional.
e) Tiempo de reposición en cada partido del campeonato colombiano de fútbol 2021.

2. Una compañía tiene cinco solicitantes para dos puestos de trabajo: dos mujeres y
tres hombres. Suponga que los 5 solicitantes son igualmente calificados y que no hay
preferencia para escoger su género. Sea X igual al número de de mujeres escogidas
para ocupar los dos puestos de trabajo. Encuentre p(x) y luego halle µ, σ 2 y σ.

3. Una variable aleatoria X tiene la siguiente distribución de probabilidad


x 0 1 2 3 4 5
p(x) 0.10 0.30 0.40 0.10 ? 0.05

a) Determine p(4).
b) Encuentre µ, σ 2 y σ.
c) Localice el intervalo µ ± σ y calcule la probabilidad de que X caiga en ese
intervalo.
d) Localice el intervalo µ ± 2σ y halle la probabilidad de que X caiga en ese
intervalo.
3.3. EJERCICIOS DE VARIABLES ALEATORIAS, MEDIA Y VARIANZA 87

4. Un dado se carga de manera que un número par { 2, 4, 6 } tiene doble posibilidad


de caer que un número impar { 1, 3, 5 }. Sea X el número observado en su cara
superior. Calcule p(x), E(X) y V (X).
5. Una variable aleatoria X tiene la función
x 0 1 2 3 4
de distribución de probabilidad mostrada
p(x) 0.1 0.3 0.3 ? 0.1
en la tabla.
a) Encuentre p(3). b) Halle µ, σ 2 y σ.
c) Localice los intervalos µ ± σ y µ ± 2σ.
d) ¿Cuál es la probabilidad de que X sea por lo menos 3?
e) ¿Cuál es la probabilidad de que X sea a lo sumo 2?

6. Sea X igual al número observado en el tiro de un solo dado corriente.


a) Encuentre la distribución de probabilidad de X y grafíquela.
b) Determine µ, σ 2 y σ.
c) Localice µ ± 2σ en el eje x de la gráfica del inciso a). ¿Qué proporción de las
mediciones caen en ese intervalo?
7. La función de probabilidad de una va- y 1 2 3 4
riable aleatoria Y se aprecia en la tabla. p(y) 0.4 0.3 0.2 0.1
Encuentre E(Y ), E(1/Y ), E(Y 2 − 1) y V (Y ).

8. Se lanza un par de dados, la suma T del número de puntos que aparecen en las caras
superiores de los dados pueden asumir cualquier valor entero en el intervalo [2, 12].
a) Encuentre la distribución de probabilidad de T y grafíquela.
b) Determine µ, σ 2 y σ.
c) Localice µ ± σ en el eje t de la gráfica del inciso a). ¿Qué proporción de las
mediciones caen en ese intervalo?
d) Localice µ ± 2σ en el eje t de la gráfica del inciso a). ¿Qué proporción de las
mediciones caen en ese intervalo?
e) ¿Cuál es la probabilidad de que T sea menor que 4?
f ) ¿Cuál es la probabilidad de que T sea mayor que 8?

9. Una pieza de equipo electrónico contiene 6 chips de computadora, dos de los cuales
son defectuosos. Al azar se se seleccionan tres chips, se retiran del equipo y se
inspeccionan. Sea Y igual al número de chips defectuosos seleccionados en la muestra,
donde y = 0, 1 o 2. Halle p(y) y también encuentre µ, σ 2 y σ.

10. A una compañia de transporte le cuesta $14.8 entregar un paquete pequeño antes
de 24 horas. La compañía cobra $15.5 por el envío, pero garantiza la devolución del
dinero si no lo entrega antes de 24 horas.
Si la compañia no hace entregas en solo 2 % de su paquetería antes del periodo de 24
horas, ¿cuál es la ganancia esperada por paquete?
88 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

11. El representante de una empresa manufacturera está considerando tomar una póliza
de seguro para cubrir posibles pérdidas en que incurre al vender un nuevo
producto. Si el producto es un completo fracaso, el representante incurrirá en una
pérdida de $ 800 000. Si es sólo un éxito moderado, incurrirá en una pérdida de
$ 250 000. Las probabilidades de que el producto sea un fracaso o un éxito
moderado son de 0.01 y 0.05 respectivamente. ¿Qué prima debe cobrar la
compañia de seguros por póliza para no tener pérdida ni ganancia?

12. Una persona puede asegurar un diamante de $ 50 000 por su valor total si paga una
prima de C dólares. Si la probabilidad de robo en un año determinado es 0.01, ¿qué
prima debe cobrar la compañía si desea que la ganancia esperada sea igual a $ 1 000?

13. Se lanzan cuatro monedas corrientes: una de $ 50, otra de $ 100, otra de $ 200 y otra de
$ 500. Sea Y la variable aleatoria que indica el número de caras observadas. Encuentre:
a) La distribución de probabilidad p(y). b) µ, σ 2 y σ
c) La probabilidad de ver a lo sumo una cara.
d) La probabilidad de ver por lo menos dos caras.

14. Cuando el departamento de salud examinó pozos privados en un condado en busca de


dos impurezas que se hallan en el agua potable, se encontró que 20 % de los pozos no
tenian impurezas, 40 % tenian la impureza A, y 50 % tenian la impureza B (algunos
pozos tienen ambos tipos de impurezas). Si un pozo de los existentes en el condado
es escoge al azar, encuentre la distribución de probabilidad para T , el número de
impurezas halladas en el pozo, ¿cuál es la cantidad esperada de impurezas? también
encuentre la varianza.

15. Cinco balotas numeradas con 1, 2, 3, 4 y 5 se ponen en una urna. Dos de ellas se
seleccionan al azar simultáneamente. Encuentre la distribución de probabilidad, la
media y varianza para lo siguiente:
a) X : el mayor de los dos números observados.
b) Y : la suma de los dos números observados.

16. En un juego de azar una persona saca una sola carta de una baraja corriente de 52
cartas. A un jugador le pagan $ 15 si saca un rey o una reina. Le pagan $ 5 si saca
un as o un diez. Si en cambio el jugador extrae cualquier otra carta debe pagar $ 4.
Obtenga la ganancia esperada para el jugador.

17. Sea X una v.a.d. con media µ y varianza σ 2 . Sea Y = X + 1.


Exprese E(Y ) y V (Y ) en términos de µ y σ 2 .

18. Sea X una v.a.d. con media µ y varianza σ 2 . Sea Y = 2X.


Exprese E(Y ) y V (Y ) en términos de µ y σ 2 .
3.4. DISTRIBUCIÓN UNIFORME DISCRETA 89

19. Sea X una v.a.d. con media µ y varianza σ 2 . Sea Y = aX + b.


Exprese E(Y ) y V (Y ) en términos de µ y σ 2 .
20. El gerente de un almacén de una empresa de construcción ha
y 0 1 2
construido la distribución de probabilidad para la demanda
p(y) 0.1 0.5 0.4
diaria (número de veces que se usa) de un taladro percutor.
A la empresa le cuesta $ 10 cada vez que el taladro percutor se usa. Encuentre la
media y la varianza del costo diario.

21. En una prueba técnica de selección de género, un ensayo clínico da como resultado
13 niñas en 20 nacimientos.
x 13 14 15 16 17 18 19 20
p(x) 0.0739 0.037 0.0148 0.0046 0.0011 0.0002 0.0 0.0
A partir de la tabla anterior obtenga:
a) La probabilidad de observar x = 13 niñas en 20 nacimientos.
b) La probabilidad de observar 13 o más niñas en 20 nacimientos.
c) ¿Qué probabilidad es relevante para determinar si x = 13 niñas en 20 nacimientos
es un suceso inusualmente alto: el del literal a) o el del literal b)?
d) ¿La presencia de x = 13 niñas en 20 nacimientos es un suceso inusualmente alto?

22. Repita el ejercicio 21. con x = 14 niñas en 20 nacimientos.

23. Repita el ejercicio 21. con x = 15 niñas en 20 nacimientos.

24. Repita el ejercicio 21. con x = 16 niñas en 20 nacimientos.

3.4. Distribución uniforme discreta

3.21 Definición. Si la variable aleatoria discreta X toma los valores x1 , x2 , . . . , xk , con


idénticas probabilidades, entonces la distribución uniforme discreta es igual a:
1
p(x) = , para x = x1 , x2 , . . . , xk .
k
3.22 Teorema. La media y la varianza de la distribución uniforme discreta p(x) son:
k k
(xi − µ)2
P P
xi
i=1 2 i=1
µ= y σ = .
k k
3.23 Ejemplo. Una caja contiene cuatro bombillas idénticas, una bombilla de 40 W atts(W ),
una de 60 W , una de 75 W y una de 100 W . Se selecciona una al azar. Si X es la variable
aleatoria que indica el número de Watts de la bombilla seleccionada, halle la función de
distribución de probabilidad, la media, la varianza y la desviación estándar de X.
90 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

La función de distribución de probabilidad x 40 60 75 100


es p(x) = 14 para x = 40, 60, 75, 100. p(x) 0.25 0.25 0.25 0.25

40 + 60 + 75 + 100 275
El teorema anterior implica que la media es µ= = = 68.75.
4 4
(40 − 68.75) + (60 − 68.75) + (75 − 68.75) + (100 − 68.75)2
2 2 2
La varianza es σ 2 = =⇒
4
2 2 2
(−28.75) + (−8.75) + (6.25) + (31.25) 2 7675
σ2 = = = 479.6875.
4 √ 4
La desviación estándar es σ = 479.6875 = 21.9.

3.24 Ejemplo. Se lanza un dado corriente una sola vez. La variable Y consiste en observar
el número de su cara superior. Halle la distribución de probabilidad, la media, la varianza
y la desviación estándar.

El espacio muestral es S = { 1, 2, 3, 4, 5, 6 }.
Como cada evento simple tiene la misma probabilidad se trata de una distribución uniforme.
1
La distribución de probabilidad es: p(x) = , x = 1, 2, 3, 4, 5, 6.
6
1+2+3+4+5+6 21
El valor esperado es igual a µ= = = 3.5.
6 6
La varianza es
(1 − 3.5)2 + (2 − 3.5)2 + (3 − 3.5)2 + (4 − 3.5)2 + (5 − 3.5)2 + (6 − 3.5)2
σ2 = = 2.917
6

La desviación estándar es σ = 2.917 = 1.7.

3.5. Ejercicios de distribución discreta uniforme

1. Se lanza una moneda corriente y se registra un 3 si se observa cara; y un 10 si se


observa sello. Obtenga la distribución de probabilidad, la media y la varianza.

2. El entrenador del equipo de baloncesto de la Universidad Libre quiere darle un premio


a uno de los cinco jugadores que ganó la final del torneo de Universidades. Escribe los
números de sus camisetas, que son: 12, 21, 23, 24 y 33 en papelitos, los mete en una
bolsa y selecciona uno de ellos. Encuentre la función de distribución de probabilidad,
la media, la varianza y la desviación estándar.
3.5. EJERCICIOS DE DISTRIBUCIÓN DISCRETA UNIFORME 91

3. La secretaría académica de la Universidad Libre se compone de 16 administrativos.


Mediante la extracción de una etiqueta al azar, de una caja que contiene 16 etiquetas
numeradas del 1 al 16, se selecciona a uno de los administrativos para trabajar horas
extras. Determine la probabilidad de que:
a) el número seleccionado sea a lo sumo 5
b) el número seleccionado sea menor a 5
c) el número seleccionado sea a por lo menos 14
d) el número seleccionado esté entre 8 y 11 (inclusive).

4. En un concurso familiar por televisión, un concursante lanza un dado grande y el


anfitrión le paga tantos billetes de $ 100 dólares como puntos aparecen en la cara
superior del dado, excepto cuando cae cinco o seis, en cuyo caso es el concursante
quien debe pagar al anfitrión tantos billetes de $ 100 como puntos muestre el dado.
¿El anfitrión o el concursante tiene ventaja en el juego? Para ello calcule el valor
esperado.

5. El juego de la ruleta consiste en hacer girar un disco dividido en 25 sectores circulares


de idéntica área, y cada uno tiene un número dibujado del 1 al 25.
Al detenerse la ruleta hay una marca que indica cuál número resultó ganador.
Determine la probabilidad de que resulte ganador un número de un dígito.
Halle la probabilidad de que el número ganador sea un múltiplo de cinco.

6. El primer dígito del número de serie de una pieza es igualmente factible que sea
cualquiera de los digitos del 0 al 9. Si se selecciona una pieza de un lote grande y X
es el primer dígito del número de serie.
Encuentre la distribución de probabilidad de X, la media y la varianza.
¿Cuál es la probabilidad de que la v.a.d. tome un valor que exceda de 6?

7. El profesor de física rifa un esfero de lujo entre sus 25 estudiantes de física mecánica.
Para ello los ennumera del 1 al 25 según el orden alfabético.
La variable aleatoria discreta Y consiste en elegir al azar un número de los 25 posibles.
Encuentre la distribución de probabilidad de esta v.a.d. así como la media, la varianza
y la desviación estándar. ¿Cuál es la probabilidad de que el ganador del esfero sea
uno de los primeros ocho estudiantes de la lista?

8. El profesor de matemáticas tiene ocho libros distintos de Cálculo, organizados en su


biblioteca personal por orden alfabético del autor. Un buen día decide llevar uno de
ellos al azar a la Universidad. Encuentre la función de probabilidad, la media y la
varianza. ¿Cuál es la probabilidad de que el libro seleccionado sea uno de los tres
primeros por orden alfabético?
92 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

3.6. Distribución binomial


3.25 Definición. Un experimento binomial presenta las siguientes propiedades:

Consiste en un número fijo: n, de pruebas idénticas.

Cada prueba resulta en uno de dos resultados: éxito: S, o fracaso: F.

La probabilidad de éxito en una sola prueba es iugal a algún valor p y es el mismo de


una prueba a otra. La probabilidad de fracaso es q = 1 − p.

Las pruebas son independientes.

La variable aleatoria de interés es Y : el número de éxitos observados durante las n


pruebas.

3.26 Ejemplo. Se lanza una moneda corriente 4 veces y se registra el resultado, éxito si
se observa una cara y fracaso si se aprecia un sello.
a) Verifique que se trata de un experimento binomial.
b) Determine el espacio muestral de la variable aleatoria Y que cuenta el número de éxitos
observados.
c) Encuentre la función de probabilidad p(y) = P (Y = y), y la función de distribución
acumulada F (y) = P (Y ≤ y).

a) El número de pruebas idénticas es cuatro. Cada prueba solo presenta dos posibilidades:
éxito si resulta cara: c, fracaso si se observa sello: s.
La probabilidad de éxito en cada prueba es la probabilidad de observar una cara: 0.5.
La probabilidad de fracaso en cada prueba es 1 − p = 1 − 0.5 = 0.5.
Las pruebas son independientes: el resultado de un lanzamiento no interfiere en el resultado
de otro lanzamiento.

b) Si c denota cara, mientras que s representa sello, el espacio muestral se compone de:
S = {cccc, cccs, ccsc, cscc, sccc, ccss, cscs, sccs, cssc, scsc, sscc, sssc, sscs, scss, csss, ssss}

c) Debido a que la moneda es corriente, podemos asumir que cada uno de los 16 elementos
1
del espacio muestral tienen la misma probabilidad: 16 = 0.0625.
El espacio muestral nos permite encontrar tanto la función de probabilidad como la función
de distribución acumulada, tales funciones se reúnen en la siguiente tabla.

y 0 1 2 3 4
p(y) 0.0625 0.25 0.375 0.25 0.0625
F (y) 0.0625 0.3125 0.6875 0.9375 1
3.6. DISTRIBUCIÓN BINOMIAL 93

3.27 Definición. Una variable aleatoria Y tiene una distribución binomial basada en
n pruebas con probabilidad
  de éxito p si y solo si
n y n−y
p(y) = p q , y = 0, 1, 2, . . . , n, 0 ≤ p ≤ 1.
y
3.28 Teorema. Sea Y una variable aleatoria binomial basada en n pruebas con probabilidad
p de éxito. Entonces µ = E(Y ) = np y σ 2 = V (Y ) = npq.

Sigamos analizando el ejemplo 3.26. Como se trata de un experimento binomial, la variable


aleatoria Y es binomial, sus probabilidades se pueden hallar mediante la aplicación de la
definición 3.27.
Sabemos que la probabilidad de éxito es p = 0.5, esto implica que q = 1 − p = 1 − 0.5 = 0.5.
Si por ejemplo nos interesa la probabilidad
  de observar exactamente tres caras en los cuatro
4
lanzamientos calculamos: p(3) = 0.53 0.54−3 = 0.25 este resultado coincide con
3
el valor de p(3) que se observa en la tabla del ejemplo 3.26. Es un buen ejercicio verificar
por medio de la fórmula, los otros valores de p(y) que aparecen en la tabla.
Existe otra manera de calcular las probabilidades binomiales, es mediante la tabla esta-
dística de la distribución binomial, vamos a ilustrar su uso con el cálculo de P (3) = 0.25.
La figura adjunta muestra una parte de la primer página de la tabla de la distribución
binomial.

Observemos la columna correspondiente a n = 4, p = 0.5. Al comparar estos


cinco valores con los de la tabla de F (y) en el ejemplo 3.26, podemos apreciar que son los
mismos valores, la tabla de la distribución binomial nos arroja los valores de la función de
distribución.
94 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Para calcular el valor de p(3) hacemos uso de la siguiente propiedad de la función de


distribución: p(y) = F (y) − F (y − 1). Al aplicar este resultado tenemos:
p(3) = F (3) − F (2) = 0.9375 − 0.6875 = 0.25.

3.29 Ejemplo. Se ha observado que un jugador profesional de baloncesto puede encestar


un tiro libre en un intento determinado con probabilidad igual a 0.8. Suponga que él lanza
10 tiros libres.
a) ¿cuál es la probabilidad de que enceste exactamente siete tiros libres?
b) ¿cuál es la probabilidad de que enceste por lo menos cinco tiros libres?
c) ¿cuál es la probabilidad de que enceste menos de cuatro tiros libres?
d) Calcule el valor esperado y la varianza de esta variable aleatoria.

Una prueba se puede definir como un tiro libre, éxito como una canasta, y fracaso si falla
la cesta. Según esto, n = 10, p = 0.8, q = 1 − 0.8 = 0.2 y el número Y de veces que
enceste el jugador es una variable aleatoria binomial.
 
10
a) p(7) = P (Y = 7) = 0.87 0.210−7 = 0.2013
7
También es posible obtener este valor con solo manejo de la tabla de la binomial con
n = 10 y p = 0.8. Recordando que p(y) = F (y) − F (y − 1), ubicamos en la tabla los
valores r = 7, r = 6 y hacemos la resta: p(7) = F (7)−F (6) = 0.3222−0.1209 = 0.2013.

b) P (al menos cinco) = P (Y ≥ 5) = p(5) + p(6) + p(7) + p(8) + p(9) + p(10) =


1 − p(0) + p(1) + p(2) + p(3) + p(4) = 1 − F (4) = 1 − 0.0064 = 0.9936. Este ejercicio sin
el uso de la tabla binomial se torna muy dispendioso.

c) P (menos de cuatro) = P (Y < 4) = p(0) + p(1) + p(2) + p(3) = F (3) = 0.0009, este
resultado lo arroja directamente la tabla de la distribución binomial.

d) El teorema 3.28 indica lo siguiente:


µ = E(Y ) = np = (10)(0.8) = 8 y σ 2 = V (Y ) = npq = (10)(0.8)(0.2) = 1.6.
3.30 Ejemplo. La probabilidad de que un paciente se recupere de una rara enfermedad
sanguínea es 0.4. Se conoce que 15 personas han contraído la enfermedad.
Determine la media y la desviación estándar, también calcule las siguientes probabilidades:
a) Sobrevivan al menos 10. b) Sobrevivan de 3 a 8. c) Sobrevivan exactamente 5.

Al aplicar el teorema 3.28 encontramos lo siguiente: µ = E(Y √ ) = np = (15)(0.4) = 6


2
σ = V (Y ) = npq = (15)(0.4)(0.6) = 3.6, por tanto, σ = 3.6 = 1.897
a) P (Y ≥ 10) = 1 − P (Y ≤ 9) = 1 − F (9) = 1 − 0.9662 = 0.0338
b) P (3 ≤ Y ≤ 8) = P (Y ≤ 8) − P (Y ≤ 2) = F (8) − F (2) = 0.9050 − 0.0271 = 0.8779
c) P (Y = 5) = P (Y ≤ 5) − P (Y ≤ 4) = F (5) − F (4) = 0.4032 − 0.2173 = 0.1859
3.7. EJERCICIOS DE DISTRIBUCIÓN BINOMIAL 95

Los tres diagramas corresponden a la distribución binomial Y con parámetros n = 15


y p = 0.4. El diagrama de la izquierda ilustra un histograma con la característica
P (Y ≥ 10), el del centro ilustra P (3 ≤ Y ≤ 8) y el de la derecha satisface P (Y = 5).

3.31 Nota. Cuando se realiza un muestreo sin reemplazo, los eventos pueden considerarse
independientes, si el tamaño de la muestra n no es mayor que el 5 % del tamaño de la
n
población N , es decir, si N ≤ 0.05.

3.32 Ejemplo. Suponga que un lote de 5000 fusibles electrónicos contiene 5 % de piezas
defectuosas. a) Si se prueba una muestra de 5 fusibles encuentre la probabilidad de hallar
al menos uno defectuoso. b) Si 25 fusibles se prueban al azar de este lote encuentre la
probabilidad de observar al menos tres defectuosos.
Aunque el muestreo se realiza sin reemplazo, es razonable suponer que Y , el número
observado de fusibles defectuosos, tiene distribución binomial porque el lote es grande
comparado con la muestra.
a) El enunciado nos dice que n = 5, p = 0.05.  
5
Aplicaremos la ley del complemento, por tanto hallamos P (Y = 0) = (0.050 )(0.955 ) =
0
0.774. La probabilidad solicitada es P (Y > 0) = 1 − P (Y = 0) = 1 − 0.774 = 0.226.
Observe que hay una probabilidad relativamente grande de ver al menos uno defectuoso,
aún cuando la muestra es muy pequeña.
b) Ahora n = 25, p = 0.05.
Si acudimos a las tablas de la binomial también podemos aplicar la ley del complemento,
como P (Y ≤ 2) = 0.873 entonces P (Y ≥ 3) = 1 − P (Y ≤ 2) = 1 − 0.873 = 0.127.

3.7. Ejercicios de distribución binomial


1. Un examen de selección múltiple con única respuesta, cuenta con 15 preguntas, cada
una con cinco posibles respuestas. Un estudiante no sabe absolutamene nada y con-
testa solo adivinando.
¿Cuál es la probabilidad de que conteste correctamente menos de cinco preguntas?
¿Cuál es la probabilidad de que conteste correctamente exactamente tres preguntas?
¿Cuál es la probabilidad de que apruebe el examen? (se aprueba con mínimo 9
respuestas correctas).
96 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

2. Se conjetura que hay impurezas en el 30 % del total de pozos de agua potable de cierta
comunidad rural. Como es muy costoso probar todos los pozos del área, se eligen 10
al azar para someterlos a una prueba de impurezas.
¿Cuál es la probabilidad de que exactamente 3 pozos tengan impurezas?
¿Cuál es la probabilidad de que más de 3 pozos tengan impurezas?
¿Cuál es la probabilidad de que menos de 3 pozos tengan impurezas?

3. Una cadena de tiendas al detal le compra cierto dispositivo electrónico a un fabricante,


el cuál le indica que la tasa de artículos defectuosos es del 3 %.
a) El inspector de la cadena elige 17 artículos al azar de un cargamento, halle la
probabilidad de encontrar por lo menos uno defectuoso, aproxime la respuesta a la
primer cifra decimal.
b) La cadena de tiendas al detal recibe 10 cargamentos en un mes y el inspector
prueba aleatoriamente 17 artículos por cargamento. Determine la probabilidad de
que observar por lo menos tres cargamentos que contengan al menos un dispositivo
defectuoso de entre los 17 seleccionados y probados.

4. La probabilidad de que un paciente se recupere de una enfermedad estomacal es


0.8. Suponga que se sabe que 20 personas han contrído la enfermedad. Encuentre la
probabilidad de que:
a) exactamente 14 pacientes se recuperen;
b) al menos 10 pacientes se recuperen;
c) al menos 14 pero no más de 18 se recuperen;
d) a lo sumo 16 pacientes se recuperen.

5. Un nuevo procedimiento quirúrgico es exitoso con una probabilidad igual a p.


Suponga que la operación se realiza cinco veces y que los resultados son
independientes entre si. Determine la probabilidad de que:
a) todas las operaciones sean exitosas si p = 0.8;
b) exactamente cuatro operaciones sean exitosas si p = 0.6;
c) menos de dos operaciones sean exitosas si p = 0.3.

6. Suponga que los motores de un avión operan de forma independiente y que tiene una
probabilidad de falla de 0.4. Un avión tiene un vuelo seguro si funcionan al menos la
mitad de sus motores. Si un avión tiene 4 motores y otro tiene 2 motores, diga cual
de los dos aviones tiene mayor probabilidad de realizar un vuelo exitoso.

7. El director técnico de la selección Argentina de fútbol sabe por experiencia, que su


jugador estrella, Lionel Messi, anota cuatro de cada cinco penales que ejecuta.
a) ¿Qué es más probable: que falle a lo más dos de cinco penales, o que falle a lo
más cuatro de diez penales?
b) ¿Cuál es la probabilidad de que sólo falle un penal en una serie de cinco tiros?
3.8. DISTRIBUCIÓN HIPERGEOMÉTRICA 97

8. De acuerdo con el procurador de justicia de Bogotá, por cada asalto o robo que
se denuncia ante las autoridades, hay otros cuatro que no son denunciados. Si en
una tarde ocurren 9 delitos de este tipo en una localidad de Bogotá, determine la
probabilidad de que:
a) exactamente tres de ellos hayan sido denunciados;
b) ninguno haya sido denunciado;
c) No más de siete hayan sido denunciados.
9. Un individuo afirma que es capaz de distinguir a simple vista entre una perla auténtica
y una falsa el 70 % de las veces. Para comprobar si lo que afirma es cierto, se muestran
una por una seis perlas diferentes escogidas al azar y se aceptará lo que afirma si logra
establecer la autenticidad (o falsedad) en por lo menos cinco de las perlas.
a) Halle la probabilidad de que el individuo pase la prueba, si sólo está adivinando.
b) Si es cierto lo que él afirma, obtenga la probabilidad de que no logre pasar la
prueba.
10. Una máquina produce piezas metálicas, de las cuales el 5 % son de calidad excelente.
¿Cuántas piezas deberán producirse para que la probabilidad de que haya por lo
menos una de calidad excelente sea mayor a 0.5?
11. Según el ministerio de transporte, el 20 % de los conductores de transporte público
en Bogotá manejan imprudentemente. Encuentre la probabilidad de que 4 de los
próximos 10 conductores de transporte público que pasen por un retén policiaco
conduzcan imprudentemente.

3.8. Distribución hipergeométrica


La distribución de probabilidad hipergeométrica mantiene una relación estrecha con la
distribución binomial, pero difiere de ésta en dos puntos esenciales: sus ensayos no son
independientes y su probabilidad de éxito cambia de un ensayo a otro.

Suponga que una población contiene un número finito N de elementos que posee una de dos
características, digamos elementos rojos y elementos negros. Así r de los elementos serían
rojos y N − r son negros. Una muestra de n elementos se selecciona al azar de la población
y la variable aleatoria de interés es X, el número de elementos rojos de la muestra. Esta
variable aleatoria discreta se conoce como la dstribución de probabilidad hipergeométrica.

La forma más simple de ver la diferencia entre la distribución binomial y la hipergeomé-


trica consiste en observar la manera en que se realiza el muestreo. La disribución binomial
requiere que los ensayos sean independientes; por consiguiente, si se aplica esta distribución
(tomando muestras de de un lote de artículos como barajas, balotas, objetos fabricados,
etc) el muestreo se debe efectuar reemplazando cada artículo después de observarlo.
98 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Por otra parte la distribución hipergeométrica no requiere de ensayos independientes y se


basa en un muestreo realizado sin reemplazo.

En general, nos interesa la probabilidad de seleccionar x éxitos de los r artículos que poseen
la característica satisfactoria, y n − x fracasos de los N − r artículos que no poseen la
característica buscada cuando una muestra aleatoria de tamaño n se selecciona de una
totalidad de N artículos. Esto se conoce como un experimento hipergeométrico, es decir,
aquel que posee las siguientes propiedades:
De un lote de N artículos se selecciona una muestra aleatoria de tamaño n sin
reemplazo.
r de los N artículos se pueden clasificar como éxitos, y N − r se clasifican como
fracasos

3.33 Definición. El número x de éxitos de un experimento hipergeométrico se denomina


variable aleatoria hipergeométrica. En consecuencia, la distribución de probabilidad de esta
v.a.d. se conoce como distribución hipergeométrica. Su función de probabilidad viene dada
por
N −r
  
r
x n−x
p(x) =   , siendo x = 0, 1, 2, . . . , n,
N
n
sujeto a las restricciones x ≤ r y n − x ≤ N − r.
3.34 Teorema. Si X es una v.a.d. con distribución hipergeométrica, entonces
nr  nr   N − r   N − n 
µ = E(X) = y σ2 = · ·
N N N N −1
3.35 Ejemplo. Se extraen 5 cartas una tras otra (sin reemplazo), de una baraja corriente
de 52 cartas. Hallar la probabilidad de observar 3 cartas rojas. También halle µ y σ 2 .

Como la mitad de las cartas son rojas, podemos


realizar la siguiente identificación:
N = 52, n = 5, r = 26, x = 3,
de esta manera, la probabilidad requerida es igual a:
  
26 26
3 2 nr 5 · 26
p(3) =   = 0.325, µ = = = 2.5
52 N 52
5
5 · 26 26 47 235
σ2 = · · = = 1.152
52 52 51 204
3.8. DISTRIBUCIÓN HIPERGEOMÉTRICA 99

3.36 Ejemplo. Se consideran lotes con 50 componentes electrónicos, que contienen seis
elementos defectuosos. El procedimiento para obtener muestras del lote consiste en
seleccionar 10 componentes uno tras otro (sin reemplazo) y rechazar el lote si se encuentra
más de un componente defectuoso. ¿Cuál es la probabilidad de rechazar un lote de estos?

El lote se rechaza si x = 2, 3, 4, 5, 6.
Es más sencillo aplicar la ley del complemento y tan
solo hallar la probabilidad de que x tome los valores
x = 0, 1. Ahora N = 50, n = 10, r = 6, x = 0, 1.
     
6 44 6 44
0 10 1 9
p(0) + p(1) =   +  
50 50
10 10
= 0.2415 + 0.4141 = 0.6556. Por consiguiente la
probabilidad buscada es 1 − 0.6556 = 0.3444.

3.37 Ejemplo. De un grupo de 20 ingenieros con título de Ph D, 7 son egresados de la


Universidad Libre. 10 de los 20 ingenieros son seleccionados al azar para un empleo. ¿Cuál
es la probabilidad de que los 10 seleccionados incluyan 2 egresados de la Universidad Libre?
Determine la media y la varianza.

Para este ejemplo


N = 20, n = 10, r = 7 y x = 2.
  
7 13
2 8 189
p(2) =   = 1292 = 0.1463
20
10
nr 10·7 7
µ= N = 20 = = 3.5
2
 
10·7 20−7 20−10
σ2 =
 
20 20 20−1
7 13 10 91
  
= 2 20 19 = 76 = 1.2

Relación de la distribución hipergeométrica con la distribución binomial


Existe una interesante relación entre las distribuciones hipergeométrica y binomial.
Si n es pequeña comparada con N , la naturaleza de los N artículos cambia muy poco en
cada prueba y se puede utilizar la distribución binomial para aproximar la distribución
n
hipergeométrica, esto se hace cuando ≤ 0.05.
N
100 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Cuando este es el caso, la cantidad Nr desempeña el papel de parámetro binomial p, la media


y la varianza se obtienen a partir de las fórmulas µ = np = nr 2 r
N y σ = npq = n· N · 1 − N
r

Comparando estas fórmulas con las de la media y varianza de la distribución hipergeo-


métrica, vemos que la media es la misma mientras que la varianza difiere en un factor
insignificante cuando n es pequeña comparada con N .

3.38 Ejemplo. Un fabricante de neumáticos para automóvil reporta que de un cargamento


de 5000 piezas que se mandan a un distribuidor local, 1000 están ligeramente manchadas.
Si se compran al azar 20 de estos neumáticos al distribuidor, ¿cuál es la probabilidad de
que más de 8 estén manchados?

Como el tamaño de la población N = 5000 es grande con respecto al tamaño de la muestra


n = 20, es posible emplear la distribución binomial como aproximación de la distribución
hipergeométrica. A continuación resolvemos el ejercicio de dos maneras: directamente y por
medio de la binomial.
Considerando la distribución hipergeomé- Empleamos la aproximación binomial Y .
trica X : N = 5000, n = 20 y r = 1000. Sus parámetros son:
Al calular los valores r 1000 1
   n = 20 y p = N = 5000 = 5 = 0.2.
1000 4000
x 20 − x Ahora calculamos la probabilidad de que
p(x) =   la variable aleatoria binomial Y con
5000
20 parámetros n = 20 y p = 0.2 sea mayor
que 8:
para cada x = 9, 10, 11, . . . , 19, 20
y sumar estos resultados, se obtiene P (Y > 8) = P (Y ≥ 9) =
P (X > 8) = P (X ≥ 9) = 0.0098. 1 − P (Y ≤ 8) = 1 − 0.99 = 0.01.

En el diagrama de la izquierda se aprecia el histograma de la distribución hipergeométrica


X y en el diagrama de la derecha el de la distribución binomial Y . Los parámetros se han
especificado en el desarrollo del ejercicio, a simple vista las distribuciones parecen idénticas,
note que el error entre el valor exacto y la aproximación binomial es tan solo de 0.0002.
3.9. EJERCICIOS DE DISTRIBUCIÓN HIPERGEOMÉTRICA 101

3.9. Ejercicios de distribución hipergeométrica


1. Sea X una variable aleatoria hipergeométrica con N = 15, n = 3 y r = 3.
a) Encuentre la distribución de probabilidad de X en forma de tabla.
b) Grafique el histograma de probabilidad para X. c) Calcule µ y σ.
d) ¿Qué proporción de la población de mediciones cae en el intervalo µ ± 2σ?
¿y en el intervalo µ ± 3σ? ¿estos resultados concuerdan con los suministrados por el
teorema de Chebyshev o con la regla empírica?

2. Un plato de dulces contiene cinco dulces azules y tres rojos. Un niño selecciona tres
dulces sin verlos. Calcule la probabilidad de que:
a) el niño seleccione dos dulces azules y uno rojo.
b) el niño seleccione tres dulces rojos.
c) el niño seleccione tres dulces azules.

3. Un grupo de cinco solicitantes para un par de trabajos idénticos está formado por tres
hombres y dos mujeres. Suponga que los cinco solicitantes son igualmente calificados y
que no se da preferencia para escoger género alguno. Sea X igual al número de mujeres
seleccionadas para ocupar los dos cargos. Encuentre la distribución de probabilidad
para X y halle la media y la varianza de X.

4. Repita el ejercicio anterior considerando la variable aleatoria Y : número de hombres


seleccionados para ocupar los dos cargos.

5. Una urna contiene 10 canicas, de las cuales 5 son verdes, 2 son azules y 3 son rojas.
Tres canicas se van a sacar de la urna, una a la vez y sin reemplazo. ¿Cuál es la
probabilidad de que las tres canicas extraídas sean verdes?

6. Una corporación hace un muestreo sin reemplazo para n = 3 firmas, para determinar
aquella de la cual comprar abastecimientos. La muestra se ha de seleccionar de un
grupo de seis firmas, de las cuales cuatro son locales y dos no lo son. Denote con Y el
número de firmas no locales de entre las tres seleccionadas. Calcule las siguientes pro-
babilidades: a) P (Y = 1) b) P (Y ≥ 1) c) P (Y ≤ 1)

7. Las especificaciones exigen que un termistor se pruebe entre 9000 y 10000 ohms
a 25◦ Celsius. Se dispone de 10 termistores y 3 de éstos han de ser seleccionados
para usarlos. Denote con Y el número de entre los tres que no se apegan a las
especificaciones. Encuentre las distribuciones de probabilidad para Y (en forma
tabular) dadas en las siguientes condiciones:
a) Dos temistores no se apegan a las especificaciones de entre los 10 disponibles.
b) Cuatro temistores no se apegan a las especificaciones de entre los 10 disponibles.

8. Unas fotocopiadoras usadas son enviadas al proveedor, limpiadas y luego devueltas


según convenios de renta. No se hacen reparaciones importantes y en consecuencia
102 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

algunos clientes reciben máquinas que no funcionan bien. Entre ocho fotocopiadoras
disponibles hoy, tres de ellas están funcionando mal. Un cliente desea rentar cuatro
máquinas de inmediato. Calcule la probabilidad de que el cliente reciba:
a) x máquinas que funcionen mal.
b) por lo menos una máquina que funcionen mal.

9. Se reparten cinco cartas al azar sin reemplazo de una baraja de 52 cartas. ¿Cuál
es la probabilidad de que la mano contenga por lo menos un as?
Si de una baraja ordinaria de 52 cartas se toman 7 y se reparten, ¿cuál es la
probabilidad de que al menos una de ellas sea una reina.
Si a una persona se le reparten varias veces 12 cartas de una baraja de 52 cartas
¿cuántas cartas de corazones por mano puede esperar?

10. Un embarque de 80 alarmas antirrobo contiene 4 defectuosas. Si del embarque se


seleccionan al azar tres y se envían a un cliente, encuentre la probabilidad de que el
cliente reciba exactamente un alarma defectuosa.

11. Un recipiente tiene 12 botellas de vino, 3 de ellas se han echado a perder. Una muestra
de 4 botellas se selecciona al azar de la caja.
a) Encuentre la distribución de probabilidad para X, el número de botellas de vino
echado a perder. b) Calcule la media y la varianza de X.

12. Una pieza de equipo electrónico contiene seis chips de computador, dos de los cuales
están defectuosos. Tres chips se seleccionan para inspeccionarlos y se registra el nú-
mero de defectuosos. Encuentre la distribución de probabilidad para X : el número
de chips defectuosos y encuentre la probabilidad de no ver artículos defectuosos.

13. Se selecciona al azar un comité de tres personas a partir de cuatro médicos y dos
enfermeras. Encuentre la distribución de X : el número de médicos en el comité.
Calcule P (2 ≤ X ≤ 3).

14. (B) Una ciudad vecina considera entablar una demanda de anexión en contra de
una subdivisión del condado de 1200 residencias. Si los ocupantes de la mitad de
las residencias objetan la anexión ¿cuál es la probabilidad de que en una muestra
aleatoria de 10 residencias, al menos 3 objeten la anexión?

15. (B) Se estima que 4000 de los 10000 residentes con derecho al voto de una ciudad
están en contra de un nuevo impuesto sobre las ventas. Si se seleccionan al azar 15
votantes y se les pide su opinión, ¿cuál es la probabilidad de que a lo sumo 7 estén
en contra del nuevo impuesto?
3.10. DISTRIBUCIÓN GEOMÉTRICA Y DISTRIBUCIÓN BINOMIAL NEGATIVA 103

3.10. Distribución geométrica y distribución binomial negativa


Distribución geométrica
La variable aleatoria con distribución de probabilidad geométrica esta asociada con un
experimento que comparte algunas características de un experimento binomial. Este
experimento también comprende pruebas idénticas e independientes, cada una de las cuales
puede arrojar uno de dos resultados: éxito E o fracaso F .

La probabilidad de éxito es igual a p y es constante de una prueba a otra. No obstante,


en lugar del número de éxitos que se presentan en n pruebas, la variable aleatoria Y es el
número de prueba en la que ocurre el primer éxito. Entonces el experimento consiste en
una serie de pruebas que concluye con el primer éxito.

El espacio muestral S para el experimento se compone del siguiente conjunto infinito


contable: S = { E1 , E2 , E3 , . . . , Ei−1 , Ei , . . .} donde
E1 : E indica que se obtuvo éxito en la primer prueba;
E2 : F E indica que se obtuvo fracaso en la primera y éxito en la segunda prueba, o lo que
es lo mismo, que el primer éxito se obtuvo en la segunda prueba;
E3 : F F E indica que se obtuvo fracaso en la primer y segunda prueba y éxito en la
tercer prueba, o equivalentemente, que el primer éxito se obtuvo en la tercer prueba;
Ei : F F . . . F E indica que se obtuvo el primer éxito en la i-ésima prueba.

Como las pruebas son independientes, para cualquier y = 1, 2, 3, . . . se tienen las


probabilidades p(y) = P (Y = y) = P (Ey ) = P (F F F . . . F E) = qqq . . . qp = q y−1 p

3.39 Definición. Se dice que una v.a.d. Y tiene una distribución de probabilidad
geométrica si y solo si p(y) = q y−1 p para y = 1, 2, 3, . . . donde 0 ≤ p ≤ 1 y
q = 1 − p.

3.40 Teorema. Si Y es una variable aleatoria con distribución geométrica, entonces


1 q
µ = E(Y ) = y σ 2 = V (Y ) = 2 .
p p
3.41 Ejemplo. Se sabe que en cierto proceso de fabricación uno de cada 100 artículos,
en promedio, resulta defectuoso. ¿Cuál es la probabilidad de que el quinto artículo que se
inspecciona, en un grupo de 100, sea el primer defectuoso que se encuentra?

Decir que uno de cada cien resulta defectuoso equivale a decir que la probabilidad de
encontrar uno defectuoso es p = 0.01, de esta manera p(5) = 0.994 0.01 = 0.0096

3.42 Ejemplo. En momentos de saturación, un conmutador telefónico está muy cerca de su


límite de capacidad, por lo que los usuarios tienen dificultad para hacer sus llamadas. Sería
interesante saber cuántos intentos serían necesarios para conseguir un enlace telefónico.
104 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Suponga que la probabilidad de enlace en momentos de saturación es 0.05. Determine el


número esperado de llamadas para poder ser atendidos y la probabilidad de ser atendidos
en menos de cinco llamadas.
Como la probabilidad de enlace es p = 0.05 entonces el número esperado de llamadas para
1 1
poder ser atendidos es µ = = = 20.
p 0.05
Por otra parte, si deseamos ser atendidos en menos de cinco intentos es porque somos
atendidos en la primer llamada, o en la segunda o en la tercera o en la cuarta, por
consiguiente p(1)+p(2)+p(3)+p(4) = 0.05+0.951 ·0.05+0.952 ·0.05+0.953 ·0.05 = 1.855
3.43 Ejemplo. Suponga que la probabilidad de mal funcionamiento de un motor durante
cualquier periodo de una hora es p = 0.02. Encuentre la probabilidad de que un motor
determinado funcione bien por lo menos dos horas. ¿Cuántas horas de buen funcionamiento
podremos esperar antes de encontrar una falla?
Sea Y el número de intervalos de una hora hasta la primer falla, entonces la probabilidad
P∞
de un buen funcionamiento de por lo menos dos horas es P (Y ≥ 3) = p(y).
y=3

P
Como p(y) = 1 entonces al aplicar la ley del complemento se obteine:
y=3

P
P (Y ≥ 3) = p(y) = 1 − p(1) − p(2) = 1 − p − q · p = 1 − 0.02 − 0.98 · 0.02 = 0.9604
y=3

Encontrar el tiempo esperado antes de encontrar una falla equivale a hallar el valor esperado,
1 1
E(Y ) = µ = = = 50, es decir, 50 horas.
p 0.02
Distribución binomial negativa
Una variable aleatoria con distribución binomial negativa se origina de un contexto
semejante al que da la distribución geométrica. De nuevo nos concentramos en intentos
independientes e idénticos, cada uno de los cuales conduce a uno de dos resultados: éxito o
fracaso. La probabilidad p de éxito se mantiene igual de un intento a otro. La distribución
geométrica maneja el caso donde estamos interesados en el número de intento en el que
ocurre el primer éxito. ¿Qué pasa si estamos interesados en conocer el número de intento
en el que ocurre el segundo éxito, o el el tercer éxito o el cuarto éxito? La distribución que
se ajusta a la variable aleatoria X igual al número del intento en el que ocurre el r-ésimo
éxito (r = 2, 3, 4, . . .) es la distribución binomial negativa.

3.44 Definición. Se dice que una variable aleatoria X tiene


 una distribución de
x − 1 r x−r
probabilidad binomial negativa si y solo si p(x) = p q
r−1
para x = r, r + 1, r + 2, . . . con 0 ≤ p ≤ 1 y q = 1 − p.
3.10. DISTRIBUCIÓN GEOMÉTRICA Y DISTRIBUCIÓN BINOMIAL NEGATIVA 105

3.45 Teorema. Si X es una variable aleatoria con distribución binomial negativa, entonces
r rq
µ = E(X) = y σ 2 = V (X) = .
p p2
3.46 Ejemplo. Un estudio geológico indica que un pozo petrólero de exploración
perforado en una región particular debe producir petróleo con probabilidad 0.2.
Encuentre la probabilidad de que el tercer descubrimiento de petróleo llegue en el quinto
pozo perforado. También determine la media y la varianza.

Las perforaciones son independientes y con probabilidad 0.2 de descubrir petróleo en cual-
quiera de los pozos. Sea X el número del intento en el que ocurre el tercer descubrimiento
de petróleo. Por todo esto X tiene distribución binomial
  negativa con p = 0.2 y r = 3.
4
La probabilidad requerida es P (X = 5) = p(5) = 0.23 0.82 = 6 · 0.008 · 0.64 = 0.0307
2
r 3 rq 3 · 0.8
La media es E(X) = = = 15 y la varianza σ 2 = 2 = = 60.
p 0.2 p 0.22
3.47 Ejemplo. Considere el uso de un medicamento que se sabe que es eficaz en el 60 % de
los casos que utiliza. El uso del medicamento se considerará un éxito si proporciona algún
alivio al paciente.
Nos interesa calcular la probabilidad de que el quinto paciente que experimente alivio sea
el séptimo paciente en recibir el medicamento en una semana determinada.
 
6
Ahora p = 0.6 y r = 5, por tanto P (X = 7) = p(7) = 0.65 0.42 = 0.1866
4
3.48 Ejemplo. En la serie de campeonato de la NBA (national basketball association), el
equipo que gane 4 juegos (de máximo 7) será el ganador. Suponga que los equipos A y B
se enfrentan en los juegos de campeonato y que el equipo A tiene una probabilidad de 0.55
de ganarle al equipo B.
a) ¿Cuál es la probabilidad de que el equipo A gane la serie en 6 juegos?
b) ¿Cuál es la probabilidad de que el equipo A gane la serie?

a) Estamos ante una variable binomial negativa con p = 0.55 y r = 4, por tanto
 
5
P (X = 6) = p(6) = 0.554 0.452 = 0.1853
3

b) El equipo A gana la serie si gana 4 partidos al equipo A: en el cuarto juego, o en el


quinto juego, o en el sexto juego, o en el séptimo juego. Por consiguiente
       
3 4 0 4 4 1 5 4 2 6
p(4)+p(5)+p(6)+p(7) = 0.55 0.45 + 0.55 0.45 + 0.55 0.45 + 0.554 0.453
3 3 3 3
= 0.0915 + 0.1647 + 0.1853 + 0.1668 = 0.6083
106 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

3.11. Ejercicios de dist. geométrica y binomial negativa

1. Se lanza un dado corriente y se observa el número de su cara superior. El juego termina


cuando se observa el número tres. Encuentre la probabilidad de que el juego termine
en el quinto lanzamiento. ¿Cuál es el número esperado de intentos para terminar el
juego? (considere p y q como fracciones).

2. Suponga que el 30 % de los solicitantes para cierto trabajo industrial posee capacita-
ción avanzada en programación computacional. Los candidatos son elegidos aleatoria-
mente entre la población y entrevistados en forma sucesiva. Encuentre la probabilidad
de que el primer solicitante con capacitación avanzada en programación se encuentre
en la quinta entrevista. ¿Cuál es el número esperado de solicitantes que será necesario
entrevistar para hallar el primero con capacitación avanzada?

3. Una empresa de exploración petrolera va a hacer una serie de perforaciones de sondeo


en una zona determinada en busca de un pozo productivo. La probabilidad de que
tenga éxito en un intento dado es 0.2
a) ¿Cuál es la probabilidad de que la tercera perforación sea la primera en dar un
pozo productivo?
b) Si la empresa puede darse el lujo de perforar a lo sumo siete pozos, ¿cuál es la
probabilidad de que no encuentre un pozo productivo?
c) ¿Cuántas perforaciones esperaría hacer la empresa para encontrar el primer pozo
productivo?

4. Se lanza una moneda corriente al aire. Encuentre la probabilidad de observar la primer


cara en el octavo lanzamiento.

5. Se lanza un par de dados y se suman los puntajes de sus caras superiores. Encuentre la
probabilidad de observar el primer nueve antes del quinto lanzamiento. Determine el
número esperado de lanzamientos esperado para observar el primer nueve (considere
p y q como fracciones).

6. Los empleados de una empresa que manufactura aislamientos están siendo examinados
en busca de indicios de asbesto en sus pulmones. La empresa ha sido requerida para
enviar tres empleados que tengan indicios positivos de asbesto a un centro médico para
realizarles exámenes adicionales. Si 40 % de los empleados tienen indicios positivos de
asbesto en sus pulmones, encuentre la probabilidad de que diez empleados deban ser
examinados para hallar tres positivos. Si cada examen cuesta $20, encuentre el valor
esperado y la varianza del costo total de realizar los exámenes necesarios para hallar
los tres positivos.
3.12. DISTRIBUCIÓN DE POISSON 107

7. Diez por ciento de los motores fabricados en una línea de ensamble son defectuosos.
Si los motores se seleccionan al azar uno a uno y se prueban,
a) Encuentre la probabilidad de que el tercer motor defectuoso sea hallado en el
quinto intento.
b) Calcule la probabilidad de que el tercer motor defectuoso sea hallado en el quinto
intento o antes.
c) Determine la media y la varianza del número del intento en el que sea hallado el
tercer motor no defectuoso.

8. La probabilidad de que una persona que vive en -Bogotá tenga un perro es 0.3. Calcule
la probabilidad de que la décima persona entrevistada al azar sea la quinta que tiene
un perro.

9. Obtenga la probabilidad de que una persona que lanza una moneda observe:
a) la tercer cara en el séptimo lanzamiento;
b) la primer cara en el cuarto lanzamiento.

10. Un científico inocula a varios ratones, uno a la vez, el virus que produce una
enfermedad, hasta que encuentra a dos que contraen la enfermedad. Si la
probabilidad de contraer la enfermedad es 0.1, halle la probabilidad de tener que
inocular a ocho ratones.

11. Suponga que la probabilidad de que una persona crea un rumor acerca de las
transgresiones de cierto cantante de rock famoso es de 0.8. Encuentre la
probabilidad de que:
a) la sexta persona que escuche este rumor sea la cuarta en creerlo;
b) la tercera persona que escuche este rumor sea la primera en creerlo.

3.12. Distribución de Poisson


Los experimentos que producen valores numéricos de una variable aleatoria X, el número
de resultados que ocurren durante un intervalo de tiempo determinado o en una región
específica, se denomina experimento de Poisson.

El intervalo de tiempo puede ser de cualquier duración, como un minuto, un día, una
semana, un mes o tal vez un año. Por ejemplo, un experimento de Poisson podría generar
observaciones para la variable aleatoria X que representa el número de llamadas telefónicas
por hora que recibe una oficina; el número de días que una escuela distrital permanece
cerrada debido a los paros nacionales o educativos en un año escolar; o el número de
partidos de béisbol suspendidos a causa de la lluvia durante la temporada deportiva.
108 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

La región específica podría ser un segmento de recta, un área, un volumen o quizá una
pieza de material. En estos casos X podría representar el número de ratas por hectárea;
el número de bacterias en un cultivo dado; o el número de errores mecanográficos por
página. Un experimento de Poisson se deriva del proceso de Poisson, el cuál se describe a
continuación, tenga presente que aunque solo se menciona un intervalo de tiempo, en lugar
de éste puede tratarse de una región específica.

El número de resultados que ocurren en un intervalo de tiempo es independiente del


número de resultados que se presentan en cualquier otro intervalo de tiempo disjunto.

La probabilidad de que ocurra un solo resultado durante un intervalo de tiempo muy


corto es proporcional a la longitud del intervalo de tiempo y no depende del número
de resultados que ocurren fuera de ese intervalo.

La probabilidad de que ocurra más de un resultado en tal intervalo de tiempo muy


corto, es insignificante

El número X de resultados que ocurren durante un experimento de Poisson se llama


variable aleatoria de Poisson. El número medio de resultados se calcula a partir de la
expresión λt, donde t es el tiempo, la distancia, el área o el volumen de interés.
La siguiente fórmula se utiliza para calcular probabilidades de Poisson.

3.49 Definición. Una variable aleatoria Y tiene distribución de probabilidad de


λy −λ
Poisson si y solo si p(y) = e para y = 0, 1, 2, . . . con λ > 0.
y!

3.50 Teorema. Si Y es una variable aleatoria que posee distribución de Poisson con
parámetro λ entonces µ = E(Y ) = λ y σ 2 = V (Y ) = λ.

3.51 Ejemplo. El número promedio de accidentes de tránsito en cierto cruce de carretera


es dos por semana.
Suponga que el número de accidentes sigue una distribución de Poisson con λ = 2.
a) Encuentre la probabilidad de que no haya accidentes en este cruce de carretera durante
un periodo de una semana.
b) Obtenga la probabilidad de que a lo sumo se presenten tres accidentes en esta sección
de carretera durante un periodo de dos semanas.

a) El número medio de accidentes semanales es igual a dos, por tanto asumimos el


parámetro λ = 2 y de esta manera calculamos la probabilidad solicitada,
20
P (Y = 0) = p(0) = e−2 = e−2 = 0.1353. Este valor se puede obtener fácilmente de las
0!
tablas de la distribución de Poisson con parámetro λ = 2.
3.12. DISTRIBUCIÓN DE POISSON 109

b) En un periodo de dos semanas el número promedio de accidentes en esa sección


de carretera es λ = 2 · 2 = 4. La probabilidad de ver a lo sumo tres accidentes será:
40 41 42 43
P (Y ≤ 3) = p(0) + p(1) + p(2) + p(3) = e−4 + e−4 + e−4 + e−4
0! 1! 2! 3!
= 0.0183 + 0.0733 + 0.1465 + 0.1954 = 0.4335. Este valor también podría
leerse directamente de las tablas de la distribución de Poisson con parámetro λ = 4.

En la gráfica de la izquierda se aprecia el histograma de la distribución de Poisson con


λ = 2 y se selecciona Y = 0. En la gráfica de la derecha se observa el histograma de la
distribución de Poisson con λ = 4 y se seleccionan Y = 0, 1, 2 y 3.

3.52 Ejemplo. El número promedio de camiones que llegan diariamente a cierta ciudad
portuaria es 10. Las instalaciones en el puerto pueden alojar a lo sumo 15 camiones por
día. ¿Cuál es la probabilidad de que en un día determinado lleguen más de 15 camiones y
se tenga que rechazar algunos camiones?

Sea X el número de camiones que llegan a


diario.
Usando la ley del complemento y la tabla
de la distribución de Poisson se tiene

P (X > 15) = 1 − P (X ≤ 15)


= 1 − 0.9513 = 0.0487

3.53 Ejemplo. Durante un experimento de laboratorio el número promedio de particu-


las radiactivas que pasan a través de un contador en un milisegundo es 4. ¿Cuál es la
probabilidad de que entren 6 partículas al contador en un milisegundo? Encuentre la media
y la varianza de la distribución de probabilidad.
110 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Sea Y el número de partículas radiactivas que


pasan a través del contador en un milisegundo.
Y tiene distribución de Poisson con parámetro
λ = 4. Al aplicar la definición se tiene:
46
P (Y = 6) = e−4 = 0.1042
6!
Este valor se puede obtener a partir la tabla de
la distribución de Poisson con parámetro λ = 4,
P (Y = 6) = P (Y ≤ 6) − P (Y ≤ 5)
= 0.8893 − 0.7851 = 0.1042
La media y la varianza son iguales a λ = 4.

Relación entre la distribución binomial y la distribución de Poisson


La distribución de probabilidad de Poisson da una aproximación sencilla, fácil de
calcular y precisa a probabilidades binomiales, cuando n es grande y λ = np es pequeña,
preferiblemente np ≤ 7.
3.54 Ejemplo. Una compañia de seguros de vida asegura las vidas de 5000 hombres de 45
años de edad. Estudios actuariales muestran que la probabilidad de que cualquier hombre
de 45 años muera en un año determinado es 0.001. Encuentre la probabilidad de que la
compañia tenga que pagar cuatro reclamaciones en un año determinado
a) exactamente, es decir, por medio de la distribución binomial;
b) usando la aproximación suministrada por la distribución de Poisson.

a) Al emplear la distribución binomial con n = 5000 y p = 0.001 se obtiene


 
5000
p(4) = 0.0014 · 0.9994996 = 0.17552
4

b) La distribución de Poisson brinda una buena aproximación puesto que


54
λ = np = 5000 · 0.001 = 5 < 7, de esta manera p(4) = e−5 = 0.1755,
4!
nótese que la aproximación es muy precisa.

3.13. Ejercicios de distribución de Poisson


1. El número de errores mecanográficos cometidos por una secretaria tiene una distri-
bución de Poisson con un promedio de cuatro errores por página. Si en una página se
observan más de cuatro errores, la secretaria debe volver a escribir la página. ¿Cuál es
la probabilidad de que una página seleccionada al azar tenga que volver a ser escrita.
3.13. EJERCICIOS DE DISTRIBUCIÓN DE POISSON 111

2. El número medio de automóviles que entran al túnel de una montaña por periodo
de dos minutos es uno. Un número excesivo de autos que entran al túnel durante un
breve periodo de tiempo produce una situación peligrosa.
a) Encuentre la probabilidad de que el número de autos que entran al túnel en un
periodo de dos minutos sea de por lo menos cuatro autos.
b) Halle la probabilidad de que el número de autos que entran al túnel en un periodo
de seis minutos sea de por lo menos cuatro autos.

3. Sea Y una v.a.d. con distribución de Poisson con media λ y sean X y W otras dos
variables aleatorias definidas como X = Y (Y − 1) y W = Y (Y + 1).
Encuentre el valor esperado de X y de W .

4. En la producción diaria de cierta clase de cuerda, sea Y el número de defectos por


metro. Y tiene una distribución de Poisson con media λ = 2.
La utilidad por metro al vender la cuerda, es igual a W = 50 − 2Y − Y 2 . Encuentre
la utilidad esperada por metro.

5. Ocurren accidentes industriales de acuerdo con un proceso de Poisson con un promedio


de tres accidentes por mes. Durante los últimos dos meses ocurrieron diez accidentes.
Encuentre la probabilidad de este evento.

6. En cierto cruce ocurren en promedio 3 accidentes viales mensualmente. Determine la


probabilidad de que en cualquier mes en este cruce
a) ocurran exactamente 5 accidentes;
b) se presenten menos de 3 accidentes;
c) ocurran por lo menos 2 accidentes.

7. Un escritor de libros comete en promedio dos errores de procesamiento de texto por


página en el primer borrador de su libro. Halle la probabilidad de que en la siguiente
página cometa
a) por lo menos cuatro errores;
b) ningún error.

8. Cierta región del este de Estados Unidos resulta afectada en promedio por 6 huracanes
al año. Halle la probabilidad de que para el próximo año esta región sea afectada por
a) menos de cuatro huracanes;
b) entre seis y ocho huracanes.

9. Se estima que el número promedio de ratas en un campo de 5 hectáreas de cultivo de


trigo es igual a 20. Calcule la probabilidad de que se encuentren menos de 7 ratas en
un campo de dos hectáreas de cultivo de trigo.
112 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

10. En un proceso de fabricación donde se manufacturan productos de vidrio, ocurren


defectos o burbujas, lo cual ocasionalmente hace que la pieza no se pueda vender.
En promedio 1 de cada 1000 artículos producidos tiene burbujas. ¿Cuál es la
probabilidad de que un lote de 6500 artículos tenga menos de 7 artículos con burbujas?

11. La probabilidad de que un ratón inoculado con un suero contraiga cierta


enfermedad es 0.2. Usando la aproximación de Poisson, encuentre la probabilidad
de que al menos 3 de entre 30 ratones inoculados contraigan la enfermedad. También
halle la probabilidad directamente, es decir, por medio de la distribución binomial.

12. Se sabe que la probabilidad de que un estudiante de preparatoria no pase la prueba de


escoliosis (curvatura de la espina dorsal) es de 0.004. De los siguientes 1375 estudiantes
que se revisan en búsqueda de escoliosis
a) calcule la probabilidad de que menos de 5 no pasen la prueba;
b) obtenga la probabilidad de que 8, 9 o 10 no pasen la prueba;
c) Encuentre el número promedio de estudiantes que no pasan la prueba.

3.14. Media y varianza de variables aleatorias continuas


Recordemos que la función de distribución acumulada de una variable aleatoria Y se define
como la función F (y) tal que F (y) = P (Y ≤ y) para toda y.

En el ejemplo 3.26 se consideró el experimento consistente en lanzar una moneda corriente


4 veces y Y es la variable aleatoria que cuenta el número de caras observadas, nótese que
Y es una variable aleatoria binomial con n = 4 y p = 0.5.
En tal ejemplo se aprecia que la función 
de distribución viene dada mediante la


0 si y<0

siguiente tabla



0.0625 si 0≤y<1

0.3125 si 1≤y<2
y 0 1 2 3 4 F (y) =
F (y) 0.0625 0.3125 0.6875 0.9375 1 

0.6875 si 2≤y<3
3≤y<4

0.9375

 si
o de manera más general, la función de

y≥4

1 si
destribución esta escrita a la derecha.
3.55 Teorema (Propiedades de la función de distribución). Si F (y) es una función de
distribución, entonces:
lı́m F (y) = 0
y→−∞

lı́m F (y) = 1
y→∞

F (y) es una función no decreciente.


3.14. MEDIA Y VARIANZA DE VARIABLES ALEATORIAS CONTINUAS 113

3.56 Definición. Una variable aleatoria


Y , con función de distribución F (y),
es llamada continua si F (y) es continua
para toda −∞ < y < ∞.

La principal diferencia entre las variables


aleatorias discretas y continuas está dada
por la siguiente observación.

3.57 Nota. Si Y es una variable aleatoria


continua (v.a.c.) entonces, para cualquier
número real y se tiene P (Y = y) = 0.

3.58 Definición. Sea F (y) la función de distribución de una v.a.c. Y . La función de


dF (y)
densidad f (y) viene dada por f (y) = = F 0 (y) siempre que exista la derivada.
dy

3.59 Nota. La definición anterior y el teorema fundamental del Z y


cálculo implican que la función de distribución se puede escribir F (y) = f (t) dt
como se aprecia a la derecha, siendo f (t) la función de densidad. −∞

3.60 Teorema (Propiedades de la función de densidad). Si f (y) es la función de densidad


de una v.a.c. entonces se deben cumplir las dos condiciones:
f (y) ≥ 0 para toda y.
Z ∞
f (y) dy = 1
−∞

3.61 Teorema. Si la v.a.c. Y tiene función de densidad


f (y) y si a < b, entonces la probabilidad de que Y
caiga en el intervalo [a, b] es:
Zb
P (a ≤ Y ≤ b) = f (y) dy
a

Si Y es una variable aleatoria continua y si a y b son constantes tales que a < b, entonces
P (Y = a) = 0 y P (Y = b) = 0, por tanto:
Zb
P (a ≤ Y ≤ b) = P (a < Y ≤ b) = P (a ≤ Y < b) = P (a < Y < b) = f (y) dy.
a
114 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

 2
3.62 Ejemplo. Suponga que el error en la temperatura y
si − 1 ≤ y ≤ 2
de reacción, medida en grados centígrados, es una variable f (y) = 3
0 en otro caso.
aleatoria continua Y con función de probabilidad:

a) Verifique que f (y) es una función de densidad.


b) Calcule P (0 < Y ≤ 1) mediante la función de densidad.
c) Halle la función de distribución F (y) y utilice el resultado para calcular P (0 < Y ≤ 1).

a) La primer condición de una función de densidad se cumple: f (y) ≥ 0 para toda y.


y3 2
Z ∞ Z 2 2
y 8 1
Veamos la segunda condición: f (y) dy = dy = = + =1
−∞ −1 3 9 −1 9 9

1 1
y2 y3 1
Z
b) P (0 < Y ≤ 1) = dy = =
0 3 9 0 9
y y y
t2 t3 y3 + 1
Z Z
c) Si −1 ≤ y ≤ 2 entonces F (y) = f (t) dt = dt = = por tanto
−∞ −1 3 9 −1 9

03
 si y < −1
y +1 2 1
F (y) = si − 1 ≤ y ≤ 2 entonces P (0 < Y ≤ 1) = F (1) − F (0) = 9 − 9 = 91 .
 9
1 si y > 2.

3.63 Ejemplo. Sea Y una variable aleatoria continua cuya (


función de densidad de probabilidad se aprecia a la derecha. 3y 2 si 0 ≤ y ≤ 1
f (y) =
Encuentre la función de distribución F (y), grafique 0 en otro caso.
las funciones f (y) y F (y). Calcule P (0 < Y ≤ 0.5).
Z y Z y y
Si 0 ≤ y < 1 entonces F (y) = f (t) dt = 3t2 dt = t3 = y 3 , de esta manera
−∞ 0 0

0
 si y < 0
entonces P (0 < Y ≤ 0.5) = F (0.5) − F (0)
F (y) = y 3 si 0 ≤ y < 1
 = 0.125 − 0 = 0.125
1 si y ≥ 1.

Z 0.5 0.5
Calculamos la probabilidad por
P (0 < Y ≤ 0.5) = 3y 2 dy = y 3 = 0.125
medio de la función de densidad: 0 0
3.14. MEDIA Y VARIANZA DE VARIABLES ALEATORIAS CONTINUAS 115

En la gráfica de la izquierda se aprecia la gráfica de la función de densidad f (y), mientras


que en la gráfica de la derecha se puede ver la gráfica de la función de distribución F (y).

Z ∞ Y con función de
3.64 Definición. El valor esperado de una variable aleatoria continua
densidad f (y) es (siempre que exista la integral): E(Y ) = µ = y f (y) dy
−∞
3.65 Teorema. Sea Y una variable aleatoria continua con función de densidad Z ∞ f (y) y sea
g(Y ) una función de Y . El valor esperado de g(Y ) está dado por E[g(Y )] = g(y) f (y) dy
−∞
3.66 Teorema. Sea Y una variable aleatoria continua, sea c una constante y sean
g(Y ), g1 (Y ), g2 (Y ), . . . , gk (Y ) funciones de Y . Entonces:
E(c) = c
E[c g(Y )] = cE[g(Y )]
E[ g1 (Y ) + g2 (Y ) + . . . + gk (Y )] = E[g1 (Y )] + E[g2 (Y )] + . . . + E[gk (Y )]

La varianza de una v.a.c. se define exactamente igual que la varianza de una v.a.d.
3.67 Definición. Sea Y una variable aleatoria continua con valor esperado µ. La varianza
de Y es igual al valor esperado de (Y − µ)2 , esto es, V (Y ) = σ 2 = E[(Y − µ)2 ].
3.68 Nota. Si Y es una variable aleatoria continua con valor esperado µ, es posible
demostrar que V (Y ) = σ 2 = E(Y 2 ) − µ2 .
(
cy 2 si 0 ≤ y ≤ 2
3.69 Ejemplo. Sea Y una v.a.c. con función de densidad f (y) =
0 en otro caso.
a) Encuentre el valor de c que hace de f (y) una función de densidad.
b) Determine la probabilidad P (1 ≤ Y ≤ 1.2)
c) Calcule el valor esperado y la varianza de Y .
Z ∞
a) La función f (y) debe ser no negativa y satisfacer la identidad f (y) dy = 1,
−∞
cy 3 2 8c
Z ∞ Z 2
2 3
por tanto: f (y) dy = cy dy = = = 1 =⇒ c =
−∞ 0 3 0 3 8
116 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Z1.2 1.2
3y 2 y3 1.23 − 1
b) P (1 ≤ Y ≤ 1.2) = dy = = = 0.091
8 8 1 8
1

Z∞ Z2 Z2 2
3y 2 3y 3 3y 4 3 · 16 3
c) E(Y ) = µ = y · f (y) dy = y· dy = dy = = = = 1.5
8 8 32 0 32 2
−∞ 0 0

Al aplicar la observación 3.68 para calcular la varianza se tiene:


Z∞ Z2 Z2 4
2 2 2 3y
2 3y 3y 5 2 3 · 32 12
E(Y ) = y · f (y) dy = y · dy = dy = = = = 2.4,
8 8 40 0 40 5
−∞ 0 0

3
por consiguiente, σ 2 = V (Y ) = E(Y 2 ) − µ2 = 2.4 − 1.52 = 20 = 0.15

3.15. Ejercicios de media y varianza de v.a.c.


1. El tiempo de falla (en cientos de horas) para un (
0 si y < 0
transistor, es una variable aleatoria continua Y F (y) = 1
1 − y2 si y ≥ 0.
con función de distribución dada por: e

a) Determine la función de densidad f (y).


b) Encuentre la probabilidad de que el transistor opere durante al menos 200 horas.
c) Si se sabe que el transistor funciona como máximo 200 horas, halle la probabilidad
de que el transistor dure más de 100 horas.
(
cy(1 − y) si 0 ≤ y ≤ 1
2. Suponga que Y tiene función de densidad f (y) =
0 en otro caso.
a) Encuentre el valor de c que hace de f (y) una función de densidad de probabilidad.
b) Calcule las probabilidades: i) P (0.4 ≤ Y ≤ 1) ii) P (0.4 < Y < 1)
iii) P (Y ≤ 0.4 | Y ≤ 0.8) iv) P (Y < 0.4 | Y < 0.8)

3. Con base en pruebas extensas, el fabricante de una lavadora determinó que el tiempo
Y (en años) para que el electrodoméstico requiera una reparación mayor, se obtiene
mediante( la siguiente función de densidad de probabilidad
1
si y ≥ 0
f (y) = 4ey/4
0 en otro caso.
a) Verifique que f (y) es una función de densidad, y grafíquela.
b) Los expertos afirman que la lavadora es una ganga si no requiere reparaciones
serias antes de 6 años. De su punto vista luego de hallar la probabilidad P (Y > 6).
c) Obtenga la probabilidad de que este tipo de lavadora requiera una reparación
mayor durante el primer año.
3.15. EJERCICIOS DE MEDIA Y VARIANZA DE V.A.C. 117

(
cy si 0 ≤ y ≤ 2
4. Suponga que Y posee función de densidad f (y) =
0 en otro caso.
a) Encuentre el valor de c que hace de f (y) una función de densidad. Grafique f (y).
b) Use f (y) para hallar la probabilidad P (1 ≤ Y ≤ 2).
c) Encuentre la función de distribución F (y) y trace su gráfica.
d) Emplee la función de distribución F (y) para calcular P (1 ≤ Y ≤ 2).
5. Una gasolinera opera dos bombas, cada una de las cuales puede bombear hasta 10 000
galones de gasolina por mes. La cantidad total de gasolina bombeada en un mes es
una v.a.c. Y (medida en 10 000 galones) con una función de densidad dada por
 a) Verifique que f (y) es una función de densidad y
y
 si 0 ≤ y < 1 grafíquela.
f (y) = 2 − y si 1 ≤ y ≤ 2 b) Encuentre F (y) y trace su gráfica.
c) Obtenga la probabilidad de que la gasolinera

0 en otro caso.

bombee entre 8 000 y 12 000 galones en el mes de mayo.
d) Dado que la gasolinera bombeó más de 10 000 galones en un mes particular,
encuentre la probabilidad de que haya bombeado más de 15 000 galones en tal mes.
(
c(2 − y) si 0 ≤ y ≤ 2
6. Suponga que Y posee función de densidad f (y) =
0 en otro caso.
a) Halle el valor de c que hace de f (y) una función de densidad. Grafique f (y).
b) Emplee f (y) para hallar la probabilidad P (1 ≤ Y ≤ 2).
c) Encuentre la función de distribución F (y) y trace su gráfica.
d) Use la función de distribución F (y) para calcular P (1 ≤ Y ≤ 2).
e) Obtenga la media y la varianza de Y .
7. Sean a y b constantes y sea Y una v.a.c. con media µ y varianza σ 2 .
Demostrar lo siguiente:
a) E(aY + b) = aµ + b
b) V (aY + b) = a2 σ 2
8. Para ciertas muestras de minerales, la proporción Y de impurezas por muestra es una
v.a.c. con media µ y varianza σ 2 . El valor (en dólares) de cada muestra es W = 5 − Y2 .
Obtenga la media y la varianza del costo de cada muestra W .

9. Sea F (Y ) la función de distribución de la v.a.c. Y . 
 0 si y ≤ 0
a) Obtenga la función de densidad f (y).

y

si 0 ≤ y < 2
b) Calcule las siguientes probabilidades: F (y) = y82
i) P (1 ≤ Y ≤ 3) ii) P (Y ≤ 1.5)


 16 si 2 ≤ y ≤ 4

1 si y ≥ 4.
iii) P (Y ≥ 1.5) iv) P (Y ≥ 1|Y ≤ 3)
118 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

10. La proporción de tiempo diario que todas las cajas de ( un supermercado están
cy 2 (1 − y)4 si 0 ≤ y ≤ 1
ocupadas es una v.a.c. Y con función de densidad f (y) =
0 en otro caso.
a) Determine el valor de c que hace de f (y) una función de densidad.
b) Encuentre el valor esperado de Y .
11. La radiación solar diaria en el estado de Florida,
( durante un mes cualquiera, tiene
3
(y − 2)(6 − y) si 2 ≤ y ≤ 6
una función de densidad dada por f (y) = 32 con
0 en otro caso.
mediciones en cientos de calorias. Verifique que f (y) es una función de densidad y
encuentre la radiación solar diaria esperada para el mes de noviembre.
( √
c y si 0 ≤ y ≤ 1
12. Suponga que Y tiene función de densidad f (y) =
0 en otro caso.
a) Encuentre el valor de c que hace de f (y) una función de densidad de probabilidad.
b) Calcule las probabilidades: i) P (0.3 ≤ Y ≤ 0.6) ii) P (Y < 0.5)
c) Determine el valor esperado y la varianza de Y .

( cierta medicina de prescripción, es una v.a.c. Y


13. La vida útil, en días, para frascos de
20 000
3 si y ≥ 0
con función de densidad f (y) = (y+100)
0 en otro caso.
a) Verifique que f (y) es una función de densidad.
b) Encuentre la vida útil esperada para un frasco de dicha medicina.
c) Obtenga la probabilidad de que un frasco de esta medicina tenga una vida útil
de: i) al menos 200 días; ii) entre 80 días y 120 días.
14. El tiempo (en horas) para que un radar detecte entre conductores sucesivos a aquellos
que exceden los límites de velocidad, es una v.a.c. con función de distribución
( Obtenga la probabilidad de que el tiempo que pase
0 si y < 0 para que el radar detecte entre conductores sucesivos
F (y) = 1
1− si y ≥ 0. a los que exceden los límites de velocidad sea menor
e8y
que 12 minutos
a) empleando la función de distribución F (y);
b) utilizando la función de densidad f (y).
15. La proporción de personas que responden a cierta encuesta enviada por correo es una
v.a.c. Y con función de densidad
( a) Verifique que f (y) es una función de densidad.
2y+4
5 si 0 ≤ y ≤ 1 b) Calcule la probabilidad de que por lo menos la
f (y) =
0 en otro caso cuarta parte de las personas contactadas respondan a
este tipo de encuesta.
3.16. DISTRIBUCIÓN UNIFORME CONTINUA 119

c) Encuentre la probabilidad de que por lo menos la cuarta parte de las personas


contactadas, pero menos de la mitad de las personas contactadas respondan a este
tipo de encuesta.

16. Un factor importante en el combustible sólido para proyectiles es la distribución del


tamaño de las partículas. A partir de datos históricos de producción se determinó que
la distribución
( del tamaño (en micras) de las partículas viene dado por
3
4 si y ≥ 1
f (y) = y
0 en otro caso.
a) Verifique que f (y) es una función de densidad, y grafíquela.
b) Use f (y) para hallar la probabilidad de que una partícula tomada al azar del
combustible fabricado sea mayor que 4 micras.
c) Obtenga la función de distribución F (y) y grafíquela.
d) Emplee F (y) para hallar la probabilidad de que una partícula tomada al azar del
combustible fabricado sea mayor que 4 micras.

3.16. Distribución uniforme continua


En estadística la distribución continua más simple es la distribución uniforme continua,
que se caracteriza por una función de densidad horizontal en un intervalo cerrado [a, b],
esto implica que la probabilidad de que la v.a.c. caiga en subintervalos de igual longitud
sea la misma.
Aunque las aplicaciones de la distribución uniforme continua no son tan abundantes como
las aplicaciones de otras distribuciones, resulta apropiado para un estudiante comenzar el
estudio de las distribuciones continuas con esta distribución.

3.70 Definición. Si a < b se dice que


una variable aleatoria continua Y tiene
distribución uniforme en el intervalo [a, b]
si y solo si, la función de densidad de Y es
 1

si a ≤ y ≤ b
f (y) = b − a
0 en otro caso.

3.71 Teorema. Si a<b y Y es una variable aleatoria uniformemente distribuida en


a+b (b − a)2
el intervalo [a, b], entonces E(Y ) = µ = y V (Y ) = σ 2 = .
2 12
120 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

3.72 Ejemplo. Un bus escolar siempre llega a cierto paradero entre las 6 : 00 a.m. y las
6 : 10 a.m. la probabilidad de que el bus llegue en cualquier subintervalo de tiempo es solo
proporcional a la longitud del subintervalo, es decir, sigue una distribución uniforme.
Sea Y el tiempo que un niño de esta ruta debe esperar si llega a las 6 : 00 a.m. al paradero.

a) Encuentre la función de densidad de probabilidad f (y).


b) Calcule la probabilidad de que el bus escolar pase entre las 6 : 00 a.m. y las 6 : 02 a.m.
c) Obtenga la probabilidad de que el niño deba esperar por lo menos 6 minutos.
d) Halle la probabilidad de que el bus escolar pase entre las 6 : 07 a.m. y las 6 : 09 a.m.
e) Determine el valor esperado y la varianza de esta variable aleatoria.
a) La ( función de densidad es
1
si 0 ≤ y ≤ 10
f (y) = 10
0 en otro caso.
Z2 2
1 y 2
b) P (0 ≤ Y ≤ 2) = dy = = = 0.2
10 10 0 10
0
Z10 10
1 y 10 − 6
c) P (Y ≥ 6) = dy = = = 0.4
10 10 6 10
6
Z9 9
1 y 9−7
d) P (7 ≤ Y ≤ 9) = dy = = = 0.2
10 10 7 10
7

0 + 10
e) El valor esperado es E(Y ) = µ = = 5 y la varianza viene dada por la
2
(10 − 0)2 100 25
expresión V (Y ) = σ 2 = = = = 8.333.
12 12 3
3.73 Ejemplo. Suponga que el tiempo máximo que se puede reservar una gran sala de
conferencias de un centro de convenciones son cuatro horas.
Como es natural, frecuentemente se presentan conferencias extensas y cortas, de hecho, se
puede suponer que la duración Y (en horas) de una conferencia tiene distribución uniforme
en el intervalo [0, 4].
a) Encuentre la función de densidad de probabilidad f (y).
b) Calcule la probabilidad de que una conferencia presente una duración a lo sumo de tres
horas.
c) Obtenga la probabilidad de que una conferencia dure entre una y dos horas y media.
d) Determine el valor esperado y la varianza de esta variable aleatoria.
3.17. EJERCICIOS DE DISTRIBUCIÓN UNIFORME CONTINUA 121

(
1
4 si 0 ≤ y ≤ 4
a) La función de densidad es f (y) =
0 en otro caso.
Z3 3
1 y 3
b) P (0 ≤ Y ≤ 3) = dy = = = 0.75
4 4 0 4
0
Z2.5 2.5
1 y 2.5 − 1
c) P (1 ≤ Y ≤ 2.5) = dy = = = 0.375
4 4 1 4
1
0+4 (4 − 0)2 16 4
d) E(Y ) = µ = =2 V (Y ) = σ 2 = = = = 1.333.
2 12 12 3

3.17. Ejercicios de distribución uniforme continua

1. El cambio en la profundidad de un río de (un día al siguiente (medida en pies), es una


c si − 1 ≤ y ≤ 2
v.a.c. con función de densidad f (y) =
0 en otro caso.
a) Halle el valor de c que hace de f (y) una función de densidad.
b) Obtenga la función de distribución F (y).
c) Calcule el valor esperado y la varianza de esta variable aleatoria.

2. En cierto banco ubicado en el centro de la ciudad siempre hay fila que dura entre 10
y 40 minutos, y el tiempo de espera es una v.a.c. uniforme.
a) Determine la función de densidad f (y).
b) Obtenga la probabilidad de tener que esperar más de media hora.
c) Halle la probabilidad de esperar exactamente 15 minutos.
d) Calcule el valor esperado y la varianza de esta variable aleatoria.

3. La temperatura Y (en grados Celsius) a la que se conecta


( un interruptor controlado
1
si 59 ≤ y ≤ 61
por un termostato tiene función de densidad f (y) = 2
0 en otro caso.
a) Halle la probabilidad de que un interruptor se conecte a más de 60◦ C.
b) Encuentre la media y la varianza.

4. Al estudiar bajas cotizaciones para contratos de embarques, una empresa fabricante


de microcomputadores encuentra que los contratos interestatales tienen bajas cotiza-
ciones que están uniformemente distribuidas entre 20 y 25, en unidades de miles de
dólares.
a) Encuentre la probabilidad de que la baja cotización en el siguiente contrato in-
terestatal i) esté por debajo de $ 22 000; ii) sea de más de $ 24 000.
b) Encuentre el valor esperado de los contratos de bajas cotizaciones.
122 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

5. El tiempo de ciclo para camiones que transportan concreto al lugar de construcción


de una carretera está uniformemete distribuido en el intervalo de 50 a 70 minutos.
Encuentre la probabilidad de que el tiempo de ciclo exceda de 65 minutos si se sabe
que el tiempo de ciclo excede de 55 minutos.

6. El perímetro de un círculo de radio r es igual a 2π r. Entre los productos de una


empresa de metalmecánica se encuentran láminas circulares cuyo radio (en
centímetros) está uniformemente distribuido en el intervalo [14, 20]. Obtenga la media
y la varianza del perímetro de tales láminas circulares.

3.18. Distribución normal


La distribución de probabilidad continua más importante es la distribución normal o
distribución gaussiana (en honor a Karl Friedrich Gauss 1777-1855 quien realizó la
deducción de su ecuación). Su gráfica denominada curva normal es aquella con forma de
campana, la cual describe aproximadamente muchos fenómenos que ocurren en la
naturaleza, la industria y la investigación.

3.74 Definición. La función de densidad de la variable aleatoria normal X con media µ


y varianza σ 2 es:
1 1 2
n(x; µ, σ) = √ e− 2σ2 (x−µ) , −∞ < x < ∞.
2πσ
Una vez que se especifican µ y σ, la curva normal queda determinada por completo.

Área bajo la curva normal

La curva de cualquier distribución continua de probabilidad o función de densidad, se


construye de manera tal que el área bajo la curva limitada por las dos ordenadas x = x1
y x = x2 sea igual a la probabilidad de que la variable aleatoria X tome un valor entre
x = x1 y x = x2 .
3.18. DISTRIBUCIÓN NORMAL 123

Por consiguiente, para la curva normal


Z x2
p(x1 < X < x2 ) = n(x; µ, σ) dx
x1
Z x2 1 2
= √1
2πσ
e− 2σ2 (x−µ) dx
x1

es representada por el área sombreada.

La dificultad que se encuentra al resolver las integrales de funciones de densidad normal


exige tabular las áreas de la curva normal para una referencia rápida. Sin embargo, sería
inútil tratar de establecer tablas separadas para cada posible valor de µ y σ.
Por fortuna, podemos transformar todas las observaciones de cualquier variable aleatoria
normal X en un nuevo conjunto de observaciones de una variable aleatoria normal Z con
media 0 y varianza 1.
X −µ
Esto se puede realizar mediante la transformación Z= .
σ
x−µ
Siempre que X tome un valor x, el correspondiente valor Z es dado por z = .
σ
Por tanto, si X cae entre los valores x = x1 y x = x2 , la variable aleatoria Z caerá
x1 − µ x2 − µ
entre los valores z1 = y z2 = .
σ σ
En consecuencia podemos establecer la identidad p(x1 < X < x2 ) = p(z1 < Z < z2 )
siendo Z una variable aleatoria normal con media 0 y varianza 1.

3.75 Definición. La variable aleatoria normal con media 0 y varianza 1 se llama la


distribución normal estándar.

Ahora hemos reducido el número requerido de tablas de áreas de la curva normal a solamente
una: la distribución normal estándar. La tabla estadística de esta distribución, corresponde
a p(Z < z) para valores de z que van de −3.49 a 3.49.

Para ilustrar el uso de esta tabla encontremos la


probabilidad de que Z sea menor que 0.62.
Para ello localizamos el valor de z igual a 0.6 en
la columna de la izquierda, luego nos movemos
a lo largo del renglón superior hasta la columna
bajo 0.02, al cruzar la respectiva fila y columna
podemos ver el número 0.7324, es decir,
p(Z < 0.62) = 0.7324.
124 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Para calcular un valor z correspondiente a un área determinada se invierte el proceso, por


ejemplo, el valor de z que deja un área a la izquierda igual a 0.5910, es z = 0.23.

3.76 Ejemplo. Dada una distribución


normal estándar, calcule el área bajo la
curva que se localiza:

a) a la derecha de z = 1.84

b) entre z = −1.97 y z = 0.86.

a) En la figura de la izquierda se aprecia que el área a la derecha de z = 1.84 es igual


a 1 menos el área a la izquierda de 1.84, esto es lo que dice la ley del complemento.
De esta manera p(Z > 1.84) = 1 − p(Z ≤ 1.84) = 1 − 0.9671 = 0.0329.

b) El área en la figura b) entre z = −1.97 y z = 0.86 es igual al área a la izquierda de


z = 0.86 menos el área a la izquierda de z = −1.97.
La tabla de la normal estándar nos da estos valores:
p(−1.97 < Z < 0.86) = p(Z < 0.86) − p(Z < −1.97)
= 0.8051 − 0.0244 = 0.7807.

3.77 Ejemplo. Dada una distribución normal


estándar, determine el valor de k tal que:

a) p(Z > k) = 0.3015


b) p(k < Z < −0.18) = 0.4197
c) p(−k < Z < k) = 0.82

a) En la figura de la izquierda vemos que el valor de k que deja un área de 0.3015 a la


derecha, debe dejar un área de 0.6985 a la izquierda. Consultamos la tabla de la normal
para hallar el valor de k que cumple p(Z < k) = 0.6985, se obtiene k = 0.52.

b) En la tabla de la normal estándar se observa que el área total a la izquierda


de −0.18 es 0.4286. En la figura de la derecha se aprecia que el área entre k y −0.18
es 0.4197, de manera que el área a la izquierda de k debe ser 0.4286 − 0.4197 = 0.0089.
De todo esto se concluye que el valor de k debe ser k = −2.37.
3.18. DISTRIBUCIÓN NORMAL 125

c) La parte central de la curva abarca un área


de 0.82, por simetría, el área entre 0 y k debe ser
0.41, esto es,
p(−k < Z < k) = 2p(0 < Z < k) = 0.82 =⇒
p(0 < Z < k) = 0.41, esta ecuación imlica lo
siguiente: p(0 < Z < k) =
p(Z < k) − p(Z < 0) = 0.41 =⇒
p(Z < k) − 0.5 = 0.41 =⇒
p(Z < k) = 0.5 + 0.41 = 0.91 −k 0 k z
y por tanto k = 1.34.

3.78 Ejemplo. Dada una variable aleatoria


X que tiene una distribución normal con
µ = 50 y σ = 10, determine la probabilidad de
que X tome un valor entre 45 y 62.

Los valores de z que corresponden a


x1 = 45 y x2 = 62 son

45 − 50 62 − 50
z1 = = −0.5 y z2 = = 1.2 respectivamente, por tanto:
10 10
p(45 < X < 62) = p(−0.5 < Z < 1.2) = p(−0.5 < Z < 1.2) =

p(Z < 1.2) − p(Z < −0.5) = 0.8849 − 0.3085 = 0.5764.

3.79 Ejemplo. Cierto tipo de batería de


almacenamiento dura en promedio 3 años,
con una desviación estándar de 0.5 años.
Suponga que la duración de la batería
presenta comportamiento normal.
Calcule la probabilidad de que una batería
determinada dure menos de 2.3 anõs.

Se necesita la probabilidad p(X < 2.3). Primero hallamos el correspondiente valor z para
luego acudir a la tabla.
2.3 − 3
z1 = = −1.4 =⇒ p(X < 2.3) = p(Z < −1.4) = 0.0808.
0.5
126 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Uso de la curva normal a la inversa


En ocasiones se pide calcular el valor de z correspondiente a una probabilidad
especificada. Por conveniencia se elige el valor z que corresponde a la probabilidad
tabular más cercana a la especificada (o como el punto medio cuando cae
exactamente en la mitad de dos valores adyacentes de la tabla).
x−µ
Luego de determinar z se encuentra el valor de x reacomodando la fórmula z = para
σ
obtener x = σz + µ

3.80 Ejemplo. Dada una distribución


normal con µ = 40 y σ = 6 encuentre el
valor de x que deja
a) el 45 % del área a la izquierda
b) el 14 % del área a la derecha.

a) Primero se requiere un valor de z tal que p(Z < z) = 0.45, al acudir a la tabla de la
normal encontramos p(Z < −0.13) = 0.4483 y p(Z < −0.12) = 0.4522; el valor
más cercano a 0.45 es 0.4483 y así z = −0.13. Por consiguiente
x = (6)(−0.13) + 40 = 39.22
b) El valor de z que deja un área de 0.14 a la derecha debe dejar un área de 0.86 a la
izquierda, es decir, p(Z < z) = 0.86, la tabla de la normal nos dice que
p(Z < 1.08) = 0.8599; de esto se sigue que z = 1.08 y por tanto
x = (6)(1.08) + 40 = 46.48
3.81 Ejemplo. Al diseñar la ubicación de un reproductor de CD en un nuevo modelo de
automóviles, los ingenieros deben considerar el alcance frontal del conductor.
Los diseñadores deciden que el reproductor debe ubicarse de manera que esté dentro del
alcance del 95 % de las mujeres.
Las mujeres tienen alcances frontales distribuidos normalmente, con una media de 27
pulgadas y una desviación estándar de 1.3 pulgadas.
Calcule el alcance frontal de las mujeres que separa el 95 % superior del resto.

La tabla de la normal nos arrroja áreas a izquierda.


Un alcance frontal que separe al 95 % superior,
dejará un 5 % a la izquierda, así debemos buscar
un valor de z tal que p(Z < z) = 0.05.
La tabla nos indica que z = −1.645.
Finalmente encontramos x :
x = 27 − (1.3)(1.645) = 24.8615
3.19. EJERCICIOS DE DISTRIBUCIÓN NORMAL 127

3.82 Ejemplo. Se ha realizado un examen de estadística sobre 100 puntos. Las califica-
ciones vienen dadas en números enteros y siguen una curva que tiene distribución normal.
La calificación promedio es 74 y la desviación estándar es 7.
Si el 12 % de la clase obtiene calificaciones excelentes diga cual es la calificación excelente
más baja y cual es la calificación buena más alta.

Una calificación que deje un área del 12 % a la


derecha, dejará un área del 88 % a la izquierda.
Buscamos un valor de z tal que p(Z < z) = 0.88,
tal valor es z = 1.175.
Así: x = 74 + (7)(1.175) = 82.225.
Como las calificaciones asumen valores enteros,
el menor valor que puede tomar una calificación
excelente es 83 y la mayor calificación buena es
82.

3.19. Ejercicios de distribución normal

1. Las barras de pan de centeno que venden en una cafetería de la Universidad Libre
tienen una longitud promedio de 30 cm y una desviación estándar de 2 cm. Si las
longitudes están distribuidas normalmente, ¿qué porcentaje de las barras de pan son:
a) más largas que 31.7 cm?
b) de entre 29.3 cm y 33.5 cm de longitud?
a) más cortas que 25.5 cm?

2. La puntuación de una persona en la prueba de coeficiente intelectual (CI) debe estar en


el 2 % superior para ser admitido en un curso avanzado de inteligencia artificial. Si las
puntuaciones de CI tienen una distribución normal con una media de 100 y desviación
estándar de 15, ¿cuál debe ser la puntuación mínima de una persona (aproximada al
entero más cercano) para que pueda ser admitido en el curso avanzado de inteligencia
artificial?

3. Dado que Z es una variable normal estándar, halle k en cada una de las
siguientes situaciones:
a) el área a la izquierda de k es 0.2119
b) el área entre −k y k es 0.9030
c) el área a la derecha de k es 0.6915
d) el área a la izquierda de k es 0.9948
e) el área entre −k y k es 0.2052
128 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

4. Un empleado promedio estadounidense pasa en promedio 77 horas mensuales co-


nectado a internet durante las horas de trabajo. Suponga que tales tiempos están
distribuidos normalmente, con una desviación estándar de 20 horas. Un trbajador es
clasificado como intensivo si se encuentra en el 20 % superior de uso. ¿Qué tiempo
(aprximado a la hora más cercana) tiene un empleado que haber estado conectado a
internet para ser considerado un usuario intensivo?

5. Sea X es una variable aleatoria normal con media 30 y desviación estándar 5, halle
el valor de x = k en cada una de las siguientes situaciones:
a) el área a la izquierda de k es 0.3264
b) el área entre 0 y k es 0.4750
c) el área a la derecha de k es 0.1314
d) el área a la izquierda de k es 0.6700
e) el área entre −k y k es 0.9030

6. El precio promedio de las acciones que pertenecen al grupo S&P es de $ 30 (dólares)


y la desviación estándar es de $ 8.2. Suponga que los precios de las acciones están
distribuidos normalmente. ¿A partir de qué valor debe ser el precio de la acción
de una empresa para que esté entre el 10 % de las mejores empresas? (aproxime al
centécimo más cercano).

7. Si un conjunto de observaciones se distribuye de manera normal, ¿qué porcentaje de


éstas difieren de la media en:
a) más de 1.3σ? b) menos de 0.52σ? (use propiedades del valor absoluto).

8. Suponga que los pesos de los hombres se distribuyen de manera normal, con media
de 172 libras y una desviación estándar de 29 libras. ¿Que peso separa el 99.5 % de
los hombres menos pesados, del 0.5 % de los hombres más pesados?

9. Una empresa de material eléctrico fabrica


bombillas de luz que tienen una duración
que distribuye normalmente, con una duración
promedio de 800 horas y una desviación
estándar de 40 horas.
Encuentre la probabilidad de que una
bombilla funcione entre 778 y 834 horas.

10. Realice el ejemplo 3.81 asumiendo que los diseñadores deciden que el
reproductor de CD debe ubicarse de manera que esté dentro del alcance del 90 %
de las mujeres.
3.20. APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL 129

11. Una máquina expendedora de bebidas gaseosas se regula para que sirva un promedio
de 200 militros (ml) por vaso. Si la cantidad de bebida se distribuye normalmente
con una varianza de 225 ml,
a) ¿qué fracción de los vasos contendrá más de 224 ml?
b) ¿cuál es la probabilidad de que un vaso contenga entre 191 ml y 209 ml?
c) ¿cuántos vasos probablemente se derramarán si se utilizan vasos de 230 ml para
las siguientes 1000 bebidas?

12. Coonsidere el ejemplo 3.82. Encuentre el sexto de-


cíl o equivalentemente el percentil 60.
Recuerde que el sexto decil es el valor de x que
deja 60 % del área a la izquierda.

13. Un investigador informa que unos ratones a los que primero se les restringen drásti-
camente sus dietas y después se les enriquecen con vitaminas y proteínas, vivirán en
promedio 40 meses. Si suponemos que las vidas de tales ratones distribuyen normal-
mente con una desviación estándar de 6.3 meses, calcule la probabilidad de que un
ratón de estos viva:
a) más de 32 meses. b) menos de 28 meses. c) entre 37 y 49 meses.

14. Suponga que las mediciones de la corriente en una tira de alambre siguen una distri-
bución normal con una media de 10 miliamperes (mA) y una varianza de 4 mA2 .
a) Determine la probabilidad de que la medición exceda de 13 mA.
b) Encuentre la probabilidad de que una medición de la corriente esté entre 9 mA y
11 mA.
c) La corriente es excesiva si sus mediciones pertenecen al 2 % superior. ¿Cuál es el
mayor valor (en mA) que puede tomar la corriente para que no sea catalogada como
excesiva?

3.20. Aproximación normal a la distribución binomial

Sea X una variable aleatoria binomial con n intentos y probabilidad p de éxito.


La distribución de probabilidad de X se aproxima mediante el uso de una curva normal

con media µ = np y desviación estándar σ = npq.

Esta aproximación es adecuada siempre y cuando n sea grande y p no esté demasiado cerca
de 0 o 1. La aproximación normal a las probabilidades binomiales será adecuada si np ≥ 5
y nq ≥ 5.
130 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Debe tener cuidado de no excluir la mitad de los dos rectángulos de probabilidad de los
extremos cuando utilice la aproximación normal a la distribución binomial. Este ajuste,
llamado corrección de continuidad, ayuda a exlicar el hecho de que se está aproximan-
do una variable aleatoria discreta mediante una continua, el no hacerlo aleja bastante su
aproximación del verdadero valor. A continuación se enuncia el procedimiento a seguir.

Procedimiento para calcular probabilidades binomiales por medio de la


aproximación normal
Verifique las condiciones np ≥ 5 y nq ≥ 5. Luego calcule la media de la distribución

normal µ = np y la desviación estándar σ = npq.
Escriba la probabilidad en términos de X y localice el área apropiada en la curva.
Corrija el valor de X en ±0.5 para incluir todo el bloque de probabilidad para este
valor. Este paso es llamado corrección por continuidad.
Convierta los valores pertinentes de X en x ± 0.5 − np
z= √
valores de Z usando la transformación npq
Use la tabla de la distribución normal para calcular la probabilidad aproximada.

3.83 Ejemplo. Utilice la distribución normal para realizar una aproximación de la


probabilidad p(8 ≤ X ≤ 10) = p(8) + p(9) + p(10) para una variable aleatoria binomial con
n = 25 y p = 0.5. Compare esta aproximación con la probabilidad binomial exacta.

Verificamos: np = nq = (25)(0.5) = 12.5 ≥ p


5. La media y la desviación estándar son:

µ = np = (12)(0.5) = 12.5 y σ = npq = (25)(0.5)(0.5) = 2.5.
La probabilidad buscada corresponde al área de los tres rectángulos sombreados, centrados
en x = 8, 9 y 10. El área equivalente bajo la curva normal, aplicando la corrección por
continuidad, se encuentra entre x = 7.5 (el lado izquierdo del primer rectángulo) y x = 10.5
(el lado derecho del último rectángulo).

Ahora estandarizamos cada punto extremo del intervalo:


x−µ 7.5 − 12.5 x−µ 10.5 − 12.5
z= = = −2 y z= = = −0.8.
σ 2.5 σ 2.5
3.20. APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL 131

Con estos valores acudimos a la


tabla de la distribución normal
estándar y encontramos:
p(−2 < z < −0.8) =
0.2119 − 0.0228 = 0.1891

Al consultar la tabla de la distribución binomial con n = 25 y p = 0.5 obtenemos :


p(8 ≤ X ≤ 10) = p(X ≤ 10) − p(X ≤ 7) = 0.212 − 0.022 = 0.19.
El error en la aproximación es muy pequeño: |0.1891 − 0.19| = 0.0009.

3.84 Ejemplo. La confiabilidad de un fusible eléctrico es la probabilidad de que un fusible


escogido al azar de la producción, funcione bajo sus condiciones de diseño. Una muestra
aleatoria de 1000 fusibles se probó y se observaron x = 27 defectuosos. Calcule la probabi-
lidad aproximada de observar 27 o más defectuosos, suponiendo que la confiabilidad de un
fusible es 0.98.

La probabilidad de observar un fusible defectuoso es el complemento de la confiabilidad:


p = 1 − 0.98 = 0.02.
Verificamos las condiciones para aplicar la aproximación normal:
np = (1000)(0.02) = 20 ≥ 5 y nq = (1000)(0.98) = 980 ≥ 5.
Calculamos la media y la desviación estándar: p √

µ = np = (1000)(0.02) = 20 y σ = npq = (1000)(0.02)(0.98) = 19.6

La probabilidad de 27 o más fusibles defectuosos es


p(X ≥ 27) = p(27) + p(28) + p(29) + · · · + p(999) + p(1000)
El área normal empleada para aproximar p(X ≥ 27) es el área bajo la curva normal a la
derecha de 26.5 (corrección por continuidad ).
x−µ 26.5 − 20
El valor z correspondiente a x = 26.5 es: z = = √ = 1.47.
σ 19.6
Finalmente p(X ≥ 27) ≈ p(z ≥ 1.47) = 1 − 0.9292 = 0.0708.

3.85 Ejemplo. Una fábrica de gaseosas estaba completamente segura de que su marca
tenía el 10 % de participación en el mercado. Se tomó una muestra de 2500 consumidores
de gaseosas y 211 manifestaron su preferencia por la marca considerada. Si la cifra del 10 %
es correcta, encuentre la probabilidad de observar 211 o menos consumidores que prefieran
esta marca de bebidas gaseosas.
132 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Comprobamos que se puede aplicar la aproximación normal: np = (2500)(0.1) = 250 y


nq = (2500)(0.9) = 2250. Calculamos media: µ √
= np = (2500)(0.1) = 250
√ p
y desviación estándar: σ = npq = (2500)(0.1)(0.9) = 225 = 15.
La probabilidad de observar 211 o menos consumidores que prefieran esta marca es
p(X ≤ 211) = p(0) + p(1) + p(2) + · · · + p(210) + p(211).

Corrección de continuidad: La aproximación normal a esta probabilidad es el área a la


izquierda de 211.5 bajo una curva normal con media de 250 y desviación estándar de 15.
x−µ 211.5 − 250
Hallando el valor z tenemos: z= = = −2.57.
σ 15
Entonces: p(X ≤ 211.5) ≈ p(z ≤ −2.57) = 0.0051.

Recordemos que como la probabilidad de observar 211 o menos éxitos en 1000 ensayos es
demasiado pequeña entonces el hecho de observar 211 éxitos se clasifica como un resultado
poco común. Al complementar esta información con la regla del suceso poco común
podemos concluir que el supuesto del 10 % de participación del mercado a lo mejor es
equivocado y probablemente sea menor.

3.21. Ejercicios de aproximación normal a la binomial

1. Sea X una variable aleatoria binomial con n = 15 y p = 0.4. Encuentre las siguientes
probabilidades mediante la aproximación de la normal, luego consultando la tabla de
la binomial y encuentre la distancia entre estas dos medidas.
a) p(x ≥ 6) b) p(X > 6) c) p(x = 6)

2. Investigadores de la Universidad Libre y del instituto nacional de salud informan


que el 75 % de las personas cree que los tranquilizantes funcionan muy bien para
lograr que una persona esté más tranquila en épocas de pandemia. Apoyado en la
aproximación de la normal diga cual es la probabilidad de que de las próximas 80
personas entrevistadas:
a) por lo menos 50 tengan esta opinión.
b) a lo sumo 56 tengan esta opinión.
c) exactamente 61 personas opinen de esta manera.

3. Sea X una variable aleatoria discreta binomial con n = 100 y p = 0.2. Encuentre las
aproximaciones normales para las siguientes probabilidades:
a) p(x > 22) b) p(x ≥ 22) c) p(19 < X < 25) d) p(19 ≤ X ≤ 25)
3.21. EJERCICIOS DE APROXIMACIÓN NORMAL A LA BINOMIAL 133

4. Se lanza una moneda 400 veces, utilice la aproximación de la normal para calcular la
probabilidad de obtener:
a) entre 185 y 210 caras.
b) exactamente 205 caras.
c) menos de 176 o más de 227 caras.
5. Sea X una variable aleatoria binomial con n = 25 y p = 0.2.
a) Emplee la tabla de la distribución binomial para determinar p(4 ≤ X ≤ 6).
b) Utilice la tabla de la distribución normal para hallar p(4 ≤ X ≤ 6).
c) Halle la diferencia entre estas dos probabilidades, note que se tiene una buena
aproximación aún cuando np = 5.
6. La décima parte de la producción de una fábrica corresponde a de artículos defec-
tuosos. Se seleccionan al azar 200 artículos producidos por la fábrica. Mediante la
aproximación de la normal determine la probabilidad de que el número de elementos
defectuosos:
a) exceda los 26.
b) sea menor que 16.
c) sea precisamente 19.
7. Sea X una variable aleatoria binomial con n = 20 y p = 0.3. Encuentre las siguientes
probabilidades mediante la aproximación de la normal y también usando la tabla de
la binomial. Determine la distancia entre estos dos valores.
a) p(x = 5) b) p(X ≥ 7) c) p(x < 4)
8. El 20 % de los residentes en Barranquilla prefieren una carcasa blanca para para su
teléfono celular. Use la aproximación de la normal para estimar la probabilidad de
que, de los siguientes 1000 teléfonos vendidos en Barranquilla:
a) precisamente 200 tengan carcasa blanca.
b) entre 170 y 185 tengan carcasa blanca.
c) al menos 210 pero no más de 225 posean carcasa blanca.
9. Un paciente tiene 0.9 de probabilidad de recuperarse de una delicada operación de
corazón. Use la aproximación de la normal para estimar la probabilidad de que de los
siguientes 100 pacientes que se someten a esta operación
a) sobrevivan entre 84 y 95 pacientes.
b) sobrevivan menos de 86 pacientes.
10. Un par de dados se lanza 180 veces. Por medio de la aproximación de la curva normal
estime la probabilidad de que se observe un siete:
a) por lo menos 25 veces.
b) entre 33 y 41 veces.
c) exactamente 7 veces.

También podría gustarte