Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Para llevar a cabo satisfactoriamente esta labor, los ingenieros desempeñan una tarea
primordial, puesto que ellos son los encargados de diseñar nuevos productos, hacer los
cálculos necesarios para el desarrollo del producto, desarrollar nuevos procesos de
fabricación, así como mejorar los sistemas existentes.
1
2 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
El objetivo de la primer parte del curso es presentar las técnicas más comunes de la
estadística descriptiva: la rama de la estadística relacionada con la descripción de
conjuntos de datos tanto de muestras como de poblaciones. Antes de esto
debemos introducir algunas definiciones propias del lenguaje estadístico.
1.1 Definición. Una variable es una característica que cambia con el tiempo o con
diferentes individuos u objetos de estudio.
Por ejemplo, la temperatura en Bogotá es una variable que cambia con el tiempo. Por otra
parte, la afiliación religiosa, el origen étnico, la estatura, la edad o el peso son variables que
cambian con cada individuo elegido.
1.2 Definición. Una unidad experimental es el individuo u objeto sobre el cuál se mide
una variable. Una medición o dato se obtiene cuando se mide una variable sobre una
unidad experimental.
Si se genera una medición por cada unidad experimental en todo el conjunto, los datos
resultantes constituyen la población de interés. Cualquier subconjunto más pequeño de
datos es una muestra.
1.3 Definición. Una población es el conjunto de todos los datos de interés para el estudio
realizado.
1.4 Definición. Una muestra es un subconjunto de datos elegidos de la población de
interés.
1.5 Definición. El censo es el recuento de datos estadísticos sobre toda una población
específica, de manera que se puedan conocer algunas características de interés.
Los datos que suelen recogerse en un censo son edad, género, nivel de educación, acceso a
servicios básicos, ingresos mensuales, características de la vivienda habitada, entre otros.
Pese a su utilidad los censos no suelen realizarse con tanta frecuencia debido al costo que
implica su realización.
1.6 Definición. La encuesta es un instrumento para recoger información cualitativa y/o
cuantitativa de una población estadística. Para ello, se elabora un cuestionario, cuyos datos
obtenidos son procesados con métodos estadísticos.
Para realizar una encuesta, el investigador debe elaborar un formulario de preguntas que
dependen de los objetivos del estudio, tal formulario o cuestionario se aplica normalmente
a una muestra representativa.
4 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
1.8 Definición. Un estadístico es una medición numérica que describe algunas caracte-
rísticas de una muestra.
Con base en una muestra de 900 ejecutivos encuestados, se encontró que el 45 % de ellos
no contrataría a alguien con un error ortográfico en su solicitud de empleo. Esta cifra del
45 % es un estadístico, ya que está basada en una muestra.
1.9 Definición. Las variables cualitativas miden una cualidad o característica en cada
unidad experimental. Las variables cuantitativas miden una cantidad numérica en cada
unidad experimental.
1.10 Definición. Una variable discreta puede tomar solo un número finito o contable
de valores. Una variable continua toma una cantidad de valores correspondientes a los
puntos de un intervalo de recta.
En este ejemplo se examinan cuatro variables, las unidades experimentales sobre las cuales
se miden las variables son cinco estudiantes de la Universidad Distrital.
1.5. EJERCICIOS SOBRE CONCEPTOS BÁSICOS 5
Las variables son: número de materias, estatura, carrera y género, note que cada una de
ellas cambia de un estudiante a otro.
La tercer variable es la carrera, que puede pertenecer a una de cuatro categorías: ambiental,
industrial, mecánica o sistemas. En este caso la variable es cualitativa, al igual que la cuarta
variable de interés, la cual indica el género del estudiante, esta variable solo puede caer en
una de dos categorías: femenino o masculino.
1. Un conjunto de datos consta de las edades que tenían al morir cada uno de los 41
presidentes de los Estados Unidos ahora desaparecidos.
a) ¿Este conjunto de datos es una muestra o una población?
b) ¿Cuál es la variable que se está midiendo?
c) ¿De qué tipo es la variable?
d) ¿Cuáles son las unidades experimentales sobre las cuales se mide la variable?
5. Identifique las unidades experimentales en las que se miden las siguientes variables:
a) Género de un estudiante.
b) Cantidad de errores en el examen final.
c) Edad de jubilación de un pensionado en Colombia.
d) Número de flores en una planta de azalea.
e) Color de un automóvil que entra al parqueadero de la Universidad Distrital.
7. La encuesta a los suscriptores de The Wall Street Journal formuló ciertas preguntas
sobre las características y los intereses de los lectores. Determine si cada una de las
siguientes preguntas proporciona datos cualitativos o cuantitativos.
a) ¿Qué edad tiene?
b) ¿Es usted hombre o mujer?
c) ¿Le interesan los deportes? Si es así indique cuáles.
d) ¿Cuántos años lleva en su empleo actual?
1.5. EJERCICIOS SOBRE CONCEPTOS BÁSICOS 7
9. La revista Foreign Affairs realizó una encuesta para desarrollar un perfil de sus
suscriptores. Se formularon las siguientes preguntas:
a) ¿Cuántas noches ha permanecido en un hotel en el último año?
b) ¿Donde adquiere sus libros? Se listaron tres opciones: Bookstore, Internet y Book
club.
c) ¿Posee o alquila vehículo de lujo? (Sí o no).
d) ¿Qué edad tiene?
Diga si cada pregunta proporciona datos cualitativos o cuantitativos.
11. El departamento de comercio informó que recibió las siguientes aplicaciones para el
premio nacional de calidad: 23 de las empresas de manufactura grandes, 18 de las
empresas de servicios grandes y 30 de las pequeñas empresas.
a) ¿El tipo de empresa es una variable cualitativa o cuantitativa?
b) ¿Qué porcentaje de las aplicaciones proviene de las pequeñas empresas?
c) ¿Qué porcentaje de las aplicaciones proviene de empresas de servicios?
8 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
Después de reunir los datos, se pueden consolidar y resumir para mostrar la siguiente
información:
Qué categorías de la variable se midieron.
Con qué frecuencia apareció cada categoría.
Para este propósito se puede construir una tabla estadística, con la cual se pueden apreciar
gráficamente los datos clasificados en las categorías.
De esta manera, la tabla estadística se compone de una lista de las categorías consideradas
junto a una medición de frecuencia con que aparece cada categoría. Para ello se dispone de
tres parámetros:
La frecuencia o número de datos en cada categoría.
la frecuencia relativa o proporción de datos en cada categoría.
El porcentaje de datos en cada categoría.
Las categorías para una variable cualitativa se eligen de manera que cada medición
pertenezca exactamente a una de ellas, una vez que se han clasificado y resumido los datos
en una tabla estadística, se puede usar una gráfica de sectores o una gráfica de barras para
mostrar la distribución de los datos.
Una gráfica de sectores también llamada diagrama de pastel, es una gráfica circular que
muestra cómo se distribuyen los datos entre las categorías. En una gráfica de barras se
exhibe la misma distribución de mediciones en categorías pero usando unas barras en las
cuales su altura determina con qué frecuencia se observa una categoría particular.
1.13 Ejemplo. Coke Classic, Diet Coke, Dr Pepper, Pepsi y Sprite son cinco bebidas
refrescantes muy conocidas en Estados Unidos. Los datos presentados en la siguiente tabla
representan la bebida favorita obtenida a partir de una encuesta telefónica.
1.6. RESUMEN DE DATOS CUALITATIVOS 9
Construya una tabla de frecuencias, una gráfica de barras y una gráfica de sectores para
este conjunto de datos cualitativos.
3. En orden alfabético, los seis apellidos más comunes en Estados Unidos son: Brown,
Davis, Johnson, Jones, Smith y Williams. Una muestra de 50 personas con uno de
estos apellidos proporcionó los siguientes datos:
Brown Williams Williams Williams Brown
Smith Jones Smith Johnson Smith
Davis Smith Brown Williams Johnson
Johnson Smith Smith Johnson Brown
Williams Davis Johnson Williams Johnson
Williams Johnson Jones Smith Brown
Johnson Smith Smith Brown Jones
Jones Jones Smith Smith Davis
Davis Jones Williams Davis Smith
Jones Johnson Brown Johnson Davis
1.7. EJERCICIOS SOBRE DATOS CUALITATIVOS 11
5. Una bolsa pequeña de maní confitado M & M contiene 21 dulces con los colores
descritos en la lista adjunta, elabore una tabla estadística de frecuencias y las gráficas
de barras y sectores de frecuencia relativa para este conjunto de datos cualitativos.
Café Rojo Amarillo Café Anaranjado Amarillo Verde
Rojo Anaranjado Azul Café Azul Verde Azul
Verde Café Azul Café Anaranjado Café azul
10. Un fabricante de Jeans tiene plantas en California (CA), Arizona (AZ) y Texas (TX).
Se selecciona al azar una muestra de 25 jeans de la base de datos computarizada y se
registra el estado en el que se produjo cada uno:
CA AZ AZ TX CA
CA CA TX TX TX
AZ AZ CA AZ TX
CA AZ TX TX TX
CA AZ AZ CA CA
a) ¿Cuál es la variable que se está midiendo?
b) Construya una gráfica de sectores de frecuencia relativa.
c) Elabore una gráfica de barras de frecuencia relativa.
d) ¿Qué proporción de jeans se fabricó en Texas?
e) ¿Qué estado produjo la mayoría de jeans de la muestra?
1.8. RESUMEN DE DATOS CUANTITATIVOS 13
Un histograma de frecuencia relativa es semejante a una gráfica de barras, que se usa para
resumir datos cuantitativos en lugar de datos cualitativos. Primero dividimos el intervalo
de mediciones, de las más pequeñas a las más grandes, en subintervalos de igual longitud,
que llamaremos clases. Si se ponen en columna los puntos de cada clase y se traza una barra
sobre cada columna se habrá creado un histograma de frecuencia relativa.
Si un dato coincide con un punto frontera de clase, se acostumbra usar el método de inclusión
izquierda: se incluye el valor si éste coincide con el extremo izquierdo de la clase y se excluye
si coincide con el extremo derecho.
Determine el número de clases, usualmente este número se encuentra entre 5 y 10. Entre
más datos se tengan, más clases serán necesarias.
Calcule el ancho de clase al dividir la diferencia entre los valores máximo y mínimo entre
el número de clases, y aproxime superiormente este valor hasta obtener un número entero
o un número con una cifra decimal.
Localice las fronteras de clase. La primer clase puede incluir la medición más pequeña.
En las otras clases aplique el método de inclusión izquierda.
Construya una tabla estadística que contenga las clases, sus frecuencias, frecuencias
relativas y si es pertinente las frecuencias acumuladas (estas frecuencias se mencionarán
a continuación).
Elabore un histograma similar a una gráfica de barras, ubicando los intervalos de clase en
el eje horizontal y las frecuencias relativas como las alturas de las barras.
14 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
Frecuencias acumuladas: estas frecuencias utilizan el número, los anchos y los límites de
clases desarrollados para las distribuciones de frecuencia, sin embargo, en lugar de indicar
la frecuencia de cada clase, la distribución de frecuencia acumulada exhibe el número de
datos con valores menores que la frontera superior de cada clase.
Tenga en cuenta que si n representa la cantidad de datos, en la última fila de la frecuencia
acumulada debe aparecer n, y en la última fila de la frecuencia relativa acumulada debemos
encontrar el número 1. El siguiente ejemplo ilustra el uso de estas distribuciones.
1.15 Ejemplo. Los datos de la tabla de la derecha 7.2 7.8 6.8 6.2 8.2
son los pesos de 30 bebés de gestación completa al 8.0 8.2 5.6 8.6 7.1
momento de nacer, nacidos en un hospital metropoli- 8.2 7.7 7.5 7.2 7.7
tano de California y registrados al décimo de libra más 5.8 6.8 6.8 8.5 7.5
cercano. Realice un histograma de frecuencia relativa 6.1 7.9 9.4 9.0 7.8
que describa el comportamiento de éstos datos. 8.5 9.0 7.7 6.7 7.7
Trabajemos con ocho clases. El rango (o intervalo) de datos es 9.4 − 5.6 = 3.8.
3.8
El ancho mínimo de clase es igual a = 0.475, para mayor comodidad aproximamos
8
este ancho de clase a 0.5 (se aproxima superiormente).
La primer clase empieza incluyendo el dato 5.6 y todos los datos menores a 5.6 + 0.5 = 6.1.
La segunda clase incluye los datos mayores o iguales a 6.1 y menores que 6.1 + 0.5 = 6.6.
La tercer clase incluye los datos mayores o iguales a 6.6 y menores que 6.6 + 0.5 = 7.1.
Continuando de esta manera llegamos a la octava clase, que incluye los datos mayores o
iguales a 9.1 y menores o iguales a 9.1 + 0.5 = 9.6.
Al ubicar cada dato en su respectiva clase podemos construir la tabla de frecuencias que
acompaña este ejemplo, en este caso se incluyen las frecuencias acumuladas para ilustrar
su uso, pero si no se solicitan no es necesario incluirlas.
La gráfica más simple para los datos cuantitativos es el diagrama de puntos. Para un
conjunto pequeño de mediciones, por ejemplo el conjunto 2, 6, 9, 3, 7, 6, se pueden trazar
los datos simplemente como puntos en un eje horizontal. Para el ejemplo mencionado, el
diagrama de puntos se ilustra a continuación.
Para un conjunto más grande de datos, como el de la siguiente figura, es posible que el
diagrama de puntos no dé información clara y que su interpretación sea difícil de realizar.
16 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
Para crear el tallo y las hojas se puede dividir cada observación en sus unidades y sus
decenas, el tallo es la cifra de las decenas, mientras que la hoja es la cifra de las unidades,
por ejemplo, para las zapatillas que costaron $ 68, el tallo es 6 y la hoja es 8. Los tallos
varían de 4 a 9 y se listan a la izquierda de la línea vertical.
La indicación que aclara que la unidad de hoja es 1, sirve para que el lector comprenda que
el tallo 7 y la hoja 5 representan el número 75.
1.8. RESUMEN DE DATOS CUANTITATIVOS 17
4 0 4 0
5 7 5 7
6 5 8 0 8 5 5 unidad de hoja = 1 6 0 5 5 5 8 8
7 0 0 0 5 0 4 0 5 0 0 reordenamiento =⇒ 7 0 0 0 0 0 0 0 4 5 5
8 8
9 0 5 9 0 5
A partir del diagrama de tallo y hoja se aprecia que el menor dato es 40, el mayor es 95, el
que más se repite es 70 que aparece siete veces, que el 65 aparece tres veces, etc.
En ciertas ocasiones el diagrama de tallo y hoja nos conduce a una gráfica con pocos tallos
y una gran cantidad de hojas dentro de cada tallo, para realizar un diagrama más práctico
y en el cuál se pueda apreciar la información de manera más clara, se pueden prolongar los
tallos al dividir cada uno en varias lineas, por lo general los tallos se dividen en una de dos
formas:
En dos líneas, con las hojas 0-4 en la primera línea y las hojas 5-9 en la segunda línea.
En cinco líneas, con hojas 0-1, 2-3, 4-5, 6-7 y 8-9 en las cinco líneas, respectivamente.
1.18 Ejemplo. Consideremos de nuevo el ejemplo 7.2 7.8 6.8 6.2 8.2
1.15 que nos habla del peso de 30 bebés al nacer. 8.0 8.2 5.6 8.6 7.1
En la tabla de la derecha se tienen de nuevo los datos. 8.2 7.7 7.5 7.2 7.7
Realizar el diagrama de tallo y hoja extendido, 5.8 6.8 6.8 8.5 7.5
dividiendo cada tallo en dos partes como lo indica la 6.1 7.9 9.4 9.0 7.8
primer viñeta del párrafo anterior. 8.5 9.0 7.7 6.7 7.7
Si se usa el punto decimal como línea divisoria entre el tallo y las hojas, tenemos solamente
cinco tallos, algunos con una gran cantidad de hojas haciendo el diagrama un poco tedioso
de interpretar. Al escribir cada tallo en dos renglones consecutivos vemos ocho tallos debido
a que la primera línea del tallo 5 y la segunda línea del tallo 9 están vacías, esto produce
una gráfica más descriptiva.
5 8 6 5 6 8
6 1 2 6 1 2
6 8 8 8 7 6 7 8 8 8
7 2 2 1 unidad de hoja = 0.1 7 1 2 2
7 8 7 9 5 7 7 5 8 7 reordenamiento =⇒ 7 5 5 7 7 7 7 8 8 9
8 0 2 2 2 8 0 2 2 2
8 5 6 5 8 5 5 6
9 0 4 0 9 0 0 4
18 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
Este diagrama muestra que el dato que más se repite es 7.7 ya que aparece cuatro veces,
también muestra que el menor valor es 5.6 y el mayor es 9.4, otra característica rescatable
es que la mayoría de los pesos se encuentran entre 7 y 8 libras.
Si esta gráfica se gira 90◦ a la izquierda se puede apreciar que los datos se han agrupado
en forma de campana, algo muy especial en el ámbito de la estadística.
Una vez se ha elaborado una gráfica para un conjunto de datos es conveniente tener en
cuenta los siguientes aspectos:
Verifique las escalas horizontal y vertical para tener claro lo que se está midiendo.
Busque cualquier medición inusual o valor atípico, es decir, ¿existe alguna medición
mucho más grande o pequeña que las demás? Tales valores atípicos podrían no ser
representativos de los otros valores del conjunto.
1.19 Definición. Una distribución es simétrica si sus lados izquierdo y derecho forman
imágenes idénticas cuando se dividen por su valor medio.
Una distribución es sesgada a la derecha si una proporción mayor de datos se localiza a la
derecha del valor máximo, este tipo de distribuciones pueden presentar algunas mediciones
extremadamente grandes.
Una distribución es sesgada a la izquierda si una proporción mayor de datos se localiza
a la izquierda del valor máximo, tales distribuciones pueden presentar algunas mediciones
extremadamente pequeñas.
6. Para encontrar la distribución de los tiempos (en minutos) de atención a los clientes
de una cadena de supermercados, se registró el muestra de 60 tiempos de servicio a
clientes, los cuales se presentan a continuación:
3.6 1.9 2.1 0.3 0.8 0.2 1.0 1.4 1.8 1.6 1.1 1.8
0.3 1.1 0.5 1.2 0.6 1.1 0.8 1.7 1.4 0.2 1.3 3.1
0.4 2.3 1.8 4.5 0.9 0.7 0.6 2.8 2.5 1.1 0.4 1.2
0.4 1.3 0.8 1.3 1.1 1.2 0.8 1.0 0.9 0.7 3.1 1.7
1.1 2.2 1.6 1.9 5.2 0.5 1.8 0.3 1.1 0.6 0.7 0.6
a) Construya un diagrama de tallo y hoja extendido, indique la unidad de hoja.
b) ¿Qué fracción de los tiempos de servicio es menor o igual a un minuto?
c) Encuentre las mediciones número 15, 25, 35 y 45.
61 93 91 86 55
8. Las calificaciones en un examen de 100 puntos se
63 86 82 76 57
registraron para 20 estudiantes y se encuentran
94 89 67 62 72
a la derecha.
87 68 65 75 84
a) Realice un diagrama de puntos para este conjunto de datos (use una escala
horizontal adecuada).
b) Describa la forma de los datos.
c) La forma de la distribución es poco común. Dé una razón para este
comportamiento.
10. A continuación aparecen tres diagramas de puntos, clasifique cada uno de ellos según
su forma (simétrico, sesgado a derecha/izquierda).
Las gráficas permiten representar la forma básica de una distribución de datos, pero el uso
de los métodos gráficos tienen limitaciones, por ejemplo, un simple cambio de escala en un
histograma puede cambiar la percepción de la forma de la distribución, otro problema con
las gráficas es que ellas son imprecisas a la hora de aplicar alguna inferencia estadística.
Una manera de superar estos problemas es usar medidas numéricas, las cuales se determi-
nan para una muestra o una población de datos. Se pueden usar las mediciones para calcular
un conjunto de números que transmitirán una imagen mental aceptable de la distribución
de frecuencias. Recuerde que estas medidas se llaman parámetros cuando se relacionan con
la población, y estadísticos cuando se calculan a partir de las mediciones de una muestra.
Una de las medidas numéricas más utilizadas son las medidas de tendencia central, es decir,
una medida en el eje horizontal que ubica el centro de la distribución.
A
Plo largo del curso asumiremos la siguiente notación:
denota la sumatoria de un conjunto de valores.
x es la variable que representa los valores de las mediciones.
n representa el número de valores de una muestra.
N representa el número de valores de una población.
1.21 Definición. La media de un conjunto de mediciones es igual a la suma de las
mediciones, dividida entre el número de mediciones.
n
P
xi es la media de un conjunto de valores de una muestra.
i=1
x̄ = Se denomina x barra.
n
N
P
xi es la media de un conjunto de valores de una población.
i=1 Se denomina mu.
µ=
N
1.22 Ejemplo. Un ingeniero está diseñando un conector de nylon que se usará en un motor
de automóvil. Se realizan ocho unidades y se miden las fuerzas de desconexión, produciendo
los siguientes datos (en lb − pie): 12.6, 12.8, 13.4, 12.3, 13.6, 13.5, 12.7, 13.1.
Calcule la media muestral de fuerza de desconexión.
8
P
xi
i=1 12.6 + 12.8 + 13.4 + 12.3 + 13.6 + 13.5 + 12.7 + 13.1
x̄ = = = 13.0
8 8
por tanto, la fuerza de desconexión promedio es de 13 lb − pie.
Recordemos que hay 8 datos, es decir, un número par. Primero organizamos los datos de
menor a mayor y hallamos el promedio entre los datos cuarto y quinto:
Como hay cinco datos, la mediana será el ubicado en el tercer lugar, es decir, m = 6.
Otra manera de localizar el centro de una distribución es buscar el valor que más se repita.
1.27 Ejemplo. 1. Considere el ejemplo 1.15 que habla del peso al nacer de 30 bebés.
La moda de este conjunto de datos es M = 7.7.
2. El ejemplo 1.17 suministra el precio de un par de zapatillas de 20 marcas distintas.
La moda de estas mediciones es 70.
3. El ejemplo 1.22 nos da la fuerza de desconexión de 8 conectores de nylon. En este
caso decimos que no hay moda.
Las distribuciones sesgadas a la izquierda (o con sesgo negativo) poseen una cola
izquierda más larga, en este caso es muy común que tanto la media como la mediana
se encuentren a la izquierda de la moda.
Generalmente en este tipo de distribuciones, la media es menor que la mediana.
Las distribuciones sesgadas a la derecha (o con sesgo positivo) presentan una cola hacia
la derecha, en esta situación normalmente la media y la mediana son mayores que la moda.
Usualmente en las distribuciones sesgadas a la derecha, la media se encuentra a la derecha
de la mediana.
1.11. EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL 25
3. El ejemplo 1.16 nos da el tiempo necesario para completar las auditorías para una
muestra de 20 clientes de una firma de contadores.
a) Determine x̄, m y M.
b) Según los resultados obtenidos en la parte a) diga si la distribución es simétrica
o sesgada.
c) En el ejemplo mencionado aparece el diagrama de puntos para el conjunto de
mediciones. ¿Tal diagrama es consistente con la forma de la distribución que usted
dió en la parte b)?
26 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
6. En la tabla de la derecha aparece el precio esti- 0.99 0.60 1.23 0.85 0.65
mado (en dólares) de una lata de atún empacado 0.53 1.41 1.12 0.63 0.67
en agua de 6 onzas, para 14 marcas diferentes. 0.69 0.60 1.92 0.66
a) Determine la media, la mediana y la moda para este conjunto de datos.
b) Diga si la distribución es simétrica o sesgada.
c) Realice un diagrama de puntos. ¿Esto confirma la conclusión sobre la forma de
la distribución hecha en la parte b)?
9. Walt Disney Company compró a Pixar Animation Studios en el año 2006. Algunas
películas producidas por estas compañias durante los 10 anõs previos a la compra
aparecen en la tabla adjunta, los ingresos se miden en millones de dólares.
1.29 Ejemplo. Recordemos el ejemplo 1.22 que nos habla de la fuerza de desconexión de
ocho mediciones, a continuación escribimos las mediciones:
12.6, 12.8, 13.4, 12.3, 13.6, 13.5, 12.7, 13.1
La mayor medición es 13.6 y la menor es 12.3, por tanto el rango es R = 13.6 − 12.3 = 1.3
El siguiente estadístico nos dice qué tan grande es la desviación estándar con respecto a la
media.
1.33 Definición. El coeficiente de variación se expresa por medio del siguiente
desviación estándar
porcentaje: CV = · 100 %
media
Al implementar la notación para muestras y poblaciones respectivamente, la anterior
s σ
expresión equivale a: CV = · 100 % o CV = · 100 %
x̄ µ
1.34 Ejemplo. El coeficiente de variación de las mediciones del ejemplo 1.32 es:
s 2.4
CV = · 100 % = · 100 % = 63.2 %
x̄ 3.8
este resultado indica que la desviación estándar muestral es el 63.2 % del valor de la media
muestral, un número tan alto indica que los datos se encuentran muy dispersos.
3. El ejemplo 1.16 nos da el tiempo necesario para completar las auditorías para una
muestra de 20 clientes de una firma de contadores.
Determine R, s2 , s y CV.
6. En la tabla de la derecha aparece el precio esti- 0.99 0.60 1.23 0.85 0.65
mado (en dólares) de una lata de atún empacado 0.53 1.41 1.12 0.63 0.67
en agua de 6 onzas, para 14 marcas diferentes. 0.69 0.60 1.92 0.66
a) Determine la desviación estándar muestral.
b) Calcule el coeficiente de variación.
1.13. EJERCICIOS SOBRE MEDIDAS DE VARIACIÓN 31
9. Walt Disney Company compró a Pixar Animation Studios en el año 2006. Algunas
películas producidas por estas compañias durante los 10 anõs previos a la compra
aparecen en la tabla adjunta, los ingresos se miden en millones de dólares.
10. Al investigar los tiempos que se requieren en el servicio en automóvil (en segundos),
se obtuvieron los siguientes resultados
McDonald’s 287 128 92 267 176 240 192 118 153 254 193 136
Jack in the Box 136 130 126 126 139 141 137 138 133 131 134 129
a) Calcule el coeficiente de variación muestral para el tiempo de servicio en McDo-
nald’s.
b) Halle el coeficiente de variación muestral para el tiempo de servicio en Jack in
the Box.
c) ¿Que puede concluir al comparar los coeficientes de las partes a) y b)?
32 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
1.14.1. Puntuación z
Un puntaje z mide la distancia entre una observación y la media, medidas en unidades de
desviación estándar.
1.35 Definición. El puntaje z mide el número de desviaciones estándar que una medición
x se encuentra por arriba o por debajo de la media. Este número puede ser positivo o
negativo y se calcula mediante las siguientes expresiones:
x − x̄ x−µ
Muestra: z= Población: z=
s σ
1.36 Ejemplo. La estatura promedio de los hombres en Estados Unidos es de 69 pulgadas
con una desviación estándar de 2.8 pulgadas, en tanto que la estatura promedio de las
mujeres en dicho país es de 63.6 pulgadas con una desviación estándar de 2.5 pulgadas.
Para comparar las estaturas de estos exdeportistas en relación con las poblaciones de
hombres y mujeres, debemos hallar los puntajes z de sus estaturas:
Los puntajes z también son útiles para indicar cuando una medición es infrecuente, esto es,
cuando un dato esta considerablemente arriba o abajo de la media.
Más precisamente, los valores comunes son aquellos que satisfacen la desigualdad
−2 ≤ puntaje z ≤ 2.
1.14. MEDIDAS DE POSICIÓN RELATIVA 33
Los valores infrecuentes tienen puntuaciones z menores que −2 o mayores que 2, esto es,
puntaje z < 2 o puntaje z > 2.
En 1988 Mugsy Bogues jugó en los Charlotte Hornets de la nba, este exbasquetbolista sólo
mide 63 pulgadas. Vamos a averiguar si tal estatura también es un valor inf recuente.
x−µ 63 − 69
Hallando su puntaje z tenemos: z = = = −2.14 y por tanto decimos que la
σ 2.8
estatura de Mugsy también es un valor inf recuente.
Los cuartiles y percentiles también son medidas de posición, pero se usan para comparar
valores dentro del mismo conjunto de datos.
Recuerde que la mediana m es el valor que está en la mitad de los datos, de modo que el
50 % de los datos son menores o iguales a m, y el restante 50 % son mayores o iguales a m.
1.37 Definición. Así como la mediana m divide los datos en dos partes iguales,
los cuartiles, denotados Q1 , Q2 , y Q3 dividen los valores ordenados en cuatro
partes iguales.
Un percentil es otra medida de posición relativa y se usa con frecuencia en conjuntos grandes
de números, éstas medidas no son prácticas en conjuntos pequeños.
1.38 Definición. Un conjunto de n mediciones se ha reacomodado en orden de magnitud.
El p-ésimo percentil es el valor de x que es mayor o igual al p % de las mediciones, y
menor o igual que el restante (100 − p) %.
Nótese que el percentil-25 no es otra cosa más que el primer cuartil Q1 , el percentil-50 es
igual a la mediana y que el percentil-75 coincide con el tercer cuartil.
Si los números 0.25(n + 1) y 0.75(n + 1) no son enteros (como sucede casi siempre), los
cuartiles se hallan por interpolación, usando los valores de las dos posiciones adyacentes.
Esto significa que Q1 está a 1/4 de distancia entre la décima y onceava mediciones:
167 + 173
Q1 = 86 + 0.25(87 − 86) = 86.25. m= = 170
2
Q3 se ubica a 3/4 de distancia entre la trigésima medición y la trigésimo primera:
Q3 = 224 + 0.75(233 − 224) = 230.75.
Los cuatro cuartiles dividen la distribución de datos en cuatro partes, cada una de ellas
contiene aproximadamente el 25 % de los datos. Los cuartiles Q1 y Q3 conforman la frontera
del 50 % medio de la distribución. Se puede medir el rango de este 50 % por medio de la
siguiente medida numérica.
1.40 Definición. El rango intercuartil (IQR) para un conjunto de mediciones, se define
como la diferencia entre el cuartil superior e inferior, esto es, IQR = Q3 − Q1
1.41 Ejemplo. En el ejemplo 1.39 se encontró lo siguiente: Q1 = 86.25 en tanto que
Q3 = 230.75, por tanto, IQR = 230.75 − 86.25 = 144.5
El resumen de los cinco números consta del dato menor, el cuartil inferior, la mediana,
el cuartil superior y el dato mayor, presentados en orden ascendente:
Min, Q1 , Mediana, Q3 , Max
1.42 Ejemplo. Elabore el resumen de los cinco números correspondiente al ejemplo 1.39.
Si nos remitimos al ejemplo 1.39 podemos apreciar que allí se calculan los tres cuartiles,
solo falta agregar el dato menor: 0, y el dato mayor: 491. De esta manera, el resumen de
los cinco números es:
0 86.25 170 230.75 491
El diagrama de caja es un resumen gráfico que presenta las características más importantes
de un conjunto de datos.
Este diagrama esta basado en el resumen de los cinco números y en el rango intercuartílico.
Calcule la mediana, los cuartiles inferior y superior, así como el IQR para el conjunto
de mediciones.
Trace una recta horizontal que represente la escala de medición, forme una caja arriba
de tal recta con su extremo izquierdo en Q1 y su extremo derecho en Q3 . Trace una
recta vertical que atraviese la caja en la ubicación de la mediana.
Calcule el límite inferior y superior mediante las expresiones:
límite inferior: Q1 − 1.5(IQR) límite superior: Q3 + 1.5(IQR)
Los datos menores que el límite inferior, y los datos mayores que el límite superior,
son llamados resultados atípicos, márquelos con un asterisco (∗) en el diagrama.
prolongue rectas horizontales llamadas bigotes desde los extremos laterales de la caja,
hasta las mediciones más pequeñas y más grandes que no sean resultados atípicos.
1.43 Ejemplo. El ejemplo 1.39 presenta los niveles de nicotina en 40 personas. Realice el
diagrama de caja.
Los cuartiles, mediana y rango intercuartílico vienen dados por:
Q1 = 86.25, m = 170, Q3 = 230.75, IQR = 144.5
En el conjunto de datos no hay ninguno de ellos que sea menor que el límite inferior,
sin embargo hay dos datos mayores que el límite superior: 477 y 491, éstos son
los resultados atípicos.
* *
El diagrama de caja también se puede utilizar para describir la forma de una distribución
de datos, si la mediana está cerca de la mitad de la caja, la distribución es simétrica; si la
mediana está a la izquierda del centro (cerca al primer cuartíl) la distribución es sesgada a
la derecha; si la mediana está a la derecha del centro (cerca al tercer cuartíl) la distribución
es sesgada a la izquierda. El diagrama de caja del ejemplo 1.39 nos indica que la distribución
es prácticamente simétrica.
Los diagramas de caja también se emplean para comparar aspectos como medianas
o variación en dos o más variables medidas en las mismas unidades.
1.44 Ejemplo. Para comparar los salarios mensuales de los empleados de una empresa
multinacional, se selecccionó una muestra de 200 empleados en la sección de negocios y se
registró la profesión y el suedo mensual de cada profesional.
La figura adjunta presenta los diagramas de caja para los profesionales en contabilidad,
finanzas, sistemas de información, administración de empresas y marketing.
Algunas observaciones acerca de los sueldos por área de especialización, a partir de los
diagramas de caja son las siguientes:
Con base en las medianas se concluye que los salarios ordenados de mayor a menor,
corresponden a las áreas de contabilidad, sistemas de información,finanzas, marketing
y administración.
Se presentan resultados atípicos de sueldos altos en contabilidad, finanzas y marketing.
Los salarios en el área de finanzas tienen menos variación, mientras que en contabilidad
se presenta la mayor variación.
38 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
1. La temperatura corporal humana tiene una media de 98.6◦ F y una desviación estándar
de 0.62◦ F. Se le tomó la temperatura a Juan, María y Pablo, tres estudiantes del curso
de estadística, y registraron 100◦ F, 96.96◦ F y 98.2◦ F respectivamente.
Calcule los tres puntajes z y clasifíquelos como valores comunes o infrecuentes.
b) Para las mediciones sobre el queso sin grasa, halle el límite inferior y el límite
superior; verifique que no hay resultados atípicos en este tipo de queso.
c) Según la ubicación de las medianas, ¿qué tipo de queso presenta los mayores
niveles de sodio?
d) Según la posición de las medianas, ¿cómo es la forma de las distribuciones? ¿Cuál
presenta mayor sesgo?
e) ¿Qué tipo de queso presenta menor variabilidad en los niveles de sodio?
10. El ejemplo 1.16 nos da el tiempo (en días) requerido para completar las auditorías de
final de año para 20 clientes de una firma de contadores.
a) Realice el diagrama de caja para este conjunto de datos.
b) Determine la forma de la distribución, basado en la ubicación de la mediana.
40 CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
11. Al investigar los tiempos que se requieren en el servicio en automóvil (en segundos),
se obtuvieron los siguientes resultados
McDonald’s 287 128 92 267 176 240 192 118 153 254 193 136
Jack in the Box 136 130 126 126 139 141 137 138 133 131 134 129
a) Realice los dos diagramas de caja de tiempo de servicio.
b) Al comparar la ubicación de las medianas diga cuál empresa es más rápida al
despachar la comida.
c) ¿Qué empresa presenta la menor variación en el tiempo de servicio?
En esta sección se empleará la notación correspondiente a una población pero debe tenerse
presente que su resultado también aplica para datos muestrales.
Teorema de Chebyshev
La proporción de cualquier conjunto de datos que está dentro de k desviaciones
estándar de la media, es por lo menos 1 − k12 , donde k es cualquier número
positivo mayor que 1. Para k = 2, k = 3 y k = 4, tenemos:
Al menos 3/4 de los datos están dentro de dos desviaciones estándar de la media, o
equivalentemente, por lo menos el 75 % de las mediciones pertenecen al intervalo
µ − 2σ ≤ x ≤ µ + 2σ
Al menos 8/9 de los datos están dentro de tres desviaciones estándar de la media, o
equivalentemente, por lo menos el 89 % de las mediciones pertenecen al intervalo
µ − 3σ ≤ x ≤ µ + 3σ
Al menos 15/16 de los datos están dentro de cuatro desviaciones estándar de la media,
o equivalentemente, por lo menos el 94 % de las mediciones pertenecen al intervalo
µ − 4σ ≤ x ≤ µ + 4σ
1.16. TEOREMA DE CHEBYSHEV Y REGLA EMPÍRICA 41
Tenga presente que k puede asumir cualquier valor mayor que 1, por ejemplo, si k = 1.6
realizamos el cálculo 1 − k12 = 1 − 1.61 2 = 1 − 0.39 = 0.61, para concluir lo siguiente:
por lo menos el 61 % de las mediciones pertenecen al intervalo
µ − 1.6σ ≤ x ≤ µ + 1.6σ
1.45 Ejemplo. Se ha realizado un examen de estadística a 80 estudiantes de física de la
Universidad Distrital, la media de las calificaciones es 3.5 y la varianza 0.04.
a) Aplique el teorema de Chebyshev para describir la distribución de los datos.
b) ¿Qué porcentaje de los estudiantes obtuvieron calificaciones entre 3.2 y 3.8?
c) ¿Cuántos estudiantes obtuvieron calificaciones entre 3.0 y 4.0?
El enunciado nos dice que x̄ = 3.5 y que s2 = 0.04, por tanto s = 0.2
Regla empírica
En muchas aplicaciones prácticas los conjuntos de datos exhiben una distribución simétrica
con forma de campana, como lo indica la imagen, la regla empírica nos dice que bajo este
supuesto:
Esto indica que el rango total de las mediciones, desde la menor hasta la mayor, debe ser
un valor numérico muy cercano a cuatro desviaciones estándar.
Desde luego, esta es una aproximación muy burda pero a la vez útil para detectar errores
graves al calcular s. Si el rango, R, abarca alrededor de cuatro desviaciones estándar, se
puede escribir: R ≈ 4s ⇐⇒ s ≈ R4 .
1.47 Ejemplo. En el ejemplo 1.32 se calculó la desviación estándar del conjunto de datos
5, 7, 1, 2, 4. Utilice la regla práctica del intervalo para verificar el cálculo de s.
No se pretende que el rango sea exactamente igual a 4s, lo que se busca es descubrir errores
graves en el cálculo de s, tales como no dividir la suma de los cuadrados de las desviaciones
entre n − 1, o no tomar la raíz cuadrada de s2 ; tales errores generan valores para s mucho
mayores que la aproximación suministrada por la regla práctica del intervalo cuando se
hacen los cálculos a mano.
8. Los datos presentados a continuación son los pesos (en libras) de 27 paquetes de carne
molida de un supermercado:
1.08 0.99 0.97 1.18 1.41 1.28 0.83 1.06 1.14
1.38 0.75 0.96 1.08 0.87 0.89 0.89 0.96 1.12
1.12 0.93 1.24 0.89 0.98 1.14 0.92 1.18 1.17
1.17. EJERCICIOS SOBRE EL TEOREMA DE CHEVYSHEV
Y LA REGLA EMPÍRICA 45
10. La prueba Weschler sobre el coeficiente intelectual en adultos presenta una distribu-
ción normal (forma de campana), con media de 100 y desviación estándar de 15.
a) ¿Qué porcentaje de adultos tiene puntuaciones entre 55 y 145?
b) El 68 % de las mediciones ¿en qué intervalo se encuentra?
CAPÍTULO 2
PROBABILIDAD
2.1. Introducción
Eventos aleatorios como los ya mencionados, nos generan la necesidad de contar con una
teoría de probabilidad, que dará un método riguroso para hallar un número (o probabilidad)
que estará de acuerdo con la frecuencia relativa real de que ocurra un evento en una larga
serie de intentos.
46
2.2. CONJUNTOS 47
2.2. Conjuntos
Los conjuntos y las relaciones entre ellos se pueden representar en forma adecuada mediante
el uso de diagramas de Venn.
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
Las leyes de Morgan tienen gran importancia en la teoría de los conjuntos, ellas establecen
lo siguiente:
(A ∩ B) = Ā ∪ B̄
(A ∪ B) = Ā ∩ B̄
2.1 Ejemplo. Se Lanza un dado y se denota con S el conjunto de todas las posibles
observaciones numéricas, esto es, S = { 1, 2, 3, 4, 5, 6 }.
Se definen tres conjuntos: A = { 1, 2 }, B = { 1, 3 } y C = { 2, 4, 6 }.
Determine: a) A ∪ B b) A ∩ B c) Ā d) B ∩ C
2.3. EJERCICIOS SOBRE CONJUNTOS 49
a) A ∪ B = { 1, 2, 3 } b) A ∩ B = { 1 } c) Ā = { 3, 4, 5, 6 }
4. Suponga que una familia tiene dos hijos de distintas edades y estamos interesados en
el género de estos niños. Usemos la notación H para hombre y M para mujer, y el
orden de las letras para indicar el hijo mayor, por ejemplo M H indica que el mayor
es la niña y que el menor es el niño. Hay cuatro puntos en el conjunto universal de
posibilidades: S = { M M, M H, HM, HH}. Denote con A el subconunto de S que no
contiene hombres, B el subconjunto que contiene dos hombres y C es subconjunto que
contiene por lo menos un hombre. Indique los elementos de los siguientes conjuntos:
a) A ∩ B̄ b) A ∪ B c) Ā ∩ C d) A ∪ C e) B ∩ C̄ f ) B̄ ∪ C
8. Un grupo de cinco solicitantes para un par de trabajos idénticos está formado por tres
hombres (H1 , H2 , H3 ) y dos mujeres (M1 , M2 ). El empleador debe seleccionar dos de
los cinco solicitantes para los trabajos. Denote con S el conjunto de todas las posibles
selecciones para los dos trabajos. Denote con A el subconjunto de todos los resultados
posibles a la selección de dos hombres y con B al subconjunto correspondiente a la
selección de por lo menos una mujer. Indique los siguientes conjuntos:
a) A ∩ B b) A ∩ B̄ c) Ā ∩ B d) Ā ∩ B̄
e) A ∪ B f ) A ∪ B̄ g) Ā ∪ B h) Ā ∪ B̄
9. Se lanzan dos dados, uno blanco y otro negro; y se observan los números de las caras
superiores. Denotemos con S el conjunto de todos los pares posibles que se pueden
observar (si por ejemplo se observa un 2 en el dado blanco y un 3 en el dado negro se
escribe (2, 3)). Especifique los siguientes subconjuntos de S:
a) El número observado en el dado negro es par.
b) La suma de los dos números es par.
c) La suma de los dos números es 8.
d) Se observa el mismo número en el dado blanco y en el dado negro.
11. Se lanzan dos monedas corrientes: una de $ 100 y otra de $ 200 y se registra lo que se
aprecia en su cara superior escribiendo primero el resultado de la moneda de $ 100 y
luego el resultado de la moneda de $ 200, por ejemplo la pareja sc indica que ha caído
sello en la moneda de $ 100 y cara en la de $ 200.
2.4. ESPACIO MUESTRAL Y AXIOMAS DE PROBABILIDAD 51
12. Se lanzan tres monedas corrientes: una de $ 100, otra de $ 200 y otra de $ 500 y se
registra lo que se aprecia en su cara superior escribiendo primero el resultado de la
moneda de $ 100, luego el resultado de la moneda de $ 200 y finalmente el resultado
de la moneda de $ 500, por ejemplo la terna ssc indica que ha caído sello en la moneda
de $ 100, sello en la moneda de $ 200 y cara en la de $ 500.
Halle el conjunto S de todas las posibilidades y los siguientes subconjuntos de S:
a) No se observa ni una cara.
b) Se aprecia una cara.
c) Se observan dos caras.
d) Las tres monedas han caído cara.
En esta sección se realiza una definición de gran relevancia en todo el campo de la estadística:
el concepto de probabilidad. Primero es necesario realizar las siguientes definiciones.
2.2 Definición. Un experimento es el proceso por medio del cual se hace una
observación.
Un espacio muestral discreto es aquel que está formado ya sea por un número
finito o contable de puntos muestrales distintos.
2.3 Ejemplo. Considere el experimento que consiste en lanzar un dado corriente y observar
el puntaje que aparece en la cara superior.
P (S) = 1
2.4 Ejemplo. Retomemos el ejemplo 2.3, como hay seis eventos simples lo más natural es
que la probabilidad de cada uno de ellos sea 16 , esto es, P (Ei ) = 61 para cada i = 1, 2, . . . , 6.
Para encontrar la probabilidad de los tres eventos compuestos empleamos el tercer axioma:
P (A) = P (E1 ) + P (E3 ) + P (E5 ) = 12 P (B) = P (E1 ) + P (E2 ) + P (E3 ) + P (E4 ) = 32
1
P (C) = P (E2 ) + P (E3 ) = 3 Observe que se satisface el segundo axioma:
P (S) = P (E1 ) + P (E2 ) + P (E3 ) + P (E4 ) + P (E5 ) + P (E6 ) = 1.
a) Cualquier evento simple está formado por un par de terminales seleccionadas para el
envío. Al considerar todas las posibilidades obtenemos:
E1 = { B1 , B2 } E2 = { B1 , B3 } E3 = { B2 , B3 } E4 = { B1 , D1 } E5 = { B1 , D2 }
E6 = { B2 , D1 } E7 = { B2 , D2 } E8 = { B3 , D1 } E9 = { B3 , D2 } E10 = { D1 , D2 }
2.5. EJERCICIOS SOBRE ESPACIO MUESTRAL Y AXIOMAS 53
b) A = { E1 , E2 , E3 }
d) Debido a que las terminales se seleccionan S
al azar, cualquier par de terminales es tan pro-
bable de ser seleccionado como cualquier otro, E4 E5
A E6
por tanto la probabilidad de un evento simple E1
1
es P (Ei ) = 10 = 0.1 para i = 1, 2, . . . , 10. E7
E3 E10
e) Como A = E1 ∪ E2 ∪ E3 , el tercer E2
axioma de las probabilidades implica que E8
E9
P (A) = P (E1 ) + P (E2 ) + P (E3 ) = 0.3
2.6 Ejemplo. Se lanzan tres monedas corrientes: una de $ 100, otra de $ 200 y otra de
$ 500 y se registra lo que se aprecia en su cara superior escribiendo primero el resultado de
la moneda de $ 100, luego el resultado de la moneda de $ 200 y finalmente el resultado de la
moneda de $ 500, por ejemplo la terna ssc indica que ha caído sello en la moneda de $ 100,
sello en la moneda de $ 200 y cara en la de $ 500. Sea A el evento consistente en observar
exactamente dos caras.
a) Halle el espacio muestral S del experimento.
b) Describa el evento A y calcule su probabilidad.
c) Describa el evento Ā y determine su probabilidad.
a) El espacio muestral es S = { ccc, ccs, csc, scc, ssc, scs, css, sss }.
Como las monedas son corrientes y hay 8 puntos muestrales en S, la probabilidad de cada
evento simple es 81 = 0.125.
b) El evento A viene dado por A = { ccs, csc, scc } y su probabilidad es
P (A) = P (ccs) + P (csc) + P (scc) = 83 = 0.375.
c) Al hallar el complemento de A se obtiene Ā = { ccc, ssc, scs, css, sss }, su
probabilidad es P (Ā) = 85 = 0.625.
Observe que P (A) = 0.375 y que P (Ā) = 1 − P (A) = 1 − 0.375 = 0.625.
4. Dos monedas corrientes (una de $ 100 y otra de $ 200) se tiran al aire y se observan
sus caras superiores (la notación sc indica sello en la moneda de $ 100 y cara en la
moneda de $ 200).
a) Halle el espacio muestral S de este experimento.
b) Asigne probabilidades a cada evento simple (las monedas son corrientes).
c) Se definen dos eventos: A es aquel en el que se aprecia exactamente una cara;
mientras que B registra por lo menos una cara. Halle los puntos muestrales de cada
evento y sus respectivas probabilidades.
d) Calcule las siguientes probabilidades: P (A ∩ B), P (A ∪ B), P (Ā ∩ B) y P (A ∩ B̄).
e) Muestre que: P (A) = P (A ∩ B) + P (A ∩ B̄)
6. Se necesitan dos jurados adicionales para completar un jurado para un juicio criminal.
Hay seis jurados en perspectiva, dos mujeres y cuatro hombres. Los dos jurados se
seleccionan al azar de entre los seis disponibles.
2.5. EJERCICIOS SOBRE ESPACIO MUESTRAL Y AXIOMAS 55
8. Se lanzan dos dados, uno blanco y otro negro; y se observan los números de las caras
superiores. Denotemos con S el conjunto de todos los pares posibles que se pueden
observar (si por ejemplo se observa un 2 en el dado blanco y un 3 en el dado negro
se escribe (2, 3)). Halle el espacio muestral S de este experimento y las siguientes
probabilidades:
a) La suma de los dos números es 3 d) La suma de los dos números es 8.
b) La suma de los dos números es 5 e) La suma de los dos números es 10.
c) La suma de los dos números es 7. f ) La suma de los dos números es 12.
10. Un frasco contiene cuatro monedas: una de $ 5 centavos, una de $ 10 centavos, una
de $ 25 centavos y otra de $ 50 centavos. Se seleccionan al azar tres monedas del frasco.
a) Halle el espacio muestral S e indique que probabilidad de cada punto muestral.
b) ¿Cuál es la probabilidad de que la selección contenga la moneda de $ 50 centavos?
c) ¿Cuál es la probabilidad de que la suma total sacada sea mayor o igual a $ 60
centavos?
56 CAPÍTULO 2. PROBABILIDAD
Esta sección presenta algunos resultados útiles de la teoría del análisis combinatorio, así
como su aplicación al cálculo de la probabilidad de un evento.
2.9 Ejemplo. Se lanzan dos dados, uno blanco y otro negro; y se observan los números
de las caras superiores. Denotemos con S el conjunto de todos los pares posibles que se
pueden observar (si por ejemplo se observa un 2 en el dado blanco y un 3 en el dado negro
se escribe (2, 3)). ¿Cuántos eventos simples hay en el espacio muestral?
El dado blanco puede caer en una de m = 6 formas, el dado negro también cae en una
de n = 6 formas. Como el experimento comprende dos etapas, el número total de eventos
simples en S es mn = (6)(6) = 36.
2.6. TÉCNICAS DE CONTEO 57
2.10 Ejemplo. El profesor de estadística tiene cinco camisas y dos corbatas. ¿De cuántas
maneras puede elegir una camisa y una corbata?
La primer etapa del experimento es la eleccón de la camisa, el profesor puede hacer esto de
cinco maneras. La segunda etapa es la selección de la corbata, solo tiene dos posibilidades
para ello. Por la regla mn el profesor puede elegir una camisa y una corbata de 10 formas.
2.11 Teorema (Regla mn extendida). Si un experimento se realiza en k etapas, con n1
formas de efectuar la primera etapa, n2 formas de realizar la segunda etapa, . . . , y nk for-
mas de hacer la k−ésima etapa, entonces el número de formas para efectuar el experimento
es igual a n1 · n2 · n3 · · · nk .
2.12 Ejemplo. Se lanzan tres monedas corrientes: una de $ 100, otra de $ 200 y otra de
$ 500 y se registra lo que se aprecia en su cara superior escribiendo primero el resultado de
la moneda de $ 100, luego el resultado de la moneda de $ 200 y finalmente el resultado de la
moneda de $ 500, por ejemplo la terna ssc indica que ha caído sello en la moneda de $ 100,
sello en la moneda de $ 200 y cara en la de $ 500.
¿Cuántos puntos muestrales hay en el espacio muestral?
Enumeramos los días del año: 1, 2, 3, . . . , 364, 365. Un punto muestral puede ser
representado por una sucesión ordenada de 20 números, donde el primero de ellos denota
el número de la fecha del cumpleaños del primer estudiante, el segundo número representa
la fecha del cumpleaños del segundo estudiante, y así sucesivamente. Al aplicar 20 veces la
regla mn extendida deducimos que el espacio muestral S contiene 36520 puntos muestrales.
58 CAPÍTULO 2. PROBABILIDAD
Denotemos con A el evento de que cada estudiante tenga un cumpleaños distinto. Supon-
gamos que (x1 , x2 , x3 , . . . , x19 , x20 ) ∈ A, donde x1 es un número que representa la
fecha del primer estudiante, x2 es un número que representa la fecha del segundo estu-
diante, y así sucesivamente. x1 puede asumir cualquiera de los 365 valores posibles, x2
puede tomar cualquier valor, excepto el ya asignado a x1 , es decir, hay 364 posibilida-
des para x2 . Similarmente x3 puede asumir cualquier valor distinto de los asignados a x1
y a x2 , por tanto hay 363 posibilidades. El conjunto del cual se puede seleccionar x20
contiene 346 elementos: todos excepto los 19 valores asignados anteriormente. De nuevo
una aplicación de la regla mn extendida implica que el evento A se puede obtener de
n1 · n2 · n3 · · · n20 = (365)(364)(363) · · · (346) formas.
Como el número debe ser par, tenemos tres opciones para la posición de las unidades. Sin
embargo, para un número de cuatro dígitos la posición de los millares no puede ser cero.
De esta manera, consideramos la posición de las unidades en dos partes: cero o distinto de
cero.
a) La posición de las cifras de las unidades es 0, esto es, n1 = 1. Ahora tenemos 5 opciones
para las cifras de los millares: n2 = 5; 4 posibilidades para la cifra de las centenas: n3 = 4; y
3 opciones para la cifra de las decenas: n4 = 3. Por esta ramificación vemos que la cantidad
de números pares es: n1 · n2 · n3 · n4 = (1)(5)(4)(3) = 60.
b) La posición de las cifras de las unidades es distinto de cero 0, esto implica que en la cifra
de las unidades podemos colocar el 2 o el 6, y así n1 = 2; debido a que el 0 no se puede ubicar
en la cifra de los millares tenemos que n2 = 4; se han usado dos números de seis, y así la cifra
de las centenas se puede elegir de cuatro maneras: n3 = 4; finalmente quedan tres números
para la cifra de las decenas n4 = 3, lo que nos conduce a : n1 ·n2 ·n3 ·n4 = (2)(4)(4)(3) = 96.
Como los dos casos anteriores son mutuamente excluyentes, la cantidad total de números
pares es 60 + 96 = 156.
Otras reglas de conteo importantes, son las relacionadas con las permutaciones y las combi-
naciones, las permutaciones nos permiten calcular el número de resultados experimentales
cuando se seleccionan r objetos de un conjunto de n objetos, y el orden de selección es
importante. Los mismos r objetos acomodados en un orden distinto originan otra permuta-
ción. Por otra parte, en las combinaciones no es importante el orden en el que se acomodan
los objetos.
2.6. TÉCNICAS DE CONTEO 59
2.18 Ejemplo. La Universidad Distrital otorga tres importantes premios a sus profesores
de la maestría en ingeniería, los premios son: a la investigación, a la innovación y a la
enseñanza. Si el cuerpo de profesores de la maestría se compone de 25 docentes y si cada
profesor puede recibir un premio como máximo, ¿cuántas selecciones posibles existen?
4!
a) El número de permutaciones es P24 = = 12.
(4 − 2)!
Estas son: ab, ba, ac, ca, ad, da, bc, cb, bd, db, cd, dc.
4!
b) Hay P34 = = 24 permutaciones, y vienen dadas por:
(4 − 3)!
abc, acb, bac, bca, cab, cba, abd, adb, bad, bda, dab, dba,
acd, adc, cad, cda, dac, dca, bcd, bdc, cbd, cdb, dbc, dcb.
4!
c) Ahora tenemos P44 = = 24 permutaciones, se enuncian a continuación:
(4 − 4)!
abcd, abdc, acbd, acdb, adbc, adcb, bacd, badc, bcad, bcda, bdac, bdca,
cabd, cadb, cbad, cbda, cdab, cdba, dabc, dacb, dbac, dbca, dcab, dcba.
60 CAPÍTULO 2. PROBABILIDAD
2.21 Ejemplo. Un niño tiene una colección de juegos de Game-Boy compuesta por 10
juegos recreativos y 5 de deportes. El niño está reunido con sus amigos y le pide a su madre
que le lleve 3 juegos recreativos y 2 de deportes. ¿De cuántas maneras diferentes se puede
hacer esto?
El orden en que son entrgados los billetes de lotería es importante, de ahí que las
posibilidades que tiene Carlos de asignar los billetes de lotería es
32! 32!
P432 = = = (32)(31)(30)(29) = 863040
(32 − 4)! 28!
2.23 Ejemplo. Una máquina está compuesta de cinco partes que se pueden ensamblar en
cualquier orden. Se ha de realizar una prueba para determinar el tiempo necesario para
cada orden de ensamble. Si cada orden se ha de probar una vez, ¿cuántas pruebas deben
efectuarse?
Como los fabricantes se seleccionan al azar, cualquiera de esos 10 eventos simples será
1
igualmente probable, con probabilidad 10 = 0.1.
5. Un restaurante ofrece un menú especial en el que, por un costo fijo una persona puede
seleccionar de entre 4 aperitivos, 3 ensaladas, 4 entradas y 5 postres. ¿Cuántas comidas
diferentes hay si una de ellas consta de un aperitivo, una ensalada, una entrada y un
postre?
8. Un estudio concluyó que siguiendo 7 reglas sencillas para la salud, una persona puede
prolongar su vida aproximadamente una década. Estas reglas son: no fumar, hacer
ejercicio habitualmente, moderar el consumo de alcohol, dormir entre 7 y 8 horas
diarias, mantener un peso apropiado, desayunar y no ingerir alimentos entre comidas.
De cuántas formas puede una persona adoptar 5 de estas reglas:
a) ¿si la persona actualmente infringe las 7 reglas?
b) ¿si la persona nunca nunca bebe y desayuna?
c) ¿Si la persona no fuma?
10. El profesor de cálculo vectorial tiene tan solo 12 alumnos en su clase. ¿Cuál es la
probabilidad de que cada estudiante tenga un cumpleaños distinto? (suponga que el
año no es bisiesto).
11. En una urna hay 40 balotas numeradas, 8 de ellas están premiadas y se distinguen
con color rojo, las restantes no estan premiadas y tienen color blanco. La profesora
de química extrae de la urna un puñado de 5 balotas. Determine de cuántas maneras
se pueden sacar si:
a) exactamente tres balotas salieron premiadas;
b) por lo menos tres balotas están premiadas.
12. a) Determine todas las permutaciones que se pueden formar con las letras a, b y c
considerando dos letras a la vez; luego considerando tres letras a a la vez.
b) Encuentre todas las permutaciones que se pueden formar con las letras
a, b, c, d y e considerando dos letras a la vez.
13. La mamá de caperucita roja, que tenía una gran canasta con 7 guayabas, 6 duraznos,
5 manzanas y 4 peras, le encargó a su hija seleccionar 4 guayabas, 3 duraznos,
2 manzanas, y 2 peras para llevar a la casa de la abuela.
2.7. EJERCICIOS DE TÉCNICAS DE CONTEO 63
a) ¿De cuántas formas Caperucita puede seleccionar las frutas siguiendo las
indicaciones de su mamá?
b) Determine las selecciones posibles si la niña olvida las indicaciones de la madre y
tan solo elige 11 frutas al azar.
14. Si una prueba de opción múltiple consta de 5 preguntas, cada una con 4 respuestas
posibles, de las cuales sólo una es correcta.
a) ¿De cuántas formas diferentes puede un estudiante elegir una respuesta a cada
pregunta?
b) Si un estudiante responde adivinando, ¿cuál es la probabilidad de que todas sus
respuestas estén erradas?
15. Un automóvil sólo tiene lugar para seis personas, incluyendo el conductor. Seis amigos
que viven cerca y estudian en la Universidad Libre utilizan este auto para ir a la
Universidad. Determine de cuántas maneras se pueden acomodar si:
a) cualquiera de ellos puede conducir.
b) solo el dueño del carro puede conducir.
16. Una tarjeta de circuitos impresos tiene 8 sitios diferentes en los que puede instalarse
un componente. Si van a colocarse 5 componentes idénticos en la tarjeta, ¿cuántos
diseños diferentes son posibles?
18. ¿Cuántos números pares de cinco dígitos se pueden formar con los dígitos 0, 2, 3, 4,
5, 6, y 9, si cada dígito se puede usar sólo una vez?
19. De cuántas maneras se pueden sentar 4 niños y 5 niñas en una fila, si se deben alternar
unos y otras?
Antes de enunciar algunas reglas útiles que facilitan el cálculo de las probabilidades, es
necesario introducir una definición importante.
2.26 Ejemplo. Consideremos el ejemplo 2.3 que nos habla de un experimento consistente
en lanzar un dado y registrar el número de la cara superior. Allí se determinó que el espacio
muestral es S = { E1 , E2 , E3 , E4 , E5 , E6 }. Algunas particiones del espacio muestral son:
P1 = {{ E1 , E2 , E3 }, { E4 , E5 , E6 }}
P2 = {{ E1 , E2 }, { E3 , E4 }, { E5 , E6 }}
P3 = {{ E1 }, { E2 , E3 , E4 }, { E5 , E6 }}
P4 = {{ E1 , E3 , E5 }, { E2 , E4 , E6 }}
2.28 Ejemplo. María es una ingeniera ambiental que después de presentar entrevistas en
dos empresas en donde aspira trabajar, determina que la probabilidad que tiene de lograr
un empleo en la empresa A es 0.8, y que la probabilidad de obtenerlo en la empresa B es
0.6. Si por otro lado, considera que la probabilidad de recibir ofertas de ambas empresas es
0.5, ¿qué probabilidad tiene de obtener al menos una oferta de esas dos empresas?
Por la primer regla del teorema anterior,
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0.8 + 0.6 − 0.5 = 0.9
2.29 Ejemplo. ¿Cuál es la probabilidad de obtener un total de seis o diez cuando se lanza
un par de dados?
2.9. EJERCICIOS DE REGLAS ADITIVAS DE LA PROBABILIDAD 65
Sea A el evento que resulte un seis y B el evento que salga un diez. Ahora bien, para
5 de los 36 puntos muestrales ocurre un total de seis y sólo para 3 de los 36 se observa
un diez. Los eventos A y B son mutuamente excluyentes debido a que no pueden ocurrir
5 3 8
simultáneamente, por tanto, P (A ∪ B) = P (A) + P (B) = 36 + 36 = 36 = 29 ≈ 0.222
2.30 Ejemplo. La probabilidad de que un mecánico automotriz dé servicio a 3, 4, 5, 6, 7,
8 o más vehículos se encuentra en la siguiente tabla
cantidad de vehículos 3 4 5 6 7 8 o más
probabilidad de servicio 0.12 0.17 0.28 0.24 0.10 0.09
¿Cuál es la probabilidad de que dé servicio al menos a 5 vehículos en un día de trabajo?
Sea A el evento: dar servicio por lo menos a 5 vehículos, por tanto el evento complementario
de A sería: Ā : dar servicio a menos de 5 vehículos, esto equivale a decir lo siguiente:
Ā : dar servicio a 3 o a 4 vehículos. Calcular la probabilidad de Ā es muy sencillo: basta con
realizar la suma: 0.12+0.17 = 0.29, de esto se sigue que: P (A) = 1−P (Ā) = 1−0.29 = 0.71
3. Una caja contiene 500 sobres idénticos, de los cuales 75 contienen $ 100 en efectivo,
150 contienen $ 25 y 275 contienen $ 10. ¿Cuál es el espacio muestral para la diferentes
cantidades de dinero? Asigne probabilidades a los puntos muestrales y después calcule
la probabilidad de que el primer sobre seleccionado contenga menos de $ 100.
66 CAPÍTULO 2. PROBABILIDAD
9. Suponga que A y B son dos eventos tales que P (A) = 0.8 y P (B) = 0.7.
a) ¿Es posible que P (A ∩ B) = 0.1? Argumente.
b) ¿Cuál es el menor valor posible para P (A ∩ B)?
c) ¿Es posible que P (A ∩ B) = 0.77? Justifique.
d) ¿Cuál es el mayor valor posible para P (A ∩ B)?
10. Existe interés por la vida de un componente electrónico. Se sabe que la probabilidad
de que el componente funcione más de 6000 horas es 0.42. Suponga que la probabilidad
de que el componente no dure más de 4000 horas es 0.04.
a) ¿Cuál es la probabilidad de que la vida del componente sea menor o igual a 6000
horas?
b) ¿Cuál es la probabilidad de que la vida del componente sea mayor que 4000 horas?
c) ¿Cuál es la probabilidad de que la vida del componente sea mayor que 4000 horas
y menor o igual a 6000 horas?
11. Se toman 3 libros al azar, de un estante que contiene 5 libros de física, 3 de cálculo y
uno de química. Determine la probabilidad de qué:
a) se seleccione el libro de química;
b) Se seleccionen 2 libros de física y un libro de cálculo;
c) no se seleccione el libro de química.
12. Se abrieron cursos libres de matemáticas y de inglés para un grupo de 100 estudiantes
graduados de secundaria, 54 tomaron curso de matemáticas, 69 de inglés y 35 tomaron
ambos cursos, algunos estudiantes no tomaron ningún curso. Calcule la probabilidad
de que:
a) uno de éstos estudiantes tome curso de matemáticas o de inglés;
b) uno de éstos estudiantes no haya tomado ningun curso;
c) uno de éstos estudiantes tome curso de matemáticas pero no de inglés;
d) uno de éstos estudiantes tome curso de inglés pero no de matemáticas.
13. En una escuela primaria de California, se encontró que el 40 % de los niños era de
origen hispano; además, se comprobó que el 12 % eran zurdos. Determine el porcentaje
de pequeños que son diestros y de origen no hispano, si se sabe que el 5 % de ellos son
hispanos zurdos.
14. Se lanza un par de dados, halle la probabilidad de que la suma de las caras superiores:
a) sea menor que cinco;
b) sea a lo sumo cinco;
c) sea mayor que diez;
d) sea por lo menos diez.
68 CAPÍTULO 2. PROBABILIDAD
2.36 Ejemplo. Tres marcas de café: X, Y y Z van a ser clasificadas por un juez de
acuerdo con su sabor. Considere los siguientes eventos,
A : la marca X es mejor que la marca Y . B : la marca X es la mejor.
C : la marca X es la segunda mejor. D : la marca X es la peor.
Si el juez en realidad no tiene preferencia por el sabor y al azar asigna lugar a las marcas,
diga si: a) A y B son independientes. b) A y C son independientes.
c) A y D son independientes.
De esta manera, los puntos muestrales de los cuatro eventos considerados son:
A = { XY Z, XZY, ZXY }, B = { XY Z, XZY }, C = { Y XZ, ZXY } y
D = { Y ZX, ZY X }, podemos ver que P (A) = 21 , P (B) = 13 , P (C) = 13 , y P (D) = 31 .
4. Sean A y B dos eventos tales que P (A) = 0.2, P (B) = 0.3 y P (A ∪ B) = 0.4
Encuentre lo siguiente:
a) P (A ∩ B̄) b) P (A|B̄) c) P (Ā ∩ B) d) P (Ā|B)
8. El profesor de estadística lanza un dado blanco y un dado negro sobre la mesa, mira
los números que salieron y los cubre con la mano para que sus alumnos no los vean.
Entonces pregunta lo siguiente:
a) ¿cuál es la probabilidad de que uno de los dados muestre un cuatro y el otro un
cinco?
b) suponga que el profesor le proporciona a sus alumnos la información de que en
uno de los dados salió el cinco. Conociendo este dato, ¿cuál es la probabilidad de que
el otro dado muestre el cuatro?
72 CAPÍTULO 2. PROBABILIDAD
11. Se lanzan al aire tres monedas, una de $ 100, otra de $ 200 y otra de $ 500, y se registra
el número de caras. Considere los tres eventos: A : se aprecian tres caras o tres sellos.
B : se observa por lo menos una cara. C : caen por lo menos dos caras.
De los siguientes eventos, ¿cuáles son independientes?
a) A y B b) A y C c) B y C
2.41 Ejemplo. De los ingenieros graduados en el año 2015, las dos terceras partes han
conseguido empleo ejerciendo su profesión, y la tercera parte restante se encuentra sin
empleo. El 12 % de los ingenieros empleados habla inglés, mientras que el 6 % de los
ingenieros desempleados habla inglés. ¿Cuál es la probabilidad de que un ingeniero
graduado en el 2015 hable inglés?
Definamos los tres eventos, A : El ingeniero graduado en el 2015 habla inglés.
E : El ingeniero graduado en el 2015 tiene empleo.
D : El ingeniero graduado en el 2015 no tiene empleo.
74 CAPÍTULO 2. PROBABILIDAD
3
2/
=
E)
El teorema de probabilidad total implica la siguiente
P(
ecuación: P (A) = P (E)P (A|E) + P (D)P (A|D).
P(
El enunciado nos da todas las probabilidades del
D)
lado derecho de esta ecuación, por tanto,
=
1/
2 1 1
P (A) = 3 (0.12) + 3 (0.06) = 10 = 0.1
3
P(A D) = 0.06
2.42 Ejemplo. Una empresa de manufactura emplea tres plantas para la elaboración de
su producto. La primer planta produce el 30 % de la producción total, la segunda planta
produce el 45 % y la tercer planta produce el 25 %. La tasa de artículos defectuosos es
diferente para las tres plantas, en la primer planta el 5 % de los artículos son defectuosos,
en la segunda el 2 % son defectuosos y en la tercera el el 4 % son defectuosos.
Halle la probabilidad de que la empresa produzca un artículo defectuoso.
0.3
)=
B3 : el producto es elaborado en la tercer planta.
B1
D : el producto es defectuoso. P(
P(B2) = 0.45 P(D B2) = 0.02
Por tanto, de fuentes como una muestra, un informe especial o una prueba de productos, se
obtiene información adicional sobre los eventos. Con esta nueva información actualizamos
los eventos de probabilidad previos mediante el cálculo de las probabilidades revisadas,
2.12. LEYES MULTIPLICATIVAS DE LA PROBABILIDAD Y LA REGLA DE BAYES 75
P (Bj )P (A|Bj )
P (Bj |A) =
P (B1 )P (A|B1 ) + P (B2 )P (A|B2 ) + . . . + P (Bk )P (A|Bk )
P (D)P (Ā|D)
Al aplicar la regla de Bayes se obtiene: P (D|Ā) =
P (E)P (Ā|E) + P (D)P (Ā|D)
Cada una de estas probabilidades se encuentra en el diagrama, de esta manera,
1 0.94
3 (0.94) 3 0.94
P (D|Ā) = 2 1
= 2.7 = 2.7 = 0.348
3 (0.88) + 3 (0.94) 3
2.45 Ejemplo. Consideremos de nuevo el ejemplo 2.42. Supongamos ahora que tenemos
un artículo defectuoso. ¿Cuál es la probabilidad de que el artículo haya sido elaborado en
la segunda planta?
76 CAPÍTULO 2. PROBABILIDAD
Ahora se sabe que el artículo es defectuoso, por tanto P(D B1) = 0.05
el diagrama de árbol presentado en el ejemplo 2.42
0.3
es óptimo para resolver este ejercicio y de nuevo lo
)=
B1
utilizamos.
P(
Se requiere la probabilidad de que el artículo P(B2) = 0.45 P(D B2) = 0.02
defectuoso provenga de la segunda planta, es decir,
P(
se busca P (B2 |D).
B3
)=
0.2
La regla de Bayes especifica la manera de encontrar
5
esta probabilidad, esto se consigue al aplicar la P(D B3) = 0.04
fórmula:
P (B2 )P (D|B2 )
P (B2 |D) =
P (B1 )P (D|B1 ) + P (B2 )P (D|B2 ) + P (B3 )P (D|B3 )
por consiguiente:
(0.45)(0.02) 0.009
P (B2 |D) = = = 0.265
(0.3)(0.05) + (0.45)(0.02) + (0.25)(0.04) 0.034
1. De una baraja de 52 cartas se extraen dos de ellas, una tras otra y sin reposición.
a) Encuentre la probabilidad de que las dos sean ases.
b) Halle la probabilidad de que la primer carta extraída sea un as y la segunda sea
un diez.
c) Obtenga la probabilidad de que una carta extraída sea un as y la otra carta
extraída sea un diez.
2. Una caja contiene 15 bolas iguales salvo en su color. Hay 6 rojas, 4 blancas y 5
azules. Se extraen dos bolas, una tras otra sin reposición. Calcular las siguientes
probabilidades:
a) las dos bolas son azules;
b) las primera es blanca y la segunda es roja;
c) Se extraiga una bola blanca y otra bola roja.
4. En el ejemplo anterior suponga que la persona que lanza la moneda no dice si cayó
cara o sello, pero si dice que tomó una canica roja.
a) ¿Cuál es la probabilidad de que se haya tomado de la caja I?
b) ¿Cuál es la probabilidad de que se haya tomado de la caja II?
7. Una prueba diagnóstica para una enfermedad es tal que detecta correctamente la
enfermedad en el 90 % de los individuos que en realidad tienen la enfermedad.
También, si una persona no tiene la enfermedad, la prueba reportará que él o ella
no la tiene con probabilidad 0.97. Sólo el 2 % de la población tiene la enfermedad
en cuestión. Si una persona es seleccionada al azar de la población y la prueba
diagnóstica indica que tiene la enfermedad, ¿cuál es la probabilidad condicional de
que tenga en realidad la enfermedad? ¿considera confiable esta prueba diagnóstica?
10. Los registros de delincuencia urbana muestran que el 20 % de todos los delitos son
violentos y que el 80 % no lo son. El 90 % de los delitos violentos son denunciados,
mientras que el 70 % de los no violentos se denuncian.
a) ¿Cuál es la probabilidad de que se denuncie un delito?
b) Si un delito es denunciado ¿cuál es la probabilidad de que sea violento?
c) Si un delito es denunciado ¿cuál es la probabilidad de que no sea violento?
11. Una máquina operada por un trabajador produce un artículo defectuoso con proba-
bilidad 0.01 si el trabajador sigue exactamente las instrucciones de operación de la
máquina, y con probabilidad 0.03 si no las sigue. Si el trabajador sigue las instruc-
ciones el 90 % del tiempo, ¿qué proporción de todos los artículos producidos por la
máquina será defectuosa?
12. En cierta ciudad francesa hay tres aeropuertos, el aeropuerto A maneja el 50 % de todo
el tráfico aéreo y los aeropuertos B y C manejan el 30 % y el 20 % respectivamente.
Los porcentajes de detección de armas en los tres aeropuertos son 0.9, 0.8 y 0.85
respectivamente. Si se encuentra un pasajero en uno de estos tres aeropuertos llevando
un arma de fuego,
a) ¿cuál es la probabilidad de que el pasajero use el aeropuerto A?
b) ¿cuál es la probabilidad de que el pasajero use el aeropuerto C?
13. Un estudiante contesta una pregunta de opción múltiple de un examen que ofrece
cuatro posibles respuestas. Suponga que la probabilidad de que el estudiante conozca
la respuesta a la pregunta es 0.8 y la probabilidad de que adivine es 0.2.
Suponga que si el estudiante adivina, la probabilidad de que seleccione la respuesta
correcta es 0.25. Si el estudiante contesta correctamente una pregunta, ¿cuál es la
probabilidad de que realmente conozca la respuesta correcta?
14. Hay dos métodos, A y B, para enseñar cierta habilidad industrial. El porcentaje de
personas que han hecho el curso y reprueban es 20 % para el método A, y s 10 % para
el método B. El método A es más económico y por tanto se usa el 70 % de las veces,
mientras que el método B se usa el 30 % de las veces.
A Pablo se le enseñó la habilidad por uno de los dos métodos pero no la aprendió
correctamente. ¿Cuál es la probabilidad de que se le haya enseñado por el método A?
A María se le enseñó la habilidad y la aprendió satisfactoriamente. ¿Cuál es la
probabilidad de que se le haya enseñado por el método B?
CAPÍTULO 3
3.1. Introducción
79
80 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
x 0 1 2
observe que las dos propiedades del teorema anterior se
p(x) 0.25 0.50 0.25
satisfacen: 0 ≤ P (i) ≤ 1, para i = 0, 1, 2.
F (x) 0.25 0.75 1
3.2. VALOR ESPERADO Y VARIANZA DE VARIABLES ALEATORIAS DISCRETAS 81
Aunque consideraremos las variables aleatorias continuas en la parte final del curso, se da
su definición para comprender la diferencia entre estos dos tipos de variables.
3.6 Definición. Una variable aleatoria que puede asumir cualquier valor numérico en un
intervalo de números reales, se llama variable aleatoria continua.
Los resultados experimentales basados en escalas de medición tales como el tiempo, el peso,
la distancia, o la temperatura se describen por medio de este tipo de variable.
Un ejemplo de variable aleatoria continua puede ser el tiempo transcurrido entre dos
llamadas telefónicas consecutivas en una oficina de servicio al cliente, en este caso la variable
X puede tomar cualquier valor no negativo: x ≥ 0.
El valor esperado de una variable aleatoria, también llamado media o esperanza, es una
medida de su posición central que nos suministra el resultado medio teórico de un número
infinito de ensayos. Podemos considerar este valor esperado en el sentido de que constituye
el valor promedio que esperaríamos obtener si los ensayos pudiesen continuar de manera
indefinida.
Aun cuando el valor esperado proporciona el valor medio de la variable aleatoria, a menudo
necesitamos de una medida de variabilidad o dispersión. Así como la varianza se usó en la
parte de estadística descriptiva para resumir la variabilidad de los datos, ahora la varianza
se usa para resumir la variabilidad de una variable aleatoria.
82 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
3.9 Nota. El valor esperado también se conoce como la media y se denota E(X) = µ.
3.10 Ejemplo. Calcular el valor esperado de la variable aleatoria del ejemplo 3.5.
3.11 Definición. Si X es una variable aleatoria discreta que tiene media E(X) = µ, la
varianza de la variable aleatoria X, denotada V (X) = σ 2P , se define como el valor
esperado de (X − µ)2 , esto es: V (X) = σ 2 = E[(X − µ)2 ] = (x − µ)2 p(x)
x
La desviación estándar de X, denotada σ, es la raíz cuadrada positiva de la varianza.
3.13 Nota. Existe una fórmula muy práctica para hallar la varianza de una variable
aleatoria discreta: V (X) = σ 2 = E(X 2 ) − µ2
2
E(X 2 ) = x2 p(x) = 0 · 0.25 + 1 · 0.50 + 4 · 0.25 = 1.50 por tanto
P
x=0
El siguiente teorema se refiere al valor esperado y varianza de una variable aleatoria discreta.
3.14 Teorema. Sea X una variable aleatoria discreta, sea c una constante y sean
g(X), g1 (X), g2 (X), . . . , gk (X), funciones de la v.a.d. X. Entonces:
E(c) = c
x 0 1 2 3 4 5
x2 0 1 4 9 16 25
p(x) 0.10 0.40 0.20 0.15 0.10 0.05
Por consiguiente
P la ganancia esperada será:
7998 2
E(X) = µ = x p(x) = −20 · 8000 + 23980 · 8000 = −14
x
La ganancia esperada en este caso es una pérdida de $14.
3.17 Ejemplo. Determine la prima anual para una póliza de seguro de $10000 que cubre
un evento que en un largo tiempo, ha ocurrido a razón de 2 veces en 100. Sea X igual a la
ganancia financiera anual para la compañia de seguros que resulte de la venta de la póliza y
sea C igual a la prima anual desconocida. Calcule el valor de C tal que la ganancia esperada
sea igual a cero (si la ganancia es cero hay un punto de equilibrio).
Comencemos por determinar los valores que la ganancia X puede tomar y luego determinar
p(x). Si el evento no ocurre durante el año, la compañia ganará la prima de x = C dólares.
Si el evento sucede la ganancia será negativa, esto es, la compañia perderá x = 10000 dólares
menos la prima de C dólares ya recolectada, es decir, x = −(10000 − C) = C − 10000.
98 2
Las probabilidades asociadas con estos dos valores de x son 100 y 100 respectivamente.
98 2
Al resolver la ecuación µ = 0 se obtiene: C · 100 + (C − 10000) · 100 = 0 =⇒
98C 2C
100 + 100 − 200 = 0 =⇒ C = 200. Por tanto, Si la compañia de seguros cobra una prima
anual de $ 200, la ganancia es cero y así se obtiene el punto de equilibrio.
3.2. VALOR ESPERADO Y VARIANZA DE VARIABLES ALEATORIAS DISCRETAS 85
x 11 12
p(X = x) 0.0417 0.0139
p(X ≥ x) 0.0592 0.0176
86 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
Para efectos de pruebas internas que debe realizar el laboratorio antes de sacar al mercado
su producto, con una muestra de 15 madres, ¿cuál debe ser la cantidad mínima de niñas
observadas para que su producto sea confiable?
Nos interesa el menor valor de x que produce una probabilidad P (X ≥ x) extremadamente
pequeña, es decir, menor o igual a 0.05.
De la tabla podemos observar que dicho valor es x = 12, puesto que P (X ≥ 12) = 0.0176.
Al aplicar la regla del suceso poco común deducimos que si 15 madres han dado a luz
12 niñas, el supuesto que dice que la probabilidad de nacimiento de cada género es igual
posiblemente no es cierto, de esta manera la probabilidad de que nazca una niña será mayor
que la de tener un niño.
Concluímos que el laboratorio en sus pruebas internas, debe observar que en una muestra
de 15 madres que usan su producto, por lo menos 12 de ellas dan a luz una niña.
2. Una compañía tiene cinco solicitantes para dos puestos de trabajo: dos mujeres y
tres hombres. Suponga que los 5 solicitantes son igualmente calificados y que no hay
preferencia para escoger su género. Sea X igual al número de de mujeres escogidas
para ocupar los dos puestos de trabajo. Encuentre p(x) y luego halle µ, σ 2 y σ.
a) Determine p(4).
b) Encuentre µ, σ 2 y σ.
c) Localice el intervalo µ ± σ y calcule la probabilidad de que X caiga en ese
intervalo.
d) Localice el intervalo µ ± 2σ y halle la probabilidad de que X caiga en ese
intervalo.
3.3. EJERCICIOS DE VARIABLES ALEATORIAS, MEDIA Y VARIANZA 87
8. Se lanza un par de dados, la suma T del número de puntos que aparecen en las caras
superiores de los dados pueden asumir cualquier valor entero en el intervalo [2, 12].
a) Encuentre la distribución de probabilidad de T y grafíquela.
b) Determine µ, σ 2 y σ.
c) Localice µ ± σ en el eje t de la gráfica del inciso a). ¿Qué proporción de las
mediciones caen en ese intervalo?
d) Localice µ ± 2σ en el eje t de la gráfica del inciso a). ¿Qué proporción de las
mediciones caen en ese intervalo?
e) ¿Cuál es la probabilidad de que T sea menor que 4?
f ) ¿Cuál es la probabilidad de que T sea mayor que 8?
9. Una pieza de equipo electrónico contiene 6 chips de computadora, dos de los cuales
son defectuosos. Al azar se se seleccionan tres chips, se retiran del equipo y se
inspeccionan. Sea Y igual al número de chips defectuosos seleccionados en la muestra,
donde y = 0, 1 o 2. Halle p(y) y también encuentre µ, σ 2 y σ.
10. A una compañia de transporte le cuesta $14.8 entregar un paquete pequeño antes
de 24 horas. La compañía cobra $15.5 por el envío, pero garantiza la devolución del
dinero si no lo entrega antes de 24 horas.
Si la compañia no hace entregas en solo 2 % de su paquetería antes del periodo de 24
horas, ¿cuál es la ganancia esperada por paquete?
88 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
11. El representante de una empresa manufacturera está considerando tomar una póliza
de seguro para cubrir posibles pérdidas en que incurre al vender un nuevo
producto. Si el producto es un completo fracaso, el representante incurrirá en una
pérdida de $ 800 000. Si es sólo un éxito moderado, incurrirá en una pérdida de
$ 250 000. Las probabilidades de que el producto sea un fracaso o un éxito
moderado son de 0.01 y 0.05 respectivamente. ¿Qué prima debe cobrar la
compañia de seguros por póliza para no tener pérdida ni ganancia?
12. Una persona puede asegurar un diamante de $ 50 000 por su valor total si paga una
prima de C dólares. Si la probabilidad de robo en un año determinado es 0.01, ¿qué
prima debe cobrar la compañía si desea que la ganancia esperada sea igual a $ 1 000?
13. Se lanzan cuatro monedas corrientes: una de $ 50, otra de $ 100, otra de $ 200 y otra de
$ 500. Sea Y la variable aleatoria que indica el número de caras observadas. Encuentre:
a) La distribución de probabilidad p(y). b) µ, σ 2 y σ
c) La probabilidad de ver a lo sumo una cara.
d) La probabilidad de ver por lo menos dos caras.
15. Cinco balotas numeradas con 1, 2, 3, 4 y 5 se ponen en una urna. Dos de ellas se
seleccionan al azar simultáneamente. Encuentre la distribución de probabilidad, la
media y varianza para lo siguiente:
a) X : el mayor de los dos números observados.
b) Y : la suma de los dos números observados.
16. En un juego de azar una persona saca una sola carta de una baraja corriente de 52
cartas. A un jugador le pagan $ 15 si saca un rey o una reina. Le pagan $ 5 si saca
un as o un diez. Si en cambio el jugador extrae cualquier otra carta debe pagar $ 4.
Obtenga la ganancia esperada para el jugador.
21. En una prueba técnica de selección de género, un ensayo clínico da como resultado
13 niñas en 20 nacimientos.
x 13 14 15 16 17 18 19 20
p(x) 0.0739 0.037 0.0148 0.0046 0.0011 0.0002 0.0 0.0
A partir de la tabla anterior obtenga:
a) La probabilidad de observar x = 13 niñas en 20 nacimientos.
b) La probabilidad de observar 13 o más niñas en 20 nacimientos.
c) ¿Qué probabilidad es relevante para determinar si x = 13 niñas en 20 nacimientos
es un suceso inusualmente alto: el del literal a) o el del literal b)?
d) ¿La presencia de x = 13 niñas en 20 nacimientos es un suceso inusualmente alto?
40 + 60 + 75 + 100 275
El teorema anterior implica que la media es µ= = = 68.75.
4 4
(40 − 68.75) + (60 − 68.75) + (75 − 68.75) + (100 − 68.75)2
2 2 2
La varianza es σ 2 = =⇒
4
2 2 2
(−28.75) + (−8.75) + (6.25) + (31.25) 2 7675
σ2 = = = 479.6875.
4 √ 4
La desviación estándar es σ = 479.6875 = 21.9.
3.24 Ejemplo. Se lanza un dado corriente una sola vez. La variable Y consiste en observar
el número de su cara superior. Halle la distribución de probabilidad, la media, la varianza
y la desviación estándar.
El espacio muestral es S = { 1, 2, 3, 4, 5, 6 }.
Como cada evento simple tiene la misma probabilidad se trata de una distribución uniforme.
1
La distribución de probabilidad es: p(x) = , x = 1, 2, 3, 4, 5, 6.
6
1+2+3+4+5+6 21
El valor esperado es igual a µ= = = 3.5.
6 6
La varianza es
(1 − 3.5)2 + (2 − 3.5)2 + (3 − 3.5)2 + (4 − 3.5)2 + (5 − 3.5)2 + (6 − 3.5)2
σ2 = = 2.917
6
√
La desviación estándar es σ = 2.917 = 1.7.
6. El primer dígito del número de serie de una pieza es igualmente factible que sea
cualquiera de los digitos del 0 al 9. Si se selecciona una pieza de un lote grande y X
es el primer dígito del número de serie.
Encuentre la distribución de probabilidad de X, la media y la varianza.
¿Cuál es la probabilidad de que la v.a.d. tome un valor que exceda de 6?
7. El profesor de física rifa un esfero de lujo entre sus 25 estudiantes de física mecánica.
Para ello los ennumera del 1 al 25 según el orden alfabético.
La variable aleatoria discreta Y consiste en elegir al azar un número de los 25 posibles.
Encuentre la distribución de probabilidad de esta v.a.d. así como la media, la varianza
y la desviación estándar. ¿Cuál es la probabilidad de que el ganador del esfero sea
uno de los primeros ocho estudiantes de la lista?
3.26 Ejemplo. Se lanza una moneda corriente 4 veces y se registra el resultado, éxito si
se observa una cara y fracaso si se aprecia un sello.
a) Verifique que se trata de un experimento binomial.
b) Determine el espacio muestral de la variable aleatoria Y que cuenta el número de éxitos
observados.
c) Encuentre la función de probabilidad p(y) = P (Y = y), y la función de distribución
acumulada F (y) = P (Y ≤ y).
a) El número de pruebas idénticas es cuatro. Cada prueba solo presenta dos posibilidades:
éxito si resulta cara: c, fracaso si se observa sello: s.
La probabilidad de éxito en cada prueba es la probabilidad de observar una cara: 0.5.
La probabilidad de fracaso en cada prueba es 1 − p = 1 − 0.5 = 0.5.
Las pruebas son independientes: el resultado de un lanzamiento no interfiere en el resultado
de otro lanzamiento.
b) Si c denota cara, mientras que s representa sello, el espacio muestral se compone de:
S = {cccc, cccs, ccsc, cscc, sccc, ccss, cscs, sccs, cssc, scsc, sscc, sssc, sscs, scss, csss, ssss}
c) Debido a que la moneda es corriente, podemos asumir que cada uno de los 16 elementos
1
del espacio muestral tienen la misma probabilidad: 16 = 0.0625.
El espacio muestral nos permite encontrar tanto la función de probabilidad como la función
de distribución acumulada, tales funciones se reúnen en la siguiente tabla.
y 0 1 2 3 4
p(y) 0.0625 0.25 0.375 0.25 0.0625
F (y) 0.0625 0.3125 0.6875 0.9375 1
3.6. DISTRIBUCIÓN BINOMIAL 93
3.27 Definición. Una variable aleatoria Y tiene una distribución binomial basada en
n pruebas con probabilidad
de éxito p si y solo si
n y n−y
p(y) = p q , y = 0, 1, 2, . . . , n, 0 ≤ p ≤ 1.
y
3.28 Teorema. Sea Y una variable aleatoria binomial basada en n pruebas con probabilidad
p de éxito. Entonces µ = E(Y ) = np y σ 2 = V (Y ) = npq.
Una prueba se puede definir como un tiro libre, éxito como una canasta, y fracaso si falla
la cesta. Según esto, n = 10, p = 0.8, q = 1 − 0.8 = 0.2 y el número Y de veces que
enceste el jugador es una variable aleatoria binomial.
10
a) p(7) = P (Y = 7) = 0.87 0.210−7 = 0.2013
7
También es posible obtener este valor con solo manejo de la tabla de la binomial con
n = 10 y p = 0.8. Recordando que p(y) = F (y) − F (y − 1), ubicamos en la tabla los
valores r = 7, r = 6 y hacemos la resta: p(7) = F (7)−F (6) = 0.3222−0.1209 = 0.2013.
c) P (menos de cuatro) = P (Y < 4) = p(0) + p(1) + p(2) + p(3) = F (3) = 0.0009, este
resultado lo arroja directamente la tabla de la distribución binomial.
3.31 Nota. Cuando se realiza un muestreo sin reemplazo, los eventos pueden considerarse
independientes, si el tamaño de la muestra n no es mayor que el 5 % del tamaño de la
n
población N , es decir, si N ≤ 0.05.
3.32 Ejemplo. Suponga que un lote de 5000 fusibles electrónicos contiene 5 % de piezas
defectuosas. a) Si se prueba una muestra de 5 fusibles encuentre la probabilidad de hallar
al menos uno defectuoso. b) Si 25 fusibles se prueban al azar de este lote encuentre la
probabilidad de observar al menos tres defectuosos.
Aunque el muestreo se realiza sin reemplazo, es razonable suponer que Y , el número
observado de fusibles defectuosos, tiene distribución binomial porque el lote es grande
comparado con la muestra.
a) El enunciado nos dice que n = 5, p = 0.05.
5
Aplicaremos la ley del complemento, por tanto hallamos P (Y = 0) = (0.050 )(0.955 ) =
0
0.774. La probabilidad solicitada es P (Y > 0) = 1 − P (Y = 0) = 1 − 0.774 = 0.226.
Observe que hay una probabilidad relativamente grande de ver al menos uno defectuoso,
aún cuando la muestra es muy pequeña.
b) Ahora n = 25, p = 0.05.
Si acudimos a las tablas de la binomial también podemos aplicar la ley del complemento,
como P (Y ≤ 2) = 0.873 entonces P (Y ≥ 3) = 1 − P (Y ≤ 2) = 1 − 0.873 = 0.127.
2. Se conjetura que hay impurezas en el 30 % del total de pozos de agua potable de cierta
comunidad rural. Como es muy costoso probar todos los pozos del área, se eligen 10
al azar para someterlos a una prueba de impurezas.
¿Cuál es la probabilidad de que exactamente 3 pozos tengan impurezas?
¿Cuál es la probabilidad de que más de 3 pozos tengan impurezas?
¿Cuál es la probabilidad de que menos de 3 pozos tengan impurezas?
6. Suponga que los motores de un avión operan de forma independiente y que tiene una
probabilidad de falla de 0.4. Un avión tiene un vuelo seguro si funcionan al menos la
mitad de sus motores. Si un avión tiene 4 motores y otro tiene 2 motores, diga cual
de los dos aviones tiene mayor probabilidad de realizar un vuelo exitoso.
8. De acuerdo con el procurador de justicia de Bogotá, por cada asalto o robo que
se denuncia ante las autoridades, hay otros cuatro que no son denunciados. Si en
una tarde ocurren 9 delitos de este tipo en una localidad de Bogotá, determine la
probabilidad de que:
a) exactamente tres de ellos hayan sido denunciados;
b) ninguno haya sido denunciado;
c) No más de siete hayan sido denunciados.
9. Un individuo afirma que es capaz de distinguir a simple vista entre una perla auténtica
y una falsa el 70 % de las veces. Para comprobar si lo que afirma es cierto, se muestran
una por una seis perlas diferentes escogidas al azar y se aceptará lo que afirma si logra
establecer la autenticidad (o falsedad) en por lo menos cinco de las perlas.
a) Halle la probabilidad de que el individuo pase la prueba, si sólo está adivinando.
b) Si es cierto lo que él afirma, obtenga la probabilidad de que no logre pasar la
prueba.
10. Una máquina produce piezas metálicas, de las cuales el 5 % son de calidad excelente.
¿Cuántas piezas deberán producirse para que la probabilidad de que haya por lo
menos una de calidad excelente sea mayor a 0.5?
11. Según el ministerio de transporte, el 20 % de los conductores de transporte público
en Bogotá manejan imprudentemente. Encuentre la probabilidad de que 4 de los
próximos 10 conductores de transporte público que pasen por un retén policiaco
conduzcan imprudentemente.
Suponga que una población contiene un número finito N de elementos que posee una de dos
características, digamos elementos rojos y elementos negros. Así r de los elementos serían
rojos y N − r son negros. Una muestra de n elementos se selecciona al azar de la población
y la variable aleatoria de interés es X, el número de elementos rojos de la muestra. Esta
variable aleatoria discreta se conoce como la dstribución de probabilidad hipergeométrica.
En general, nos interesa la probabilidad de seleccionar x éxitos de los r artículos que poseen
la característica satisfactoria, y n − x fracasos de los N − r artículos que no poseen la
característica buscada cuando una muestra aleatoria de tamaño n se selecciona de una
totalidad de N artículos. Esto se conoce como un experimento hipergeométrico, es decir,
aquel que posee las siguientes propiedades:
De un lote de N artículos se selecciona una muestra aleatoria de tamaño n sin
reemplazo.
r de los N artículos se pueden clasificar como éxitos, y N − r se clasifican como
fracasos
3.36 Ejemplo. Se consideran lotes con 50 componentes electrónicos, que contienen seis
elementos defectuosos. El procedimiento para obtener muestras del lote consiste en
seleccionar 10 componentes uno tras otro (sin reemplazo) y rechazar el lote si se encuentra
más de un componente defectuoso. ¿Cuál es la probabilidad de rechazar un lote de estos?
El lote se rechaza si x = 2, 3, 4, 5, 6.
Es más sencillo aplicar la ley del complemento y tan
solo hallar la probabilidad de que x tome los valores
x = 0, 1. Ahora N = 50, n = 10, r = 6, x = 0, 1.
6 44 6 44
0 10 1 9
p(0) + p(1) = +
50 50
10 10
= 0.2415 + 0.4141 = 0.6556. Por consiguiente la
probabilidad buscada es 1 − 0.6556 = 0.3444.
2. Un plato de dulces contiene cinco dulces azules y tres rojos. Un niño selecciona tres
dulces sin verlos. Calcule la probabilidad de que:
a) el niño seleccione dos dulces azules y uno rojo.
b) el niño seleccione tres dulces rojos.
c) el niño seleccione tres dulces azules.
3. Un grupo de cinco solicitantes para un par de trabajos idénticos está formado por tres
hombres y dos mujeres. Suponga que los cinco solicitantes son igualmente calificados y
que no se da preferencia para escoger género alguno. Sea X igual al número de mujeres
seleccionadas para ocupar los dos cargos. Encuentre la distribución de probabilidad
para X y halle la media y la varianza de X.
5. Una urna contiene 10 canicas, de las cuales 5 son verdes, 2 son azules y 3 son rojas.
Tres canicas se van a sacar de la urna, una a la vez y sin reemplazo. ¿Cuál es la
probabilidad de que las tres canicas extraídas sean verdes?
6. Una corporación hace un muestreo sin reemplazo para n = 3 firmas, para determinar
aquella de la cual comprar abastecimientos. La muestra se ha de seleccionar de un
grupo de seis firmas, de las cuales cuatro son locales y dos no lo son. Denote con Y el
número de firmas no locales de entre las tres seleccionadas. Calcule las siguientes pro-
babilidades: a) P (Y = 1) b) P (Y ≥ 1) c) P (Y ≤ 1)
7. Las especificaciones exigen que un termistor se pruebe entre 9000 y 10000 ohms
a 25◦ Celsius. Se dispone de 10 termistores y 3 de éstos han de ser seleccionados
para usarlos. Denote con Y el número de entre los tres que no se apegan a las
especificaciones. Encuentre las distribuciones de probabilidad para Y (en forma
tabular) dadas en las siguientes condiciones:
a) Dos temistores no se apegan a las especificaciones de entre los 10 disponibles.
b) Cuatro temistores no se apegan a las especificaciones de entre los 10 disponibles.
algunos clientes reciben máquinas que no funcionan bien. Entre ocho fotocopiadoras
disponibles hoy, tres de ellas están funcionando mal. Un cliente desea rentar cuatro
máquinas de inmediato. Calcule la probabilidad de que el cliente reciba:
a) x máquinas que funcionen mal.
b) por lo menos una máquina que funcionen mal.
9. Se reparten cinco cartas al azar sin reemplazo de una baraja de 52 cartas. ¿Cuál
es la probabilidad de que la mano contenga por lo menos un as?
Si de una baraja ordinaria de 52 cartas se toman 7 y se reparten, ¿cuál es la
probabilidad de que al menos una de ellas sea una reina.
Si a una persona se le reparten varias veces 12 cartas de una baraja de 52 cartas
¿cuántas cartas de corazones por mano puede esperar?
11. Un recipiente tiene 12 botellas de vino, 3 de ellas se han echado a perder. Una muestra
de 4 botellas se selecciona al azar de la caja.
a) Encuentre la distribución de probabilidad para X, el número de botellas de vino
echado a perder. b) Calcule la media y la varianza de X.
12. Una pieza de equipo electrónico contiene seis chips de computador, dos de los cuales
están defectuosos. Tres chips se seleccionan para inspeccionarlos y se registra el nú-
mero de defectuosos. Encuentre la distribución de probabilidad para X : el número
de chips defectuosos y encuentre la probabilidad de no ver artículos defectuosos.
13. Se selecciona al azar un comité de tres personas a partir de cuatro médicos y dos
enfermeras. Encuentre la distribución de X : el número de médicos en el comité.
Calcule P (2 ≤ X ≤ 3).
14. (B) Una ciudad vecina considera entablar una demanda de anexión en contra de
una subdivisión del condado de 1200 residencias. Si los ocupantes de la mitad de
las residencias objetan la anexión ¿cuál es la probabilidad de que en una muestra
aleatoria de 10 residencias, al menos 3 objeten la anexión?
15. (B) Se estima que 4000 de los 10000 residentes con derecho al voto de una ciudad
están en contra de un nuevo impuesto sobre las ventas. Si se seleccionan al azar 15
votantes y se les pide su opinión, ¿cuál es la probabilidad de que a lo sumo 7 estén
en contra del nuevo impuesto?
3.10. DISTRIBUCIÓN GEOMÉTRICA Y DISTRIBUCIÓN BINOMIAL NEGATIVA 103
3.39 Definición. Se dice que una v.a.d. Y tiene una distribución de probabilidad
geométrica si y solo si p(y) = q y−1 p para y = 1, 2, 3, . . . donde 0 ≤ p ≤ 1 y
q = 1 − p.
Decir que uno de cada cien resulta defectuoso equivale a decir que la probabilidad de
encontrar uno defectuoso es p = 0.01, de esta manera p(5) = 0.994 0.01 = 0.0096
Encontrar el tiempo esperado antes de encontrar una falla equivale a hallar el valor esperado,
1 1
E(Y ) = µ = = = 50, es decir, 50 horas.
p 0.02
Distribución binomial negativa
Una variable aleatoria con distribución binomial negativa se origina de un contexto
semejante al que da la distribución geométrica. De nuevo nos concentramos en intentos
independientes e idénticos, cada uno de los cuales conduce a uno de dos resultados: éxito o
fracaso. La probabilidad p de éxito se mantiene igual de un intento a otro. La distribución
geométrica maneja el caso donde estamos interesados en el número de intento en el que
ocurre el primer éxito. ¿Qué pasa si estamos interesados en conocer el número de intento
en el que ocurre el segundo éxito, o el el tercer éxito o el cuarto éxito? La distribución que
se ajusta a la variable aleatoria X igual al número del intento en el que ocurre el r-ésimo
éxito (r = 2, 3, 4, . . .) es la distribución binomial negativa.
3.45 Teorema. Si X es una variable aleatoria con distribución binomial negativa, entonces
r rq
µ = E(X) = y σ 2 = V (X) = .
p p2
3.46 Ejemplo. Un estudio geológico indica que un pozo petrólero de exploración
perforado en una región particular debe producir petróleo con probabilidad 0.2.
Encuentre la probabilidad de que el tercer descubrimiento de petróleo llegue en el quinto
pozo perforado. También determine la media y la varianza.
Las perforaciones son independientes y con probabilidad 0.2 de descubrir petróleo en cual-
quiera de los pozos. Sea X el número del intento en el que ocurre el tercer descubrimiento
de petróleo. Por todo esto X tiene distribución binomial
negativa con p = 0.2 y r = 3.
4
La probabilidad requerida es P (X = 5) = p(5) = 0.23 0.82 = 6 · 0.008 · 0.64 = 0.0307
2
r 3 rq 3 · 0.8
La media es E(X) = = = 15 y la varianza σ 2 = 2 = = 60.
p 0.2 p 0.22
3.47 Ejemplo. Considere el uso de un medicamento que se sabe que es eficaz en el 60 % de
los casos que utiliza. El uso del medicamento se considerará un éxito si proporciona algún
alivio al paciente.
Nos interesa calcular la probabilidad de que el quinto paciente que experimente alivio sea
el séptimo paciente en recibir el medicamento en una semana determinada.
6
Ahora p = 0.6 y r = 5, por tanto P (X = 7) = p(7) = 0.65 0.42 = 0.1866
4
3.48 Ejemplo. En la serie de campeonato de la NBA (national basketball association), el
equipo que gane 4 juegos (de máximo 7) será el ganador. Suponga que los equipos A y B
se enfrentan en los juegos de campeonato y que el equipo A tiene una probabilidad de 0.55
de ganarle al equipo B.
a) ¿Cuál es la probabilidad de que el equipo A gane la serie en 6 juegos?
b) ¿Cuál es la probabilidad de que el equipo A gane la serie?
a) Estamos ante una variable binomial negativa con p = 0.55 y r = 4, por tanto
5
P (X = 6) = p(6) = 0.554 0.452 = 0.1853
3
2. Suponga que el 30 % de los solicitantes para cierto trabajo industrial posee capacita-
ción avanzada en programación computacional. Los candidatos son elegidos aleatoria-
mente entre la población y entrevistados en forma sucesiva. Encuentre la probabilidad
de que el primer solicitante con capacitación avanzada en programación se encuentre
en la quinta entrevista. ¿Cuál es el número esperado de solicitantes que será necesario
entrevistar para hallar el primero con capacitación avanzada?
5. Se lanza un par de dados y se suman los puntajes de sus caras superiores. Encuentre la
probabilidad de observar el primer nueve antes del quinto lanzamiento. Determine el
número esperado de lanzamientos esperado para observar el primer nueve (considere
p y q como fracciones).
6. Los empleados de una empresa que manufactura aislamientos están siendo examinados
en busca de indicios de asbesto en sus pulmones. La empresa ha sido requerida para
enviar tres empleados que tengan indicios positivos de asbesto a un centro médico para
realizarles exámenes adicionales. Si 40 % de los empleados tienen indicios positivos de
asbesto en sus pulmones, encuentre la probabilidad de que diez empleados deban ser
examinados para hallar tres positivos. Si cada examen cuesta $20, encuentre el valor
esperado y la varianza del costo total de realizar los exámenes necesarios para hallar
los tres positivos.
3.12. DISTRIBUCIÓN DE POISSON 107
7. Diez por ciento de los motores fabricados en una línea de ensamble son defectuosos.
Si los motores se seleccionan al azar uno a uno y se prueban,
a) Encuentre la probabilidad de que el tercer motor defectuoso sea hallado en el
quinto intento.
b) Calcule la probabilidad de que el tercer motor defectuoso sea hallado en el quinto
intento o antes.
c) Determine la media y la varianza del número del intento en el que sea hallado el
tercer motor no defectuoso.
8. La probabilidad de que una persona que vive en -Bogotá tenga un perro es 0.3. Calcule
la probabilidad de que la décima persona entrevistada al azar sea la quinta que tiene
un perro.
9. Obtenga la probabilidad de que una persona que lanza una moneda observe:
a) la tercer cara en el séptimo lanzamiento;
b) la primer cara en el cuarto lanzamiento.
10. Un científico inocula a varios ratones, uno a la vez, el virus que produce una
enfermedad, hasta que encuentra a dos que contraen la enfermedad. Si la
probabilidad de contraer la enfermedad es 0.1, halle la probabilidad de tener que
inocular a ocho ratones.
11. Suponga que la probabilidad de que una persona crea un rumor acerca de las
transgresiones de cierto cantante de rock famoso es de 0.8. Encuentre la
probabilidad de que:
a) la sexta persona que escuche este rumor sea la cuarta en creerlo;
b) la tercera persona que escuche este rumor sea la primera en creerlo.
El intervalo de tiempo puede ser de cualquier duración, como un minuto, un día, una
semana, un mes o tal vez un año. Por ejemplo, un experimento de Poisson podría generar
observaciones para la variable aleatoria X que representa el número de llamadas telefónicas
por hora que recibe una oficina; el número de días que una escuela distrital permanece
cerrada debido a los paros nacionales o educativos en un año escolar; o el número de
partidos de béisbol suspendidos a causa de la lluvia durante la temporada deportiva.
108 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
La región específica podría ser un segmento de recta, un área, un volumen o quizá una
pieza de material. En estos casos X podría representar el número de ratas por hectárea;
el número de bacterias en un cultivo dado; o el número de errores mecanográficos por
página. Un experimento de Poisson se deriva del proceso de Poisson, el cuál se describe a
continuación, tenga presente que aunque solo se menciona un intervalo de tiempo, en lugar
de éste puede tratarse de una región específica.
3.50 Teorema. Si Y es una variable aleatoria que posee distribución de Poisson con
parámetro λ entonces µ = E(Y ) = λ y σ 2 = V (Y ) = λ.
3.52 Ejemplo. El número promedio de camiones que llegan diariamente a cierta ciudad
portuaria es 10. Las instalaciones en el puerto pueden alojar a lo sumo 15 camiones por
día. ¿Cuál es la probabilidad de que en un día determinado lleguen más de 15 camiones y
se tenga que rechazar algunos camiones?
2. El número medio de automóviles que entran al túnel de una montaña por periodo
de dos minutos es uno. Un número excesivo de autos que entran al túnel durante un
breve periodo de tiempo produce una situación peligrosa.
a) Encuentre la probabilidad de que el número de autos que entran al túnel en un
periodo de dos minutos sea de por lo menos cuatro autos.
b) Halle la probabilidad de que el número de autos que entran al túnel en un periodo
de seis minutos sea de por lo menos cuatro autos.
3. Sea Y una v.a.d. con distribución de Poisson con media λ y sean X y W otras dos
variables aleatorias definidas como X = Y (Y − 1) y W = Y (Y + 1).
Encuentre el valor esperado de X y de W .
8. Cierta región del este de Estados Unidos resulta afectada en promedio por 6 huracanes
al año. Halle la probabilidad de que para el próximo año esta región sea afectada por
a) menos de cuatro huracanes;
b) entre seis y ocho huracanes.
lı́m F (y) = 1
y→∞
Si Y es una variable aleatoria continua y si a y b son constantes tales que a < b, entonces
P (Y = a) = 0 y P (Y = b) = 0, por tanto:
Zb
P (a ≤ Y ≤ b) = P (a < Y ≤ b) = P (a ≤ Y < b) = P (a < Y < b) = f (y) dy.
a
114 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
2
3.62 Ejemplo. Suponga que el error en la temperatura y
si − 1 ≤ y ≤ 2
de reacción, medida en grados centígrados, es una variable f (y) = 3
0 en otro caso.
aleatoria continua Y con función de probabilidad:
1 1
y2 y3 1
Z
b) P (0 < Y ≤ 1) = dy = =
0 3 9 0 9
y y y
t2 t3 y3 + 1
Z Z
c) Si −1 ≤ y ≤ 2 entonces F (y) = f (t) dt = dt = = por tanto
−∞ −1 3 9 −1 9
03
si y < −1
y +1 2 1
F (y) = si − 1 ≤ y ≤ 2 entonces P (0 < Y ≤ 1) = F (1) − F (0) = 9 − 9 = 91 .
9
1 si y > 2.
Z 0.5 0.5
Calculamos la probabilidad por
P (0 < Y ≤ 0.5) = 3y 2 dy = y 3 = 0.125
medio de la función de densidad: 0 0
3.14. MEDIA Y VARIANZA DE VARIABLES ALEATORIAS CONTINUAS 115
Z ∞ Y con función de
3.64 Definición. El valor esperado de una variable aleatoria continua
densidad f (y) es (siempre que exista la integral): E(Y ) = µ = y f (y) dy
−∞
3.65 Teorema. Sea Y una variable aleatoria continua con función de densidad Z ∞ f (y) y sea
g(Y ) una función de Y . El valor esperado de g(Y ) está dado por E[g(Y )] = g(y) f (y) dy
−∞
3.66 Teorema. Sea Y una variable aleatoria continua, sea c una constante y sean
g(Y ), g1 (Y ), g2 (Y ), . . . , gk (Y ) funciones de Y . Entonces:
E(c) = c
E[c g(Y )] = cE[g(Y )]
E[ g1 (Y ) + g2 (Y ) + . . . + gk (Y )] = E[g1 (Y )] + E[g2 (Y )] + . . . + E[gk (Y )]
La varianza de una v.a.c. se define exactamente igual que la varianza de una v.a.d.
3.67 Definición. Sea Y una variable aleatoria continua con valor esperado µ. La varianza
de Y es igual al valor esperado de (Y − µ)2 , esto es, V (Y ) = σ 2 = E[(Y − µ)2 ].
3.68 Nota. Si Y es una variable aleatoria continua con valor esperado µ, es posible
demostrar que V (Y ) = σ 2 = E(Y 2 ) − µ2 .
(
cy 2 si 0 ≤ y ≤ 2
3.69 Ejemplo. Sea Y una v.a.c. con función de densidad f (y) =
0 en otro caso.
a) Encuentre el valor de c que hace de f (y) una función de densidad.
b) Determine la probabilidad P (1 ≤ Y ≤ 1.2)
c) Calcule el valor esperado y la varianza de Y .
Z ∞
a) La función f (y) debe ser no negativa y satisfacer la identidad f (y) dy = 1,
−∞
cy 3 2 8c
Z ∞ Z 2
2 3
por tanto: f (y) dy = cy dy = = = 1 =⇒ c =
−∞ 0 3 0 3 8
116 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
Z1.2 1.2
3y 2 y3 1.23 − 1
b) P (1 ≤ Y ≤ 1.2) = dy = = = 0.091
8 8 1 8
1
Z∞ Z2 Z2 2
3y 2 3y 3 3y 4 3 · 16 3
c) E(Y ) = µ = y · f (y) dy = y· dy = dy = = = = 1.5
8 8 32 0 32 2
−∞ 0 0
3
por consiguiente, σ 2 = V (Y ) = E(Y 2 ) − µ2 = 2.4 − 1.52 = 20 = 0.15
3. Con base en pruebas extensas, el fabricante de una lavadora determinó que el tiempo
Y (en años) para que el electrodoméstico requiera una reparación mayor, se obtiene
mediante( la siguiente función de densidad de probabilidad
1
si y ≥ 0
f (y) = 4ey/4
0 en otro caso.
a) Verifique que f (y) es una función de densidad, y grafíquela.
b) Los expertos afirman que la lavadora es una ganga si no requiere reparaciones
serias antes de 6 años. De su punto vista luego de hallar la probabilidad P (Y > 6).
c) Obtenga la probabilidad de que este tipo de lavadora requiera una reparación
mayor durante el primer año.
3.15. EJERCICIOS DE MEDIA Y VARIANZA DE V.A.C. 117
(
cy si 0 ≤ y ≤ 2
4. Suponga que Y posee función de densidad f (y) =
0 en otro caso.
a) Encuentre el valor de c que hace de f (y) una función de densidad. Grafique f (y).
b) Use f (y) para hallar la probabilidad P (1 ≤ Y ≤ 2).
c) Encuentre la función de distribución F (y) y trace su gráfica.
d) Emplee la función de distribución F (y) para calcular P (1 ≤ Y ≤ 2).
5. Una gasolinera opera dos bombas, cada una de las cuales puede bombear hasta 10 000
galones de gasolina por mes. La cantidad total de gasolina bombeada en un mes es
una v.a.c. Y (medida en 10 000 galones) con una función de densidad dada por
a) Verifique que f (y) es una función de densidad y
y
si 0 ≤ y < 1 grafíquela.
f (y) = 2 − y si 1 ≤ y ≤ 2 b) Encuentre F (y) y trace su gráfica.
c) Obtenga la probabilidad de que la gasolinera
0 en otro caso.
bombee entre 8 000 y 12 000 galones en el mes de mayo.
d) Dado que la gasolinera bombeó más de 10 000 galones en un mes particular,
encuentre la probabilidad de que haya bombeado más de 15 000 galones en tal mes.
(
c(2 − y) si 0 ≤ y ≤ 2
6. Suponga que Y posee función de densidad f (y) =
0 en otro caso.
a) Halle el valor de c que hace de f (y) una función de densidad. Grafique f (y).
b) Emplee f (y) para hallar la probabilidad P (1 ≤ Y ≤ 2).
c) Encuentre la función de distribución F (y) y trace su gráfica.
d) Use la función de distribución F (y) para calcular P (1 ≤ Y ≤ 2).
e) Obtenga la media y la varianza de Y .
7. Sean a y b constantes y sea Y una v.a.c. con media µ y varianza σ 2 .
Demostrar lo siguiente:
a) E(aY + b) = aµ + b
b) V (aY + b) = a2 σ 2
8. Para ciertas muestras de minerales, la proporción Y de impurezas por muestra es una
v.a.c. con media µ y varianza σ 2 . El valor (en dólares) de cada muestra es W = 5 − Y2 .
Obtenga la media y la varianza del costo de cada muestra W .
9. Sea F (Y ) la función de distribución de la v.a.c. Y .
0 si y ≤ 0
a) Obtenga la función de densidad f (y).
y
si 0 ≤ y < 2
b) Calcule las siguientes probabilidades: F (y) = y82
i) P (1 ≤ Y ≤ 3) ii) P (Y ≤ 1.5)
16 si 2 ≤ y ≤ 4
1 si y ≥ 4.
iii) P (Y ≥ 1.5) iv) P (Y ≥ 1|Y ≤ 3)
118 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
10. La proporción de tiempo diario que todas las cajas de ( un supermercado están
cy 2 (1 − y)4 si 0 ≤ y ≤ 1
ocupadas es una v.a.c. Y con función de densidad f (y) =
0 en otro caso.
a) Determine el valor de c que hace de f (y) una función de densidad.
b) Encuentre el valor esperado de Y .
11. La radiación solar diaria en el estado de Florida,
( durante un mes cualquiera, tiene
3
(y − 2)(6 − y) si 2 ≤ y ≤ 6
una función de densidad dada por f (y) = 32 con
0 en otro caso.
mediciones en cientos de calorias. Verifique que f (y) es una función de densidad y
encuentre la radiación solar diaria esperada para el mes de noviembre.
( √
c y si 0 ≤ y ≤ 1
12. Suponga que Y tiene función de densidad f (y) =
0 en otro caso.
a) Encuentre el valor de c que hace de f (y) una función de densidad de probabilidad.
b) Calcule las probabilidades: i) P (0.3 ≤ Y ≤ 0.6) ii) P (Y < 0.5)
c) Determine el valor esperado y la varianza de Y .
3.72 Ejemplo. Un bus escolar siempre llega a cierto paradero entre las 6 : 00 a.m. y las
6 : 10 a.m. la probabilidad de que el bus llegue en cualquier subintervalo de tiempo es solo
proporcional a la longitud del subintervalo, es decir, sigue una distribución uniforme.
Sea Y el tiempo que un niño de esta ruta debe esperar si llega a las 6 : 00 a.m. al paradero.
0 + 10
e) El valor esperado es E(Y ) = µ = = 5 y la varianza viene dada por la
2
(10 − 0)2 100 25
expresión V (Y ) = σ 2 = = = = 8.333.
12 12 3
3.73 Ejemplo. Suponga que el tiempo máximo que se puede reservar una gran sala de
conferencias de un centro de convenciones son cuatro horas.
Como es natural, frecuentemente se presentan conferencias extensas y cortas, de hecho, se
puede suponer que la duración Y (en horas) de una conferencia tiene distribución uniforme
en el intervalo [0, 4].
a) Encuentre la función de densidad de probabilidad f (y).
b) Calcule la probabilidad de que una conferencia presente una duración a lo sumo de tres
horas.
c) Obtenga la probabilidad de que una conferencia dure entre una y dos horas y media.
d) Determine el valor esperado y la varianza de esta variable aleatoria.
3.17. EJERCICIOS DE DISTRIBUCIÓN UNIFORME CONTINUA 121
(
1
4 si 0 ≤ y ≤ 4
a) La función de densidad es f (y) =
0 en otro caso.
Z3 3
1 y 3
b) P (0 ≤ Y ≤ 3) = dy = = = 0.75
4 4 0 4
0
Z2.5 2.5
1 y 2.5 − 1
c) P (1 ≤ Y ≤ 2.5) = dy = = = 0.375
4 4 1 4
1
0+4 (4 − 0)2 16 4
d) E(Y ) = µ = =2 V (Y ) = σ 2 = = = = 1.333.
2 12 12 3
2. En cierto banco ubicado en el centro de la ciudad siempre hay fila que dura entre 10
y 40 minutos, y el tiempo de espera es una v.a.c. uniforme.
a) Determine la función de densidad f (y).
b) Obtenga la probabilidad de tener que esperar más de media hora.
c) Halle la probabilidad de esperar exactamente 15 minutos.
d) Calcule el valor esperado y la varianza de esta variable aleatoria.
Ahora hemos reducido el número requerido de tablas de áreas de la curva normal a solamente
una: la distribución normal estándar. La tabla estadística de esta distribución, corresponde
a p(Z < z) para valores de z que van de −3.49 a 3.49.
a) a la derecha de z = 1.84
45 − 50 62 − 50
z1 = = −0.5 y z2 = = 1.2 respectivamente, por tanto:
10 10
p(45 < X < 62) = p(−0.5 < Z < 1.2) = p(−0.5 < Z < 1.2) =
Se necesita la probabilidad p(X < 2.3). Primero hallamos el correspondiente valor z para
luego acudir a la tabla.
2.3 − 3
z1 = = −1.4 =⇒ p(X < 2.3) = p(Z < −1.4) = 0.0808.
0.5
126 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
a) Primero se requiere un valor de z tal que p(Z < z) = 0.45, al acudir a la tabla de la
normal encontramos p(Z < −0.13) = 0.4483 y p(Z < −0.12) = 0.4522; el valor
más cercano a 0.45 es 0.4483 y así z = −0.13. Por consiguiente
x = (6)(−0.13) + 40 = 39.22
b) El valor de z que deja un área de 0.14 a la derecha debe dejar un área de 0.86 a la
izquierda, es decir, p(Z < z) = 0.86, la tabla de la normal nos dice que
p(Z < 1.08) = 0.8599; de esto se sigue que z = 1.08 y por tanto
x = (6)(1.08) + 40 = 46.48
3.81 Ejemplo. Al diseñar la ubicación de un reproductor de CD en un nuevo modelo de
automóviles, los ingenieros deben considerar el alcance frontal del conductor.
Los diseñadores deciden que el reproductor debe ubicarse de manera que esté dentro del
alcance del 95 % de las mujeres.
Las mujeres tienen alcances frontales distribuidos normalmente, con una media de 27
pulgadas y una desviación estándar de 1.3 pulgadas.
Calcule el alcance frontal de las mujeres que separa el 95 % superior del resto.
3.82 Ejemplo. Se ha realizado un examen de estadística sobre 100 puntos. Las califica-
ciones vienen dadas en números enteros y siguen una curva que tiene distribución normal.
La calificación promedio es 74 y la desviación estándar es 7.
Si el 12 % de la clase obtiene calificaciones excelentes diga cual es la calificación excelente
más baja y cual es la calificación buena más alta.
1. Las barras de pan de centeno que venden en una cafetería de la Universidad Libre
tienen una longitud promedio de 30 cm y una desviación estándar de 2 cm. Si las
longitudes están distribuidas normalmente, ¿qué porcentaje de las barras de pan son:
a) más largas que 31.7 cm?
b) de entre 29.3 cm y 33.5 cm de longitud?
a) más cortas que 25.5 cm?
3. Dado que Z es una variable normal estándar, halle k en cada una de las
siguientes situaciones:
a) el área a la izquierda de k es 0.2119
b) el área entre −k y k es 0.9030
c) el área a la derecha de k es 0.6915
d) el área a la izquierda de k es 0.9948
e) el área entre −k y k es 0.2052
128 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
5. Sea X es una variable aleatoria normal con media 30 y desviación estándar 5, halle
el valor de x = k en cada una de las siguientes situaciones:
a) el área a la izquierda de k es 0.3264
b) el área entre 0 y k es 0.4750
c) el área a la derecha de k es 0.1314
d) el área a la izquierda de k es 0.6700
e) el área entre −k y k es 0.9030
8. Suponga que los pesos de los hombres se distribuyen de manera normal, con media
de 172 libras y una desviación estándar de 29 libras. ¿Que peso separa el 99.5 % de
los hombres menos pesados, del 0.5 % de los hombres más pesados?
10. Realice el ejemplo 3.81 asumiendo que los diseñadores deciden que el
reproductor de CD debe ubicarse de manera que esté dentro del alcance del 90 %
de las mujeres.
3.20. APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL 129
11. Una máquina expendedora de bebidas gaseosas se regula para que sirva un promedio
de 200 militros (ml) por vaso. Si la cantidad de bebida se distribuye normalmente
con una varianza de 225 ml,
a) ¿qué fracción de los vasos contendrá más de 224 ml?
b) ¿cuál es la probabilidad de que un vaso contenga entre 191 ml y 209 ml?
c) ¿cuántos vasos probablemente se derramarán si se utilizan vasos de 230 ml para
las siguientes 1000 bebidas?
13. Un investigador informa que unos ratones a los que primero se les restringen drásti-
camente sus dietas y después se les enriquecen con vitaminas y proteínas, vivirán en
promedio 40 meses. Si suponemos que las vidas de tales ratones distribuyen normal-
mente con una desviación estándar de 6.3 meses, calcule la probabilidad de que un
ratón de estos viva:
a) más de 32 meses. b) menos de 28 meses. c) entre 37 y 49 meses.
14. Suponga que las mediciones de la corriente en una tira de alambre siguen una distri-
bución normal con una media de 10 miliamperes (mA) y una varianza de 4 mA2 .
a) Determine la probabilidad de que la medición exceda de 13 mA.
b) Encuentre la probabilidad de que una medición de la corriente esté entre 9 mA y
11 mA.
c) La corriente es excesiva si sus mediciones pertenecen al 2 % superior. ¿Cuál es el
mayor valor (en mA) que puede tomar la corriente para que no sea catalogada como
excesiva?
Esta aproximación es adecuada siempre y cuando n sea grande y p no esté demasiado cerca
de 0 o 1. La aproximación normal a las probabilidades binomiales será adecuada si np ≥ 5
y nq ≥ 5.
130 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
Debe tener cuidado de no excluir la mitad de los dos rectángulos de probabilidad de los
extremos cuando utilice la aproximación normal a la distribución binomial. Este ajuste,
llamado corrección de continuidad, ayuda a exlicar el hecho de que se está aproximan-
do una variable aleatoria discreta mediante una continua, el no hacerlo aleja bastante su
aproximación del verdadero valor. A continuación se enuncia el procedimiento a seguir.
3.85 Ejemplo. Una fábrica de gaseosas estaba completamente segura de que su marca
tenía el 10 % de participación en el mercado. Se tomó una muestra de 2500 consumidores
de gaseosas y 211 manifestaron su preferencia por la marca considerada. Si la cifra del 10 %
es correcta, encuentre la probabilidad de observar 211 o menos consumidores que prefieran
esta marca de bebidas gaseosas.
132 CAPÍTULO 3. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
Recordemos que como la probabilidad de observar 211 o menos éxitos en 1000 ensayos es
demasiado pequeña entonces el hecho de observar 211 éxitos se clasifica como un resultado
poco común. Al complementar esta información con la regla del suceso poco común
podemos concluir que el supuesto del 10 % de participación del mercado a lo mejor es
equivocado y probablemente sea menor.
1. Sea X una variable aleatoria binomial con n = 15 y p = 0.4. Encuentre las siguientes
probabilidades mediante la aproximación de la normal, luego consultando la tabla de
la binomial y encuentre la distancia entre estas dos medidas.
a) p(x ≥ 6) b) p(X > 6) c) p(x = 6)
3. Sea X una variable aleatoria discreta binomial con n = 100 y p = 0.2. Encuentre las
aproximaciones normales para las siguientes probabilidades:
a) p(x > 22) b) p(x ≥ 22) c) p(19 < X < 25) d) p(19 ≤ X ≤ 25)
3.21. EJERCICIOS DE APROXIMACIÓN NORMAL A LA BINOMIAL 133
4. Se lanza una moneda 400 veces, utilice la aproximación de la normal para calcular la
probabilidad de obtener:
a) entre 185 y 210 caras.
b) exactamente 205 caras.
c) menos de 176 o más de 227 caras.
5. Sea X una variable aleatoria binomial con n = 25 y p = 0.2.
a) Emplee la tabla de la distribución binomial para determinar p(4 ≤ X ≤ 6).
b) Utilice la tabla de la distribución normal para hallar p(4 ≤ X ≤ 6).
c) Halle la diferencia entre estas dos probabilidades, note que se tiene una buena
aproximación aún cuando np = 5.
6. La décima parte de la producción de una fábrica corresponde a de artículos defec-
tuosos. Se seleccionan al azar 200 artículos producidos por la fábrica. Mediante la
aproximación de la normal determine la probabilidad de que el número de elementos
defectuosos:
a) exceda los 26.
b) sea menor que 16.
c) sea precisamente 19.
7. Sea X una variable aleatoria binomial con n = 20 y p = 0.3. Encuentre las siguientes
probabilidades mediante la aproximación de la normal y también usando la tabla de
la binomial. Determine la distancia entre estos dos valores.
a) p(x = 5) b) p(X ≥ 7) c) p(x < 4)
8. El 20 % de los residentes en Barranquilla prefieren una carcasa blanca para para su
teléfono celular. Use la aproximación de la normal para estimar la probabilidad de
que, de los siguientes 1000 teléfonos vendidos en Barranquilla:
a) precisamente 200 tengan carcasa blanca.
b) entre 170 y 185 tengan carcasa blanca.
c) al menos 210 pero no más de 225 posean carcasa blanca.
9. Un paciente tiene 0.9 de probabilidad de recuperarse de una delicada operación de
corazón. Use la aproximación de la normal para estimar la probabilidad de que de los
siguientes 100 pacientes que se someten a esta operación
a) sobrevivan entre 84 y 95 pacientes.
b) sobrevivan menos de 86 pacientes.
10. Un par de dados se lanza 180 veces. Por medio de la aproximación de la curva normal
estime la probabilidad de que se observe un siete:
a) por lo menos 25 veces.
b) entre 33 y 41 veces.
c) exactamente 7 veces.