Apuntes de Probabilidad y Estadistica
Apuntes de Probabilidad y Estadistica
APUNTES DE PROBABILIDAD Y
ESTADÍSTICA
2. Distribuciones de Frecuencia 16
2.1. Estadística descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2. Construcción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.1. Representación Gráfica . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1
ÍNDICE GENERAL 2
4. Medidas de Variabilidad 35
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2. Variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2.1. Rango y rango intercuartílico . . . . . . . . . . . . . . . . . . . . . . 35
4.2.2. Desviación media . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.2.3. Desviación media para datos agrupados . . . . . . . . . . . . . . . . 36
4.2.4. Varianza y desviación estándar . . . . . . . . . . . . . . . . . . . . . 37
4.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5. Probabilidad 41
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.2. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.3. Operaciones entre eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.4. Definciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.4.1. Concepto Clásico de Probabilidad . . . . . . . . . . . . . . . . . . . 45
5.4.2. Concepto frecuentista de probabilidad . . . . . . . . . . . . . . . . . 45
5.4.3. Probabilidad subjetiva . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.4.4. Concepto axiomático de probabilidad . . . . . . . . . . . . . . . . . 46
5.5. Teoremas de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.5.1. Teorema 1: Regla de la Adición . . . . . . . . . . . . . . . . . . . . 47
5.5.2. Teorema 2: Regla de la complementación . . . . . . . . . . . . . . . 48
5.5.3. Teorema 3: Regla de Diferenciación . . . . . . . . . . . . . . . . . . 48
5.5.4. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . 48
5.5.5. Teorema 4: Reglas de Multiplicación . . . . . . . . . . . . . . . . . 49
5.6. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6. Variables aleatorias 63
6.1. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.2. Distribución de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.2.1. Propiedades de la función de probabilidad . . . . . . . . . . . . . . . 66
6.2.2. Propiedades de la función de densidad de probabilidad . . . . . . . . 68
6.2.3. Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . 72
6.2.4. Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3. Esperanza, varianza y momentos . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3.1. Esperanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.3.3. Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.4. Función generadora de momentos . . . . . . . . . . . . . . . . . . . . . . . 80
6.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7. Distribuciones de probabilidad 91
7.1. Distribuciones discretas de probabilidad . . . . . . . . . . . . . . . . . . . . 91
7.1.1. Distribución Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . 91
7.1.2. Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.1.3. Distribución Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.1.4. Distribución geométrica . . . . . . . . . . . . . . . . . . . . . . . . 99
7.1.5. Distribución binomial negativa . . . . . . . . . . . . . . . . . . . . . 101
ÍNDICE GENERAL 3
9. Estimación 180
9.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
9.2. Estimadores y sus propiedades . . . . . . . . . . . . . . . . . . . . . . . . . 180
9.2.1. Propiedades de un buen estimador . . . . . . . . . . . . . . . . . . . 181
9.3. Estimación Puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
9.3.1. Estimadores de maxima verosimilitud . . . . . . . . . . . . . . . . . 184
9.3.2. Estimadores por el método de los momentos . . . . . . . . . . . . . 186
9.4. Estimación por Intervalos de Confianza . . . . . . . . . . . . . . . . . . . . 187
9.4.1. Intervalos de confianza para estimar la media de una población . . . . 188
9.4.2. Intervalos de confianza para la varianza y la desviación típica de una
población. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
9.4.3. Intervalos de confianza para estimar Proporciones . . . . . . . . . . . 196
9.4.4. Intervalos de confianza para estimar Diferencias de Medias . . . . . . 198
9.4.5. Intervalos de confianza para Relaciones de Varianzas . . . . . . . . . 201
9.4.6. Intervalos de confianza para Diferencias de Proporciones . . . . . . . 204
9.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
ÍNDICE GENERAL 4
8.1. Gráfica de f (x) cuando los parámetros m y n toman diferentes pares de valores.165
5
ÍNDICE DE FIGURAS 6
9.1. Gráfica del proceso de elección de los valores χ2c y χ2l . . . . . . . . . . . . . 194
9.2. Gráfica de la distribución acumulada de la χ2 . . . . . . . . . . . . . . . . . . 195
7
Capítulo 1
1.1. Introducción
¿Qué significa la palabra estadística?
La encontramos frecuentemente en nuestro lenguaje cotidiano. En su uso más común,
estadística se refiere a informaciones numéricas. Ejemplos serían; el salario inicial promedio
de un graduado de una escuela superior, el número de decesos anuales debido al alcoholismo,
el porcentaje de alumnos no graduados que estudian en la Universidad Nacional de Asunción,
la variación de ayer a hoy de los precios de los productos de la canasta familiar, etc. En estos
ejemplos la estadística consiste en números o porcentajes. A estos números se les denomina
estadísticos.
La Estadística se divide en dos grandes áreas (descripción de datos y realización de infer-
encias) que reflejan la propia historia del desarrollo de esta ciencia. La Estadística actual es el
producto del encuentro de dos ramas distintas del saber, la antigua estadística y el cálculo de
probabilidades, que se encontraron en el siglo XIX. Etimológicamente, la palabra estadística
procede de la palabra estado, ya que desde la antigüedad los romanos hicieron recolecciones
de datos que posteriormente tenían que resumir de una forma comprensiva y que permitiera
proporcionar informaciones útiles. Este tipo de estudios dio lugar a la estadística descriptiva
cuya misión consiste en describir situaciones y procesos dados; para ello se sirve de tablas,
representaciones gráficas, proporciones, números índice y medidas típicas.
Sin embargo las conclusiones extraídas se agotan en el propio conjunto de datos obser-
vados, pues el objetivo consistía en hacerse una idea clara de lo que había, y lo que había se
contaba y se medía. Lo que posibilitó el cálculo de probabilidades fue, precisamente, el desar-
rollo de un conjunto de métodos para extrapolar las conclusiones a entidades no observadas.
Es decir, proporcionó el instrumento adecuado para poder hacer inferencias acerca de grandes
cantidades de observaciones potenciales a partir de unas pocas observaciones reales. Estas
técnicas tuvieron su fundamento en el desarrollo de la curva normal por Gauss, en su apli-
cación por Galton a los problemas de herencia, etc. Sin embargo los auténticos fundadores
de estas técnicas fueron Karl Pearson (1857-1936) y Sir Ronald Fisher (1890-1962). Así se
ha desarrollado la estadística analítica o inferencial basada en la teoría de probabilidades que
trata de obtener leyes generales a partir de la observación de algunos datos. Precisamente
este fundamento probabilístico condiciona el que los resultados obtenidos se vean sujetos a
unos márgenes de error. Ahora se puede dar una definición de Estadística en la que aparecen
algunos términos no definidos lo cual no impedirá entender su significado.
8
1.2. DEFINICIONES Y EJEMPLOS 9
Por ejemplo una población en estudio podría ser el conjunto de todos los estudiantes que
estudian administración en la Facultad de Ciencias Económicas de la Universidad Nacional
de Asunción y una muestra podría consistir en el conjunto de estudiantes de primer año de
dicha población.
1.3. Variables
Definición 1.3.1 : Variables
Es una característica que puede tomar diferentes valores. Las variables son características
observables, susceptibles de adoptar distintos valores o ser expresados en categorías. Variable
es un aspecto especifico de la realidad referido a la unidad del análisis y puede ser medidos
o cuantificados. La variable adquiere un valor determinado en cada unidad de análisis. Si
una característica, se encuentra que toma valores diferentes en personas, lugares o cosas
diferentes, se dice que esta característica es variable, es decir la característica no es la misma
cuando se observa en diferentes poseedoras de ellas.
lugar de nacimiento
religión
color de ojos
1.3. VARIABLES 11
Note que cada una de estas variables puede valer un número entero (por ejemplo: 1, 2,3,
etc.) pero no puede valer números fraccionarios (por ejemplo: 1,5). Típicamente, las variables
discretas resultan de un conteo.
Ejemplo 1.3.7 Religiones en México (población con 5 años o más, censo del 2000)
Categoría Seguidores
Religión Católica 74 612 373
Religión no católica 3 483 593
Sin religión 2 982 929
total 81 078 895
Categoría Calificación ( %)
Buena / muy buena 75,7
regular 17,1
mala / muy mala 2
no sabe / no contesta 5,2
total 100
b) Las categorías de datos están ordenadas de acuerdo con la cantidad de las característi-
cas que poseen.
Observación
En la escala de medición de una variable; sea cualitativa o cuantitativa; las categorías
deben ser mutuamente excluyentes. Esto significa que un individuo ó medición pertenece
únicamente a una de las categorías. Además las categorías deben ser exhaustivas, esto es
cada individuo ó medición debe pertenecer a una de las categorías.
1.4. PROBLEMAS 14
1.4. Problemas
1. ¿Cuál es el nivel de medición de cada una de las siguientes variables?
3. En cada uno de los siguientes puntos determine si el grupo es una muestra o una
población
11. A una muestra aleatoria de 500 clientes se le pidió probar una nueva pasta dental. De
los 500, 400 dijeron que era excelente, 32 pensaron que era buena y el resto de los
clientes no dieron ninguna opinión. Basándose en lo encontrado en la muestra haga
una diferencia de la reacción de todos los clientes a la nueva pasta dental.
12. Una muestra aleatoria de 300 ejecutivos de los 2500 empleados en una empresa grande
mostró que 270 se mudarían a otro sitio si ello significara un ascenso importante.
Basándose en los hallazgos en la muestra describa la reacción de todos los ejecutivos
de la empresa.
Distribuciones de Frecuencia
1. La forma de la distribución. Para describir como están distribuidos los datos utiliza una
herramienta llamada “distribución de frecuencia” y presenta la información por medio
de tablas y gráficas.
2. Las medidas de tendencia central: que resumen la información a una cifra que es rep-
resentativa de la serie de datos.
3. Las medidas de variabilidad: que nos indican que tan variables son los datos respecto
a las medidas de tendencia central.
2.2. Construcción
Una distribución de frecuencias es una serie de datos agrupados en categorías, en las
cuales se muestra el número de observaciones que contiene cada categoría.
Los pasos para la construcción de una distribución de frecuencias son mejor explicados
con un ejemplo.
Ejemplo 2.2.1 Los siguientes datos son el número de meses de duración de una muestra de
40 baterías para coche.
22 41 35 45 32 37 30 26
34 16 31 33 38 31 47 37
25 43 34 36 29 33 39 31
33 31 37 44 32 41 19 34
47 38 32 26 39 30 42 35
16
2.2. CONSTRUCCIÓN 17
16 19 22 25 26 26 29 30
30 31 31 31 31 32 32 32
33 33 33 34 34 34 35 35
36 37 37 37 38 38 39 39
41 41 42 43 44 45 47 47
2. El rango (amplitud)
El número de intervalos (nic) puede ser como mínimo 5 y como máximo 15 de acuerdo
a la fórmula : 2nic
Para facilitar la clasificación de los datos, el tic se redondea siempre al entero posterior.
Usualmente, el límite inferior del primer intervalo de clase es el dato más chico, que en
este ejemplo es 16.
El límite inferior de los siguientes intervalos se calcula sumando el tic al límite inferior
del intervalo anterior hasta llegar a un número no mayor al dato más grande.
LI LS
16 21
22 27
28 33
34 39
40 45
46 51
Los límites anteriores son los límites nominales pero no son los reales. Los límites
reales son el punto medio entre el límite superior (LS) y el límite inferior del siguiente
³ LS + LIsig ´
intervalo (LIsig), entonces LSR =
2
LI LS LSR
16 21 21,5
22 27 27,5
28 33 33,5
34 39 39,5
40 45 45,5
46 51 51,5
La marca de clase, también llamada punto medio del intervalo es la mitad de la distancia
entre los límites inferior y superior de cada intervalo. La marca de clase es el valor más
LI + LS
representativo de los valores del intervalo. Con lo cual X =
2
LI LS LSR X
16 21 21,5 18,5
22 27 27,5 24,5
28 33 33,5 30,5
34 39 39,5 36,5
40 45 45,5 42,5
46 51 51,5 48,5
Clasificar las observaciones en los intervalos. La práctica usual es marcar con una línea
( / ) que representa una observación. En el ejemplo la observación 22 se clasifica en el
intervalo 20 - 24 porque se encuentra entre el 20 y el 24 inclusive. Una vez clasificados
todos los datos se cuentan las líneas de cada intervalo y el resultado es la frecuencia de
cada intervalo de clase.
2.2. CONSTRUCCIÓN 19
LI LS LSR X cuenta F
16 21 21,5 18,5 // 2
22 27 27,5 24,5 //// 4
28 33 33,5 30,5 ///// ///// /// 13
34 39 39,5 36,5 ///// ///// /// 13
40 45 45,5 42,5 ///// / 6
46 51 51,5 48,5 // 2
LI LS LSR X cuenta F FR
16 21 21,5 18,5 // 2 2/40 = 0, 05
22 27 27,5 24,5 //// 4 4/40 = 0, 1
28 33 33,5 30,5 ///// ///// /// 13 13/40 = 0, 325
34 39 39,5 36,5 ///// ///// /// 13 13/40 = 0, 325
40 45 45,5 42,5 ///// / 6 6/40 = 0, 15
46 51 51,5 48,5 // 2 2/40 = 0, 05
El histograma
El histograma es una de las gráficas más ampliamente utilizadas y una de las más fáciles
de entender. Un histograma describe una distribución de frecuencia utilizando una serie de
rectángulos adyacentes donde la altura de cada rectángulo es proporcional a la frecuencia de
clase que representa.
Polígono de frecuencia
El polígono de frecuencia consiste de segmentos de línea conectando los puntos formados
por la intersección de las marcas de clase y las frecuencias de clase.
2.3. Problemas
Elabore la distribución de frecuencias de las siguientes series de datos, con sus respectivas
gráficas:
1. Los resultados siguientes representan las calificaciones del examen final de un curso
de estadística elemental.
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
17 20 10 9 23 13 12 19 18 24
12 14 6 9 13 6 7 10 13 7
16 18 8 13 3 32 9 7 10 11
13 7 18 7 10 4 27 19 16 8
7 10 5 14 15 10 9 6 7 15
6. Se aplicó una encuesta donde se les pide indicar el número de amigos o parientes que
visitan cuando menos una vez al mes. Los resultados son los siguientes:
3 5 2 3 3 4 1 8 4
2 4 2 5 3 3 3 0 3
5 6 4 3 2 2 6 3 5
4 14 3 5 6 3 4 2 4
9 4 1 4 2 4 3 5 0
4 3 5 7 3 5 6 2 2
8. El presidente de una agencia de viajes, quiere información sobre las edades de la gente
que toma cruceros por el Caribe. Una muestra de 40 clientes que tomaron un crucero
el año pasado reveló estas edades:
77 18 63 84 38 54 50 59 54 56
36 26 50 34 44 41 58 58 53 51
62 43 52 53 63 62 62 65 61 52
60 45 66 83 71 63 58 61 71 60
10. Se conduce un estudio de los efectos de fumar sobre los patrones de sueño. La medición
que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtienen estos
datos:
69 56 22 28 41 28 47 53 48
30 34 13 52 34 60 25 21 37
43 23 13 31 29 38 26 36 30
12. Una compañía de luz seleccionó una muestra de 20 clientes residenciales. Los sigu-
ientes datos son las cuentas que se les facturó el mes pasado:
54 48 58 50 25 47 75 46 60 70
67 68 39 35 56 66 33 62 65 67
13. Una muestra de suscriptores de una compañía telefónica reveló los siguientes números
de llamadas recibidas en la última semana.
52 43 30 38 30 42 12 46
39 37 34 46 32 18 41 5
Capítulo 3
Promedios
A las medidas de tendencia central con frecuencia se les llama promedios. El propósito
de una medida de tendencia central es indicar con toda precisión el centro de un conjunto de
observaciones.
3.1. La Media
3.1.1. La Media Geométrica
La media geométrica es útil para encontrar el promedio de porcentajes, proporciones,
índices, o tasas de crecimiento. Tiene mucha aplicación en el comercio y la economía porque
nos interesa encontrar el porcentaje de cambio en ventas, salarios o datos económicos como el
producto nacional bruto. La media geométrica de un conjunto de "n"números enteros positivo
se define como la n-ésima raíz del producto de los n valores es decir:
p
n
X1 , X2 , . . . , Xn
Ejemplo 3.1.1 Suponga que usted recibe un 5 % de aumento en su salario este año y un
15 % de aumento el año próximo y quiere saber cuál es el incremento porcentual promedio.
Si tiene un aumento del 5 % entonces su salario es 1,05 y si tiene un p
aumento del 15 %
su salario es de 1,15 entonces calculando la media geométrica se obtiene (1, 05)(1, 15) =
1, 09886, por lo que el aumento promedio anual es del 9, 886 %.
Ejemplo 3.1.2 Las ganancias obtenidas por Atkins Construction Company en cuatro proyec-
tos recientes fueron 3 %, 2 %, 4 % y 6 %. ¿Cuál es la media de las ganancias?
Por lo que la media de ganancias obtenidas por Atkins Construction Company en los
cuatro proyectos está dada por
p4
(0, 03)(0, 2)(0, 4)(0, 6) = 0, 03464
o sea 3,464 %
25
3.1. LA MEDIA 26
n
∑ Xi 85, 4 + 85, 3 + 84, 9 + 85, 4 + 84, 0
i=1
X= = = 85, 0
n 5
∑ fi Xi
X=
n
Donde:
X : simboliza la media de la muestra
Xi : es la marca de clase del intervalo i-ésimo
fi : es la frecuencia de clase del intervalo i-ésimo
LI LS Xi fi fi Xi
15 19 17 2 34
20 24 22 1 22
25 29 27 4 108
30 34 32 15 480
35 39 37 10 370
40 44 42 5 210
45 49 47 3 141
n =40 ∑ fiXi = 1365
∑ fi Xi 1365
X= = = 34, 12
n 40
3.2. La mediana
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeños, la
media aritmética no es representativa. El valor central en tales problemas puede ser mejor
descrito usando una medida de tendencia central llamada mediana.
La mediana es el punto medio de los valores de una serie de datos después de haber
sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como
posteriores en el arreglo de datos.
85,9
85,4
85,4 ↓→↓ X̃
84,3
84,0
Ejemplo 3.2.2 Una muestra de los honorarios de paramédicos cargados por la clínica Balti-
more reveló las siguientes cantidades: 35,29, 30,25, 32,35. ¿Cuál es la mediana?
25
29
30 ↓→↓ X̃
32
35
35
En este caso la mediana se calcula obteniendo la media de las dos observaciones centrales
30 + 32
X̃ = = 31
2
( n2 − FA)tic
X̃ = LRI +
F
Donde:
X̃ : mediana de la muestra
LI LS LSR X F FA
15 19 19,5 17 2 2
20 24 24,5 22 1 3
25 29 29,5 27 4 7
30 34 34,5 32 15 22 ↓→↓ intervalo mediano
35 39 39,5 37 10 32
40 44 44,5 42 5 37
45 49 49,5 47 3 40
3.3. LA MODA 31
3.3. La moda
La moda es la medida de tendencia central especialmente útil para describir mediciones
de tipo ordinal y nominal. Es el valor de la observación que aparece más frecuentemente.
3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
2. En algunas series de datos hay más de una moda, en este caso uno podría preguntarse
¿cual es el valor representativo de la serie de datos?
1. Localizar la clase del intervalo que contenga la frecuencia de clase más grande.
Donde:
Si hay dos intervalos contiguos con frecuencia máxima la moda será la media aritmética
de las dos marcas de clases. Si hay dos o más intervalos no contiguos con frecuencia de clase
máxima habrá dos o más modas que serán las marcas de clases de dichos intervalos.
X F
5 4
10 3
15 15 X̂= 15
20 9
25 10
30 7
X F no hay moda
5 4
10 4
15 4
20 4
25 4
30 4
Cuando haya intervalos abiertos, situaciones en las que el intervalo superior carece de
límite superior, el intervalo inferior carece de límite inferior o ambos.
Observación : Esta igualdad no es exacta, sino que se cumple con mayor o menor
aproximación en función del grado de simetría de la curva que represente gráficamente
la distribución.
2. Para una distribución asimétrica negativa se tiene que: X < X̃ < X̂, con lo cual la
distribución de datos presenta un sesgo negativo.
3. Para una distribución asimétrica positiva se tiene que: X̂ < X̃ < X, con lo cual la dis-
tribución de datos presenta un sesgo positivo.
Observación: La regla empírica se acepta como válida siempre que el grado de curva
no sea muy acentuado.
3.4. Problemas
1. El departamento de agricultura, tiene los siguientes datos que representan el crecimien-
to mensual (en pulgadas) de muestras de maíz recién plantados
0,4 1,9 1,5 0,9 0,3 1,6 0,4 1,5 1,2 0,8
0,9 0,7 0,9 0,7 0,7 1,5 0,5 1,5 1,7 1,8
5. las edades de 60 personas que trabajan en una fábrica textil se han tabulado dando la
siguiente tabla de frecuencias:
Edades No de personas
13-17 2
18-22 6
23-27 10
28-32 13
33-37 18
38-42 6
43-47 2
48-52 2
53-57 16
Total 60
Medidas de Variabilidad
4.1. Introducción
¿Qué son las medidas de variabilidad?
Las medidas de variabilidad de una serie de datos, muestra o población, permiten iden-
tificar que tan dispersos o concentrados se encuentran los datos respecto a una medida de
tendencia central.
Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al aplicar
una medida de variabilidad podemos evaluar la medida de tendencia central utilizada. Una
medida de variabilidad pequeña indica que los datos están agrupados muy cerca, digamos, de
la media. La media, por lo tanto es considerada bastante representativa de la serie de datos.
Inversamente, una gran medida de variabilidad indica que la media no es muy representativa
de los datos.
Una segunda razón para estudiar la variabilidad de una serie de datos es para comparar
como están esparcidos los datos en dos o más distribuciones. Por ejemplo, la calificación
promedio de dos estudiantes, A = {90, 80, 75, 75} y B = {90, 55, 85, 90}, es de 80. Basados
en esto podríamos pensar que sus calificaciones son idénticas. Pero si revisamos el detalle de
sus calificaciones vemos que esta conclusión no es correcta.
4.2. Variabilidad
4.2.1. Rango y rango intercuartílico
Definición 4.2.1 : Amplitud o Rango
Es la diferencia entre observaciones extremas, es decir la diferencia entre el mayor y el
menor valor. Es muy sensible a los valores extremos.
R = 8−1 = 7
35
4.2. VARIABILIDAD 36
Es parecida al rango, pero eliminando las observaciones más extremas o sea las inferiores
y superiores. Por lo que no es tan sensible a valores extremos. Es la distancia entre primer y
tercer cuartil.
X X −X |X − X|
85,4 + 0.4 0.4
85,4 + 0.4 0.4
85,3 + 0.3 0.3
84,9 - 0.1 0.1
84,0 - 1.0 1.0
n
∑ |Xi − X| 2, 2
i=1
Dm = = = 0, 44
n 5
Dm =
∑ fi|Xi − X| (4.2.3)
n
Claramente observamos que la serie B tiene una dispersión mayor que la serie A, sin
embargo en ambos casos la desviación media es cero.
Varianza
Es la media aritmética de las desviaciones cuadradas de los datos respecto a la media.
Desviación estándar
Es la raíz cuadrada de la varianza.
X X2
85,4 7293,16
85,3 7276,09
84.9 7208,01
85.4 7293.16
84.0 7056.00
2
∑ Xi = 425, 0 ∑ X = 36126, 42
S = 0, 595818764
√
S= S2 (4.2.11)
desviación estándar de una muestra
LI LS X fi fi Xi fi Xi2
15 19 17 2 34 588
20 24 22 1 22 484
25 29 27 4 108 2916
30 34 32 15 480 15360
35 39 37 10 370 13690
40 44 42 5 210 8820
45 49 47 3 141 6627
n =40 ∑ i i = 1365
f X fi Xi2 = 48475
S = 6, 881814804
4.3. Problemas
1. Se conduce un estudio de los efectos de fumar sobre los patrones de sueños. La medi-
ción que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtiene
4.3. PROBLEMAS 40
estos datos:
Fumadores 69,3 56,0 22,1 47,6 53,2 48,1 52,7 34,4 60,2 43,8
No fumadores 28,6 25,1 26,4 34,9 29,8 38,5 30,2 30,6 31,8 41,6
2. La compañía National Tire tiene fondos de reserva en valores negociable a corto plazo.
El saldo diario de cierre (en millones de dólares) de la cuenta de valores negociables
en lapso de dos semanas es el que mostramos a continuación
a) Calcula las mediadas de tendencia central para cada grupo e interprete los resul-
tados obtenidos.
b) Calcula la desviación media, la varianza, la desviación típica y el coeficiente de
variación de cada grupo.
c) Diga cuál de los grupos tiene mejor concentración
Capítulo 5
Probabilidad
5.1. Introducción
La teoría de probabilidad tuvo como uno de sus primeros puntos de partida el intentar
resolver un problema particular concerniente a una apuesta de juego de dados entre dos per-
sonas. El problema al que nos referimos involucraba una gran cantidad de dinero y puede
plantearse de la siguiente forma: Dos jugadores escogen cada uno de ellos un número del 1
al 6, distinto uno del otro, y apuestan 32 doblones de oro a que el número escogido por uno
de ellos aparece en tres ocasiones antes que el número del contrario al lanzar sucesivamente
un dado. Suponga que el número de uno de los jugadores ha aparecido dos veces y el número
del otro una sola vez. ¿Cómo debe dividirse el total de la apuesta si el juego se suspende?
Uno de los apostadores, Antonio de Gombaud, popularmente conocido como el caballero
De Mere, deseando conocer la respuesta al problema plantea a Blaise Pascal (1623-1662) la
situación. Pascal a su vez consulta con Pierre de Fermat (1601-1665) e inician un intercambio
de cartas a propósito del problema. Esto sucede en el año de 1654. Los historiadores de
la matemática están generalmente de acuerdo en considerar este hecho como el origen del
estudio de las probabilidades. Con lo anteriormente mencionado se inician algunos esfuerzos
por dar solución a éste y otros problemas similares que se plantean. Con el paso del tiempo
se sientan las bases y las experiencias necesarias para la búsqueda de una teoría matemática
que sintetice los conceptos y los métodos de solución de los muchos problemas particulares
resueltos a lo largo de varios años.
Las ideas de probabilidades permanecen circunscritas a los problemas de juegos de azar
hasta que Pierre Laplace (1749-1827) y Friedrich Gauss (1777-1855) hacen notar que las
teorías desarrolladas son aplicables también a otras actividades diferentes de los juegos de
azar. En el segundo congreso internacional de matemáticas, celebrado en la ciudad de Paris
en el año 1900, el matemático David Hilbert (1862-1943) plantea 23 problemas matemáticos
de importancia. Uno de estos problemas es el de encontrar axiomas o postulados a partir
de los cuales se pueda construir una teoría matemática de la probabilidad. Aproximada-
mente treinta años después, en 1933, el matemático ruso Andrei Nikolaevich Kolmogorov
(1903-1987) propone ciertos axiomas basados en la teoría de la medida desarrollada por
H. Lebesgue(1875-1941), que a la postre resultaron adecuados para la construcción de una
teoría de la probabilidad. Esta teoría prevalece hoy en día y ha adquirido el calificativo de
teoría clásica. Actualmente la teoría clásica de la probabilidad se ha desarrollado y exten-
41
5.2. DEFINICIONES Y EJEMPLOS 42
Unión
La unión de dos eventos dados A y B de un espacio muestral Ω; es el conjunto de re-
sultados de un experimento aleatorio que pertenece a alguno de estos dos eventos dados. El
símbolo de la unión es ∪.
Complemento
El complemento de un evento A de un espacio muestral Ω; es el conjunto de resultados de
un experimento aleatorio que no pertenece a dicho evento dado. El símbolo del complemento
es − .
Diferencia
Diferencia de dos eventos A y B de un espacio muestral Ω; es el conjunto de resultados
de un evento dado que no pertenece a otro evento dado. El operador de la diferencia es el
signo "menos"(−).
Ejemplo 5.4.2 Se quiere saber si una moneda está cargada. Para determinar la probabilidad
de que caiga cara se lanza 60 veces la moneda al aire, de las cuales 25 veces cayó cara. Si
aplicamos la fórmula
25
P(cae cara) = = 0, 4167
60
Algunas dificultades que presenta este enfoque de la probabilidad es que no dice cual es
el número grande de observaciones necesario, o que se entiende por condiciones similares,
porque si las condiciones son las mismas los resultados serán también los mismos.
Ejemplo 5.4.3 ¿Cuál es la probabilidad de que un cierto equipo de fútbol gane en su próx-
imo partido?. Ciertas circunstancias internas del equipo, las condiciones del equipo rival o
cualquier otra condición externa, son elementos que sólo algunas personas conocen y que
podrían darnos una idea más exacta de esta probabilidad.
Axioma 2: P(Ω) = 1
Ejemplo 5.5.1 Si el experimento es lanzar un dado una vez, el espacio muestral es:
S = {1, 2, 3, 4, 5, 6}
A = {2, 4, 6}
B = {1, 2}
A ∩ B = {2}
5.5. TEOREMAS DE PROBABILIDAD 48
1
por lo que P(A ∩ B) =
6
Si aplicamos la regla de adición:
1 1 1 2
P(A ∪ B) = + − =
2 3 6 3
1 1
P(A) = 1 − P(A) = 1 − =
2 2
3 1
P(A − B) = P(A) − P(A ∩ B) = − = 0, 3333
6 6
Y la probabilidad de que caiga un número menor que tres pero no sea par es:
2 1
P(B − A) = P(B) − P(AB) = − = 0,167
6 6
Ejemplo 5.5.5 Una maquina empaca vegetales en una bolsa de plástico. Experiencias ante-
riores revelan que en ocasiones los paquetes tienen menos del peso correcto, y en otras más,
pero la mayoría de las veces tiene el peso satisfactorio. Como muestra la siguiente tabla:
Peso Probabilidad
debajo del correcto 0,025
correcto 0,900
arriba del correcto 0,075
Supongamos que queremos saber la probabilidad de que al inspeccionar tres paquetes, los
tres pesen correctamente. Establezcamos los siguientes eventos:
P(A) = 0, 900
P(B) = 0, 900
P(C) = 0, 900
Según el teorema de multiplicación la probabilidad de que los tres eventos ocurran es:
P(A ∩ B ∩C) = P(A) · P(B) · P(C) = (0, 900) · (0, 900) · (0, 900) = 0, 729
5.5. TEOREMAS DE PROBABILIDAD 50
Ejemplo 5.5.6 Cierto departamento de una compañía está compuesto por 8 hombres y 4
mujeres, de entre ellos se va elegir al nuevo jefe del departamento, para lo cual se entrevistará
a dos de ellos. Si todos tienen la misma probabilidad de ser elegidos, ¿cuál es la probabilidad
de que las dos personas entrevistadas sean mujeres?
Teorema de Bayes
En el siglo XVIII el reverendo Thomas Bayes, un ministro presbiteriano inglés, se hi-
zo esta pregunta: ¿realmente existe Dios?. Siendo el, un entusiasta matemático se evocó a
desarrollar una fórmula para encontrar la probabilidad de que Dios existe, basándose en la
evidencia disponible sobre la tierra. Años después de la muerte de Bayes, Laplace desarrol-
ló el trabajo del reverendo, y por vez primera, se logra la determinación de la probabilidad
de las causas a partir de los efectos que han podido ser observados. El cálculo de dichas
probabilidades recibe el nombre de teorema de Bayes. La fórmula del teorema de Bayes es:
P(A1 )P(B|A1 )
P(A1 |B) =
P(A1 )P(B|A1 ) + P(A2 )P(B|A2 ) + ... + P(An )P(B|An )
Ejemplo 5.5.7 : Don Pepe tiene una tienda, en el trabajan tres cajeras, Andrea, Bianca, y
Consuelo. Andrea realiza el 50 % de los cobros, Bianca el 30 % y Consuelo el 20 %. Cuando
cobra Andrea hay un 1 % de probabilidad de que lo haga mal, cuando lo hace Bianca hay un
2 % de que cobre mal, y si cobra Consuelo hay un 3 % de probabilidad de que se equivoque.
Un cliente se quejó con Don Pepe porque le cobraron mal. ¿Cuál es la probabilidad de que
el mal cobro lo haya hecho Andrea?
5.6. PROBLEMAS 51
P(A)P(M|A)
P(A|M) =
P(A)P(M|A) + P(B)P(M|B) + P(C)P(M|C)
5.6. Problemas
1. Suponga que de un grupo de 500 estudiantes universitarios se encuentra que 300 fu-
man, que 350 consumen bebidas alcohólicas y que 250 tienen estos dos hábitos nocivos
para la salud. ¿Cuál es la probabilidad de que un estudiante seleccionado aleatoria-
mente
6. El profesor Ramos tiene muchos años impartiendo la clase de matemáticas, por expe-
riencia sabe que el 80 % de los estudiantes contestan los problemas que les encarga de
tarea. También sabe que el 90 % de los estudiantes que hacen la tarea aprueban el curso
y que el 60 % de los estudiantes que no hacen la tarea reprueban. Manuel aprobó el
curso, ¿cual es la probabilidad de que hizo la tarea?
9. Una urna contiene 5 bolillas blancas, 4 negras, 6 rojas y 10 verdes. Se extrae una bolilla
de la urna. Calcular la probabilidad de que:
10. Cierta población de 1500 habitantes, fue clasificado, según su nacionalidad, resultando:
950 paraguayos, 200 españoles, 300 italianos y 50 franceses. Si se elige un habitante
al azar, calcular la probabilidad de que:
21. Se tiene un grupo de 12 tornillos, de los cuales 4 son defectuosos. Se recogen 2 tornillos
al azar.¿ Cuál es la probabilidad de que:
22. Se tiene tres urnas, la primera contiene 50 bolas rojas y 50 bolas blancas; la segunda 60
bolas amarillas y 40 blancas, la tercera 70 bolas verdes y 30 blancas. Si se selecciona
aleatorimente una de las urnas y se extraen dos bolas con reposición:
24. De 100 individuos que presenten su solicitud para ocupar puestos de analista de sis-
temas en una gran empresa en el último año. 40 contaban con experiencia laboral
previa y 30 tenían título profesional. Sin embargo 20 de los solicitantes tenían tanto
experiencia laboral como título profesional, de modo que han sido incluidos en ambos
conteos.
26. En una caja hay 15 lapiceras con las plumas en buen estado, de los cuales 5 no tienen
tinta, además 6 lapiceras con las plumas rotas. Al sacar una lapicera. Calcular la pro-
babilidad de que la lapicera no escriba. Respuesta: 0,5238
27. Para la señalización de emergencia se ha instalado dos indicadores que funcionan in-
dependientemente; la probabilidad de que un indicador se accione durante la avería es
igual a 0,95 para el primero y 0,90 para el segundo. Hallar las siguientes probabilidades
que durante una avería:
28. Una caja contiene 20 unidades de cierto producto electrónico, 4 de ellos son defec-
tuosos y 16 son buenas. Se seleccionarán aleatoriamente 4 unidades y se venderán.
Obténgase la probabilidad de que:
1
a) las cuatro unidades vendidas sean defectuosos Respuesta: 4845
48
b) entre las cuatro unidades vendidas 2 sean buenas Respuesta: 323
13
c) se vendan al menos tres unidades defectuosas Respuesta: 969
29. En un deposito hay 3000 cajas de plumas de las marcas A, B, C, D y E y en ellas hay
cajas de plumas deterioradas. Las cajas se distinguen de la siguiente manera:
30. La urna A tiene 2 boletines rojos y 3 azules; la urna B contiene 4 rojas y 1 azul y la urna
C 3 rojas y 4 azules. Se selecciona aleatoriamente una urna y un boletín es extraído y
que resulta ser rojo. Hallar la probabilidad de haber escogido:
a) la urna A Respuesta: 14
57
b) la urna B Respuesta: 28
57
5
c) la urna C Respuesta: 19
d) la urna A o B Respuesta: 14
19
e) la urna A o C Respuesta: 29
57
31. Un agente de una compañía de seguros vende pólizas a 5 personas, todas de edad idén-
tica y con buena salud. De acuerdo con la tabla de los actuarios la probabilidad de que
una persona de esta edad especifica esté viva en 30 años es 23 . Hallar la probabilidad
de que en 30 años estén vivas:
32
a) las 5 personas Respuesta: 243
b) al menos 3 personas Respuesta: 64
81
40
c) solamente 2 personas Respuesta: 243
d) al menos una persona Respuesta: 242
243
32. En una exhibición canina, 3 de los 10 perros premiados deben seleccionarse para que
aparezcan en un comercial de comida para perros. Se han otorgados premios a tres
coolíes, cuatro pastores alemán, dos perros galeces y un perro de agua.
a) ¿Cual es la probabilidad de que los tres perros elegidos sean de la misma raza?
Respuesta: 0,042
b) ¿Cual es la probabilidad de que se seleccionen dos coolíes y un pastor alemán?
Respuesta: 0,10
33. Una caja con guantes de béisbol contiene 2 guantes para jugadores zurdos y 7 para
diestros. Si se seleccionan 3 guantes al azar:
34. En una caja hay 18 artículos de los cuales cuatro son defectuosas. Si se extrae aleatori-
amente tres artículos al mismo tiempo. Calcular las siguientes probabilidades
39. La probabilidad de que en los hogares de una población tengan lava vajilla es 0,40 y
de que tengan video es de 0,30. Calcular las siguientes probabilidades:
40. Se extrae tres cartas de un mazo de 40. Calcular las siguientes probabilidades:
42. De una baraja de 40 naipes bien mezcladas, se sacan al azar 5 cartas. Hallar la proba-
bilidad de que:
5.6. PROBLEMAS 59
45. En una zapatería hay tres estanterías A, B y C, la primera tiene 50 pares de zapatos
negros y 25 marrones, la segunda tiene 40 de cada color y la ultima 20 negros y 30
marrones. Si un cliente no tiene preferencia especial respecto a las estanterías ni re-
specto al color elige un par de zapatos y es marrón. Calcule la probabilidad de que
15
proceda de la estantería B. Respuesta: 43
46. Dos seres humanos y ocho elefantes se sientan al azar entorno a una mesa circular.
Calcular la probabilidad de que los humanos esten juntos. Respuesta:
47. Si A y B son dos sucesos tales que P(A) = 0, 6 y P(B) = 0, 7. Calcular: P(A ∪ B) y
P(A ∩ B) sabiendo que P(A ∪ B) · P(A ∩ B) = 0, 4 Respuesta: P(A ∪ B) = 0, 8 y
P(A ∩ B) =0,5 o P(A ∪ B) = 0, 5 y P(A ∩ B) = 0, 8
49. Un jugador lleva en el bolsillo dos monedas, una normal y otras con dos caras. Elige al
azar una de las monedas y la lanza al aire.
50. De los 250 empleados de una compañía, 130 fuman cigarrillos. Hay 150 hombres que
trabajan en esta compañía de los cuales 85 fuman cigarrillos. ¿ Cuál es la probabilidad
de que un empleado seleccionado en forma aleatoria,
no fume cigarrillo?
5.6. PROBLEMAS 60
51. Se desea determinar si hay una relación entre el interés de un estudiante por la estadís-
tica y su capacidad para las matemáticas, se selecciona una muestra aleatoria de 200
estudiantes y se les pregunta si su capacidad para las matemáticas y su interés por la
estadística es bajo, promedio o alto. Los resultados fueron como sigue:
52. Una moneda esta cargada de modo que la posibilidad de salir cara (H) sea el doble de
salir sello (S). Hallar P(H) y P(T ) Respuesta:
54. Dos hombres y tres mujeres intervienen en un torneo de ajedrez. Los del mismo sexo
tienen igual probabilidad de ganar pero cada hombre tiene el doble de probabilidad de
ganar que una mujer.
55. Una clase consta de 10 hombres y 20 mujeres de los cuales la mitad de los hombres y
la mitad de las mujeres tienen ojos castaños. Hallar la probabilidad de que una persona
escogida al azar sea un hombre o tenga los ojos castaños. Respuesta:
57. Se escogen al azar dos dígitos desde del conjunto {1, 2, 3, ...., 9}. Si la suma es par,
hallar la probabilidad de que ambos sean números impares. Respuesta:
58. Se escogen al azar tres lamparas entre 15 de las cuales 5 son defectuosos. Hallar la
probabilidad de que:
59. Se selecciona al azar dos cartas entre 10 cartas numeradas de 1 a 10. Hallar la proba-
bilidad de que la suma sea impar si:
60. Una clase tiene 12 niños y 4 niñas. Se seleccionan tres estudiantes de la clase al azar. ¿
Cuál es la probabilidad de que todas sean niñas? Respuesta:
61. En cierta facultad, 4 % de los hombres y 1 % de las mujeres tienen más de 6 pies de
estatura. Además, 60 % de los estudiantes son mujeres. Ahora bien si se selecciona al
azar un estudiante y es más alto que 6 pies, ¿Cuál es la probabilidad de que el estudiante
seleccionado sea mujer? Respuesta:
62. Una caja contiene tres monedas; una de las monedas es corriente, otra tiene dos caras
y la tercera esta cargada de modo que la probabilidad de obtener cara sea 0,6. Se selec-
ciona una de las monedas y se lanza al aire. Hallar la probabilidad de que salga cara.
Respuesta:
63. Una urna contiene 3 bolas rojas y 7 blancas. Se saca una bola de la urna y se reemplaza
por una de otro color. Se saca de la urna una segunda bola.
64. Se nos da dos urnas como sigue: La urna A contiene 3 bolas rojas y 2 bolas blancas y la
urna B contiene 2 bolas rojas y 5 bolas blancas. Se selecciona al azar una urna; se saca
una bola y se coloca en la otra urna, luego se saca una bola de la segunda urna. Hallar
la probabilidad de que las dos bolas sacadas sean del mismo color. Respuesta:
65. En una carretera entre las ciudades A y B hay tres semáforos, a una distancia de unos
kilómetros entre si. Los ciclos de los mismos son de un minuto cada uno. Los tres
semáforos están prendidos en verde durante 30, 40 y 50 segundos respectivamente.
Suponiendo que un auto observa los reglamentos de transito. Calcular la probabilidad
de que el auto:
Sin importar cual de los componentes funcione o no. ¿Cuáles son los posibles
resultados? (Puede suponer independencia en la operación de los componentes).
¿ Cuál es la probabilidad de que el aparato no funcione Respuesta: 0,99
Capítulo 6
Variables aleatorias
La definición anterior nos dice que dado un experimento aleatorio cualquiera, y el espacio
muestral Ω asociado a dicho experimento, una variable aleatoria es una transformación X del
espacio de resultados (espacio muestral) al conjunto de números reales, esto es, asigna a cada
elemento ω ∈ Ω, un número real X(ω). La expresión matemática está dada por:
X : Ω −→ R
A menudo se escribe simplemente v.a. en lugar del término variable aleatoria. En sen-
tido estricto una variable aleatoria es una función de Ω en R que satisface además cierta
condición de medibilidad, pero omitiremos tales tecnicismos pues no son de utilidad para los
propósitos de este curso. Suponga entonces que se efectúa el experimento aleatorio una vez
y se obtiene un resultado ω en R. Al transformar este resultado con la variable aleatoria X
se obtiene un número real X(ω) = x. Podemos entonces suponer que los posibles resultados
del experimento aleatorio son los diferentes números reales x que la función X puede tomar.
Haremos aqui la siguiente observación importante. Seguiremos la notación usual de usar la
letra mayúscula X para denotar una variable aleatoria cualquiera, es decir, X es una función
de Ω en R, mientras que la letra minúscula x denota un número real y que es un posible valor
de la variable aleatoria. En general, las variables aleatorias se denotan usando las últimas
63
6.1. DEFINICIONES Y EJEMPLOS 64
letras del alfabeto en mayúsculas, U,V,W, X,Y, Z, y para un valor cualquiera de ellas se usa
la misma letra pero en minúscula.
Ejemplo 6.1.1 Si un experimento aleatorio consiste en lanzar una vez un dado equilibrado
y observar la cara superior del dado una vez que cae. Denotemos por “1, 2, 3, 4, 5 y 6 ” las
seis caras del dado. Es claro que el espacio muestral es Ω = {1, 2, 3, 4, 5, 6}. Podemos definir
entonces la variable aleatoria X : Ω −→ R como X({1}) = 1 y X({2, 3, 4, 5, 6}) = 0 si
nuestro interés es el número de veces que se obtiene el 1 en este experimento.
Ejemplo 6.1.2 Consideremos el experimento aleatorio consistente en lanzar un dardo en
un tablero circular de radio uno. El espacio muestral o conjunto de posibles resultados del
experimento se puede escribir como sigue:
Ω = {(x, y) : x2 + y2 ≤ 1}
Los siguientes son ejemplos de funciones de Ω en R, variables aleatorias, asociadas a este
experimento aleatorio:
a) X(x, y) = x, proyección sobre el eje horizontal.
b) Y (x, y) = y, proyección sobre el eje vertical.
p
c) Z(x, y) = x2 + y2 , distancia al centro del círculo.
d) V (x, y) = |x| + |y|, distancia del taxista.
e) W (x, y) = xy, producto de las coordenadas.
Figura 6.2: Representación gráfica del espacio muestral del ejemplo 6.1.2
Considerando el conjunto de valores que una variable aleatoria puede tomar, se puede
clasificar a las variables aleatorias en dos tipos: discretas o continuas.
Definición 6.1.2 Una variable aleatoria es discreta cuando el conjunto de valores que és-
ta toma es un conjunto discreto, es decir, un conjunto finito o numerable. Por ejemplo, el
conjunto {0, 1, 2, ..., n} es un conjunto discreto porque es finito, lo mismo N pues aunque es
infinito, es numerable y por lo tanto discreto.
6.1. DEFINICIONES Y EJEMPLOS 65
Definición 6.1.3 Una variable aleatoria es continua cuando toma todos los valores dentro
de un intervalo (a, b) ⊆ R.
Usaremos con mucha frecuencia la notación arriba explicada. El lector debe asegurarse
de comprender bien que si x es un número real entonces (X ≤ x) es un subconjunto de Ω y por
lo tanto un evento. Lo mismo sucede con el complemento de este conjunto que es (X > x).
Podemos escribir entonces la igualdad de conjuntos (X ≤ x) ∪ (X > x) = Ω. Y aplicando
probabilidad se obtiene:
P(X ≤ x) + P(X > x) = 1
6.2. DISTRIBUCIÓN DE PROBABILIDAD 66
Nota importante. A través de una variable aleatoria se puede considerar que los posibles
resultados de un experimento aleatorio no son elementos ω en Ω sino números reales que la
variable aleatoria puede tomar. Esta es una consideración radical pues ya no consideraremos
experimentos aleatorios particulares, ni espacios muestrales arbitrarios Ω, ni eventos (sub-
conjuntos) de Ω, en lugar de ello consideraremos que una cierta variable aleatoria de interés
toma valores en un cierto subconjunto de números reales. La probabilidad definida antes para
subconjuntos de Ω se traslada, como explicamos antes, a probabilidades para subconjuntos
de R. Esta perspectiva permite estudiar modelos generales y después aplicarlos a cualquier
situación particular. A partir de ahora y en lo que resta del curso el término variable aleatoria
constituirá un elemento frecuente en los enunciados.
2) ∑ f (x) = 1
x
Ejemplo 6.2.1 Considere la variable aleatoria discreta X que toma los valores 1, 2 y 3, con
probabilidades 0,3; 0,5 y 0,2 respectivamente. Entonces la función de probabilidad de X es
0, 3 si x = 1
f (x) = 0, 5 si x = 2
0, 2 si x = 3
Esta función se muestra gráficamente en la Figura 6.2. Alternativamente podemos tam-
bién expresar esta función mediante la tabla mostrada más abajo. En esta representación se
entiende de manera implícita que f (x) es cero para cualquier valor de x distinto de 1, 2 y 3.
En particular, compruebe que las siguientes probabilidades son correctas:
P(X ≤ 2) = 0, 7 P(|X| = 1) = 0, 3 y P(X < 1) = 0
x 1 2 3
p(x) 0,3 0,5 0,2
Ejemplo 6.2.2 Encontremos el valor de la constante c que hace que la siguiente función sea
de probabilidad. ½
cx si x = 0, 1, 2, 3
f (x) =
0 en otro caso
Los posibles valores de la variable aleatoria discreta, no especificada, son 0, 1, 2 y 3, con
probabilidades 0, c, 2c y 3c, respectivamente. Como la suma de estas probabilidades debe ser
uno, obtenemos la ecuación c + 2c + 3c = 1. De aqui obtenemos c = 16 . Este es el valor de c
que hace que f (x) sea no negativa y sume uno, es decir, una función de probabilidad.
Definición 6.2.2 (Función de densidad para una variable aleatoria continua)
Sea X una variable aleatoria continua. Decimos que la función integrable y no negativa
f (x) : R −→ [0, ∞) es la función de densidad de X si para cualquier intervalo (a, b) de R se
cumple la igualdad
Z b
P(X ∈ (a, b)) = f (x)dx
a
6.2. DISTRIBUCIÓN DE PROBABILIDAD 68
Es decir, la probabilidad de que la variable tome un valor dentro del intervalo (a, b) se
puede calcular o expresar como el área bajo la función de densidad en el intervalo (a, b).
De esta forma el cálculo de una probabilidad se reduce al cálculo de una integral. Véase
la Figura 6.4. No es difícil comprobar que toda función de densidad f (x) de una variable
aleatoria continua X cumple las dos propiedades que mencionamos a continuación análogas
al caso discreto.
Se trata de una variable aleatoria continua que toma valores en el intervalo [−1, 1]. Como
esta función debe integrar uno tenemos que:
Z ∞ Z 1 Z 1 ³ x 2 ´1
1= f (x)dx = c|x|dx = 2c xdx = 2c =c
−∞ −1 0 2 0
Por lo tanto, cuando tomamos c = 1 la función anterior resulta ser una función de densi-
dad pues ahora cumple con ser no negativa e integrar uno.
Definición 6.2.3 (Función de distribución). Sea X una variable aleatoria discreta o con-
tinua. La función de distribución de X, denotada por F(x) : R −→ [0, 1], se define como
F(x) = P(X ≤ x)
Ejemplo 6.2.5 Consideremos la variable aleatoria discreta X del ejemplo 6.2.1. Tenemos que
la correspondiente función de distribución evaluada en x se calcula sumando las probabilida-
des P(X = u) para valores de u menores o iguales a x, es decir,
0 si x < 1
0, 3 si 1 ≤ x < 2
F(x) = P(X ≤ x) = ∑ P(X = u) =
u≤x
0, 8 si 2 ≤ x < 3
1 si x ≥ 3
cuya gráfica aparece en la Figura 6.6. Este es el comportamiento típico de una función de
distribución de una v.a. discreta, es no decreciente, constante por pedazos, y si la función
tiene una discontinuidad en x, entonces el tamaño de tal discontinuidad es exactamente la
probabilidad de que la variable aleatoria tome ese valor.
6.2. DISTRIBUCIÓN DE PROBABILIDAD 70
Ejemplo 6.2.6 Consideremos ahora la variable aleatoria continua X del ejemplo 6.2.3. La
correspondiente función de distribución se obtiene calculando la siguiente integral:
0 si x ≤ 1 0 si x ≤ 1
Z x Z x
1 x−1
F(x) = P(X ≤ x) = f (u)du = du si 1 < x < 3 = si 1 < x < 3
−∞
1 2
2
1 si x ≥ 3 1 si x ≥ 3
cuya gráfica aparece en la Figura 6.7. Observe que esta función es continua y no decreciente.
En los dos ejemplos anteriores se ha mostrado la forma de obtener F(x) a partir de f (x).
Ahora explicaremos el proceso contrario. En el caso continuo tenemos que para toda x en R,
Z x
F(x) = P(X ≤ x) = f (u)du
−∞
d
de modo que por el teorema fundamental del cálculo, y cuando F(x) es diferenciable, (F(x)) =
dx
f (x). De este modo podemos encontrar f (x) a partir de F(x). En el caso discreto, f (x) =
6.2. DISTRIBUCIÓN DE PROBABILIDAD 71
Proposición 6.2.1 . Toda función de distribución F(x) satisface las siguientes propiedades:
1. 0 ≤ F(x) ≤ 1
2. lı́m F(x) = 1
x−→∞
3. lı́m F(x) = 0
x−→−∞
6. F(x) = F(x+ )
Demostración
1. Como F(x) es una probabilidad pues, por definición, F(x) = P(X ≤ x). Por lo tanto se
cumple la primera propiedad.
/ =0
F(x) −→ P(X ≤ −∞) = P(0)
6. Para h > 0 tenemos que F(x + h) = P(X ≤ x + h) = P(X ≤ x) + P(x < X ≤ x + h), de
modo que cuando h tiende a cero, el conjunto (x < X ≤ x + h) tiende al conjunto vacío.
Concluimos entonces que, cuando h −→ 0 con h > 0,
/ = F(x)
F(x + h) −→ F(x) + P(0)
a) Distribución binomial
c) Distribución Poisson
d) Distribución geométrica
e) Distribución hipergeométrica
a) Distribución ji cuadrado
b) Distribución exponencial
c) Distribución t-student
d) Distribución normal
e) Distribución Gamma
f) Distribución Beta
Las distribuciones continuas son imposibles de tabular y por lo tanto se representan con
curvas.
6.3.1. Esperanza
Definición 6.3.1 Esperanza
La esperanza de una variable aleatoria X es un número real denotado por E(X) y que se
calcula como sigue:
6.3. ESPERANZA, VARIANZA Y MOMENTOS 73
E(X) = ∑ x f (x)
x
en donde la suma se efectúa sobre todos los posibles valores que pueda tomar la variable
aleatoria X, y se define cuando esta suma sea absolutamente convergente, es decir,
El número de sumandos puede ser finito o infinito dependiendo del conjunto de valores
de la variable aleatoria.
Ejemplo 6.3.1 Sea X una variable aleatoria discreta con función de densidad dada por la
siguiente tabla.
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
La esperanza de X es el número
3
1 4 1 2 1
E(X) = ∑ x f (x) = −1 · + 0 · + 1 · + 2 · =
8 8 8 8 2
x=−1
Observe que la suma su efectúa para todos los valores de x indicados en la tabla, es decir: -1,
0, 1 y 2. También es instructivo observar que la esperanza no es necesariamente uno de los
valores tomados por la variable aleatoria. En este ejemplo el valor 12 nunca es tomado por la
variable aleatoria, pero es su valor esperado.
6.3. ESPERANZA, VARIANZA Y MOMENTOS 74
La esperanza de X es
¯1
Z ∞ Z 1
2 2 ¯¯ 2
E(X) = x f (x)dx = x · 2x = x ¯ =
−∞ 0 3 ¯ 3
0
Observe que la integral sólo es relevante en el intervalo (0, 1), pues fuera de dicho intervalo
la función de densidad se anula.
Proposición 6.3.1 Sea X una variable aleatoria y sea g : R −→ R una función tal que g(X)
es una variable aleatoria con esperanza finita. Entonces:
Ejemplo 6.3.4 Sea X una variable aleatoria con función de probabilidad dada por la tabla
que aparece abajo. Encuentre la función de probabilidad de Y = X 2 usando la ecuación (6.3.2).
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
Propiedades de la esperanza
Proposición 6.3.2 Sean X y Y variables aleatorias con esperanzas finitas y sea c una cons-
tante. Entonces
a) E(c) = c
b) E(cX) = cE(X)
c) Si X ≥ 0, entonces E(X) ≥ 0
Demostración
a) Si X es una v.a. discreta por definición de esperanza para caso discreto tenemos que:
Si X es una v.a. continua por definición de esperanza para caso continuo tenemos que:
Z ∞ Z ∞
E(c) = c f (x)dx = c f (x)dx = c
−∞ −∞
b) Si X es una v.a. discreta por definición de esperanza para caso discreto tenemos que:
Si X es una v.a. continua por definición de esperanza para caso continuo tenemos que:
Z ∞ Z ∞
E(cX) = (cx) f (x)dx = c x f (x)dx = cE(X)
−∞ −∞
6.3. ESPERANZA, VARIANZA Y MOMENTOS 76
c) Este inciso es muy evidente pues cuando se cumple la hipótesis (E(X) ≥ 0), en la
integral o suma correspondiente solo aparecerán términos que son no negativos.
Oservaciones:
6.3.2. Varianza
Definición 6.3.2 (Varianza)
La varianza de una variable aleatoria X, denotada por Var(X), se define como la siguiente
esperanza, si ésta existe,
∑ [x − E(X)]2 f (x) si X es una v.a. discreta
x
Var(X) = E[X − E(X)]2 = Z ∞
[x − E(X)]2 f (x)dx si X es una v.a. continua
−∞
La varianza es una medida del grado de dispersión de los diferentes valores tomados por
la variable aleatoria. Se le denota regularmente por la letra σ2 (sigma cuadrada). A la raíz
cuadrada positiva de la varianza, esto es σ, se le llama desviación estándar. Nuevamente la
anterior suma o integral puede no existir y en ese caso decimos que la variable aleatoria
no tiene varianza finita. Observemos que para calcular Var(X) necesitamos conocer primero
E(X). Veamos algunos ejemplos sencillos.
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
6.3. ESPERANZA, VARIANZA Y MOMENTOS 77
1
Recordemos primeramente que por cálculos previos, E(X) = . Aplicando la definición de
2
varianza para v.a. discreta Var(X) = ∑[x − E(X)]2 f (x), tenemos que:
x
³ 1 ´2 1 ³ 1 ´2 4 ³ 1 ´2 1 ³ 1 ´2 2
Var(X) = − 1 − · + 0− · + 1− · + 2− · =1
2 8 2 8 2 8 2 8
Ejemplo 6.3.6 Calcularemos la varianza de la variable aleatoria continua X con función de
densidad f (x) = 2x para x ∈ (0, 1) y cero en otro caso. En un cálculo previo habíamos encon-
2
trado que E(X) = . Aplicando la definición de varianza para una v.a. continua Var(X) =
Z ∞ 3
2
[x − E(X)] f (x)dx, tenemos que
−∞
Z 1³ Z 1³
2 ´2 8 8 ´ ³ x4 8 4 ´¯¯1 1
Var(X) = x− 2xdx = 2x3 − x2 + x dx = − x3 + x2 ¯ =
0 3 0 3 9 2 9 9 0 18
Propiedades de la varianza
Ahora enunciamos algunas propiedades de la varianza.
Proposición 6.3.3 Sean X y Y dos variables aleatorias, y sea c una constante. Entonces
a) Var(X) ≥ 0
b) Var(c) = 0
c) Var(cX) = c2Var(X)
d) Var(X + c) = Var(X)
f) Var(X +Y ) 6= V (X) +V (Y )
Demostración
a) Este inciso es evidente a partir de la definición de varianza pues en ella aparece una
suma o integral de términos no negativos.
b) Para este inciso la constante c es una v.a. con un único valor, de modo que E(c) = c,
entonces
Var(X) = E(c − c)2 = E(0)2 = E(0) = 0
= E(X 2 ) − [E(X)]2
f) Finalmente para demostrar la propiedad (f) es suficiente dar un ejemplo. Puede tomarse
el caso Y = X, en general y por lo demostrado antes, se tiene que
Observación:
Nota: En este curso no entraremos en detalles con respecto a las v.a. independientes por
eso no demostraremos las propiedades que este hecho implica en la esperanza y la varianza
de la suma de v.a. de este tipo mencionadas anteriormente.
6.3.3. Momentos
Los momentos de una variable aleatoria son números que representan algunas caracterís-
ticas de la distribución de probabilidad asociada. Bajo ciertas condiciones el conjunto de
momentos determinan de manera única a la distribución de probabilidad. A continuación
definiremos los momentos si existen de una variable aleatoria alrededor del origen y alrede-
dor de la media también llamada momento central.
Ejemplo 6.3.7 Sea la variable aleatoria discreta X con función de probabilidad dada por la
siguiente tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer, segundo y tercer momento alrededor de la media
Ejemplo 6.3.8 Una variable aleatoria X tiene función de densidad de probabilidad dada por:
x
si 0 < x < 2
2
f (x) =
0 en otro caso
a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer y segundo momento alrededor de la media
Ejemplo 6.4.1 Sea X la variable aleatoria discreta del ejemplo 6.3.7, es decir, con función de
probabilidad dada por la tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
Ejemplo 6.4.2 Una variable aleatoria X tiene función de densidad de probabilidad dada por:
−2x
2e si x ≥ 0
f (x) =
0 en otro caso
2 ¯∞ 2
¯
= e−(2−t)x ¯ =
−(2 − t) 0 2−t
³(tX)k ´
∞ ∞ k
t
MX (t) = E ∑ = ∑ E(X k )
k=0 k! k=0 k!
d³ ´ ∞
t k−1 ∞
t k−1
MX (t) = ∑ E(X k ) = ∑ E(X k−1 X) = E(XetX )
dt k=1 (k − 1)! k=1 (k − 1)!
6.4. FUNCIÓN GENERADORA DE MOMENTOS 82
d2 ³ ´ ∞
t k−2 k
∞
t k−2
2
MX (t) = ∑ E(X ) = ∑ E(X k−2 X 2 ) = E(X 2 etX )
dt k=2 (k − 2)! k=2 (k − 2)!
..
.
dn ³ ´ ∞
t k−n k
∞
t k−n
M X (t) = ∑ E(X ) = ∑ E(X k−n X n ) = E(X n etX )
dt n k=n (k − n)! k=n (k − n)!
Por lo que finalmente
dn ³ ´
MX (0) = E(X n )
dt n
Ejemplo 6.4.3 Tomemos nuevamente a la variable aleatoria discreta X del ejemplo 35 junto
con su función generadora de momentos y calculemos los cuatro primeros momentos de la
variable alrededor del origen. Entonces
et + et + 1
MX (t) =
2
d³ ´¯
¯ e2t + et ¯¯ 1+1
E(X) = Mx (t) ¯ = ¯ = =1
dx t=0 2 t=0 2
d2 ³ ´¯
¯ 2e2t + et ¯¯ 2+1 3
E(X 2 ) = 2 Mx (t) ¯ = ¯ = =
dx t=0 2 t=0 2 2
d 3 ³ ´¯ 2t
4e + e ¯ t ¯ 4+1 5
¯
E(X) = 3 Mx (t) ¯ = ¯ = =
dx t=0 2 t=0 2 2
d 4 ³ ´¯ 2t
8e + e ¯ t ¯ 8+1 9
¯
E(X) = 4 Mx (t) ¯ = ¯ = =
dx t=0 2 t=0 2 2
Ejemplo 6.4.4 Tomemos ahora la variable aleatoria continua X del ejemplo 6.4.2 junto con
su función generadora de momentos y calculemos los cuatro primeros momentos de la vari-
able alrededor del origen. Entonces
2
MX (t) =
2−t
d³ ´¯
¯ 2 ¯¯ 2 1
E(X) = Mx (t) ¯ = 2 ¯ = 2=
dx t=0 (2 − t) t=0 2 2
d2 ³ ´¯
¯ 4 ¯¯ 4 1
E(X 2 ) = 2 Mx (t) ¯ = 3 ¯ = 3=
dx t=0 (2 − t) t=0 2 2
d3 ³ ´¯
¯ 12 ¯¯ 12 3
E(X) = 3 Mx (t) ¯ = 4 ¯ = 4 =
dx t=0 (2 − t) t=0 2 4
d4 ³ ´¯
¯ 48 ¯¯ 48 3
E(X) = 4 Mx (t) ¯ = 5 ¯ = 5 =
dx t=0 (2 − t) t=0 2 2
Proposición 6.4.2 Si X1 , X2 , . . . , Xn son v.a. independientes entonces
n
M³ n ´(t) = ∏ MXi (t)
∑ Xi i=1
i=1
6.5. PROBLEMAS 83
Demostración
Por definición de función generadora de momentos se tiene que
n
³ ∑ Xit ´ ³ n ´ n n
Xi t Xi t
M³ n ´(t) = E e i=1 = E ∏ e = ∏ E(e ) = ∏ MXi (t)
∑ Xi i=1 i=1 i=1
i=1
Notese que para esta demostración utilizamos la propiedad de la esperanza para v.a. in-
dependientes.
6.5. Problemas
Variables Aleatorias
1. Determine en cada caso si la variable aleatoria en cuestión es discreta o continua.
¿Cuáles son sus posibles valores?
a) Tiempo de vida de una persona escogida al azar.
b) Número de errores tipográficos en una página escogida al azar de un libro.
c) Tiempo de servicio en una transacción escogida al azar realizada por una persona
en un cajero automático.
d) Monto de una reclamación por accidente automovilístico escogida al azar del
conjunto de reclamaciones efectuadas a una compañía aseguradora.
2. Considere el experimento aleatorio de escoger un número al azar dentro del intervalo
unitario (0, 1). Suponga que cada resultado de este experimento se escribe en su expan-
sión decimal como ω = 0, x1 x2 x3 . . . . Determine en los siguientes casos el conjunto de
valores de la variable aleatoria definida y clasifique ésta como discreta o continua.
a) X(ω) = ω
b) X(ω) = x1
c) X(ω) = 1 − ω
d) X(ω) = 0, 0x1 x2 x3 . . .
3. Considere un experimento aleatorio con espacio muestral equiprobable ω = {1, 2, 3, 4, 5, 6}.
Defina la variable aleatoria X(ω) = 2(ω − 3). ¿Cuáles son los posibles valores de X?.
Calcule P(X = 0), P(X ∈ {2, 3}), P(X ≥ 0), P(X < 0), P(X 2 = 1), P(2X − 4 = 0), y
P(X 2 = 4).
4. Considere el ejemplo del experimento aleatorio de lanzar un dardo en un tablero circu-
lar de radio p
uno, Figura 1.13, junto con las variables aleatorias X(x, y) = x,Y (x, y) = y
y Z(x, y) = x2 + y2 . Suponga que para cada región A ⊆ Ω cuya área puede ser calcu-
Área(A)
lada se define por P(A) = .
Área(Ω)
³ 1´ ³1 1´
Calcule P(X ≥ 0), P(X < 0), P(X +Y ≤ 1), P(Y > X), P Z < yP <Z< .
2 3 2
6.5. PROBLEMAS 84
3. Encuentre el valor de la constante c para que f (x) sea una función de probabilidad.
Grafique esta función y calcule P(X ∈ 2, 3, 4) y P(X < 3) en cada caso.
cx si x = 1, 2, . . . , 10
a) f (x) =
0 en otro caso
2
cx si x = 1, 2, . . . , 10
b) f (x) =
0 en otro caso
4. Determine si la siguiente función es de probabilidad. Grafique la función y justifique
su respuesta.
1
si x = 0, 1
6
f (x) = 2
si x = 2
3
0 otro caso
x -1 0 1
f(x) 0,2 0,3 0,5
11. Dadas las variables aleatorias con funciones de probabilidad dada por las tablas
x 0 1 2 3 4
f(x) 1/210 4/35 3/7 8/21 1/14
x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 1/18 1/12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36
12. Sea X una v.a. discreta con función de probabilidad dada por la tabla que aparece abajo.
Grafique f (x). Calcule la función de probabilidad de las siguientes variables aleatorias
Y = X 2 , Z = |X| y W = 2X − 5. Grafique en cada caso.
x -2 -1 0 2 3 5
f(x) 0,1 0,15 0,4 0,1 0,15 0,1
13. Sea X discreta con función de probabilidad dada por la tabla que aparece abajo. En-
cuentre el valor de c y grafique f (x). Calcule y grafique la función de probabilidad de
la variable Y = X 2 .
x -2 0 2
f(x) 0,1 c 0,1
14. Sea X una variable aleatoria con la siguiente función de distribución. Encuentre y
grafique f (x). Calcule P(0 ≤ X < 10).
³ 1 ´x+1
1− si x = 0, 1, 2, 3, . . .
F(x) = 2
0 otro caso
18. El tiempo en minutos que una persona espera un autobús es una v.a. con función de
densidad dada por 1
2 si 0 < t < 1
f (t) = 1
4 si 2 < t < 4
0 para otro valor de t
Hallar la probabilidad de que el tiempo en que la persona que espera el autobús sea de
a) mayor de 3 minutos
b) entre 1 y 2 minutos
c) menor de 3 minutos
Hallar:
a) la constante c
b) la función de distribución
³1 3´
c) P(X > 2) y P <X <
2 2
20. Sea X una variable aleatoria con la función de distribución que aparece abajo. ¿Es X
discreta o continua? Grafique F(x). Encuentre y grafique la correspondiente función
de densidad f (x). Calcule además P(X = 2) y P(1 < X < 2).
0 para x < 1
1
F(x) = si 1 ≤ x < 2
3
1 para x ≥ 2
21. Sea X una variable aleatoria con la función de distribución que aparece abajo. ¿Es X
discreta o continua? Grafique F(x). Encuentre y grafique la correspondiente función
1 1
de densidad f (x). Calcule además P(X = ) y P(X > ).
2 2
√0 para x < 0
F(x) = x si 0 ≤ x < 1
1 para x ≥ 1
6.5. PROBLEMAS 88
22. Una urna contiene cuatro bolas numeradas 1, 2, 3 y 4. Se extraen dos bolas al azar, una
a la vez y sin reemplazo. Sea X la variable aleatoria que denota la suma de los números
de las dos bolas seleccionadas.
a) Determine Ω
b) Calcule y grafique f (x)
c) Calcule y grafique F(x)
d) Calcule P(X ≥ 6), P(3 < X ≤ 5) y P(X = 6)
Esperanza, varianza, momentos y función generadora de momentos
1. Sea a un número fijo. Construya una variable aleatoria X tal que E(X) = a.
2. Calcule la esperanza de la variable aleatoria discreta X cuya función de probabilidad
es
1
si x = 0, 1
3
a) f (x) = 1
si x = 2, 3
6
0 otro caso
1
si x = −1, 1
4
b) f (x) = 1
si x = 0
2
0 otro caso
7. Encuentre la esperanza y luego demuestre que la varianza de una variable aleatoria con
la siguiente función de densidad no existe.
2
3 para x > 1
f (x) = x
0 para x ≤ 1
a) Var(E(X)) = 0
b) E(Var(X)) = E(X)
14. Sea X una variable aleatoria continua con función de densidad f (x) = 12e−|x| , para
−∞ < x < ∞. Demuestre que f (x) es efectivamente una función de densidad y com-
pruebe que
a) E(X) = 0
b) E(X 2 ) = 2
c) Var(X) = 2
d) E(X n ) = n! para n par
a) E(−X) = −E(X)
b) Var(−X) = −Var(X)
c) E(Var(X)) = Var(E(X))
0 = Var(0)
= Var(X + (−X))
= Var(X) +Var(−X)
= Var(X) +Var(X)
= 2Var(X)
Capítulo 7
Distribuciones de probabilidad
Demostración
a) A partir de la definición de esperanza se tiene que
E(X) = ∑ x f (x) = 0 · (1 − p) + 1 · p = p
x
91
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 92
b) Según la definición de varianza, Var(X) = ∑[x − E(X)]2 f (x), entonces tenemos que
x
Ejemplo 7.1.1 Considere el experimento aleatorio de lanzar una moneda al aire. Calcula la
esperanza, la varianza y la función generadora de momentos.
Suponga que ω1 = cara y ω2 = cruz son los dos resultados posibles, con probabilidades
1 1
p = y 1 − p = , respectivamente. Sea X la variable aleatoria dada por X(ω1 ) = 1, y
2 2 ³1´
X(ω2 ) = 0. Entonces X tiene distribución Ber , por lo tanto
2
1
E(X) = p =
2
1 1 1
Var(X) = p(1 − p) = (1 − ) =
2 2 4
1 1 1
MX (t) = 1 − + et = (1 + et )
2 2 2
Ω = {(EEE . . . E), (FEE . . . E), (FFE . . . E), . . . , (FFF . . . FE), (FFF . . . F)}
Usando el principio multiplicativo, es fácil ver que este conjunto tiene 2n elementos.
Si ahora se define la variable aleatoria X como el número de éxitos en cada una de estas
sucesiones, esto es
entonces X toma los valores 0, 1, . . . , n, y se dice que X tiene una distribución binomial con
parámetros n y p. Se escribe X ∼ bin(n, p), y su función de probabilidad es
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 93
n!
px (n − p)1−x si x = 0, 1, . . . , n
x!(n − x)!
f (x) =
0 para otro caso
Demostración
Ejemplo 7.1.2 El experimento consiste en lanzar cuatro veces al aire una moneda. Nuestro
interés es el número de caras obtenidas en los cuatro lanzamientos. Como es evidente, la
probabilidad de obtener un éxito (cara), en una de las pruebas (lanzamiento) es 0,50 y la de
obtener un fracaso es también 0,50.
a) La probabilidad de no obtener caras en los cuatro lanzamientos es P(X = 0), esto es,
4! ³ 1 ´4 1
P(X = 0) = =
0!(4 − 0)! 2 16
b) La probabilidad de obtener dos caras en los cuatro lanzamientos es P(X = 2), esto es,
4! ³ 1 ´4 6 3
P(X = 2) = = =
2!(4 − 2)! 2 16 8
x 0 1 2 3 4
p(x) 1/16 4/16 3/8 1/4 1/16
1
E(X) = 4 · =2
2
1 1
Var(X) = 4 · · = 1
2 2
³ 1 1 ´4 1
MX (t) = 1 − + et = (et + 1)4
2 2 16
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 95
Demostración
a) A partir de la definición de esperanza se tiene que
∞ ∞ ∞ −λ x−1
e−λ λx e−λ λx e λ
E(X) = ∑x x!
=∑ =λ∑ =λ
x=0 x=1 (x − 1)! x=1 (x − 1)!
b) Según una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) − [E(X)]2 , en-
tonces calculemos primero E(X 2 )
∞ ∞ ∞
e−λ λx e−λ λx e−λ λx
E(X 2 ) = ∑ x2 x!
= ∑x = ∑ (x − 1 + 1)
x=0 x=1 (x − 1)! x=1 (x − 1)!
∞ ∞ ∞ ∞ −λ x−1
e−λ λx e−λ λx e−λ λx e λ
= ∑ (x − 1) +∑ =∑ +λ ∑
x=1 (x − 1)! x=1 (x − 1)! x=2 (x − 2)! x=1 (x − 1)!
∞ ∞ −λ x−1
e−λ λx−2 e λ
= λ2 ∑ +λ ∑ = λ2 + λ
x=2 (x − 2)! x=1 (x − 1)!
Entonces:
Var(X) = λ2 + λ − λ2 = λ
c) Por la definición de función generadora de momentos, se tiene que
∞ ∞
e−λ λx (et λ)x t t
MX (t) = ∑ etx x!
= e−λ ∑ = e−λ · ee λ = eλ(e −1)
x=0 x=0 x!
= 1 − 0, 7306 = 0, 2694
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 98
La distribución de Poisson puede ser vista como un caso límite de la distribución bino-
mial, es decir, una distribución binomial en la que n → ∞ y p → 0 se puede aproximar
por una distribución de Poisson de parámetro λ = np.
Ejemplo 7.1.4 En una central telefónica automática la probabilidad de que una lla-
mada sea conectada erróneamente es 10−3 .
a) Para un día donde son conectadas 2000 llamadas independientes, hallar el valor
aproximado de la probabilidad que se efectúen 4 conexiones erróneas.
b) ¿Cuál es el número mínimo de llamadas independientes que se requieren para
asegurar con probabilidad 0,9 que por lo menos una de las llamadas sea conectada
erróneamente?
Desarrollo
e−np (np)0
1− ≥ 0, 9
0!
0, 1 ≥ e−np
ln|0, 1| ≥ −np
n ≤ 2303 llamadas
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 99
El nombre de esta distribución proviene del hecho de que cuando escribimos la suma
de todas las probabilidades, obtenemos una suma geométrica. La inspección sucesiva de
artículos hasta encontrar uno defectuoso, posiblemente en un proceso de control de calidad,
puede modelarse usando una distribución geométrica.
Proposición 7.1.4 Si X es la v.a. que muestra el número de fracasos antes del primer éxito
esto es; X ∼ geo(p) entonces:
(1 − p)
a) E(X) =
p
(1 − p)
b) Var(X) =
p2
p ¯ 1 ¯
¯ ¯
c) MX (t) = t
, con t < ln¯ ¯
1 − e (1 − p) 1− p
Demostración
∞
d d h ∞ i
= −p(1 − p) ∑ [(1 − p)x ] = −p(1 − p) ∑ (1 − p)x
x=1 d p d p x=1
d ³1 ´ (−1) 1 − p
= −p(1 − p) − 1 = −p(1 − p) 2 =
dp p p p
b) Según una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) − [E(X)]2 , en-
tonces calculemos primero E(X 2 )
∞ ∞ ∞
2
E(X 2 ) = ∑x p(1 − p) = p ∑ x (1 − p) = p(1 − p) ∑ x2 (1 − p)x−1
x 2 x
x=0 x=1 x=1
∞
d d h ∞ i
= −p(1 − p) ∑ [x(1 − p)x ] = −p(1 − p) ∑ x(1 − p)x
x=1 d p d p x=1
d h1 ∞ x
i d h1 − pi
= −p(1 − p) ∑
d p p x=1
px(1 − p) = −p(1 − p)
d p p2
Entonces:
(1 − p)(2 − p) (1 − p)2 1 − p
Var(X) = − = 2
p2 p2 p
c) Por la definición de función generadora de momentos, se tiene que
∞ ∞
p ¯ 1 ¯
tx x t x ¯ ¯
MX (t) = ∑ e p(1 − p) = p ∑ [e (1 − p)] = t
con t < ln¯ ¯
x=0 x=0 1 − e (1 − p) 1− p
∞
1
Observación: Recordar que una serie geométrica es de la forma ∑ rx−1 y converge a 1 − r
x=1
si su radio r cumple con la condición |r| < 1
Ejemplo 7.1.5 Supongamos que un dado ordinario (equilibrado) es lanzado repetidas veces
hasta que aparece el resultado “1” por primera vez. Calcular
a) obtener la distribución de probabilidad de la v.a. que se ajuste a este experimento y
calcular la probabilidad de obtener el 1 en el cuarto lanzamiento
b) la esperanza, la varianza y la función generadora de momentos
Desarrollo
a) Sea X la v.a que represente el número de lanzamientos necesarios del dado para obtener
por primera vez el resultado “1”. Entonces X ∼ geo(P = 16 ), con lo cual
³ ´x
16 56 si x = 0, 1, 2, . . .
P(X = x) =
0 para otro caso
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 101
Por lo que
1³ 5 ´3 125
P(X = 3) = 1− =
6 6 1296
b) Según la proposición 7.1.4 se tiene que
1 − 16
E(X) = 1
=5
6
1− 1
V (X) = ³ ´52 = 30
1
6
1
1
MX (t) = ³6 ´=
1 − et 1 − 16 6 − 5et
con lo cual µ ¶
n−1
P(An ) = pr (1 − p)n−r (7.1.1)
r−1
Si decimos que X es la v.a. que cuenta el número de fracasos antes de obtener el r-ésimo
éxito, entonces X puede tomar los valores del conjunto {0, 1, 2, . . . }. Además recordemos
que n por definición de An es número de fracasos (x) más número de éxitos (r), esto es
n = x + r. Entonces se entiende la v.a. X podría caracterizar numéricamente al suceso An
como X(An ) = x, por lo que tendremos;
Proposición 7.1.5 Si X es la v.a. que muestra el número de fracasos antes del r éxito esto
es; X ∼ bin neg(r, p) entonces:
r(1 − p)
a) E(X) =
p
r(1 − p)
b) Var(X) =
p2
h p ir ¯ 1 ¯
¯ ¯
c) MX (t) = t
, con t < ln¯ ¯
1 − e (1 − p) 1− p
Demostración
Si X es la v.a que cuenta el número de fracasos antes del r-ésimo éxito en sucesión
r
de pruebas de Bernoulli; entonces X = ∑ Xi, donde todas las v.a. Xi son independientes
i=1
1− p 1− p
entre si y cada Xi ∼ geo(p), ∀ i = 1, 2, . . . , r; con lo cual E(Xi ) = ,Var(Xi ) =
p p2
p
y MXi (t) = . Esto resulta del hecho de que para cada éxito se tubo que haber
1 − et (1 − p)
tenido un cierto número de fracasos, que es la característica de la distribución geométrica.
Entonces
a) la esperanza de X es
³ r ´ r r
1 − p r(1 − p)
E(X) = E ∑ i ∑ i ∑ p = p
X = E(X ) =
i=1 i=1 i=1
b) la varianza de X es
³ r ´ r r
1 − p r(1 − p)
Var(X) = Var ∑ Xi = ∑ Var(Xi ) = ∑ 2
=
p2
i=1 i=1 i=1 p
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 103
Ejemplo 7.1.6 Se lanza repetidas veces una moneda honesta, cuyos dos resultados son cara
y cruz.
a) ¿Cuál es la probabilidad de obtener la tercera cruz en el quinto lanzamiento?
b) Obtener la esperanza, varianza y la función generadora de momentos para esta dis-
tribución
Desarrollo
a) Sea X la v.a. que represente el número de caras (fracasos) necesarias astes de obtener
por tercera vez cruz. Entonces X ∼ bin neg(3, 21 ), con lo cual
µ ¶³ ´ ³ ´
2+x 3 x
1 1
si x = 0, 1, 2, . . .
x
2 2
P(X = x) =
0 para otro caso
Por lo que
µ ¶³ ´ ³ ´ ³ 1 ´5
2+2 1 3 1 2 6
P(X = 2) = =6 = = 0, 1875
2 2 2 2 32
Proposición 7.1.6 Dada una población finita de tamaño N con dos clases posibles de objetos.
Si X es la v.a. que muestra el número de objetos de la primera clase contenidos en una muestra
de tamaño n seleccionada de dicha población entonces X ∼ hipergeo(N, k, n) y presenta las
siguientes caracteristicas:
nk
a) E(X) =
N
nk ³ k ´³ N − n ´
b) Var(X) = 1−
N N N −1
Demostración
Como primer paso seleccionemos n objetos de la población de tamaño N que contiene
n
k objetos de una primera clase y N − k objetos de la segunda clase. Definamos a X = ∑ Xi
i=1
como la v.a aleatoria que cuenta el número de objetos de la primera clase en la muestra
seleccionada; en donde cada Xi , ∀ i = 1, 2, . . . , n es una v.a que presenta las siguientes carac-
terísticas:
Xi = 1 si se selecciona un objeto de la primera clase en la i-ésima extracción
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 105
b) la varianza de X es
³ n ´
Var(X) = Var ∑ i = E(X 2) − E(X)
X
i=1
calculemos entonces:
µ ¶µ ¶ µ ¶µ ¶
k N −k k−1 N −k
2
n x x
x n−x nk n x−1 n−x
E(X ) = ∑
2 µ ¶ = ∑ µ ¶
x=0
N N x=1 N − 1
n n−1
µ ¶µ ¶
k−1 N −k
n (x − 1 + 1)
nk x−1 n−x
= ∑
N x=1
µ
N −1
¶
n−1
µ ¶µ ¶ µ ¶µ ¶
k−2 N −k k−1 N −k
" #
nk (k − 1)(n − 1) n x−2 n−x
n
x−1 n−x
=
N N −1 ∑ µ
N −2
¶ +∑ µ
N −1
¶
x=2 x=1
n−2 n−1
" # " #
nk (k − 1)(n − 1) nk (k − 1)(n − 1) + N − 1
= +1 =
N N −1 N N −1
Por lo tanto
" # " #
nk (k − 1)(n − 1) + N − 1 ³ nk ´2 nk N 2 − (k + n)N + nk
Var(X) = − =
N N −1 N N N(N − 1)
nk ³ N − k ´³ N − n ´
=
N N N
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 106
Ejemplo 7.1.7 Supóngase que una urna contiene cinco bolas rojas y diez azules. Si se selec-
cionan bolas de la urna sin reemplazamiento; sea X la v.a que cuenta el número de bolas rojas
extraidas. Si se extraen al azar sin reemplazamiento siete bolas
Desarrollo
Como X es la v.a que cuenta el número de bolas rojas extraidas en un muestreo sin reem-
plazmiento; se tiene que X ∼ hipergeo(15, 5, 7). Por lo tanto
à !à !
5 10
x 7−x
Ã
15
! si x = 0, 1, 2, 3, 4, 5
P(X = x) =
7
0 para otro caso
a) Para contestar la pregunta de este item basta calcular P(X = 4), esto es;
µ ¶µ ¶
5 10
4 3 5 · 120 40
P(X = 4) = µ ¶ = =
15 6435 429
7
b) Para contestar esta parte debemos calcular P(X ≥ 3); que equivale a decir,
Por lo tanto
µ ¶µ ¶ µ ¶µ ¶ µ ¶µ ¶
5 10 5 10 5 10
3 4 4 3 5 2 140 40 1 61
P(X ≥ 3) = µ ¶ + µ ¶ + µ ¶ = + + =
15 15 15 429 429 143 143
7 7 7
7·5 7
E(X) = =
15 3
³ 7 · 5 ´³ 15 − 5 ´³ 15 − 7 ´ 8
V (X) = =
15 15 15 − 1 9
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 107
Proposición 7.2.1 Sea X la v.a. continua con distribución uniforme en el intervalo (a, b),
entonces X tiene las siguientes características
a+b
a) E(X) =
2
(b − a)2
b) Var(X) =
12
ebt − eat
c) MX (t) =
(b − a)t
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 108
0 si x > a
x
d) F(x) = si a ≤ x < b
b−a
1 si x ≥ b
Demostración
Como X es una v.a. continua con distribución uniforme en el intervalo (a, b) entonces su
función de densidad de probabilidad es
1
si a < x < b
f (x) = b−a
0 en otro caso
con lo cual
a) por definición de esperanza para v.a. continua
Z ∞ Z b ¯b
1 1 ¯ 1 a+b
E(X) = x f (x)dx = x dx = x2 ¯ = (b2 − a2 ) =
−∞ a b−a 2(b − a) a 2(b − a) 2
1 h³ a + b ´3 ³ a + b ´3 i 1 h³ b − a ´3 ³ a − b ´3 i
= b− − a− = −
3(b − a) 2 2 3(b − a) 2 2
1 (b − a)2 (b − a)2
= =
3 4 12
c) por defincición de función generadora de momentos
Z ∞ Z b ¯b ebt − eat
1 1 1 ¯
MX (t) = etx dx = etx dx = etx ¯ =
−∞ b−a b−a a t(b − a) a (b − a)t
Ejemplo 7.2.1 Supongase que tenemos una cuerda de 2m de longitud que queremos cortar
por un punto al azar a una cierta distancia de uno de los extremos. Sea X la v.a. que represente
el punto elegido; entonces
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 109
a) Como el área debe ser 1, la altura del rectángulo será 12 , entonces la función de densidad
es:
1
si 0 < x < 2
f (x) = 2
0 en otro caso
Definición 7.2.2 Decimos que una v.a. X tiene distribución de probabilidad normal si su
función de densidad de probabilidad está definida por la siguiente ecuación:
1 1 x−µ 2
f (x) = √ e− 2 (σ ) , para −∞ < x < ∞
2πσ2
en donde µ ∈ R y σ > 0 son los parámetros. Escribimos entonces X ∼ N(µ, σ2 ). La gráfica de
esta función de densidad tiene forma de campana como se puede apreciar en la Figura 7.6, en
donde se muestra además el significado geométrico de los dos parámetros.
Figura 7.6: Representación gráfica de f (x) para ciertos valores de µ y σ2 de una variable
aleatoria normal.
No es inmediato pero es posible demostrar que E(X) = µ, y ello significa que la campana
esta centrada en este valor, el cual puede ser negativo, positivo o cero. También puede de-
mostrarse que Var(X) = σ2 , y que la distancia del punto µ a cualquiera de los dos puntos en
donde la función tiene puntos de inflexión es σ, por lo tanto la campana se abre o se cierra de
acuerdo a la magnitud de este parámetro. El papel que desempeñan µ y σ puede apreciarse
en la gráfica 7.7.
Si las curvas tienen iguales sus medias pero diferentes varianzas entonces las curvas es-
tarán centradas en la misma posición y tendrán diferentes formas; tal como lo muestra
la Figura 7.8.
Figura 7.8: Curvas normales que tienen medias iguales y desviaciones estándar diferentes
Si las curvas tienen desviaciones estándar iguales y medias diferentes, las curvas serán
idénticas pero centradas en diferentes posiciones sobre el eje horizontal, así como lo
muestra la Figura 7.9.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 113
Figura 7.9: Curvas normales que tienen medias diferentes y desviaciones estándar iguales
Si las curvas tienen medias diferentes y también sus desviaciones estándar son difer-
entes entonces aparte de estar centradas en diferentes lugares del eje x, tendrá formas
diferentes; así como lo muestra la Figura 7.10.
Figura 7.10: Curvas normales que tienen medias diferentes y desviaciones estándar diferentes
Proposición 7.2.2 Sea X una variable aleatoria con distribución normal con parámetros µ
y σ2 . Entonces la siguiente variable aleatoria tiene una distribución normal estándar
X −µ
Z= (7.2.3)
σ
Demostración
Para probar que Z sigue una distribución normal estandar debemos mostrar que E(Z) = 0
y Var(Z) = 1. Recordemos además que si X ∼ N(µ, σ2 ) entonces E(X) = µ y Var(X) = σ2 .
Para realizar la demostración de esta proposición recordemos además las propiedades de la
esperanza y la varianza de una v.a. Por lo tanto
³X − µ´ 1 1 1
E(Z) = E = E(X − µ) = [E(X) − µ] = [µ − µ] = 0
σ σ σ σ
³x − µ´ 1 1 1
Var(Z) = Var = 2 Var(X − µ) = 2 Var(X) = 2 σ2 = 1
σ σ σ σ
A la operación anterior se le conoce con el nombre de estandarización, y bajo tal transfor-
mación se dice que la variable X ha sido estandarizada. Es común usar la letra Z para denotar
una variable aleatoria con distribución normal estándar, y seguiremos nosotros también esa
costumbre.
La proposición anterior parece muy modesta pero tiene una gran importancia opera-
cional pues establece que el cálculo de las probabilidades de una variable aleatoria normal
cualquiera se reduce al cálculo de las probabilidades para la normal estándar. Explicaremos
esta situación con más detalles. Suponga que X es una variable aleatoria con distribución
N(µ, σ2 ), y que deseamos calcular, por ejemplo, P(a < X < b), para a < b números dados.
Tenemos entonces que
³a − µ X − µ b − µ´
P(a < X < b) = P(a − µ < X − µ < b − µ) = P < <
σ σ σ
por lotanto
³a − µ b − µ´
P(a < X < b) = P <Z<
σ σ
La igualdad de estas probabilidades es consecuencia de la igualdad de los eventos. De
esta forma una probabilidad que involucra a la variable X se ha reducido a una probabilidad
que involucra a una variable Z.
Ejemplo 7.2.2 Los coeficientes intelectuales de 600 aspirantes de cierta universidad se dis-
tribuyen aproximadamente de forma normal con una media de 115 y una desviación estándar
de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de que:
a) tenga un coeficiente mayor de 120
Desarrollo
Según las condiciones del problema la v.a. X representa el coeficiente intelectual del
estudiante elegido y además X ∼ N(115, 144).
Para calcular las probabilidades de los distintos itens debemos transformar esta distribu-
ción normal en una distribución normal estándar (con media cero y desviación estándar 1),
x − 115
para lo cual hay que cambiar el valor de x por un valor z con la fórmula z = . Entonces
12
la probabilidad de que:
³ 120 − 115 ´
a) tenga un coeficiente mayor de 120 es: P(X > 120) = P Z > = P(Z > 0, 41)
12
La distribución ya transformada se observa en el siguiente gráfico:
Se busca el valor del área para 0 ≤ Z ≤ 0, 41 en la tabla de áreas bajo la curva normal
estandar; que corresponde al valor 0,1591. Como el área a la derecha del valor z = 0, 41
es el que corresponde a la probabilidad pedida, entonces la probabilidad de que un
aspirante a la universidad tenga un coeficiente intelectual mayor de 120 es:
P(X < 100) = P(Z < −1, 25) = 0, 5 − A(1, 25) = 0, 5 − 0, 3944 = 0, 1056
Se busca el valor del área para 0 ≤ Z ≤ 0, 58 en la tabla de áreas bajo la curva normal
estandar, que es el valor 0,2190. Y como el área a la izquierda del valor z = 0, 58 es el
área que buscamos, entonces el resultado a buscar es:
Se busca el valor del área para 0 ≤ Z ≤ 0, 83 en la tabla de áreas bajo la curva normal
estandar, que es el valor 0,2967. Y como el área a buscar es el área entre z = 0 y z = 0, 83,
entonces el resultado a buscar es:
Se busca el valor del área para −2, 08 ≤ Z ≤ −0, 83 en la tabla de áreas bajo la curva
normal estandar, que es el valor 0,2967. Y como el área a buscar es el área entre z = 0 y
z = 0, 83, entonces el resultado a buscar es:
Recordemos que en la tabla de áreas bajo la curva normal no se tabulan valores neg-
ativos de z y que la distribución normal es simétrica; estos A(z) = A(−z). Se busca el
valor del área para 0 ≤ Z ≤ 2, 14 en la dicha tabla, que corresponde al valor 0,48382.
Y como el área a la izquierda del valor z = −2, 14 es el área que buscamos, entonces el
resultado a buscar es:
b) P(X = 35)
En este caso se pide una probabilidad cuando la variable aleatoria X toma un valor
exacto. En una distribución continua la probabilidad de que la variable aleatoria sea
exactamente un determinado valor no se puede calcular y se estima que es cero, mien-
tras que en una distribución discreta aproximada a una distribución normal (continua)
la probabilidad de X sea igual a un valor puntual se calcula sumando y restando el fac-
tor de corrección de continuidad a dicho valor puntual y estimar el área entre ambos
puntos.
Por lo tanto
³ 34, 5 − 40 35, 5 − 40 ´
P(X = 35) = P ≤Z≤ = P(−1,12 ≤ Z ≤ −0, 92)
4, 899 4, 899
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 120
P(X = 35) = P(−1, 12 ≤ Z ≤ −0, 92) = A(1, 12)−A(0, 92) = 0, 3686−0, 3212 = 0, 0474
c) P(X ≤ 30)
Aquí se pide la probabilidad de que X tome valores desde 0 hasta 30 inclusive, como el
30 está incluido el factor de corrección de continuidad se suma. Entonces
³ 30, 5 − 40 ´
P(x ≤ 30) = P Z ≤ = P(Z ≤ −1, 94)
4, 899
Como A(−1, 94) = A(1, 94); se busca el valor del área para 0 ≤ Z ≤ 1, 94 en la tabla,
que corresponde al valor 0,4738. Y como el área a la izquierda del valor z = −1, 94 es
el área que buscamos, entonces el resultado a buscar es:
Definición 7.2.3 Decimos que la variable aleatoria continua X tiene una distribución ji-
cuadrada con k grados de libertad (k entero positivo), si su función de densidad está dada por
la siguiente expresión:
k
1 −1 − x
√2k Γ( k ) x 2 e 2 si 0 < x < ∞
2
f (x) =
0 si x ≤ 0
Figura 7.11: Gráfica de f (x) cuando el parámetro k toma los valores 1,2,3,4 y 5
Por la definición anterior; ji-cuadrada es una variable aleatoria continua con posibles
valores en el intervalo (0, ∞). Esta distribución tiene un solo parámetro denotado aqui por
la letra k, y al cual se le llama grados de libertad. También al parámetro de ji-cuadrado se
denota por la letra griega ν. A pesar de la aparente expresión complicada de f (x), no es difícil
comprobar que es efectivamente una función de densidad de probabilidad. La gráfica de esta
función para varios valores del parámetro k aparece en la Figura 7.9.
Escribiremos simplemente X ∼ χ2 (k), en donde la letra griega χ se pronuncia “ji” o
también “chi”. Puede demostrarse que E(X) = k y Var(X) = 2k. La distribución ji-cuadrada
puede obtenerse como indican los siguientes resultados que dejaremos sin demostrar.
Es decir, el cuadrado de una variable aleatoria con distribución normal estándar tiene
distribución ji-cuadrada con un grado de libertad. Por otro lado, el siguiente resultado es-
tablece que la suma de dos variables aleatorias independientes con distribución ji-cuadrada
tiene distribución nuevamente ji-cuadrada con grado de libertad igual a la suma de los grados
de libertad de los sumandos.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 122
Está distribución esta estrechamente ligada con muestras aleatorias de una distribución
normal.
la varinza σ2 es desconocida.
4. Todas tienen la misma media de cero, pero sus desviaciones estándar difieren de acuer-
do al tamaño de la muestra.
Definición 7.2.5 Decimos que una variable aleatoria continua X tiene una distribución
exponencial con parámetro λ > 0, y escribimos X ∼ exp(λ), cuando su función de densidad
de probabilidad es
λe−λx si x > 0
f (x) =
0 si x ≤ 0
La gráfica de esta función cuando el parámetro λ toma los valores particulares 0,5; 1,0 y
1,5 se muestra en la Figura 7.11.
La correspondiente función de distribución de esta v.a. está dada por
0 si x ≤ 0
F(x) = P(X ≤ x) =
1 − e−λx si x > 0
La gráfica de esta función cuando el parámetro λ toma los valores particulares 0,5; 1,0 y
1,5 se muestra en la Figura 7.12.
Proposición 7.2.8 Sea X la v.a. continua con distribución exponencial, entonces X tiene las
siguientes características
1
a) E(X) =
λ
1
b) Var(X) =
λ2
λ
c) MX (t) =
λ−t
Demostración
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 126
Figura 7.13: Gráfica de f (x) cuando el parámetro λ toma los valores 0,5;1,0 y 1,5
Figura 7.14: Gráfica de F(x) cuando el parámetro λ toma los valores 0,5;1,0 y 1,5
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 127
Ejemplo 7.2.4 Suponga que el tiempo en minutos que un usuario cualquiera permanece re-
1
visando su correo electrónico sigue una distribución exponencial de parámetro λ = . Calcule
5
la probabilidad de que un usuario cualquiera permanezca conectado al servidor de correo
a) menos de un minuto
b) más de un ahora
Solución
b) Siguiendo el mismo razonamiento del inciso anterior y teniendo en cuenta que una
hora equivale a 60 minutos se tiene que
Z ∞
1 −1x 1 − 1 x ¯¯∞
P(X > 60) = e dx = − 5e 5 ¯ = e−12 = 6, 14 · 10−6
5
60 5 5 60
7.3. Problemas
Distribución binomial
1. Sea X una variable aleatoria con distribución bin(n, p) tal que E(X) = 4 y Var(X) = 2.
¿Cuáles son los valores de n y p?
2. Sea X una variable aleatoria con distribución bin(n, p). Demuestre que la variable Y =
n − X tiene distribución bin(n, 1 − p). Proporcione una explicación probabilísta de este
resultado.
4. Se lanza una moneda equilibrada 6 veces. Calcule la probabilidad de que cada cara
caiga exactamente 3 veces.
5. Se lanza una moneda equilibrada 2n veces. Calcule la probabilidad de que ambas caras
caigan el mismo número de veces.
6. Sea X una variable aleatoria con distribución bin(n, p). Demuestre que
0 ≤ Var(X) ≤ E(X)
7. Suponiendo que es igualmente probable que nazca un hombre (H) o una mujer (M), y
considerando la observación de 6 nacimientos. ¿Cuál de los siguientes eventos es más
probable que ocurra?
a) MHHMHM
b) MMMMHM
c) HMHMHM
9. En la ciudad la necesidad de dinero para comprar drogas se establece como la razón del
75 % de los robos. Encuentre la probabilidad de que entre los siguientes cinco casos de
robo:
10. Un prominente médico afirma que 70 % de las personas con cáncer de pulmón son
fumadores empedernidos. Si su aseveración es correcta:
13. Un estudio examinó las actitudes hacia los antidepresivos. El estudio reveló que aprox-
imadamente el 70 % cree que “los antidepresivos en realidad no curan nada, sólo en-
cubren el problema real”. De acuerdo con este estudio
a) sobrevivan exactamente 14
b) sobrevivan por lo menos 10
c) sobrevivan cuando mucho 16
d) sobrevivan entre 5 y 10
17. Harry Ohme esta a cargo de la sección de electrónica de una gran tienda departamental.
Se has dado cuenta de que la probabilidad de que un cliente que solamente se encuen-
tra curioseando compre algo es de 0,3. Suponga que 15 clientes visitan la sección de
electrónica cada hora.
a) ¿Cual es la probabilidad de que almenos una de las personas que curiosea compré
algo durante una hora dada?
b) ¿Cual es la probabilidad de que almenos cuatro personas que curiosean compre
algo durante una hora dada?
c) ¿Cual es la probabilidad de que ninguna de las personas que curiosean compre
algo durante una hora dada?
d) ¿Cual es la probabilidad de que no más de cuatro personas que curiosean compre
algo durante una hora dada?
18. Un aparato de radio que no funciona se agrupa accidentalmente con 5 radios que fun-
cionan. ¿Cual es la probabilidad de que se escoja un conjunto de tres radios, el aparato
que no funciona este entre los tres escogidos?
19. Una abogada especializada en litigios por drogas estima que gana el 70 % de sus casos
que van a la corte. Acaba de leer “Drogas: Un caso para legalización” en el número
del 3 de octubre de 1989 y quiere usar parte de los argumentos del artículo en su
próximo juicio. Considere su probabilidad de éxito estimado, si actualmente representa
a 5 acusados en distintos casos. ¿Cuál es la probabilidad de qué:
22. Un complejo sistema electrónico esta construido con cierto número de componentes de
apoyo en sus subsistema. Un subsistema contiene cuatro componentes idénticos, cada
uno con una probabilidad de 0,2 de fallar en menos de 1000 hs. El subsistema funciona
si dos componentes cualesquiera de los cuatro trabajan en forma adecuada. Se suponen
que los componentes operan independientemente.
7.3. PROBLEMAS 132
24. Un examen de opción múltiple esta compuesto de 15 preguntas, con cinco respuestas
posibles cada una, de las cuales solamente una es la correcta. Supóngase que uno de
los estudiantes que realiza el examen contesta las preguntas al azar. ¿Cual es la proba-
bilidad de que conteste al menos 10 preguntas correctamente?
25. Un sistema para detectar incendios utiliza tres celdas sensibles a la temperatura que
actúan independientemente, talque una o más pueden activar la alarma. Cada celda
tiene una probabilidad p = 0, 8 de activar la alarma al alcanzar la temperatura de 100
grados Celsius o más. Sea Y el numero de celdas que activan la alarma cuando la
temperatura alcanza 100 grados. Encuentre la probabilidad de que la alarma funcione
cuando la temperatura alcanza los 100 grados.
26. Suponga que un lote de producción de 40000 hornos de microondas incluye 32000 sin
ningún defecto, que no requieren en absoluto ningún ajuste. Sin embargo el departa-
mento de control de calidad, sin conocer el dato referente al lote de producción, toma
una muestra aleatoria de 10 hornos para calcular la calidad global.
28. Una cadena de moteles ha adoptado la política de hacer un descuento del 3 % a los
clientes que paguen en efectivo en vez de hacerlo con tarjeta de crédito. Su experiencia
indica que el 30 % de los clientes aceptan el descuento. Sea Y el número de personas
que aceptan el descuento entre los próximos 20 clientes.
29. Un fabricante de medicamentos afirma que solo el 10 % que resultan efectivas en las
pruebas con animales pasan el resto de las que se le exige para su comercialización.
Actualmente, el fabricante tiene 8 nuevos medicamentos de probada efectividad en
experimentos con animales y que esperan pasar en las siguientes pruebas.
30. Una compañía pequeña utiliza un servicio de paquetería para enviar los pedidos de
quesos especiales que son para obsequios. La compañía ha encontrado que el 90 %
de los paquetes se entregan a tiempo. Se envía un embarque de 20 paquetes. Sea Y =
número de paquetes embarcados a tiempo. Suponiendo que las hipótesis binomiales se
cumplen calcular:
31. La revista Statistical Adstrac (U.S) informa que la mediana del ingreso familiar en
Estados Unidos durante 1985 fue 27755 dólares. En cuatro familias seleccionadas al
azar, calcular la probabilidad de que:
32. Entre personas que donan sangre en una clínica, 80 % tienen RH+, es decir el factor
Rhesus en su sangre. Cinco personas donan sangre en al clínica en determinado día.
a) Calcular la probabilidad de que al menos una de las cinco no tenga el factor RH+.
b) Calcular la probabilidad de que cuando mucho 4 de las 5 tenga sangre del tipo
RH+.
7.3. PROBLEMAS 134
Distribución Geométrica
1. Considere una urna con 3 bolas negras y 5 bolas blancas. Se escoge una bola al azar,
se registra su color, y despu´es se regresa a la urna. ¿Cuántas extracciones en promedio
se necesitan realizar hasta obtener una bola negra por primera vez?
2. Sea X una variable aleatoria con distribución geo(p). Demuestre que para cualesquiera
a, b = 0, 1, 2, . . . se cumple la siguiente propiedad llamada de pérdida de memoria:
P(X ≤ a + b|X ≤ a) = P(X ≤ b).
Distribución Poisson
1. Sea X una variable aleatoria con distribución Poisson(λ). Demuestre que para todo
x = 0, 1, 2, . . . se cumple la siguiente fórmula. Esta expresión permite calcular las pro-
babilidades Poisson de una forma iterativa.
λ
P(X = x + 1) = P(X = x)
(x + 1)
2. Sea X una variable aleatoria con distribución Poisson(λ). Demuestre que la probabili-
(1 + e−2λ )
dad de que X tome un valor par es .
2
3. El número de computadoras que fallan por mes en un laboratorio de cómputo tiene
una distribución Poisson con un promedio mensual de λ = 2 máquinas descompuestas.
El laboratorio tiene capacidad para reparar hasta dos máquinas por mes. Cuando se
descomponen más de dos máquinas, las restantes se envían fuera del laboratorio para
su reparación.
4. Sea Y una variable aleatoria que tiene una distribución de Poisson cuyo promedio es
de 2. Calcular:
a) P(Y = 4)
b) P(Y ≥ 4)
c) P(Y ≤ 4)
6. Supongamos que la probabilidad de que una persona reciba una inyección de penicilina
y sufra una reacción desfavorable es de 0,0002. Si 3000 personas reciben aplicaciones
de este medicamento. ¿Cuál es la probabilidad de que 0,1,2,3,4 o 5 personas reaccionen
mal?
7.3. PROBLEMAS 135
11. Los grandes almacenes Bon han determinado que la demanda de cierto modelo de
cámara fotográfica tiene una distribución de Poisson con una media de 2 por semana.
La directora del departamento de cámara quiere estudiar la demanda actual para ver si
se justifica ofrecer clases de fotografía. Acaba de leer un artículo sobre el paisaje en el
American Photographer y piensa que ese tipo de clases seria efectivo.
12. Los autos llegan al lavadero 22 con una tasa promedio de 9 por hora. Si la llegada por
hora sigue una distribución de Poisson, averigüe la probabilidad de que lleguen 15 o
más autos durante una hora dad de operación.
13. Se estima que el número de taxis que esperan recoger un pasajero delante de la terminal
de ómnibus de Asunción tiene una distribución de Poisson con una media de 5,5 taxis.
14. La concertista de piano Donna Prima se preocupa cada vez más por el número de tosi-
dos que se presentan en la audiencia justo antes que empiece a tocar. Durante su última
gira, Donna estimo un promedio de 8 tosidos justo antes de empezar su concierto.
La señora prima le ha prometido a su director que si escucha más de 5 tosidos en el
concierto esa noche, se rehusará a tocar. ¿Cuál es la probabilidad de que la artista toque
esa noche?
15. En promedio cinco pájaros chocan contra el monumento en Washington y mueren por
este motivo cada semana. Bill Garey, un oficial del Servicio del Parque Nacional de Es-
tados Unidos, ha solicitado que el congreso estadounidense asigne fondos para adquirir
equipos que alejen a los pájaros de dicho monumento. Un subcomité del congreso le
ha respondido que pueden asignarle fondos para tal fin a menos que la probabilidad de
que mueran más de tres pájaros cada semana sea mayor que 0,70. ¿Se destinaran los
fondos para la compra de los equipos que alejen a los pájaros del monumento?
16. El número de nudos en un tipo particular de madera tiene una distribución de Poisson
con una media de 1,5 nudos de 10 pies cúbicos de madera. Encuentre la probabilidad
de que un bloque de esta madera de 10 pies cúbico tenga a lo más un nudo.
18. La Articulate Corporation espera que el 99 % de los saldos de sus cuentas por cobrar
sean correctas. Se seleccionó una muestra aleatoria de 200 cuentas para auditarlas.
19. En los últimos 20 años, solo el 2 % en promedio de los cheques endosados a la Ameri-
can Herat Association fueron rechazados. Este mes, la asociación recibió 200 cheques.
¿Cuál es la probabilidad de que:
20. El centro contencioso del condado de Orange, en California maneja varios tipos de
litigios, pero casi todos ellos son del tipo conyugal. De hecho 96 % de los pleitos que
atiende el centro son de esta naturaleza. ¿Cuál es la probabilidad de que de 80 litigios
atendidos por el centro exactamente 7 no sean del tipo conyugal?
Distribución Uniforme
1. Sea X una variable aleatoria con distribución uniforme en el intervalo (1, 4).
3. Se escogen al azar dos números del intervalo (0, 3). Sea X la variable aleatoria que
indica la suma de los dos números elegidos. Si X sigue una distribución uniforme
Distribución Normal
a) P(X ≥ 10)
b) P(X < 0)
c) P(0 < X ≤ 10)
d) P(X ≥ 20)
e) P(−20 < X ≤ 10)
a) P(X ≤ 10)
b) P(X > 0)
c) P(0 < X ≤ 40)
d) P(X ≥ 30)
e) P(−10 < X ≤ 10)
a) F(x) = 0, 8666
b) 1 − F(x) = 0, 9154
4. Un investigador reporta que unos ratones vivirán un promedio de 40 meses cuando sus
dietas se restringen drásticamente y después se enriquecen con vitaminas y proteínas.
Suponga que la vida de tales ratones se distribuye normalmente con una desviación
estándar de 6,3 meses, encuentre la probabilidad de que un ratón viva:
a) Más de 32 meses
b) Menos de 28 meses
c) Entre 37 y 49 meses
d) Entre 45 y 50 meses
e) Entre 40 y 43 meses
f) ¿Cuál es la probabilidad de que de seis ratones 4 vivan más de 30 meses?
5. Las barras de centeno que cierta panadería distribuye a las tiendas locales tienen una
longitud promedio de 30 centímetros y una desviación estándar de 2 centímetros.
Suponga que las longitudes se distribuyen normalmente, ¿qué porcentaje de las bar-
ras son
d) Encuentre cual es el tiempo a partir del cual que duran el 15 % de los viajes más
lentos?
e) Encuentre la probabilidad de que dos de los siguientes tres viajes tomen como
máximo 12 hora.
7. Las alturas de 1000 estudiantes se distribuyen normalmente con una media de 174,5
cm y una desviación estándar de 6,9 cm., ¿cuántos de estos estudiantes se esperaría
que tuvieran alturas
8. Una estación de radio encontró que el tiempo promedio que una persona sintoniza esa
estación es de 15 minutos con una desviación estándar de 3,5 minutos. ¿Cual es la
probabilidad de que un radioescucha sintonice la estación por:
a) más de 20 minutos?
b) entre 15 y 18 minutos?
c) entre 10 y 12 minutos?
d) ¿Cuantos minutos como máximo sintonizan la estación el 70 % de los radioes-
cuchas?
e) ¿Cuál es la probabilidad de que de 8 radioescuchas, al menos 7 sintonicen la
estación por más de 5 minutos?
10. Suponga que el salario por hora de un trabajador en una fabrica de ropa (que se basa
en un sistema de pago a destajo) tiene una distribución normal con un valor esperado
de 5,10 dólares y una desviación estándar de 0,40 dólares.
7.3. PROBLEMAS 140
11. Se ha determinado que la vida útil de cierta marca de llantas radiales tiene una distribu-
ción normal con media 38000 kilómetros y desviación estándar 3000 kilómetros.
a) ¿Cuál es la probabilidad de que una llanta elegida al azar tenga vida útil de cuando
menos 35000 km.?
b) ¿Cuál es la probabilidad de que dure mas de 45000 km.?
13. Una operación de maquinado produce ejes de aceros cuyos diámetros están distribui-
dos normalmente con un promedio de 1,005 pulgadas y desviación estándar de 0,01
pulgadas. Las especificaciones piden diámetros que queden en el intervalo 1, 00 ± 0, 02
pulgadas. ¿Qué porcentaje de la producción no cumplirá las especificaciones?
14. Las ausencias por enfermedad de los empleados de una empresa en un mes tiene una
distribución normal aproximada con promedios de 200 horas y una varianza de 400
horas.
15. Una empresa eléctrica fabrica focos que tienen una duración, antes de fundirse, que se
distribuye normalmente con una media igual a 800 horas y una desviación estándar de
40 horas.
16. Las calificaciones de un examen se distribuyen normalmente con valor esperado igual
a 74 y desviación estándar igual a 7. Si 12 % de la clase obtiene Calificación A . ¿Cuál
es la A más baja posible y la B más alta posible?.
7.3. PROBLEMAS 141
18. Los puntos logrados por los candidatos en una prueba de actitud están distribuidos
normalmente con una media de 500 y una desviación 100. ¿Qué porcentaje de los
candidatos reciben puntajes
a) superiores a 700
b) entre 400 y 600
19. Si la estatura de los estudiantes de una universidad están normalmente distribuidos con
media de 70 pulgadas, con un desvío estándar de 3 pulgadas.
20. El examen dado por un grupo de estudiantes arroja una media de 65 con una desviación
típica de 10. Si quisiéramos dar al 15 % superior una calificación A , al 20 % siguiente
B, al 30 % del medio C, al siguiente 25 % D y al 10 % más bajo F. ¿Qué calificaciones
numéricas siguen el trazado de la curva?.
21. La distribución de los salarios de 2000 trabajadores tiene una media de 70 dólares y una
varianza de 36 dólares. Suponga que la distribución es normal aproximada. Calcular la
probabilidad que ganen:
a) entre 65 y 77 dólares
b) 82 dólares y mas
c) ¿Cuantos trabajadores ganan 60 dólares o menos?
22. Un especialista en ictiología tropical esta interesado en estimar cuanto tiempo puede
sobrevivir cierto tipo de pez en agua con determinado porcentaje de toxicidad. Luego
de una serie de experimentos llega a estimar que la vida media de este tipo de pez
alcanza 100 días con un desvió estándar de 20 días.
23. Dos estudiantes fueron informados de que habían recibido referencias tipificadas de
0,8 y -0,4 respectivamente, en un examen de inglés. Si sus puntuaciones fueron de 88
y 64 respectivamente. Hallar la media y la desviación típica de las puntuaciones.
24. La media de los pesos de 500 estudiantes de un cierto colegio es 151 libras y la
desviación típica 15 libras. Suponiendo que los pesos se distribuyen normalmente,
hallar
25. Una fabrica de productos para televisores vende transistores de vida media de 1000
horas y desviación estándar de 100 horas. Suponiendo que la distribución de vida en
horas de los transistores es normal, calcular:
26. La cantidad semanal que una compañía gasta en mantenimiento y reparaciones tiene
una distribución normal aproximada cuyo promedio es de 400 dólares y su desviación
estándar 20 dólares. Si el presupuesto para cubrir los gastos de reparación para la sem-
ana siguiente es de 450 dólares.
a) ¿Cuál es la probabilidad de que los costos reales sean mayores que la cantidad
supuesta?
b) ¿De cuanto debe ser el presupuesto semanal para mantenimientos y reparaciones
para que tan solo se rebase con una probabilidad de 0,1.
27. Los conductores que se fabrican para utilizar en determinado sistema de computo nece-
sitan tener resistencias que varíen entre 0,12 y 0,14 ohm. Las resistencias reales medi-
das de los conductores que producen la compañía A tiene una distribución normal con
un promedio de 0,13 ohm y una desviación estándar de 0,005 ohm.
28. A una temperatura de 25◦C, las resistencias de un termistor de determinado tipo tiene
una distribución normal con un promedio de 10000 ohm y una desviación típica de
4000 ohm. Los termistores se clasificaran para enviar a un cliente, los que tengan re-
sistencias entre 8000 y 15000 ohm. ¿Qué fracción de los termistores se debe enviar?
29. Los tiempos de las primera avería de una unidad de cierta marca de impresoras de
chorro de tinta tienen aproximadamente una distribución normal con un promedio de
1500 horas y una desviación estándar de 200 horas.
7.3. PROBLEMAS 143
30. Una encuesta entre los habitantes de cierta ciudad, indicó que el ingreso promedio era
de 45000 guaraníes, con una desviación estándar de 5000 guaraníes. Admitiendo una
distribución normal para la variable ingreso, calcular
31. Se acepta que la vida de las bombillas producidas por una compañía eléctrica tiene una
distribución normal, con una media igual a 1000 hs. y una desviación típica de 50 hs.
Determinar la probabilidad de que una bombilla tomada al azar se queme:
32. El peso medio de 500 bacas es de 151 kilogramos, con una dispersión de 15 kilo-
gramos. Suponiendo que la variable “peso” se encuentre normalmente distribuida, de-
terminar:
34. Los resultados obtenidos por los aspirantes que rindieron examen de ingreso en una
Facultad, indicaron una distribución aproximadamente normal de la variable “puntaje”
con un valor medio de 60 puntos y una dispersión de 8 puntos. Calcular el porcentaje
de aspirante que obtuvieron puntajes:
a) mayores a 70 puntos
b) inferiores a 56 puntos
c) entre 65 y 75 puntos
5. Para varios millares de artículos que se mantienen en existencia en una empresa, existe
una probabilidad global del 0,08 de que un articulo especifico (incluyendo tamaño y
color determinado) no se encuentre en existencia. Si para un embarque que cubre los
pedidos para 120 artículos distintos.
7. La Articulate Corporation espera que el 99 % de los saldos de sus cuentas por cobrar
sean correctas. Se selecciono una muestra de 200 cuentas para auditarlas.
8. En los últimos 20 años, solo 3 % de los cheques endosados a la American Herat As-
sociation fueron rechazados. Este mes, la asociación recibió 200 cheques. ¿Cuál es la
probabilidad de que:
9. Suponga que el 10 % de los habitantes de una ciudad son pelirrojos. Un grupo de en-
cuestadores selecciona 200 personas al azar y les pregunta confidencialmente por quien
votaran en las próximas elecciones.
11. Si el 15 % de motores eléctricos producidos por una línea de montaje son defectuosos,
determinar la probabilidad de que entre 100 motores elegidos al azar:
12. La proporción de familias que usan el jabón A en cierta ciudad es de 0,3. Se toma una
muestra aleatoria de 40 familias. Determinar
13. La proporción de estudiantes que reciben calificación C es de 0,7. Se toma una muestra
aleatoria de 150 estudiantes.
7.3. PROBLEMAS 146
14. La probabilidad de que una persona que entra en un supermercado efectúe compra es
de 0,80. Si entran 35 personas diariamente. Calcular la probabilidad de que:
Distribución Exponencial
2. Sabemos que la duración del tipo de bombillas que usamos sigue una distribución
exponencial de media 6 horas.
3. Si la cantidad de dinero pagado por cada póliza en una compañía de seguros se dis-
tribuye exponencialmente con media 2000.
a) Si una persona en este momento está pagando una poliza de seguros a la compañía
¿cuál es la probabilidad de que sea un monto superior a 2500?.
b) Encuentre la cantidad promedio de pago de dinero por un seguro a la compañía.
4. Una máquina de servicio tiene una unidad de reserva para sustituirla de inmediato
cuando falle. El “Tiempo a la falla” (tiempo entre fallas) de la máquina (o de su unidad
de reserva) es exponencial, y sucede cada 40 minutos en promedio.
5. El tiempo entre llegadas en una dependencia del Banco Mercan es exponencial con
valor medio de 0,05 hora. La oficina abre a las 8:00 A.M.
Las llegadas en restaurantes parecidos tienen una frecuencia de 35 clientes por hora.
El tiempo entre llegadas tiene distribución exponencial.
10. Si un cliente llega a McDonalds en menos de 4 minutos después del cliente inmediato
anterior, recibirá un descuento del 10 %. Si el tiempo entre llegadas es entre 4 y 5
minutos, el descuento, es del 6 %. Si el tiempo entre llegadas es mayor que 5 minutos,
el cliente tiene 2 % de descuento. El tiempo entre llegadas es exponencial, con media
de 6 minutos.
a) Determine la probabilidad de que un cliente que llegue reciba el máximo des-
cuento.
b) Determine el descuento promedio a cada cliente que llega
11. Se sabe que el tiempo entre fallas de un refrigerador Kencore es exponencial, con una
media de 9000 horas (más o menos 1 año de funcionamiento), y la empresa otorga una
garantía de 1 año con el refrigerador. ¿Cuál es la probabilidad de que la garantía cubra
una reparación por descompostura?.
12. Los niños nacen en un estado poco poblado, con una frecuencia de un nacimiento cada
12 minutos. El tiempo entre nacimientos sigue una distribución exponencial. Determi-
nar
a) La cantidad promedio de nacimientos por año
b) La probabilidad de que no haya nacimientos en cualquier día
c) La probabilidad de emitir 50 certificados de nacimientos en 3 horas, cuando se
emitieron 40 certificados durante las primeras 2 horas del período de 3 horas.
d) Suponga que el empleado que pasa la información de los certificados de nacimien-
to a la computadora suele esperar hasta que se hayan acumulado 5 certificados.
Calcule la probabilidad de que el empleado capture un nuevo lote en cada hora.
13. Un coleccionista de arte viaja una vez al mes, en promedio, para asistir a subastas.
En cada viaje se garantiza una compra. El tiempo entre los viajes tiene distribución
exponencial. Determine lo siguiente:
a) La probabilidad de que el coleccionista no compre obras de arte en un período de
3 meses.
b) La probabilidad de que el coleccionista no compre más de 8 obras de arte por
año.
c) La probabilidad de que el tiempo entre viajes sucesivos sea mayor que 1 mes.
14. En un banco, la frecuencia de llegadas es de 2 clientes por minuto. Determine lo sigu-
iente:
a) La cantidad promedio de llegadas durante 5 minutos.
b) La probabilidad de que no haya llegadas durante el próximo 0,5 minuto.
c) La probabilidad de que haya al menos una llegada durante el siguiente 0,5 minuto.
d) La probabilidad de que el tiempo entre dos llegadas sucesivas sea de 3 minutos,
cuando menos.
15. El tiempo entre llegadas al restaurante Juan Arepa es exponencial con media de 5
minutos. El restaurante abre a las 11:00 A.M. Determine:
7.3. PROBLEMAS 149
8.1. Introducción
Supongamos que tenemos una población de interés, esto es, un conjunto arbitrario de in-
dividuos (personas, animales, plantas ó objetos en general) cualesquiera, y deseamos conocer
cierta información de esta población. Debido a la imposibilidad o no conveniencia de tener
información de todos y cada uno de los elementos de la población, generalmente tomamos un
pequeño subconjunto de ella, al cual llamamos muestra. Con base en esta muestra trataremos
de inferir la información de la población en su totalidad.
De este modo, cuando se diga, por ejemplo, que una muestra aleatoria es tomada de una
población normal con media µ y varianza σ2 , ello significa que las variables aleatorias que
forman la m.a. son independientes entre sí, y todas ellas tienen la misma distribución normal
y los mismos parámetros que la población. Una muestra aleatoria constituye el elemento
básico para llevar a cabo inferencias estadísticas.
Definición 8.2.2 Una estadística o estadístico muestral es una función cualquiera de una
muestra aleatoria X1 , X2 , . . . , Xn , y por lo tanto es también una variable aleatoria.
150
8.3. MÉTODOS DE MUESTREO 151
Una estadística es entonces cualquier función de las variables aleatorias que se observaron
en la muestra; de manera que esta función no contiene cantidades desconocidas.
Veremos a continuación dos ejemplos de estadísticas que serán usados con frecuencia
más adelante. Considere una muestra aleatoria X1 , X2 , . . . , Xn . La función X definida como
sigue
1 n
X = ∑ Xi
n i=1
es una estadística, y se le conoce con el nombre de media muestral. El otro ejemplo es el de
la varianza muestral, que se puede expresar de dos maneras distintas y se definen por
1 n 1 n
S2 = ∑ i (X − X)2
y Ŝ 2
= ∑ (Xi − X)2
n i=1 n − 1 i=1
Por ejemplo se quiere conocer la resistencia de los tornillos que se fabrica en una plan-
ta, para conocerla es necesario destruir el producto, lógicamente no podemos probar
toda la población porque nos quedaríamos sin productos.
Por ejemplo se quiere conocer el efecto de un nuevo insecticida en las moscas, como se
puede comprender no es posible contactar a todas las moscas para realizar el estudio.
En ocasiones se necesita información rápida para tomar una decisión importante, tal
vez estudiar a toda la población nos lleve más tiempo del que disponemos.
8.3. MÉTODOS DE MUESTREO 152
Por las razones anteriores, en muchos casos es conveniente el uso de muestras, pero
para que podamos extraer conclusiones, es importante que elijamos bien las muestras para
nuestros estudios. Hay cuestiones que debemos especificar a la hora de elegir una muestra:
b) El tamaño de la muestra.
Muestreos no probabilísticos
No sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra ex-
traída sea representativa, ya que no todos los sujetos de la población tienen la misma probabi-
lidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios
procurando que la muestra sea representativa.
Muestreo sin norma: se toma la muestra sin norma alguna, la muestra podría ser
representativa si la población es homogénea y no se producen sesgos de selección.
Muestreos probabilísticos
Los muestreos probabilísticos son aquellos en los que todos los individuos tienen la mis-
ma probabilidad de ser elegidos para formar parte de una muestra. Dentro de los métodos de
muestreo probabilísticos encontramos los siguientes tipos:
2. Muestreo sistemático
3. Muestreo estratificado
después al azar (como una urna, tablas de números aleatorios, números aleatorios gen-
erados electrónicamente, etc.) se eligen los elementos necesarios para la muestra.
que cuando se trabaja con muestras pequeñas es posible que no represente a la población
adecuadamente.
Ejemplo 8.3.1 En una compañía con 150 trabajadores se quiere obtener una muestra aleato-
ria de 15 elementos para un chequeo médico. Se sigue el siguiente procedimiento:
3) El punto de arranque en la tabla se fija mediante la hora en ese momento, 4:03, por lo
tanto se inicia en la fila 4, columna 3.
4) Como los números de los trabajadores van desde 1 hasta 150 solo se toman en cuenta las
primeras 3 cifras de cada número y se registran los números que se vayan encontrando
en ese rango.
Ejemplo 8.3.4 Se quiere conocer la opinión de los padres de familia sobre los temas de edu-
cación sexual tratados en los libros de texto de primaria en la República Mexicana. Como la
población está muy dispersa y es muy grande, es necesario hacer un muestreo por conglom-
erados en varias etapas.
Primero dividimos la República en sectores geográficos, que podrían ser los estados, y
seleccionamos una muestra aleatoria de ellos. Luego en cada uno de ellos hacemos una se-
lección aleatoria de escuelas primarias. Y por último en las escuelas seleccionadas obtenemos
una muestra aleatoria de padres de familia.
Demostración
Para realizar la demostración de esta proposición recordemos que una muestra aleato-
ria de tamaño n esta constituida por n variables aleatorias independientes e identicamente
distribuidas, esto es cada una de las variables aleatorias Xi , ∀ i = 1, 2, . . . , n intervinientes
tienen los mismos parámetros que el de la población de la cual provienen. Por lo tanto
E(Xi ) = µ, ∀i = 1, 2, . . . , n; entonces
³1 n ´ 1 n 1
E(X) = E ∑
n i=1
Xi = ∑ E(Xi ) = nµ = µ
n i=1 n
σ2
E(X − µ)2 = σ2X =
n
donde σ2 es la varianza de la población de la cual provienen todas las muestras de tamaño n.
Demostración
Como ya se dijo anteriormente las variables aleatorias Xi , ∀ i = 1, 2, . . . , n intervienientes
en la muestra aleatoria son independientes e identicamente distribuidas con lo cual tendremos
que Var(Xi ) = σ2 , ∀i = 1, 2, . . . , n y para cualquier par de variables aleatorias Xi , X j , ∀ i 6= j
en la muestra se tendrá Var(Xi + X j ) = Var(Xi ) +Var(X j ). Por lo tanto
³1 n ´ 1 n 1 2 σ2
E(X − µ)2 = σ2X = Var(X) = Var ∑ Xi = ∑ Var(Xi ) = nσ =
n i=1 n2 i=1 n2 n
Desarrollo
Según las condiciones del problema; la media y la desviación estándar poblacional son
respectivamente µ = 300 libras y σ = 50 libras. Como no se conoce el tamaño de la población
se asume que es infinita, por lo que los parámetros de la distribución muestral de medias
σ 50
serán: µX = µ = 300 libras y σX = √ = √ libras. Entonces la probabilidad de que
n n
a) el peso medio de 35 paquetes recibidos aleatoriamente sea menor que 320 libras es
³ 320 − 300 ´
P(X < 320) = P Z < 50
= P(Z < 2, 37) = 0, 5 + A(2, 37)
√
35
b) el peso medio de 40 paquetes recibidos aleatoriamente sea mayor que 290 libras
³ 290 − 300 ´
P(X > 290) = P Z > 50
= P(Z > −1, 26) = 0, 5+A(−1, 26) = 0, 5+A(1, 26)
√
40
Buscando nuevamente en la tabla de Z encontramos que A(1, 26) = 0, 3962 por lo que
la probabilidad buscada esta dada por
P(X > 290) = 0, 5 + 0, 3962 = 0, 8962
8.4. DISTRIBUCIONES MUESTRALES 160
Desarrollo
Según las condiciones del problema; la media y la desviación estándar poblacional son
respectivamente µ = 68, 2 kg y σ = 2, 5 kg. El tamaño de la población es 1000 estudiantes,
por lo que los
r parámetros de lardistribución muestral de medias serán: µX = µ = 68, 2 kg y
σ N −n 2, 5 1000 − 100
σX = √ · =√ · = 0, 2373 kg. Entonces la probabilidad de que
n N −1 100 1000 − 1
la media muestral
a) sea mayor que 68, 9 kg es
³ 68, 9 − 68, 2 ´
P(X > 68, 9) = P Z > = P(Z > 2, 95) = 0, 5 − A(2, 95)
0, 2373
1 n 1 n
S2 = ∑ (Xi − X)2
= ∑ [(Xi − µ) − (X − µ)]2
n i=1 n i=1
n
nS = ∑ [(Xi − µ)2 − 2(Xi − µ)(X − µ) + (X − µ)2 ]
2
i=1
n n n
= ∑ (Xi − µ)2 − 2(X − µ) ∑ (Xi − µ) + ∑ (X − µ)2
i=1 i=1 i=1
n
= ∑ (Xi − µ)2 − 2n(X − µ)2 + n(X − µ)2
i=1
n
= ∑ (Xi − µ)2 − n(X − µ)2
i=1
Por lo tanto
n
∑ (Xi − µ)2 = nS2 + n(X − µ)2
i=1
Proposición 8.4.3 Si se extraen muestras de tamaño n de una población normal con media
µ y varianza σ2 , entonces la esperanza y la varianza de S2 son respectivamente
n−1 2 2(n − 1) 4
µS 2 = σ y σS 2 = σ
n n2
.
8.4. DISTRIBUCIONES MUESTRALES 163
Desarrollo
Para realizar la demostración primeramente recordemos que la esperanza y la varianza
de una distribución ji-cuadrada con con k grados de libertad están dadas por k y 2k respecti-
nS2
vamente. Además tomemos en cuenta que la v.a. 2 tiene una distribución ji-cuadrada con
σ
n − 1 grados de libertad. Entonces
³ nS2 ´ ³ nS2 ´
E = n − 1 y Var = 2(n − 1)
σ2 σ2
por lo que
n 2 n2
E(S ) = n − 1 y Var(S2 ) = 2(n − 1)
σ2 σ4
con lo cual
n−1 2 2(n − 1) 4
E(S2 ) = σ y Var(S2 ) = σ
n n2
Ejemplo 8.4.3 Una población normal tiene una varianza de 15. Si se extraen muestras de
tamaño 5 de esta población; ¿qué porcentajes pueden tener varianzas
a) menores que 10?
b) mayores que 20?
Calcule además la media y la varianza de esta distribución muestral de varianzas.
Desarrollo
Según las condiciones del problema; σ2 = 15 y n = 5. Además el grado de libertad será
n − 1 = 5 − 1 = 4, entonces
a) para responder este inciso debemos calcular primeramente χ21 que viene dada por la
siguiente relación
nS2 (5)(10)
χ21 = 21 = = 3, 3333
σ 15
Luego se busca en la tabla χ2 un valor que tenga 4 grados de libertad y este lo más
cercano a 3,3333. Este valor resulta ser χ2[0,50 ; 4] = 3, 36 y por lo cual la probabilidad
buscada es de aproximadamente 0,50.
8.4. DISTRIBUCIONES MUESTRALES 164
b) para responder a este inciso se debe realizar un procedimiento análogo al anterior; esto
es
nS2 (5)(20)
χ22 = 22 = = 6, 667
σ 15
Luego en la tabla χ2 se observa que el valor 6,667 con 4 grados de libertad está ente los
valores χ2[0,80 ;4] = 5, 99 y χ2[0,90 ;4] = 7, 78; con lo cual podríamos tomar al promedio
de estos valores como el valor más cercano. Entonces
χ2[0,80 ;4] + χ2[0,90 ;4]
5, 99 + 7, 78
χ2[0,85 ;4] = == 6, 885
2 2
con lo cual la probabilidad buscada es de aproximadamente 1 − 0, 85 = 0, 15.
La esperanza y la varianza para esta distribución vienen dadas por las siguientes rela-
ciones
n−1 2 4
E(S2 ) = σ = 15 = 12
n 5
2(n − 1) 2(4)
Var(S2 ) = σ 2
= 15 = 4, 8
n2 52
8.4.4. Distribución F
Esta distribución de probabilidad es usada en varias situaciones. Es usada cuando quer-
emos probar si dos varianzas muestrales provienen de la misma población o de poblaciones
con características idénticas, además es aplicada cuando se quiere comparar las medias de
más de dos poblaciones simultáneamente.
La distribución F se define como la razón entre dos distribuciones ji-cuadrada indepen-
dientes, dividida cada una de ellas entre sus respectivos grados de libertad.
Consideremos dos variables aleatorias independientes Y y W tales que Y tiene una dis-
tribución χ2 con m grados de libertad y W una distribución χ2 com n grados de libertad,
donde m y n son enteros positivos. Se define una nueva variable aleatoria como sigue:
Y
m nY
X= W
=
n
mW
entonces a la variable aleatoria X se le denomina distribución F de Snedecor con m y n
grados de libertad.
8.4. DISTRIBUCIONES MUESTRALES 165
Figura 8.1: Gráfica de f (x) cuando los parámetros m y n toman diferentes pares de valores.
Características de la distribución F
Hay una “familia” de distribuciones F. Cada miembro de esta familia está determinado
por los grados de libertad del numerador (varianza mayor) y por los del denominador
(varianza menor).
Se restó el factor de corrección al límite superior 0,4 debido a que pniño < 0, 4. Esta
resta garantiza que la probabilidad de ocurrencia de este valor extremo no forme parte
del resultado final. Luego en la tabla de Z se observa que A(−2, 90) = A(2, 90) =
0, 4981, con lo cual
Entonces (1000)(0, 994) = 994. Lo que significa que con 994 muestras cabe esperar
que entre 40 % y 60 % sean ñinas.
c) La probabilidad de que 53 % o más sean niñas está dada por
à 1 !
0, 53 − 2(200) − 0, 5
P(pniña ≥ 0, 53) = P Z ≥ = P(Z ≥ 0, 78) = 0, 5 − A(0, 78)
0, 0354
Se restó el factor de corrección al límite inferior 0,53 debido a que pniña ≥ 0, 53. Esta
resta garantiza que la probabilidad de ocurrencia de este valor extremo forme parte del
resultado final. Luego en la tabla de Z se observa que A(0, 78) = 0, 2823, con lo cual
P(pniña ≥ 0, 53) = 0, 5 − 0, 0, 2823 = 0, 2177
Con lo cual (1000)(0, 2177) = 217, 7. Por lo que en aproximadamente 218 muestras
cabe esperar que 53 % o más sean niñas.
Demostración
Recordemos primeramente que por la proposición 8.4.1 la media de toda distribución
muestral de medias coincide con la media de la población del cual se extraen las muestras.
Entonces la media de la distribuciones muestral de sumas y la media de la distribución mues-
tral de diferencias serán respectivamente
σ2X NX − nX
σ2X2 = ·
nX NX − 1
donde nX y NX son el tamaño de la muestra y de la población uno respectivamente.
Cuando las muestras n1 y n2 son de gran tamaño, esto es n1 + n2 − 2 ≥ 30, la distribución
muestral de sumas de medias por aplicación del teorema central del límite se aproxima a una
distribución normal con media µX+Y = µX + µY y varinaza σ2X+Y = σ2X + σY2 . Por lo tanto la
variable aleatoria
(X +Y ) − µX+Y
Z= ∼ N(0, 1)
σX+Y
Bajo estas mismas condiciones la distribución muestral de diferencias de medias también
se aproxima a una distribución normal con media µX−Y = µX −µY y varinaza σ2X−Y = σ2X +σY2
y la variable aleatoria.
(X −Y ) − µX−Y
Z= ∼ N(0, 1)
σX−Y
Ejemplo 8.4.5 Los acumuladores del automóvil de manufactura XY tienen una duración
promedio de 360 días con una desviación estándar de 45 días, y los de manufactura ZW
duran en promedio 300 días con una desviación estándar de 30 días. Si se prueban muestras
al azar de 50 acumuladores de cada marca.
b) Halllar la probabilidad de que la suma de los promedios de los dos grupos sea mayor
que 670 días.
Desarrollo
Si nombramos por X a los acumuladores del automóvil de manufactura XY y por Y a los
acumuladores del automóvil de manufactura ZW tendremos: µX = 360 días, σX = 45 días,
nX = 50, µY = 300 días, σY = 30 días y nY = 50.
b) La probabilidad de que suma de los promedios de los acumuladores tenga una duración
mayor de 670 días, se puede calcular estableciendo una distribución muestral de sumas
de medias sobre las dos poblaciones de acumuladores para automóviles. Además se
tiene que n1 + n2 − 2 = 50 + 50 − 2 = 98, con lo cual
à !
(X +Y ) − (µX + µY )
P(X +Y > 670) = P Z > q
σ2X + σY2
8.4. DISTRIBUCIONES MUESTRALES 172
n1 SX2 n2 SY2
Por la proposición 7.2.4 + 2 ∼ χ2 (n1 + n2 − 2); entonces
σ2X σY
(X ±Y ) − µX±Y
σX±Y
T=v ∼ t(n1 + n2 − 2)
u
u n1 SX2 n2 SY2
u 2 + 2
t σX σY
n1 + n2 − 2
Si se asume que las varianzas poblacionales son iguales; esto es σ2X = σY2 = σ2 ; se tendrá
las siguientes relaciones
s r
σ2 σ2 1 1
σX±Y = + =σ +
n1 n2 n1 n2
v
u
u n1 SX2 n2 SY2 s
u 2 + 2
t σX σY 1 n1 SX2 + n2 SY2
=
n1 + n2 − 2 σ n1 + n2 − 2
8.4. DISTRIBUCIONES MUESTRALES 173
(X ±Y ) − µX±Y
r
1 1
σ +
n n2 (X ±Y ) − µX±Y (X ±Y ) − µX±Y
T= s 1 =s r = r
2
1 n1 SX + n2 SY 2 2 2
n1 SX + n2 SY 1 1 1 1
+ Sp +
σ n1 + n2 − 2 n1 + n2 − 2 n1 n2 n1 n2
s
n1 SX2 + n2 SY2
donde SP = recibe el nombre de varianza combinada de las muestras.
n1 + n2 − 2
Como se puede observar tanto T como su distribución no dependen de las varianzas
poblaciones. Esto es característico de las distribuciones t.
σ2pˆ1 − pˆ2 = Var( pˆ1 − pˆ2 ) = Var( pˆ1 ) +Var( pˆ2 ) = σ2pˆ1 + σ2pˆ2
Si las poblaciones son infinitas o el muestreo en cada población se realiza con sustitución
la distribución muestral de proporciones en cada población seguirá una ley bimonial y se
tendrá que
µ pˆ1 − pˆ2 = P1 − P2
P1 (1 − P1 ) P2 (1 − P2 )
σ2pˆ1 − pˆ2 = +
n1 n2
Por el contrario si almenos una de las poblaciones es finita o el muestreo en él se realiza
sin reemplazamiento, la distribución muestral de proporciones obtenida obedecerá a la ley
hipergeométrica y se tendrá que
P1 (1 − P1 ) N1 − n1 P2 (1 − P2 ) N2 − n2
σ2pˆ1 = · ó σ2pˆ2 = ·
n1 N1 − 1 n2 N2 − 1
8.4. DISTRIBUCIONES MUESTRALES 174
Ejemplo 8.4.6 Un colegio de artes liberales tiene 100 profesores, 60 de los cuales tienen el
doctorado. Dos muestras con n1 = n2 = 30, son extraídas independientemente de este grupo
de profesores, con reposición, y se anotan los números de los que tienen el doctorado. Hallar
la probabilidad de que las dos muestras difieran en 8 ó más en el número con doctorado.
Desarrollo
Según el problema el tamaño de la población es de 100 profesores, de las cuales 60 tienen
doctorado y 40 no, con lo cual la proporción de profesores con doctorado es P = 0, 6 y la de
su opuesto es 1 − P = 0, 4. El rasgo a estudiar en cada muestra es tiene doctorado.
X Y
Se define p̂1 = y p̂2 = ; donde X representa el número de profesores con doctorado
n1 n2
en la muestra n1 y Y número de profesores con doctorado en la muestra n2 . Además como
los muestreos fueron hechos de la misma población y con sustitución, se tiene
µ p̂1 − p̂2 = P1 − P2 = 0, 6 − 0, 6 = 0
s r
P1 (1 − P1 ) P2 (1 − P2 ) (0, 6)(0, 4) (0, 6)(0, 4)
σ p̂1 − p̂2 = + = + = 0, 1265
n1 n2 30 30
Entonces la probabilidad de que las dos muestras difieran en 8 ó más en el número de
profesores con doctorado está dada por
³ X −Y 8´ ³ 0, 2667 ´
P(X −Y ≥ 8) = P ≥ = P( p̂1 − p̂2 ≥ 0, 2667) = P Z ≥
30 30 0, 1265
= P(Z ≥ 2, 11) = 0, 5 − A(2, 11)
8.5. Problemas
Distribución muestral de medias
1. Las alturas de 1000 estudiantes se distribuyen normalmente con una media de 174,5
cm y una desviación estándar de 6,9 cm. Si se extrae una muestra aleatoria de tamaño
100, calcular la probabilidad de que la media muestral
2. Suponga que el salario por hora de un trabajador en una fabrica de ropa (que se basa en
un sistema de pago a destajo) tiene una distribución normal con un valor esperado de
5,10 dólares y una desviación estándar de 0,40 dólares. Si se selecciona una muestra
aleatoria de 35 trabajadores
a) Encuentre la probabilidad de que el salario promedio por hora sea superior a 5,25
dólares.
b) Encuentre la probabilidad de que el salario promedio por hora se encuentre entre
4,90 y 5,20 dólares.
c) Encuentre la probabilidad de que el salario promedio por hora sea superior al
salario mínimo de 3,90 dólares.
3. Se ha determinado que la vida útil de cierta marca de llantas radiales tiene una distribu-
ción normal con media 38000 kilómetros y desviación estándar 3000 kilómetros. Si se
selecciona una muestra aleatoria de 50 de estas llantas,
a) ¿cuál es la probabilidad de que de el promedio de vida útil muestral de las llantas
sea menos de 37500 km?
b) ¿Cuál es la probabilidad de que de el promedio de vida útil muestral de las llantas
sea más de 38500 km?
4. Si los ingresos mensuales de médicos Norteamericanos están distribuidos normal-
mente, con media 15000 dólares y con un desvío estándar de 3500 dólares. Si se
seleccionan 40 médicos, ¿cuál es la probabilidad de que el ingreso promedio anual
muestral:
a) sea superior a 16260 dólares
b) esté entre 16260 y 18500 dólares
c) esté entre 13700 y 16500 dólares
5. Los resultados obtenidos por los aspirantes que rindieron examen de ingreso en una
Facultad de administración, indicaron una distribución aproximadamente normal de la
variable “puntaje” con un valor medio de 70 puntos y una dispersión de 8 puntos. La
cantidad de alumnos que rindieron el examen de ingreso fue de 1500. Si selecciona una
muestra aleatoria de 100 de estos alumnos, calcular la probabilidad de que el puntaje
promedio muestral:
8.5. PROBLEMAS 176
6. El número de libros encuadernados diariamente por una máquina automática sigue una
variable aleatoria cuya distribución no se conoce, con una desviación típica de 14 libros
por día. Si se selecciona una muestra aleatoria de 49 días, determinar la probabilidad
de que el número medio de libros encuadernados durante esos días
3. Para varios millares de artículos que se mantienen en existencia en una empresa, existe
una probabilidad global del 0,08 de que un articulo especifico (incluyendo tamaño y
color determinado) no se encuentre en existencia. Si para un embarque que cubre los
pedidos para 120 artículos distintos.
4. En los últimos 20 años, solo 3 % de los cheques endosados a la American Herat As-
sociation fueron rechazados. Este mes, la asociación recibió 200 cheques . ¿Cuál es la
probabilidad de que:
4. Los cinescopios para televisión del fabricante A tienen una duración media de 6,5 años
y una desviación estándar de 0,9 años, mientras que los del fabricante B tienen una du-
ración media de 6 años y una desviación estándar de 0,8 años. Calcular la probabilidad
a) de que una muestra aleatoria de 36 cinescopios del fabricante A tenga una du-
ración media que sea al menos de un año más que la duración media de una
muestra de 49 cinescopios del fabricante B.
b) de que una muestra aleatoria de 40 cinescopios del fabricante A tenga una du-
ración media inferior de un año y medio que la duración media de una muestra
de 45 cinescopios del fabricante B.
5. Se toma una muestra aleatoria de tamaño 25 de una población normal que tiene una me-
dia de 80 y una desviación estándar de 5. Una segunda muestra aleatroia de tamaño 36
se toma de una población normal diferente que tiene una media de 75 y una desviación
estándar de 3. Encuentre la probabilidad de que
2. Una compañía pequeña utiliza un servicio de paquetería para enviar los pedidos de
quesos especiales que son para obsequios. La compañía ha encontrado que el 90 % de
los paquetes se entregan a tiempo. Ayer envió un embarque de 25 paquetes y hoy uno
de 30. Hallar la probabilidad de que
a) la proporción de personas que realizaron compras ayer supere en 0,1 a las que
realizaron compras hoy.
b) la proporción de personas que realizaron compras hoy supere en 0,15 a las que
realizaron compras ayer.
c) la diferencia entre las proporciones muestrales se inferior a 0,25.
4. Las proporciones de familias que usan el jabón de la marca A en una ciudad X y una
ciudad Y son de 0,3 y 0,4 respectivamente. Si se toma una muestra aleatoria de 40
familias de la ciudad X y 30 de la ciudad Y. Determinar la probabilidad de que
Estimación
9.1. Introducción
El objetivo más importante de la Estadística es obtener una inferencia con respecto a
la población basándose en la información contenida en una muestra. Como las poblaciones
se describen mediante medidas numéricas denominadas parámetros, el objetivo de la may-
oría de las investigaciones estadísticas es deducir una inferencia con respecto a uno o más
parámetros de la población. Los parámetros poblacionales pertenecen a ciertos conjuntos de
valores denominados espacios parámetricos.
Un problema de inferencia estadística o, más simplemente, un problema de estadística es
un problema en el cual se han de analizar datos que han sido generados de acuerdo con una
distribución de probabilidad desconocida y en el que se debe realizar algún tipo de inferencia
acerca de tal distribución. En otras palabras, en un problema de estadística existen dos o más
distribuciones de probabilidad que podrían haber generado algunos datos experimentales.
En la mayoria de los problemas reales, existe un número infinito de distribuciones posibles
distintas que podrían haber generado los datos. Analizando los datos, se intenta conocer la
distribución desconocida para realizar inferencias acerca de ciertas propiedades de la dis-
tribución y determinar la verosimilitud relativa que cada distribución posible tiene de ser la
correcta.
Los problemas que se tratan en la inferencia estadística se dividen generalmente en dos
clases: los problemas de estimación y los de prueba de hipótesis.
El procedimiento mediante el cual; a partir del conocimiento de las características de la
muestra que llamaremos estimadores; inferimos las características de la población se llama
estimación, que a su vez se divide en estimación puntual y estimación por intervalos.
180
9.2. ESTIMADORES Y SUS PROPIEDADES 181
El valor que toma g, es decir g(x1 , x2 , . . . , xn ) será mencionado como una estimación de θ
y habitualmente es escrito como: θ̂ = g(x1 , x2 , . . . , xn )
X
Ejemplo 9.2.1 Sea p̂ = un estimación del parámetro P; donde X es una v.a. bino-
n
mial con parámetros P y n. Probar que p̂ es un estimador insesgado de P.
Desarrollo
Ejemplo 9.2.2 Sea una población con media µ y varianza σ2 . La distribución mues-
σ2
tral de medias tiene media dada por E(X) = µ y varianza Var(X) = y la dis-
n
tribución muestral de medianas tiene también media E(Xmediana ) = µ, pero varianza
πσ2
Var(Xmediana ) = . Vemos que X y Xmediana son estimadores insesgados del parámetro
2n
µ y además Var(X) < Var(Xmediana ), por lo que X es un estimador eficiente de µ.
Eficiencia relativa
También se pueden comparar dos estimadores en base a su eficiencia relativa. Sean θ̂1 y
θ̂2 dos estimadores diferentes del parámetro θ. La eficiencia relativa de θ̂2 , comparada
con θ̂1 , se define por la rezón:
E(θ̂1 − θ)2
R= (9.2.1)
E(θ̂2 − θ)2
9.2. ESTIMADORES Y SUS PROPIEDADES 182
donde θ − E(θ̂i ) se llama sesgo del estimador y puede ser positivo, negativo ó cero. Si
es cero el estimador será insesgado.
Si θ̂1 y θ̂2 son insesgados, la eficiencia relativa no es más que el cociente de sus vari-
anzar.
Var(θ̂1 )
R= (9.2.2)
Var(θ̂2 )
Consistente ó convergente
Proposición 9.2.1 Sea θ̂ una estimación del parámetro θ basada en una muestra de
tamaño n; si lı́m E(θ̂) = θ, y si lı́m Var(θ̂) = 0; entonces θ̂ es una estimación conver-
n→∞ n→∞
gente de θ.
Suficiente
La definición anterior nos dice que un estimador θ̂ es suficiente si utiliza una cantidad
de la información contenida de la muestra y además ningún otro estimador podría
extraer información adicional de la muestra sobre el parámetro de la población θ que
se está estimando que no sea ya suministrada por θ̂.
9.2. ESTIMADORES Y SUS PROPIEDADES 183
Criterio de Fisher-Neyman
Un estadístico Y1 = Y1 (X1 , X2 , . . . , Xn ) es suficiente, si y sólo si:
n
f (x1 , x2 , . . . , xn |θ) = ∏ f (xi |θ) = f (y1 |θ)h(x1 , x2 , . . . , xn )
i=1
donde h no contiene a θ.
Como la población tiene distribución Bernoulli con parámetro 0 < p < 1, la distribu-
ción conjunta de X1 , X2 , . . . , Xn está dada por
n n
n n ∑ xi ∑ (1 − xi)
f (x1 , x2 , . . . , xn |p) = ∏ f (xi |p) = ∏ pxi (1 − p)1−xi = pi=1 (1 − p)i=1
i=1 i=1
Invariante
2 σ2 2
con los cual E(X ) = + µ2 . Entonces X no es un estimador insesgado de µ2 , con lo
n
cual X no es un estimador invariante de µ.
Ejemplo 9.3.1 Los siguientes datos corresponden a una muestra aleatoria de las estaturas
de jugadores de baloncesto de una liga local. Vamos a realizar una estimación puntual de la
estatura promedio de los jugadores de baloncesto de esta liga.
1 10
X= ∑ xi = 1, 96
10 i=1
Como es una estimación puntual, se establece que la estatura promedio de los jugadores
de baloncesto de esta liga es aproximadamente igual a 1, 96 metros.Esto es µ = 1, 96.
Supongamos ahora que extraemos una muestra aleatoria de una población con cierta dis-
tribución de probabilidad y queremos estimar un cierto parámetro de está población a traves
de la muestra tomada. Existen dos metodos de estimación puntual de un parámetro pobla-
cional:
Función de verosimilitud
Si las variables aleatroias X1 , X2 , . . . , Xn constituyen una muestra aleatoria de una dis-
tribución cuya función de probabilidad o de densidad de probabilidad es f (x|θ), entonces
la función de probabilidad o de densidad de probabilidad conjunta de las varables aleatorias
X1 , X2 , . . . , Xn , está dada por:
Ejemplo 9.3.2 Supongamos que las variables aleatorias X1 , X2 , . . . , Xn constituyen una mues-
tra aleatoria de una distribución de Bernoulli con parámetro p desconocido (0 ≤ p ≤ 1).
Encontrar la función de verosimilitud.
Desarrollo
Como cada Xi ; ∀ i = 1, 2, . . . , n; tiene distribución de Bernoulli entonces
x
p i (1 − p)1−xi si x = 0, 1
f (x) =
0 en otro caso
Ejemplo 9.3.3 Suponiendo que el tiempo para fallar T , de una componente tiene una dis-
tribución exponencial con parámetro β desconocido. Si se extrae una mustra aleatoria de
tamaño n de esta población, hallar el estimador de verosimilitud de β.
Desarrollo
Como cada Ti , ∀ i = 1, 2, . . . , n tiene distribución exponencial con prámetro β por ser una
muestra aleatoria proveniente de una población exponencial con dicho parámetro entonces
βe−βti si ti > 0
f (ti ) =
0 en otro caso
por lo que la función de verosimilitud es
n
n
−βti n
−β ∑ ti
L(x1 , x2 , . . . , xn |p) = ∏ βe =β e i=1
i=1
n
−β ∑ ti
log L(x1 , x2 , . . . , xn |p) = logβ e i=1
para t = 1, 2, . . . , k.
En general µt será función de los k parámetros. Sea ahora X1 , X2 , . . . , Xn una muestra
aleatoria de tamaño n de f (x|θ1 , θ2 , . . . , θk ). A partir de esta muestra formamos los k primeros
momentos muestrales m1 , m2 , . . . , mn . Sean θ̂1 , θ̂2 , . . . , θ̂k las soluciones que resultan de las k
ecuaciones mt = µt , para t = 1, 2, . . . , k. Las soluciones θ̂1 , θ̂2 , . . . , θ̂k constituyen los esti-
madores por el metodo de los momentos.
Ejemplo 9.3.4 Sea una población normal con parámetros µ y σ2 , ambas desconocidas. Sea
X1 , X2 , . . . , Xn una muestra aleatoria de tamaño n de esta distribución. Obtener por el metodo
de los momentos las estimaciones de µ y de σ2 .
Desarrollo
Como la distribución es normal entonces E(X) = µ y Var(X) = σ2 . Además recordemos
que Var(X) = E(X 2 ) − [E(X)]2 , entonces E(X 2 ) = σ2 + µ2 . Por otro lado los momentos
1 n 1 n
muestrales se definen como m1 = ∑ Xi y m2 = ∑ Xi2 . Tomando en consideración la
n i=1 n i=1
n
1 1 n
relación mt = µt temdremos que : µ = ∑ Xi = X y σ2 + µ2 = ∑ Xi2 , entonces
n i=1 n i=1
1 n 2 1³ n 2 2
´ 1 n
σ2 = ∑ Xi2 − X = ∑ Xi − nX = ∑ (Xi − X)2
n i=1 n i=1 n i=1
Entonces los estimadores por el método de los momentos son
ˆ 1 n
µ̂ = X y σ = ∑ (Xi − X)2
2
n i=1
Definición 9.4.1 Sea α ∈ (0, 1). Un intervalo de confianza para un parámetro desconocido
θ de una distribución de probabilidad es un intervalo aleatorio de la forma (θ̂1 , θ̂2 ), en donde
θ̂1 y θ̂2 son estadísticas muestrales tales que:
P(θ̂1 < θ < θ̂2 ) = 1 − α
A las estadísticas θ̂1 y θ̂2 se les conoce como límites inferior y superior, respectivamente,
del intervalo de confianza. A los números α y 1 − α se les conoce como nivel se significación
y grado o nivel de confianza, respectivamente. En general, se toma el valor de α cercano a 0
de tal forma que el grado de confianza, 1−α, es cercano a 1. Entonces el nivel de confianza es
la probabilidad de que el parámetro poblacional se encuentre dentro del intervalo encontrado.
Los niveles de confianza más ampliamente usados son 0, 95 y 0, 99, sin embargo puede usarse
cualquier probabilidad cercana a 1.
Intervalos de confianza para estimar la media de una población con muestras grandes
Recordemos que si la muestra es lo suficientemente grande, esto es n ≥ 30, la distribu-
ción muestral de medias por aplicación del teorema central del límite se aproxima a una
distribución normal con media µX = µ y varianza σ2X . Entonces la v.a.
X − µX
Z= ∼ N(0, 1)
σX
X − µX
Z1 < < Z2
σX
se tendrá
X − Zc σX < µX < X + Zc σX
que generalmente se abrevia como
X ± Zc σX
con lo cual el intervalo buscado para la media poblacional µ es
(X − Zc σX , X + Zc σX )
Ejemplo 9.4.1 Los resultados siguientes representan las calificaciones de una muestra aleato-
ria de estudiantes en el primer examen de estadística elemental. Elaborar un intervalo de
confianza del 95 % para estimar la media poblacional.
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
Desarrollo
1 60 3929
X= ∑
60 i=1
Xi =
60
= 65, 483
En el caso de la varianza muestral se puede optar por S2 ó Ŝ2 , la elección es del inves-
tigador, pero generalmente se prefiere usar Ŝ2 ya que es un estimador insesgado de la
varianza poblacional σ2 . Para fines comparativos calculemos los dos
1 60 2 2 283635 ³ 3929 ´2 60 2
S2 = ∑ Xi − X = − = 439, 183 y Ŝ2 = S = 446, 627
60 i=1 60 60 60 − 1
S Ŝ
σX = √ = 2, 705 y σX = √ = 2, 728
60 60
9.4. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 191
5. A continuación se calcula el error máximo de estimación denotado por E para las dos
situaciones, entonces
por lo que el intervalo de confianza buscado será (60, 136 ; 70, 83), es decir
Si comparamos los intervalos obtenidos vemos que hay muy poca diferencia, pero la
obtenida con Ŝ es un poco más ancha y por lo tanto un poco más fiable.
Intervalos de confianza para estimar la media de una población con muestras pequeñas
Si la muestra es de tamaño menor que 30 y la varianza poblacional es desconocida, en-
tonces para calcular el intervalo de confianza que contiene a la media poblacional se utiliza
la distribución t de Student en vez de la distribución normal. Luego se siguen los mismos
pasos de los intervalos de confianza para muestras grandes.
Tomando en consideración que cuando se tienen muestras paqueñas (n < 30) y la varianza
poblacional es desconocida, la distribución muestral de medias puede ser relacionada con una
distribución t de Studens. Por lo tanto la v.a.
√
(X − µX ) n − 1
T= ∼ t(n − 1)
S
9.4. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 192
Ejemplo 9.4.2 Una muestra aleatoria de 12 secretarias que escriben a máquina arrojó un
promedio 85,2 palabras por minuto con una desviación estándar de 9,3 palabras por minu-
to. Encuentre un intervalo de confianza de 95 % para el número promedio de palabras por
minuto escritas por todas las secretarias.
Desarrollo
α/2 = 0, 025
n − 1 = 11 2,201
Por lo tanto el intervalo de confianza buscado es (79, 028 ; 91, 372), que en término de
probabilidades se expresa como
nS2
que 2 esté entre estos dos valores sea igual al grado de fiabilidad propuesto, tal como lo
σ
muestra la figura 9.1. Esto es
³ nS2 ´
P χ2c < 2 < χ2l = 1 − α
σ
Figura 9.1: Gráfica del proceso de elección de los valores χ2c y χ2l .
nS2
Tomando la expresión χ2c < < χ2c y despejando en ella a σ2 , se tendrá
σ2
nS2 nS2
Entonces la probabilidad de que la varianza poblacional esté entre los valores y 2
χ2l χc
estará dada por la relación
³ nS2 nS2 ´
P 2 < σ2 < 2 = 1 − α
χl χc
con lo cual el intervalo de confianza de σ2 con un nivel de confianza de 1 − α estará dada por
³ nS2 nS2 ´
,
χ2l χ2c
se obtiene lo siguiente √ √
nS nS
<σ<
χ[1− α2 ; n−1] χ[ α2 ; n−1]
Desarrollo
p = 0, 05 p = 0, 95
y
gl = 4 0,7107 gl = 4 9,488
con lo cual los valores buscado son χ2c = 0, 711 y χ2l = 9, 488.
Con lo cual el intervalo buscado para la varianza es (2200, 67 ; 29367, 09), que en
término de probabilidades se expresa como
Este resultado se interpreta de la misma manera que para el caso anterior, esto es,
sustituyendo la palabra varianza por la de desiviación estándar.
Ejemplo 9.4.4 Se pregunta a 2000 votantes cuál será la actitud respecto a una determinada
propuesta política; 800 se oponen. Suponiendo que la muestra fuese aleatoria y procedente de
una población Bernoulli. Construya un intervalo de confianza para la proporción de votantes
a favor de la propuesta política para un 95 % de confianza.
Desarrollo
1. El nivel de confianza fijado es 1 − α = 0, 95.
2. Como se trata de estimar una proporción y además n = 60 > 30, la variable aleatoria
estándar a utilizar es Z de la distribución normal estándar. Como 1 − α = 0, 95, ya
vimos anteriormente que Zc = 1, 96.
Por lo que el intervalo buscado es (0, 5785 ; 0, 6215), que en términos de probabilida-
des se expresa como
P(0, 5785 < P < 0, 6215) = 0, 95
Este resultado se interpreta de la siguiente manera: “Hay una probabilidad de 0,95 de
que la proporción de votantes que están a favor de la propuesta política, se encuentre
entre los valores 0,5785 y 0,6215”.
Observación: Si n1 + n2 − 2 ≥ 30 y se desconocen
s las varianzass
poblaciones se utilizan
S12 S22 σ21 σ22
las varianzas muestrales; dicho de otro modo + en lugar de + .
n1 n2 n1 n2
Ejemplo 9.4.5 En un laboratorio, se experimenta con dos drogas que reducen el tiempo de
respuesta a cierto estímulo. Se administra a 35 ratas la droga 1 y a 30 la droga 2. La reducción
del tiempo de reacción al estímulo de cada rata fue registrada como sigue:
Reducción del tiempo con la droga 1 Reducción del tiempo con la droga 2
28 31 33 23 20 11 21 7 21 23
30 22 34 32 35 23 24 27 23 30
30 33 36 34 43 17 17 16 16 25
26 28 27 23 29 37 29 22 12 26
28 33 33 29 38 27 15 23 29 19
27 26 21 24 24 16 17 33 36 14
27 15 28 19 27
Encuentre un intervalo de confianza del 90 % para estimar la diferencia entre los tiempos
de respuesta promedio al estímulo de los grupos e interprete el resultado.
Desarrollo
El nivel de confianza ya establecido es 1 − α = 0, 90.
Como n1 + n2 − 2 = 35 + 30 − 2 = 63 > 30, la variable aleatoria a utilizar es Z de la
normal tipificada. Como 1 − α = 0, 90, buscando en la tabla de Z, encontraremos que
Zc = 1, 645.
Los estadísticos muestrales a utilizar son
X = 28, 457 S12 = 32, 3053 n1 = 35
Y = 21, 867 S22 = 51, 3156 n2 = 30
El error estandar de estimación es
r
32, 3053 51, 3156
σX−Y = + = 1, 623
35 30
El error máximo de estimación estará dada por
E = (1, 645)(1, 623) = 2, 67
Los límites inferior y superior serán respectivamente
con lo cual; el intervalo de confianza buscado en estas condiciones está dada por la expresión
à r r !
1 1 1 1
X −Y − tc S p + ; X −Y + tc S p +
n1 n2 n1 n2
Por lo que el intervalo buscado es (−32, 7 ; 84, 9), que en términos de probabilidades
se expresa como
P(−32, 7 < µX − µY < 84, 9) = 0, 99
mS12 2 nS22
2
∼ χ (m − 1) y 2
∼ χ2 (n − 1)
σ1 σ2
Suponiendo independencia entre estas variables aleatorias; entonces por lo ya visto an-
teriormente el cociente entre dos variables con distribuciones ji-cuadradas divididas por sus
9.4. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 202
Por conveniencia se podría tomar a F1 = F[ α2 ; m−1 ; n−1] y F2 = F[1− α2 ; m−1 ; n−1] ; además
de tener en cuenta que
mS12 nS22
Ŝ12 = y Ŝ22 =
m−1 n−1
la ultima expresión se transforma en
³ 1 Ŝ12 σ21 1 Ŝ12 ´
P · < < · = 1−α
F[1− α2 ; m−1 ; n−1] Ŝ22 σ22 F[ α2 ; m−1 ; n−1] Ŝ22
Ejemplo 9.4.7 La población A tiene una varianza de 3,4 según se determinó con una mues-
tra de 21 elementos, mientras que la población B tenía una varianza de 5,2 según se determinó
por una muestra de 16 elementos. Determinar los límites de confianza del
a) 90 %
b) 95 %
de la razón de las varianzas de las dos poblaciones.
Desarrollo
1 Ŝ12 1 3, 57
a) · 2
= · = 0, 2762
F[0,95 ; 20 ; 15] Ŝ2 2, 33 5, 547
1 Ŝ12 1 3, 57
· 2
= · = 1, 4145
F[0,05 ; 20 ; 15] Ŝ2 0, 455 5, 547
Por lo tanto el intervalo de confianza buscado es (0, 2762 ; 1, 4145); que en tér-
mino probabilístico se expresa como
³ σ21 ´
P 0, 2762 < 2 < 1, 4145 = 0, 90
σ2
1 Ŝ12 1 3, 57
b) · = · = 0, 2332
F[0,975 ; 20 ; 15] Ŝ22 2, 76 5, 547
1 Ŝ12 1 3, 57
· = · = 1, 6502
F[0,05 ; 20 ; 15] Ŝ22 0, 39 5, 547
Por lo tanto el intervalo de confianza buscado es (0, 2332 ; 1, 6502); que en tér-
mino probabilístico se expresa como
³ σ2 ´
P 0, 2332 < 12 < 1, 6502 = 0, 95
σ2
Recordemos que σ p̂1 − p̂2 depende de los parámetros P1 y P2 , que en este caso son de-
sconocidos, razón por la cual para su cálculo se reemplaza a P1 por p̂1 y a P2 por pˆ2 .
Ejemplo 9.4.8 De una cierta ciudad se extrae una muestra aleatoria de 100 personas y
se encuentra que 50 usan una cierta marca de jabón. De la misma ciudad se extrae otra
muestra de 100 personas y se encuentra que 20 usan una marca de jabón distinta a la primera.
Construya un intervalo de confianza del 95 % para la diferencia de proporciones de personas
que usan las respectivas marcas de jabón e interprete el resultado.
Desarrollo
2. Como se trata de estimar diferencias de proporciones y además las muestras son grandes,
la variable aleatoria estándar a utilizar es Z de la distribución normal estándar. Como
1 − α = 0, 95, ya se vió que Zc = 1, 96.
Por lo que el intervalo buscado es (0, 1745 ; 0, 4255), que en término de probabilidad
se expresa como
P(0, 1755 < P1 − P2 < 0, 4255) = 0, 95
9.5. Problemas
2. Sea X1 , X2 , . . . , Xn una m.a. de una población con media desconocida µ. Probar que la
estadística X
4. Sea X1 , X2 , . . . , Xn una m.a. de una población con media conocida µ y varianza σ2 de-
sconocida. Demuestra que la siguiente estadística es un estimador insesgado para σ2 ,
1 n
2
σ̂ = ∑ (Xi − µ)2
n i=1
5. Sea X1 , X2 , . . . , Xn una m.a. de una población con media desconocida y varianza finita
σ2 desconocida. Demuestra que la siguiente estadística es un estimador insesgado para
σ2 ,
n−1
1
σ̂2 = ∑ (Xi+1 − Xi)2
2(n − 1) i=1
6. Sea X1 , X2 , X3 , X4 una muestra aleatoria de una población distribuida según la ley una
ley de Poissón con parámetro θ. Considere los siguientes estadísticos para θ.
X1 + X2 + X3 + X4 X1 + 2X2 + 3X3 + 4X4
θ1 = y
4 10
9.5. PROBLEMAS 207
Estimación Puntual
Método de máxima verosimilitud
7. Supóngase que X1 , X2 , . . . , Xn constituye una muestra aleatoria de tamaño n de una
distribución Bernoulli con parámetro P desconocido, pero se sabe que P pertenece al
intervalo abierto (0, 1).
a) Determinar el estimador de máxima verosimilitud de P, suponiendo que no todos
los valores observados son 0 o todos los valores observados son 1.
b) Probar que el estimador de máxima verosimilitud de P no existe si todo valor
observado es 0 o si todo valor observado es 1.
8. No se sabe que proporción P de la compra de cierta marca de cereal es realizada por
mujeres y que proporción es realizada por hombres. En una muestra de 70 compras
de este cereal, se encontró que 58 fueron realizadas por mujeres y 12 por hombres.
Determine el estimador de máxima verosimilitud para P.
9. Supóngase que X1 , X2 , . . . , Xn constituye una muestra aleatoria de tamaño n de una
distribución normal con media desconocida µ y varianza σ2 también desconocida. De-
termínense los estimadores de máxima verosimilitud para µ y σ2 .
10. Supóngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribución cuya función de
densidad de probabilidad f (x|θ) es la siguiente
θ−1
θx si 0 < x < 1
f (x|θ) =
0 en otro caso
Además, supóngase que el valor de θ es desconocido (θ > 0). Determínese el estimador
de máxima verosimilitud para θ.
11. Supóngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribución cuya función de
densidad de probabilidad f (x|θ) es la siguiente
1
f (x|θ) = e−|x−θ| para − ∞ < x < ∞
2
Además, supóngase que el valor de θ es desconocido (−∞ < θ < ∞). Determínese el
estimador de máxima verosimilitud para θ.
12. Supóngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribución uniforme sobre el
intervalo (θ1 , θ2 ), donde θ1 y θ2 son desconocidos (−∞ < θ1 < θ2 < ∞). Determínense
los estimadores de máxima verosimilitud para θ1 y θ2 .
13. Una población tiene una función de densidad de probabilidad dada por
r
ν 2 −νx2
f (x|ν) = 2ν x e para − ∞ < x < ∞
π
9.5. PROBLEMAS 208
14. Supongase que Γ, el tiempo para fallas (en horas) de un instrumento eléctronico, tiene
la siguiente función de densidad de probabilidad
βe−β(t−t0 ) si t > t0 > 0
f (t|β) =
0 en otro caso
Supóngase que se prueban n artículos y que se anotan los tiempos de fallas t1 ,t2 , . . . ,tn .
suponiendo que t0 es conocido, obtener el estimador de maxima verosimilitud para β.
15. Supóngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribución de Poisson con
media λ desconocida (λ > 0).
Método de momentos
16. Dada una muestra aleatoria de tamaño n de una población uniforme en el intervalo
[0, a], use el método de momentos para encontrar un estimador para el parámetro a.
17. Dada una muestra aleatoria de tamaño n de una población Poisson con parámetro de-
sconocido λ > 0, use el método de momentos para encontrar un estimador del parámetro
λ.
18. Dada una muestra aleatoria de tamaño n de una población exponencial con parámetro
desconocido β > 0, use el método de momentos para encontrar un estimador del parámetro
β.
19. Dada una muestra aleatoria de tamaño n de una población con función de densidad de
probabilidad
1
si 0 < x < β
β
f (x) =
0 otro caso
20. Dada una muestra aleatoria de tamaño n de una población con función de densidad de
probabilidad
(1 − α)xα si 0 < x < 1
f (x) =
0 otro caso
Estimar α por el método de los momentos.
9.5. PROBLEMAS 209
21. Dada una muestra aleatoria de tamaño n de una población con función de densidad de
probabilidad
2
2 (α − x) si 0 < x < α
f (x) = α
0 otro caso
Estimar α por el método de los momentos.
23. Los siguientes datos son el número de kilómetros al año que es manejado el automóvil
por una muestra de 25 propietarios de automóviles:
24. Se toma una muestra aleatoria de 81 observaciones de una población normal. La media
de la muestra es 40 y la desviación estándar de la muestra es 5. Encuentre el intervalo
de confianza de 95 % para la media de la población e inteprete el resultado.
25. Se toma una muestra aleatoria de 49 observaciones de una población normal. La media
de la muestra es 55 y la desviación estándar de la muestra es 10. Encuentre el intervalo
de confianza de 99 % para la media de la población.
26. Una empresa de investigación realizó una encuesta para determinar la cantidad media
que los fumadores continuos gastan en cigarrillos cada semana. Una muestra de 49
fumadores continuos reveló que X = 20 dólares y S = 5 dólares.
27. Un profesor de ingles contó el número de palabras mal escritas en su ensayo que asignó
hace poco a sus alumnos. Para una clase de 40 alumnos, el número medio de palabras
mal escritas fue de 6, 05 y la desviación estándar fue de 2, 44. Construya un intervalo
de confianza de 95 % para el número medio de palabras mal escritas en la población de
estudiantes e interprete el resultado.
28. Una empresa eléctrica fabrica focos que tienen una duración aproximadamente dis-
tribuida de forma normal con una desviación estándar de 40 horas. Si una muestra de
30 focos tienen una duración promedio de 780 horas. Encuentre un intervalo de con-
fianza de 95 % para la media de la población de todos los focos que producen esta
empresa e interprete el resultado.
29. A muchos pacientes con problemas cardiacos se les implantó un marca pasos para con-
trolar su ritmo cardiaco. Se monta un modulo conector de plástico sobre la parte su-
perior del marca pasos. Suponga una desviación estándar de 0,0015 y una distribución
aproximadamente normal. Encuentre un intervalo de confianza de 95 % para la media
de todos los módulos conectores que fabrica cierta compañía e interprete el resultado.
Una muestra aleatoria de 75 módulos tiene un promedio de 0,310 pulgadas.
31. Para una muestra de 50 empresas tomadas de una industria determinada, se encuentra
que el número promedio de empleados por empresas es de 420,5 con una desviación
muestral de 55,7. Existe un total de 380 empresas en esa rama industrial. Encuentre
un intervalo de confianza de 95 % para media de la población de los empleados por
empresa e interprete el resultado.
32. Una fabrica produce anillos para los pistones de un motor de automóvil. Se sabe que
el diámetro del anillo esta distribuida aproximadamente en forma normal y que tiene
una desviación estándar de 0, 001 mm. Una muestra aleatoria de 15 anillos tiene un
diámetro promedio de 74, 036 mm.
33. Se toma una muestra al azar de 45 alumnos, tomados sin reposición de una clase de
estadística de 221 alumnos que muestra una media de 70 puntos y una desviación están-
dar de 9 puntos en las calificaciones finales. Compruebe que el intervalo de confianza
del 98 % para la media de las 221 calificaciones varia de 72, 8 a 97, 2 puntos.
34. La media y la desviación típica de las cargas máximas soportadas por 60 cables están
dadas respectivamente por 11, 9 ton. y 0, 73 ton. Hallar los limites de confianza de:
9.5. PROBLEMAS 211
a) 95 %
b) 99 % para la media de las cargas máximas de todos los cables producidos por la
compañía e interprete los resultados.
35. La municipalidad necesita adquirir lamparitas eléctricas en una fábrica. Se toma una
muestra de 100 lámparas con las cuales se hace que se mida el tiempo en que tardan
en quemarse. Los resultados son: media 2080 horas de vida y desviación típica de 300
horas. Hallar un intervalo de confianza para µ con un nivel de significación de 1 % e
interprete el resultado.
36. Se desea estimar el precio promedio de cierto artículo de consumo. Para tal fin se
realiza una muestra en 101 comercios seleccionados al azar, que indica un precio medio
de 120 dólares, con una desviación muestral de 16 dólares. Construir un intervalo de
confianza que con 95 % de seguridad contenga el parámetro poblacional e interprete el
resultado.
38. Supongamos que la distribución del gasto mensual en consumo de bienes alimenticios,
en unidades monetarias, por cada persona mayor de 16 y más años en una ciudad,
sigue una distribución normal de media desconocida y desviación estándar de 15.000
unidades monetarias. Al encuestar a 100 personas mayores de 16 años y preguntarles
por sus gastos de alimentación se obtiene un gasto medio de 35.650 unidades mone-
tarias. Obtener un intervalo de confianza al 95 % para la media poblacional.
39. las cantidades de pesetas, destinadas por un total de 15 familias a diversiones tales
como cine, teatro y otros espectáculos públicos durante un periodo de tiempo determi-
nado fueron los siguientes:
41. Una empresa de investigación realizó una encuesta para determinar la cantidad media
que los fumadores continuos gastan en cigarrillos cada semana. Una muestra de 25
fumadores continuos reveló que X = 20 dólares y S = 5 dólares. Elabora un intervalo
de confianza del 99 % para la media poblacional e interprete el resultado.
42. Un profesor de inglés contó el número de palabras mal escritas en un ensayo que asignó
hace poco a sus alumnos. Para una clase de 24 alumnos, el número medio de palabras
mal escritas fue de 6,05 y la desviación estándar fue de 2,44. Construya un intervalo
de confianza de 95 % para el número medio de palabras mal escritas en la población de
estudiantes e interprete el resultado.
43. Supongamos que la distribución del gasto mensual en consumo de bienes alimenticios,
en unidades monetarias, por cada persona mayor de 16 y más años en una ciudad es
desconocida. Al encuestar a 20 personas mayores de 16 años y preguntarles por sus
gastos de alimentación se obtiene un gasto medio de 28.915 unidades monetarias y
una varianza muestral de 23.877.000 unidades monetarias al cuadrado. Obtener un
intervalo de confianza al 95 % para la media poblacional.
45. Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de
piezas cuyos diámetros son:
Para Proporciones
46. Una compañía quiere conocer la proporción de consumidores que adquieren su pro-
ducto. Encarga a una empresa un estudio de mercado para obtener un intervalo de
confianza al 99 % de su proporción de clientes a partir de una muestra de tamaño 1000.
Los resultados muestrales arrojaron que 740 de los entrevistados eran clientes de su
producto.
47. Una compañía que fabrica pastelillo desea estimar la proporción de consumidores que
prefieran su marca. Los agentes de la compañía observan a 450 compradores, del
número total observado 300 compraron los pastelillos. Calcule un intervalo de con-
fianza del 95 % para la venta de la proporción de compradores que prefieren la marca
de esta compañía.
9.5. PROBLEMAS 213
48. En una encuesta realizada entre 50 personas de una gran población, se han encontrado
que el procentaje de individuos con gafas es del 25 %. Determinar un intervalo de
confianza al 99 % para la proporción poblacional, P, de los individuos con gafas.
49. En una muestra de 120 personas extraida de cierta población muy numerosa, 20 de
ellas eran portadores de un virus. Estima el intervalo de confianza para el porcentaje
de personas que son portadores del virus en dicha población con un nivel de confianza
del 90 % y 99 %.
50. Se hizo una encuesta a 325 personas mayores de 16 años y se encontró que 120 iban al
cine regularmente. Hallar con un nivel de confianza del 95 % un intervalo para estudiar
la proporción y el porcentaje de los ciudadanos que van al cine regularmente.
51. Tomando al azar una muestra de 500 personas de una determinada comunidad se en-
contró que 300 leían la prensa regularmente. Halla, con confianza del 90 % un intervalo
para estudiar la proporción de lectores entre las personas de esa comunidad.
53. Se realiza una encuesta mediante una pregunta clara y concisa sobre la preferencia
electoral entre dos candidatos a 5000 individuos, obteniéndose el siguiente resultado:
A favor del candidato A el 30 %, a favor del candidato B el 60 % y no contestan el
10 %.
Obtener un intervalo de confianza para la proporción de individuos a favor del can-
didato B a un nivel de confianza del 95 % e interpretar el resultado.
54. Consideramos una poblacion N(µX , 150002 ) de la que hemos extraido una muestra
de tamano 100, obteniendose una media muestral de 35.650 unidades monetarias.
Supongamos ahora que disponemos de una segunda poblacion con distribucion N(µY , 8002 )
de la que se extrae una muestra de tamano 36, con una media muestral de 32.400
unidades monetarias. Si ambas variables se refieren al gasto en alimentacion en sus
respectivas poblaciones, calcular un intervalo de confianza para la diferencia de sus
medias con un nivel de confianza del 95 %.
Hombres Mujeres
nh = 96 nM = 85
Media muestral = 170,81 mg/dl Media muestral = 181,08 mg/dl
Desviación tipica = 30,55 mg/dl Desviación tipica = 30,79 mg/dl
A 8,93 9,54 10,32 6,99 8,56 8,67 9,72 7,76 8,95 9,32 8,59 9,78
B 5,69 7,56 6,88 10,26 9,57 7,88 8,95 9,35 6,58 7,32
61. Los zoólogos están interesados en la distancia promedio que un cierto tipo de mamífero
viaja desde su madriguera. Un equipo de vigilancia observa dos poblaciones de estos
mamíferos, la información en metros de la población 1 fue:
176 289 181 226 265 174 260 260 325 145 207 245 228 144
y de la población 2 fue:
129 212 213 191 157 143 136 148 138 167
62. La revista Human Factors notificó un estudio en el que se les pidió a 14 sujetos que
estacionaran dos automóviles sustancialmente distintos en cuanto al tamaño de la llanta
y la relación de vueltas del volante. Los tiempos obtenidos fueron
Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Coche 1 37 25,8 16,2 24,2 22 33,4 23,8 58,2 36,6 24,4 23,4 21,2 36,2 29,8
Coche 2 17,8 20,2 16,8 41,4 21,4 38,4 16,8 32,2 27,8 23,2 29,6 20,6 32,2 53,8
65. Se analiza la proporción de productos defectuosos producidos por dos líneas de pro-
ducción. Una muestra aleatoria de 100 unidades provenientes de la línea 1 contienen
10 que son defectuosas, mientras que una muestra aleatoria de 120 unidades de la línea
2 tiene 25 que son defectuosas. Encuentre un intervalo de confianza del 99 % para la
diferencia de proporciones de productos defectuosos producidos por las dos líneas.
9.5. PROBLEMAS 216
66. Una tienda de informática está interesada en saber si la proporción de usuarios de or-
denadores personales que utilizan Windows Vista es diferente en dos grandes áreas
urbanas de un país. Habiéndose obtenido muestras aleatorias de 500 usuarios de or-
denadores personales en cada ciudad, la tienda encuentra 35 usuarios que utilizan
Windows Vista en un área y 25 en otra. Construir un intervalo de confianza para la
diferencia de proporciones considerando un nivel de confianza del 95 %.
67. Se realizó un estudio para determinar si hay una diferencia significativa entre los miem-
bros de un sindicato con base en el sexo. Se tomó una muestra aleatoria de 5000 em-
pleados de una fábrica y, de este grupo, 785 eran miembros del sindicato. Se tomó una
muestra aleatoria de 3000 empleadas y, de este grupo, 327 eran miembros del sindica-
to. Construya un intervalo de confianza de 99 % de la diferencia entre las proporciones
e interprete el resultado.
68. La fracción de productos defectuosos fabricados por dos líneas de producción se está
analizando. Una muestra aleatoria de 1000 unidades de la línea 1 tiene 10 defectuosas,
en tanto que una muestra aleatoria de 1200 unidades de la línea 2 tiene 25 defectuosas.
Encuentre un intervalo de confianza de 99 % respecto de la diferencia entre unidades
defectuosas producidas por las dos líneas e interprete el resultado.
69. Se selecciona una muestra aleatoria formada por 80 ejemplares de calamar sahariano.
27 de estos ejemplares resultaron ser machos. Estimar la proporción de machos en esta
especie y dar un intervalo de confianza al 90 % para dicha proporción. En otra muestra
aleatoria de 100 ejemplares de calamar de Peal se encontraron 38 machos. Estimar la
diferencia entre las proporciones de machos de ambas especies mediante un intervalo
de confianza al 95 %.
70. Oficiales escolares comparan el coeficiente intelectual entre niños de dos grupos. De
una muestra de 159 niños del grupo I 78 califican con más de 100 puntos, de una
muestra de 250 niños del grupo II 123 califican con más de 100 puntos. Construya un
intervalo de confianza para la diferencia entre las dos proporciones del grupo I y II de
los niños con califican con más de 100.
Capítulo 10
Prueba de Hipótesis
10.1. Introducción
En el capítulo 8 se inició el estudio de la inferencia estadística. Se describió la manera
de seleccionar una muestra aleatoria y, con base a ésta, estimar el valor de un parámetro
poblacional.
En este capítulo se continuará con el estudio de la inferencia estadística. Pero ya no se
realizarán estimaciones puntuales sobre el valor de un parámetro ó se establecerá un intervalo
de valores dentro del cual se espera que se encuentre el parámetro poblacional, sino que se
realizará una prueba de hipótesis acerca de una afimación sobre un parámetro poblacional.
Todas estas hipótesis tienen algo en común, las poblaciones de interés son tan grandes
que no es factible estudiar todos sus elementos. Como ya sabemos, una alternativa a estudiar
217
10.2. DEFINICIONES Y EJEMPLOS 218
la población entera es tomar una muestra de la población de interés. De esta manera podemos
probar una afirmación para determinar si la evidencia soporta o no la afirmación.
α = P(rechazar H0 | H0 es cierta)
En cambio, la aceptación de la hipótesis nula cuando ésta es falsa recibe el nombre de error
tipo II, y la probabilidad de cometer este segundo tipo de error está dada por la relación
β = P(aceptar H0 | H0 es f alsa)
H0 cierta H0 falsa
Rechazar H0 Error tipo I Decisión correcta
con probabilidad α con probabilidad 1 − β
Aceptar H0 Decisión correcta Error tipo II
con probabilidad 1 − α con probabilidad β
La información para obtener una regla de decisión que nos lleve a rechazar o no rechazar
un hipótesis estadística provendrá de una muestra aleatoria X1 , . . . , Xn de la distribución de
que se trate. Observe además que al aceptar una hipótesis no se afirma que ésta sea absoluta-
mente cierta, sino simplemente que es consistente con los datos de la muestra aleatoria. Si la
muestra cambia, posiblemente la decisión de rechazar o no rechazar también.
Definición 10.2.4 El subconjunto S1 del espacio muestral S para el cual H0 sería rechazada
se denomina región crítica del contraste y a la probabilidad de cometer el error tipo I, esto
es α, se le llama tamaño de la región crítica. A esta probabilidad se le conoce también con el
nombre de nivel de significancia.
y R denominada zona de rechazo y que contiene todos los resultados para los cuales
H0 será rechazada.
que constituye la probabilidad de evitar un error de tipo II. Por lo que la potencia de la prueba,
para cualquier valor en H1 , es la probabilidad de rechazar H0 , dado que H1 es cierta.
Por el contrario si H0 es cierta, la función de potencia es
que constituye la probabilidad de evitar un error de tipo I. Por lo tanto, constituye la proba-
bilidad de tomar la decisión correcta de aceptar H0 cunado esta es cierta.
Cuando H0 es falsa, la función caracteristica de operación está dada por la relación
El primer paso para un contraste de hipótesis es establecer las hipótesis: nula y alter-
nativa; esto es
H0 : θ = θ0 contra una de las tres alternativas siguientes
H1 : θ < θ0 −→ (1)
H1 : θ > θ0 −→ (2)
H1 : θ 6= θ0 −→ (3)
Si estamos ante el caso (1) o (2) decimos que el contraste es unilateral o de una cola;
por el contrario si estamos ante el caso (3) el contraste es bilateral o de dos colas.
10.3. PRUEBAS DE HIPÓTESIS PARA GRANDES MUESTRAS 222
Una regla de decisión es establecer las condiciones sobre las cuales la hipótesis nula
deberá ser rechazada o no rechazada. Si el estadístico de prueba queda dentro de la
zona crítica la hipótesis nula deberá ser rechazada. Si por el contrario, el estadístico de
prueba queda fuera de la zona crítica la hipótesis nula no deberá ser rechazada.
El problema es encontrar una regla para decidir cuándo rechazar H0 en favor de H1 con
base en los datos de la muestra X1 , X2 , . . . , Xn . Cuando H0 es cierta, esto es, cuando µ es
efectivamente µ0 , se tendrá que X ∼ N(µ0 , σ2X ) y por lo tanto
X − µ0
Z= ∼ N(0, 1)
σX
Ejemplo 10.3.1 La experiencia de varios años ha demostrado que los focos marca A tienen
una vida media de 1180 hs, con una desviación estándar de 90hs. Para probar la pretención
de los vendedores de la marca B, se probaron 100 de esos focos comprados en almacenes
ordinarios. La muestra arrojó X = 1220 hs. y S = 80 hs. Probar la hipótesis de que la media
marca B es igual a la media marca A, contra la alternativa de que tenga un valor mayor. Usar
un nivel de significancia del 5 %.
Desarrollo
H0 : µ = 1180 hs
H1 : µ > 1180 hs
El siguiente paso consiste en establecer un criterio de decisión, que en este caso será
Con un nivel de significancia de 0,05 se puede afirmar que son distintos los promedios
de la marca A y la marca B, presumiblemente mayor el de la marca B.
(X −Y ) − ((µ1 − µ2 )
Z= ∼ N(0, 1)
σX−Y
En una prueba de hipótesis donde interviene la distribución muestral de diferencias de
medias se desea contrastar las hipótesis H0 : µ1 −µ2 = 0 contra la hipótesis alternativa H1 , que
dependiendo de la naturaleza de la prueba podría ser cualquiera de las siguientes alternativas
H1 : µ1 − µ2 < 0 −→ (1)
H1 : µ1 − µ2 > 0 −→ (2)
H1 : µ1 − µ2 6= 0 −→ (3)
La hipótesis nula será cierta cuando efectivamente µ1 −µ2 = 0, esto es X −Y ∼ N(0, σ2X−Y )
y por lo tanto
(X −Y ) − 0
Z= ∼ N(0, 1)
σX−Y
Entonces, al igual que en el caso de pruebas para medias Z es una medida de distancia.
En este caso Z es la distancia natural entre X −Y y su valor esperado 0 cuando H0 es cierta.
Por lo tanto, para encontrar una regla de decisión se puede proceder de manera totalmente
análoga al caso de pruebas para medias.
Ejemplo 10.3.2 Se realizó un estudio con un nivel de significancia de 0,05 para investigar
si la prensa popular está más orientada hacia temas sexuales que la prensa dirigida a la clase
media. Se recogieron dos muestras representativas de 40 artículos publicados en ambos tipos
de revistas. Utilizando un índice que mide el contenido sexual de los artículos, la muestra 1
(popular) tuvo un puntaje medio de 3,5 con una desviación estándar de 2, mientras que la
muestra 2 (clase media) tuvo una media de 3 con una desviación de 2,2.
Desarrollo
Paso 1: Formulación de las hipóteisis nula y alternativa
2 S12 S22 22 2, 22
σX−Y = + = + = 0, 221
n1 n2 40 40
con lo cual, el estadístico de prueba será
3, 5 − 3
Zc = √ = 1, 064
0, 221
El siguiente paso consiste en establecer un criterio de decisión, que en este caso será
Como Zc = 1, 064 > 1, 645, se observa que el estadístico de prueba queda localizado
fuera de la zona crítica, entonces no podemos rechazar la hipótesis nula (H0 ), de tal
suerte que se concluye lo siguiente:
Con un nivel de significancia de 0,05 se puede afirmar que: la orientación hacia con-
tenidos sexuales es igual tanto en la prensa popular como en la prensa de clase media.
Desarrollo
Z 0,06
1,9 0,475
0, 14 − 0, 32
Zc = = −3, 86
0, 04665
Paso 4: Toma de desición y conclusión
El criterio de decisión para este caso es
Como Zc = −3, 86 6∈ (−1, 96; 1, 96), se observa que el estadístico de prueba queda
localizado dentro de la zona crítica, entonces podemos rechazar la hipótesis nula (H0 ),
de tal suerte que se concluye lo siguiente:
son variables aleatorias independientes que representan el número de individuos en las mues-
tras 1 y 2 respectivamente que poseen la propiedad que se define a P1 y P2 .
En el capítulo 9 se estimó la diferencia de proporciones de éxitos, P1 − P2 , por medio
de intervalos de confianza basándose en la distribución muestral de diferencias de propor-
ciones vista en el capítulo 8 y estableciendo ciertos niveles de confianza. En esta sección
se realizarán test de hipótesis relacionadas con P1 − P2 basándose en muestras aleatorias de
tamaños n1 y n2 provenientes de las poblaciones 1 y 2 respectivamente. Tomando en conside-
ración el Teorema Central del Límite, si n1 y n2 son lo suficientemente grande, las variables
X Y
aleatroias X, Y , pb1 = y pb2 = tienen una distribución normal aproximada. Por lo tanto
n1 n2
según la distribución muestral de diferencias de proporciones vista en el capítulo 8, pb1 − pb2
también tiene una distribución normal aproximada de la forma
P1 (1 − P1 ) P2 (1 − P2 )
donde σ2pb1 y σ2pb2 son respectivamente y si las poblaciones son infinitas,
n1 n2
P1 (1 − P1 ) N1 − n1 P2 (1 − P2 ) N2 − n2
y · y si las poblaciones son finitas. En consecuencia
n1 N1 − 1 n2 N2 − 1
( pb1 − pb2 ) − (P1 − P2 )
Z= q ∼ N(0, 1)
2 2
σ pb1 + σ pb2
La hipótesis nula será cierta cuando P1 − P2 = 0, es decir pb1 − pb2 ∼ N(0, σ2pb1 + σ2pb2 ).
Entonces
( pb1 − pb2 ) − 0
Z= q ∼ N(0, 1)
σ2pb1 + σ2pb2
razón por la cual el procedimiento para encontrar la regla de decisión en base a las eviden-
cias muestrales de tamaños n1 y n2 se procede de manera totalmente análoga a los casos
anteriores.
El procedimiento para probar hipótesis relaltivas a deferencias de proporciones pobla-
cionales comprende los mismos cuatro pasos vistos en las pruebas de hipótesis anteriores.
Ejemplo 10.3.4 Se quiere saber si hay diferencia entre la proporción de hombres y de mujeres
que fuman cuando menos una cajetilla de cigarros diaria entre la población de estudian-
tes universitarios. De una muestra de 500 hombres, 70 de ellos fuman por lo menos una
cajetilla diaria, y de una muestra de 400 mujeres, 72 fuman cuando menos una cajetilla
diaria. Pruebe en un nivel de significancia de 0,01 si hay o no diferencia entre estas dos
proporciones poblacionales.
Desarrollo
Luego, se calcula el error estándar σ pb1 − pb2 . Debido a que se desconocen los valores de
P1 y P2 se utilizan en su lugar sus respectivos estimadores y además se supone que las
poblaciones son infinitas debido a que no se tiene información acerca de sus tamaños
respectivos. Entonces
s r
pb1 (1 − pb1 ) pb2 (1 − pb2 ) 0, 14 · 0, 86 0, 18 · 0, 82
σ pb1 − pb2 = + = + = 0, 0247
n1 n2 500 400
Como Zc = −1, 62 ∈ (−2, 575; 2, 575), se observa que el estadístico de prueba queda
localizado fuera de la zona crítica, entonces no podemos rechazar la hipótesis nula
(H0 ), de tal suerte que se concluye lo siguiente:
Ejemplo 10.4.1 Supongamos que las colegiaturas de los estudiantes universitarios entre-
vistados son las siguientes:
Probar que la colegiatura que pagan los estudiantes universitarios de la República Mexi-
cana es en promedio de 3000 pesos si el nivel de significancia es de 0,05.
Desarrollo
φ \ α/2 0,025
19 t = 2, 093
Como tc = −0, 977 ∈ (−2, 093; 2, 093), se observa que el estadístico de prueba queda
localizado fuera de la zona crítica, entonces no podemos rechazar la hipótesis nula
(H0 ), de tal suerte que se concluye lo siguiente:
No hay evidencia suficiente para afirmar que la colegiatura que pagan en promedio los
estudiantes universitarios es diferente de 3000 pesos, en un nivel de significancia de
0,05.
distribución normal aún cuando se desconocen los valores de las varianzas poblacionales. Si
por lo menos una de las muestras es pequeña, menor que 30, ya no es posible la utilización de
la distribución normal. En estos casos se hacen ciertas suposiciones acerca de las poblaciones
involucradas y por lo tanto los procedimientos inferenciales a ser utilizados dependen exclu-
sivamente del cumplimiento, por lo menos de manera aproximada, de estas suposiciones que
se mencionan a continuación:
(X −Y ) − (µ1 − µ2 )
tc = s
S12 S22
+
n1 n2
pero teniendo en cuenta que tc no tiene una distribución normal sino una t de Studens
con ν grados de libertad, donde
³ S2 S22 ´2
1
+
n n2
ν = ³ 2 ´1 ³ S 2 ´2
S 1
2
2
n1 n
+ 2
n1 − 1 n2 − 1
y se redondea al entero inferior.
Ejemplo 10.4.2 El deterioro de muchas redes municipales en todo el país es una pre-
ocupación creciente. Una tecnología, propuesta para la rehabilitación de tuberías, uti-
liza un revestimiento flexible insertado en la tubería existente. En un cierto artículo
publicado se proporcionan los siguientes datos acerca de la resistencia a la tensión
(lb/pulg2 ) de especímenes de revestimiento cuando se utiliza cieto tipo de fusión, y
cuando no se usó este proceso.
Desarrollo
φ \ α/2 0,025
15 t = 2, 131
Como tc = −1, 082 ∈ (−2, 131; 2, 131), se observa que el estadístico de prue-
ba queda localizado fuera de la zona crítica, entonces no podemos rechazar la
hipótesis nula (H0 ), de tal suerte que se concluye lo siguiente:
se tiene que
(X −Y ) − (µ1 − µ2 ) (X −Y ) − (µ1 − µ2 )
Z= s = r
σ 2 σ 2 1 1
+ σ +
n1 n2 n1 n2
(X −Y ) − (µ1 − µ2 )
tc = r
1 1
Sp +
n1 n2
donde tc reemplaza a Z debido a que la teoría estadística establece que si una vari-
anza muestral reemplaza a la varianza poblacional entonces la variable estandarizada
resultante es una t de Studens. Por lo tanto, tc sigue una distribución t de Studens con
n1 + n2 − 2 grados de libertad.
Maquina I Maquina II
X 8,68 8,73
S2 0,34 0,30
Desarrollo
No hay evidencia suficiente para afirmar que las medias de los diámetros de to-
das las barras de acero manufacturadas en las dos máquinas de extrusión no son
iguales.
10.4. PRUEBAS DE HIPÓTESIS PARA PEQUEÑAS MUESTRAS 239
β(P0 ) = P(Error de tipo II|P = P0 ) = P(Aceptar H0 |H0 es falsa) = P(X < c|X ∼ Bin(n, P0 ))
El tamaño de la muestra n necesario para asegurar que una prueba de nivel α también
ha especificado β a un valor alternativo particular P0 se debe determinar por ensayo y error
usando la formula de la Binomial.
Los procediemientos de prueba utilizando las alternativas H1 : P < P0 y H1 : P 6= P0 se
construyen de manera totalmente análoga al caso anterior. En el primer caso, la región de
rechazo apropiada tiene la forma x ≤ c, una prueba de extremo inferior. El valor critico c es
el número más grande que satisface
Ejemplo 10.4.4 Suponga que en el pasado, el 40 % de los adultos favorecían la pena capi-
tal. Tenemos razón para creer que la proporción cambió, si en una encuesta realizada a 15
individuos 8 manifestaron que están a favor de la pena de muerte.
a) Utilice un nivel de significancia de 0,01 para realizar un test de hipótesis bajo esta
afirmación.
10.4. PRUEBAS DE HIPÓTESIS PARA PEQUEÑAS MUESTRAS 240
b) Si son hoy más del 40 % de la población los que apoyan la pena capital. Utilice α = 0, 05
para constrastar esta afirmación.
Desarrollo
Desarrollo del items a)
H1 : P 6= 040 “La proporción de los adultos que favorecen la pena capital actualmente
no es 0,40”
Si asumimos que
1. Si X ≤ 1 ó X ≥ 12 se rechaza H0
2. Si X ∈ (1, 12) no se puede rechazar H0
10.4. PRUEBAS DE HIPÓTESIS PARA PEQUEÑAS MUESTRAS 241
Como X = 8 < 12 podemos rechazar la hipótesis nula (H0 ), de tal suerte que se con-
cluye lo siguiente:
H1 : P > 040 “La proporción de los adultos que favorecen la pena capital actualmente
es mayor que 0,40”
P(X ≥ 10|X ∼ Bin(15, 0, 4)) = P(X = 10) + · · · + P(X = 15) = 0, 033 < 0, 05
1. Si X ≥ 10 se rechaza H0
2. Si X < 10 no se puede rechazar H0
Como X = 8 < 10 no podemos rechazar la hipótesis nula (H0 ), de tal suerte que se
concluye lo siguiente:
10.5. Problemas
Pruebas de Hipótesis para grandes muestras
Para medias
1. Una nueva empresa dedicada al cuidado del peso anuncia que todos los que se inscriban
perderán, en promedio, 4, 5 kg en las primeras dos semanas. Una muestra aleatoria
de 50 personas inscritas al programa reveló que la pérdida media de peso fue de 4
kilogramos. La desviación estándar de la muestra se calculó en 1,27 kg. En el nivel
de significancia del 5 %, ¿es posible concluir que aquellos que se unen al programa de
reducción de peso perderán más de 4,5 kg?
5. El control de calidad de una compañía que produce harina, verifica que la presentación
del producto en paquete de 1 kg contenga dicha cantidad. Se obtuvo una muestra de 50
paquetes los cuales dieron tuvieron los siguientes pesos en gramos:
10.5. PROBLEMAS 243
994 1043 1011 1053 1015 1045 1003 946 985 997
1017 987 986 966 1006 979 974 971 1023 936
994 1014 1000 934 970 997 989 998 922 987
951 960 1027 971 999 958 999 1006 952 1014
997 1019 1034 977 965 1000 995 1000 972 1015
a) ¿Hay evidencia suficiente en base a esta muestra, de que el contenido de los pa-
quetes es diferente a un kilo si el nivel de significancia es 0,01?
b) Se obtuvo otra muestra, esta de 35 paquetes, con una media de 0,971 kg y una
desviación de 0,35 kg y el mismo nivel de significancia. ¿Podemos afirmar la
hipótesis de que los paquetes contienen menos de 1 kg?
6. Estamos interesados en conocer el consumo diario medio de cigarrillos entre los alum-
nos de Centros de Bachillerato de nuestra localidad. Seleccionada una muestra aleato-
ria de 100 alumnos se observó que fumaban una media de 8 cigarrillos diarios. Si
admitimos que la varianza de dicho consumo es de 16 cigarrillos en el colectivo total,
contraste la hipótesis de que el consumo medio de cigarrillos en la comunidad es de
cigarrillos diarios con un nivel de confianza del 90 %.
Para proporciones
7. La distribuidora de cierta marca de horno de microondas afirma que 9 de cada 10
de estos hornos microondas no presenta ninguna falla. Si embargo el departamento de
calidad de una cierta empresa que adquiere dicho producto sospecha de esta afirmación
y por ende toma una muestra aleatoria de 50 de estos productos y encuentra que solo 8
presentaban algún tipo de defectos. Con un nivel de significación del 5 %, ¿Es correcta
la afirmación de la distribuidora?
11. Un fabricante de lavadoras afirma que solo el 5 % de todas las unidades que vende
sufren una falla durante el primer año de operación normal. Una organización de con-
sumidores ha pedido a 50 familias de igual número de miembros que ha adquirido estas
lavadoras, que reporten cualquier mal funcionamiento durante el primer el año. Al tér-
mino de este, solo cuatro familias reportaron mal funcionamiento. Si la organización
de consumidores cree que la proporción de lavadoras que sufrirán alguna falla es más
alta que el valor afirmado por el fabricante, emplee el nivel de significancia del 1 %
para comprobar o refutar la sospecha.
12. Un prominente médico afirma que 70 % de las personas con cáncer de pulmón son
fumadores empedernidos. Una reciente investigación mostró que 80 de 100 personas
con cancer de pulmón eran fumadores empedernidos. Con un nivel de significación del
5 %, ¿Es correcta la afirmación del médico?
Medicamento A Medicamento B
nA = 50 nB = 50
X 1 = 32, 6 X 2 = 26, 8
Con un nivel del 5 % contrasta la hipótesis de que el tiempo promedio requerido por
el cuerpo humano para absorber el medicamento A es mayor que el tiempo requerido
para absorver el medicamento B.
16. En un laboratorio, se experimenta con dos drogas que reducen el tiempo de respuesta
a cierto estímulo. Se administra a 30 ratas la droga 1 y a 35 la droga 2. La reducción
del tiempo de reacción al estímulo de cada rata fue registrada como sigue
a) Si el nivel de significancia es 0,05; ¿es posible decir que no existe diferencia entre
la reducción del tiempo de respuesta con la droga 1 que con la droga 2?
b) Si el nivel de significancia es 0,05; ¿es posible decir que es mayor la reducción
del tiempo de respuesta de las ratas del grupo 1 que la de las del grupo 2?
c) c) Si el nivel de significancia es .05, y la desviación estándar de ambas muestras
es 10 mseg, ¿es posible decir que no existe diferencia entre el tiempo de respuesta
con la droga 1 y el tiempo de respuesta con la droga 2?
17. Un antropólogo obtuvo dos muestras de 30 habitantes de dos regiones diferentes (región
1 y región 2) y registró el índice cefálico de los 60 individuos como sigue:
Región 1 Región 2
78 74 75 81 76 80 72 75 75 74 76 71
77 76 82 73 78 80 74 73 76 74 74 76
86 77 80 78 79 83 73 75 74 74 75 75
75 83 86 84 79 80 77 76 79 76 80 75
74 82 80 75 75 78 73 75 72 79 76 76
18. Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en
cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio
indican que el mecanismo de hidratación del cemento queda bloqueado y esto permite
que el agua ataque varias partes de una estructura de cemento. Al tomar 50 mues-
tras de cemento estándar, se encontró que el peso promedio de calcio es de 100 con
una desviación estándar de 8; los resultados obtenidos con 45 muestras de cemento
contaminado con plomo fueron de 97 en promedio con una desviación estándar de 6.
Supóngase que el porcentaje de peso de calcio está distribuido de manera normal. Si
el nivel de significancia es 0,05, ¿es significativa la diferencia entre las muestras para
afirmar que el peso promedio de calcio en cemento estándar es mayor que el peso
promedio de calcio en cemento contaminado con plomo.
hombre Mujer
Más de 25 horas 15 29
No más de 25 horas 27 19
23. Una muestra de 200 hombres casados se clasifica de acuerdo con la educación y el
número de hijos:
24. Para determinar si la incidencia de cierto tipo de crimen varía de una colonia a otra en
una ciudad grande se obtuvo la siguiente información sobre eventos sucedidos el año
pasado:
25. La enfermería de una universidad quiere determinar la eficacia de tres medicinas para
la tos. Se aplicó cada medicina a 50 estudiantes y se registro su efecto:
Efecto Medicina
A B C
Sin alivio 11 13 9
Cierto alivio 32 28 27
Alivio total 7 9 14
26. Para determinar la posición de los padres de familia respecto a que se haga oración en
las escuelas públicas se llevó a cabo una investigación en cuatro escuelas seleccionadas
aleatoriamente, con los siguientes resultados:
Posición Escuela
Morelos Patria Franklin Galicia
A favor 65 66 40 34
En contra 42 30 33 42
Sin opinión 93 54 27 24
28. Se lleva a cabo una investigación en dos ciudades para determinar el sentimiento de los
votantes hacia los candidatos en una elección próxima. Se seleccionaron 500 votantes
al azar en cada ciudad y se registraron los siguientes datos:
a) Si α = 0, 05; ¿se puede afirmar que la proporción de votantes del candidato azul
es mayor que la del candidato verde?
b) Si α = 0, 05; ¿se puede afirmar que la proporción de votantes indecisos de la
ciudad A es igual que la proporción de indecisos de la ciudad B? c) Si α = 0, 06;
¿se puede afirmar que la proporción de votantes del candidato verde en la ciudad
A es 40 %?
29. Se quiere saber si un preso al salir de la cárcel tiene una mejor adaptación a la vida
en libertad, si se establece en su lugar de origen o en otro lugar. Para probar estas
hipótesis se seleccionó aleatoriamente a 200 personas que estuvieron presas y hoy
viven en libertad, usando un cuestionario se clasificó su adaptación a la vida en libertad
como excelente, buena, mala, pésima. Los resultados fueron los siguientes:
30. De acuerdo con un estudio publicado en el American Journal of Public Health, las
viudas viven más que los viudos. En una encuesta hecha para probar la afirmación
anterior se obtuvieron los siguientes datos de sobrevivencia de 100 viudas y 100 viudos
después de la muerte de su cónyuge:
10.5. PROBLEMAS 250
Años vividos por las viudas Años vividos por los viudos
después de la muerte del cónyuge después de la muerte del cónyuge
1 2 4 2 2 3 2 1 3 2 4 1 3 5 3 5
5 2 0 3 2 2 3 3 3 2 4 3 0 3 2 2
3 3 0 3 1 3 2 3 2 1 2 1 3 3 2 2
1 2 1 1 4 2 9 6 3 2 4 3 2 4 2 4
6 7 6 11 6 9 8 8 3 3 3 2 5 0 2 2
9 2 8 9 2 8 7 6 11 8 7 7 9 8 6 8
8 9 8 7 5 4 7 5 7 10 10 7 9 7 7 6
8 7 5 7 6 9 9 5 6 7 6 9 5 8 7 10
10 8 7 4 9 8 15 12 12 7 10 9 9 10 7 10
13 12 12 13 10 11 14 15 8 11 5 8 8 9 7 7
10 14 14 13 10 9 12 10 14 9 11 15 17 13 11 9
11 11 8 10 13 6 12 3 16 8 11 10 11 9 10 10
5 11 12 10 5 13 16 6
a) ¿Se puede afirmar que la proporción de viudas que sobrevivió a su cónyuge por
menos de 7 años es mayor que la proporción de viudos? Utilice α = 0, 04.
b) ¿Se puede afirmar que la proporción de viudas que sobrevivió a su cónyuge por 8
o 9 años es igual a la proporción de viudos? Utilice α = 0, 03.
c) ¿Se puede afirmar que la proporción de viudas que sobrevivió a su cónyuge por
más de 12 años es igual a la proporción de viudos? Utilice α = 0, 01.
32. La experiencia con la cría de pollos New Jersey Red reveló que el peso promedio de los
pollos a los cinco meses de edad es de 4,35 libras. Los pesos tienen una distribución
normal. Con el fin de incrementar el peso de los pollos, se añadió a su alimento un
nutriente especial. Los pesos subsecuentes de una muestra de pollos de cinco meses de
edad fueron (en libras):
4,41 4,37 4,33 4,35 4,30 4,39 4,36 4,38 4,40 4,39
33. La compañía de luz del Paraguay afirma que las cuentas promedio facturadas por mes
en una zona de la ciudad de Itá es de 60000 guaranies. Una muestra tomada de 20
clientes de la zona el mes pasado reveló los siguientes datos
55000 49000 58000 54000 50000 48000 75000 48000 60000 65000
67000 68000 49000 45000 56000 66000 45000 62000 65000 64000
34. El gerente de una compañia telefónica afirma que el número promedio de llamadas
recibidas por semana es de 30. Una muestra tomada en las últimas 16 semanas reveló
los siguientes números de llamadas recibidas.
52 43 30 38 30 42 12 46 39 37 34 46 32 18 41 5
35. El dueño de un negocio de comida rápida está interesado en el número de veces que
un cliente compra en su negocio durante un periodo de dos semanas. Averigua con su
gerente, quién le afirma que en promedio el número de veces que un cliente compra en
su negocio durante un periodo de dos semanas es 6. Para comprobar tal información el
dueño del negocio le pregunta a 26 clientes en un día determinado, ¿cuántas veces han
comprado en su negocio las ultimas dos semanas?. Los resultados se dan a continuación
3 1 4 6 4 2 6 6 7 1 5 6 3
5 3 4 5 6 8 4 7 6 5 9 7 6
Para un nivel de significación de 0,04; ¿es verdadera la afirmación del gerente dada la
evidencia muestral?
36. El presidente de una agencia de viajes, quiere información sobre las edades de las
personas que toman cruceros por el Caribe. El gerente de la agencia le informa que la
edad en promedio de las personas que realizan el viaje es de 50 años. Una muestra de
28 clientes que tomaron un crucero el año pasado reveló estas edades:
77 18 63 84 38 54 50 59 54 56
36 26 50 34 44 41 58 58 53 51
62 43 52 53 63 62 62 65
Para un nivel de significación de 0,06; ¿es verdadera la afirmación del gerente dada la
evidencia muestral?
Para proporciones
10.5. PROBLEMAS 252
a) ¿Tenemos razón para creer que la proporción cambió, si en una encuesta realizada
a 20 individuos 11 manifestaron que están a favor de la pena de muerte? Utilice
un nivel de significancia de 0,03.
b) ¿Son hoy más del 40 % de la población los que apoyan la pena capital? Si α =
0, 01.
39. Un planificador urbano afirma que, a escala nacional en Estados Unidos, 20 % de las
familias que alquilan un condominio en Dallas se mudan durante un año determinado.
Una muestra aleatoria de 20 familias que rentan condominios en Dallas reveló que 5
se mudaron durante el año anterior. En el nivel de significancia de 0,02; ¿sugiere esta
evidencia muestral que una proporción mayor de propietarios de condominios en el
área de Dallas se mudó el año pasado?.
40. Tina Dennis es jefa de contabilidad de Meek industries. Cree que los problemas pre-
sentes de flujo de efectivo de la empresa se deben a la lentitud en la recuperación de las
cuentas por cobrar. Cree que más del 60 % de las cuentas tienen vencimientos mayores
a tres meses. Una muestra de 26 cuentas demostró que 18 tenían más de tres meses de
antigüedad. En el nivel de significancia de 0,08; ¿es posible concluir que más del 60 %
de las cuentas están vencidas por más de tres meses dada la evidencia muestral?
Grupo 1 Grupo 2
52 72 73 64 48 52 57 42 58 35 51 51 47 35
46 66 61 46 65 62 47 61 31 32 47 60 29 35
51 53 49 47 73 61 53 28 14 64 37 65 60 48
60 62 43 46 75 64 68 37 43 45 58 18 39 41
43. Cierta asociación de lucha contra la discriminación afirma que en los establecimien-
tos comerciales del centro de la ciudad el sueldo de las mujeres es inferior al de los
varones. Para comprobarlo se obtuvo una muestra de percepciones de mujeres y una
muestra percepciones de hombres, de las cuales se obtuvo lo siguiente:
45. La compañía X que fabrica lámparas incandescentes, asegura que su producto es su-
perior al de su principal competidor, la compañía Y . En un estudio, en una muestra
de 24 de las lámparas X y una muestra de 20 lámparas Y se obtuvieron las siguientes
duraciones en horas:
10.5. PROBLEMAS 254
Lámparas X Lámparas Y
643 636 630 645 630 624 611 655 630 639 622 688
667 626 635 652 622 629 665 696 665 573 639 585
624 662 633 645 691 690 641 673 649 597 629 648
636 656 610 645 621 630 652 641
46. Se quiere demostrar que en esta ciudad y en cierta ciudad vecina, el nivel de las rentas
de casas habitación es similar. Para demostrar esto se obtienen dos muestras aleato-
rias, una muestra obtenida en esta ciudad, y otra muestra de la ciudad vecina, que se
muestran a continuación:
Colonia 1 Colonia 2
81 77 132 101 94 94 126 138 77 80
120 87 56 103 105 106 98 160 98 70
102 116 135 104 115 109 70 119 125 58
89 138 129 117 60 109 102 154 74 93
Concentraciones de albúmina
Concentraciones de albúmina
con Esteroide A (g/100 ml)
con Esteroide B (g/100 ml)
4,1 3,7 4,1 4,0 4,3
4,0 3,9 3,8 3,7 3,7
3,7 4,4 3,8 3,5 3,4
3,5 3,6 3,6 3,5 3,8
4,0 4,3 4,5 4,0 3,5
3,5 3,8 4,0 3,4 3,9
4,3 3,4 3,3 4,3 2,9
3,5 3,5 4,0 3,4 3,9
3,8 3,8 4,1 4,4 4,1
a) Si el nivel de significancia es 0,01; ¿podemos decir que en base a estos datos que
el esteroide A disminuye el nivel de albúmina en el suero?
b) Si el nivel de significancia es 0,05, ¿podemos decir que en base a estos datos que
el esteroide A disminuye el nivel de albúmina en el suero igual que el esteroide
B?
Capítulo 11
256
11.2. PROCEDIMIENTO DEL ANÁLISIS DE LA VARIANZA 257
que un grupo de ratas consume está en relación con el tiempo transcurrido desde su última
comida. Para comprobar esta hipótesis, se selecciona al azar tres grupos de ratas con seis
ratas en cada grupo. Después de someter a cada grupo a un entrenamiento preliminar, prueba
al grupo A, tres horas después de comer; el grupo B, doce horas después de comer y al grupo
C, veinticuatro horas después de comer. La cantidad de tabletas consumidas por cada animal
en un periodo de diez minutos fueron las siguientes:
∑ x = 18 ∑ x = 30 ∑ x = 48
∑ x2 = 104 ∑ x2 = 180 ∑ x2 = 424
Capítulo 12
12.1. Introducción
En muchas investigaciones estadísticas, el principal objetivo es establecer relaciones que
permitan pronosticar una o más variables en términos de otras. Por ejemplo, se han efectuado
estudios para pronosticar las ventas futuras de un producto en términos de su precio, de la
reducción de peso de una persona en términos del número de semanas que ha seguido una
dieta de 800 calorías por día, de los gastos familiares en atención médica en términos del
ingreso familiar, del consumo per cápita de ciertos artículos alimenticios en términos de su
valor nutricional y el dinero que se gasta en su publicidad televisiva y así consecutivamente.
Es evidente que sería ideal si pudiéramos pronosticar una cantidad exactamente en térmi-
nos de otra, pero esto rara vez es posible. En la mayoria de los casos debemos conformarnos
con pronosticar promedios o valores esperados. Por ejemplo, no podemos pronosticar con
exactitud la cantidad de dinero que un graduado universitario específico ganará diez años
después de graduarse, pero considerando datos apropiados podemos pronosticar las ganan-
cias promedio de todos los graduados univeristarios diez años después de su graduación. Este
problema de pronóstico del valor promedio de una variable en términos del valor conocido de
otra variable (o de los valores conocidos de otras variables) se designa como el problema de
la regresión. Este término se remonta a Francis Galton (1822-1911), quien lo usó por primera
vez en un estudio de la relación entre las alturas de padres e hijos.
Definición 12.2.1 Modelo: Por un modelo entendemos una ecuación matemática que con-
tiene variables aleatorias, variables matemáticas (no aleatorias) y parámetros poblacionales.
258
12.2. MODELO ESTADÍSTICO 259
donde
β1 , β22 y β3 son parámetros poblacionales desconocidos
X1i , X2i y X3i son variables matemáticas
εi son variables aleatorias
Definición 12.2.2 Modelo Lineal: Es una ecuación que contiene variables aleatorias, va-
riables matemáticas (no aleatorias) y parámetros poblacionales y que el modelo es lineal en
los parámetros y en las variables aleatorias.
donde
β1 , β2 y β3 son parámetros poblacionales desconocidos
X1 , X2 y X3 son variables matemáticas
εi son variables aleatorias
Y = α + βX
Y = α + βX + ε
Definición 12.2.5 Modelo de Regresión: Son aquellas en que las variables aleatorias inde-
pendientes o predictoras son variables continuas; tales como la edad, peso, ingreso, demanda,
producción, etc; que toman infinitos valores y sirven para cuantificar en lugar de indicar la
presencia de un efecto cualitativo.
n
Por lo tanto para minimizar ∑ (yi − ŷi)2 respecto de a y b; lo derivamos parcialmente con
i=1
respecto de ellos e igualemos dichas derivadas parciales a cero y obtendremos un sistema de
dos ecuaciones con dos incógnitas denominados ecuaciones normales. Esto es
∂h n 2
i n ³ n n ´
∑
∂a i=1
(y i − ŷ i ) = −2 ∑ (y i − a − bxi ) = −2 ∑ yi − na − b ∑ =0xi
i=1 i=1 i=1
∂h n 2
i n ³ n n n
2
´
∑ i i
∂b i=1
(y − ŷ ) = −2 ∑ i (y − a − bx )x
i i = −2 ∑ i i ∑ i ∑ i =0
x y − a x − b x
i=1 i=1 i=1 i=1
con lo cual
n n
∑ yi = na + b ∑ xi (12.3.1)
i=1 i=1
n n n
∑ xiyi = a ∑ xi + b ∑ xi2 (12.3.2)
i=1 i=1 i=1
Ajusta una línea recta de mínimos cuadrados que relacione los números de años que los
solicitantes de trabajos en el servicio exterior estudiaron alemán en preparatoria o universi-
dad con las calificaciones que obtuvieron en la prueba de dominio de ese idioma.
Desarrollo
Ilustrando los puntos correspondientes a estos diez pares de valores en un diagrama, ob-
servaremos que aunque no todos los puntos caen en una misma línea recta, el patrón general
de la relación se describiría razonablemente bien por medio de una línea recta adecuada acier-
tos criterios bien definidos.
El gráfico 12.1 muestra el patrón de comportamiento de la relación entre los números de
años que los solicitantes de trabajos en el servicio exterior estudiaron alemán en preparatoria
o universidad con las calificaciones que obtuvieron en la prueba de dominio de ese idioma,
además muestra la linea que mejor se ajusta a los diez pares de datos.
12.3. MODELO DE REGRESIÓN SIMPLE 263
Figura 12.1: Gráfico de la relación entre el número de años que se estudió alemán y la califi-
cación obtenida en la prueba.
Las sumas requeridas para la sustitución en las ecuaciones normales se obtienen realizan-
do los cálculos que aparecen en la tabla siguiente:
x y x2 xy
3 57 9 171
4 78 16 312
4 72 16 288
2 58 4 116
5 89 25 445
3 63 9 189
4 73 16 292
5 84 25 420
3 75 9 225
2 48 4 96
El estudio de la correlación involucra cuestiones como: ¿hay una relación entre los prome-
dios de la preparatoria y los promedios de primero en la universidad?. ¿Hay una relación entre
los gastos en publicidad de un negocio y sus ventas?. ¿Hay una relación entre el número de
años en el trabajo y la productividad?, etc.
Ejemplo 12.4.1
12.5. PROBLEMAS 267
12.5. Problemas
1. Un proyecto de investigación fue emprendido para determinar si hay una relación entre
los años de servicio y el rating de eficiencia de los empleados. El objetivo del estudio
es predecir el rating de eficiencia de un empleado basado en los años de servicio. Los
resultados de una muestra de empleados son:
9. Una cadena de tiendas de electrónica tiene puntos de venta en varias ciudades. El ge-
rente de ventas planea lanzar al aire un comercial de televisión de cámaras de video
en estaciones locales de televisión previo a una gigantesca venta de videocámaras de
sábado y domingo. El gerente planea obtener las cifras de venta de videocámaras de
sábado y domingo en varios puntos de venta y parearlos con el número de veces que
el comercial aparece en la estación de TV local. El propósito principal de esta inves-
tigación es encontrar si hay alguna relación entre el número de veces que aparece el
comercial y las ventas de cámaras de video. Las cifras fueron las siguientes:
10. Sabin Motorcycle Works planea desarrollar un folleto para su nueva y revolucionar-
ia motocicleta X2B. Una de las facetas a ser exploradas y registradas es la cuestión
velocidad - consumo de combustible. ¿Hay una relación lineal entre la velocidad de
la motocicleta y las millas por galón de combustible? Pruebas de pista revelaron lo
siguiente:
12. Los siguientes datos representan las calificaciones de matemáticas para una muestra
aleatoria de 12 alumnos de primer grado de cierta universidad junto con sus califica-
ciones de una prueba de inteligencia que se les aplicó cuando aún eran alumnos del
último año de preparatoria:
13. Los siguientes datos se obtienen en un estudio de la relación entre el peso y el tamaño
del tórax de infantes al nacer:
A confidence interval provides a range of values within which a population parameter lies with a certain degree of confidence, such as 95% or 99%. It's essential in statistical analysis as it quantifies the uncertainty associated with a sample estimate of a population parameter . In decision making, confidence intervals help assess the reliability and precision of estimates, guiding evaluations of statistical hypotheses or forming predictions about future observations. A narrow interval suggests a more precise estimate, aiding in making more informed and substantiated decisions .
Hypothesis testing uses statistical significance to decide whether to reject a null hypothesis based on sample data. The level of significance (alpha, α) defines the threshold for rejecting the null hypothesis, usually set at 0.05 or 0.01. This threshold corresponds to the probability of observing the data assuming the null hypothesis is true, known as the p-value. If the p-value is less than or equal to α, the result is statistically significant, suggesting sufficient evidence to reject the null hypothesis in favor of the alternative . This process provides a structured method for evaluating research queries, ensuring decisions are supported by quantifiable evidence rather than mere chance .
To determine the probability of drawing specific color combinations from a set of differently colored balls without replacement, you use combinatorial probability. This involves calculating combinations that represent the different possible selections. For instance, with a set containing different colored balls, use combinations (nCr) to calculate the number of favorable ways to draw the required combination out of the total ways to draw the specified number of balls. Then, the probability is the ratio of favorable outcomes to total possible outcomes . This approach efficiently accommodates events where drawing one item affects the outcomes of subsequent draws.
When applying the Central Limit Theorem (CLT) to estimate population parameters, several considerations are essential. Firstly, the sample size should be sufficiently large (typically n ≥ 30) for the theorem to hold well. Secondly, the samples should be independent and identically distributed. The CLT posits that the distribution of the sample means approximates a normal distribution, regardless of the shape of the population distribution. This allows the use of normal distribution properties in hypothesis testing and confidence interval creation, further assuming that the sample variance accurately reflects the population variance . These considerations ensure that the CLT provides reliable and applicable results for estimating population parameters.
In financial contexts, probabilities are critical in constructing forecasts by assessing the likelihood of various outcomes. Models like Monte Carlo simulations use random sampling to predict the behavior of markets by simulating the prices of securities or interest rates over time, accounting for the probability distributions of key variables . These models incorporate probabilities to evaluate risks and expected returns, guiding investment strategies and risk management practices. By estimating the probability of losses exceeding certain thresholds, businesses can make informed decisions and set contingency strategies.
Calculating the probability of compound events with overlapping probabilities requires accounting for the overlap to avoid double-counting. This is done using the formula: P(A or B) = P(A) + P(B) - P(A and B). The term P(A and B) represents the probability of both events occurring together, which is subtracted to correct the initial sum of the individual probabilities. An example is finding the probability of drawing a heart or a queen from a deck of cards. P(Heart) is 13/52, P(Queen) is 4/52, and P(Heart and Queen) is 1/52. Thus, P(Heart or Queen) = 13/52 + 4/52 - 1/52 = 16/52.
Bayes' Theorem provides a mechanism for updating the probability of a hypothesis or event as new evidence becomes available. It involves the formula: P(H|E) = [P(E|H) * P(H)] / P(E), where P(H) is the prior probability, P(E|H) is the likelihood of the evidence given the hypothesis, and P(E) is the marginal likelihood of the evidence. This theorem allows for recalculating probabilities dynamically, improving their accuracy with accumulating data . For instance, if diagnosing a disease, initial probabilities based on patient history can be updated with test results to better assess the probability of the disease.
In probabilistic modeling, a random variable is a numerical description of the outcome of a random phenomenon, essentially mapping outcomes to numbers. The probability distribution provides a function that assigns a probability to each potential value of the random variable. For discrete variables, this function is known as the probability mass function, and for continuous variables, it's the probability density function . This relationship allows the modeling of various statistical experiments by abstracting outcomes into numbers, enabling the calculation of probabilities across different scenarios.
For mutually exclusive events, the probability that any one of several events will occur is the sum of their individual probabilities, since they cannot occur simultaneously. Mathematically, if events A and B are mutually exclusive, then P(A or B) = P(A) + P(B). For example, in a single dice roll, the probability of rolling a 1 or a 2 is calculated by summing the probabilities of each event: P(rolling a 1) = 1/6 and P(rolling a 2) = 1/6, thus P(rolling a 1 or 2) = 1/6 + 1/6 = 1/3.
To find the probability of at least one event occurring among independent events, it's often simpler to first calculate the probability of none of the events occurring and then subtract this from 1. If P(A) and P(B) are the probabilities of events A and B occurring independently, then the probability of neither A nor B occurring is (1 - P(A))(1 - P(B)). Hence, the probability of at least one occurring is 1 - (1 - P(A))(1 - P(B)). This method simplifies computation especially when each event's occurrence is independent of others.