Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA Y PROBABILIDAD
Julia Mu
noz
UNIVERSIDAD AUTONOMA
DE LA CIUDAD DE MEXICO
Indice general
1. Estadstica Descriptiva
1.1. Representacon de datos agrupados y no agrupados
1.1.1. Agrupamiento de datos . . . . . . . . . . . .
1.1.2. Graficos . . . . . . . . . . . . . . . . . . . .
1.1.3. Diagrama de tallo y hoja . . . . . . . . . . .
1.2. Medidas de tendencia central . . . . . . . . . . . .
1.2.1. Datos no agrupados . . . . . . . . . . . . . .
1.2.2. Datos agrupados . . . . . . . . . . . . . . .
1.3. Medidas de dispersion . . . . . . . . . . . . . . . .
1.3.1. Datos no agrupados . . . . . . . . . . . . . .
1.3.2. Varianza y desviacion estandar . . . . . . .
1.3.3. Datos agrupados . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
5
6
6
7
9
11
11
11
13
2. Probabilidad
2.1. Espacio muestral . . . . . . . . . .
2.2. Elementos de calculo combinatorio
2.2.1. Principio de multiplicacion .
2.2.2. Permutaciones . . . . . . . .
2.2.3. Combinaciones . . . . . . .
2.3. Eventos . . . . . . . . . . . . . . .
2.3.1. Operaciones con eventos . .
2.4. Funcion de probabilidad . . . . . .
2.5. Probabilidad Condicional . . . . . .
2.6. Teorema de Bayes . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15
15
17
17
19
20
21
21
25
28
32
3. Variables Aleatorias
3.1. Definicion y propiedades de las variables aleatorias discretas
3.2. Distribucion de probabilidad . . . . . . . . . . . . . . . . . .
3.3. Esperanza, varianza y desviacion estandar . . . . . . . . . .
3.4. Distribuciones discretas especiales . . . . . . . . . . . . . . .
3.4.1. Distribucion Uniforme . . . . . . . . . . . . . . . . .
3.4.2. Distribucion Bernoulli . . . . . . . . . . . . . . . . .
3.4.3. Distribucion Binomial . . . . . . . . . . . . . . . . .
3.4.4. Distribucion Geometrica . . . . . . . . . . . . . . . .
3.4.5. Distribucion Poisson . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
35
35
36
40
43
43
45
45
48
50
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INDICE GENERAL
3.5. Otras distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.5.1. Distribucion Binomial Negativa . . . . . . . . . . . . . . . . . . . . . . . 52
4. Variable aleatoria continua
4.1. Variables aleatorias continuas y sus propiedades
4.2. Distribuciones continuas especiales . . . . . . .
4.2.1. Distribucion Uniforme . . . . . . . . . .
4.2.2. Distribucion Exponencial . . . . . . . . .
4.2.3. Distribucion Normal . . . . . . . . . . .
4.2.4. Otras distribuciones . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5. Estimaciones
5.1. Teorema del Lmite Central . . . . . . . . . . . . . . .
5.2. Intervalos de Confianza . . . . . . . . . . . . . . . . . .
5.2.1. Intervalos de confianza para con conocida .
5.2.2. Intervalo de confianza para con desconocida
5.3. Intervalos de confianza para 2 . . . . . . . . . . . . .
6. Pruebas de hip
otesis
6.1. Pruebas de hipotesis para . . .
6.1.1. Prueba de hipotesis para
6.1.2. Prueba de hipotesis para
6.1.3. Prueba de hipotesis para
6.2. Pruebas de hipotesis para y 2
Indice de Materias
iv
. . . . . . . . . .
de dos colas . . .
cola derecha . .
de cola izquierda
. . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
57
61
61
62
64
69
.
.
.
.
.
71
71
75
75
77
78
.
.
.
.
.
81
81
82
83
83
86
88
Estadstica Descriptiva
1.1.
Representac
on de datos agrupados y no agrupados
1.1.1.
Agrupamiento de datos
Ejemplo 1.1.1
Calificaciones del curso de estadstica: 7.5, 6, 8.3, 9 y 10.
Ordenamos y obtenemos:
1
Ejemplo 1.1.2
Los datos que siguen corresponden a las observaciones hechas a las 10:00 de la manana del numero
de pasajeros en el RTP durante 50 das.
48 51
52 54
30 40
57 63 59
37 47 49
50 46 56
50 64
45 52
39 55 74
65 59 51
63 64
57 53
58 61
54 62 77
58 73 75
59 70 63
60 64
73 72
71 81 66
82 60 49
39 40 45
48 49 49
51 51 52
52 53
56 57
54 54 55
57 58 58
59 59
61 62
64 64
59 60 60
63 63 63
64 65 66
70 71
74 75
72 73 73
77 81 82
Cuando hacemos este ordenamiento obtenemos como mnimo 30 pasajeros y el maximo fue 82.
Ademas por ejemplo el 49 aparece 2 veces, al 2 le llamamos frecuencia f o frecuencia absoluta, esto
es numero de veces que aparece repetido el elemento. Obtenemos la siguiente lista de frecuencias:
2
xi
xi
xi
xi
xi
xi
30
37
39
40
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
70
71
72
73
74
75
77
81
82
Aplicamos las formulas anteriores al ejemplo 1.1.2 del RTP. Despejamos de la desigualdad y
obtenemos
3
lmite superior
frecuencia
punto medio
30
40
50
39
49
59
3
7
18
34.5
44.5
54.5
60
70
69
79
12
8
64.5
74.5
80
89
84.5
frecuencia
frecuencia relativa
frecuencia acumulada
30-39
40-49
50-59
3
7
18
6%
14 %
36 %
6%
20 %
56 %
60-69
70-79
12
8
24 %
16 %
80 %
96 %
80-89
4%
100 %
Ejercicio 1.1.1.
y la mas peque
na es 56.
a) Cuantas clases debera tener la tabla de frecuencia?
b) Cual es el intervalo de clase conveniente?
c) Cuales son los lmites y puntos medios de cada clase?
2. Los siguientes datos son los ingresos semestrales de 60 ingenieros. Los datos estan expresados en miles de pesos.
4
76 89 45 67
76 34 65 45
74 56 71 85
34
39
87
74
69
71
38 69 79 61
62 56 38 69
54 31 69 62
71
79
39
65
55
79 47 46 77
75 62 57 77
66
36
73
40
72 64 69 51
50 74 61 69
50
73
1.1.2.
Gr
aficos
Podemos decir que este grafico corresponde a la frecuencia absoluta. El grafico correspondiente a
la frecuencia relativa es el conocido como diagrama circular o diagrama pastel. Esto es cada
pedazo representa el porcentaje correspondiente a la frecuencia relativa. Lo mas conveniente es
que sean pocas clases para obtener para poder leer facilmente la informacion.
5
1.1.3.
John Tukey, un estadista notable, creo el diagrama de tallo y hoja como una alternativa al
grafico histograma pues proporciona tambien una informacion visual rapida. Cada observacion
se divide en dos partes tallo y hojas, el tallo es la informacion com
un a los datos por ejemplo las
decenas y las hojas seran las unidades. Tomando nuevamente como ejemplo 1.1.2 del n
umero
de pasajeros del autob
us obtenemos la siguiente tabla:
Tallo
Hoja
3
4
079
0567899
5
6
001122344567788999
001233344456
7
8
01233457
12
1.2.
Una medida de tendencia ubica e identifica el punto alrededor el cual se centran los datos. La
idea es describir un conjunto de datos con un solo n
umero. El ejemplo que usamos com
unmente
para representar al conjunto de calificaciones de un semestre es el promedio. Vamos a empezar
a calcular las medidas de tendencia central a partir de datos no agrupados.
6
1.2.1.
Datos no agrupados
Existen tres metodos comunes para identificar el centro de un conjunto de datos: la media, la
mediana y la moda. Su calculo e interpretacion se definen a continuacion.
Definici
on 1.4. La media, o media aritmetica, es la medida de tendencia central que usualmente se le llama promedio. Se calcula haciendo la suma de todas las observaciones y dividir
esta suma entre el n
umero de operaciones.
La notacion de la media de una poblacion es el parametro . Si hay N observaciones en el
conjunto de datos de la poblacion. La media se calcula:
X1 + X2 + X3 + + XN
=
=
N
N
X
Xi
i=1
Definici
on 1.5. La poblaci
on es la coleccion de todos los datos de interes.
Es posible que no tengamos todas las observaciones, esto es, tenemos la llamada muestra.
Definici
on 1.6. Una muestra es un subconjunto de observaciones representativo de la poblacion.
La formula de la media muestral es:
= X1 + X2 + + Xn =
X
n
n
X
Xi
i=1
Para determinar si se trata de una poblacion o de una muestra se debe leer cuidadosamente el
problema.
Definici
on 1.7. La mediana conocida como media posicional porque queda exactamente en
la mitad del conjunto de datos despues de ordenarlos.
La mitad de las observaciones estara por encima de la mediana, la otra mitad estara por debajo
de ella. Si el conjunto de datos tiene un n
umero impar de observaciones, la posicion de la
mediana se calcula con la formula:
posicion =
n+1
.
2
En el caso de que el n
umero de observaciones sea par se toma el promedio de los valores que se
n+1
.
encuentran en las posiciones justo en medio esto es el entero mayor y menor a
2
7
Ejemplo 1.2.1
Tu empresa esta introduciendo un nuevo chip de computadora que hace calculos estadsticos rapidamente. Se hacen 20 calculos diferentes que se muestran a continuacion. Determina la media, la
mediana y la moda. Comenta los beneficios de usar cada estadstico.
3.2
5.4
0.6
6.2
1.8
4.3
2.6
3.3
SOLUCION:
Al leer que se toman 20 calculos diferentes quiere decir que no tomamos todos.
Por lo tanto se trata de una muestra con n = 20. Ordenamos los valores podemos aprovechar y
escribir el diagrama de tallo y hoja obteniendo.
tallo
hoja
1
2
5789
246
3
4
5
2236
139
24
123
Calculamos
= 70.5 = 3.525.
X
20
20 + 1
Como el numero de datos es par obtenemos la posicion=
= 10.5.
2
8
1.2.2.
23.2
22.3
Datos agrupados
Cuando trabajamos con datos que han sido agrupados en c clases con una ditribucion de frecuencia, ya no conocemos los datos individuales pero si conocemos las frecuencias f y podemos
calcular de cada clase el punto medio M y el n
umero de observaciones n pues este sera igual a
c
X
fi .
la suma de las frecuencias n =
i
g =
Media con datos agrupados: X
c
X
fi Mi
i=1
Ejemplo 1.2.2
Usamos el ejemplo 1.1.2 del RTP. Usando la tabla
clase
fM
30-39
34.5
103.5
40-49
50-59
7
18
44.5
54.5
311.5
981
60-69
70-79
80-89
12
8
2
64.5
74.5
84.5
774
596
169
50
2935
9
En el caso de la moda, lo que hacemos es localizar la clase modal, que es la que tiene el mayor
n
umero de elementos. Y para estimar la moda para datos agrupados usamos la siguiente
formula:
Da
Moda = Lmo +
(IC)
Db + Da
1.3. MEDIDAS DE DISPERSION
N
umero de empleados ausentes Das en los que ese n
umero estuvo ausente
1.3.
1.3.1.
20-29
30-39
40-49
5
9
8
50-59
60-69
10
12
70-79
80-89
90-99
11
8
3
Medidas de dispersi
on
Datos no agrupados
Las medidas de tendencia central no son suficientes siempre. Una descripcion mas completa
puede obtenerse determinando que tan separados estan las observaciones de la media.
La opcion mas sencilla es calcular el rango esto es obtener el valor mas peque
no y el maximo
el rango es la resta de estos valores, podemos calcular que tan separados estan de la media.
Como podemos calcular el rango no nos proporciona mucha informacion.
1.3.2.
Varianza y desviaci
on est
andar
N
X
i=1
(Xi )2
N
Ejemplo 1.3.1
Marcos Reyes es gerente de una empresa. Recientemente Marcos estaba interesado en las tasas de
endimiento de los ultimos cinco anos 12,10,13,9 y 11 %.
Calcula, media, varianza y desviacion estandar.
SOLUCION:
Se trata de una poblacion pues solo interesan los ultimos cinco anos:
11
1.3. MEDIDAS DE DISPERSION
12 + 10 + 13 + 9 + 11
= 11 para calcular la varianza
5
(12 11)2 + (10 11)2 + (13 11)2 + (9 11)2 + (11 11)2
2 =
=2
5
y finalmente la desviacion estandar = 2 1.4142.
Cuando se trata de una muestra la media muestral se denota con x y la desviacon estandar
muestral se denota con s.
La formula para x es la misma que para como ya vimos, pero la varianza muestral cambia a
N
X
2
(Xi X)
2
2
2
i=1
i=1
n(n 1)
Ejemplo 1.3.2
El senor Reyes desea determinar la estabilidad de la desviacion estandar del precio de cierre diario de
dicha accion. Al revisar las paginas financieras Reyes sabe que la accion ha cotizado en la bolsa durante muchos meses. Reyes ocupa una muestra aleatoria de 7 das dada en dolares: 87,120,54,92,73,80
y 63.
SOLUCION:
Claramente se trata de una muestra.
87
+
120 + 54 + 92 + 73 + 80 + 63
X=
= 81.29
7
la varianza muestral es:
7
X
2
(Xi X)
s2 =
i=1
12
Proceso 1
Proceso 2
3.41 3.22
3.81 3.26
3.74 3.06
3.89 3.65
3.65 3.33
3.26 3.79
3.07 3.14
3.35 3.51
1.3. MEDIDAS DE DISPERSION
1.3.3.
Datos agrupados
Si los datos estan agrupados en una tabla de frecuencia, la varianza y la desviacion estandar
pueden calcularse como:
Varianza de datos agrupados
s2 =
2
f M 2 nX
n1
y la desviaci
on est
andar s = s2 .
Usamos nuevamente la tabla del RTP y escribimos la informacion que nos falta para calcular
la desviacion estandar.
clase
fM
M2
fM2
774
596
4160.25
5550.25
49923
44402
80-89
169
7140.25
14280.5
2
50
84.5
2935
179502.5
Ya habamos calculado:
g = f M = 2935 = 58.7
X
n
50
Ahora sustituimos las sumas correspondientes en la formula de la varianza:
179502.5 50(58.7)2
s2 =
= 147.31
50 1
y la desviacion estandar
s = 12.14.
Ejercicio 1.3.2. Usamos ahora el ejercicio 1.2.2 de ausentismo. Si el a
no pasado la desviaci
on
estandar fue de 14.7. Calcula la varianza y la desviacion estandar del a
no en curso y comparala
con la del a
no anterior.
Existen otras medidas de dispersion llamadas cuartiles y percentiles. Los cuartiles dividen el
conjunto en 4 partes, esto es el primer cuartil se trata del dato que tiene por debajo el 25 % de
las observaciones, el segundo cuartil corresponde a la mediana que es el 50 %, y el tercer cuartil
corresponde al 75 %.
Cuando hablamos de percentiles se escoge un porcentaje, digamos 85 % y lo que se hace es
encontrar el dato cuya posicion indica que el 85 % de los datos estan por debajo de dicho dato.
13
1.3. MEDIDAS DE DISPERSION
14
Probabilidad
2.1.
Espacio muestral
Definici
on 2.1. Un experimento es cualquier operacion cuyo resultado no puede predecirse con
exactitud.
Ejemplo 2.1.1
Ejemplo 2.1.2
15
Espacio muestral
Tipo
S = {aguila, sol}
discreto
discreto
Lanzar un dado
Resultado de un partido de futbol
Total de goles en un partido
Medida del grosor de un conector
de forma T hecho de plastico
Chip cumple con las especificaciones
S = {1, 2, 3, 4, 5, 6}
discreto
S = {0, 1, 2, 3, 4, 5, 6, . . . }
discreto
S = {x : x R+ } = (0, )
continuo
S = {s,no}
discreto
continuo
S = {ss,sn,ns,nn}
discreto
S = {n,sn,ssn,sssn,...}
discreto
Ejemplo 2.1.3
2.2. ELEMENTOS DE CALCULO
COMBINATORIO
Sin importar el caso se tiene que es discreto.
2. Se tienen 3 mensajes de correo electronico, tenemos que llegan puntuales (p) o tarde (t).
S = {ppp, ptt, ppt, ttt, tpp, ttp, ptp, tpt}
Ejercicio 2.1.2. Una consecionaria vende vehculos con equipo al gusto del cliente las opciones
son:
Automatico o estandar
Con aire acondicionado o sin aire acondicionado
Radio, Radio CD, Radio CD y MP3
Rojo infierno, verde metalico, azul acero y blanco mate.
Determina el espacio muestral de todos los vehculos posibles. Cuantos son?
2.2.
Elementos de c
alculo combinatorio
Muchas veces no estamos interesados precisamente en la lista del espacio muestral discreto y
finito, sino en la cantidad de elementos de este espacio muestral tiene.
2.2.1.
Principio de multiplicaci
on
Ejemplo 2.2.1
2.2. ELEMENTOS DE CALCULO
COMBINATORIO
3. Cuantas placas de automovil para el Distrito Federal pueden armarse?
Sabemos que tienen 3 letras y 3 numeros para cada una de las letras tenemos 27 maneras, para
cada uno de los numeros tenemos 10 dgitos posibles, aplicando el principio de multiplicacion
tenemos 27 27 27 10 10 10 = 19683000 placas posibles.
4. Cuantos numeros hay de la lotera nacional que no repiten dgitos? Sabemos que la lotera
nacional imprime boletos de 5 dgitos, entonces para el primer dgito tenemos 10 maneras,
para el segundo ya no tenemos 10 maneras pues no queremos que se repita el primero as que
son 9, para el tercero son 8 finalmente tenemos 10 9 8 7 6 = 30240.
Ejercicio 2.2.1.
1. Cuantos n
umeros telefonicos de 8 cifras hay que empiecen con 1?
2. Cuantas placas del distrito federal tienen vocales?
3. Cuantos n
umeros de la loteria nacional tienen solo dgitos pares que no se repiten?
Definici
on 2.3. El factorial de n denotado por n!. Es el resultado del producto de n y todos
los enteros menores a n.
n! = n(n 1)(n 2) 5 4 3 2 1
Propiedades
i. n(n 1)! = n!
ii. (n 1)! =
n!
n
iii. 0! = 1
Ejemplo 2.2.2
a) 5! = 120
88!
88 87 86 85!
=
= 88 87 86 = 658416
85!
85!
1!
=1
c) 0! =
1
b)
d) 18! = 6.402D + 15
18
2.2. ELEMENTOS DE CALCULO
COMBINATORIO
2.2.2.
Permutaciones
Definici
on 2.4. Una permutacion es un arreglo de n smbolos en un orden definido.
Ejemplo 2.2.3
a) Cuantas permutaciones de 3 letras se obtienen del conjunto A = {a, b, c}? {abc, acb, bac, bca, cab, cba}
En total son 6.
b) Cuantas permutaciones de 2 letras? {ab, ac, ba, bc, ca, cb} En total son 6.
P (n, r) denota el numero de permutaciones de n smbolos en arreglos de r posiciones. Y la formula
es:
P (n, r) =
n!
(n r)!
As en el primer caso tenemos que son tres smbolos en palabras de tres letras. Entonces
n=r=3y
3!
3!
=
= 3! = 6.
P (3, 3) =
(3 3)!
0!
En el segundo problema se trata de tres smbolos en palabras de dos letras. Entonces n = 3 y
r = 2 sustituyendo en la formula tenemos
3!
3!
P (3, 2) =
=
= 6.
(3 2)!
1!
Si se quiere hacer una permutacion con de n simbolos donde k estan repetidos la formula
correspondiente es:
P =
n!
n1 ! n2 ! nk !
donde ni es el n
umero de veces que se repite el smbolo i.
Ejemplo 2.2.4
Cuantas palabras distintas se obtienen con aabb? Notamos n = 4 y son dos simbolos los que
4!
= 6. Podemos verificar esto
se repiten n1 = 2 y n2 = 2 sustituyendon en la formula P =
2!2!
{aabb, abab, abba, baab, baba, bbaa}.
19
2.2. ELEMENTOS DE CALCULO
COMBINATORIO
2.2.3.
Combinaciones
Ahora que pasa cuando no nos interesa la posicion, esto es cuantas selecciones de dos letras puedo hacer de {a, b, c}, notemos que {a, b} es la misma eleccion que {b, a} porque aqu el orden no
importa, pues notamos que se eligieron las mismas letras. As tenemos que {{a, b}, {a, c}, {b, c}},
esto es son solo tres posibles selecciones de tres letras.
Definici
on 2.5. Una combinacion es una seleccion de r objetos de un conjunto de n elementos
sin importar el orden.
El n
umero de combinaciones se obtiene a partir de el n
umero de permutaciones entre el factorial
del n
umero de objetos de la seleccion.
P (n, r)
n!
C(n, r) =
=
=
r!
(n r)!r!
n
r
Verificamos esto con el ejemplo anterior, para el cual ya habiamos calculado que P (3, 2) = 6
como se trata de r = 2 obtenemos que
6
= 3.
C(3, 2) =
2!
Propiedades
n
i.
n
n
ii.
!
!
=1
iii.
n1
=1
iv.
nr
!
!
=n
n
r
Ejemplo 2.2.5
10
8
10!
10!
=
=
= 45
8!(10 8)!
8!2!
75
14
75!
= 5.607D + 14
14!61!
Ejemplo 2.2.6
Cuantas manos distintas de pokar hay?
SOLUCION:
Sabemos que una mano de pokar tiene 5 cartas y para una mano no importa la
posicion pues se trata de una seleccion de 5 cartas. Y como el mazo tiene 52 cartas, se trata de
20
2.3. EVENTOS
52!
=
una combinacion de 5 de 52 objetos. Sustituimos en la formula y obtenemos: C(52, 5) =
5!47!
2598960.
Cuando resolvemos problemas debemos determinar si se trata de una permutacion (importa
el orden y se trata de un arreglo), una combinacion (no importa el orden se trata de una
seleccion) o simplemente se debe utilizar el principio de la multiplicacion (importa el orden
pero hay elementos repetidos).
Ejercicio 2.2.2.
1. Cuantas palabras de 9 letras se pueden hacer de aabbbcccc?
2. Cuantas combinaciones hay del melate si se trata de escoger 6 n
umeros del 1 al 56?
3. Cuantas placas de transportistas se pueden hacer si se componen de 4 n
umeros sin repetir
y 2 letras sin repetir?
4. Cuantos n
umeros telefonicos de 8 cifras de n
umeros pares hay?
5. En una unidad habitacional se requiere formar una comisi
on de 5 para ir a la delegaci
on
y solicitar el cambio de el alumbrado p
ublico. Cuantas comisiones se puden formar si se
trata de 100 departamentos?
2.3.
Eventos
Definici
on 2.6. Un evento o suceso es un subconjunto del espacio muestral.
Ejemplo 2.3.1
a) El espacio muestral de lanzar una moneda es S = {A, S} digamos aguila o sol. Los eventos
pueden ser: E1 = {A} esto es cae aguila y otro puede ser E2 = {S} que es cae sol.
b) En el ejemplo de tirar un dado un evento puede ser caiga un numero par Ep = {2, 4, 6}.
2.3.1.
2.3. EVENTOS
Definici
on 2.7. La cardinalidad de un conjunto o evento es el n
umero de elementos de dicho
evento. La notacion es #(A).
Del ejemplo anterior tenemos
#(E1 ) = 1
#(Ep ) = 3
#(E2 ) = 1
Definici
on 2.8. La union de dos eventos es un evento que consiste de todos los reultados que
estan en E1 o en E2 .
E1 E2 = {x : x E1 o x E2 }
E1 E2 =
S
E1
E2
E1 E2 = {x : x E1 y x E2 }
E1 E2 =
S
E1
E2
2.3. EVENTOS
Definici
on 2.10. Dos eventos se llaman ajenos si
E1 E2 = .
S
E1
E2
Definici
on 2.11. El complemento de E1 es un evento que consiste de todos los resultados del
espacio muestral S que no estan en el evento E1 .
E1c = {x S : x 6 E1 }
23
2.3. EVENTOS
Ejemplo 2.3.2
Consideremos el espacio muestral donde se aceptan o se rechazan 2 artculos. S = {ss, sn, ns, nn}
son eventos de este espacio muestral
Ejercicio 2.3.1.
1. Haz el diagrama de Venn correspondiente a espacio muestral de la concesionaria considerando los siguientes eventos:
E1 = {x : x es un auto de color rojo infierno}
E2 = {x : x es un auto de color verde metalico}
E3 = {x : x es un auto de color blanco mate}
E4 = {x : x es un auto de color azul acero}
E5 = {x : x es un auto con transmision automatica}.
2. Se mide el tiempo necesario para que se realice una reacci
on qumica. Este experimento
puede ser modelado con el espacio muestral S = + . Sean los eventos E1 = {x : 1 x <
10} y E2 = x : 3 < x < 118. Calcula
24
DE PROBABILIDAD
2.4. FUNCION
a) E1 E2
c) E1c
b) E1 E2
d) E1c E2
Propiedades de cardinalidad
Sea S discreto y finito y E1 , E2 y E3 eventos del espacio muestral.
i. Como Ei S tenemos #(Ei ) #(S)
ii. Si E1 y E2 son ajenos #(E1 E2 ) = #(E1 ) + #(E2 ).
iii. #(E1 E2 ) = #(E1 ) + #(E2 ) #(E1 E2 )
iv. #(E1 E2 E3 ) = #(E1 ) + #(E2 ) + #(E3 ) #(E1 E2 ) #(E1 E3 ) #(E2 E3 ) +
#(E1 E2 E3 ).
Propiedades de conjuntos
Como hemos observado los eventos son conjuntos por lo cual nos conviene repasar algunas
propiedades las cuales puedes verificar utilizando diagramas de Venn.
i. (Ac )c = A
Propiedades conmutativas
iv. (A B) C = (A C) (B C)
v. (A B) C = (A C) (B C)
Leyes de DMorgan
ii. A B = B A
iii. A B = B A
Propiedades distributivas
2.4.
vi. (A B)c = Ac B c
vii. (A B)c = Ac B c
Funci
on de probabilidad
Definici
on 2.12. Sea S cualquier espacio muestral y E cualquier evento de este. Se llamara funci
on de probabilidad sobre el espacio muestral S a P (E) si satisface los siguientes
axiomas.
i. P (E) 0
ii. P (S) = 1
iii. Si para eventos ajenos E1 y E2 entonces P (E1 E2 ) = P (E1 ) + P (E2 ).
25
DE PROBABILIDAD
2.4. FUNCION
Si podemos contarlos notamos que estas propiedades corresponden a cardinalidad de la siguiente
forma:
P (E) =
#(E)
.
#(S)
Ejemplo 2.4.1
50 muestras de plastico son analizados. Se analizan tanto resistencia a golpes y la resistencia a
Resistencia a golpes
a rayones
Resistencia
alta
baja
alta
40
1
baja
4
5
Sea A el evento que denota a los elementos con alta resistencia a golpes y sea B el evento que
denota alta resistencia a rayones.
a) Que es Ac ? Son los elementos con baja resistencia a golpes
b) Que es B c ? Son los elementos con baja resistencia a rayaduras
c) Que es A B? son los elementos que tienen alta resistencia a golpes y rayaduras
d) Que es A B? son los elementos que tienen una alta resistencia en cualquiera de los dos
golpes o rayaduras
f) P (A). En este caso sabemos que #(S) = 50 y que #(A) = 41 entonces P (A) =
26
41
= 0.82
50
DE PROBABILIDAD
2.4. FUNCION
g) P (B) P (B) =
44
#(B)
=
= 0.88
#(S)
50
h) P (A B c ) Nos preguntan por los que tienen alta resistencia a golpes y baja resistencia a
1
rayaduras leyendo de la tabla tenemos que es solo uno P (A B c ) =
= 0.02
50
i) P (A B) Son los que tienen alta en cualquiera de los dos golpes o rayaduras P (A B) =
45
= 0.9
50
9
j) P (Ac ) P (Ac ) =
= 0.18
50
Propiedades de la probabilidad
a) 0 P (E) 1
b) P () = 0
c) Si E1 E2 entonces P (E1 ) < P (E2 )
d) P (E c ) = 1 P (E)
e) P ((E c )c ) = P (E)
Teorema 2.2. Sea S un espacio muestral que contiene a dos eventos cualquiera A y B, entonces:
P (A B) = P (A) + P (B) P (A B).
Verificamos esto usando el ejemplo anterior donde ya tenemos calculados todos los valores
40
= 0.8, ahora que tenemos todos los
excepto P (A B), #(A B) = 40 entonces P (A B) =
50
valores sustituimos en P (A B) = P (A) + P (B) P (A B) P (A B) = 0.82 + 0.88 .8 = 0.9
valor que habiamos obtenido directamente.
Ejercicio 2.4.1.
1. Cual es la probabilidad de sacarse el melate?
2. Tabla de sellos en semiconductores clasificados por contaminacion y localizacion. A denota
el evento que el sello tiene altos niveles de contaminacion, C denota el evento de que la
contaminacion se localiza en el centro.
Contaminaci
on
Localizacion
centro orilla
baja
alta
514
112
68
246
27
2.5.
Probabilidad Condicional
Un evento puede estar condicionado a otro, imaginemos que tenemos en una bolsa 4 pelotas
una de color blanco, una de color verde, una roja y una azul. En principio sabemos que la
probabilidad de sacar la azul es de 0.25 ahora si ya se saco digamos la blanca como primera
pelota, cual es la probabilidad de sacar la azul dado que ya salio la blanca?, la probabilidad
1
es , pues cambio el evento y ahora el espacio muestral solo tiene 3 pelotas.
3
Definici
on 2.13. La probabilidad condicional de un evento B dado un evento A, denotado
por P (B|A), se calcula con
P (B|A) =
P (A B)
P (A)
con P (A) 6= 0
Ejemplo 2.5.1
Consideremos nuevamente el ejemplo de las piezas de plastico. Recordamos que los eventos son A
alta resistencia a golpes y B alta resistencia a rayones.
28
Resistencia a golpes
a rayaduras
Resistencia
alta
baja
alta
baja
40
1
4
5
P (B|A) se traduce a cual es la probabilidad de dado que es una pieza de plastico tiene alta resistencia
a golpes se escoja con alta resistencia a rayones. Como A ya ocurrio vemos la tabla y estamos
trabajando con 41 piezas, de las cuales 40 tienen alta resiencia a rayones. Entonces P (B|A) =
40
= 0.97. Gracias a la definicion no es necesario que hagamos este razonamiento, simplemente
41
utilizamos la formula.
P (B|A) =
0.8
P (A B)
=
= 0.98
P (A)
0.82
P (A B)
0.8
=
= 0.91
P (B)
0.88
Regla de multiplicaci
on
i. P (A|B) P (B) = P (B|A) P (A)
ii. P (A B) = P (A|B) P (B) = P (B|A) P (A)
Ejercicio 2.5.1. A los habitantes de la Ciudad de Mexico se les hizo una encuesta con el
proposito de determinar el n
umero de lectores de La Jornada y el Universal. Los resultdos
fueron: 20 % leen el Universal, 16 % leen la Jornada, mientras que el 1 % lee ambos periodicos.
Si selecciona al azar a un lector del Universal cual es la probabilidad de que tambien lea la
Jornada?
Definici
on 2.14. Sean A y B dos eventos cualesquiera de un espacio muestral S. Se dice que
el evento A es independiente del evento B si P (A|B) = P (A).
Teorema 2.3. Si el evento A es independiente del evento B entonces se verifica una de las 3
relaciones siguientes:
1. P (A|B) = P (A)
2. P (B|A) = P (B)
3. P (A B) = P (A) P (B)
29
Ejemplo 2.5.2
El circuito ilustrado a continuacion solo opera si hay una trayectoria de dispositivos funcionales de
izquierda a derecha. La probabilidad de que cada dispositivo funcione se indica en la ilustracion.
Supon que los dispositivos fallan independientemente. Cual es la probabilidad de que el circuito
opere?
Cuando trabajamos con circuitos en serie se trata de de una interseccion pues para que funcione
deben funcionar todos, y cuando estan conectados en paralelo se trata de uniones pues para que
funcionen puede funcionar cualquiera.
Nombramos dispositivo A al de arriba y B al de abajo.
Para que funcione nos preguntamos P (A B) pues estan conectados en paralelo. P (A B) =
P (A)+P (B)P (AB) como son independientes podemos cambiar la interseccion por el producto.
P (A B) = P (A) + P (B) P (A)P (B) = 0.95 + 0.95 (0.95)(0.95) = 0.998
Ejercicio 2.5.2. Haz lo mismo en el siguiente circuito.
30
Ejemplo 2.5.3
En la fabricacion de semiconductores, suponga que la probabilidad de que un chip sujeto a niveles de
contaminacion altos durante la fabricacion ocasione la falla de un producto es 0.1; la probabilidad
de que un chip sujeto a niveles de contaminacion medios durante la fabricacion ocasione la falla de
un producto es 0.01 y la probabiliad de que un chip sujeto a niveles de contaminacion bajos durante
31
SOLUCION:
Para resolver este problema debemos identificar que nos estan preguntando, esto
es la probabilidad de que falle el producto, lo que nos da el primer evento y con la primera lectura
identificamos los demas:
F : el producto falla.
A: el producto estuvo sometido a niveles altos de contaminacion.
M: el producto estuvo sometido a niveles medios de contaminacion.
B: el producto estuvo sometido a niveles bajos de contaminacion.
Podemos ademas hacer el diagrama de Venn correspondiente:
Despues obtenemos los datos correspondientes: P (F |A) = 0.10, P (F |M) = 0.01, P (F |B) = 0.001,
2.6.
Teorema de Bayes
Teorema 2.4. Sean n eventos ajenos Ei y el evento A entonces usando la regla de probabilidad
total y la de la multiplicacion.
P (E1 |B) =
P (B|E1 )P (E1 )
P (E1 B)
=
P (B)
P (B|E1 )P (E1 ) + P (B|E2 )P (E2) + + P (B|En )P (En )
32
Ejemplo 2.6.1
Dado que un nuevo procedimiento medico ha demostrado ser efectivo para la deteccion temprana
de una enfermedad, se propone un estudio medico exhaustivo de la poblacion. La probabilidad de
que la prueba identifique correctamente a alguien que no padece la enfermedad como negativo es
0.95 y la probabilidad de que la prueba identifique correctamente a alguien con la enfermedad como
positivo es 0.99. La incidencia de la enfermedad en la poblacion general es 0.0001. Si te sometes a
la prueba y el resultado es positivo. Cual es la probabilidad de que padezcas la enfermedad?
SOLUCION:
Nuevamente empezando por la pregunta debemos tener cuidado pues se trata de
probabilidad condicional pues ya sucedio que el resultado es positivo y se pide la probabilidad de
padecer la enfermedad.
Eventos:
E: esta enfermo as E c : no esta enfermo
N: resultado negativo y N c : resultado positivo
Lo que nos piden calcular es P (E|N c ).
La informacion que nos dan es: P (N|E c ) = 0.95, P (N c |E) = 0.99 y P (E) = 0.0001. Utilizamos
el Teorema de Bayes
P (N c |E)P (E)
P (E|N c ) =
P (N c |E)P (E) + P (N c |E c )P (E c )
Como podemos ver nos faltan los datos P (E c ) y P (N c |E c ) podemos calcularlos pues son complementos de P (E) y P (N|E c ) podemos modificar la formula a
P (N c |E)P (E)
P (E|N ) =
.
P (N c |E)P (E) + (1 P (N|E c ))(1 P (E))
c
(0.99)(0.0001)
= 0.002
(0.99)(0.0001) + (1 0.95)(1 0.0001)
34
Variables Aleatorias
3.1.
Definici
on y propiedades de las variables aleatorias
discretas
Definici
on 3.1. Una variable aleatoria es una funcion que asigna un n
umero real a cada
resultado del espacio muestral de un experimento aleatorio. La variable aleatoria se denota por
la letra X.
Por ejemplo el experimento resultado de un partido de futbol
S = {ganado, perdido, empatado}
la variable aleatoria que se usa es asignar 3 puntos si gana, 1 punto si empata y 0 si pierde y
de esta forma acumula puntos cada equipo. En este caso la variable aleatoria es X = {3, 0, 1}
Al igual que con los espacios muestrales, hay dos tipos de variables aleatorias: discretas y
continuas. Una variable aleatoria discreta tiene un rango finito o infinito de n
umeros que
podemos contar, en cambio una variable aleatoria continua tiene como rango un intervalo
de los n
umeros reales.
Ejemplo 3.1.1
DE PROBABILIDAD
3.2. DISTRIBUCION
a) Espacio muestral
b) Rango de X
c) Probabilidad de cada elemento de la variable aleatoria
SOLUCION:
1. X = {0, 1, 2, 3, 4, . . . , 45} y es discreta.
2. El espacio muestral es S = {pp, pf, f p, f f }
X = {2, 1, 0}
Tenemos el evento A: oblea pasa la prueba.
P (Ac Ac ) esto es las dos fallan es interseccion y son independientes podemos calcularlo con
P (Ac ) P (Ac ) = (0.2)(0.2) = 0.04
P (A A) = P (A)P (A) = (0.8)(0.8) = 0.64
P (A Ac ) = P (Ac A) = P (Ac ) P (A) = (0.2)(0.2) = 0.16
Entonces la probabilidad de la variable aleatoria hereda la probabilidad de los resultados del
espacio muestral.
P (X = 0) = 0.04 corresponde a las dos fallan P (Ac Ac )
P (X = 1) = 0.16 + 0.16 = 0.32 corresponde tanto a P (Ac A) como a P (A Ac ).
P (X = 2) = 0.64 relacionada con P (A A)
Ademas de preguntarnos por la probabilidad de cada uno de los elementos del rango de X
tenemos que es posible P (X 1) esto es cual es la probabilidad de que la variable aleatoria
sea mayor o igual que uno. Para esto tenemos dos opciones o es 1 o es 2. Entonces P (X 1) =
P (X = 1) + P (X = 2) = 0.32 + 0.64 = 0.96.
3.2.
Distribuci
on de probabilidad
Definici
on 3.2. La distribuci
on de probabilidad de una variable aleatoria X es la descripcion de las probabilidades asociadas con los valores posibles de X.
En el ejemplo anterior graficamente la distribucion de probabilidad que se obtiene es:
36
DE PROBABILIDAD
3.2. DISTRIBUCION
Ejemplo 3.2.1
Se lanzan dos dados, la variable aleatoria X es la suma de los dados.
a) Determina el Rango de X
b) Determina la distribucion de probabilidad de la variable aleatoria X
c) Haz la grafica de distribucion correspondiente
SOLUCION:
Sabemos que la suma de los dados va de 2 a 12 por lo cual X = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.
Notemos que P (X = 1) = 0 pues no es posible que al lanzar 2 dados la suma de 1.
Para calcular P (X = 2) notamos que esto solo es posible cuando cae 1 en los dos dados, sabemos
que el espacio muestral tiene 36 posibles resultados pues para cada dado son 6 maneras, y de estas
1
la pareja (1, 1) aparece solo una vez, por lo tanto P (X = 2) =
= 0.028.
36
Hacemos una tabla para ver como se obtienen cada una de las posibles sumas y la probabilidad
correspondiente:
37
DE PROBABILIDAD
3.2. DISTRIBUCION
i
parejas
Probabilidad
(1,1)
(1,2),(2,1)
(1,3),(2,2),(3,1)
(1,4),(2,3),(3,2),(4,1)
(1,5),(2,4),(3,3),(4,2),(5,1)
(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)
(2,6),(3,5),(4,4),(5,3),(6,2)
(3,6),(4,5),(5,4)
10
(4,6),(5,5)
11
(5,6),(6,5)
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
12 (6,6)
La grafica correspondiente a esta distribucion de probabilidad es la siguiente
Definici
on 3.3. Para una variable aleatoria X con valores posibles o rango x1 , x2 , x3 , . . . , xn
la funcion masa de probabilidad se define como
f (xi ) = P (X = xi ).
38
DE PROBABILIDAD
3.2. DISTRIBUCION
Por ejemplo, usando las parejas de los resultados de tirar dos dados.
f (1) = 0
3
36
6
f (7) =
36
3
f (10) =
36
f (4) =
1
36
4
f (5) =
36
5
f (8) =
36
2
f (11) =
36
f (2) =
2
36
5
f (6) =
36
4
f (9) =
36
1
f (12) =
36
f (3) =
Definici
on 3.4. La funci
on de distribucion acumulada de una variable aleatoria X denotada
por F (x), se define como
X
F (x) = P (X x) =
f (xi ).
xi <x
en lugar de calcular todas estas sumas ahorramos trabajo usando el complemento esto es:
F (11) = P (X 11) = 1 P (X > 11) = 1 f (12) = 1
1
35
= .
36
36
Propiedades de la funci
on de distribuci
on acumulada
Para una variable aleatoria discreta X, F (x) satisface las siguientes propiedades:
i. F (x) = P (X x) =
f (xi )
xi <x
ii. 0 F (x) 1
iii. Si x y entonces F (x) F (y).
39
ESTANDAR
3.3.
Definici
on 3.5. La media, tambien conocida como valor esperado o esperanza de la variable
aleatoria discreta X denotada por o E(X) es:
= E(X) =
xf (x)
xX
Ejemplo 3.3.1
Seguimos con el ejemplo de los dados, si jugamos turista el valor esperado sera el resultado de:
12
X
1
2
3
4
5
6
5
=
xf (x) = 2
+3
+4
+5
+6
+7
+8
+
36
36
36
36
36
36
36
x=2
3
2
1
4
+ 10
+ 11
+ 12
=7
9
36
36
36
36
Definici
on 3.6. La varianza de una variable aleatoria discreta X denotada por 2 o V (X) se
define como
2 = V (X) =
xX
(x )2 f (x) =
xX
x2 f (x) 2 .
Definici
on 3.7. La desviacion estandar de la variable aleatoria discreta X es
1
= (V (X)) 2
Por u
ltimo
la varianza y la desviacion estandar del ejemplo de los dados.
calculamos
1
(4(1) + 9(2) + 16(3) + 25(4)
V (X) =
36
+36(5) + 49(6) + 64(5) + 81(4) + 100(3) + 121(2) + 144(1)) 72 = 5.83
p
ESTANDAR
SOLUCION:
En este caso tenemos que se trata de una variable aleatoria discreta pero infinita,
pues la oblea con la partcula grande de contaminacion puede aparecer en la primera muestra o en
la segunda etcetera. Por lo tanto la variable aleatoria X = {1, 2, 3, 4, 5, 6, 7, . . . }.
En este caso no podemos hacer una tabla para determinar que pasa con la probabilidad.
Empezamos con f (1) esto es cuando la partcula grande se detecta en la primera oblea. Como se
trata solo de una podemos decirlo directamente del enunciado. Esto es: f (1) = 0.01. En el caso
0.014
0.012
0.010
0.008
0.006
0.004
0.002
0.000
0
10
15
20
25
Para calcular la funcion acumulada F , seguimos el mismo procedimiento F (1) = 0.01, F (2) =
f (1) + f (2) = 0.01 + 0.99(0.01) y F (3) = f (1) + f (2) + f (3) = 0.01 + 0.01(0.99) + 0.01(0.99)2.
Notemos que 0.01 es comun a todos y por lo tanto lo podemos factorizar, y ademas podemos
41
ESTANDAR
xX
1
si p < 1.
1p
i=1
X
X
x1
E(X) =
x(0.99) (0.01) = (0.01)
x(0.99)x1.
la serie geometrica
pi =
x=1
En este momento nos preocuparemos solo por la suma notamos que tenemos que
x(0.99)x1 =
x=1
1 + 2 0.99 + 3 0.992 +
x(0.99)x1 =
x=1
+0.992 +0.993 +
+0.993 +
Notamos que la primera lnea se trata de la serie geometrica con p = 0.99 y la segunda tambien si
factorizamos 0.99, la tercera tambien si factorizamos 0.992 .
As obtenemos:
x(0.99)x1 =
x=1
=
=
Entonces:
(0.01)
X
1
1
10.99
1
1
+ 0.99 10.99
+ 0.992 10.99
+
1
(1 + 0.99 + 0.992 +
10.99
1
1
1
= (0.01)
2
10.99
10.99
x(0.99)x1 = (0.1)
0.993 + )
1
1
=
= 100.
2
(0.01)
0.01
2. Determinar la funci
on de masa de probabilidad de X.
3. Determinar la funci
on acumulada de probabilidad.
4. Valor esperado
5. Varianza.
3.4.
Ahora la idea es identificar distribuciones y obtener para cada una: funcion de masa, grafica,
valor esperado, varianza y desviacion estandar.
3.4.1.
Distribuci
on Uniforme
Cuando tenemos que todos los elementos de una variable aleatoria discreta X tienen la misma
probabilidad, se trata de la distribucion uniforme. Sea X = {x1 , x2 , . . . , xn } la cual tiene n
elementos.
1
f (x) = p =
n
n
X
xi
E(X) =
i=1
n
n
X
V (X) = i=1
p
= V (X)
Esto es el promedio.
!2
n
X
2
xi
xi
i=1
n2
1.0
0.8
0.6
0.4
0.2
0.0
0
10
Ejemplo 3.4.1
Sea la variable aleatoria discreta X = {0.1, 0.5, 0.7, 0.8, 0.9, 1.1}. Si todos sus elementos tienen la
misma probabilidad. Determina funcion de masa, la media y la desviacion estandar.
1
SOLUCION:
Como tiene 6 elementos la funcion de masa es f (x) = .
6
Hacemos la tabla y obtenemos
xi
x2i
0.1 0.01
0.5 0.25
0.7 0.49
0.8 0.64
0.9 0.81
1.1 1.21
suma 4.1 3.41
44
n
X
xi
4.1
= 0.683
6
vn
!2
u n
n
u X
X
un
x2i
xi
u
t i=1
i=1
i=1
6(3.41) (4.1)2
= 0.3184
36
Ejercicio 3.4.1. Sea que la variable aleatoria discreta X tiene una distribucion uniforme y se
compone de los enteros 0 x 15. Determina funcion de masa, media y varianza.
3.4.2.
Distribuci
on Bernoulli
3.4.3.
Distribuci
on Binomial
Ahora en lugar de ser solo un intento son varios digamos n, entonces cuantos artculos pasaran
la inspeccion?, cuantas veces caera sol si tiro la moneda 3 veces?
En este caso tenemos que la variable aleatoria es X = {0, 1, 2, 3, 4, 5, . . . n} para el primer caso
que no nos dicen cuantos artculos son.
En el caso de las monedas pueden caer cero soles hasta 3: X = {0, 1, 2, 3}.
Para obtener la funcion de masa de esta distribucion hagamos el ejemplo de los volados, pero
en lugar de usar una moneda honesta, usamos una cargada, la probabilidad de sacar Sol es
p = 0.6. En la siguiente tabla dejamos expresada la probabilidad para
45
Elementos
AAA
SAA, ASA, AAS
x=2
x=3
probabilidad
(1 0.6)3
3(0.6)(1 0.6)2
3(0.6)2 (1 0.6)
(0.6)3
donde
n
x
n
x
(p)x (1 p)nx
n!
son los llamados coeficientes binomiales.
x!(n x)!
Definici
on 3.8. Un experimento aleatorio que consta de n ensayos repetidos tales que los
ensayos son independientes, la probabilidad p del resultado de interes en cada ensayo permanece
constante. Se llama experimento binomial. Con:
Variable aleatoria
Func
on de masa
X = {0, 1, 2, 3, 4, 5, . . . , n}
!
n
f (x) =
(p)x (1 p)nx
x
Valor esperado
E(X) = np
Varianza
V (X) = np(1 p)
0.5
0.4
0.3
0.2
0.1
0.0
0
10
-0.1
Ejemplo 3.4.2
La probabilidad de que un bit transmitido a traves de un canal de transmision digital se reciba con
error es 0.1. Supon ademas que los ensayos de transmision son independientes. Sea X el numero de
bits con error de cuatro bits transmitidos. Determina:
a) Variable aleatoria
b) funcion de masa
c) La probabilidad de que se reciban 2 bits con error, es decir, P (X = 2).
d) La probabilidad de que haya 3 errores o mas, es decir, P (X 3)
e) Valor esperado, Varianza, desviacion estandar.
SOLUCION:
a) La variable aleatoria es X = {0, 1, 2, 3, 4}. Y como nos interesa con error
p = 0.1 y n = 4.
47
b) f (x) =
4
x
(0.1)x (1 0.1)4x =
c) f (2) = P (X = 2) =
4
2
d) P (X 3) = f (3) + f (4) =
4
x
(0.1)x (0.9)4x
(0.1)2 (0.9)42 =
4
3
4!
(0.1)2 (0.9)2 = 0.0486
2!2!
4
4
(0.1)3 (0.9)43 +
(0.1)4 (0.9)44 =
4!
(0.1)3 (0.9)1 +
3!1!
4!
(0.1)4 (0.9)0 = 4(0.1)3(0.9) + (0.1)4 = 0.0037
4!0!
e) E(X) = np = 4(0.1) = 0.4
f) V (X) = np(1 p) = 4(0.1)(1 0.1) = 0.36 y =
0.36 = 0.6.
Ejercicio 3.4.2. Cada muestra de aire tiene 10 % de probabilidad de contener una molecula
rara particular. Supon que las muestras son independientes con respecto a la presencia de la
molecula rara. Determina:
a) La probabilidad de que de 18 muestras, exactamente 2 contengan la molecula rara.
b) La probabilidad de que de 18 muestras, mas de 10 contengan la molecula rara.
c) Valor esperado, Varianza y desviacion estandar.
3.4.4.
Distribuci
on Geom
etrica
X = {1, 2, 3, 4, 5, . . . }
Func
on de masa
Valor esperado
Varianza
48
1
p
1p
2 =
p2
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0
10
-0.1
Ejemplo 3.4.3
La probabilidad de que un bit transmitido a traves de un canal de transmision digital se reciba con
error es 0.1. Suponga ademas que los ensayos de transmision son independientes. Sea X el numero
de bits necesarios hasta que ocurra el primer error. Determina:
a) Rango de la variable aleatoria.
b) La probabilidad de que se requieran transmitir 5 bits para obtener un bit con error.
c) Numero de bits que se espera que se deben transmitir para encontrar el primer error.
d) Varianza.
SOLUCION:
a) X = {1, 2, 3, 4, . . . }
b) Notamos que p = 0.1 sustituimos en la formula P (X = 5) = f (5) = 0.1(1 0.1)51 =
0.1(0.9)4 = 0.066
49
1
= 10
0.1
1p
1 0.1
=
= 90
p2
(0.1)2
Ejercicio 3.4.3. Cada muestra de aire tiene 10 % de probabilidad de contener una molecula
rara particular. Supon que las muestras son independientes con respecto a la presencia de la
molecula rara. Determina:
a) La probabilidad de que se necesiten analizar exactamente 5 muestras de aire para encontrar
la partcula rara.
b) La probabilidad de que se necesiten analizar menos de 4 muestras de aire.
c) La probabilidad de que se necesiten analizar al menos 2 pero no mas de 5.
d) La probabilidad de que se necesiten analizar mas de 3.
e) Valor esperado
f ) Varianza
3.4.5.
Distribuci
on Poisson
Esta distribucion tiene que ver con conteo sobre un intervalo de los n
umeros reales, esto es por
ejemplo: se tiene que pasan en promedio 5 coches por minuto frente a la UACM. En este caso
el conteo fue 5 y el intervalo de los n
umeros reales es el minuto. Cual es la probabilidad de
que pasen 7 en 2 minutos? la descripcion de este caso lo hace la distribucion de Poisson pues
ahora en lugar de ser 1 minuto son 2 entonces lo que se esperara seran 10 coches.
La distribucion de Poisson lo primero que podemos describir es el valor esperado o media que
sera precisamente el promedio de conteos en dicho intervalo, para un minuto el valor esperado
es 5, para 2 minutos es 10, para 3 minutos es 15 etcetera, este valor esperado sera denotado
por . Ahora veamos la definicion formal de la distribucion de Poisson.
Definici
on 3.10. Un experimento aleatorio que consta de conteos del resultado deseado en un
intervalo, donde los conteos en subintervalos son independientes. Con promedio en un intervalo
dado tiene una distribuci
on llamada de Poisson:
50
Variable aleatoria
X = {0, 1, 2, 3, 4, 5, . . . }
Func
on de masa
f (x) =
Valor esperado
E(X) =
Varianza
V (X) =
e x
x!
Ejemplo 3.4.4
Se presentan imperfecciones aleatoriamente a lo largo de un alambre delgado de cobre. Sea que
X denote el numero de imperfecciones y sigue una distribucion de Poisson con una media de 2.3
imperfecciones por milmetro.
a) Determina la probabilidad de exactamente 2 imperfecciones en 1 milmetro de alambre.
b) Determina la probabilidad de exactamente 3 imperfecciones en 2 milmetros de alambre.
c) Determina la probabilidad de al menos una imperfeccion en 2 milmetros de alambre.
d) Determina la probabilidad de a lo mas 3 imperfecciones en 1 milmetro de alambre.
e) Valor esperado
f) Varianza
51
SOLUCION:
a) Como vamos a trabajar solo sobre un milmetro entonces = 2.3 y utilizamos
e2.3 2.32
la funcion de masa f (2) =
= 0.265
2!
b) Ahora trabajamos con 2 milmetros entonces duplicamos y obtenemos = 4.6 f (3) =
0.163
e4.6 4.63
=
3!
c) En este caso el calculo no es exacto usamos la desigualdad P (X 1). Como X tiene un numero
infinito de elementos utilizamos la propiedad de complemento:
P (X 1) = 1 P (X < 1) = 1 f (0)
e4.6 4.60
=1
0!
= 0.999
d) Nuevamente se trata de trabajar solo en un milmetro entonces = 2.3. Y nos preguntan
P (X 3) = f (0) + f (1) + f (2) + f (3)
e2.3 2.30 e2.3 2.31 e2.3 2.32 e2.3 2.33
=
+
+
+
0!
1!
2!
3!
= 0.799
e) = 2.3
f) 2 = 2.3
Ejercicio 3.4.4. La contaminacion constituye un problema en la fabricacion de discos de almacenamiento optico. El n
umero de partculas de contaminacion que ocurre en un disco optico
tiene una distribuci
on de Poisson y el n
umero promedio de partculas por centmetro cuadrado
de superficie del disco es 0.1.
a) Encuentra la probabilidad de que ocurran 12 partculas en 100 cm cuadrados del disco.
b) Encuentra la probabilidad de que ocurran cero partculas en 50 cm cuadrados del disco.
c) Determina la probabilidad de que 3 o menos partculas ocurran en 100 cm cuadrados.
3.5.
3.5.1.
Esta distribucion corresponde a la pregunta cuantos ensayos se necesitan para obtener r resultados deseados?
52
X = {r, r + 1, r + 2, r + 3, r + 4, r + 5, . . . }
!
x1
f (x) =
pr (1 p)xr
r1
r
=
p
r(1 p)
2 =
p2
Ejemplo 3.5.1
Una empresa de reclutamiento encuentra que el 30 % de los aspirantes para determinado puesto
en la industria tienen conocimientos avanzados de programacion de computadoras. Supongase que
se tienen tres puestos en los que se necesitan conocimientos avanzados de programacion. Si se
seleccionan los solicitantes uno a uno en forma independiente y al azar, calcular:
a) La variable aleatoria X
b) La probabilidad de que se encuentre al tercer aspirante calificado en la quinta entrevista.
c) La probabilidad de que se necesiten a lo mas 6 entrevistas.
d) Cuantas entrevistas se esperan hacer?
SOLUCION:
a) Son r = 3 plazas entonces X = {3, 4, 5, . . . }
b) Notamos que p = 0.3 es la probabilidad de que tengan conocimientos avanzados de programacion.
P (X = 5) = f (5) =
51
31
4
2
0.33 (1 0.3)53 =
c)
P (X 6) = f (3) +
!
! f (4) + f (5) + f (6)
=
2
2
!
0.33 (0.7)0 +
0.33 (0.7)2 +
2
= 0.256
5
2
3
2
!
0.33 (0.7)1 +
0.33 (0.7)3
53
d) =
Ejercicio 3.5.1. Supon que la probabilidad de que Shaquille ONeal anote una canasta es 0.6.
Supon que los tiros son eventos independientes, y sea que la variable aleatoria X denote el
n
umero de tiros hasta que anota 4 canastas. Calcula:
a) La probabilidad de que necesite exactamente 10 tiros.
b) La probabilidad de que necesite mas de 5 tiros.
c) El n
umero de tiros que se espera hasta obtener las 4 canastas.
Cada uno de los ensayos, cuestan tiempo o dinero. Podemos calcular ademas tiempos y costos
las funciones correspondientes. Las cuales podemos incorporar a las distribuciones pues estan
en funcion del n
umero de ensayos, para hacer estos calculos usamos el siguiente teorema.
Teorema 3.1. Para cualquier variable aleatoria X y constantes a y b cualesquiera tenemos
que:
E(aX + b) = aE(X) + b y V (aX + b) = a2 V (X)
Ejemplo 3.5.2
Un gran lote de bombas usadas contiene un 20 % de ellas que no sirven y necesitan reparacion. Se
manda a un mecanico con tres juegos de refacciones. Selecciona bombas al azar y las prueba una
tras otra. Si trabaja una bomba, prosigue con la siguiente. Si no trabaja, le instala uno de sus juegos
de refacciones. Supongase que tarda 10 minutos en probar si una bomba trabaja o no, y 30 minutos
en probar y reparar una bomba que no trabaja. Calcular el valor esperado y la varianza del tiempo
total que le llevara terminar con sus tres juegos.
SOLUCION:
Como va a seguir intentando hasta que se acaben sus 3 juegos de refacciones, se
trata de una distribucion binomial negativa con p = 0.2, r = 3 y X = {3, 4, 5, 6, . . . }. Pero si
encuentra una que no sirve le tomara otro rato repararla.
Si le toma x intentos en encontrar las tres bombas descompuestas. x 3 ocuparan solo su tiempo
de revision y 3 el tiempo de reparacion.
Esto es la funcion tiempo es: t(x) = 10(x 3) + 30(3) = 10x 30 + 90 = 10x + 60. Usamos el
teorema y metemos esta funcion en el valor esperado esto es:
3
E(t(x)) = E(10x + 60) = 10(E(x)) + 60 = 10
0.2
54
+ 60 = 210
(3)(0.8)
= 6000
0.22
Se espera que le tome 210 minutos y la varianza es de 6000 minutos cuadrados.
V (10x + 60) = 102 V (x) = 102
Ejercicio 3.5.2. Se examina a los empleados de un negocio de fabricacion de aislantes para ver
si hay asbesto en sus pulmones. Se pide a la empresa que mande a tres empleados cuyos resultados fueron positivos a un centro medico para mayores examenes. Si el 40 % de los empleados
tuvieron resultados positivos en la detencion asbesto en sus pulmones:
a) Calcular la probabilidad de que se deba analizar a diez empleados para encontrar a tres con
asbesto en sus pulmones.
b) Si cada analisis cuesta $200, calcular el valor esperado y la varianza del costo total de llevar
a cabo las pruebas para encontrar tres empleados con resultados positivos.
Otra distribucion discreta es la llamada hipergeometrica la cual ya no usa ensayos tipo Bernoulli
independientes. Si te interesa puedes consultar en la bibliografa.
55
56
4
Variable aleatoria continua
4.1.
Definici
on 4.1. Se dice que una variable aleatoria X es continua si puede tomar un n
umero
infinito de valores posibles asociados con intervalos de n
umeros reales.
Definici
on 4.2. La funci
on f (x) es llamada funcion de densidad de probabilidad y cumple:
ii.
f (x)dx = 1
iii. P (a X b) =
f (x)dx1
a
Consideremos la funcion f (x) = 0.3x2 + 0.1 cumple con las especificacines para ser una funcion
de masa en el intervalo [0, 2] y el area bajo la curva, es decir, la integral es igual con 1. Como
podemos apreciar en la siguiente figura:
57
Definici
on 4.3. La funci
on de distribucion de una variable aleatoria X se define como:
F (b) =
f (x)dx = P (X b)
Definici
on 4.4. Suponga que X es una variable alatoria continua con funcion de densidad de
probabilidad f (x) entonces:
La media o el valor esperado de X es:
= E(X) =
xf (x)dx
La varianza:
2
= V (X) =
x2 f (x)dx 2
Ejemplo 4.1.1
La funcion de densidad de la variable aleatoria X de la vida util de una batera dado en cientos de
horas: (
1 x2
e
Si x > 0
2
f (x) =
0
Si x 0
a) Determina si se trata de una funcion de densidad de probabilidad.
58
SOLUCION:
a) Primero tenemos que calcular la integral y verificar que da 1. En este caso
tenemos una integral impropia:
Z b
Z
b
b
x
1 x
1 x
e 2 dx = lm
e 2 dx = lm e 2 |b0 = lm e 2 + e0 = 1 lm e 2 = 1
b
b 0 2
b
b
2
0
Z x
x
x
x
1 x
b) F (x) = P (X x) =
e 2 dx = e 2 |x0 = e 2 + e0 = 1 e 2
0 2
2
c) 200 horas corresponde a 2 cientos de horas por lo tanto P (X < 2) = F (2) = 1 e 2 = 0.63
4
1 x
e 2
x
2
Z b
b
b
x2
x2
x
b
x2
2
dx = lm xe +
= lm xe 2e |0 = lm be 2 2e 2 (0
e
b
g) Al igual que el ejercicio anterior se usa integracion por partes y se obtiene V (X) =
2 = 4
x2 e 2 dx
Ejercicio 4.1.1. Sea que la variable aleatoria continua X denote el diametro de un agujero
taladrado en un componente metalico. El diametro especificado es 12.5 mm la mayora de las
perturbaciones aleatorias del proceso resultan en diametros mayores. Datos historicos indican
que la distribuci
on de X puede modelarse con la funcion de densidad de probabilidad f (x) =
20(x12.5)
20e
para x 12.5.
1. Verifica que se trata de una funcion de densidad.
59
d
dx
(F (x))
Ejemplo 4.1.2
El tiempo para que una reaccion qumica se complete (en milisegundos), se aproxima con la funcion
de distribuci
( on acumulada siguiente:
0
si x < 0
F (x) =
0.01x
1e
si x 0
a) Cual es la funcion de densidad?
b) Que proporcion de las reacciones se completa en menos de 200 milisegundos?
c) Que proporcion entre 100 y 300 milisegundos?
d) Cual es el tiempo esperado de la reaccion qumica?
SOLUCION:
a) La funcion de densidad f la obtenemos derivando la funcion de distribucion
acumulada F .
(
(
d0
si
x
<
0
0
si x < 0
dF (x)
dx
=
f (x) =
=
0.01x
d1e
dx
si x 0
0.01e0.01x si x 0
dx
b) P (X < 200) =
200
60
4.2.
4.2.1.
Definici
on 4.5. Una variable aleatoria continua X con funcion de densidad de probabilidad
1
si a x b tiene una distribucion uniforme.
f (x) =
ba
Z
1
1
1
dx =
x |ba =
(b a) = 1
ba
ba
ba
E(X) =
b+a
2
(b a)2
V (X) =
12
Ejemplo 4.2.1
Sea que la variable aleatoria continua X denote la corriente medida en un alambre delgado de cobre
en miliamperes. Supon que el rango de X es [0, 10 mA] y que tiene distribucion uniforme.
a) Determina: funcion de densidad, funcion acumulada, valor esperado, varianza y desviacion estandar.
b) Cual es la probabilidad de que una medicion de la corriente este entre 5 y 10?
SOLUCION:
a = 0 y b = 10
1
1
f (x) =
=
10
10
Z x 0
1
x x x
F (x) =
dx =
| =
10 0 10
0 10
10 + 0
E(X) =
=5
2
(10 0)2
= 8.33
V (X) =
12
= 2.887
10
5
Para el inciso b P (5 < X < 10) = F (10) F (5) =
= 0.5
10 10
Ejercicio 4.2.1. Supon que X tiene una distribucion continua uniforme en el intervalo [1.5, 5.5].
a) Determina: funci
on de densidad, funcion acumulada, valor esperado, varianza y desviaci
on
estandar.
b) P (X < 2.5)
61
4.2.2.
Distribuci
on Exponencial
El equivalente discreto a esta distribucion es la distribucion geometrica, ya que la distribucion exponencial es la distribucion de probabilidad del tiempo transcurrido hasta la primera
ocurrencia de un suceso de Poisson.
Definici
on 4.6. La variable aleatoria X que es igual a la distancia entre conteos sucesivos de
un proceso de Poisson tiene una distribucion exponencial con parametro > 0.
La funcioZn de densidad de probabilidad de X es f (x) = ex para x 0
1
E(X) =
x ex dx =
0
1
V (X) = 2
Por otro lado si se trata de la exponencial con media E(X) = entonces estoy partiendo de la
1
media la cual por la definicion tenemos que E(X) = = haciendo el despeje tenemos que
1
= y sustituyo adecuadamente en la integral.
Ejemplo 4.2.2
En una red de computadoras de una gran corporacion, el acceso de usuarios al sistema puede
modelarse como un proceso de Poisson con una media de 25 accesos por hora. Sea X denote el
tiempo en horas desde el principio del intervalo hasta el primer acceso.
a) Cual es la probabilidad de que no haya accesos en un intervalo de 6 minutos?
b) Cual es la probabilidad de tener el siguiente acceso este entre 2 y 3 minutos.
c) Determina el intervalo de tiempo tal que la probabilidad que no haya accesos en el intervalo sea
0.9.
d) Determina, el tiempo promedio hasta el siguiente acceso
e) La desviacion estandar
SOLUCION:
Notamos que = 25 por hora y pero notamos que las preguntas estan en minutos
25
5
entonces hacemos el cambio =
=
60
12
62
a) P (X > 6) = 1 P (X 6) = 1
0.082
5
30
5 5x
12
x 6
30
12
12
e
dx = 1 e
|0 = 1 e
+ 1 = e 12 =
12
5
15
10
5 5x
e 12 dx = e 12 x |32 = e 12 + e 12 = 0.148
2 12
Z t
5
5
5 5x
e 12 dx = e 12 x |t0 = 1 e 12 t y ahora
c) P (X > t) = 0.9 esto es P (X t) = 0.1 0.1 =
0 12
despejamos t
5
1 e 12 t = 0.1
5
e 12 t = 0.9
5
t = ln 0.9
12
12
ln 0.9
t=
5
t = 0.253 minutos
b) P (2 < X < 3) =
d) E(x) = =
e) =
1
12
= 2.5
=
5
5
12
1
= 2.5
Ejercicio 4.2.2. Sea que X denote el tiempo entre la deteccion de una partcula rara en un
contador Geiger y suponga que sigue un proceso de Poisson con media de 75 por minuto.
a) Cual es la probabilidad de que se detecte una partcula en un lapso de 30 segundos despues
de activar el contador?
b) Determina la probabilidad de que detecte una partcula entre los 15 y los 45 segundos.
c) Determina x tal que P (X < x) = 0.9
d) media y desviaci
on estandar.
Ejemplo 4.2.3
Una refinadora de azucar recibe azucar morena a granel. La cantidad de azucar que puede procesar
la refinadora en un da se puede representar mediante una funcion exponencial con una media de 4
(mediciones en toneladas) por da.
a) Calcular la probabilidad de que se procesen mas de 2 toneladas en un da determinado.
63
SOLUCION:
En este caso nos dicen que = 4 entonces =
a) P (X > 2) = 1 P (X 2) = 1
b) P (1 < X < 3) =
c) P (X < 3) =
3
0
3
1
2
0
1
4
h
i2
2
1
1 1x
e 4 dx = 1 e 4 x = 1 + e 4 1 = 0.607
4
0
3
x 3
1
1 x
e 4 dx = e 4 1 = e 4 + e 4 = 0.306
4
x 3
3
1 x
e 4 dx = e 4 0 = e 4 + 1 = 0.528
4
Ejercicio 4.2.3. En una zona de Estados Unidos se pueden modelar las magnitudes de los
terremotos mediante una distribucion exponencial cuyo promedio es 2.4 en la escala de Richter.
Calcular la probabilidad de que el siguiente temblor que se presente en esa zona sea:
a) mayor que 3.0 grados de la escala de Richter
b) entre 2.0 y 3.0 grados en la escala de Richter.
4.2.3.
Distribuci
on Normal
Muchas encuestas o estadsticas tienen una distribucion normal, esto es en el centro se acumulan
la mayora de los datos, esta distribucion de datos tambien es conocida como la campana de
Gauss, un ejemplo de esto son las calificaciones, la gran mayora de los estudiantes de secundaria
sacan entre 7,8,9, pocos sacan 6 y pocos sacan 10.
Definici
on 4.7. Una variable aleatoria X con funcion de densidad de probabilidad
(x)2
1
e 22 para < x < )
f (x) =
2
E(X) = y V (X) = 2 tiene una distribucion normal con parametros y donde < <
y > 0.
Esta variable aleatoria tambien es denotada con X = N(, )
Ejemplo 4.2.4
Si la corriente en una tira de alambre sigue una distribucion normal, con una media de 10 mA y
una varianza de 4 mA2 esto es = 2.
(x10)2
1
e 222 la grafica correspondiente es:
La funcion de masa es f (x) =
22
64
0.20
0.18
0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.00
-5
10
15
20
Definici
on 4.8. A una variable aleatoria normal con = 0 y 2 = 1 esto es = 1 se le llama
variable aleatoria normal estandar se denota como Z = N(0, 1).
La grafica correspondiente es:
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
-4
-3
-2
-1
Como veremos no es necesario que calculemos la integral para esta funcion, pues toda la informacion se da en la tabla que se anexa. Para usarla entendemos que se tratan de los valores de
65
1
1 2
e 2 u du
2
Observamos que la tabla tiene como columnas z y valores que van desde 0.09 hasta 0.00 del
lado negativo, del lado positivo tiene z y los valores desde 0.00 hasta 0.9.
Como renglones en la primer columna tenemos desde 3.9 hasta 0.0 del lado negativo y desde
0.0 hasta 3.9 del lado positivo. Lo demas son los valores que buscamos.
Ejemplo 4.2
P (Z < 1.32) Para encontrar el valor correspondiente buscamos 1.3 del lado positivo en el renglon,
despues nos movemos hasta la columna 0.02 esto es 1.32 = 1.3 + 0.02 y justo en la interseccion
del renglon 1.3 y la columna 0.02 encontramos el valor de la distribucion acumulada de la normal:
P (Z < 1.32) = 0.906582)
La grafica correspondiente es:
b) P (Z 1.53) = 0.936992
c) P (Z > 0.86) = 1 P (Z 0.86) = 0.194894
d) P (1.25 < Z < 0.37) = P (Z < 0.37) P (Z < 1.25) = 0.644309 0.105650 = 0.538659
e) P (Z 4.6) = 0 esto es practicamente cero
De estos ejemplos podemos desprender las siguientes propiedades:
66
Ejemplo 4.2
Ahora queremos determinar z tal que P (Z < z) = 0.78 para esto buscamos en la tabla el valor
mas cercano a 0.78 esto es z = 0.77
b) P (z Z z) = 0.99 usando las propiedades tenemos que 1 2P (Z < z) = 0.99
1 0.99
= 0.005 esto es z = 2.58 por lo que
despejando tenemos que P (Z < z) =
2
concluimos que z = 2.58
Ejercicio 4.2.4. Usa la tabla para determinar las siguientes probabilidades
a) P (Z < 1.32)
b) P (Z < 3)
c) P (Z < 4.5)
d) P (Z 1.45)
e) P (Z < 6.1)
f ) P (Z > 2.15)
g) P (Z > 5)
h) P (2.34 < Z < 1.76)
i) P (Z 1.53)
j) P (Z 1.26)
Determinar z tal que
k) P (Z < z) = 0.9
l) P (z < Z < z) = 0.5
m) P (Z z) = 0.2
n) P (1.24 Z z) = 0.8
n
) P (z Z z) = 0.68
67
X
V (X)
2
= 0 y V (Z) = V (
)=
=
=1
2
2
Ejemplo 4.2.7
Suponga que las mediciones de corriente de una tira de alambre siguen una distribucion normal con
una media de 10mA y una varianza de 4(mA)2
a) Cual es la probabilidad de que una medicion exceda 13 mA?
b) Cual es la probabilidad de que una medicion de corriente este entre 9 y 11mA?
c) Que medicion exceden el 90 % de los casos?
13 10
X 10
2
2
=
SOLUCION:
a) P (X > 13) = 1 P (X 13) estandarizamos 1 P
3
1P Z
= 1 0.933193 = 0.066807
2
9 10
X 10
11 10
P (9 < X < 11) = P
<
<
2
2
2
1
1
<Z<
=P
b)
2
2
= P (Z < 0.5) P (Z < 0.5) = 0.691462 0.308538
= 0.382924
x 10
x 10
X 10
= 0.9 P Z >
=
>
c) P (X > x) = 0.9 primero estandarizamos, P
2
2
2
x 10
x 10
1P Z
entonces P Z
= 0.1 buscando en la tabla obtenemos que
2
2
x 10
= 1.28 despejando tenemos que x = 2(1.28) + 10 = 7.44 por lo tanto el 90 % de las
2
mediciones exceden los 7.44mA
Ejercicio 4.2.5. El diametro de un eje propulsor de almacenamiento optico tiene una distribucion normal con una media de 0.2508 pulgadas y una desviacion estandar de 0.005 pulgadas.
Las especificaciones de los ejers son 0.2500 0.0015
68
4.2.4.
Otras distribuciones
En estas notas no nos ocuparemos de otras distribuciones continuas solo las mencionaremos:
La distribucion Gamma estas funciones modelan situaciones no simetricas como la duracion de bacterias, precipitaciones etcetera.
Distribucion ji-cuadrada 2 con grados de libertad. En estadstica, se usa el termino
grados de libertad que es el n
umero de observaciones menos el n
umero de parametros
desconocidos que se desean estimar con base a estas observaciones. Usaremos esta distribucion mas adelante para estimar la varianza 2 cuando tenemos n observaciones por lo
cual usaremos n 1 grados de libertad.
La distribucion Beta esta definida en el intervalo 0 < x < 1, esta distribucion se usa para
trabajar con 2 probabilidades llamadas y .
La distribucion de Weibull, esta se usa par tiempos de vida u
til de componentes o sistemas.
La distribucion t de Student con grados de libertad. Podemos decir que la distribucion
t de Student es una especie de version generalizada de la distribucion normal estandar,
la cual sera precisamente una distribucion t con grados de libertad. Esta distribucion
la ocuparemos para hacer estimaciones de la media .
69
70
Estimaciones
5.1.
Ejemplo 5.1.1
Las resistencias a la fractura de determinado tipo de vidrio son en promedio 14 (miles de libras por
pulgada cuadrada) y tienen una desviacion estandar igual a dos.
a) Cual es la probabilidad de que la resitencia promedio de fractura de 100 piezas de este vidio sea
mayor que 14.5?
b) Determinar un intervalo que abarque la resistencia promedio de la fractura de 100 muestras de
este vidrio, con unaprobabilidad de 0.95.
71
SOLUCION:
a) Notamos que nos estan preguntando P X
que = 14 y que = 2. Entonces podemos estandarizar, pues de acuerdo con el Teorema de
tiene una distribucion aproximadamente normal.
Lmite Central X
!
X
14.5
14
> 14.5 = P
P X
>
= P (Z > 2.5) = 1P (Z 2.5) = 10.993790 =
0.00621
100
. Despejando x = z
0.95 + 1
= 0.975
2
+ .
2
2
( z
,+ z
) = (14 1.96 100 , 14 1.96 100 ) = (13.608, 14.392).
n
n
Ejemplo 5.1.2
Se ha observado durante mucho tiempo que una maquina determinada para llenar botellas, tiene una
varianza en las cantidades de llenado aproximadamente de 2 = 1 onzas cuadradas. Sin embargo,
el promedio de las onzas de llenado depende de un ajuste que puede cambiar de da a da, o de
operador a operador. Si en un da se llevan a cabo n = 25 observaciones de la cantidad (onzas) de
lquido servido, todas con el mismo ajuste de maquina.
a) Calcular la probabilidad de que el promedio muestral quede dentro de 0.3 onzas de diferencia
con respecto al promedio verdadero de la poblacion , para ese ajuste.
b) Cuantas observaciones se deben efectuar en la muestra para que x quede a menos de 0.3 onzas
de con una probabilidad de 0.95?
SOLUCION:
a) Tenemos que = 1, n = 25 y lo que nos estan preguntando es:
!
0.3
x
+ 0.3
0.3
0.3
<Z< 1
=
< <
=P
P ( 0.3 < x < + 0.3) = P
b) En este caso me estan preguntando un valor simetrico que da dicha probabilidad esto es:
P (z < Z < z) = 0.95 Ahora le hacemos al reves y buscamos en la tabla que valores correspon0.3
den obteniendo z = 1.96 utilizando el inciso anterior tenemos que z = 1.96 = 1 despejamos
2
1.96
= 42.42.684444.
0.3
Redondeado necesitamos hacer 43 observaciones para que x quede a menos de 0.3 onzas de .
72
z
x
2
Ejemplo 5.1.3
Un artculo del Journal of Heat Transfer (Trans. ASME, Secc. C, 96, p. 59) describa un nuevo metodo para medir la conductividad termica del hierro Armco. Utilizando una temperatura de
100 F y una alimentacion de energa de 550 W , se obtuvieron las siguientes 10 mediciones de la
conductividad termica (en Btu/hr pie F ):
41.60, 41.48, 42.34, 41.95, 41.86, 42.18, 41.72, 42.26, 41.81, 42.04
a) Calcular x y su error.
b) Comparar el error con x calculando que porcentaje representa el error con respecto a la media
obtenida. Es un buen estimador?
SOLUCION:
a)
x2
41.60
1730.56
41.48
42.34
1720.5904
1792.6756
41.95
41.86
42.18
1759.8025
1752.2596
1779.1524
41.72
42.26
41.81
1740.5584
1785.9076
1748.0761
42.04
1767.3616
2
x = 419.24 x = 17576.9442
x
nx2 ()2
= 41.924; s2 =
= 0.0807 y por lo tanto s = 0.284.
n
n(n 1)
0.284
s
=
Como no tenemos entonces podemos calcular el error estimado estandar = =
n
10
0.0898
n = 10; x =
(0.0898)(100)
100 =
= 0.214 %
x
41.924
Como el error es el 0.214 % del valor estimado podemos concluir que es un buen estimador.
b) Tenemos que
Ejercicio 5.1.2. Cinco temperaturas maximas de la ciudad de Florida en grados celsius fueron:
22, 20, 24,21 y 26.
74
5.2.
Intervalos de Confianza
Los metodos de los intervalos de confianza deben dar valores entre los que puede estar el
parametro que se esta estimando con un indicador de confianza.
Definici
on 5.6. Suponga que X es una variable aleatoria cuya probabilidad depende de un
parametro desconocido . Dada una muestra aleatoria x1 , x2 , x3 , ...xn dos estadsticas L1 y L2
forman un intervalo de confianza del 100(1 ) % para si P (L1 L2 ) 1 . Sin
importar el valor desconocido de .
5.2.1.
Sabemos que x tiene una distribucion aproximadamente normal con media y desviacion
Como se obtiene esto, recordemos que lo que queremos es encontrar B tal que P ( B X)
+ B) = 1 . La grafica correspondiente es la siguiente:
1
B
2
+B
Esto es queremos encontrar un valor z 2 que corresponda a + B pero estandarizado lo llamaremos valor crtico.
75
1
z
z
2
As estandarizado 1 = P z 2
+ z
z X
P X
2
2
n
n
z 2
z
= P z 2 X
=
2
n
n
Ejemplo 5.2.1
Se estudiaron 50 observaciones de la vida util de bateras de cierto tipo, se obtuvo un promedio
x = 2.266 y se sabe que la desviacion estandar es 1.935. Construye el intevalo de confianza con un
coeficiente de confianza igual a 0.95.
SOLUCION:
n = 50, x = 2.266, = 1.935. Como se quiere el 0.95 de confianza tenemos que
, 2.266 + 1.96
= (1.730, 2.802)
x z 2 n , x + z 2 n = 2.266 1.96
50
50
Ejercicio 5.2.1. Para una muestra aleatoria de 50 mediciones de resistencia a la ruptura de
hebras de algodon, se encontro que la resistencia promedio era 210 gramos y la desviaci
on
estandar 18 gramos. Obtener un intervalo de confianza para la verdadera resistencia de ruptura
promedio de las hebras de algodon de este tipo, con una confianza igual a 0.90.
Ahora supongamos que queremos estimar el n
umero de observaciones para que x quede a B
de con un nivel de confianza 1 .
z
Esto es el intervalo que queremos es que el intervalo de confianza x 2 = x B. Esto es
n
z 2
z 2
2
B = x entonces n =
n
B
76
Ejemplo 5.2.2
Se desea estimar la distancia promedio que recorren los empleados de una empresa muy grande
camino a su trabajo. Los estudios anteriores de este tipo indican que la desviacion estandar de esas
distancias debe estar cercana a las 2 millas. Cuantos empleados deben muestrearse si la estimacion
debe quedar a menos de 0.1 millas del promedio verdadero, con un coeficiente de confianza de 0.95?
SOLUCION:
= 2, B = 0.1, 1 = 0.95, = 0.05 y
z 2 1.96(2) 2
2
=
n=
= 1536.64.
B
0.1
Se deben muestrear 1537 empleados.
Ejercicio 5.2.2. La resistencia a la ruptura de los hilos tiene una desviacion estandar de 18
gramos. Cuantas mediciones de resistencia a la ruptura deben hacerse en el siguiente experimento, si la estimacion de la resistencia promedio de ruptura debe estar a menos de 4 gramos
de la resistencia verdadera a la ruptura, con un coeficiente de confianza igual a 0.90?
5.2.2.
Ejemplo 5.2.3
El alambre pretensado para reforzar tubos de concreto se fabrica en rollos grandes. En una inspeccion
de control de calidad se prueban 5 muestras de un rollo y se mide su resistencia maxima a la tension,
RMT . Los resultados de las mediciones, en un rollo de lb/pulg 2 , fueron 253, 261, 258, 255 y 256.
Con estos datos, determinar una estimacion de intervalo de confianza del 95 % del RMT promedio
verdadero para el rollo que se muestreo.
77
SOLUCION:
x2
253
261
258
64009
68121
66564
255
256
65025
65536
x = 1283 x2 = 329255
5(329255) (1283)2
= 9.3 y s = 3.049.
n = 5, x = 256.6, s2 =
5(4)
= 0.05 entonces /2 = 0.025.
t/2 con 4 grados de libertad es: t0.025 = 2.776
9.3
s
x t 2 = 256.6 2.776 = 256.6 3.7859 = (252.814, 260.3859)
n
5
Ejercicio 5.2.3. La resistencia a la ruptura en el sentido de la urdimbre de 5 especmenes de
determinada tela, fue en promedio 180lb/pulg 2 con desviacion estandar muestral de 5lb/pulg 2.
Estimar resistencia de ruptura verdadera en el sentido de la urdimbre para telas de este tipo
con un intervalo de confianza de 95 %.
5.3.
Ahora toca el turno a varianza 2 cuyo estimador es s2 si seguimos teniendo una distribucion
aproximadamente normal.
Teorema 5.3. Suponga que x1 , x2 , ..., xn es una muestra aleatoria X con media y varianza
n
X
(xi )2
2
Entonces Y =
tiene una distribucion 2 con n 1 grados de libertad.
2
i=1
Teorema 5.4. Suponga que X1 , X2 , X3 , ..., Xn es una variable aleatoria de una variable aleatoria normal. Entonces:
(xi x)2
s2 (n 1)
=
2
2
es una variable aleatoria 2 con n 1 grados de libertad y s2 y x son variables aleatorias
independientes.
Con el teorema anterior podemos definir el intervalo de confianza para 2 con una confianza
del100(1 ) %.
(n 1)s2
2
2
P 1/2
/2 = 1
2
Trabajando la desigualdad para!dejar sola a 2 obtenemos:
(n 1)s2
(n 1)s2
2
P
=1
2/2
21/2
Por lo tanto el intervalo de confianza para 2 con (1 )100 % de confianza es:
78
2/2
21/2
Ejemplo 5.3.1
En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de
los resultados que producen muestras estandar. En un estudio de la cantidad de calcio en el agua
potable, el cual se efectua como parte del control de calidad de una agua, se analizo seis veces
la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes de millon
fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar 2 usando un intervalo de confianza de 90 %.
SOLUCION:
x2
9.54
9.61
91.0116
92.3251
9.32
9.48
86.8624
89.8704
9.70
9.26
94.09
85.7476
x = 56.91 x2 = 539.9341
6(539.9341) (56.41)2
59.41
= 9.485, s2 =
= 0.02855.
x =
6
6(5)
2
2
= 0.1 entonces /2 = 0.05 con 5 grados de libertad 0.05 = 11.07 0.95 = 1.15.
(6 1)0.02855 (6 1)(0.02855)
= (0.1241, 0.128)
,
11.07
1.15
Ejercicio 5.3.1. Estimar la varianza verdadera de las mediciones de resistencia, en un intervalo de confianza de 90 %, si una muestra de 15 resistores presento resistencias con una
desviacion estandar muestral igual a 0.5 ohms.
79
80
Pruebas de hip
otesis
Definici
on 6.1. A un proceso que lleva a una decision acerca de una hipotesis particular se
llama prueba de hipotesis.
Las posibles decisiones son Rechazar, No rechazar. Como trabajaremos con una muestra entonces asegurar algo sobre la poblacion sera muy descuidado.
Los procedimientos de prueba se basan en el uso de la informacion contenida en una muestra
aleatoria de la poblacion de interes.
En este caso la hipotsis nula es la hipotesis que quiere probarse. El rechazo de la hipotesis nula
lleva a No rechazarla hipotesis alterna.
Los errores en los que podemos caer al trabajar pruebas de hipotesis son 2.
Definici
on 6.2. El error de tipo I se define como el rechazo de la hipotesis nula H0 cuando
esta es verdadera.
Definici
on 6.3. El error de tipo II se define como el no rechazo de la hipotesis nula H0
cuando esta es falsa.
H0 es cierta
Rechazar H0
No rechazar H0
Error de tipo I
Decision correcta
6.1.
Pruebas de hip
otesis para
6.1. PRUEBAS DE HIPOTESIS
PARA
6.1.1.
Prueba de hip
otesis para de dos colas
H0 : = 0 esto quiere decir que la hipotesis afirma que la 0 dada es igual a la de la poblacion.
La hipotesis alterna es el complemento de la hipotesis nula H1 : 6= 0 .
Intervalo
de
confianza
1
punto crtico
punto crtico
Regi
on
Regi
on
Regi
on
de
de
de
aceptaci
on
rechazo
rechazo
punto crtico
punto crtico
x 0
x 0
s
n
6.1. PRUEBAS DE HIPOTESIS
PARA
6.1.2.
Prueba de hip
otesis para cola derecha
H0 : 0 esto quiere decir que la hipotesis afirma que la 0 dada es mayor que la de la
poblacion.
La hipotesis alterna es el complemento de la hipotesis nula H1 : < 0 .
1
Regi
on
de
aceptaci
on
Regi
on
de
rechazo
punto crtico
x 0
H0 no se rechaza si z0 > z
H0 se rechaza si z0 < z
El estadstico en caso de que no conozcamos es:
t0 =
x 0
s
n
H0 no se rechaza si t0 > t
H0 se rechaza si t0 < t
6.1.3.
Prueba de hip
otesis para de cola izquierda
H0 : 0 esto quiere decir que la hipotesis afirma que la 0 dada es menor que la de la
poblacion.
6.1. PRUEBAS DE HIPOTESIS
PARA
1
Regi
on
de
aceptaci
on
punto crtico
Regi
on
de
rechazo
punto crtico
x 0
H0 no se rechaza si z0 < z
H0 se rechaza si z0 > z
El estadstico en caso de que no conozcamos es:
t0 =
x 0
s
n
H0 no se rechaza si t0 < t
H0 se rechaza si t0 > t
Ejemplo 6.1.1
Los sistemas de expulsion de la tripulacion de un avion son impulsados por una carga propulsora
solida. La rapidez de combustion de esta carga propulsora es una caracterstica importante del
producto. Las especificaciones requieren que la rapidez de combustion media debe ser 50cm/s. Se
sabe que la desviacion estandar de la rapidez de combustion es = 2cm/s. El analista decide
especificar una probabilidad del error tipo I o nivel de significacion de = 0.05. Selecciona una
muestra aleatoria de n = 25 y obtiene un promedio muestral de la rapidez de combustion de
x = 51.3cm/s. Considera como H0 : = 50. Cual es tu conclusion?
SOLUCION:
Tenemos que se trata de una hipotesis de dos colas:
84
6.1. PRUEBAS DE HIPOTESIS
PARA
H0 : = 50
H1 : 6= 50
=2
/2 = 0.025
n = 25
z0 =
x 0
51.3 50
2
25
= 3.25
x = 51.3
Por otro lado z0.025 = 1.96. Ahora como tenemos que z/2 < z0 entonces la hipotesis se rechaza.
Conclusion: Rechazamos la hipotesis de que = 50 con un nivel de significacion de 0.05.
Ejemplo 6.1.2
El ajuste de profundidad de determinado taladro de columna es dos pulgadas. Entonces, se podra
suponer que la profundidad promedio de todos los agujeros barrenados por esta maquina es = 2
pulgadas. Para comprobar esta hipotesis, as como la exactitud del calibre de profundidades, se
midio una muestra aleatoria de n = 100 agujeros barrenados por esa maquina y se encontro un
promedio de muestra x = 2.005 pulgadas con una desviacion estandar de = 0.03 pulgadas. Si Se
puede rechazar la hipotesis con base en los datos de la muestra?
SOLUCION:
Tenemos que otra vez se trata de una hipotesis de dos colas:
= 0.03
H0 : = 2
/2 = 0.025
2.005 2
x 0
=
= 1.6667
z0 =
0.03
H1 : 6= 2
n = 100
n
100
x = 2.005
Otra vez ocupamos z/2 = 1.96. Como z/2 > z0 no podemos rechazar la hipotesis de que = 2.
Conclusion: no se puede rechazar la hipotesis de que la media = 2 pulgadas con un nivel de
significacion de 0.05.
Ejercicio 6.1.1. Un vicepresidente de una gran empresa afirma que el n
umero de llamadas
solicitando servicio al equipo que vende su empresa no es mas de 15 por semana, en promedio.
Para comprobar su afirmacion, se revisaron los registros de servicio para 36 semanas seleccionadas al azar, y el resultado fue que x = 17 y la varianza muestral de 19 para los datos de las
muestras. Contradice la evidencia de la muestra la afirmacion del vicepresidente al nivel de
significacion de 5
Ejercicio 6.1.2. La tension de salida de determinado circuito electrico debe ser 130, de acuerdo
con las especificaciones. Una muestra de 40 mediciones independientes de la tension de este
circuito dio un promedio de x = 128.6 y una desviacion estandar muestral de 2.1. Se quieren
hacer las dos pruebas siguientes con un nivel de significaci
on
a) Probar la hipotesis de que la tension promedio de salida es 130.
b) Probar la hiportesis de que la tension promedio de salida es no es mayor a 130.
85
6.2. PRUEBAS DE HIPOTESIS
PARA Y 2
Ejemplo 6.1.3
Un artculo de la revista Materials Engineering (Vol. II, No. 4, pp. 275-281) describe los resultados
de las pruebas por traccion para la adhesion en 22 muestras de la aleacion U-700. Las cargas en
que fallaron las muestras (en MPa) son las siguientes: 19.8 18.5 17.6 16.7 15.8 15.4 14.1 13.6 11.9
11.4 11.4 8.8 7.5 15.4 15.4 19.5 14.9 12.7 11.9 11.4 10.1 7.9
La media muestral 13.71 es y la desviacion estandar resulta 3.55 Los datos sugieren que la carga
para la falla media excede 10? Supon que la carga para la falla tiene una distribucion normal, y usa
= 0.05.
SOLUCION:
H0 : > 10
H1 : 10
n = 22
x = 13.71
t0 =
s = 3.55
= 0.05
= 1.721 con 21 grados de libertad.
x
s
n
13.71 10
3.55
12
= 4.901
2.94, 4.38, 4.02, 3.82, 3.30, 2.85, 3.34, 3.91. Se podra rechazar la hipotesis de que se cumple
con la especificacion en el nivel de significacion del 5 %?
6.2.
Pruebas de hip
otesis para y 2
Si se desea probar una hipotesis acerca de la varianza o la desviacion estandar se pude hacer utilizando el intervalo de confianza que construimos en el captulo anterior usando como
estadstico
(n 1)s2
.
20 =
02
Al igual que la media vamos a tener pruebas de una y dos colas. Las cuales podemos resumir en
(n 1)s2
la siguiente tabla usando como estadstico en todos los casos 20 =
y tenemos n 1
02
gracos de libertad.
86
6.2. PRUEBAS DE HIPOTESIS
PARA Y 2
Hipotesis
H0 : 2 = 02
H1 : 2 6= 02
No se rechaza
Se rechaza
Colas
H0 : 2 02
H1 : 2 > 02
2 > 20
Si 2/2 < 20
H0 : 2 02
21 < 20
Si 21 > 20
H1 : 2 < 02
Ejemplo 6.2.1
Una determinada compana que produce una parte maquinada para un motor, afirma que tiene una
varianza de diametro no mayor que 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas partes
dio una varianza muestral s2 = 0.0003. Hay evidencia para refutar lo que afirma el proveedor
usando = 0.05 ?
SOLUCION:
H0 : 2 0.0002
H1 : 2 > 0.0002
n = 10
s2 = 0.0003
= 0.05
20
(n 1)s2
9(0.0003)
=
=
= 13.5
2
0.0002
Ejemplo 6.2.2
Para una muestra aleatoria simple de adultos, las puntuaciones de CI se distribuyen normalmente, con
una media de 100 y una desviacion estandar de 15. Una muestra aleatoria simple de 13 profesores de
estadstica produce una desviacion estandar s = 7.5. Un psicologo afirma que la desviacion estandar
de los profesores es menor o igual a la de los adultos. Tienes elementos para rechazar esta hipotesis
usando un nivel de significacion de = 0.05. ?
87
6.2. PRUEBAS DE HIPOTESIS
PARA Y 2
n = 13
12(51.84)
(n 1)s2
2
2
=
= 2.7648.
SOLUCION:
s = 51.84 0 =
2
2
225
H1 : > 225
= 0.05
2
2
2
Como 0.05 = 21.03 y > 0 . No se rechaza la hipotesis de que < 15.
H0 : 2 225
Ejercicio 6.2.2. Utilice un nivel de significancia de 0.05 para probar la aseveracion de que las
estaturas de mujeres supermodelos varan menos que las estaturas de las mujeres en general.
La desviaci
on estandar de las estaturas de la poblacion de mujeres es de 2.5 pulgadas. A continuacion se listan las estaturas (en pulgadas) de supermodelos seleccionadas al azar (Taylor,
Evangelista, Auermann, Schiffer, MacPherson, Turlington, Hall, Crawford, Herzigova, Banks,
Moss, Hume). 71 69.5 70.5 71 72 70 70 69 69.5 69 70 66.5
88
Indice alfab
etico
Bayes
Teorema de, 33
Distribucion continua
uniforme, 60
Bernoulli
Distribucion, 45
Distribucion de probabilidad, 36
Binomial
distribucion, 45
experimento, 46
Cardinalidad
Error de tipo I, 78
Error de tipo II, 78
Espacio muestral, 14
Esperanza, 40
Estadstica
propiedades, 25
cardinalidad, 21
descriptiva, 1
inferencial, 1
clases, 3
Combinacion, 19
Estandarizacion, 67
Estimaciones, 69
conjuntos
Estimador, 71
propiedades, 25
Datos
agrupados, 1
agrupamiento de, 1
no agrupados, 1
Datos agrupados, 9
error, 72
insesgado, 71
Evento
interseccion de, 22
Eventos
ajenos, 22
complemento, 23
definicion, 20
Desviacion estandar
datos agrupados, 13
poblacional, 11
variable aleatoria discreta, 40
Diagrama de tallo y hoja, 6
Distribucion
Bernoulli, 45
Binomial, 45
exponencial, 61
Geometrica, 48
independientes, 30
union, 21
experimento, 14
Exponencial
distribucion, 61
Factorial, 17
Frecuencia, 3
acumulada, 3
normal, 63
Poisson, 50
uniforme, 43
relativa, 3
Funcion de distribucion, 57
Funcion de distribucion acumulada
89
INDICE ALFABETICO
propiedades, 39
funcion de distribucion acumulada, 39
funcion de masa de probabilidad, 39
Geometrica
distribucion, 48
Grafica
pastel, 5
Graficos, 5
histograma, 5
Intervalo de clase, 3
Intervalos de confianza, 73
con desconocida, 75
Poblacion, 7
Poisson
distribucion, 50
Principio de multiplicacion, 16
Probabilidad
condicional, 28
funcion, 25
propiedades, 27
total, 31
Pruebas de hipotesis, 78
para cola derecha, 80
para de cola izquierda, 80
para de dos colas, 79
Punto medio, 4
para , 76
Lmite Central
teorema de, 69
Media aritmetica
datos no agrupados, 7
Media muestral
datos no agrupados, 7
Mediana
datos agrupados, 10
Datos no agrupados, 7
Medidas de dispersion, 11
Medidas de tendencia central, 6
Medua
datos agrupados, 9
Moda
datos agrupados, 10
datos no agrupados, 8
Muestra, 7
Regla de multiplicacion, 29
Teorema
del Lmite Central, 69
Teorema de Bayes, 33
Uniforme
distribucion, 43
distribucion continua, 60
Variable aleatoria
continua, 35
definicion, 35
discreta, 35
Variable aleatoria continua
definicion, 56
propiedades, 56
Varianza, 11
datos agrupados, 13
poblacional, 11
variable aleatoria discreta, 40
Normal
distribucion, 63
Permutacion, 18
90