Está en la página 1de 94

APUNTES DE

ESTADISTICA Y PROBABILIDAD
Julia Mu
noz

UNIVERSIDAD AUTONOMA
DE LA CIUDAD DE MEXICO

Indice general
1. Estadstica Descriptiva
1.1. Representacon de datos agrupados y no agrupados
1.1.1. Agrupamiento de datos . . . . . . . . . . . .
1.1.2. Graficos . . . . . . . . . . . . . . . . . . . .
1.1.3. Diagrama de tallo y hoja . . . . . . . . . . .
1.2. Medidas de tendencia central . . . . . . . . . . . .
1.2.1. Datos no agrupados . . . . . . . . . . . . . .
1.2.2. Datos agrupados . . . . . . . . . . . . . . .
1.3. Medidas de dispersion . . . . . . . . . . . . . . . .
1.3.1. Datos no agrupados . . . . . . . . . . . . . .
1.3.2. Varianza y desviacion estandar . . . . . . .
1.3.3. Datos agrupados . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

1
1
1
5
6
6
7
9
11
11
11
13

2. Probabilidad
2.1. Espacio muestral . . . . . . . . . .
2.2. Elementos de calculo combinatorio
2.2.1. Principio de multiplicacion .
2.2.2. Permutaciones . . . . . . . .
2.2.3. Combinaciones . . . . . . .
2.3. Eventos . . . . . . . . . . . . . . .
2.3.1. Operaciones con eventos . .
2.4. Funcion de probabilidad . . . . . .
2.5. Probabilidad Condicional . . . . . .
2.6. Teorema de Bayes . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

15
15
17
17
19
20
21
21
25
28
32

3. Variables Aleatorias
3.1. Definicion y propiedades de las variables aleatorias discretas
3.2. Distribucion de probabilidad . . . . . . . . . . . . . . . . . .
3.3. Esperanza, varianza y desviacion estandar . . . . . . . . . .
3.4. Distribuciones discretas especiales . . . . . . . . . . . . . . .
3.4.1. Distribucion Uniforme . . . . . . . . . . . . . . . . .
3.4.2. Distribucion Bernoulli . . . . . . . . . . . . . . . . .
3.4.3. Distribucion Binomial . . . . . . . . . . . . . . . . .
3.4.4. Distribucion Geometrica . . . . . . . . . . . . . . . .
3.4.5. Distribucion Poisson . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

35
35
36
40
43
43
45
45
48
50

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

iii

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

INDICE GENERAL
3.5. Otras distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.5.1. Distribucion Binomial Negativa . . . . . . . . . . . . . . . . . . . . . . . 52
4. Variable aleatoria continua
4.1. Variables aleatorias continuas y sus propiedades
4.2. Distribuciones continuas especiales . . . . . . .
4.2.1. Distribucion Uniforme . . . . . . . . . .
4.2.2. Distribucion Exponencial . . . . . . . . .
4.2.3. Distribucion Normal . . . . . . . . . . .
4.2.4. Otras distribuciones . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

5. Estimaciones
5.1. Teorema del Lmite Central . . . . . . . . . . . . . . .
5.2. Intervalos de Confianza . . . . . . . . . . . . . . . . . .
5.2.1. Intervalos de confianza para con conocida .
5.2.2. Intervalo de confianza para con desconocida
5.3. Intervalos de confianza para 2 . . . . . . . . . . . . .
6. Pruebas de hip
otesis
6.1. Pruebas de hipotesis para . . .
6.1.1. Prueba de hipotesis para
6.1.2. Prueba de hipotesis para
6.1.3. Prueba de hipotesis para
6.2. Pruebas de hipotesis para y 2
Indice de Materias

iv

. . . . . . . . . .
de dos colas . . .
cola derecha . .
de cola izquierda
. . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

57
57
61
61
62
64
69

.
.
.
.
.

71
71
75
75
77
78

.
.
.
.
.

81
81
82
83
83
86
88

Estadstica Descriptiva
1.1.

Representac
on de datos agrupados y no agrupados

Los datos estadsticos se obtienen de observaciones numericas de conjuntos que se caracterizan


por la variacion que muestrean sus componentes.
La estadstica descriptiva permite resumir y representar los datos mas destacados de los
elementos que componen un conjunto de observaciones.
La estadstica inferencial tiene por objeto describir las caractersticas de un conjunto, pero
sin que se registren los datos correspondientes a todos los elementos del conjunto, sino solo de
una parte de los elementos, por esta razon esta inferencia tiene probabilidad de error.
Los datos con los que se trabajan pueden ser nominativos como, partido poltico, sexo, color favorito, carrera etcetera. Tambien pueden ser numericos como son edad, estatura, watts,
longitud etcetera.
En este curso trabajaremos con datos numericos. Estos datos tienen un orden sabemos que
5 > 3 y que 30 < 100. Tambien trabajaremos con los datos nominativos que tambien tienen la
caracterstica de orden, esto es, por ejemplo caliad alta, media, baja, sabemos que alta > baja
y que media < alta.

1.1.1.

Agrupamiento de datos

En el analisis estadstico de los datos es necesario realizar un proceso de condensacion de los


mismos antes de obtener las medidas estadsticas que resuman a
un mas la informacion.
La agrupacion mas sencilla es ordenar los datos.

Ejemplo 1.1.1
Calificaciones del curso de estadstica: 7.5, 6, 8.3, 9 y 10.
Ordenamos y obtenemos:
1

DE DATOS AGRUPADOS Y NO AGRUPADOS


1.1. REPRESENTACION
6, 7.5, 8.3, 9, 10.
La informacion que obtenemos es limitada podemos decir que el valor mnimo es 6 y el maximo es
10.
Consideremos un conjunto mas grande.

Ejemplo 1.1.2
Los datos que siguen corresponden a las observaciones hechas a las 10:00 de la manana del numero
de pasajeros en el RTP durante 50 das.
48 51
52 54
30 40

57 63 59
37 47 49
50 46 56

50 64
45 52

39 55 74
65 59 51

63 64
57 53
58 61

54 62 77
58 73 75
59 70 63

60 64
73 72

71 81 66
82 60 49

Procedemos a ordenarlos y obtenemos la siguiente lista


30 37
46 47
50 50

39 40 45
48 49 49
51 51 52

52 53
56 57

54 54 55
57 58 58

59 59
61 62
64 64

59 60 60
63 63 63
64 65 66

70 71
74 75

72 73 73
77 81 82

Cuando hacemos este ordenamiento obtenemos como mnimo 30 pasajeros y el maximo fue 82.
Ademas por ejemplo el 49 aparece 2 veces, al 2 le llamamos frecuencia f o frecuencia absoluta, esto
es numero de veces que aparece repetido el elemento. Obtenemos la siguiente lista de frecuencias:
2

DE DATOS AGRUPADOS Y NO AGRUPADOS


1.1. REPRESENTACION
xi

xi

xi

xi

xi

xi

xi

30

37

39

40

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

70

71

72

73

74

75

77

81

82

Ademas de la frecuencia, podemos calcular otras frecuencias llamadas frecuencia relativa y


frecuencia acumulada.
Definici
on 1.1. La frecuencia relativa es el porcentaje que corresponde la fraccion de la frecuencia del elemento entre el n
umero total de observaciones.
Definici
on 1.2. La frecuencia acumulada es la suma de frecuencia del elemento y las frecuencias de los elementos anteriores.
2
Por ejemplo la frecuencia relativa del 49 es
pues aparece 2 veces y son 50 datos, el porcentaje
50
correspondiente es 4 %.
Y la frecuencia acumulada es 10 si sumamos todas las frecuencias anteriores incluida la del 49
y traduciendolo a porcentaje es 20 %
Como podemos observar tenemos muchos datos, lo cual no es agradable a la vista. Los datos
que mas se repiten son el 59, 63 y el 64, muchos datos solo aparecen una vez, lo cual nos aporta
poca informacion. Para obtener mas informacion hacemos agrupamiento de datos en clases.
El n
umero de clases es arbitrario. En general se forman entre 5 y 20 clases aunque algunos
autores proponen maximo 12 clases.
Una regla simple para determinar el n
umero de clases c de n observaciones puede ser:
2c n
Definici
on 1.3. El intervalo de clase es el rango de valores encontrado dentro de una clase.
Por ejemplo cuando se hace una encuesta a mujeres jovenes, la edad se divide en clases:
21 a 25, 26 a 30, 31 a 35 etcetera.
Cada clase tiene 5 valores esto es 21,22,23,24,25 lo mismo que las otras y por lo tanto el IC = 5.
Una forma de aproximar un valor conveniente para el IC es:
IC =

Valor mas grande Valor mas peque


no
N
umero deseado de clases

Aplicamos las formulas anteriores al ejemplo 1.1.2 del RTP. Despejamos de la desigualdad y
obtenemos
3

DE DATOS AGRUPADOS Y NO AGRUPADOS


1.1. REPRESENTACION
ln50
5.64
ln2
entonces c = 6. Redondeando obtenemos 6 clases.
82 30
52
Aproximamos IC =
=
8.7. Redondeando 9 el cual no es tan comodo, en su lugar
6
6
nos conviene utilizar un IC = 10 para trabajar con decenas esto es digamos la clase de 20 a 29
que tiene 10 valores posibles. El valor mas peque
noo se llama lmite inferior de la clase en
ln2c ln50, cln2 ln50 c

este caso 20 y el 29 es el lmite superior de la clase.


Otra caracterstica de la clase ademas del IC es el punto medio. El punto medio de la clase
y se calcula como la suma de los lmites superior e inferior entre 2.
Regresamos al ejemplo y obtenemos las siguientes 6 clases junto con su frecuencia y punto
medio.
lmite inferior

lmite superior

frecuencia

punto medio

30
40
50

39
49
59

3
7
18

34.5
44.5
54.5

60
70

69
79

12
8

64.5
74.5

80

89

84.5

Ademas de la frecuencia podemos calcular la frecuencia relativa y frecuencia acumulada de cada


clase:
clase

frecuencia

frecuencia relativa

frecuencia acumulada

30-39
40-49
50-59

3
7
18

6%
14 %
36 %

6%
20 %
56 %

60-69
70-79

12
8

24 %
16 %

80 %
96 %

80-89

4%

100 %

Ejercicio 1.1.1.

1. Un conjunto de datos contiene 100 observaciones la mas grande es 315

y la mas peque
na es 56.
a) Cuantas clases debera tener la tabla de frecuencia?
b) Cual es el intervalo de clase conveniente?
c) Cuales son los lmites y puntos medios de cada clase?
2. Los siguientes datos son los ingresos semestrales de 60 ingenieros. Los datos estan expresados en miles de pesos.
4

DE DATOS AGRUPADOS Y NO AGRUPADOS


1.1. REPRESENTACION
58
64
79

76 89 45 67
76 34 65 45
74 56 71 85

34
39
87

74
69
71

38 69 79 61
62 56 38 69
54 31 69 62

71
79
39

65
55

79 47 46 77
75 62 57 77

66
36

73
40

72 64 69 51
50 74 61 69

50
73

a) Construye las clases


b) Determina la frecuencia absoluta, frecuencia relativa y frecuencia acumulada.
c) Escribe tus conclusiones sobre los datos de la tabla.

1.1.2.

Gr
aficos

Los graficos tambien son metodos u


tiles para describir conjuntos de datos.
Un histograma coloca las clases o elementos de una distribucion de frecuencias en el eje
horizontal. Lo que haces es simplemente escribir rectangulos en su base la clase y la altura es
la frecuencia correspondiente.

Podemos decir que este grafico corresponde a la frecuencia absoluta. El grafico correspondiente a
la frecuencia relativa es el conocido como diagrama circular o diagrama pastel. Esto es cada
pedazo representa el porcentaje correspondiente a la frecuencia relativa. Lo mas conveniente es
que sean pocas clases para obtener para poder leer facilmente la informacion.
5

1.2. MEDIDAS DE TENDENCIA CENTRAL

1.1.3.

Diagrama de tallo y hoja

John Tukey, un estadista notable, creo el diagrama de tallo y hoja como una alternativa al
grafico histograma pues proporciona tambien una informacion visual rapida. Cada observacion
se divide en dos partes tallo y hojas, el tallo es la informacion com
un a los datos por ejemplo las
decenas y las hojas seran las unidades. Tomando nuevamente como ejemplo 1.1.2 del n
umero
de pasajeros del autob
us obtenemos la siguiente tabla:
Tallo

Hoja

3
4

079
0567899

5
6

001122344567788999
001233344456

7
8

01233457
12

En este caso podemos observar que se trata graficamente de un histograma horizontal y a la


vez tenemos todos los datos correspondientes de las observaciones.
Ejercicio 1.1.2. Haz el histograma, diagrama circular y diagrama de tallo y hoja del problema
2 del ejercicio 1.1.1 .

1.2.

Medidas de tendencia central

Una medida de tendencia ubica e identifica el punto alrededor el cual se centran los datos. La
idea es describir un conjunto de datos con un solo n
umero. El ejemplo que usamos com
unmente
para representar al conjunto de calificaciones de un semestre es el promedio. Vamos a empezar
a calcular las medidas de tendencia central a partir de datos no agrupados.
6

1.2. MEDIDAS DE TENDENCIA CENTRAL

1.2.1.

Datos no agrupados

Existen tres metodos comunes para identificar el centro de un conjunto de datos: la media, la
mediana y la moda. Su calculo e interpretacion se definen a continuacion.
Definici
on 1.4. La media, o media aritmetica, es la medida de tendencia central que usualmente se le llama promedio. Se calcula haciendo la suma de todas las observaciones y dividir
esta suma entre el n
umero de operaciones.
La notacion de la media de una poblacion es el parametro . Si hay N observaciones en el
conjunto de datos de la poblacion. La media se calcula:

X1 + X2 + X3 + + XN
=
=
N

N
X

Xi

i=1

Definici
on 1.5. La poblaci
on es la coleccion de todos los datos de interes.
Es posible que no tengamos todas las observaciones, esto es, tenemos la llamada muestra.
Definici
on 1.6. Una muestra es un subconjunto de observaciones representativo de la poblacion.
La formula de la media muestral es:

= X1 + X2 + + Xn =
X
n

n
X

Xi

i=1

Para determinar si se trata de una poblacion o de una muestra se debe leer cuidadosamente el
problema.
Definici
on 1.7. La mediana conocida como media posicional porque queda exactamente en
la mitad del conjunto de datos despues de ordenarlos.
La mitad de las observaciones estara por encima de la mediana, la otra mitad estara por debajo
de ella. Si el conjunto de datos tiene un n
umero impar de observaciones, la posicion de la
mediana se calcula con la formula:
posicion =

n+1
.
2

En el caso de que el n
umero de observaciones sea par se toma el promedio de los valores que se
n+1
.
encuentran en las posiciones justo en medio esto es el entero mayor y menor a
2
7

1.2. MEDIDAS DE TENDENCIA CENTRAL


Definici
on 1.8. La moda es la observacion o dato que ocurre con mayor frecuencia.
En caso de que sean 2 datos los que mas se repiten se dice que el conjunto de datos es bimodal,
si son 3 trimodal etcetera.
La media es la medida de tendencia central mas usada, pues se presta para mayor manipulacion
e interpretacion algebraica. Desafortunadamente, la media se ve afectada por valores extremos,
o valores atpicos, y a diferencia de las otras dos, la media puede ser sesgada por estos valores.
Esto no significa que sean mejores que la media, simplemente cada medida de tendencia central
da distinta informacion.

Ejemplo 1.2.1
Tu empresa esta introduciendo un nuevo chip de computadora que hace calculos estadsticos rapidamente. Se hacen 20 calculos diferentes que se muestran a continuacion. Determina la media, la
mediana y la moda. Comenta los beneficios de usar cada estadstico.
3.2
5.4

4.1 6.3 1.9


5.2 3.2 4.9

0.6
6.2

1.8
4.3

1.7 3.6 1.5


6.1 2.4 2.2

2.6
3.3

SOLUCION:
Al leer que se toman 20 calculos diferentes quiere decir que no tomamos todos.
Por lo tanto se trata de una muestra con n = 20. Ordenamos los valores podemos aprovechar y
escribir el diagrama de tallo y hoja obteniendo.
tallo

hoja

1
2

5789
246

3
4
5

2236
139
24

123

Calculamos
= 70.5 = 3.525.
X
20
20 + 1
Como el numero de datos es par obtenemos la posicion=
= 10.5.
2
8

1.2. MEDIDAS DE TENDENCIA CENTRAL


Entonces tomamos los datos en las posiciones 10 y 11. Esto es, 3.2 y 3.3 al hacer el promedio
obtenemos que la mediana es 3.25. Del diagrama de tallo y hojas notamos que el valor que mas se
repite es 3.2.
Podemos observar que en este caso la media, la moda y la mediana no estan tan alejadas. Entonces
el dato mas representativo sera la mediana pues el el valor que se encuentra entre la media y la
moda.
Ejercicio 1.2.1. Como gerente de ventas de Acme, deseas calcular las medidas de tendencia
central de los niveles de utlidad del u
ltimo a
no. Se tienen los siguientes datos mensuales en
miles de dolares. Comenta tus resultados
12.3 14.3 25.7
21.6 21.6 -12.8
22.3 18.0
-3.4 17.9

1.2.2.

23.2
22.3

Datos agrupados

Cuando trabajamos con datos que han sido agrupados en c clases con una ditribucion de frecuencia, ya no conocemos los datos individuales pero si conocemos las frecuencias f y podemos
calcular de cada clase el punto medio M y el n
umero de observaciones n pues este sera igual a
c
X
fi .
la suma de las frecuencias n =
i

g =
Media con datos agrupados: X

c
X

fi Mi

i=1

Ejemplo 1.2.2
Usamos el ejemplo 1.1.2 del RTP. Usando la tabla
clase

fM

30-39

34.5

103.5

40-49
50-59

7
18

44.5
54.5

311.5
981

60-69
70-79
80-89

12
8
2

64.5
74.5
84.5

774
596
169

50

2935
9

1.2. MEDIDAS DE TENDENCIA CENTRAL


= 58.7 que es muy buena aproximacion de el valor verdadero que da 58.36.
X
Para calcular la mediana con datos agrupados utilizamos las frecuencias para determinar
en que clase se encontara la mediana si no estuvieran agrupados. Como no conocemos las
observaciones generales hacemos una aproximacion utilizando la siguiente formula:

n
F
2
(IC)
Mediana Lmd +
fmd

Donde Lmd es el lmite inferior de la clase donde se encontrara la mediana, F es la frecuencia


acumulada de la clase anterior, fmd es la frcuencia de la clase de la mediana, IC es el intervalo
de la clase de la mediana.
Usamos nuevamente el ejemplo del RTP. Buscamos la clase donde se encuentran incluidos los
elementos 25 y 26, esto es la clase 50-59. Notamos que su frecuencia acumulada de la clase
anterior es 10.
Sustituimos los datos en la formula


25 10
(10) = 58.333
Mediana 50 +
18

Este resultado tambien esta muy cerca de la mediana verdadera 58.5.

En el caso de la moda, lo que hacemos es localizar la clase modal, que es la que tiene el mayor
n
umero de elementos. Y para estimar la moda para datos agrupados usamos la siguiente
formula:


Da
Moda = Lmo +
(IC)
Db + Da

Donde Lmo es el lmite inferior de la calse modal, Da es la diferencia entre la frecuencia de la


clase modal y la clase que la antecede, Db es la diferencia entre la frecuencia de la clase modal
y la clase que le sigue y IC es el intervalo de clase. Usando la tabla del RTP. Estimamos la
moda:


18 7
Moda = 50 +
(10) = 56.47
(18 12) + (18 7)
revisando la tabla de datos originales tenemos que tena tres modas: 59, 63 y 64, pero en este
caso solo podemos estimar una y esta ya no es tan buena aproximacion.

Ejercicio 1.2.2. El ausentismo diario en una oficina parece ir en aumento. El a


no pasado un
promedio de 47.8 empleados estuvo ausente algunos das. Se recolecto una muestra de datos
para el a
no en curso y se ubicaron en la tabla de frecuencias que se muestra a continuaci
on.
Estima la media, la mediana y la moda para estos datos y compara con el promedio del a
no
anterior.
10


1.3. MEDIDAS DE DISPERSION
N
umero de empleados ausentes Das en los que ese n
umero estuvo ausente

1.3.
1.3.1.

20-29
30-39
40-49

5
9
8

50-59
60-69

10
12

70-79
80-89
90-99

11
8
3

Medidas de dispersi
on
Datos no agrupados

Las medidas de tendencia central no son suficientes siempre. Una descripcion mas completa
puede obtenerse determinando que tan separados estan las observaciones de la media.
La opcion mas sencilla es calcular el rango esto es obtener el valor mas peque
no y el maximo
el rango es la resta de estos valores, podemos calcular que tan separados estan de la media.
Como podemos calcular el rango no nos proporciona mucha informacion.

1.3.2.

Varianza y desviaci
on est
andar

La varianza es el promedio de las diferencias de las observaciones y la media elevadas al cuadrado.


La formula de la varianza poblacional:

(X1 ) + (X2 ) + + (XN )


=
N

Desviacion estandar poblacional: = 2 .


2 =

N
X
i=1

(Xi )2
N

Ejemplo 1.3.1
Marcos Reyes es gerente de una empresa. Recientemente Marcos estaba interesado en las tasas de
endimiento de los ultimos cinco anos 12,10,13,9 y 11 %.
Calcula, media, varianza y desviacion estandar.

SOLUCION:
Se trata de una poblacion pues solo interesan los ultimos cinco anos:
11


1.3. MEDIDAS DE DISPERSION
12 + 10 + 13 + 9 + 11
= 11 para calcular la varianza
5
(12 11)2 + (10 11)2 + (13 11)2 + (9 11)2 + (11 11)2
2 =
=2
5
y finalmente la desviacion estandar = 2 1.4142.

Cuando se trata de una muestra la media muestral se denota con x y la desviacon estandar
muestral se denota con s.
La formula para x es la misma que para como ya vimos, pero la varianza muestral cambia a
N
X
2
(Xi X)
2
2
2

(X1 X) + (X2 X) + + (XN X)


= i=1
s2 =
n1
n1
donde n es el n
umero de elementos de la muestra. Una formula mas sencilla de calcular estas
sumas de cuadrados es: !
2
n
n
X
X
2
n
xi
xi
s2 =

i=1

i=1

n(n 1)

Ejemplo 1.3.2
El senor Reyes desea determinar la estabilidad de la desviacion estandar del precio de cierre diario de
dicha accion. Al revisar las paginas financieras Reyes sabe que la accion ha cotizado en la bolsa durante muchos meses. Reyes ocupa una muestra aleatoria de 7 das dada en dolares: 87,120,54,92,73,80
y 63.

SOLUCION:
Claramente se trata de una muestra.
87
+
120 + 54 + 92 + 73 + 80 + 63

X=
= 81.29
7
la varianza muestral es:
7
X
2
(Xi X)
s2 =

i=1

= 465.9 y finalmente la desviacion estandar muestral s = 21.58.


71
Ejercicio 1.3.1. Se utilizan dos procesos para producir discos de computadora. Han surgido
problemas con respecto a las varaciones en los tama
nos de dichos discos. Con base en los datos
de muestra aqui observados, de ocho tama
nos de disco. Determina cual proceso tienen una
menor desviaci
on estandar.

12

Proceso 1

Proceso 2

3.41 3.22

3.81 3.26

3.74 3.06
3.89 3.65
3.65 3.33

3.26 3.79
3.07 3.14
3.35 3.51


1.3. MEDIDAS DE DISPERSION

1.3.3.

Datos agrupados

Si los datos estan agrupados en una tabla de frecuencia, la varianza y la desviacion estandar
pueden calcularse como:
Varianza de datos agrupados
s2 =

2
f M 2 nX
n1

y la desviaci
on est
andar s = s2 .
Usamos nuevamente la tabla del RTP y escribimos la informacion que nos falta para calcular
la desviacion estandar.
clase

fM

M2

fM2

30-39 3 34.5 103.5 1190.25 3570.75


40-49 7 44.5 311.5 1980.25 13861.75
50-59 18 54.5 981 2970.25 53464.5
60-69 12 64.5
70-79 8 74.5

774
596

4160.25
5550.25

49923
44402

80-89

169

7140.25

14280.5

2
50

84.5

2935

179502.5

Ya habamos calculado:
g = f M = 2935 = 58.7
X
n
50
Ahora sustituimos las sumas correspondientes en la formula de la varianza:
179502.5 50(58.7)2
s2 =
= 147.31
50 1
y la desviacion estandar
s = 12.14.
Ejercicio 1.3.2. Usamos ahora el ejercicio 1.2.2 de ausentismo. Si el a
no pasado la desviaci
on
estandar fue de 14.7. Calcula la varianza y la desviacion estandar del a
no en curso y comparala
con la del a
no anterior.
Existen otras medidas de dispersion llamadas cuartiles y percentiles. Los cuartiles dividen el
conjunto en 4 partes, esto es el primer cuartil se trata del dato que tiene por debajo el 25 % de
las observaciones, el segundo cuartil corresponde a la mediana que es el 50 %, y el tercer cuartil
corresponde al 75 %.
Cuando hablamos de percentiles se escoge un porcentaje, digamos 85 % y lo que se hace es
encontrar el dato cuya posicion indica que el 85 % de los datos estan por debajo de dicho dato.

13


1.3. MEDIDAS DE DISPERSION

14

Probabilidad
2.1.

Espacio muestral

Definici
on 2.1. Un experimento es cualquier operacion cuyo resultado no puede predecirse con
exactitud.

Ejemplo 2.1.1

Lanzar una moneda


Lanzar un dado
Partido de futbol
Numero ganador de la Lotera Nacional
Definici
on 2.2. El espacio muestral (denotado por S) de un experimento es el conjunto de
todos los resultados posibles del experimento. El espacio se dice discreto cuando podemos contar
sus elementos no importa si es finito o infinito, en cambio el espacio muestral es continuo
cuando se trata de un intervalo de los n
umeros reales.

Ejemplo 2.1.2

15

2.1. ESPACIO MUESTRAL


Experimento

Espacio muestral

Tipo

Lanzar una moneda

S = {aguila, sol}

discreto

S = {perdido, ganado, empatado}

discreto

Lanzar un dado
Resultado de un partido de futbol
Total de goles en un partido
Medida del grosor de un conector
de forma T hecho de plastico
Chip cumple con las especificaciones

S = {1, 2, 3, 4, 5, 6}

discreto

S = {0, 1, 2, 3, 4, 5, 6, . . . }

discreto

S = {x : x R+ } = (0, )

continuo

S = {s,no}

discreto

S = {x R : 10 < x < 11}

continuo

S = {ss,sn,ns,nn}

discreto

S = {n,sn,ssn,sssn,...}

discreto

Medida del grosor de un tubo


se sabe que la maquina los
produce entre 10 y 11 mm
Dos conectores cumplen con
las especificaciones
Resultados de especificaciones
de conectores hasta que uno falla

Ejercicio 2.1.1. Determina en cada experimento el espacio muestral S y el tipo de espacio.


1. Escoger una carta de un mazo de baraja americana.
2. Escoger el n
umero ganador de un sorteo con 1000 boletos numerados.
3. Estatura exacta de los estudiantes de la UACM.
4. Resultado de calidad de un producto
5. Resultados de un examen de 3 preguntas con dos incisos.
Se puede tener un experimento donde se escogen objetos donde se puede tener la caracterstica
de escoger con reemplazo esto es se regresa el objeto elegido para participar en la siguiente
eleccion o sin reemplazo, un objeto ya elegido no participa en la siguiente eleccion.

Ejemplo 2.1.3

1. Experimento: Formar palabras de 2 letras el conjunto {a, b, c}


Caso 1. Sin reemplazo S = {ab, ac, ba, bc, ca, cb}
Caso 2. con reemplazo S = {aa, ab, ac, ba, bb, bc, ca, cb, cc}
16


2.2. ELEMENTOS DE CALCULO
COMBINATORIO
Sin importar el caso se tiene que es discreto.
2. Se tienen 3 mensajes de correo electronico, tenemos que llegan puntuales (p) o tarde (t).
S = {ppp, ptt, ppt, ttt, tpp, ttp, ptp, tpt}
Ejercicio 2.1.2. Una consecionaria vende vehculos con equipo al gusto del cliente las opciones
son:
Automatico o estandar
Con aire acondicionado o sin aire acondicionado
Radio, Radio CD, Radio CD y MP3
Rojo infierno, verde metalico, azul acero y blanco mate.
Determina el espacio muestral de todos los vehculos posibles. Cuantos son?

2.2.

Elementos de c
alculo combinatorio

Muchas veces no estamos interesados precisamente en la lista del espacio muestral discreto y
finito, sino en la cantidad de elementos de este espacio muestral tiene.

2.2.1.

Principio de multiplicaci
on

Teorema 2.1. Principio de multiplicaci


on Si puede realizarse una primera operacion o seleccion de n maneras, y luego puede realizarse una segunda operacion o seleccion en m maneras.
Entonces pueden realizarse ambas operaciones de n m maneras.

Ejemplo 2.2.1

1. Para saber la cantidad de vehculos posibles notamos lo siguiente, Transmision=2 maneras,


Aire acondicionado=2 maneras, Radio=3 maneras, Colores=4 maneras.
Por el principio de la multiplicacion tenemos que son: 2 2 3 4 = 48. Es decir, son 48
autos posibles.
2. Cuantos atuendos diferentes son posibles? Si se tienen 3 pantalones, 4 camisas y 2 corbatas.
Nuevamente por el principio de multiplicacion tenemos 3 4 2 = 24 24 atuendos distintos.
17


2.2. ELEMENTOS DE CALCULO
COMBINATORIO
3. Cuantas placas de automovil para el Distrito Federal pueden armarse?
Sabemos que tienen 3 letras y 3 numeros para cada una de las letras tenemos 27 maneras, para
cada uno de los numeros tenemos 10 dgitos posibles, aplicando el principio de multiplicacion
tenemos 27 27 27 10 10 10 = 19683000 placas posibles.
4. Cuantos numeros hay de la lotera nacional que no repiten dgitos? Sabemos que la lotera
nacional imprime boletos de 5 dgitos, entonces para el primer dgito tenemos 10 maneras,
para el segundo ya no tenemos 10 maneras pues no queremos que se repita el primero as que
son 9, para el tercero son 8 finalmente tenemos 10 9 8 7 6 = 30240.
Ejercicio 2.2.1.
1. Cuantos n
umeros telefonicos de 8 cifras hay que empiecen con 1?
2. Cuantas placas del distrito federal tienen vocales?
3. Cuantos n
umeros de la loteria nacional tienen solo dgitos pares que no se repiten?
Definici
on 2.3. El factorial de n denotado por n!. Es el resultado del producto de n y todos
los enteros menores a n.
n! = n(n 1)(n 2) 5 4 3 2 1

Propiedades
i. n(n 1)! = n!
ii. (n 1)! =

n!
n

iii. 0! = 1

Ejemplo 2.2.2

a) 5! = 120
88!
88 87 86 85!
=
= 88 87 86 = 658416
85!
85!
1!
=1
c) 0! =
1

b)

d) 18! = 6.402D + 15
18


2.2. ELEMENTOS DE CALCULO
COMBINATORIO

2.2.2.

Permutaciones

Definici
on 2.4. Una permutacion es un arreglo de n smbolos en un orden definido.

Ejemplo 2.2.3

a) Cuantas permutaciones de 3 letras se obtienen del conjunto A = {a, b, c}? {abc, acb, bac, bca, cab, cba}
En total son 6.

b) Cuantas permutaciones de 2 letras? {ab, ac, ba, bc, ca, cb} En total son 6.
P (n, r) denota el numero de permutaciones de n smbolos en arreglos de r posiciones. Y la formula
es:
P (n, r) =

n!
(n r)!

As en el primer caso tenemos que son tres smbolos en palabras de tres letras. Entonces
n=r=3y
3!
3!
=
= 3! = 6.
P (3, 3) =
(3 3)!
0!
En el segundo problema se trata de tres smbolos en palabras de dos letras. Entonces n = 3 y
r = 2 sustituyendo en la formula tenemos
3!
3!
P (3, 2) =
=
= 6.
(3 2)!
1!
Si se quiere hacer una permutacion con de n simbolos donde k estan repetidos la formula
correspondiente es:
P =

n!
n1 ! n2 ! nk !

donde ni es el n
umero de veces que se repite el smbolo i.

Ejemplo 2.2.4
Cuantas palabras distintas se obtienen con aabb? Notamos n = 4 y son dos simbolos los que
4!
= 6. Podemos verificar esto
se repiten n1 = 2 y n2 = 2 sustituyendon en la formula P =
2!2!
{aabb, abab, abba, baab, baba, bbaa}.
19


2.2. ELEMENTOS DE CALCULO
COMBINATORIO

2.2.3.

Combinaciones

Ahora que pasa cuando no nos interesa la posicion, esto es cuantas selecciones de dos letras puedo hacer de {a, b, c}, notemos que {a, b} es la misma eleccion que {b, a} porque aqu el orden no
importa, pues notamos que se eligieron las mismas letras. As tenemos que {{a, b}, {a, c}, {b, c}},
esto es son solo tres posibles selecciones de tres letras.
Definici
on 2.5. Una combinacion es una seleccion de r objetos de un conjunto de n elementos
sin importar el orden.
El n
umero de combinaciones se obtiene a partir de el n
umero de permutaciones entre el factorial
del n
umero de objetos de la seleccion.
P (n, r)
n!
C(n, r) =
=
=
r!
(n r)!r!

n
r

Verificamos esto con el ejemplo anterior, para el cual ya habiamos calculado que P (3, 2) = 6
como se trata de r = 2 obtenemos que
6
= 3.
C(3, 2) =
2!
Propiedades
n

i.

n
n

ii.

!
!

=1

iii.

n1

=1

iv.

nr

!
!

=n

n
r

Ejemplo 2.2.5
10
8

10!
10!
=
=
= 45
8!(10 8)!
8!2!

75
14

75!
= 5.607D + 14
14!61!

Ejemplo 2.2.6
Cuantas manos distintas de pokar hay?

SOLUCION:
Sabemos que una mano de pokar tiene 5 cartas y para una mano no importa la
posicion pues se trata de una seleccion de 5 cartas. Y como el mazo tiene 52 cartas, se trata de
20

2.3. EVENTOS
52!
=
una combinacion de 5 de 52 objetos. Sustituimos en la formula y obtenemos: C(52, 5) =
5!47!
2598960.
Cuando resolvemos problemas debemos determinar si se trata de una permutacion (importa
el orden y se trata de un arreglo), una combinacion (no importa el orden se trata de una
seleccion) o simplemente se debe utilizar el principio de la multiplicacion (importa el orden
pero hay elementos repetidos).
Ejercicio 2.2.2.
1. Cuantas palabras de 9 letras se pueden hacer de aabbbcccc?
2. Cuantas combinaciones hay del melate si se trata de escoger 6 n
umeros del 1 al 56?
3. Cuantas placas de transportistas se pueden hacer si se componen de 4 n
umeros sin repetir
y 2 letras sin repetir?
4. Cuantos n
umeros telefonicos de 8 cifras de n
umeros pares hay?
5. En una unidad habitacional se requiere formar una comisi
on de 5 para ir a la delegaci
on
y solicitar el cambio de el alumbrado p
ublico. Cuantas comisiones se puden formar si se
trata de 100 departamentos?

2.3.

Eventos

Definici
on 2.6. Un evento o suceso es un subconjunto del espacio muestral.

Ejemplo 2.3.1

a) El espacio muestral de lanzar una moneda es S = {A, S} digamos aguila o sol. Los eventos
pueden ser: E1 = {A} esto es cae aguila y otro puede ser E2 = {S} que es cae sol.
b) En el ejemplo de tirar un dado un evento puede ser caiga un numero par Ep = {2, 4, 6}.

2.3.1.

Operaciones con eventos

Como los eventos son conjuntos haremos un repaso de conjuntos.


21

2.3. EVENTOS
Definici
on 2.7. La cardinalidad de un conjunto o evento es el n
umero de elementos de dicho
evento. La notacion es #(A).
Del ejemplo anterior tenemos
#(E1 ) = 1

#(Ep ) = 3

#(E2 ) = 1

Tambien tenemos que #() = 0

Definici
on 2.8. La union de dos eventos es un evento que consiste de todos los reultados que
estan en E1 o en E2 .
E1 E2 = {x : x E1 o x E2 }
E1 E2 =
S
E1

E2

Figura 2.1: Union de eventos


Definici
on 2.9. La interseccion de dos eventos es un evento que consiste de todos los resultados
que estan en los dos eventos E1 y E2 .

E1 E2 = {x : x E1 y x E2 }
E1 E2 =
S
E1

E2

Figura 2.2: Interseccion de Eventos


22

2.3. EVENTOS
Definici
on 2.10. Dos eventos se llaman ajenos si
E1 E2 = .

S
E1

E2

Figura 2.3: Eventos ajenos


Si los eventos E1 , E2 y E3 son ajenos entre s y ademas S = E1 E2 E3 . Esto significa que
cubren completamente a S la representacion grafica cambia a:

Definici
on 2.11. El complemento de E1 es un evento que consiste de todos los resultados del
espacio muestral S que no estan en el evento E1 .
E1c = {x S : x 6 E1 }

23

2.3. EVENTOS

Ejemplo 2.3.2
Consideremos el espacio muestral donde se aceptan o se rechazan 2 artculos. S = {ss, sn, ns, nn}
son eventos de este espacio muestral

El evento se acepta al menos uno. E1 = {ss, sn, ns}


El evento se rechazan los dos. E2 = {nn}
El evento se acepta solamente uno de los dos E3 = {sn, ns}
E1 E2 = {ss, sn, ns, nn} = S La union de estos dos eventos da el espacio muestral completo.
E1 E2 =
E1c = {nn} = E2
E3c = {ss, nn}
El diagrama correspondiente a este espacio muestral y eventos es:

Ejercicio 2.3.1.
1. Haz el diagrama de Venn correspondiente a espacio muestral de la concesionaria considerando los siguientes eventos:
E1 = {x : x es un auto de color rojo infierno}
E2 = {x : x es un auto de color verde metalico}
E3 = {x : x es un auto de color blanco mate}
E4 = {x : x es un auto de color azul acero}
E5 = {x : x es un auto con transmision automatica}.
2. Se mide el tiempo necesario para que se realice una reacci
on qumica. Este experimento
puede ser modelado con el espacio muestral S = + . Sean los eventos E1 = {x : 1 x <
10} y E2 = x : 3 < x < 118. Calcula
24

DE PROBABILIDAD
2.4. FUNCION
a) E1 E2

c) E1c

b) E1 E2

d) E1c E2

Propiedades de cardinalidad
Sea S discreto y finito y E1 , E2 y E3 eventos del espacio muestral.
i. Como Ei S tenemos #(Ei ) #(S)
ii. Si E1 y E2 son ajenos #(E1 E2 ) = #(E1 ) + #(E2 ).
iii. #(E1 E2 ) = #(E1 ) + #(E2 ) #(E1 E2 )
iv. #(E1 E2 E3 ) = #(E1 ) + #(E2 ) + #(E3 ) #(E1 E2 ) #(E1 E3 ) #(E2 E3 ) +
#(E1 E2 E3 ).

Propiedades de conjuntos
Como hemos observado los eventos son conjuntos por lo cual nos conviene repasar algunas
propiedades las cuales puedes verificar utilizando diagramas de Venn.
i. (Ac )c = A
Propiedades conmutativas

iv. (A B) C = (A C) (B C)
v. (A B) C = (A C) (B C)
Leyes de DMorgan

ii. A B = B A
iii. A B = B A
Propiedades distributivas

2.4.

vi. (A B)c = Ac B c
vii. (A B)c = Ac B c

Funci
on de probabilidad

Definici
on 2.12. Sea S cualquier espacio muestral y E cualquier evento de este. Se llamara funci
on de probabilidad sobre el espacio muestral S a P (E) si satisface los siguientes
axiomas.
i. P (E) 0
ii. P (S) = 1
iii. Si para eventos ajenos E1 y E2 entonces P (E1 E2 ) = P (E1 ) + P (E2 ).
25

DE PROBABILIDAD
2.4. FUNCION
Si podemos contarlos notamos que estas propiedades corresponden a cardinalidad de la siguiente
forma:
P (E) =

#(E)
.
#(S)

Claramente cumple los axiomas utilizando las propiedades de cardinalidad.

Ejemplo 2.4.1
50 muestras de plastico son analizados. Se analizan tanto resistencia a golpes y la resistencia a

Resistencia a golpes
a rayones

Resistencia

rayones. Los resultados se resumen en la siguiente tabla.

alta
baja

alta
40
1

baja
4
5

Sea A el evento que denota a los elementos con alta resistencia a golpes y sea B el evento que
denota alta resistencia a rayones.
a) Que es Ac ? Son los elementos con baja resistencia a golpes
b) Que es B c ? Son los elementos con baja resistencia a rayaduras
c) Que es A B? son los elementos que tienen alta resistencia a golpes y rayaduras
d) Que es A B? son los elementos que tienen una alta resistencia en cualquiera de los dos
golpes o rayaduras

e) Hacer un diagrama de Venn con A y B. En este caso como no son ajenos.

f) P (A). En este caso sabemos que #(S) = 50 y que #(A) = 41 entonces P (A) =
26

41
= 0.82
50

DE PROBABILIDAD
2.4. FUNCION
g) P (B) P (B) =

44
#(B)
=
= 0.88
#(S)
50

h) P (A B c ) Nos preguntan por los que tienen alta resistencia a golpes y baja resistencia a
1
rayaduras leyendo de la tabla tenemos que es solo uno P (A B c ) =
= 0.02
50
i) P (A B) Son los que tienen alta en cualquiera de los dos golpes o rayaduras P (A B) =
45
= 0.9
50
9
j) P (Ac ) P (Ac ) =
= 0.18
50
Propiedades de la probabilidad
a) 0 P (E) 1
b) P () = 0
c) Si E1 E2 entonces P (E1 ) < P (E2 )
d) P (E c ) = 1 P (E)
e) P ((E c )c ) = P (E)
Teorema 2.2. Sea S un espacio muestral que contiene a dos eventos cualquiera A y B, entonces:
P (A B) = P (A) + P (B) P (A B).
Verificamos esto usando el ejemplo anterior donde ya tenemos calculados todos los valores
40
= 0.8, ahora que tenemos todos los
excepto P (A B), #(A B) = 40 entonces P (A B) =
50
valores sustituimos en P (A B) = P (A) + P (B) P (A B) P (A B) = 0.82 + 0.88 .8 = 0.9
valor que habiamos obtenido directamente.
Ejercicio 2.4.1.
1. Cual es la probabilidad de sacarse el melate?
2. Tabla de sellos en semiconductores clasificados por contaminacion y localizacion. A denota
el evento que el sello tiene altos niveles de contaminacion, C denota el evento de que la
contaminacion se localiza en el centro.
Contaminaci
on

Localizacion
centro orilla
baja
alta

514
112

68
246
27

2.5. PROBABILIDAD CONDICIONAL


a) P (A)
b) P (C)
c) P (A C)
d) P (A C)
3. Un sistema contiene dos componentes: A y B y se conecta de manera que este funciona si
cualquiera de los dos componentes funciona. Se sabe que la probabilidad de que A funcione
es 0.9 y la de B es 0.8 y la probabilidad de que ambos funcionen es 0.72. Determinar:
a) La probabilidad de que el sistema funcione.
b) La probabilidad de que el componente A falle.
c) La probabilidad de que los dos fallen.
d) La probabilidad de que A falle y B funcione.

2.5.

Probabilidad Condicional

Un evento puede estar condicionado a otro, imaginemos que tenemos en una bolsa 4 pelotas
una de color blanco, una de color verde, una roja y una azul. En principio sabemos que la
probabilidad de sacar la azul es de 0.25 ahora si ya se saco digamos la blanca como primera
pelota, cual es la probabilidad de sacar la azul dado que ya salio la blanca?, la probabilidad
1
es , pues cambio el evento y ahora el espacio muestral solo tiene 3 pelotas.
3
Definici
on 2.13. La probabilidad condicional de un evento B dado un evento A, denotado
por P (B|A), se calcula con
P (B|A) =

P (A B)
P (A)

con P (A) 6= 0

Tambien tenemos que si trabajamos con complementos


P (Ac |B) = 1 P (A|B).

Ejemplo 2.5.1
Consideremos nuevamente el ejemplo de las piezas de plastico. Recordamos que los eventos son A
alta resistencia a golpes y B alta resistencia a rayones.
28

Resistencia a golpes
a rayaduras

Resistencia

2.5. PROBABILIDAD CONDICIONAL

alta
baja

alta

baja

40
1

4
5

P (B|A) se traduce a cual es la probabilidad de dado que es una pieza de plastico tiene alta resistencia
a golpes se escoja con alta resistencia a rayones. Como A ya ocurrio vemos la tabla y estamos
trabajando con 41 piezas, de las cuales 40 tienen alta resiencia a rayones. Entonces P (B|A) =
40
= 0.97. Gracias a la definicion no es necesario que hagamos este razonamiento, simplemente
41
utilizamos la formula.
P (B|A) =

0.8
P (A B)
=
= 0.98
P (A)
0.82

Por lo regular P (A|B) 6= P (B|A) podemos verificarlo con el ejemplo:


P (A|B) =

P (A B)
0.8
=
= 0.91
P (B)
0.88

Regla de multiplicaci
on
i. P (A|B) P (B) = P (B|A) P (A)
ii. P (A B) = P (A|B) P (B) = P (B|A) P (A)
Ejercicio 2.5.1. A los habitantes de la Ciudad de Mexico se les hizo una encuesta con el
proposito de determinar el n
umero de lectores de La Jornada y el Universal. Los resultdos
fueron: 20 % leen el Universal, 16 % leen la Jornada, mientras que el 1 % lee ambos periodicos.
Si selecciona al azar a un lector del Universal cual es la probabilidad de que tambien lea la
Jornada?
Definici
on 2.14. Sean A y B dos eventos cualesquiera de un espacio muestral S. Se dice que
el evento A es independiente del evento B si P (A|B) = P (A).
Teorema 2.3. Si el evento A es independiente del evento B entonces se verifica una de las 3
relaciones siguientes:
1. P (A|B) = P (A)
2. P (B|A) = P (B)
3. P (A B) = P (A) P (B)
29

2.5. PROBABILIDAD CONDICIONAL


Definici
on 2.15. Si los eventos A, B y C son independientes si la probabilidad de todas
las intersecciones posibles es igual al producto de las probabilidades involucradas en dichas
intersecciones. Esto es: P (A B) = P (A) P (B), P (A C) = P (A) P (C), P (B C) =

P (B) P (C) y P (A B C) = P (A) P (B) P (C). Esta situacion se puede generalizar a n


eventos con las respectivas intersecciones de 2, 3, 4, , n 1, n eventos.

Ejemplo 2.5.2
El circuito ilustrado a continuacion solo opera si hay una trayectoria de dispositivos funcionales de
izquierda a derecha. La probabilidad de que cada dispositivo funcione se indica en la ilustracion.
Supon que los dispositivos fallan independientemente. Cual es la probabilidad de que el circuito
opere?

Cuando trabajamos con circuitos en serie se trata de de una interseccion pues para que funcione
deben funcionar todos, y cuando estan conectados en paralelo se trata de uniones pues para que
funcionen puede funcionar cualquiera.
Nombramos dispositivo A al de arriba y B al de abajo.
Para que funcione nos preguntamos P (A B) pues estan conectados en paralelo. P (A B) =
P (A)+P (B)P (AB) como son independientes podemos cambiar la interseccion por el producto.
P (A B) = P (A) + P (B) P (A)P (B) = 0.95 + 0.95 (0.95)(0.95) = 0.998
Ejercicio 2.5.2. Haz lo mismo en el siguiente circuito.
30

2.5. PROBABILIDAD CONDICIONAL

Regla de la probabilidad Total


Podemos involucrar a dos eventos A y B en la siguiente relacion de intersecciones:
A = (A B) A B c

No solo eso tenemos que P (A) = P (A B) + P (A B c ) as la regla de la probabilidad total es:


P (A) = P (A|B) P (B) + P (A|B c )P (B c )
Podemos generalizar a digamos n eventos ajenos Ei tales que S = ni=1 Ei :
P (A) = P (A|E1 )P (E1) + P (A|E2)P (E2 ) + + P (A|En )P (En )

Ejemplo 2.5.3
En la fabricacion de semiconductores, suponga que la probabilidad de que un chip sujeto a niveles de
contaminacion altos durante la fabricacion ocasione la falla de un producto es 0.1; la probabilidad
de que un chip sujeto a niveles de contaminacion medios durante la fabricacion ocasione la falla de
un producto es 0.01 y la probabiliad de que un chip sujeto a niveles de contaminacion bajos durante
31

2.6. TEOREMA DE BAYES


la fabricacion ocasione la falla de un producto es 0.001. En una corrida particular de produccion:
20 % de los chips estan sujetos a niveles altos, 30 % a niveles de contaminacion medios y 50 % a
niveles de contaminacion bajos. Cual es la probabilidad de que un producto que use uno de estos
chips falle?

SOLUCION:
Para resolver este problema debemos identificar que nos estan preguntando, esto
es la probabilidad de que falle el producto, lo que nos da el primer evento y con la primera lectura
identificamos los demas:
F : el producto falla.
A: el producto estuvo sometido a niveles altos de contaminacion.
M: el producto estuvo sometido a niveles medios de contaminacion.
B: el producto estuvo sometido a niveles bajos de contaminacion.
Podemos ademas hacer el diagrama de Venn correspondiente:

Despues obtenemos los datos correspondientes: P (F |A) = 0.10, P (F |M) = 0.01, P (F |B) = 0.001,

P (A) = 0.2, P (M) = 0.3 y P (B) = 0.5.

P (F ) = P (F |A)P (A) + P (F |M)P (M) + P (F |B)P (B) =


(0.10)(0.2) + (0.01)(0.3) + (0.001)(0.5) = 0.024

2.6.

Teorema de Bayes

Teorema 2.4. Sean n eventos ajenos Ei y el evento A entonces usando la regla de probabilidad
total y la de la multiplicacion.
P (E1 |B) =
P (B|E1 )P (E1 )
P (E1 B)
=
P (B)
P (B|E1 )P (E1 ) + P (B|E2 )P (E2) + + P (B|En )P (En )
32

2.6. TEOREMA DE BAYES

Ejemplo 2.6.1
Dado que un nuevo procedimiento medico ha demostrado ser efectivo para la deteccion temprana
de una enfermedad, se propone un estudio medico exhaustivo de la poblacion. La probabilidad de
que la prueba identifique correctamente a alguien que no padece la enfermedad como negativo es
0.95 y la probabilidad de que la prueba identifique correctamente a alguien con la enfermedad como
positivo es 0.99. La incidencia de la enfermedad en la poblacion general es 0.0001. Si te sometes a
la prueba y el resultado es positivo. Cual es la probabilidad de que padezcas la enfermedad?

SOLUCION:
Nuevamente empezando por la pregunta debemos tener cuidado pues se trata de
probabilidad condicional pues ya sucedio que el resultado es positivo y se pide la probabilidad de
padecer la enfermedad.
Eventos:
E: esta enfermo as E c : no esta enfermo
N: resultado negativo y N c : resultado positivo
Lo que nos piden calcular es P (E|N c ).
La informacion que nos dan es: P (N|E c ) = 0.95, P (N c |E) = 0.99 y P (E) = 0.0001. Utilizamos
el Teorema de Bayes
P (N c |E)P (E)
P (E|N c ) =
P (N c |E)P (E) + P (N c |E c )P (E c )

Como podemos ver nos faltan los datos P (E c ) y P (N c |E c ) podemos calcularlos pues son complementos de P (E) y P (N|E c ) podemos modificar la formula a
P (N c |E)P (E)
P (E|N ) =
.
P (N c |E)P (E) + (1 P (N|E c ))(1 P (E))
c

Sustituimos los datos y obtenemos:


P (E|N c ) =

(0.99)(0.0001)
= 0.002
(0.99)(0.0001) + (1 0.95)(1 0.0001)

La probablidad de que estes enfermo es del 0.2 %.


Ejercicio 2.6.1.
a) Supon que la probabilidad de que una oblea contenga una partcula de contaminacion grande
es 0.01 y que las obleas son independientes; es decir, la probabilidad de que una oblea contenga
una partcula grande no depende de las caractersticas de las obleas restantes. Si se analizan
15 obleas, cual es la probabilidad ninguna tenga particulas grandes?
33

2.6. TEOREMA DE BAYES


b) La probabilidad de que la batera de un automovil sometida a alta temperatura en el compartimiento del motor tenga una corriente de carga baja es 0.7. La probabilidad de que la batera
este sometida a alta temperatura en el compartimiento del motor es 0.05. Sea que A denota
el evento de que una batera tiene una corriente de carga baja y sea que B denote el evento
de que la batera esta sometida a alta temperatura en el compartimiento del motor. Cu
al es
la probabilidad de que una batera tenga una corriente de carga baja y este sometida a alta
temperatura en el compartimiento del motor?
c) Durante los u
ltimos a
nos se ha escrito mucho sobre la posible relacion entre fumar y el
cancer pulmonar. Supon que en un centro medico, de todos los fumadores de quienes se
sospechaba tenan cancer pulmonar, el 90 % lo tena, mientras que u
nicamente el 5 % de los
no fumadores lo padeca. Si la proporcion de fumadores es de 0.45, cual es la probabilidad
de que un paciente con cancer pulmonar seleccionado al azar sea fumador?

34

Variables Aleatorias
3.1.

Definici
on y propiedades de las variables aleatorias
discretas

Definici
on 3.1. Una variable aleatoria es una funcion que asigna un n
umero real a cada
resultado del espacio muestral de un experimento aleatorio. La variable aleatoria se denota por
la letra X.
Por ejemplo el experimento resultado de un partido de futbol
S = {ganado, perdido, empatado}
la variable aleatoria que se usa es asignar 3 puntos si gana, 1 punto si empata y 0 si pierde y
de esta forma acumula puntos cada equipo. En este caso la variable aleatoria es X = {3, 0, 1}
Al igual que con los espacios muestrales, hay dos tipos de variables aleatorias: discretas y
continuas. Una variable aleatoria discreta tiene un rango finito o infinito de n
umeros que
podemos contar, en cambio una variable aleatoria continua tiene como rango un intervalo
de los n
umeros reales.

Ejemplo 3.1.1

1. Un sistema de comunicacion de voz de un negocio tiene 45 lneas externas. En un tiempo


particular se observa el sistema y algunas lneas estan en uso. Sea X la variable aleatoria que
denota el numero de lneas en uso. Cual es el rango de X y de que tipo es?
2. En un proceso de fabricacion de semiconductores, se prueban dos obleas de un lote. Cada
oblea se clasifica como pasa o falla. La probabilidad de que una oblea pase la prueba es de
0.8 y las obleas son independientes. Considera la variable aleatoria como el numero de obleas
que pasan. Determina:
35

DE PROBABILIDAD
3.2. DISTRIBUCION
a) Espacio muestral
b) Rango de X
c) Probabilidad de cada elemento de la variable aleatoria

SOLUCION:
1. X = {0, 1, 2, 3, 4, . . . , 45} y es discreta.
2. El espacio muestral es S = {pp, pf, f p, f f }
X = {2, 1, 0}
Tenemos el evento A: oblea pasa la prueba.
P (Ac Ac ) esto es las dos fallan es interseccion y son independientes podemos calcularlo con
P (Ac ) P (Ac ) = (0.2)(0.2) = 0.04
P (A A) = P (A)P (A) = (0.8)(0.8) = 0.64
P (A Ac ) = P (Ac A) = P (Ac ) P (A) = (0.2)(0.2) = 0.16
Entonces la probabilidad de la variable aleatoria hereda la probabilidad de los resultados del
espacio muestral.
P (X = 0) = 0.04 corresponde a las dos fallan P (Ac Ac )
P (X = 1) = 0.16 + 0.16 = 0.32 corresponde tanto a P (Ac A) como a P (A Ac ).
P (X = 2) = 0.64 relacionada con P (A A)
Ademas de preguntarnos por la probabilidad de cada uno de los elementos del rango de X
tenemos que es posible P (X 1) esto es cual es la probabilidad de que la variable aleatoria
sea mayor o igual que uno. Para esto tenemos dos opciones o es 1 o es 2. Entonces P (X 1) =
P (X = 1) + P (X = 2) = 0.32 + 0.64 = 0.96.

3.2.

Distribuci
on de probabilidad

Definici
on 3.2. La distribuci
on de probabilidad de una variable aleatoria X es la descripcion de las probabilidades asociadas con los valores posibles de X.
En el ejemplo anterior graficamente la distribucion de probabilidad que se obtiene es:
36

DE PROBABILIDAD
3.2. DISTRIBUCION

Ejemplo 3.2.1
Se lanzan dos dados, la variable aleatoria X es la suma de los dados.
a) Determina el Rango de X
b) Determina la distribucion de probabilidad de la variable aleatoria X
c) Haz la grafica de distribucion correspondiente

SOLUCION:
Sabemos que la suma de los dados va de 2 a 12 por lo cual X = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.
Notemos que P (X = 1) = 0 pues no es posible que al lanzar 2 dados la suma de 1.

Para calcular P (X = 2) notamos que esto solo es posible cuando cae 1 en los dos dados, sabemos
que el espacio muestral tiene 36 posibles resultados pues para cada dado son 6 maneras, y de estas
1
la pareja (1, 1) aparece solo una vez, por lo tanto P (X = 2) =
= 0.028.
36
Hacemos una tabla para ver como se obtienen cada una de las posibles sumas y la probabilidad
correspondiente:
37

DE PROBABILIDAD
3.2. DISTRIBUCION
i

parejas

Probabilidad

(1,1)

(1,2),(2,1)

(1,3),(2,2),(3,1)

(1,4),(2,3),(3,2),(4,1)

(1,5),(2,4),(3,3),(4,2),(5,1)

(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)

(2,6),(3,5),(4,4),(5,3),(6,2)

(3,6),(4,5),(5,4)

10

(4,6),(5,5)

11

(5,6),(6,5)

1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36

12 (6,6)
La grafica correspondiente a esta distribucion de probabilidad es la siguiente

Definici
on 3.3. Para una variable aleatoria X con valores posibles o rango x1 , x2 , x3 , . . . , xn
la funcion masa de probabilidad se define como
f (xi ) = P (X = xi ).
38

DE PROBABILIDAD
3.2. DISTRIBUCION

Por ejemplo, usando las parejas de los resultados de tirar dos dados.
f (1) = 0
3
36
6
f (7) =
36
3
f (10) =
36
f (4) =

1
36
4
f (5) =
36
5
f (8) =
36
2
f (11) =
36

f (2) =

2
36
5
f (6) =
36
4
f (9) =
36
1
f (12) =
36
f (3) =

Definici
on 3.4. La funci
on de distribucion acumulada de una variable aleatoria X denotada
por F (x), se define como
X
F (x) = P (X x) =
f (xi ).
xi <x

Nuevamente usando el ejemplo de los dados dan 2, 3, 4, 5 y 6


1
F (2) = f (2) =
36
3
F (3) = f (2) + f (3) =
36
6
F (4) = f (2) + f (3) + f (4) =
36
10
F (5) = f (2) + f (3) + f (4) + f (5) =
36
15
F (6) = f (2) + f (3) + f (4) + f (5) + f (6) =
36
Podemos ahorrarnos trabajo para calcular digamos F (11) usando la definicion tenemos que
F (11) = P (X 11)

en lugar de calcular todas estas sumas ahorramos trabajo usando el complemento esto es:
F (11) = P (X 11) = 1 P (X > 11) = 1 f (12) = 1

1
35
= .
36
36

Propiedades de la funci
on de distribuci
on acumulada
Para una variable aleatoria discreta X, F (x) satisface las siguientes propiedades:
i. F (x) = P (X x) =

f (xi )

xi <x

ii. 0 F (x) 1
iii. Si x y entonces F (x) F (y).
39

ESTANDAR

3.3. ESPERANZA, VARIANZA Y DESVIACION

3.3.

Esperanza, varianza y desviaci


on est
andar

Definici
on 3.5. La media, tambien conocida como valor esperado o esperanza de la variable
aleatoria discreta X denotada por o E(X) es:
= E(X) =

xf (x)

xX

Ejemplo 3.3.1
Seguimos con el ejemplo de los dados, si jugamos turista el valor esperado sera el resultado de:
 
 
 
 
 
 
 
12
X
1
2
3
4
5
6
5
=
xf (x) = 2
+3
+4
+5
+6
+7
+8
+
36
36
36
36
36
36
36

 
 
 
 x=2
3
2
1
4
+ 10
+ 11
+ 12
=7
9
36
36
36
36
Definici
on 3.6. La varianza de una variable aleatoria discreta X denotada por 2 o V (X) se
define como
2 = V (X) =

xX

(x )2 f (x) =

xX

x2 f (x) 2 .

Definici
on 3.7. La desviacion estandar de la variable aleatoria discreta X es
1

= (V (X)) 2

Por u
ltimo
la varianza y la desviacion estandar del ejemplo de los dados.

 calculamos
1
(4(1) + 9(2) + 16(3) + 25(4)
V (X) =
36
+36(5) + 49(6) + 64(5) + 81(4) + 100(3) + 121(2) + 144(1)) 72 = 5.83
p

= V (X) = 5.83 = 2.42.


Ejemplo 3.3.2
Sea que la variable aleatoria X denote el numero de obleas de semiconductores que es necesario
analizar a fin de detectar una partcula grande de contaminacion. Supongase que la probabilidad de
que una oblea contenga una partcula grande es 0.01 y que las obleas son independientes. Determina:
a) La funcion de masa de probabilidad
b) La grafica de la funcion de masa
40

ESTANDAR

3.3. ESPERANZA, VARIANZA Y DESVIACION


c) La funcion acumulada de probabilidad
d) Valor esperado
e) Varianza y desviacion estandar.

SOLUCION:
En este caso tenemos que se trata de una variable aleatoria discreta pero infinita,
pues la oblea con la partcula grande de contaminacion puede aparecer en la primera muestra o en
la segunda etcetera. Por lo tanto la variable aleatoria X = {1, 2, 3, 4, 5, 6, 7, . . . }.

En este caso no podemos hacer una tabla para determinar que pasa con la probabilidad.
Empezamos con f (1) esto es cuando la partcula grande se detecta en la primera oblea. Como se
trata solo de una podemos decirlo directamente del enunciado. Esto es: f (1) = 0.01. En el caso

de f (2) no se detecta en la primera pero si en la segunda, como son independientes es el producto


f (2) = (0.99)(0.01), para f (3) = (0.99)2 (0.01). Con esto podemos decir que la funcion de masa
es f (x) = (0.99)x1(0.01).
La grafica que se obtiene:

0.014

0.012

0.010

0.008

0.006

0.004

0.002

0.000
0

10

15

20

25

Para calcular la funcion acumulada F , seguimos el mismo procedimiento F (1) = 0.01, F (2) =
f (1) + f (2) = 0.01 + 0.99(0.01) y F (3) = f (1) + f (2) + f (3) = 0.01 + 0.01(0.99) + 0.01(0.99)2.
Notemos que 0.01 es comun a todos y por lo tanto lo podemos factorizar, y ademas podemos
41

ESTANDAR

3.3. ESPERANZA, VARIANZA Y DESVIACION


reescribirlo como 0.01 = (1 0.99). As F (1) = 1 0.99, F (2) = (1 0.99)(1 + 0.99) = 1 0.992
y F (3) = (1 0.99)(1 + 0.99 + 0.992 ) = 1 + 0.99 + 0.992 0.99 0.992 0.993 = 1 0.993 .
Entonces F (x) = 1 0.99x .

Ahora para calcular el valor esperado utilizamos la formula =

xf (x) y tambien recordaremos

xX

1
si p < 1.
1p
i=1

X
X
x1
E(X) =
x(0.99) (0.01) = (0.01)
x(0.99)x1.
la serie geometrica

pi =

x=1

En este momento nos preocuparemos solo por la suma notamos que tenemos que

x(0.99)x1 =

x=1

1 + 2 0.99 + 3 0.992 +

La cual a si vez podemos reescribir como:

x(0.99)x1 =

x=1

1 +0.99 +0.992 +0.993 +


+0.99 +0.992 +0.993 +

+0.992 +0.993 +
+0.993 +

Notamos que la primera lnea se trata de la serie geometrica con p = 0.99 y la segunda tambien si
factorizamos 0.99, la tercera tambien si factorizamos 0.992 .
As obtenemos:

x(0.99)x1 =

x=1

=
=

Entonces:
(0.01)

X
1

As el valor esperado es 100.

1
10.99

1
1
+ 0.99 10.99
+ 0.992 10.99
+

1
(1 + 0.99 + 0.992 +
10.99


1
1
1
= (0.01)
2
10.99
10.99

x(0.99)x1 = (0.1)

0.993 + )

1
1
=
= 100.
2
(0.01)
0.01

El calculo de la varianza y la desviacion estandar lo veremos mas adelante.


Ejercicio 3.3.1. Estudios de mercado estiman que un nuevo instrumento para el analisis de
muestras de suelo sera de gran exito, con un exito moderado, o sin exito, con probabilidades
0.3, 0.6 y 0.1, respectivamente. Los ingresos anuales asociados con un producto de gran exito,
42

3.4. DISTRIBUCIONES DISCRETAS ESPECIALES


con un exito moderado o sin exito son de 10 millones, 5 millones y 1 millon, respectivamente.
Sea que la variable aleatoria X denote los ingresos anuales del producto.

1. La grafica de la distribucion de probabilidad de X.

2. Determinar la funci
on de masa de probabilidad de X.

3. Determinar la funci
on acumulada de probabilidad.

4. Valor esperado

5. Varianza.

3.4.

Distribuciones discretas especiales

Ahora la idea es identificar distribuciones y obtener para cada una: funcion de masa, grafica,
valor esperado, varianza y desviacion estandar.

3.4.1.

Distribuci
on Uniforme

Cuando tenemos que todos los elementos de una variable aleatoria discreta X tienen la misma
probabilidad, se trata de la distribucion uniforme. Sea X = {x1 , x2 , . . . , xn } la cual tiene n
elementos.
1
f (x) = p =
n
n
X
xi

E(X) =

i=1

n
n
X

V (X) = i=1
p
= V (X)

Esto es el promedio.
!2
n
X
2
xi
xi
i=1

n2

La grafica de esta distribucion con X = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} es:


43

3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

1.0

0.8

0.6

0.4

0.2

0.0
0

10

Ejemplo 3.4.1
Sea la variable aleatoria discreta X = {0.1, 0.5, 0.7, 0.8, 0.9, 1.1}. Si todos sus elementos tienen la
misma probabilidad. Determina funcion de masa, la media y la desviacion estandar.
1

SOLUCION:
Como tiene 6 elementos la funcion de masa es f (x) = .
6
Hacemos la tabla y obtenemos
xi

x2i

0.1 0.01
0.5 0.25
0.7 0.49
0.8 0.64
0.9 0.81
1.1 1.21
suma 4.1 3.41
44

3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

n
X

xi

4.1
= 0.683
6
vn
!2
u n
n
u X
X
un
x2i
xi
u
t i=1
i=1
i=1

6(3.41) (4.1)2
= 0.3184
36

Ejercicio 3.4.1. Sea que la variable aleatoria discreta X tiene una distribucion uniforme y se
compone de los enteros 0 x 15. Determina funcion de masa, media y varianza.

3.4.2.

Distribuci
on Bernoulli

Considera la inspeccion de un artculo u


nico salido de la lnea de esamble, tirar una moneda,
acreditar estadstica y probabilidad, tirar un penal, etcetera. En cada uno de estos casos tenemos
2 resultados posibles, en el artculo pasa o no pasa, sol o aguila, acreditar o reprobar, anotar o
fallar el penal.
A estos experimentos se les llama ensayo tipo Bernoulli, cuyo resultado es exito o fracaso. La
variable aleatoria discreta se compone de dos n
umeros digamos X = {0, 1} con f (1) = p y
f (0) = q pero como p + q = 1 podemos reescribir a q como q = 1 p.
As f (1) = p y f (0) = 1 p as obtnemos una formula mas general como f (x) = px (1 p)x1 .

Para calcular = 0(1 p) + 1(p) = p y la varianza se obtiene V (X) = 02 (1 p) + 12 (p) p2 =


p(1 p).
La distribucion de Bernoulli es un caso particular de la distribucion binomial que es el tema a
continuacion.

3.4.3.

Distribuci
on Binomial

Ahora en lugar de ser solo un intento son varios digamos n, entonces cuantos artculos pasaran
la inspeccion?, cuantas veces caera sol si tiro la moneda 3 veces?
En este caso tenemos que la variable aleatoria es X = {0, 1, 2, 3, 4, 5, . . . n} para el primer caso
que no nos dicen cuantos artculos son.
En el caso de las monedas pueden caer cero soles hasta 3: X = {0, 1, 2, 3}.

Para obtener la funcion de masa de esta distribucion hagamos el ejemplo de los volados, pero
en lugar de usar una moneda honesta, usamos una cargada, la probabilidad de sacar Sol es
p = 0.6. En la siguiente tabla dejamos expresada la probabilidad para
45

3.4. DISTRIBUCIONES DISCRETAS ESPECIALES


xi
x=0
x=1

Elementos
AAA
SAA, ASA, AAS

x=2
x=3

SSA, SAS, ASS


SSS

probabilidad
(1 0.6)3
3(0.6)(1 0.6)2

3(0.6)2 (1 0.6)
(0.6)3

La formula que cumple estos valores es:


f (x) =

donde

n
x

n
x

(p)x (1 p)nx

n!
son los llamados coeficientes binomiales.
x!(n x)!

Definici
on 3.8. Un experimento aleatorio que consta de n ensayos repetidos tales que los
ensayos son independientes, la probabilidad p del resultado de interes en cada ensayo permanece
constante. Se llama experimento binomial. Con:

Variable aleatoria
Func
on de masa

X = {0, 1, 2, 3, 4, 5, . . . , n}
!
n
f (x) =
(p)x (1 p)nx
x

Valor esperado

E(X) = np

Varianza

V (X) = np(1 p)

La grafica que sigue corresponde a la distribucion binomial con p = 0.6 y n = 10.


46

3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

0.5

0.4

0.3

0.2

0.1

0.0
0

10

-0.1

Ejemplo 3.4.2
La probabilidad de que un bit transmitido a traves de un canal de transmision digital se reciba con
error es 0.1. Supon ademas que los ensayos de transmision son independientes. Sea X el numero de
bits con error de cuatro bits transmitidos. Determina:
a) Variable aleatoria
b) funcion de masa
c) La probabilidad de que se reciban 2 bits con error, es decir, P (X = 2).
d) La probabilidad de que haya 3 errores o mas, es decir, P (X 3)
e) Valor esperado, Varianza, desviacion estandar.

SOLUCION:
a) La variable aleatoria es X = {0, 1, 2, 3, 4}. Y como nos interesa con error
p = 0.1 y n = 4.
47

3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

b) f (x) =

4
x

(0.1)x (1 0.1)4x =

c) f (2) = P (X = 2) =

4
2

d) P (X 3) = f (3) + f (4) =

4
x

(0.1)x (0.9)4x

(0.1)2 (0.9)42 =

4
3

4!
(0.1)2 (0.9)2 = 0.0486
2!2!
4
4

(0.1)3 (0.9)43 +

(0.1)4 (0.9)44 =

4!
(0.1)3 (0.9)1 +
3!1!

4!
(0.1)4 (0.9)0 = 4(0.1)3(0.9) + (0.1)4 = 0.0037
4!0!
e) E(X) = np = 4(0.1) = 0.4
f) V (X) = np(1 p) = 4(0.1)(1 0.1) = 0.36 y =

0.36 = 0.6.

Ejercicio 3.4.2. Cada muestra de aire tiene 10 % de probabilidad de contener una molecula
rara particular. Supon que las muestras son independientes con respecto a la presencia de la
molecula rara. Determina:
a) La probabilidad de que de 18 muestras, exactamente 2 contengan la molecula rara.
b) La probabilidad de que de 18 muestras, mas de 10 contengan la molecula rara.
c) Valor esperado, Varianza y desviacion estandar.

3.4.4.

Distribuci
on Geom
etrica

Ahora nos interesa el n


umero de ensayos necesarios hasta obtener el resultado deseado.
Definici
on 3.9. Sea que la variable aleatoria X denote el n
umero de ensayos independientes tipo Bernoulli necesarios hasta obtener el resultado deseado con probabilidad constante p.
Entonces X tiene una distribucion geometrica.
Variable aleatoria

X = {1, 2, 3, 4, 5, . . . }

Func
on de masa

f (x) = (p)(1 p)x1

Valor esperado

Varianza

48

1
p
1p
2 =
p2

3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

0.6

0.5

0.4

0.3

0.2

0.1

0.0
0

10

-0.1

Ejemplo 3.4.3
La probabilidad de que un bit transmitido a traves de un canal de transmision digital se reciba con
error es 0.1. Suponga ademas que los ensayos de transmision son independientes. Sea X el numero
de bits necesarios hasta que ocurra el primer error. Determina:
a) Rango de la variable aleatoria.
b) La probabilidad de que se requieran transmitir 5 bits para obtener un bit con error.
c) Numero de bits que se espera que se deben transmitir para encontrar el primer error.
d) Varianza.

SOLUCION:
a) X = {1, 2, 3, 4, . . . }
b) Notamos que p = 0.1 sustituimos en la formula P (X = 5) = f (5) = 0.1(1 0.1)51 =
0.1(0.9)4 = 0.066
49

3.4. DISTRIBUCIONES DISCRETAS ESPECIALES


c) Sustituimos en la formula =
d) V (X) =

1
= 10
0.1

1p
1 0.1
=
= 90
p2
(0.1)2

Ejercicio 3.4.3. Cada muestra de aire tiene 10 % de probabilidad de contener una molecula
rara particular. Supon que las muestras son independientes con respecto a la presencia de la
molecula rara. Determina:
a) La probabilidad de que se necesiten analizar exactamente 5 muestras de aire para encontrar
la partcula rara.
b) La probabilidad de que se necesiten analizar menos de 4 muestras de aire.
c) La probabilidad de que se necesiten analizar al menos 2 pero no mas de 5.
d) La probabilidad de que se necesiten analizar mas de 3.
e) Valor esperado
f ) Varianza

3.4.5.

Distribuci
on Poisson

Esta distribucion tiene que ver con conteo sobre un intervalo de los n
umeros reales, esto es por
ejemplo: se tiene que pasan en promedio 5 coches por minuto frente a la UACM. En este caso
el conteo fue 5 y el intervalo de los n
umeros reales es el minuto. Cual es la probabilidad de
que pasen 7 en 2 minutos? la descripcion de este caso lo hace la distribucion de Poisson pues
ahora en lugar de ser 1 minuto son 2 entonces lo que se esperara seran 10 coches.
La distribucion de Poisson lo primero que podemos describir es el valor esperado o media que
sera precisamente el promedio de conteos en dicho intervalo, para un minuto el valor esperado
es 5, para 2 minutos es 10, para 3 minutos es 15 etcetera, este valor esperado sera denotado
por . Ahora veamos la definicion formal de la distribucion de Poisson.
Definici
on 3.10. Un experimento aleatorio que consta de conteos del resultado deseado en un
intervalo, donde los conteos en subintervalos son independientes. Con promedio en un intervalo
dado tiene una distribuci
on llamada de Poisson:

50

Variable aleatoria

X = {0, 1, 2, 3, 4, 5, . . . }

Func
on de masa

f (x) =

Valor esperado

E(X) =

Varianza

V (X) =

e x
x!

3.4. DISTRIBUCIONES DISCRETAS ESPECIALES


La siguiente grafica corresponde a la distribucion de Poisson con = 2.3

Ejemplo 3.4.4
Se presentan imperfecciones aleatoriamente a lo largo de un alambre delgado de cobre. Sea que
X denote el numero de imperfecciones y sigue una distribucion de Poisson con una media de 2.3
imperfecciones por milmetro.
a) Determina la probabilidad de exactamente 2 imperfecciones en 1 milmetro de alambre.
b) Determina la probabilidad de exactamente 3 imperfecciones en 2 milmetros de alambre.
c) Determina la probabilidad de al menos una imperfeccion en 2 milmetros de alambre.
d) Determina la probabilidad de a lo mas 3 imperfecciones en 1 milmetro de alambre.
e) Valor esperado
f) Varianza
51

3.5. OTRAS DISTRIBUCIONES DISCRETAS

SOLUCION:
a) Como vamos a trabajar solo sobre un milmetro entonces = 2.3 y utilizamos
e2.3 2.32
la funcion de masa f (2) =
= 0.265
2!
b) Ahora trabajamos con 2 milmetros entonces duplicamos y obtenemos = 4.6 f (3) =
0.163

e4.6 4.63
=
3!

c) En este caso el calculo no es exacto usamos la desigualdad P (X 1). Como X tiene un numero
infinito de elementos utilizamos la propiedad de complemento:

P (X 1) = 1 P (X < 1) = 1 f (0)
e4.6 4.60
=1
0!
= 0.999
d) Nuevamente se trata de trabajar solo en un milmetro entonces = 2.3. Y nos preguntan
P (X 3) = f (0) + f (1) + f (2) + f (3)
e2.3 2.30 e2.3 2.31 e2.3 2.32 e2.3 2.33
=
+
+
+
0!
1!
2!
3!
= 0.799
e) = 2.3
f) 2 = 2.3
Ejercicio 3.4.4. La contaminacion constituye un problema en la fabricacion de discos de almacenamiento optico. El n
umero de partculas de contaminacion que ocurre en un disco optico
tiene una distribuci
on de Poisson y el n
umero promedio de partculas por centmetro cuadrado
de superficie del disco es 0.1.
a) Encuentra la probabilidad de que ocurran 12 partculas en 100 cm cuadrados del disco.
b) Encuentra la probabilidad de que ocurran cero partculas en 50 cm cuadrados del disco.
c) Determina la probabilidad de que 3 o menos partculas ocurran en 100 cm cuadrados.

3.5.
3.5.1.

Otras distribuciones discretas


Distribuci
on Binomial Negativa

Esta distribucion corresponde a la pregunta cuantos ensayos se necesitan para obtener r resultados deseados?
52

3.5. OTRAS DISTRIBUCIONES DISCRETAS


Definici
on 3.11. En una serie de ensayos tipo Bernoulli independientes, la probabilidad p del
resultado deseado, sea la variable aleatoria X denote el n
umero de ensayos hasta que ocurran
r de estos resultados deseados. Entonces X tiene una distribucion binomial negativa.
Variable aleatoria
Func
on de masa
Valor esperado
Varianza

X = {r, r + 1, r + 2, r + 3, r + 4, r + 5, . . . }
!
x1
f (x) =
pr (1 p)xr
r1
r
=
p
r(1 p)
2 =
p2

Ejemplo 3.5.1
Una empresa de reclutamiento encuentra que el 30 % de los aspirantes para determinado puesto
en la industria tienen conocimientos avanzados de programacion de computadoras. Supongase que
se tienen tres puestos en los que se necesitan conocimientos avanzados de programacion. Si se
seleccionan los solicitantes uno a uno en forma independiente y al azar, calcular:
a) La variable aleatoria X
b) La probabilidad de que se encuentre al tercer aspirante calificado en la quinta entrevista.
c) La probabilidad de que se necesiten a lo mas 6 entrevistas.
d) Cuantas entrevistas se esperan hacer?

SOLUCION:
a) Son r = 3 plazas entonces X = {3, 4, 5, . . . }
b) Notamos que p = 0.3 es la probabilidad de que tengan conocimientos avanzados de programacion.
P (X = 5) = f (5) =

51
31

4
2

0.33 (1 0.3)53 =

0.33 (0.7)2 = 0.0794

c)
P (X 6) = f (3) +
!
! f (4) + f (5) + f (6)
=

2
2
!

0.33 (0.7)0 +

0.33 (0.7)2 +

2
= 0.256

5
2

3
2
!

0.33 (0.7)1 +

0.33 (0.7)3

53

3.5. OTRAS DISTRIBUCIONES DISCRETAS


3
r
=
= 10.
p
0.3
Esto es se espera hacer 10 entrevistas.

d) =

Ejercicio 3.5.1. Supon que la probabilidad de que Shaquille ONeal anote una canasta es 0.6.
Supon que los tiros son eventos independientes, y sea que la variable aleatoria X denote el
n
umero de tiros hasta que anota 4 canastas. Calcula:
a) La probabilidad de que necesite exactamente 10 tiros.
b) La probabilidad de que necesite mas de 5 tiros.
c) El n
umero de tiros que se espera hasta obtener las 4 canastas.
Cada uno de los ensayos, cuestan tiempo o dinero. Podemos calcular ademas tiempos y costos
las funciones correspondientes. Las cuales podemos incorporar a las distribuciones pues estan
en funcion del n
umero de ensayos, para hacer estos calculos usamos el siguiente teorema.
Teorema 3.1. Para cualquier variable aleatoria X y constantes a y b cualesquiera tenemos
que:
E(aX + b) = aE(X) + b y V (aX + b) = a2 V (X)

Ejemplo 3.5.2
Un gran lote de bombas usadas contiene un 20 % de ellas que no sirven y necesitan reparacion. Se
manda a un mecanico con tres juegos de refacciones. Selecciona bombas al azar y las prueba una
tras otra. Si trabaja una bomba, prosigue con la siguiente. Si no trabaja, le instala uno de sus juegos
de refacciones. Supongase que tarda 10 minutos en probar si una bomba trabaja o no, y 30 minutos
en probar y reparar una bomba que no trabaja. Calcular el valor esperado y la varianza del tiempo
total que le llevara terminar con sus tres juegos.

SOLUCION:
Como va a seguir intentando hasta que se acaben sus 3 juegos de refacciones, se
trata de una distribucion binomial negativa con p = 0.2, r = 3 y X = {3, 4, 5, 6, . . . }. Pero si
encuentra una que no sirve le tomara otro rato repararla.
Si le toma x intentos en encontrar las tres bombas descompuestas. x 3 ocuparan solo su tiempo
de revision y 3 el tiempo de reparacion.
Esto es la funcion tiempo es: t(x) = 10(x 3) + 30(3) = 10x 30 + 90 = 10x + 60. Usamos el
teorema y metemos esta funcion en el valor esperado esto es:

3
E(t(x)) = E(10x + 60) = 10(E(x)) + 60 = 10
0.2
54

+ 60 = 210

3.5. OTRAS DISTRIBUCIONES DISCRETAS

(3)(0.8)
= 6000
0.22
Se espera que le tome 210 minutos y la varianza es de 6000 minutos cuadrados.
V (10x + 60) = 102 V (x) = 102

Ejercicio 3.5.2. Se examina a los empleados de un negocio de fabricacion de aislantes para ver
si hay asbesto en sus pulmones. Se pide a la empresa que mande a tres empleados cuyos resultados fueron positivos a un centro medico para mayores examenes. Si el 40 % de los empleados
tuvieron resultados positivos en la detencion asbesto en sus pulmones:
a) Calcular la probabilidad de que se deba analizar a diez empleados para encontrar a tres con
asbesto en sus pulmones.
b) Si cada analisis cuesta $200, calcular el valor esperado y la varianza del costo total de llevar
a cabo las pruebas para encontrar tres empleados con resultados positivos.
Otra distribucion discreta es la llamada hipergeometrica la cual ya no usa ensayos tipo Bernoulli
independientes. Si te interesa puedes consultar en la bibliografa.

55

3.5. OTRAS DISTRIBUCIONES DISCRETAS

56

4
Variable aleatoria continua
4.1.

Variables aleatorias continuas y sus propiedades

Definici
on 4.1. Se dice que una variable aleatoria X es continua si puede tomar un n
umero
infinito de valores posibles asociados con intervalos de n
umeros reales.

Definici
on 4.2. La funci
on f (x) es llamada funcion de densidad de probabilidad y cumple:

i. f (x) 0 para toda x X

ii.

f (x)dx = 1

iii. P (a X b) =

f (x)dx1
a

Consideremos la funcion f (x) = 0.3x2 + 0.1 cumple con las especificacines para ser una funcion
de masa en el intervalo [0, 2] y el area bajo la curva, es decir, la integral es igual con 1. Como
podemos apreciar en la siguiente figura:

Notemos que P (a < X b) = P (a X < b) = P (a < X < b)

57

4.1. VARIABLES ALEATORIAS CONTINUAS Y SUS PROPIEDADES

Definici
on 4.3. La funci
on de distribucion de una variable aleatoria X se define como:
F (b) =

f (x)dx = P (X b)

Definici
on 4.4. Suponga que X es una variable alatoria continua con funcion de densidad de
probabilidad f (x) entonces:
La media o el valor esperado de X es:
= E(X) =

xf (x)dx

La varianza:
2

= V (X) =

x2 f (x)dx 2

Ejemplo 4.1.1
La funcion de densidad de la variable aleatoria X de la vida util de una batera dado en cientos de
horas: (
1 x2
e
Si x > 0
2
f (x) =
0
Si x 0
a) Determina si se trata de una funcion de densidad de probabilidad.
58

4.1. VARIABLES ALEATORIAS CONTINUAS Y SUS PROPIEDADES


b) Obten una formula para la funcion de distribucion F (x).
c) Cual es la probabilidad de que dure menos de 200 horas?
d) Calcular la probabilidad que dure mas de 400 horas.
e) Determina la probabilidad de que la batera dure mas de 250 horas pero menos de 500.
f) Determina media.
g) Determina varianza.

SOLUCION:
a) Primero tenemos que calcular la integral y verificar que da 1. En este caso
tenemos una integral impropia:
Z b
Z


b
b
x
1 x
1 x
e 2 dx = lm
e 2 dx = lm e 2 |b0 = lm e 2 + e0 = 1 lm e 2 = 1
b
b 0 2
b
b
2
0
Z x

x
x
x
1 x
b) F (x) = P (X x) =
e 2 dx = e 2 |x0 = e 2 + e0 = 1 e 2
0 2
2

c) 200 horas corresponde a 2 cientos de horas por lo tanto P (X < 2) = F (2) = 1 e 2 = 0.63
4

d) 400 horas corresponde a 4 cientos de horas P (X > 4) = 1 P (X 4) = 1 (1 e 2 ) = 0.14


e) Esta probabilidad la podemos calcular de dos formas:
Z 5
x
5
2.5
1 x
i. P (2.5 < X < 5) =
= e 2 dx = e 2 |52.5 = e 2 + e 2 = 0.20
2
2.5


5
2.5
ii. P (2.5 < X < 5) = F (5) F (2.5) = 1 e 2 1 e 2 = 0.20
f) =
2

1 x
e 2
x
2



Z b


b
b
x2
x2
x
b
x2
2
dx = lm xe +
= lm xe 2e |0 = lm be 2 2e 2 (0
e
b

g) Al igual que el ejercicio anterior se usa integracion por partes y se obtiene V (X) =
2 = 4

x2 e 2 dx

Ejercicio 4.1.1. Sea que la variable aleatoria continua X denote el diametro de un agujero
taladrado en un componente metalico. El diametro especificado es 12.5 mm la mayora de las
perturbaciones aleatorias del proceso resultan en diametros mayores. Datos historicos indican
que la distribuci
on de X puede modelarse con la funcion de densidad de probabilidad f (x) =
20(x12.5)
20e
para x 12.5.
1. Verifica que se trata de una funcion de densidad.
59

4.1. VARIABLES ALEATORIAS CONTINUAS Y SUS PROPIEDADES


2. Determina F (x)
3. Un componente se desecha si tiene mas de 12.6 milmetros Cual es la probabilidad de
desechar un componente?
4. Que proporcion de componentes tiene entre 12.5 y 12.6 milmetros?
5. Determina
6. Determina V (X)
Como F (x) resulta de integrar la funcion de densidad f (x). f (x) se pude obtener derivando
F (x).
As f (x) =

d
dx

(F (x))

Ejemplo 4.1.2
El tiempo para que una reaccion qumica se complete (en milisegundos), se aproxima con la funcion
de distribuci
( on acumulada siguiente:
0
si x < 0
F (x) =
0.01x
1e
si x 0
a) Cual es la funcion de densidad?
b) Que proporcion de las reacciones se completa en menos de 200 milisegundos?
c) Que proporcion entre 100 y 300 milisegundos?
d) Cual es el tiempo esperado de la reaccion qumica?

SOLUCION:
a) La funcion de densidad f la obtenemos derivando la funcion de distribucion
acumulada F .
(
(
d0
si
x
<
0
0
si x < 0
dF (x)
dx
=
f (x) =
=
0.01x
d1e
dx
si x 0
0.01e0.01x si x 0
dx
b) P (X < 200) =

200

f (x)dx = F (200) = 1 e0.01(200) = 0.864

c) P (100 < X < 300) = F (300) F (100) = 1 e0.01(300) (1 e0.01(100) = 0.318


Z
Z
b
d) =
xf (x)dx =
x(0.01e0.01xdx = lm xe0.01x 100e0.01x 0 = 100.

Esto es el tiempo esperado es de 100 milisegundos.

60

4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

4.2.
4.2.1.

Distribuciones continuas especiales


Distribuci
on Uniforme

Definici
on 4.5. Una variable aleatoria continua X con funcion de densidad de probabilidad
1
si a x b tiene una distribucion uniforme.
f (x) =
ba
Z

1
1
1
dx =
x |ba =
(b a) = 1
ba
ba
ba
E(X) =

b+a
2

(b a)2
V (X) =
12

Ejemplo 4.2.1
Sea que la variable aleatoria continua X denote la corriente medida en un alambre delgado de cobre
en miliamperes. Supon que el rango de X es [0, 10 mA] y que tiene distribucion uniforme.
a) Determina: funcion de densidad, funcion acumulada, valor esperado, varianza y desviacion estandar.
b) Cual es la probabilidad de que una medicion de la corriente este entre 5 y 10?

SOLUCION:
a = 0 y b = 10
1
1
f (x) =
=
10
10
Z x 0
1
x x x
F (x) =
dx =
| =
10 0 10
0 10
10 + 0
E(X) =
=5
2
(10 0)2
= 8.33
V (X) =
12
= 2.887
10
5
Para el inciso b P (5 < X < 10) = F (10) F (5) =

= 0.5
10 10
Ejercicio 4.2.1. Supon que X tiene una distribucion continua uniforme en el intervalo [1.5, 5.5].
a) Determina: funci
on de densidad, funcion acumulada, valor esperado, varianza y desviaci
on
estandar.
b) P (X < 2.5)
61

4.2. DISTRIBUCIONES CONTINUAS ESPECIALES


c) P (2 < X < 4)
d) P (X 3)

4.2.2.

Distribuci
on Exponencial

El equivalente discreto a esta distribucion es la distribucion geometrica, ya que la distribucion exponencial es la distribucion de probabilidad del tiempo transcurrido hasta la primera
ocurrencia de un suceso de Poisson.
Definici
on 4.6. La variable aleatoria X que es igual a la distancia entre conteos sucesivos de
un proceso de Poisson tiene una distribucion exponencial con parametro > 0.
La funcioZn de densidad de probabilidad de X es f (x) = ex para x 0


1
E(X) =
x ex dx =

0
1
V (X) = 2

Por otro lado si se trata de la exponencial con media E(X) = entonces estoy partiendo de la
1
media la cual por la definicion tenemos que E(X) = = haciendo el despeje tenemos que

1
= y sustituyo adecuadamente en la integral.

Ejemplo 4.2.2
En una red de computadoras de una gran corporacion, el acceso de usuarios al sistema puede
modelarse como un proceso de Poisson con una media de 25 accesos por hora. Sea X denote el
tiempo en horas desde el principio del intervalo hasta el primer acceso.
a) Cual es la probabilidad de que no haya accesos en un intervalo de 6 minutos?
b) Cual es la probabilidad de tener el siguiente acceso este entre 2 y 3 minutos.
c) Determina el intervalo de tiempo tal que la probabilidad que no haya accesos en el intervalo sea
0.9.
d) Determina, el tiempo promedio hasta el siguiente acceso
e) La desviacion estandar

SOLUCION:
Notamos que = 25 por hora y pero notamos que las preguntas estan en minutos
25
5
entonces hacemos el cambio =
=
60
12
62

4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

a) P (X > 6) = 1 P (X 6) = 1
0.082



5
30
5 5x
12
x 6
30
12
12
e
dx = 1 e
|0 = 1 e
+ 1 = e 12 =
12

5
15
10
5 5x
e 12 dx = e 12 x |32 = e 12 + e 12 = 0.148
2 12
Z t
5
5
5 5x
e 12 dx = e 12 x |t0 = 1 e 12 t y ahora
c) P (X > t) = 0.9 esto es P (X t) = 0.1 0.1 =
0 12
despejamos t
5
1 e 12 t = 0.1
5
e 12 t = 0.9
5
t = ln 0.9
12


12
ln 0.9
t=

5
t = 0.253 minutos

b) P (2 < X < 3) =

d) E(x) = =

e) =

1
12
= 2.5
=
5
5
12

1
= 2.5

Ejercicio 4.2.2. Sea que X denote el tiempo entre la deteccion de una partcula rara en un
contador Geiger y suponga que sigue un proceso de Poisson con media de 75 por minuto.
a) Cual es la probabilidad de que se detecte una partcula en un lapso de 30 segundos despues
de activar el contador?
b) Determina la probabilidad de que detecte una partcula entre los 15 y los 45 segundos.
c) Determina x tal que P (X < x) = 0.9
d) media y desviaci
on estandar.

Ejemplo 4.2.3
Una refinadora de azucar recibe azucar morena a granel. La cantidad de azucar que puede procesar
la refinadora en un da se puede representar mediante una funcion exponencial con una media de 4
(mediciones en toneladas) por da.
a) Calcular la probabilidad de que se procesen mas de 2 toneladas en un da determinado.
63

4.2. DISTRIBUCIONES CONTINUAS ESPECIALES


b) Calcular la probabilidad de que se procesen entre 1 y 3 toneladas de azucar.
c) Calcular la probabilidad de que se procesen menos de tres toneladas.

SOLUCION:
En este caso nos dicen que = 4 entonces =
a) P (X > 2) = 1 P (X 2) = 1
b) P (1 < X < 3) =
c) P (X < 3) =

3
0

3
1

2
0

1
4

h
i2
2
1
1 1x
e 4 dx = 1 e 4 x = 1 + e 4 1 = 0.607
4
0


3
x 3
1
1 x
e 4 dx = e 4 1 = e 4 + e 4 = 0.306
4


x 3
3
1 x
e 4 dx = e 4 0 = e 4 + 1 = 0.528
4

Ejercicio 4.2.3. En una zona de Estados Unidos se pueden modelar las magnitudes de los
terremotos mediante una distribucion exponencial cuyo promedio es 2.4 en la escala de Richter.
Calcular la probabilidad de que el siguiente temblor que se presente en esa zona sea:
a) mayor que 3.0 grados de la escala de Richter
b) entre 2.0 y 3.0 grados en la escala de Richter.

4.2.3.

Distribuci
on Normal

Muchas encuestas o estadsticas tienen una distribucion normal, esto es en el centro se acumulan
la mayora de los datos, esta distribucion de datos tambien es conocida como la campana de
Gauss, un ejemplo de esto son las calificaciones, la gran mayora de los estudiantes de secundaria
sacan entre 7,8,9, pocos sacan 6 y pocos sacan 10.
Definici
on 4.7. Una variable aleatoria X con funcion de densidad de probabilidad
(x)2
1
e 22 para < x < )
f (x) =
2
E(X) = y V (X) = 2 tiene una distribucion normal con parametros y donde < <
y > 0.
Esta variable aleatoria tambien es denotada con X = N(, )

Ejemplo 4.2.4
Si la corriente en una tira de alambre sigue una distribucion normal, con una media de 10 mA y
una varianza de 4 mA2 esto es = 2.
(x10)2
1
e 222 la grafica correspondiente es:
La funcion de masa es f (x) =
22
64

4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

0.20

0.18

0.16

0.14

0.12

0.10

0.08

0.06

0.04

0.02

0.00
-5

10

15

20

Definici
on 4.8. A una variable aleatoria normal con = 0 y 2 = 1 esto es = 1 se le llama
variable aleatoria normal estandar se denota como Z = N(0, 1).
La grafica correspondiente es:

0.40

0.35

0.30

0.25

0.20

0.15

0.10

0.05

0.00
-4

-3

-2

-1

Como veremos no es necesario que calculemos la integral para esta funcion, pues toda la informacion se da en la tabla que se anexa. Para usarla entendemos que se tratan de los valores de
65

4.2. DISTRIBUCIONES CONTINUAS ESPECIALES


la funcion de distribucion acumulada de una variable aleatoria estandar que se denota como
(z) = P (Z z) =

1
1 2
e 2 u du
2

Observamos que la tabla tiene como columnas z y valores que van desde 0.09 hasta 0.00 del
lado negativo, del lado positivo tiene z y los valores desde 0.00 hasta 0.9.
Como renglones en la primer columna tenemos desde 3.9 hasta 0.0 del lado negativo y desde
0.0 hasta 3.9 del lado positivo. Lo demas son los valores que buscamos.

Ejemplo 4.2
P (Z < 1.32) Para encontrar el valor correspondiente buscamos 1.3 del lado positivo en el renglon,
despues nos movemos hasta la columna 0.02 esto es 1.32 = 1.3 + 0.02 y justo en la interseccion
del renglon 1.3 y la columna 0.02 encontramos el valor de la distribucion acumulada de la normal:
P (Z < 1.32) = 0.906582)
La grafica correspondiente es:

b) P (Z 1.53) = 0.936992
c) P (Z > 0.86) = 1 P (Z 0.86) = 0.194894
d) P (1.25 < Z < 0.37) = P (Z < 0.37) P (Z < 1.25) = 0.644309 0.105650 = 0.538659
e) P (Z 4.6) = 0 esto es practicamente cero
De estos ejemplos podemos desprender las siguientes propiedades:
66

4.2. DISTRIBUCIONES CONTINUAS ESPECIALES


Propiedades de la distribuci
on Normal Est
andar
I. P (Z > a) = 1 P (Z a) = P (Z < a)
II. P (a < Z < b) = P (Z < b) P (Z < a)
III. P (z < Z < z) = 1 2P (Z < z)

Ejemplo 4.2
Ahora queremos determinar z tal que P (Z < z) = 0.78 para esto buscamos en la tabla el valor
mas cercano a 0.78 esto es z = 0.77
b) P (z Z z) = 0.99 usando las propiedades tenemos que 1 2P (Z < z) = 0.99
1 0.99
= 0.005 esto es z = 2.58 por lo que
despejando tenemos que P (Z < z) =
2
concluimos que z = 2.58
Ejercicio 4.2.4. Usa la tabla para determinar las siguientes probabilidades
a) P (Z < 1.32)
b) P (Z < 3)
c) P (Z < 4.5)
d) P (Z 1.45)
e) P (Z < 6.1)
f ) P (Z > 2.15)
g) P (Z > 5)
h) P (2.34 < Z < 1.76)
i) P (Z 1.53)
j) P (Z 1.26)
Determinar z tal que
k) P (Z < z) = 0.9
l) P (z < Z < z) = 0.5
m) P (Z z) = 0.2
n) P (1.24 Z z) = 0.8
n
) P (z Z z) = 0.68
67

4.2. DISTRIBUCIONES CONTINUAS ESPECIALES


Proceso de estandarizaci
on
La tabla corresponde a la normal estandar esto es cuando = 0y 2 = 1. Pero si tenemos
que X es una variable aleatoria normal con E(X) = y V (X) = 2 . Al restar la media y
dividir esta resta entre la desviacion estandar obtenemos la variable aleatoria continua normal
estandar:
X
X
E(X)
Z=
podemos verificar que es normal estandar pues E(Z) = E(
)=
=

X
V (X)
2

= 0 y V (Z) = V (
)=
=
=1

2
2

Ejemplo 4.2.7
Suponga que las mediciones de corriente de una tira de alambre siguen una distribucion normal con
una media de 10mA y una varianza de 4(mA)2
a) Cual es la probabilidad de que una medicion exceda 13 mA?
b) Cual es la probabilidad de que una medicion de corriente este entre 9 y 11mA?
c) Que medicion exceden el 90 % de los casos?


13 10
X 10

2
2

=
SOLUCION:
a) P (X > 13) = 1 P (X 13) estandarizamos 1 P


3
1P Z
= 1 0.933193 = 0.066807
2


9 10
X 10
11 10
P (9 < X < 11) = P
<
<
2
2
 2
1
1
<Z<
=P
b)
2
2
= P (Z < 0.5) P (Z < 0.5) = 0.691462 0.308538
= 0.382924




x 10
x 10
X 10
= 0.9 P Z >
=
>
c) P (X > x) = 0.9 primero estandarizamos, P
2
2



2
x 10
x 10
1P Z
entonces P Z
= 0.1 buscando en la tabla obtenemos que
2
2
x 10
= 1.28 despejando tenemos que x = 2(1.28) + 10 = 7.44 por lo tanto el 90 % de las
2
mediciones exceden los 7.44mA
Ejercicio 4.2.5. El diametro de un eje propulsor de almacenamiento optico tiene una distribucion normal con una media de 0.2508 pulgadas y una desviacion estandar de 0.005 pulgadas.
Las especificaciones de los ejers son 0.2500 0.0015
68

4.2. DISTRIBUCIONES CONTINUAS ESPECIALES


a) Que proporcion de los ejes cumple con las especificaciones?
b) Cual es la probabilidad de que el diametro mida mas de 0.2512?
c) Que diametro exceden el 80 % de los casos?

4.2.4.

Otras distribuciones

En estas notas no nos ocuparemos de otras distribuciones continuas solo las mencionaremos:
La distribucion Gamma estas funciones modelan situaciones no simetricas como la duracion de bacterias, precipitaciones etcetera.
Distribucion ji-cuadrada 2 con grados de libertad. En estadstica, se usa el termino
grados de libertad que es el n
umero de observaciones menos el n
umero de parametros
desconocidos que se desean estimar con base a estas observaciones. Usaremos esta distribucion mas adelante para estimar la varianza 2 cuando tenemos n observaciones por lo
cual usaremos n 1 grados de libertad.
La distribucion Beta esta definida en el intervalo 0 < x < 1, esta distribucion se usa para
trabajar con 2 probabilidades llamadas y .
La distribucion de Weibull, esta se usa par tiempos de vida u
til de componentes o sistemas.
La distribucion t de Student con grados de libertad. Podemos decir que la distribucion
t de Student es una especie de version generalizada de la distribucion normal estandar,
la cual sera precisamente una distribucion t con grados de libertad. Esta distribucion
la ocuparemos para hacer estimaciones de la media .

69

4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

70

Estimaciones

La media muestral x es el promedio de los datos de la muestra. Pero es igual a ? Es mas


grande o mas peque
na que ? Que tanto estan alejadas? Esto es lo que vamos a trabajar en
este captulo.
Nuestro objetivo es estimar y 2 , media y varianza poblacionales, conociendo los valores
muestrales x y s2 . Hay diversos trabajos con otras distribuciones pero en esta unidad nos
enfocaremos u
nicamente a la distribucion normal.

5.1.

Teorema del Lmite Central

Teorema 5.1. Si se toma una variable aleatoria de tama


no n de una poblacion cuya media es
2

y su varianza es entonces el promedio X tiene una distribucion aproximadamente normal,


2
con media y varianza
.
n

X
es aproximadamente normal estandar.
Por el teorema anterior tenemos que

Esta aproximacion mejora a medida que aumenta el tama


no de la muestra.
Hagamos primero experimentos en el hipotetico caso de qeu conocemos y pero no x.

Ejemplo 5.1.1
Las resistencias a la fractura de determinado tipo de vidrio son en promedio 14 (miles de libras por
pulgada cuadrada) y tienen una desviacion estandar igual a dos.
a) Cual es la probabilidad de que la resitencia promedio de fractura de 100 piezas de este vidio sea
mayor que 14.5?
b) Determinar un intervalo que abarque la resistencia promedio de la fractura de 100 muestras de
este vidrio, con unaprobabilidad de 0.95.
71

5.1. TEOREMA DEL LIMITE CENTRAL



> 14.5 y que nos dan como datos

SOLUCION:
a) Notamos que nos estan preguntando P X
que = 14 y que = 2. Entonces podemos estandarizar, pues de acuerdo con el Teorema de
tiene una distribucion aproximadamente normal.
Lmite Central X
!


X
14.5

14
> 14.5 = P
P X
>
= P (Z > 2.5) = 1P (Z 2.5) = 10.993790 =

0.00621

100

b) P (z < Z < z) = 0.95 esto es 2P (Z z) 1 = 0.95 P (Z z) =


|z| = 1.96

Ahora resolvemos para x z =

. Despejando x = z

0.95 + 1
= 0.975
2

+ .

El intervalo se obtiene pues tenemos dos soluciones para z. Esto es:


 
 





2
2

( z
,+ z
) = (14 1.96 100 , 14 1.96 100 ) = (13.608, 14.392).
n
n
Ejemplo 5.1.2
Se ha observado durante mucho tiempo que una maquina determinada para llenar botellas, tiene una
varianza en las cantidades de llenado aproximadamente de 2 = 1 onzas cuadradas. Sin embargo,
el promedio de las onzas de llenado depende de un ajuste que puede cambiar de da a da, o de
operador a operador. Si en un da se llevan a cabo n = 25 observaciones de la cantidad (onzas) de
lquido servido, todas con el mismo ajuste de maquina.
a) Calcular la probabilidad de que el promedio muestral quede dentro de 0.3 onzas de diferencia
con respecto al promedio verdadero de la poblacion , para ese ajuste.
b) Cuantas observaciones se deben efectuar en la muestra para que x quede a menos de 0.3 onzas
de con una probabilidad de 0.95?

SOLUCION:
a) Tenemos que = 1, n = 25 y lo que nos estan preguntando es:
!


0.3
x
+ 0.3
0.3
0.3
<Z< 1
=
< <
=P
P ( 0.3 < x < + 0.3) = P

P (1.5 < Z < 1.5) =0.933193 0.066807 = 0.866386

b) En este caso me estan preguntando un valor simetrico que da dicha probabilidad esto es:
P (z < Z < z) = 0.95 Ahora le hacemos al reves y buscamos en la tabla que valores correspon0.3
den obteniendo z = 1.96 utilizando el inciso anterior tenemos que z = 1.96 = 1 despejamos


2

1.96
= 42.42.684444.
0.3
Redondeado necesitamos hacer 43 observaciones para que x quede a menos de 0.3 onzas de .

de la ecuacion anterior tenemos n =

72

5.1. TEOREMA DEL LIMITE CENTRAL


Con el inciso b del ejemplo anterior podemos obtener una formula para encontrar el n
umero de
observaciones necesario haciendo el despeje conveniente:
n=
Ejercicio 5.1.1.

z
x

2

1. Se ha encontrado que las mediciones de resistencia al cortante de las

soldaduras de punto tienen una desviacion estandar aproximada de 10 lb/pulg 2 . Si se


miden 100 soldaduras de prueba:
a) calcular la probabilidad aproximada de que la media muestral x quede a + 1 lb/pulg 2
del promedio verdadero de la poblacion.
b) cuantas soldaduras de prueba se deben tomar para que la probabilidad sea aproximadamente de 95 %?
2. Los resistores de cierto tipo tienen resistencias que en promedio son de 200 Ohms, con
desviaci
on estandar de 10 ohms. Se utilizan 25 de ellos en un circuito. Calcular la probabilidad de que la resistencia promedio de los 25 resistores este entre 199 y 202 ohms.
Definici
on 5.1. Un estimador es una medida estadstica que especfica como utilizar los datos
de la muestra para estimar un parametro desconocido de la poblacion.
Un estimador es una variable aleatoria a la cual le podemos calcular valor esperado y varianza.
= .
Definici
on 5.2. Un estimador es insesgado para estimar si E()
Definici
on 5.3. El sesgo se obtiene cuando el estimador no es insesgado y se calcula con
|.
|E()
Definici
on 5.4. Si se consideran todos los estimadores de al que tiene la menor varianza se
le llama estimador insesgado de varianza mnima.
Teorema 5.2. Si x1 , x2 , x3 , ..., xn es una muestra aleatoria de tama
no n de una distribuci
on
2
normal con media y varianza , entonces la media muestral x es un estimador insesgado de
varianza mnima de .
El estimador insesgado de varianza mnima de 2 es la varianza muestral s2 .
Cuando se reporta el valor numerico o estimacion puntual de un parametro, es conveniente
saber el error correspondiente.
Definici
on 5.5. El error estandar del estimador x es la desviacion estandar por el teorema del

lmite central tenemos = .


n
73

5.1. TEOREMA DEL LIMITE CENTRAL


s
En caso de que no conozcamos usamos s podemos obtener un error estimado estandar = .
n

Ejemplo 5.1.3
Un artculo del Journal of Heat Transfer (Trans. ASME, Secc. C, 96, p. 59) describa un nuevo metodo para medir la conductividad termica del hierro Armco. Utilizando una temperatura de
100 F y una alimentacion de energa de 550 W , se obtuvieron las siguientes 10 mediciones de la
conductividad termica (en Btu/hr pie F ):

41.60, 41.48, 42.34, 41.95, 41.86, 42.18, 41.72, 42.26, 41.81, 42.04
a) Calcular x y su error.

b) Comparar el error con x calculando que porcentaje representa el error con respecto a la media
obtenida. Es un buen estimador?

SOLUCION:
a)

x2

41.60

1730.56

41.48
42.34

1720.5904
1792.6756

41.95
41.86
42.18

1759.8025
1752.2596
1779.1524

41.72
42.26
41.81

1740.5584
1785.9076
1748.0761

42.04

1767.3616
2

x = 419.24 x = 17576.9442
x
nx2 ()2
= 41.924; s2 =
= 0.0807 y por lo tanto s = 0.284.
n
n(n 1)
0.284
s
=
Como no tenemos entonces podemos calcular el error estimado estandar = =
n
10
0.0898
n = 10; x =

(0.0898)(100)

100 =
= 0.214 %
x
41.924
Como el error es el 0.214 % del valor estimado podemos concluir que es un buen estimador.

b) Tenemos que

Ejercicio 5.1.2. Cinco temperaturas maximas de la ciudad de Florida en grados celsius fueron:
22, 20, 24,21 y 26.
74

5.2. INTERVALOS DE CONFIANZA


a) Calcular x y su error.
b) Comparar el error con x calculando que porcentaje representa el error con respecto a la
media obtenida. Es un buen estimador?

5.2.

Intervalos de Confianza

Los metodos de los intervalos de confianza deben dar valores entre los que puede estar el
parametro que se esta estimando con un indicador de confianza.
Definici
on 5.6. Suponga que X es una variable aleatoria cuya probabilidad depende de un
parametro desconocido . Dada una muestra aleatoria x1 , x2 , x3 , ...xn dos estadsticas L1 y L2
forman un intervalo de confianza del 100(1 ) % para si P (L1 L2 ) 1 . Sin
importar el valor desconocido de .

5.2.1.

Intervalos de confianza para con conocida

Sabemos que x tiene una distribucion aproximadamente normal con media y desviacion

estandar . El intervalo de confianza es:


n
x z 2 , x z 2

con (1 )100 % de confianza.


Como se obtiene esto, recordemos que lo que queremos es encontrar B tal que P ( B X)
+ B) = 1 . La grafica correspondiente es la siguiente:

1
B

2
+B

Esto es queremos encontrar un valor z 2 que corresponda a + B pero estandarizado lo llamaremos valor crtico.
75

5.2. INTERVALOS DE CONFIANZA

1
z

z
2

As estandarizado 1 = P z 2



+ z
z X
P X
2
2
n
n

z 2




z
= P z 2 X
=
2
n
n

Ejemplo 5.2.1
Se estudiaron 50 observaciones de la vida util de bateras de cierto tipo, se obtuvo un promedio
x = 2.266 y se sabe que la desviacion estandar es 1.935. Construye el intevalo de confianza con un
coeficiente de confianza igual a 0.95.

SOLUCION:
n = 50, x = 2.266, = 1.935. Como se quiere el 0.95 de confianza tenemos que

1 = 0.95, = 1 0.95 = 0.05 Entonces


= 0.025 y buscando en la tabla tenemos que
2
z 2 = 1.96.
Entonces
el intervalo de
es:





 confianza

1.935
1.935

, 2.266 + 1.96
= (1.730, 2.802)
x z 2 n , x + z 2 n = 2.266 1.96
50
50
Ejercicio 5.2.1. Para una muestra aleatoria de 50 mediciones de resistencia a la ruptura de
hebras de algodon, se encontro que la resistencia promedio era 210 gramos y la desviaci
on
estandar 18 gramos. Obtener un intervalo de confianza para la verdadera resistencia de ruptura
promedio de las hebras de algodon de este tipo, con una confianza igual a 0.90.
Ahora supongamos que queremos estimar el n
umero de observaciones para que x quede a B
de con un nivel de confianza 1 .
z
Esto es el intervalo que queremos es que el intervalo de confianza x 2 = x B. Esto es
n
 z 2
z 2
2
B = x entonces n =
n
B
76

5.2. INTERVALOS DE CONFIANZA

Ejemplo 5.2.2
Se desea estimar la distancia promedio que recorren los empleados de una empresa muy grande
camino a su trabajo. Los estudios anteriores de este tipo indican que la desviacion estandar de esas
distancias debe estar cercana a las 2 millas. Cuantos empleados deben muestrearse si la estimacion
debe quedar a menos de 0.1 millas del promedio verdadero, con un coeficiente de confianza de 0.95?

SOLUCION:
= 2, B = 0.1, 1 = 0.95, = 0.05 y
 z 2  1.96(2) 2
2
=
n=
= 1536.64.
B
0.1
Se deben muestrear 1537 empleados.

= 0.025 entonces z/2 = 1.96.

Ejercicio 5.2.2. La resistencia a la ruptura de los hilos tiene una desviacion estandar de 18
gramos. Cuantas mediciones de resistencia a la ruptura deben hacerse en el siguiente experimento, si la estimacion de la resistencia promedio de ruptura debe estar a menos de 4 gramos
de la resistencia verdadera a la ruptura, con un coeficiente de confianza igual a 0.90?

5.2.2.

Intervalo de confianza para con desconocida

En este caso tenemos una muestra de tama


no n y podemos calcular s si no nos dan . Ya no
usamos la distribucion normal cambiamos a la distribucion t de Student con n 1 grados de
libertad.
x
Ahora ocupamos la tabla t de Student T = s con n 1 grados de libertad.

Esta distribucion es aproximadamente igual a Z cuando n 30.

El intervalo de confianza en este caso es analogo a la normal.

Si x1 , x2 , ..., xn es una muestra aleatoria de una distribucion normal entonces el intervalo de


confianza es x t 2 sn con n 1 grados de libertad con una confianza de (1 ) %.

Ejemplo 5.2.3
El alambre pretensado para reforzar tubos de concreto se fabrica en rollos grandes. En una inspeccion
de control de calidad se prueban 5 muestras de un rollo y se mide su resistencia maxima a la tension,
RMT . Los resultados de las mediciones, en un rollo de lb/pulg 2 , fueron 253, 261, 258, 255 y 256.
Con estos datos, determinar una estimacion de intervalo de confianza del 95 % del RMT promedio
verdadero para el rollo que se muestreo.
77

5.3. INTERVALOS DE CONFIANZA PARA 2

SOLUCION:

x2

253
261
258

64009
68121
66564

255
256

65025
65536

x = 1283 x2 = 329255
5(329255) (1283)2
= 9.3 y s = 3.049.
n = 5, x = 256.6, s2 =
5(4)
= 0.05 entonces /2 = 0.025.
t/2 con 4 grados de libertad es: t0.025 = 2.776
9.3
s
x t 2 = 256.6 2.776 = 256.6 3.7859 = (252.814, 260.3859)
n
5
Ejercicio 5.2.3. La resistencia a la ruptura en el sentido de la urdimbre de 5 especmenes de
determinada tela, fue en promedio 180lb/pulg 2 con desviacion estandar muestral de 5lb/pulg 2.
Estimar resistencia de ruptura verdadera en el sentido de la urdimbre para telas de este tipo
con un intervalo de confianza de 95 %.

5.3.

Intervalos de confianza para 2

Ahora toca el turno a varianza 2 cuyo estimador es s2 si seguimos teniendo una distribucion
aproximadamente normal.
Teorema 5.3. Suponga que x1 , x2 , ..., xn es una muestra aleatoria X con media y varianza
n
X
(xi )2
2
Entonces Y =
tiene una distribucion 2 con n 1 grados de libertad.
2

i=1
Teorema 5.4. Suponga que X1 , X2 , X3 , ..., Xn es una variable aleatoria de una variable aleatoria normal. Entonces:

(xi x)2
s2 (n 1)
=
2
2
es una variable aleatoria 2 con n 1 grados de libertad y s2 y x son variables aleatorias
independientes.
Con el teorema anterior podemos definir el intervalo de confianza para 2 con una confianza
del100(1 ) %.

(n 1)s2
2
2
P 1/2
/2 = 1
2
Trabajando la desigualdad para!dejar sola a 2 obtenemos:
(n 1)s2
(n 1)s2
2
P

=1
2/2
21/2
Por lo tanto el intervalo de confianza para 2 con (1 )100 % de confianza es:
78

5.3. INTERVALOS DE CONFIANZA PARA 2


(n 1)s2
(n 1)s2
2

2/2
21/2

Ejemplo 5.3.1
En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de
los resultados que producen muestras estandar. En un estudio de la cantidad de calcio en el agua
potable, el cual se efectua como parte del control de calidad de una agua, se analizo seis veces
la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes de millon
fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar 2 usando un intervalo de confianza de 90 %.

SOLUCION:

x2

9.54
9.61

91.0116
92.3251

9.32
9.48

86.8624
89.8704

9.70
9.26

94.09
85.7476

x = 56.91 x2 = 539.9341
6(539.9341) (56.41)2
59.41
= 9.485, s2 =
= 0.02855.
x =
6
6(5)
2
2

 = 0.1 entonces /2 = 0.05 con 5 grados de libertad 0.05 = 11.07 0.95 = 1.15.
(6 1)0.02855 (6 1)(0.02855)
= (0.1241, 0.128)
,
11.07
1.15
Ejercicio 5.3.1. Estimar la varianza verdadera de las mediciones de resistencia, en un intervalo de confianza de 90 %, si una muestra de 15 resistores presento resistencias con una
desviacion estandar muestral igual a 0.5 ohms.

79

5.3. INTERVALOS DE CONFIANZA PARA 2

80

Pruebas de hip
otesis

Definici
on 6.1. A un proceso que lleva a una decision acerca de una hipotesis particular se
llama prueba de hipotesis.
Las posibles decisiones son Rechazar, No rechazar. Como trabajaremos con una muestra entonces asegurar algo sobre la poblacion sera muy descuidado.
Los procedimientos de prueba se basan en el uso de la informacion contenida en una muestra
aleatoria de la poblacion de interes.
En este caso la hipotsis nula es la hipotesis que quiere probarse. El rechazo de la hipotesis nula
lleva a No rechazarla hipotesis alterna.
Los errores en los que podemos caer al trabajar pruebas de hipotesis son 2.
Definici
on 6.2. El error de tipo I se define como el rechazo de la hipotesis nula H0 cuando
esta es verdadera.

Definici
on 6.3. El error de tipo II se define como el no rechazo de la hipotesis nula H0
cuando esta es falsa.

H0 es cierta

Rechazar H0

No rechazar H0

Error de tipo I

Decision correcta

H0 es falsa Desicion correcta Error de tipo II


Debido a que la decision que se toma esta basada en variables aleatorias puede asociarse probabilidades a los errores de tipo I y tipo II.
La probabilidad de incurrir en un error de tipo I se denota por la letra griega . Tambien se le
llama nivel de significacion o amplitud de la prueba.

6.1.

Pruebas de hip
otesis para

En este caso tenemos tres casos para la hipotesis nula.


81


6.1. PRUEBAS DE HIPOTESIS
PARA

6.1.1.

Prueba de hip
otesis para de dos colas

H0 : = 0 esto quiere decir que la hipotesis afirma que la 0 dada es igual a la de la poblacion.
La hipotesis alterna es el complemento de la hipotesis nula H1 : 6= 0 .

Intervalo
de
confianza

1
punto crtico

punto crtico

Regi
on
Regi
on
Regi
on
de
de
de
aceptaci
on
rechazo
rechazo
punto crtico
punto crtico

El estadstico de prueba que usamos cuando conocemos es:


z0 =

x 0

H0 no se rechaza si |z0 | < z/2


H0 se rechaza si |z0 | > z/2

El estadstico en caso de que no conozcamos es:


t0 =

H0 no se rechaza si |t0 | < t/2


H0 se rechaza si |t0 | > t/2
82

x 0
s
n


6.1. PRUEBAS DE HIPOTESIS
PARA

6.1.2.

Prueba de hip
otesis para cola derecha

H0 : 0 esto quiere decir que la hipotesis afirma que la 0 dada es mayor que la de la
poblacion.
La hipotesis alterna es el complemento de la hipotesis nula H1 : < 0 .

1
Regi
on
de
aceptaci
on

Regi
on
de
rechazo
punto crtico

El estadstico de prueba que usamos cuando conocemos es:


z0 =

x 0

H0 no se rechaza si z0 > z
H0 se rechaza si z0 < z
El estadstico en caso de que no conozcamos es:
t0 =

x 0
s
n

H0 no se rechaza si t0 > t
H0 se rechaza si t0 < t

6.1.3.

Prueba de hip
otesis para de cola izquierda

H0 : 0 esto quiere decir que la hipotesis afirma que la 0 dada es menor que la de la
poblacion.

La hipotesis alterna es el complemento de la hipotesis nula H1 : > 0 .


83


6.1. PRUEBAS DE HIPOTESIS
PARA

1
Regi
on
de
aceptaci
on
punto crtico

Regi
on
de
rechazo
punto crtico

El estadstico de prueba que usamos cuando conocemos es:


z0 =

x 0

H0 no se rechaza si z0 < z
H0 se rechaza si z0 > z
El estadstico en caso de que no conozcamos es:
t0 =

x 0
s
n

H0 no se rechaza si t0 < t
H0 se rechaza si t0 > t

Ejemplo 6.1.1
Los sistemas de expulsion de la tripulacion de un avion son impulsados por una carga propulsora
solida. La rapidez de combustion de esta carga propulsora es una caracterstica importante del
producto. Las especificaciones requieren que la rapidez de combustion media debe ser 50cm/s. Se
sabe que la desviacion estandar de la rapidez de combustion es = 2cm/s. El analista decide
especificar una probabilidad del error tipo I o nivel de significacion de = 0.05. Selecciona una
muestra aleatoria de n = 25 y obtiene un promedio muestral de la rapidez de combustion de
x = 51.3cm/s. Considera como H0 : = 50. Cual es tu conclusion?

SOLUCION:
Tenemos que se trata de una hipotesis de dos colas:
84


6.1. PRUEBAS DE HIPOTESIS
PARA

H0 : = 50
H1 : 6= 50

=2
/2 = 0.025
n = 25

z0 =

x 0

51.3 50
2
25

= 3.25

x = 51.3
Por otro lado z0.025 = 1.96. Ahora como tenemos que z/2 < z0 entonces la hipotesis se rechaza.
Conclusion: Rechazamos la hipotesis de que = 50 con un nivel de significacion de 0.05.

Ejemplo 6.1.2
El ajuste de profundidad de determinado taladro de columna es dos pulgadas. Entonces, se podra
suponer que la profundidad promedio de todos los agujeros barrenados por esta maquina es = 2
pulgadas. Para comprobar esta hipotesis, as como la exactitud del calibre de profundidades, se
midio una muestra aleatoria de n = 100 agujeros barrenados por esa maquina y se encontro un
promedio de muestra x = 2.005 pulgadas con una desviacion estandar de = 0.03 pulgadas. Si Se
puede rechazar la hipotesis con base en los datos de la muestra?

SOLUCION:
Tenemos que otra vez se trata de una hipotesis de dos colas:
= 0.03
H0 : = 2
/2 = 0.025
2.005 2
x 0
=
= 1.6667
z0 =

0.03

H1 : 6= 2
n = 100
n
100
x = 2.005
Otra vez ocupamos z/2 = 1.96. Como z/2 > z0 no podemos rechazar la hipotesis de que = 2.
Conclusion: no se puede rechazar la hipotesis de que la media = 2 pulgadas con un nivel de
significacion de 0.05.
Ejercicio 6.1.1. Un vicepresidente de una gran empresa afirma que el n
umero de llamadas
solicitando servicio al equipo que vende su empresa no es mas de 15 por semana, en promedio.
Para comprobar su afirmacion, se revisaron los registros de servicio para 36 semanas seleccionadas al azar, y el resultado fue que x = 17 y la varianza muestral de 19 para los datos de las
muestras. Contradice la evidencia de la muestra la afirmacion del vicepresidente al nivel de
significacion de 5
Ejercicio 6.1.2. La tension de salida de determinado circuito electrico debe ser 130, de acuerdo
con las especificaciones. Una muestra de 40 mediciones independientes de la tension de este
circuito dio un promedio de x = 128.6 y una desviacion estandar muestral de 2.1. Se quieren
hacer las dos pruebas siguientes con un nivel de significaci
on
a) Probar la hipotesis de que la tension promedio de salida es 130.
b) Probar la hiportesis de que la tension promedio de salida es no es mayor a 130.
85


6.2. PRUEBAS DE HIPOTESIS
PARA Y 2

Ejemplo 6.1.3
Un artculo de la revista Materials Engineering (Vol. II, No. 4, pp. 275-281) describe los resultados
de las pruebas por traccion para la adhesion en 22 muestras de la aleacion U-700. Las cargas en
que fallaron las muestras (en MPa) son las siguientes: 19.8 18.5 17.6 16.7 15.8 15.4 14.1 13.6 11.9
11.4 11.4 8.8 7.5 15.4 15.4 19.5 14.9 12.7 11.9 11.4 10.1 7.9
La media muestral 13.71 es y la desviacion estandar resulta 3.55 Los datos sugieren que la carga
para la falla media excede 10? Supon que la carga para la falla tiene una distribucion normal, y usa
= 0.05.

SOLUCION:

Tenemos que t0.05

H0 : > 10
H1 : 10

n = 22
x = 13.71

t0 =

s = 3.55
= 0.05
= 1.721 con 21 grados de libertad.

x
s
n

13.71 10
3.55
12

= 4.901

Como t0 > t no se rechaza.

Conclusion: No se rechaza la hipotesis de que la media exceda 10.


Ejercicio 6.1.3. Los anchos de las ventanas de contacto de determinados chips para circuito
integrado tienen especificacion de dise
no de 3.5m. (Vease los detalles en M. S. Phadke et.
al., The Bell System Technical Journal, 62, No. 5. 1983, paginas 1273 a 1309.) Los anchos de
ventana despues del ataque qumico en los especmenes de prueba fueron como sigue: 3.21, 2.49,

2.94, 4.38, 4.02, 3.82, 3.30, 2.85, 3.34, 3.91. Se podra rechazar la hipotesis de que se cumple
con la especificacion en el nivel de significacion del 5 %?

6.2.

Pruebas de hip
otesis para y 2

Si se desea probar una hipotesis acerca de la varianza o la desviacion estandar se pude hacer utilizando el intervalo de confianza que construimos en el captulo anterior usando como
estadstico
(n 1)s2
.
20 =
02
Al igual que la media vamos a tener pruebas de una y dos colas. Las cuales podemos resumir en
(n 1)s2
la siguiente tabla usando como estadstico en todos los casos 20 =
y tenemos n 1
02
gracos de libertad.
86


6.2. PRUEBAS DE HIPOTESIS
PARA Y 2
Hipotesis
H0 : 2 = 02
H1 : 2 6= 02

No se rechaza

Se rechaza

Colas

21/2 < 20 < 2/2

Si 21/2 > 20 o 2/2 < 20

H0 : 2 02
H1 : 2 > 02

2 > 20

Si 2/2 < 20

H0 : 2 02

21 < 20

Si 21 > 20

H1 : 2 < 02

Ejemplo 6.2.1
Una determinada compana que produce una parte maquinada para un motor, afirma que tiene una
varianza de diametro no mayor que 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas partes
dio una varianza muestral s2 = 0.0003. Hay evidencia para refutar lo que afirma el proveedor
usando = 0.05 ?

SOLUCION:

H0 : 2 0.0002

H1 : 2 > 0.0002

n = 10
s2 = 0.0003
= 0.05

20

(n 1)s2
9(0.0003)
=
=
= 13.5
2

0.0002

Como 20.05 = 16.92 y 2 > 20 . No se rechaza la hipotesis de que 2 0.0002


Ejercicio 6.2.1. La variacion en la anchura de la ventana de los chips para circuito integrado
se deben controlar estrechamente si se desea que los circuitos funcionen en forma correcta.
Suponer que las especificaciones establecen que 2 = 0.30 para los anchos de ventana. Se
podra rechazar la afirmacion de que se cumple con dicha especificacion si se usan los datos del
ejercicio anterior n = 10 y s2 = 0.3166? Utilizar

Ejemplo 6.2.2
Para una muestra aleatoria simple de adultos, las puntuaciones de CI se distribuyen normalmente, con
una media de 100 y una desviacion estandar de 15. Una muestra aleatoria simple de 13 profesores de
estadstica produce una desviacion estandar s = 7.5. Un psicologo afirma que la desviacion estandar
de los profesores es menor o igual a la de los adultos. Tienes elementos para rechazar esta hipotesis
usando un nivel de significacion de = 0.05. ?
87


6.2. PRUEBAS DE HIPOTESIS
PARA Y 2
n = 13
12(51.84)
(n 1)s2
2
2

=
= 2.7648.
SOLUCION:
s = 51.84 0 =
2
2

225
H1 : > 225
= 0.05
2
2
2
Como 0.05 = 21.03 y > 0 . No se rechaza la hipotesis de que < 15.
H0 : 2 225

Ejercicio 6.2.2. Utilice un nivel de significancia de 0.05 para probar la aseveracion de que las
estaturas de mujeres supermodelos varan menos que las estaturas de las mujeres en general.
La desviaci
on estandar de las estaturas de la poblacion de mujeres es de 2.5 pulgadas. A continuacion se listan las estaturas (en pulgadas) de supermodelos seleccionadas al azar (Taylor,
Evangelista, Auermann, Schiffer, MacPherson, Turlington, Hall, Crawford, Herzigova, Banks,
Moss, Hume). 71 69.5 70.5 71 72 70 70 69 69.5 69 70 66.5

88

Indice alfab
etico
Bayes
Teorema de, 33

Distribucion continua
uniforme, 60

Bernoulli
Distribucion, 45

Distribucion de probabilidad, 36

Binomial
distribucion, 45
experimento, 46
Cardinalidad

Error de tipo I, 78
Error de tipo II, 78
Espacio muestral, 14
Esperanza, 40
Estadstica

propiedades, 25
cardinalidad, 21

descriptiva, 1
inferencial, 1

clases, 3
Combinacion, 19

Estandarizacion, 67
Estimaciones, 69

conjuntos

Estimador, 71

propiedades, 25
Datos
agrupados, 1
agrupamiento de, 1
no agrupados, 1
Datos agrupados, 9

error, 72
insesgado, 71
Evento
interseccion de, 22
Eventos
ajenos, 22
complemento, 23
definicion, 20

Desviacion estandar
datos agrupados, 13
poblacional, 11
variable aleatoria discreta, 40
Diagrama de tallo y hoja, 6
Distribucion
Bernoulli, 45
Binomial, 45
exponencial, 61
Geometrica, 48

independientes, 30
union, 21
experimento, 14
Exponencial
distribucion, 61
Factorial, 17
Frecuencia, 3
acumulada, 3

normal, 63
Poisson, 50
uniforme, 43

relativa, 3
Funcion de distribucion, 57
Funcion de distribucion acumulada
89

INDICE ALFABETICO

propiedades, 39
funcion de distribucion acumulada, 39
funcion de masa de probabilidad, 39
Geometrica
distribucion, 48
Grafica
pastel, 5
Graficos, 5
histograma, 5
Intervalo de clase, 3
Intervalos de confianza, 73
con desconocida, 75

Poblacion, 7
Poisson
distribucion, 50
Principio de multiplicacion, 16
Probabilidad
condicional, 28
funcion, 25
propiedades, 27
total, 31
Pruebas de hipotesis, 78
para cola derecha, 80
para de cola izquierda, 80
para de dos colas, 79
Punto medio, 4

para , 76
Lmite Central
teorema de, 69
Media aritmetica
datos no agrupados, 7
Media muestral
datos no agrupados, 7
Mediana
datos agrupados, 10
Datos no agrupados, 7
Medidas de dispersion, 11
Medidas de tendencia central, 6
Medua
datos agrupados, 9
Moda
datos agrupados, 10
datos no agrupados, 8
Muestra, 7

Regla de multiplicacion, 29
Teorema
del Lmite Central, 69
Teorema de Bayes, 33
Uniforme
distribucion, 43
distribucion continua, 60
Variable aleatoria
continua, 35
definicion, 35
discreta, 35
Variable aleatoria continua
definicion, 56
propiedades, 56
Varianza, 11
datos agrupados, 13
poblacional, 11
variable aleatoria discreta, 40

Normal
distribucion, 63
Permutacion, 18
90

También podría gustarte